Cara développe une IA spécialisée pour les…

Comment les entreprises développent des IA spécialisées de confiance

54

1NVIDIA AI Blog

Comment les entreprises développent des IA spécialisées de confiance

NVIDIA a lancé l'NVIDIA Agent Toolkit, une plateforme modulaire et ouverte destinée à permettre aux entreprises de construire des agents IA spécialisés adaptés à leurs propres workflows. La boîte à outils repose sur trois composants principaux : les modèles ouverts Nemotron, qui servent de base de raisonnement personnalisable ; les blueprints NemoClaw, qui définissent des schémas pour un comportement d'agent plus sûr et plus précis à moindre coût ; et le runtime OpenShell, qui permet aux agents d'opérer en toute sécurité au sein des systèmes existants. NVIDIA a également lancé le BioNeMo Toolkit, spécifiquement conçu pour les sciences de la vie, réduisant à quelques jours des tâches qui nécessitaient auparavant plusieurs mois. La plateforme est compatible avec des orchestrateurs tiers comme Hermes Agents et OpenClaw. Des entreprises comme CrowdStrike déploient déjà des agents de cybersécurité spécialisés qui traitent les alertes avec 98,5 % de précision, tandis que Cadence et Synopsys construisent des agents autonomes pour la conception de puces électroniques. Des acteurs comme Palantir, SAP, ServiceNow, Siemens et Dassault Systèmes intègrent quant à eux ces capacités agentiques dans leurs plateformes d'entreprise. L'enjeu central de cette annonce est la confiance et le contrôle. Les entreprises ne cherchent pas seulement à accéder à une IA générale : elles veulent des systèmes qu'elles peuvent personnaliser, auditer et déployer en toute sécurité dans des environnements critiques. En proposant une architecture ouverte et modulaire, NVIDIA permet aux équipes techniques d'intégrer des agents dans leurs systèmes existants sans repartir de zéro. Dans les sciences de la vie, cela accélère la découverte de médicaments, l'analyse génomique et le criblage virtuel de molécules. Dans la santé, les agents soutiennent la documentation clinique et la coordination des soins. Dans la cybersécurité, le triage automatisé à haute précision libère des analystes pour des tâches à plus forte valeur ajoutée. Le potentiel de gain de productivité à l'échelle industrielle est donc considérable. Cette initiative s'inscrit dans une deuxième vague de l'IA en entreprise, après une phase initiale d'expérimentation avec les grands modèles frontières. Les pilotes ont montré que l'IA générique ne suffit pas : les cas d'usage les plus précieux exigent des agents capables de raisonner, d'utiliser des outils métier et d'agir dans des workflows très spécifiques. NVIDIA, déjà dominant dans l'infrastructure matérielle pour l'IA, élargit ainsi son emprise sur la couche logicielle agentique. En s'alliant à des acteurs comme SAP, Siemens et Palantir, l'entreprise se positionne au coeur de l'adoption de l'IA dans les secteurs industriels, de la santé et de la cybersécurité. La prochaine étape sera de voir si cette architecture ouverte parvient à s'imposer face aux écosystèmes fermés que d'autres géants technologiques cherchent à construire.

UELes entreprises européennes Dassault Systèmes, Siemens et SAP intègrent directement ces capacités agentiques dans leurs plateformes industrielles, marquant une adoption concrète dans l'industrie européenne.

💬 NVIDIA fait le mouvement classique : verrouiller le marché par le haut (le hardware) et par le bas (la plateforme logicielle), en laissant juste assez d'ouverture pour que les entreprises se convainquent elles-mêmes qu'elles gardent le contrôle. Le vrai test, c'est dans 18 mois, quand SAP et Siemens seront assez dépendants pour que changer de couche agentique coûte plus cher que rester. Les 98,5% de précision de CrowdStrike, c'est le genre de chiffre qui fait signer des contrats.

OutilsOpinion

1 source

48

2VentureBeat AI

Le développement piloté par les spécifications s'impose pour le code agentique en entreprise

Le développement logiciel piloté par les spécifications s'impose comme la méthode de référence pour déployer des agents de codage autonomes à l'échelle des grandes entreprises. Amazon Web Services en est l'exemple le plus documenté : l'équipe derrière le nouvel environnement de développement Kiro IDE a utilisé Kiro pour construire Kiro lui-même, réduisant les cycles de développement de deux semaines à deux jours. Une équipe d'ingénieurs AWS a mené à bien un projet de refonte architecturale initialement prévu sur dix-huit mois avec trente développeurs, en six personnes en soixante-seize jours. Chez Amazon.com, la fonctionnalité "Add to Delivery", qui permet aux acheteurs d'ajouter des articles après validation de leur commande, a été livrée deux mois avant le calendrier prévu grâce à cette approche. Alexa+, Amazon Finance, Amazon Stores, Fire TV, Last Mile Delivery et Prime Video intègrent désormais tous le développement piloté par les spécifications dans leurs méthodes de production. Ce qui rend cette méthode structurante, c'est qu'elle résout le problème de confiance fondamental posé par le code généré par l'IA. Un agent qui produit cent cinquante commits par semaine dépasse largement la capacité de relecture humaine : aucune équipe ne peut valider manuellement ce volume. La spec devient alors un moteur de vérification automatique. Rédigée avant qu'une seule ligne de code soit écrite, elle définit ce que le système doit faire, ses propriétés attendues et ce que "correct" signifie concrètement. À partir de cette base, des techniques de test basées sur les propriétés et de l'IA neurosymbolique génèrent automatiquement des centaines de cas de test dérivés directement de la spécification, couvrant des cas limites qu'aucun développeur n'aurait envisagé. L'agent peut ainsi se corriger en boucle, en réinjectant les échecs de build et de test dans son propre raisonnement, jusqu'à produire un code à la fois fonctionnel et vérifiable. Cette évolution s'inscrit dans une transformation plus large du secteur. Il y a un an, le "vibe coding" avait popularisé l'idée que n'importe qui pouvait produire du code avec l'IA, au prix d'une qualité souvent médiocre. Le développement piloté par les spécifications répond à la question suivante : comment faire confiance à ce code à grande échelle ? Les équipes qui adoptent cette méthode ne traitent plus l'IA comme un outil ponctuellement consulté, mais comme un agent autonome ancré à une source de vérité permanente. La prochaine étape annoncée est celle d'agents capables de rédiger leurs propres spécifications, utilisant la spec comme mécanisme d'autocorrection et de vérification. Les entreprises qui maîtriseront ce modèle prendront une avance structurelle significative sur celles qui continuent à coder sans cadre formel.

OutilsOutil

1 source

Les agents IA donnent des réponses fausses avec assurance : la couche de contexte est le prochain défi de l'IA en entreprise

49

3VentureBeat AI

Les agents IA donnent des réponses fausses avec assurance : la couche de contexte est le prochain défi de l'IA en entreprise

À San Francisco, lors du Snowflake Summit 26, l'éditeur américain de cloud de données a annoncé une série d'initiatives destinées à résoudre un problème croissant dans les déploiements d'IA en entreprise : les agents produisent des réponses assurées mais incorrectes, non pas à cause du modèle lui-même, mais parce que le même terme "revenu" peut signifier une chose dans un tableau de bord de business intelligence, une autre dans une table SQL, et encore autre chose dans les instructions d'un agent. Parmi les annonces figurent Data Stream, un service de streaming géré compatible Kafka, des améliorations à l'adaptive compute et une meilleure interopérabilité avec Apache Iceberg. La pièce maîtresse est un système à deux couches baptisé Horizon Context et Cortex Sense. Horizon Context, construit sur l'acquisition de Select Star, agrège les métadonnées de Postgres, SQL Server, Tableau et Power BI dans un catalogue centralisé ; Cortex Sense enrichit ce contexte automatiquement à partir des données et habitudes d'usage des clients, sans curation manuelle. "Horizon Context, c'est tout ce qui est explicite et déclaré par les clients ; Cortex Sense, c'est tout ce qui est implicite et dérivé par nous", a résumé Christian Kleinerman, directeur exécutif produit de Snowflake. L'enjeu est considérable pour les entreprises qui adoptent des architectures de récupération hybrides. Selon les données VB Pulse du premier trimestre 2026, issues d'une enquête auprès d'organisations de plus de 100 employés, l'intention de passer à une récupération hybride a triplé, de 10,3 % en janvier à 33,3 % en mars, la croissance la plus rapide de tout le secteur. Lorsque plusieurs agents interrogent les mêmes données sous-jacentes, ils raisonnent sur des schémas différents et renvoient des résultats divergents. Horizon Context vise à corriger ce problème au niveau du catalogue plutôt qu'agent par agent, tandis qu'un mécanisme baptisé Semantic View Autopilot crée et affine automatiquement des vues sémantiques sans maintenance manuelle continue. La connexion à Cortex Search, l'implémentation RAG de Snowflake, permet à ce contexte enrichi d'alimenter directement les workflows de récupération des produits CoCo et Cowork. Ce problème de couche de contexte est devenu le prochain grand chantier de l'IA d'entreprise. Les deux dernières années de construction d'infrastructures de récupération ont produit une recherche vectorielle plus rapide et moins coûteuse, mais aucune définition partagée de ce que les données signifient réellement. Snowflake n'est pas seul : Microsoft a ouvert son ontologie métier Fabric IQ via MCP pour que les agents de n'importe quel éditeur puissent s'appuyer sur une sémantique commune. Pour ne pas enfermer ses clients, Snowflake lie Horizon Context à l'Open Semantic Interchange, rendant les définitions métier portables vers des catalogues et outils tiers. La question qui se pose est désormais de savoir quelle couche de contexte s'imposera dans un marché où un nombre croissant d'acteurs promettent tous de rendre les agents plus fiables.

UELes entreprises européennes déployant des architectures multi-agents font face aux mêmes enjeux de cohérence sémantique, rendant ces nouvelles couches de contexte directement pertinentes pour les DSI du continent.

OutilsOpinion

1 source

38

4VentureBeat AI

Les entreprises IA à base d'agents : concevoir pour des performances mesurables

Les agents d'intelligence artificielle semi-autonomes capables de gérer des tâches métier complexes en temps réel ne sont plus une promesse lointaine, c'est désormais une réalité opérationnelle pour certaines grandes entreprises. EdgeVerve, filiale d'Infosys spécialisée dans l'automatisation intelligente, a récemment publié un cadre de conception pour déployer ces agents à l'échelle industrielle. L'entreprise cite ses propres déploiements en production : dans un environnement financier réel piloté par un directeur financier, sept agents interconnectés ont généré en un an une amélioration de plus de 3 % des flux de trésorerie mensuels, un gain de productivité de 50 % sur les workflows concernés, un onboarding 90 % plus rapide, et un impact total de 32 millions de dollars sur la trésorerie. En maintenance immobilière, des résultats similaires ont été obtenus grâce à des agents spécialisés dans la coordination des interventions. Ces chiffres illustrent ce qui distingue un pilote réussi d'un projet abandonné : l'ancrage dans des objectifs métier mesurables dès le départ. La méthode préconisée consiste à partir des KPI organisationnels, délai de recouvrement (DSO), taux de conformité, temps moyen de résolution (MTTR), satisfaction client (NPS), pour définir les objectifs des agents, puis seulement choisir les workflows à automatiser. Les "zones grises opérationnelles", ces espaces entre les applications où subsistent encore des validations manuelles, des réconciliations et des transferts humains, représentent le prochain gisement de valeur. C'est là que les agents peuvent éliminer les frictions systémiques sans remplacer intégralement des processus formalisés. Le cadre repose sur quatre piliers : autonomie calibrée selon le niveau de risque (de la simple suggestion à l'exécution avec rollback automatique), gouvernance intégrée dès la conception avec des garde-fous stricts sur les données personnelles et réglementaires, observabilité continue via des évaluations et métriques en temps réel, et flexibilité d'intégration allant bien au-delà des seules API classiques, en incluant les flux événementiels, les connecteurs RAG pour bases documentaires, et des fallbacks RPA là où les API n'existent pas. Le risque central identifié est celui des agents "hallucinant" des actions non vérifiables par l'entreprise, d'où l'insistance sur l'idempotence, les mécanismes de retry et les schémas d'outils standardisés. Dans un contexte où de nombreuses entreprises peinent encore à sortir leurs agents du stade expérimental, ce retour d'expérience chiffré positionne EdgeVerve comme un acteur cherchant à normaliser les déploiements agentiques en environnement critique.

OutilsOutil

1 source

Cara développe une IA spécialisée pour les courtiers en assurance d'entreprise avec AWS

À lire aussi

Comment les entreprises développent des IA spécialisées de confiance

Le développement piloté par les spécifications s'impose pour le code agentique en entreprise

Les agents IA donnent des réponses fausses avec assurance : la couche de contexte est le prochain défi de l'IA en entreprise

Les entreprises IA à base d'agents : concevoir pour des performances mesurables