Concevoir des plateformes IA fiables : outils…

Conception de plateformes IA fiables : des outils pour la certitude, des agents pour la découverte

35

1InfoQ AI

Conception de plateformes IA fiables : des outils pour la certitude, des agents pour la découverte

Aaron Erickson, ingénieur chez NVIDIA, a présenté une conférence intitulée "Designing AI Platforms for Reliability: Tools for Certainty, Agents for Discovery", consacrée à la conception de hiérarchies d'agents IA sur mesure. Destinée aux développeurs seniors et architectes logiciels, son intervention détaille la méthodologie employée par NVIDIA pour construire des systèmes d'intelligence artificielle fiables et déployables à grande échelle en production. Erickson y explique comment son équipe combine des outils déterministes, capables de garantir des résultats certains et reproductibles, avec des agents capables d'explorer et de découvrir des solutions dans des contextes plus incertains. Cette approche répond à un défi central de l'industrie actuelle: les entreprises veulent exploiter la flexibilité des agents autonomes tout en évitant les erreurs et les incohérences qui peuvent survenir lorsque ces systèmes opèrent sans garde-fous. En détaillant des techniques comme l'exploitation du contexte rare, la mise en place de pyramides de tests basées sur le principe du LLM-as-a-judge, et des méthodes pour limiter le paradoxe du choix, la présentation vise à donner aux architectes des outils concrets pour construire des plateformes IA robustes, capables de tenir la charge en production. Ce travail s'inscrit dans une tendance plus large de maturation de l'ingénierie autour des agents IA, où les grandes entreprises technologiques, dont NVIDIA, cherchent à formaliser des bonnes pratiques pour transformer des prototypes prometteurs en systèmes fiables et industrialisables. À mesure que les agents autonomes se multiplient dans les environnements professionnels, la question de la fiabilité et de la testabilité devient un enjeu stratégique majeur pour l'ensemble du secteur.

OutilsOutil

1 source

38

2VentureBeat AI

Les entreprises IA à base d'agents : concevoir pour des performances mesurables

Les agents d'intelligence artificielle semi-autonomes capables de gérer des tâches métier complexes en temps réel ne sont plus une promesse lointaine, c'est désormais une réalité opérationnelle pour certaines grandes entreprises. EdgeVerve, filiale d'Infosys spécialisée dans l'automatisation intelligente, a récemment publié un cadre de conception pour déployer ces agents à l'échelle industrielle. L'entreprise cite ses propres déploiements en production : dans un environnement financier réel piloté par un directeur financier, sept agents interconnectés ont généré en un an une amélioration de plus de 3 % des flux de trésorerie mensuels, un gain de productivité de 50 % sur les workflows concernés, un onboarding 90 % plus rapide, et un impact total de 32 millions de dollars sur la trésorerie. En maintenance immobilière, des résultats similaires ont été obtenus grâce à des agents spécialisés dans la coordination des interventions. Ces chiffres illustrent ce qui distingue un pilote réussi d'un projet abandonné : l'ancrage dans des objectifs métier mesurables dès le départ. La méthode préconisée consiste à partir des KPI organisationnels, délai de recouvrement (DSO), taux de conformité, temps moyen de résolution (MTTR), satisfaction client (NPS), pour définir les objectifs des agents, puis seulement choisir les workflows à automatiser. Les "zones grises opérationnelles", ces espaces entre les applications où subsistent encore des validations manuelles, des réconciliations et des transferts humains, représentent le prochain gisement de valeur. C'est là que les agents peuvent éliminer les frictions systémiques sans remplacer intégralement des processus formalisés. Le cadre repose sur quatre piliers : autonomie calibrée selon le niveau de risque (de la simple suggestion à l'exécution avec rollback automatique), gouvernance intégrée dès la conception avec des garde-fous stricts sur les données personnelles et réglementaires, observabilité continue via des évaluations et métriques en temps réel, et flexibilité d'intégration allant bien au-delà des seules API classiques, en incluant les flux événementiels, les connecteurs RAG pour bases documentaires, et des fallbacks RPA là où les API n'existent pas. Le risque central identifié est celui des agents "hallucinant" des actions non vérifiables par l'entreprise, d'où l'insistance sur l'idempotence, les mécanismes de retry et les schémas d'outils standardisés. Dans un contexte où de nombreuses entreprises peinent encore à sortir leurs agents du stade expérimental, ce retour d'expérience chiffré positionne EdgeVerve comme un acteur cherchant à normaliser les déploiements agentiques en environnement critique.

OutilsOutil

1 source

NVIDIA déploie des agents IA fiables pour les opérations télécoms en continu

41

3NVIDIA AI Blog

NVIDIA déploie des agents IA fiables pour les opérations télécoms en continu

NVIDIA présente cette semaine à Copenhague, lors du TM Forum DTW Ignite 2026, une plateforme d'autonomie pour les opérateurs télécom, réunissant plusieurs partenaires industriels majeurs autour d'agents d'intelligence artificielle capables de gérer des réseaux en continu et sans intervention humaine systématique. Parmi les partenaires impliqués figurent SoftBank Corp., Amdocs, NTT DATA et AdaptKey. Les briques technologiques démontrées incluent NVIDIA NeMo Safe Synthesizer et NeMo Anonymizer pour la génération de données synthétiques, ainsi que NemoClaw et OpenShell pour le déploiement sécurisé d'agents autonomes. SoftBank utilise ces outils pour constituer des jeux de données synthétiques qui reflètent la structure de ses données réseau réelles, sans exposer d'informations sensibles, afin d'entraîner un grand modèle télécom propriétaire. AdaptKey pilote des agents capables de détecter des problèmes de sécurité et de connectivité sur des réseaux 5G, puis de soumettre des demandes de correction auditables couvrant le coeur de réseau, le RAN et les systèmes de facturation. Amdocs, de son côté, déploie des agents proactifs pour la relation client, notamment pour détecter les abonnés dont le forfait itinérance approche de son plafond et leur proposer automatiquement des options validées par l'opérateur. Ce passage vers l'autonomie représente un saut qualitatif par rapport à l'automatisation classique, qui se limitait jusqu'ici à accélérer des étapes prédéfinies tout en laissant aux humains la corrélation des informations et les décisions. Les agents autonomes de nouvelle génération sont conçus pour tenir des tâches complexes de bout en bout, sous contraintes de niveaux de service, de politiques de changement et de réglementations strictes. Pour les opérateurs, cela signifie des réseaux capables de se réparer seuls, une relation client prise en charge en temps réel et des migrations de systèmes de facturation orchestrées intelligemment selon l'éligibilité de chaque compte client, sans mobiliser d'équipes entières pour chaque décision. Le chemin vers ces réseaux autonomes se heurtait jusqu'ici à un obstacle majeur : 54 % des opérateurs identifient les problèmes liés aux données comme leur principal frein, les données réseau et clients les plus précieuses étant trop sensibles pour alimenter directement les modèles d'IA. La génération de données synthétiques permet de contourner cette contrainte en produisant des datasets représentatifs sans exposer les enregistrements bruts. Par ailleurs, la question de la gouvernance reste centrale : les agents NemoClaw et OpenShell opèrent dans des environnements bac à sable, avec des garde-fous basés sur des politiques, pour garantir que leur comportement reste prévisible et auditable. La démonstration de Copenhague intervient dans un contexte où la course aux réseaux autonomes s'accélère, avec des enjeux considérables pour la fiabilité des infrastructures critiques et la capacité des opérateurs à proposer des services à valeur ajoutée pilotés par l'IA.

UELes opérateurs télécom européens, soumis à des réglementations strictes sur la protection des données, pourraient tirer parti de l'approche par données synthétiques de NVIDIA pour déployer des agents IA sur leurs réseaux sans exposer d'informations sensibles.

OutilsActu

1 source

Des agents IA en production pour la conformite financiere : les lecons de Stripe

48

4AWS ML Blog

Des agents IA en production pour la conformite financiere : les lecons de Stripe

Stripe, le géant américain des paiements en ligne, a déployé en production un système d'agents IA dédié à la conformité financière, développé sur Amazon Web Services avec Amazon Bedrock. L'entreprise traite 1 400 milliards de dollars de volume de paiements annuels dans 50 pays, en servant des millions d'entreprises allant des startups aux 62 % des sociétés du Fortune 500. Pour gérer les risques de fraude et respecter les obligations réglementaires à cette échelle, ses équipes de conformité devaient examiner des milliers de transactions chaque jour. Le système d'agents, conçu selon un cadre ReAct, a permis de réduire de 26 % le temps de traitement des dossiers, tout en obtenant un taux de satisfaction de 96 % auprès des analystes internes. Les décisions finales restent systématiquement entre les mains d'experts humains. Ce déploiement illustre un problème structurel que rencontrent toutes les grandes institutions financières : les analystes qualifiés passaient jusqu'à 80 % de leur temps à naviguer entre des systèmes fragmentés pour rassembler des documents, au lieu de réaliser des évaluations de risque à haute valeur ajoutée. L'agent IA automatise cette phase de pré-investigation et d'agrégation documentaire, libérant les équipes pour les jugements complexes. À l'échelle mondiale, le coût de la conformité financière est estimé à 206 milliards de dollars par an. L'approche de Stripe permettrait d'identifier 95 % des attaques par test de carte en temps réel et de réduire de 20 % les frictions inutiles pour les clients légitimes, tout en conservant la traçabilité intégrale exigée par les régulateurs grâce à des journaux d'audit immuables. La croissance rapide de Stripe, qui représente aujourd'hui environ 1,3 % du PIB mondial numérique, a rendu intenable une mise à l'échelle des équipes de conformité proportionnelle au volume de transactions. L'entreprise a opté pour une architecture en trois composantes : décomposition des tâches et orchestration des révisions, cadre d'agents ReAct, et services d'infrastructure dédiés. Une attention particulière a été portée à l'optimisation des coûts via le prompt caching et à la gouvernance, avec des workflows d'approbation configurables et des points de contrôle humains à chaque étape critique. Ce modèle, co-développé par les équipes de Stripe et d'AWS, est présenté comme une référence pour les organisations souhaitant industrialiser la conformité sans sacrifier la qualité ni l'auditabilité, dans un contexte où les régulateurs financiers du monde entier renforcent leurs exigences en matière de traçabilité des décisions assistées par IA.

UELes établissements financiers européens soumis aux obligations KYC/AML et aux futures exigences de traçabilité de l'AI Act peuvent s'appuyer sur ce retour d'expérience pour évaluer l'automatisation de leur conformité via des agents IA.

OutilsOutil

1 source

Concevoir des plateformes IA fiables : outils pour la certitude, agents pour la découverte

À lire aussi

Conception de plateformes IA fiables : des outils pour la certitude, des agents pour la découverte

Les entreprises IA à base d'agents : concevoir pour des performances mesurables

NVIDIA déploie des agents IA fiables pour les opérations télécoms en continu

Des agents IA en production pour la conformite financiere : les lecons de Stripe