Aller au contenu principal
OutilsVentureBeat AI6sem

Les entreprises IA à base d'agents : concevoir pour des performances mesurables

Résumé IASource uniqueImpact UE
Source originale ↗·

Les agents d'intelligence artificielle semi-autonomes capables de gérer des tâches métier complexes en temps réel ne sont plus une promesse lointaine, c'est désormais une réalité opérationnelle pour certaines grandes entreprises. EdgeVerve, filiale d'Infosys spécialisée dans l'automatisation intelligente, a récemment publié un cadre de conception pour déployer ces agents à l'échelle industrielle. L'entreprise cite ses propres déploiements en production : dans un environnement financier réel piloté par un directeur financier, sept agents interconnectés ont généré en un an une amélioration de plus de 3 % des flux de trésorerie mensuels, un gain de productivité de 50 % sur les workflows concernés, un onboarding 90 % plus rapide, et un impact total de 32 millions de dollars sur la trésorerie. En maintenance immobilière, des résultats similaires ont été obtenus grâce à des agents spécialisés dans la coordination des interventions.

Ces chiffres illustrent ce qui distingue un pilote réussi d'un projet abandonné : l'ancrage dans des objectifs métier mesurables dès le départ. La méthode préconisée consiste à partir des KPI organisationnels, délai de recouvrement (DSO), taux de conformité, temps moyen de résolution (MTTR), satisfaction client (NPS), pour définir les objectifs des agents, puis seulement choisir les workflows à automatiser. Les "zones grises opérationnelles", ces espaces entre les applications où subsistent encore des validations manuelles, des réconciliations et des transferts humains, représentent le prochain gisement de valeur. C'est là que les agents peuvent éliminer les frictions systémiques sans remplacer intégralement des processus formalisés.

Le cadre repose sur quatre piliers : autonomie calibrée selon le niveau de risque (de la simple suggestion à l'exécution avec rollback automatique), gouvernance intégrée dès la conception avec des garde-fous stricts sur les données personnelles et réglementaires, observabilité continue via des évaluations et métriques en temps réel, et flexibilité d'intégration allant bien au-delà des seules API classiques, en incluant les flux événementiels, les connecteurs RAG pour bases documentaires, et des fallbacks RPA là où les API n'existent pas. Le risque central identifié est celui des agents "hallucinant" des actions non vérifiables par l'entreprise, d'où l'insistance sur l'idempotence, les mécanismes de retry et les schémas d'outils standardisés. Dans un contexte où de nombreuses entreprises peinent encore à sortir leurs agents du stade expérimental, ce retour d'expérience chiffré positionne EdgeVerve comme un acteur cherchant à normaliser les déploiements agentiques en environnement critique.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Meilleures plateformes d'IA à agents autonomes pour les entreprises en 2026
1MarkTechPost 

Meilleures plateformes d'IA à agents autonomes pour les entreprises en 2026

En 2026, l'IA agentique d'entreprise a franchi le cap du projet pilote pour entrer dans les déploiements en production. Salesforce a conclu 29 000 contrats Agentforce depuis son lancement, générant 800 millions de dollars de revenus annuels récurrents. Microsoft Copilot Studio compte plus de 160 000 organisations qui font tourner plus de 400 000 agents personnalisés. ServiceNow a reconfiguré l'ensemble de son modèle commercial autour de niveaux d'autonomie IA. Sur le plan tarifaire, les modèles divergent : Agentforce facture 2 dollars par conversation ou 500 dollars pour 100 000 crédits Flex, tandis que Copilot Studio propose 200 dollars pour 25 000 crédits mensuels. Salesforce a par ailleurs finalisé en novembre 2025 l'acquisition d'Informatica pour renforcer la qualité des données intégrées à sa couche Data 360. Ces chiffres traduisent un basculement structurel : la question n'est plus de savoir s'il faut déployer des agents IA, mais quel outil convient à quel flux de travail. Ce mouvement massif vers la production révèle aussi ses limites. Les équipes qui ont réussi la transition des pilotes vers le déploiement réel rapportent que les échecs ne viennent pas des capacités des modèles, mais de trois problèmes récurrents : des données de mauvaise qualité, une propriété floue des cas limites, et une gouvernance jamais construite. Une pratique trompeuse s'est également généralisée dans le secteur, que les praticiens appellent l'« agent washing » : des éditeurs rebaptisent des chatbots existants, des scripts d'automatisation robotique ou des outils de workflow linéaires en les présentant comme des agents autonomes. Or, un vrai agent doit être capable de prise de décision autonome, de raisonnement multi-étapes et de gestion dynamique des erreurs, une barre que la majorité des produits commercialisés aujourd'hui ne franchit pas réellement. Les brochures marketing ne suffisent pas ; il faut tester sur des flux réels qui exigent ramifications, usage d'outils, rétention de contexte et récupération sur erreur. Les deux plateformes dominantes en volume illustrent une logique d'écosystème fermé. Agentforce s'appuie sur le moteur de raisonnement Atlas, qui décompose les tâches en étapes via une boucle Reason-Act-Observe, et reste nativement intégré aux données Salesforce, un avantage décisif pour les entreprises dont Salesforce est le système d'enregistrement central, mais une contrainte réelle pour les environnements SAP ou multi-stack. Copilot Studio bénéficie quant à lui d'une surface d'intégration massive : Teams, SharePoint, Dynamics 365 et le Microsoft Graph couvrent environ un milliard de sièges Microsoft 365 dans le monde. La stratégie gagnante pour 2026, selon les retours terrain, consiste à déployer un seul agent sur un workflow précis et bien documenté, mesurer les résultats, puis étendre progressivement, plutôt que de chercher une transformation générale en une seule vague.

UELes entreprises européennes sous écosystème Salesforce ou Microsoft 365 sont directement concernées par les nouvelles grilles tarifaires et les stratégies de déploiement d'agents autonomes décrites dans cet article.

OutilsOutil
1 source
Concevoir des plateformes IA fiables : outils pour la certitude, agents pour la découverte
2InfoQ AI 

Concevoir des plateformes IA fiables : outils pour la certitude, agents pour la découverte

Aaron Erickson, architecte spécialisé dans les systèmes d'intelligence artificielle, a présenté une approche structurée pour concevoir des plateformes IA fiables à grande échelle. Sa réflexion part d'un constat simple : l'ère du "vibe checking", où l'on évalue informellement si un modèle semble fonctionner, touche à ses limites dès qu'il s'agit de déployer des systèmes en production. Il propose à la place des cadres multi-agents rigoureux, combinant des garde-fous logiciels déterministes avec des capacités de découverte agentique, pour obtenir à la fois prévisibilité et flexibilité. L'enjeu pratique est considérable pour les équipes qui industrialisent l'IA. Un système purement agentique manque de garanties, tandis qu'un pipeline entièrement déterministe est trop rigide pour des tâches complexes et ambiguës. La réponse d'Erickson est une architecture hybride : confier aux agents les tâches d'exploration et de raisonnement, tout en encadrant leurs sorties avec des vérifications logicielles classiques. Il insiste également sur l'optimisation des hiérarchies d'agents et l'intégration de modèles de fondation pour séries temporelles, deux leviers souvent négligés dans les architectures de production. Cette présentation s'inscrit dans une tendance de fond qui agite l'industrie depuis l'essor des agents LLM en 2024 : comment passer du prototype impressionnant au système fiable qui tient la charge. Erickson introduit la notion de pyramide d'évaluation, un cadre d'inspection multi-niveaux inspiré des bonnes pratiques du génie logiciel, pour mesurer objectivement la robustesse d'une architecture IA avant qu'elle ne rencontre les contraintes du monde réel.

OutilsOpinion
1 source
Pourquoi des entreprises comme Apple misent sur des agents IA aux capacités bridées
3AI News 

Pourquoi des entreprises comme Apple misent sur des agents IA aux capacités bridées

Apple, Qualcomm et d'autres acteurs majeurs de l'industrie technologique développent une nouvelle génération d'assistants IA capables d'agir de manière autonome au sein des applications, réserver des services, publier du contenu, naviguer dans des flux complexes. Lors d'une phase bêta privée, un de ces systèmes agentiques a ainsi parcouru l'intégralité d'un tunnel de paiement dans une application avant de s'arrêter net à l'écran de confirmation, attendant le feu vert de l'utilisateur. Ces agents ne sont pas conçus pour agir librement : ils intègrent des points de validation obligatoires, notamment pour toute action sensible liée aux paiements, aux modifications de compte ou aux publications. Les fournisseurs de services de paiement sont déjà en discussion pour intégrer leurs systèmes d'authentification sécurisée directement dans ces flux agentiques, bien que ces dispositifs soient encore en cours de développement. Ce modèle dit "human-in-the-loop", où l'agent prépare l'action mais laisse la décision finale à l'humain, répond à un enjeu concret : à mesure que l'IA gagne en capacité d'action, les risques d'erreur se transforment en risques financiers ou de fuite de données. Pour les utilisateurs grand public, une réservation mal déclenchée ou une transaction non souhaitée peut avoir des conséquences immédiates. Les entreprises tentent donc de limiter le périmètre d'action de ces agents : plutôt que de leur donner un accès total aux applications et aux données, elles définissent précisément quels services l'IA peut toucher, dans quelles conditions, et avec quels droits. Sur l'appareil, le traitement local des données vise également à éviter que des informations sensibles soient transmises vers des serveurs externes. Le débat sur la gouvernance des IA agentiques s'était jusqu'ici concentré sur les usages entreprise, cybersécurité, automatisation à grande échelle, conformité réglementaire. Le déploiement grand public introduit une dimension différente : des millions d'utilisateurs, souvent peu familiers des risques, interagissant avec des systèmes capables d'engager des dépenses ou de modifier des comptes en quelques secondes. Apple, dont les travaux de recherche ont exploré des mécanismes de pause avant toute action non explicitement demandée, semble vouloir établir un standard : des environnements contrôlés où l'autonomie de l'agent est réelle mais bornée. Dans le contexte du règlement européen sur l'IA, qui entre progressivement en application en 2026, cette architecture "agentique avec garde-fous" pourrait s'imposer comme la norme par défaut pour tout acteur souhaitant déployer ces technologies auprès du grand public.

UEL'architecture 'agentique avec garde-fous' pourrait s'imposer comme norme de conformité sous le règlement européen sur l'IA, qui entre progressivement en application en 2026, imposant des contraintes concrètes aux acteurs déployant des agents IA auprès du grand public en Europe.

OutilsOpinion
1 source
CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils
4MarkTechPost 

CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils

CopilotKit a annoncé son Enterprise Intelligence Platform, une nouvelle couche d'infrastructure managée qui dote les applications agentiques d'une mémoire persistante entre les sessions, les utilisateurs et les appareils. Jusqu'ici, chaque nouvelle session forçait l'agent à repartir de zéro : aucun souvenir des échanges précédents, des workflows en cours ou des décisions déjà prises. Pour contourner ce problème, les équipes de développement devaient construire manuellement leur propre couche de stockage, en choisissant une base de données, en sérialisant l'état applicatif et en gérant les identifiants de session avant même d'écrire la moindre ligne de logique produit. La plateforme résout ce problème en fournissant une infrastructure clé en main, compatible avec n'importe quel framework agentique. Elle peut être auto-hébergée sur Kubernetes, avec une option cloud managée en développement, et répond aux exigences de sécurité enterprise : conformité SOC 2 Type II, intégration SSO, contrôle d'accès par rôles, déploiements hors ligne air-gapped et souveraineté totale des données via une base de données personnalisée. L'élément central de l'architecture est le concept de "Thread" : un objet de session persistant et structuré qui survit aux déconnexions, aux changements d'appareils et aux relances d'agent. Contrairement à un simple historique de messages texte stocké en base, un Thread capture six dimensions de l'interaction : les composants d'interface générés dynamiquement par l'agent, les étapes humaines dans la boucle (approbations, corrections, décisions guidées), l'état partagé entre le backend agentique et le frontend, les entrées et sorties vocales, les fichiers uploadés ou générés, et l'ensemble des interactions multimodales au sein d'un objet unique. Concrètement, un workflow complexe démarré par un collaborateur peut être repris exactement là où il s'était arrêté par un autre membre de l'équipe sur un appareil différent, sans perte d'état ni de contexte. CopilotKit est déjà connu pour son SDK open-source dédié au frontend des agents IA, ainsi que pour l'AG-UI Protocol, un standard ouvert qui connecte les agents aux interfaces utilisateur. Cette plateforme Enterprise ne remplace pas le SDK existant : elle l'enrichit avec la couche d'infrastructure qui lui manquait. L'enjeu est considérable pour l'industrie, car la persistance de l'état est l'un des principaux freins au déploiement en production d'applications agentiques dans les entreprises. Les cas d'usage visés, comme la rédaction collaborative de documents juridiques ou la gestion de pipelines de données en plusieurs étapes, illustrent un marché qui commence à dépasser les chatbots pour entrer dans la logique de workflows longs et critiques. La disponibilité d'une infrastructure standardisée pourrait significativement accélérer cette transition.

UELa plateforme propose des options de souveraineté des données (base de données personnalisée, déploiement air-gapped sur Kubernetes) susceptibles de faciliter la conformité RGPD pour les équipes de développement européennes qui adoptent des architectures agentiques.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour