Aller au contenu principal
Les agents IA entrent dans une phase de refonte face aux problèmes de fiabilité en entreprise
OutilsVentureBeat AI2h

Les agents IA entrent dans une phase de refonte face aux problèmes de fiabilité en entreprise

Résumé IASource uniqueImpact UE
Source originale ↗·

Les agents d'intelligence artificielle d'entreprise entrent dans une phase de refonte profonde. Après une première vague de déploiements rapides, de nombreuses organisations découvrent que la performance des modèles de langage ne suffit pas à garantir la fiabilité en production. Selon Preeti Somal, vice-présidente senior de l'ingénierie chez Temporal Technologies, intervenante lors d'un récent événement AI Impact Series à New York, de nombreuses équipes reviennent aujourd'hui construire une "version 2.0" de leurs agents. "Ils ont dû aller très vite, mais ils n'ont pas pris soin de la plomberie", a-t-elle déclaré. "Les systèmes s'effondrent, et ils se retrouvent à reconstruire avec une fondation fiable." Les difficultés concrètes sont multiples : gestion de l'état d'exécution, récupération après pannes, coordination entre APIs et systèmes d'entreprise, visibilité sur les processus, et maîtrise des coûts d'inférence. Un agent peut enchaîner plusieurs modèles de langage, des systèmes de récupération d'information et des applications externes, en maintenant un état sur plusieurs heures ou jours.

L'enjeu est considérable pour les entreprises qui opèrent sous contraintes budgétaires. Redémarrer un processus après une panne peut multiplier les coûts d'inférence, augmenter la latence et dégrader l'expérience client. La distinction entre deux notions souvent confondues devient cruciale : l'état d'exécution, qui indique où en est l'agent dans un processus et à quel point reprendre après une défaillance, et la mémoire contextuelle, qui regroupe les informations transportées d'une interaction à l'autre. Somal cite l'exemple du client Abridge dans le secteur de la santé, où des processus traitent des visites médicales en plusieurs étapes : traitement audio, résumé, appels de modèles et génération de comptes-rendus post-consultation. Ces enchaînements longs et multi-étapes exigent une fiabilité structurelle que les premières architectures n'avaient pas anticipée.

Temporal Technologies, dont l'infrastructure d'orchestration est antérieure à la vague actuelle de l'IA agentique, voit dans cette situation un écho direct à une période précédente de l'adoption du cloud en entreprise. Somal compare cette ruée vers l'IA à la stratégie "lift-and-shift" des débuts du cloud : migrer des charges de travail sans repenser les architectures sous-jacentes, pour finalement dépenser davantage sans en tirer la valeur attendue. "Cette précipitation vers l'IA dans un monde où vous n'avez même pas modernisé vos applications me rappelle un peu ce lift-and-shift qui s'est produit dans le cloud", a-t-elle dit. Les problèmes d'ingénierie fondamentaux comme la durabilité d'exécution et la récupération après défaillance n'émergent souvent qu'après le déploiement. L'IA agentique n'invente pas ces problèmes : elle les amplifie, et les entreprises qui n'ont pas modernisé leur socle applicatif risquent de reproduire les mêmes erreurs coûteuses qu'une décennie auparavant.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Google fait de la gouvernance des agents IA un produit, les entreprises doivent encore s'adapter
1AI News 

Google fait de la gouvernance des agents IA un produit, les entreprises doivent encore s'adapter

Il y a deux semaines à Las Vegas, lors du Google Cloud Next '26, Google a franchi un cap que l'industrie de l'IA entreprise évitait depuis près de deux ans : intégrer la gouvernance des agents IA directement dans le produit, non pas comme une fonctionnalité optionnelle, mais comme une couche architecturale fondamentale. La pièce maîtresse de l'événement est le Gemini Enterprise Agent Platform, présenté comme le successeur de Vertex AI. Sa particularité : chaque agent construit sur la plateforme reçoit une identité cryptographique unique à des fins de traçabilité et d'audit, tandis qu'une composante appelée Agent Gateway supervise les interactions entre les agents et les données d'entreprise. La gouvernance, autrement dit, est livrée avec le produit, et non ajoutée après coup. Cette annonce répond à un écart alarmant mis en lumière par plusieurs études récentes. Une enquête d'OutSystems auprès de 1 879 décideurs IT, publiée en avril, révèle que 97 % des organisations explorent déjà des stratégies d'agents IA, et que 49 % s'estiment avancées ou expertes dans ce domaine. Pourtant, seulement 36 % disposent d'une approche centralisée de gouvernance, et à peine 12 % utilisent une plateforme unifiée pour contrôler la prolifération des agents. Le Hype Cycle 2026 de Gartner confirme la tension : si seulement 17 % des organisations ont réellement déployé des agents IA à ce jour, plus de 60 % comptent le faire dans les deux prochaines années, la courbe d'adoption la plus agressive jamais enregistrée par Gartner pour une technologie émergente. Dans les faits, entre 11 % et 14 % des projets pilotes d'agents IA atteignent une mise en production réelle. Les 86 à 89 % restants ont été mis en pause, abandonnés, ou n'ont jamais dépassé le stade du proof-of-concept, avec la gouvernance et la complexité d'intégration citées comme causes premières. La stratégie de Google est cohérente : selon une analyse de Bain & Company, l'entreprise se repositionne d'un simple fournisseur d'accès aux modèles vers une plateforme d'entreprise agentique complète, où le contexte, l'identité et la sécurité sont au centre de l'architecture. Fait notable, les trois grands fournisseurs cloud n'ont annoncé leurs registres d'agents qu'en avril 2026, ce qui illustre à quel point les outils de gouvernance restent embryonnaires dans l'ensemble du secteur. Google propose la réponse la plus complète à ce jour, mais elle implique une contrepartie : une intégration profonde dans l'écosystème Google. C'est précisément ce que les architectes d'entreprise doivent arbitrer aujourd'hui. Les systèmes agentiques multiplient les identités et les permissions à une vitesse que les modèles traditionnels de gestion des accès n'ont jamais été conçus pour absorber, et la question n'est plus quel modèle est approuvé, mais quelles actions un agent donné peut exécuter, avec quelle identité, sur quels outils, et avec quelle piste d'audit.

UELes entreprises européennes soumises à l'AI Act, qui impose traçabilité et audit des systèmes IA à haut risque, doivent arbitrer entre adopter la couche de gouvernance Google, la plus complète du marché, et le verrouillage écosystémique qui l'accompagne.

💬 86% des pilotes qui n'arrivent jamais en prod, c'est le chiffre qui résume tout. Google a visiblement lu les mêmes postmortems et décidé d'intégrer la gouvernance dans l'architecture de base plutôt que de la coller en option après coup, ce qui est la seule approche qui tienne quand tes agents se multiplient et accumulent des identités et des permissions à toute vitesse. Le prix à payer, c'est l'intégration profonde dans l'écosystème Google, et les architectes européens sous AI Act vont devoir trancher vite là-dessus.

OutilsOutil
1 source
Les agents IA en entreprise échouent souvent parce qu'ils ne retiennent pas ce qu'ils ont appris
2VentureBeat AI 

Les agents IA en entreprise échouent souvent parce qu'ils ne retiennent pas ce qu'ils ont appris

Les agents d'intelligence artificielle déployés en entreprise échouent régulièrement dès qu'ils doivent enchaîner des décisions complexes, et la cause est souvent la même : ils oublient ce qu'ils ont appris. C'est le problème que cherche à résoudre Rippletide, une startup gravitant dans l'écosystème Neo4j, avec une architecture appelée "decision context graph". Fondée par Yann Bilien, co-fondateur et directeur scientifique, la société a conçu un système qui dote les agents d'une mémoire structurée, d'un raisonnement ancré dans le temps et d'une logique de décision explicite. L'objectif central : des agents dits "non-régressifs", capables de figer des séquences d'actions validées et de capitaliser dessus au fil du temps. Le problème que Rippletide adresse touche au cœur de la majorité des déploiements d'IA en entreprise. Les architectures RAG (Retrieval-Augmented Generation), qui constituent aujourd'hui le standard, se contentent de récupérer des documents sémantiquement pertinents depuis des sources variées, ERP, bases de données, politiques internes, et de les injecter dans le contexte du modèle. Mais comme le souligne Wyatt Mayham, consultant chez Northwest AI Consulting, cette approche "fonctionne pour les chatbots, mais se brise immédiatement dès qu'un agent doit prendre des décisions et agir". Un document récupéré ne dit pas à l'agent s'il est encore valide, s'il a été remplacé, ou si une règle contradictoire a la priorité. Résultat : des agents qui combinent des règles incompatibles, inventent des contraintes pour combler les vides, et produisent des erreurs difficiles à tracer et à reproduire. À l'échelle d'un workflow multi-étapes, même un faible taux d'erreur par étape devient catastrophique, raison principale pour laquelle la plupart des agents d'entreprise ne sortent jamais de la phase pilote. Le "decision context graph" répond à ce problème en encodant explicitement une carte structurée : quelles règles s'appliquent, dans quel contexte, et à quel moment. Le temps y est traité comme une dimension de premier ordre, chaque règle, décision et exception est délimitée temporellement, permettant à l'agent de distinguer "ce qui était vrai à ce moment-là" de "ce qui est vrai maintenant". Le système repose sur trois piliers : l'applicabilité (le bon contexte est retourné uniquement quand il est pertinent), la mémoire temporelle, et les chemins de décision explicites, l'agent peut expliquer pourquoi il a inclus tel contexte et non un autre. Lors de l'initialisation, les données non structurées sont ingérées puis organisées en ontologie. Ce marché de l'infrastructure agentique en entreprise attire une attention croissante alors que les limitations du RAG seul deviennent un frein réel au passage à l'échelle des systèmes d'IA autonomes.

OutilsOutil
1 source
Agentforce Vibes 2.0 de Salesforce s'attaque à un problème méconnu : la surcharge de contexte dans les agents IA
3VentureBeat AI 

Agentforce Vibes 2.0 de Salesforce s'attaque à un problème méconnu : la surcharge de contexte dans les agents IA

La plateforme australienne de financement de startups VentureCrowd a réduit de 90 % la durée de certains cycles de développement front-end grâce à des agents IA de codage, mais cette performance a eu un prix. Diego Mogollon, directeur produit de l'entreprise, a constaté que les agents raisonnaient exclusivement à partir des données accessibles au moment de l'exécution, ce qui les rendait «confiants et faux» dès que le contexte fourni était incomplet ou mal structuré. Le problème identifié porte un nom : le «context bloat», ou gonflement de contexte, un phénomène où les agents IA accumulent progressivement trop de données, d'instructions et d'outils au fil de workflows de plus en plus complexes. Pour y répondre, Salesforce vient de publier Agentforce Vibes 2.0, une mise à jour de sa plateforme de développement d'agents intégrée à l'écosystème Salesforce, disponible dès le plan gratuit. Cette version étend la compatibilité avec des frameworks tiers comme ReAct et introduit deux nouveaux concepts : les Abilities, qui définissent ce que l'agent cherche à accomplir, et les Skills, qui désignent les outils qu'il utilisera pour y parvenir. Le problème du gonflement de contexte est plus structurel qu'il n'y paraît. Plus un agent dispose de contexte, plus il consomme de tokens, ce qui ralentit les traitements et fait grimper les coûts. Pour les entreprises qui déploient ces systèmes à grande échelle, cela se traduit par une perte de contrôle sur la latence, la fiabilité et les budgets. Mogollon résume le paradoxe central : «Ce n'est pas un problème d'IA, c'est un problème de contexte déguisé en problème d'IA, et c'est le premier mode d'échec que j'observe dans les implémentations agentiques.» VentureCrowd a d'ailleurs dû restructurer l'ensemble de sa base de code avant même de pouvoir déployer des agents efficaces, les agents amplifiant les défauts des données qu'ils reçoivent. L'approche de Salesforce avec Agentforce Vibes 2.0 se distingue par son intégration native aux modèles de données existants des entreprises, plutôt que de chercher à minimiser le contexte. D'autres plateformes adoptent une philosophie différente : Claude Code et Codex d'OpenAI privilégient une exécution autonome, où les agents lisent des fichiers et exécutent des commandes en continu, avec des mécanismes de compaction activés lorsque le contexte devient trop volumineux. La tendance générale est à la gestion du contexte croissant plutôt qu'à sa limitation, ce qui soulève des questions de fond pour l'ensemble du secteur. Avec la multiplication des workflows agentiques complexes en entreprise, la maîtrise du contexte s'impose comme un enjeu technique et économique de premier plan, et les éditeurs qui proposeront les architectures les plus efficientes sur ce point prendront un avantage concurrentiel décisif.

OutilsOutil
1 source
4Le Big Data 

Agents IA autonomes : définition, fonctionnement et cas d’usage en entreprise

En 2026, les entreprises ne se limitent plus à utiliser l'intelligence artificielle pour générer du contenu : elles lui confient désormais des pans entiers de leur exécution opérationnelle. Les agents IA autonomes représentent cette nouvelle catégorie de systèmes capables d'atteindre des objectifs complexes sans supervision humaine constante. Contrairement à un chatbot classique comme ChatGPT qui attend une instruction pour produire un texte ou une image, un agent reçoit une intention globale et agit en conséquence : si on lui demande d'organiser un voyage d'affaires, il recherche les vols, compare les hôtels et effectue les réservations de lui-même. Ces systèmes fonctionnent selon une boucle logique permanente, perception, raisonnement, action, apprentissage, en s'appuyant sur des grands modèles de langage pour décider de la meilleure marche à suivre, et sur des outils comme des API, des navigateurs web ou des accès directs aux logiciels métier pour exécuter leurs décisions. L'impact concret pour les entreprises est avant tout économique et opérationnel. Ces agents travaillent sans interruption, traitent des volumes de données inaccessibles à un humain, et peuvent gérer de bout en bout des flux financiers, des chaînes logistiques ou des cycles de relation client, rédiger un e-mail, mettre à jour un CRM, déclencher un paiement. Leur mémoire persistante leur permet de capitaliser sur les interactions passées pour optimiser leurs actions futures, réduisant progressivement le besoin de supervision technique. La logique n'est plus celle d'un outil à piloter, mais d'un collaborateur proactif doté d'une capacité de raisonnement contextuel. De nombreuses applications métier devraient intégrer ces agents d'ici la fin de l'année 2026, ce qui en fait un impératif stratégique plutôt qu'une expérimentation. Cette évolution s'inscrit dans une transition plus large de l'IA générative vers ce qu'on appelle la « révolution agentique ». Pendant des années, les entreprises ont utilisé l'IA comme un assistant réactif ; la rupture consiste à lui déléguer une autonomie décisionnelle réelle sur des processus à enjeux. Mais cette agilité nouvelle soulève des défis de gouvernance sérieux : prolifération d'agents non supervisés, exposition des données sensibles aux outils tiers, traçabilité des décisions automatisées. Les acteurs qui tireront parti de ce tournant ne seront pas ceux qui accumulent le plus d'outils, mais ceux qui construisent une architecture IA solide, avec des garde-fous clairs sur ce que les agents sont autorisés à faire en leur nom. La question centrale pour les dirigeants n'est plus technique, elle est stratégique : jusqu'où laisser agir une entité qui possède sa propre logique d'exécution.

UELes entreprises européennes devront encadrer leur déploiement d'agents IA autonomes en conformité avec les exigences de traçabilité et de gouvernance imposées par l'AI Act.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour