Aller au contenu principal
Les agents IA donnent des réponses fausses avec assurance : la couche de contexte est le prochain défi de l'IA en entreprise
OutilsVentureBeat AI2sem· 2 min de lecture

Les agents IA donnent des réponses fausses avec assurance : la couche de contexte est le prochain défi de l'IA en entreprise

Source originale ↗·

À San Francisco, lors du Snowflake Summit 26, l'éditeur américain de cloud de données a annoncé une série d'initiatives destinées à résoudre un problème croissant dans les déploiements d'IA en entreprise : les agents produisent des réponses assurées mais incorrectes, non pas à cause du modèle lui-même, mais parce que le même terme "revenu" peut signifier une chose dans un tableau de bord de business intelligence, une autre dans une table SQL, et encore autre chose dans les instructions d'un agent. Parmi les annonces figurent Data Stream, un service de streaming géré compatible Kafka, des améliorations à l'adaptive compute et une meilleure interopérabilité avec Apache Iceberg. La pièce maîtresse est un système à deux couches baptisé Horizon Context et Cortex Sense. Horizon Context, construit sur l'acquisition de Select Star, agrège les métadonnées de Postgres, SQL Server, Tableau et Power BI dans un catalogue centralisé ; Cortex Sense enrichit ce contexte automatiquement à partir des données et habitudes d'usage des clients, sans curation manuelle. "Horizon Context, c'est tout ce qui est explicite et déclaré par les clients ; Cortex Sense, c'est tout ce qui est implicite et dérivé par nous", a résumé Christian Kleinerman, directeur exécutif produit de Snowflake.

L'enjeu est considérable pour les entreprises qui adoptent des architectures de récupération hybrides. Selon les données VB Pulse du premier trimestre 2026, issues d'une enquête auprès d'organisations de plus de 100 employés, l'intention de passer à une récupération hybride a triplé, de 10,3 % en janvier à 33,3 % en mars, la croissance la plus rapide de tout le secteur. Lorsque plusieurs agents interrogent les mêmes données sous-jacentes, ils raisonnent sur des schémas différents et renvoient des résultats divergents. Horizon Context vise à corriger ce problème au niveau du catalogue plutôt qu'agent par agent, tandis qu'un mécanisme baptisé Semantic View Autopilot crée et affine automatiquement des vues sémantiques sans maintenance manuelle continue. La connexion à Cortex Search, l'implémentation RAG de Snowflake, permet à ce contexte enrichi d'alimenter directement les workflows de récupération des produits CoCo et Cowork.

Ce problème de couche de contexte est devenu le prochain grand chantier de l'IA d'entreprise. Les deux dernières années de construction d'infrastructures de récupération ont produit une recherche vectorielle plus rapide et moins coûteuse, mais aucune définition partagée de ce que les données signifient réellement. Snowflake n'est pas seul : Microsoft a ouvert son ontologie métier Fabric IQ via MCP pour que les agents de n'importe quel éditeur puissent s'appuyer sur une sémantique commune. Pour ne pas enfermer ses clients, Snowflake lie Horizon Context à l'Open Semantic Interchange, rendant les définitions métier portables vers des catalogues et outils tiers. La question qui se pose est désormais de savoir quelle couche de contexte s'imposera dans un marché où un nombre croissant d'acteurs promettent tous de rendre les agents plus fiables.

Impact France/UE

Les entreprises européennes déployant des architectures multi-agents font face aux mêmes enjeux de cohérence sémantique, rendant ces nouvelles couches de contexte directement pertinentes pour les DSI du continent.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Les agents IA d'entreprise fragmentent les données : Microsoft répond avec Microsoft IQ et Rayfin
1VentureBeat AI 

Les agents IA d'entreprise fragmentent les données : Microsoft répond avec Microsoft IQ et Rayfin

Microsoft a présenté lors de sa conférence Build 2026 deux nouvelles solutions destinées à résoudre un problème croissant dans les entreprises : la prolifération des silos de données générés par les agents IA. La première, Microsoft IQ, étend Fabric IQ en une couche de contexte unifiée regroupant quatre sources d'information distinctes : Work IQ (emails, réunions, flux de travail internes), Foundry IQ (bases de connaissances et procédures institutionnelles), Fabric IQ (état opérationnel en temps réel via Fabric Real-Time Intelligence), et Web IQ (signaux en provenance du web public). La seconde, Rayfin, est un SDK et CLI open-source qui déploie les applications générées par des agents directement dans Microsoft Fabric, acheminant automatiquement leurs données vers Microsoft OneLake plutôt que vers des backends isolés. Ces annonces interviennent dans un contexte révélateur : selon le VB Pulse Q1 2026 RAG Infrastructure Market Tracker, la proportion d'organisations de plus de 100 employés utilisant une approche hybride de récupération d'information a triplé entre janvier et mars 2026, passant de 10,3 % à 33,3 %. L'enjeu est considérable pour les équipes techniques et les directions des systèmes d'information. Chaque nouvel agent IA déployé repart aujourd'hui de zéro, sans mémoire du fonctionnement de l'organisation, des règles métier applicables ou de l'emplacement des données. Microsoft IQ vise à éliminer ce problème en offrant un point d'accès unique à l'ensemble du contexte organisationnel, qu'un développeur peut connecter en une seule étape d'intégration. De son côté, Rayfin s'attaque à l'autre versant du problème : les outils de développement assistés par IA génèrent des applications à un rythme que les équipes data ne peuvent plus gouverner, chacune créant par défaut un nouveau silo. Microsoft positionne explicitement Rayfin contre Supabase et Neon, les backends compatibles Postgres que ces outils utilisent spontanément, en substituant à ces solutions une infrastructure soumise aux politiques de conformité de Fabric. Cette double offensive s'inscrit dans une compétition acharnée entre les grands acteurs des plateformes de données d'entreprise, tous engagés dans la même course vers une couche de contexte partagée pour agents. Amir Netz, directeur technique de Microsoft Fabric, résume l'ambition avec une métaphore : comme l'écran vert de Matrix construisait la réalité dans laquelle évoluaient les agents du film, la plateforme data doit désormais "créer la réalité pour les agents à partir des données". La relation entre Rayfin et Microsoft IQ est présentée comme bidirectionnelle : un agent construit une application en puisant dans l'ontologie organisationnelle, et les données produites par cette application viennent enrichir l'ontologie pour les agents suivants. Les ontologies de Fabric IQ sont attendues en disponibilité générale dans les prochains mois, et l'exécution réelle de cette vision reste encore à démontrer à l'échelle.

UELes entreprises européennes utilisant Microsoft Fabric devront évaluer la conformité de ces nouvelles architectures de données centralisées avec le RGPD avant tout déploiement à grande échelle.

OutilsOpinion
1 source
Les agents IA entrent dans une phase de refonte face aux problèmes de fiabilité en entreprise
2VentureBeat AI 

Les agents IA entrent dans une phase de refonte face aux problèmes de fiabilité en entreprise

Les agents d'intelligence artificielle d'entreprise entrent dans une phase de refonte profonde. Après une première vague de déploiements rapides, de nombreuses organisations découvrent que la performance des modèles de langage ne suffit pas à garantir la fiabilité en production. Selon Preeti Somal, vice-présidente senior de l'ingénierie chez Temporal Technologies, intervenante lors d'un récent événement AI Impact Series à New York, de nombreuses équipes reviennent aujourd'hui construire une "version 2.0" de leurs agents. "Ils ont dû aller très vite, mais ils n'ont pas pris soin de la plomberie", a-t-elle déclaré. "Les systèmes s'effondrent, et ils se retrouvent à reconstruire avec une fondation fiable." Les difficultés concrètes sont multiples : gestion de l'état d'exécution, récupération après pannes, coordination entre APIs et systèmes d'entreprise, visibilité sur les processus, et maîtrise des coûts d'inférence. Un agent peut enchaîner plusieurs modèles de langage, des systèmes de récupération d'information et des applications externes, en maintenant un état sur plusieurs heures ou jours. L'enjeu est considérable pour les entreprises qui opèrent sous contraintes budgétaires. Redémarrer un processus après une panne peut multiplier les coûts d'inférence, augmenter la latence et dégrader l'expérience client. La distinction entre deux notions souvent confondues devient cruciale : l'état d'exécution, qui indique où en est l'agent dans un processus et à quel point reprendre après une défaillance, et la mémoire contextuelle, qui regroupe les informations transportées d'une interaction à l'autre. Somal cite l'exemple du client Abridge dans le secteur de la santé, où des processus traitent des visites médicales en plusieurs étapes : traitement audio, résumé, appels de modèles et génération de comptes-rendus post-consultation. Ces enchaînements longs et multi-étapes exigent une fiabilité structurelle que les premières architectures n'avaient pas anticipée. Temporal Technologies, dont l'infrastructure d'orchestration est antérieure à la vague actuelle de l'IA agentique, voit dans cette situation un écho direct à une période précédente de l'adoption du cloud en entreprise. Somal compare cette ruée vers l'IA à la stratégie "lift-and-shift" des débuts du cloud : migrer des charges de travail sans repenser les architectures sous-jacentes, pour finalement dépenser davantage sans en tirer la valeur attendue. "Cette précipitation vers l'IA dans un monde où vous n'avez même pas modernisé vos applications me rappelle un peu ce lift-and-shift qui s'est produit dans le cloud", a-t-elle dit. Les problèmes d'ingénierie fondamentaux comme la durabilité d'exécution et la récupération après défaillance n'émergent souvent qu'après le déploiement. L'IA agentique n'invente pas ces problèmes : elle les amplifie, et les entreprises qui n'ont pas modernisé leur socle applicatif risquent de reproduire les mêmes erreurs coûteuses qu'une décennie auparavant.

OutilsOpinion
1 source
Google fait de la gouvernance des agents IA un produit, les entreprises doivent encore s'adapter
3AI News 

Google fait de la gouvernance des agents IA un produit, les entreprises doivent encore s'adapter

Il y a deux semaines à Las Vegas, lors du Google Cloud Next '26, Google a franchi un cap que l'industrie de l'IA entreprise évitait depuis près de deux ans : intégrer la gouvernance des agents IA directement dans le produit, non pas comme une fonctionnalité optionnelle, mais comme une couche architecturale fondamentale. La pièce maîtresse de l'événement est le Gemini Enterprise Agent Platform, présenté comme le successeur de Vertex AI. Sa particularité : chaque agent construit sur la plateforme reçoit une identité cryptographique unique à des fins de traçabilité et d'audit, tandis qu'une composante appelée Agent Gateway supervise les interactions entre les agents et les données d'entreprise. La gouvernance, autrement dit, est livrée avec le produit, et non ajoutée après coup. Cette annonce répond à un écart alarmant mis en lumière par plusieurs études récentes. Une enquête d'OutSystems auprès de 1 879 décideurs IT, publiée en avril, révèle que 97 % des organisations explorent déjà des stratégies d'agents IA, et que 49 % s'estiment avancées ou expertes dans ce domaine. Pourtant, seulement 36 % disposent d'une approche centralisée de gouvernance, et à peine 12 % utilisent une plateforme unifiée pour contrôler la prolifération des agents. Le Hype Cycle 2026 de Gartner confirme la tension : si seulement 17 % des organisations ont réellement déployé des agents IA à ce jour, plus de 60 % comptent le faire dans les deux prochaines années, la courbe d'adoption la plus agressive jamais enregistrée par Gartner pour une technologie émergente. Dans les faits, entre 11 % et 14 % des projets pilotes d'agents IA atteignent une mise en production réelle. Les 86 à 89 % restants ont été mis en pause, abandonnés, ou n'ont jamais dépassé le stade du proof-of-concept, avec la gouvernance et la complexité d'intégration citées comme causes premières. La stratégie de Google est cohérente : selon une analyse de Bain & Company, l'entreprise se repositionne d'un simple fournisseur d'accès aux modèles vers une plateforme d'entreprise agentique complète, où le contexte, l'identité et la sécurité sont au centre de l'architecture. Fait notable, les trois grands fournisseurs cloud n'ont annoncé leurs registres d'agents qu'en avril 2026, ce qui illustre à quel point les outils de gouvernance restent embryonnaires dans l'ensemble du secteur. Google propose la réponse la plus complète à ce jour, mais elle implique une contrepartie : une intégration profonde dans l'écosystème Google. C'est précisément ce que les architectes d'entreprise doivent arbitrer aujourd'hui. Les systèmes agentiques multiplient les identités et les permissions à une vitesse que les modèles traditionnels de gestion des accès n'ont jamais été conçus pour absorber, et la question n'est plus quel modèle est approuvé, mais quelles actions un agent donné peut exécuter, avec quelle identité, sur quels outils, et avec quelle piste d'audit.

UELes entreprises européennes soumises à l'AI Act, qui impose traçabilité et audit des systèmes IA à haut risque, doivent arbitrer entre adopter la couche de gouvernance Google, la plus complète du marché, et le verrouillage écosystémique qui l'accompagne.

💬 86% des pilotes qui n'arrivent jamais en prod, c'est le chiffre qui résume tout. Google a visiblement lu les mêmes postmortems et décidé d'intégrer la gouvernance dans l'architecture de base plutôt que de la coller en option après coup, ce qui est la seule approche qui tienne quand tes agents se multiplient et accumulent des identités et des permissions à toute vitesse. Le prix à payer, c'est l'intégration profonde dans l'écosystème Google, et les architectes européens sous AI Act vont devoir trancher vite là-dessus.

OutilsOutil
1 source
Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents
4VentureBeat AI 

Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents

Lors de sa conférence Build 2026, Microsoft a dévoilé cette semaine une série d'annonces destinées à ancrer les agents d'intelligence artificielle au cœur des systèmes d'entreprise. La firme a présenté Microsoft IQ, une couche contextuelle unifiée couvrant GitHub Copilot, Microsoft Foundry et Copilot Studio, ainsi que des API Work IQ dont le lancement est prévu le 16 juin. S'y ajoutent Fabric IQ pour les données métier structurées, Foundry IQ pour la récupération d'informations à travers les bases de connaissances d'entreprise et le web en temps réel, et Web IQ, un moteur de recherche conçu spécifiquement pour les agents. Microsoft a également introduit Scout, un assistant personnel de travail autonome, et annoncé sept nouveaux modèles maison regroupés sous la famille MAI, dont MAI-Thinking-1, optimisés pour l'efficience en tokens et la personnalisation sur données propriétaires. En parallèle, Claude Opus 4.8 d'Anthropic est désormais disponible sur Azure Foundry, aux côtés des modèles OpenAI GPT, témoignant d'une stratégie délibérée de choix multiple de modèles. Ces annonces marquent un tournant dans la façon dont Microsoft positionne son infrastructure IA : ce n'est plus l'accès à un modèle puissant qui fait la différence, mais la capacité à donner aux agents un contexte fiable, une identité, une mémoire et un accès sécurisé aux données d'entreprise. Pour les DSI et équipes techniques, cela se traduit concrètement par la possibilité de déployer des agents gérés dans Foundry, avec gestion automatique du dimensionnement et de la conteneurisation, sans avoir à construire cette infrastructure from scratch. L'enjeu est de taille : les entreprises qui parviennent à brancher leurs agents sur leurs données internes et leurs workflows existants pourront automatiser des processus complexes à grande échelle, là où les expériences pilotes restaient jusqu'ici cantonnées à des cas d'usage isolés. Marco Casalaina, VP Products Core AI et "AI Futurist" de Microsoft, est au cœur de cette stratégie. Ancien responsable de l'équipe Einstein AI chez Salesforce et diplômé en informatique de Cornell, il a rejoint Microsoft début 2022 pour prendre la tête des Azure Cognitive Services avant d'étendre son périmètre à l'ensemble des outils pour développeurs IA, incluant Foundry, VS Code, GitHub et GitHub Copilot. Son rôle de futuriste a une définition très concrète chez Microsoft : il est systématiquement le premier à tester chaque nouvelle fonctionnalité en provenance de toutes les équipes de la firme. Cette position d'observatoire lui permet de tracer ce qu'il appelle "le futur immédiat", c'est-à-dire l'horizon à douze mois des capacités agentiques. La compétition pour devenir la plateforme de référence des agents d'entreprise est désormais ouverte, avec Google et AWS comme principaux rivaux dans une course où le contexte, la gouvernance et l'intégration des données deviennent les véritables différenciateurs.

UELes entreprises européennes peuvent évaluer les API Work IQ sur Azure (lancement le 16 juin) et les modèles MAI pour l'automatisation de leurs workflows internes, avec des enjeux de souveraineté des données à considérer.

💬 Microsoft assume enfin que la guerre se joue sur la plomberie, pas sur les modèles. Donner aux agents un contexte fiable, une identité et un accès sécurisé aux données internes, c'est précisément ce qui bloquait les pilotes depuis deux ans. Et avoir Claude d'Anthropic sur Azure aux côtés d'OpenAI, c'est malin : un argument de neutralité que Google et AWS n'ont pas encore.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic