Aller au contenu principal
Google Research intègre un RAG à base d'agents dans Gemini Enterprise pour les requêtes multi-étapes
OutilsMarkTechPost2h

Google Research intègre un RAG à base d'agents dans Gemini Enterprise pour les requêtes multi-étapes

Résumé IASource uniqueImpact UE
Source originale ↗·

L'équipe Google Research a présenté le 5 juin 2026 un nouveau cadre de récupération augmentée par agents, intégré directement à la plateforme Gemini Enterprise Agent. Cette architecture, désormais disponible en préversion publique sous le nom Cross-Corpus Retrieval, s'attaque à une limite bien connue des systèmes de recherche d'entreprise : l'incapacité à enchaîner plusieurs étapes de raisonnement sur des sources de données distinctes. Concrètement, là où un système RAG classique échoue face à une requête du type "Quelles sont les spécifications du serveur utilisé dans le Projet X ?" (parce qu'il trouve un identifiant mais ne sait pas aller chercher les specs dans une deuxième base), le nouveau système orchestre une série d'agents spécialisés. Un Orchestrateur délègue la tâche, un Agent Planificateur identifie les sources pertinentes, un Agent Réécriture de Requêtes décompose la question en sous-requêtes précises, et un Agent de Diffusion envoie ces requêtes en parallèle. Sur le benchmark FramesQA, un corpus de 824 questions et 2 676 documents PDF, le système affiche un gain de précision factuelle allant jusqu'à 34 % par rapport au RAG standard, avec de meilleures performances également sur des jeux de données propriétaires internes à Google.

Ce qui distingue fondamentalement cette architecture de ses concurrentes, c'est la présence d'un Agent de Contexte Suffisant, pièce centrale du dispositif. Plutôt que de générer une réponse dès que le premier cycle de recherche se termine, cet agent inspecte les résultats, compare un brouillon intermédiaire aux extraits récupérés, et produit un journal détaillé des lacunes identifiées, avec des raisons et des feedbacks explicites. Si des informations manquent, le cycle repart : la requête est reformulée, de nouvelles sources sont explorées. Ce mécanisme d'itération évite deux défauts symétriques : la réponse incomplète présentée comme définitive, et la capitulation prématurée du modèle face à un contexte insuffisant. Pour une question médicale portant à la fois sur les médicaments de sortie, les restrictions alimentaires et les allergies d'un patient, le système ne s'arrête pas à deux éléments sur trois, il continue jusqu'à ce que les trois soient vérifiés.

Google positionne cette avancée dans un contexte de concurrence intense sur les agents d'entreprise, un marché où Microsoft, Salesforce et plusieurs startups spécialisées investissent massivement. Le problème des requêtes multi-sources, dit "multi-hop", est depuis plusieurs années l'un des obstacles majeurs à l'adoption des LLM en environnement professionnel réel, où les données sont fragmentées entre bases de connaissances, systèmes CRM, dossiers PDF et notes cliniques. En intégrant cette capacité directement dans Gemini Enterprise Agent Platform plutôt que de la proposer comme une bibliothèque tierce, Google cherche à ancrer ses modèles au coeur des infrastructures de données des grandes organisations, tout en améliorant la fiabilité des réponses là où elle est la plus critique.

Impact France/UE

Les entreprises européennes utilisant Gemini Enterprise peuvent accéder en préversion à cette architecture multi-corpus, susceptible d'améliorer l'adoption des LLM dans des secteurs à données fragmentées comme la santé ou la finance.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Gemini Enterprise : Google lance sa plateforme unifiée pour orchestrer des agents IA
1Le Big Data 

Gemini Enterprise : Google lance sa plateforme unifiée pour orchestrer des agents IA

Google a présenté le 22 avril 2026, lors de Google Cloud Next 2026, Gemini Enterprise : une plateforme unifiée conçue pour orchestrer des flottes d'agents IA à l'échelle de l'entreprise. La nouveauté fusionne l'application Gemini Enterprise pour les utilisateurs finaux et la nouvelle Gemini Enterprise Agent Platform pour les développeurs, absorbant au passage Vertex AI qui disparaît en tant que plateforme indépendante. Plus de 200 modèles sont accessibles via Model Garden, dont les dernières générations Gemini mais aussi des modèles tiers d'Anthropic et autres. La marketplace intégrée permet de connecter des agents issus de partenaires comme Oracle, ServiceNow, Adobe, Salesforce ou Workday. Du côté technique, la plateforme introduit Agent Studio pour le développement low-code, un SDK basé sur des graphes pour les systèmes multi-agents, et Agent Runtime pour des agents capables de fonctionner en continu pendant des heures, voire des jours. Des outils d'optimisation complètent l'ensemble : Agent Simulation, Evaluation et Observability. Pour les directions informatiques, la gouvernance est au coeur du dispositif. Chaque agent se voit attribuer une identité cryptographique via Agent Identity, tandis qu'un registre central valide les outils et agents autorisés, et qu'Agent Gateway applique les politiques de sécurité à l'échelle de l'organisation. La couche de protection intègre Model Armor pour contrer les injections malveillantes et les fuites de données, appuyée par Security Command Center pour la détection des vulnérabilités. Du côté des équipes métier, Agent Designer permet de créer et déployer des agents sans écrire de code, depuis une interface unique avec boîte de réception centralisée, espaces projets à mémoire partagée et outil collaboratif Canvas pour produire des documents exportables vers Microsoft Office. Un agent Data Insights natif analyse données structurées et non structurées pour générer visualisations et rapports, tandis que Deep Research synthétise sources web et données internes. Ce lancement s'inscrit dans une course intense entre les grands acteurs du cloud pour capter les budgets IA des entreprises. Microsoft, avec Copilot Studio et Azure AI Foundry, Amazon avec Bedrock Agents, et Salesforce avec Agentforce occupent le même terrain. Google répond en cassant la fragmentation de son offre précédente : Vertex AI, Duet AI, Gemini for Workspace coexistaient sans cohérence claire pour les acheteurs. En absorbant tout dans une plateforme unique, Google vise à simplifier les cycles de vente et à verrouiller les grandes entreprises dans son écosystème. La compatibilité revendiquée avec Microsoft 365 et Google Workspace trahit la volonté de ne pas imposer une migration brutale, mais de s'intégrer aux environnements existants. L'enjeu des prochains mois sera la disponibilité réelle de ces fonctionnalités et leur tenue à l'échelle, deux points sur lesquels les annonces de Cloud Next ont historically précédé des déploiements progressifs.

UELes entreprises européennes utilisant Google Cloud devront évaluer la migration vers cette plateforme unifiée, dont les mécanismes de gouvernance (identité cryptographique des agents, registre central, audit de sécurité) pourraient faciliter la mise en conformité avec l'AI Act.

OutilsOutil
1 source
Combiner Google Search, Google Maps et fonctions personnalisées dans un appel Gemini avec chaînes d'agents multi-étapes
2MarkTechPost 

Combiner Google Search, Google Maps et fonctions personnalisées dans un appel Gemini avec chaînes d'agents multi-étapes

Google a annonce en mars 2026 une mise a jour majeure de son API Gemini permettant desormais de combiner dans un seul appel API des outils integres comme Google Search et Google Maps avec des fonctions personnalisees definies par le developpeur. Jusqu'ici, ces capacites devaient etre appelees separement, necessitant plusieurs requetes et une orchestration manuelle cote client. La mise a jour introduit egalement trois mecanismes cles : la circulation de contexte, qui preserve l'historique complet de chaque appel d'outil et de chaque reponse entre les tours de conversation ; les identifiants uniques de reponse d'outil, qui permettent de lier precisement chaque appel de fonction parallele a son resultat correspondant ; et le "Grounding with Google Maps", qui injecte des donnees de localisation en temps reel directement dans le raisonnement du modele. Les modeles concernes sont gemini-3-flash-preview pour les combinaisons d'outils et gemini-2.5-flash pour l'ancrage cartographique, les deux etant accessibles sans configuration de facturation. Cette evolution transforme la facon dont les developpeurs peuvent construire des agents IA autonomes. Auparavant, orchestrer plusieurs sources d'information, une recherche web, une donnee meteo via API tierce, et une localisation geographique, exigeait plusieurs allers-retours et une logique de coordination externe complexe. Desormais, un unique appel suffit pour que Gemini planifie, execute et synthetise des informations issues de sources heterogenes en une seule chaine de raisonnement. Pour les applications metier, assistants de voyage, outils de veille concurrentielle, agents de support client, cela reduit la latence, simplifie l'architecture et rend les systemes multi-outils beaucoup plus accessibles aux equipes de taille modeste. L'introduction des identifiants de reponse paralleles resout par ailleurs un probleme concret de fiabilite : quand plusieurs fonctions sont appelees simultanement, il etait auparavant difficile de garantir que chaque reponse correspondait bien a la bonne requete. Ces annonces s'inscrivent dans une competition intense entre Google, OpenAI et Anthropic pour imposer leur API comme la couche d'orchestration de reference pour les agents IA. OpenAI avait deja introduit le "parallel function calling" dans GPT-4 en 2023, et Anthropic a renforce les capacites d'outils de Claude tout au long de 2025. Google repond avec une integration native de son ecosysteme, Search et Maps etant des atouts considerables qu'aucun concurrent ne peut repliquer a l'identique. La prochaine etape probable est une extension de ce modele a d'autres services Google (Gmail, Calendar, Drive), transformant Gemini en un agent capable d'agir directement dans l'infrastructure numerique quotidienne des entreprises. La question qui demeure est celle du controle et de la transparence : a mesure que les chaines agentiques se complexifient, auditer ce qu'un modele a reellement fait, et pourquoi, devient un enjeu critique pour la confiance des utilisateurs professionnels.

OutilsOutil
1 source
SEO : les conseils de Google pour apparaître dans les résultats IA de Search
3Le Big Data 

SEO : les conseils de Google pour apparaître dans les résultats IA de Search

Google a publié le 17 mai 2026 un guide officiel destiné aux développeurs et aux éditeurs web, expliquant comment optimiser leur visibilité dans les nouvelles expériences de recherche propulsées par l'IA générative, les AI Overviews et le futur AI Mode. Le message central est sans ambiguïté : il n'existe pas de technique secrète pour apparaître dans ces résultats. Les mêmes fondamentaux du référencement naturel (SEO) restent déterminants. Google confirme que ses fonctionnalités IA reposent directement sur ses systèmes classiques d'indexation et de classement, et s'appuient sur une architecture de type RAG (Retrieval-Augmented Generation), qui récupère des contenus récents depuis l'index existant avant de générer une réponse. Les liens affichés dans les AI Overviews proviennent donc des pages que Google juge fiables, pertinentes et utiles. Par ailleurs, une requête utilisateur peut déclencher plusieurs recherches secondaires connexes, ce qui favorise les contenus qui traitent un sujet en profondeur plutôt que ceux qui multiplient artificiellement les variantes de mots-clés. Pour les entreprises et les éditeurs, les implications sont concrètes. Un contenu bien structuré, couvrant réellement un sujet, peut gagner en visibilité sans recourir à des tactiques d'optimisation spécifiques à l'IA. Google indique que ses modèles comprennent désormais les synonymes, les nuances et le sens global d'un texte, rendant la répétition mécanique de mots-clés encore moins pertinente. Le moteur recommande explicitement des contenus fondés sur une expertise réelle, des retours d'expérience ou des analyses originales, et déconseille les textes génériques réécrits ou produits par l'IA sans valeur ajoutée. La structure compte aussi : titres explicites, paragraphes lisibles, hiérarchie logique. Les contenus multimédias, images et vidéos pertinentes, peuvent également renforcer la visibilité au-delà du simple lien bleu traditionnel. Ce guide intervient dans un contexte de multiplication des discours marketing autour de concepts comme l'AEO (Answer Engine Optimization) ou le GEO (Generative Engine Optimization), souvent présentés comme des alternatives ou des compléments indispensables au SEO classique. Depuis l'émergence des AI Overviews en 2024, de nombreux consultants ont vendu des stratégies spécifiques, fichiers llms.txt, optimisation pour les LLM, etc., que Google invalide aujourd'hui officiellement. En réaffirmant la primauté du contenu de qualité, le géant de Mountain View envoie un signal clair à tout un écosystème d'agences et d'outils nés autour de ces nouvelles pratiques. La vraie question qui reste ouverte est celle du trafic : même en apparaissant dans une AI Overview, les éditeurs constatent que les utilisateurs cliquent moins sur les sources, ce que ce guide n'aborde pas directement.

UELes éditeurs et agences SEO en France et en Europe doivent réviser leurs pratiques : les stratégies AEO/GEO spécifiques sont officiellement invalidées par Google, qui réaffirme la primauté des fondamentaux SEO classiques pour apparaître dans ses résultats IA.

OutilsOutil
1 source
Google intègre le support MCP dans Colab pour permettre l'exécution cloud d'agents IA
4InfoQ AI 

Google intègre le support MCP dans Colab pour permettre l'exécution cloud d'agents IA

Google a publié le Colab MCP Server, un outil open source qui permet aux agents d'intelligence artificielle d'interagir directement avec Google Colab via le Model Context Protocol (MCP). Cette intégration donne aux agents la capacité d'exécuter du code, de lancer des notebooks et de piloter des environnements cloud Colab sans intervention humaine, en passant par une interface standardisée que les principaux frameworks d'agents reconnaissent nativement. L'enjeu est concret : les développeurs qui construisent des agents IA se heurtent régulièrement à deux problèmes, la puissance de calcul disponible localement et la sécurité des exécutions. En déportant ces tâches vers Colab, les agents peuvent faire tourner des modèles lourds, traiter des jeux de données volumineux ou exécuter du code potentiellement risqué dans un environnement isolé et géré par Google, sans exposer la machine du développeur. Cela ouvre la voie à des workflows d'automatisation bien plus ambitieux, notamment pour les équipes qui n'ont pas accès à des GPU dédiés. Ce lancement s'inscrit dans la montée en puissance du Model Context Protocol, standard initialement proposé par Anthropic et rapidement adopté par l'ensemble de l'industrie comme protocole commun pour connecter les agents aux outils externes. Google, qui avait déjà intégré MCP dans plusieurs de ses produits, étend ainsi sa surface de compatibilité avec l'écosystème agent. Le fait que le serveur soit open source suggère une volonté d'ancrer Colab comme infrastructure de référence pour l'exécution agentique dans le cloud.

UELes équipes européennes de développement IA peuvent déléguer l'exécution agentique à un environnement cloud isolé, facilitant le développement sans infrastructure GPU dédiée.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour