
Google Research intègre un RAG à base d'agents dans Gemini Enterprise pour les requêtes multi-étapes
L'équipe Google Research a présenté le 5 juin 2026 un nouveau cadre de récupération augmentée par agents, intégré directement à la plateforme Gemini Enterprise Agent. Cette architecture, désormais disponible en préversion publique sous le nom Cross-Corpus Retrieval, s'attaque à une limite bien connue des systèmes de recherche d'entreprise : l'incapacité à enchaîner plusieurs étapes de raisonnement sur des sources de données distinctes. Concrètement, là où un système RAG classique échoue face à une requête du type "Quelles sont les spécifications du serveur utilisé dans le Projet X ?" (parce qu'il trouve un identifiant mais ne sait pas aller chercher les specs dans une deuxième base), le nouveau système orchestre une série d'agents spécialisés. Un Orchestrateur délègue la tâche, un Agent Planificateur identifie les sources pertinentes, un Agent Réécriture de Requêtes décompose la question en sous-requêtes précises, et un Agent de Diffusion envoie ces requêtes en parallèle. Sur le benchmark FramesQA, un corpus de 824 questions et 2 676 documents PDF, le système affiche un gain de précision factuelle allant jusqu'à 34 % par rapport au RAG standard, avec de meilleures performances également sur des jeux de données propriétaires internes à Google.
Ce qui distingue fondamentalement cette architecture de ses concurrentes, c'est la présence d'un Agent de Contexte Suffisant, pièce centrale du dispositif. Plutôt que de générer une réponse dès que le premier cycle de recherche se termine, cet agent inspecte les résultats, compare un brouillon intermédiaire aux extraits récupérés, et produit un journal détaillé des lacunes identifiées, avec des raisons et des feedbacks explicites. Si des informations manquent, le cycle repart : la requête est reformulée, de nouvelles sources sont explorées. Ce mécanisme d'itération évite deux défauts symétriques : la réponse incomplète présentée comme définitive, et la capitulation prématurée du modèle face à un contexte insuffisant. Pour une question médicale portant à la fois sur les médicaments de sortie, les restrictions alimentaires et les allergies d'un patient, le système ne s'arrête pas à deux éléments sur trois, il continue jusqu'à ce que les trois soient vérifiés.
Google positionne cette avancée dans un contexte de concurrence intense sur les agents d'entreprise, un marché où Microsoft, Salesforce et plusieurs startups spécialisées investissent massivement. Le problème des requêtes multi-sources, dit "multi-hop", est depuis plusieurs années l'un des obstacles majeurs à l'adoption des LLM en environnement professionnel réel, où les données sont fragmentées entre bases de connaissances, systèmes CRM, dossiers PDF et notes cliniques. En intégrant cette capacité directement dans Gemini Enterprise Agent Platform plutôt que de la proposer comme une bibliothèque tierce, Google cherche à ancrer ses modèles au coeur des infrastructures de données des grandes organisations, tout en améliorant la fiabilité des réponses là où elle est la plus critique.
Les entreprises européennes utilisant Gemini Enterprise peuvent accéder en préversion à cette architecture multi-corpus, susceptible d'améliorer l'adoption des LLM dans des secteurs à données fragmentées comme la santé ou la finance.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




