Dis Next, c’est quoi un « RAG » en IA générative ?
Le RAG, ou Retrieval-Augmented Generation, est une architecture logicielle qui combine deux technologies pour répondre avec précision à des questions en langage naturel sur des bases de données internes à une organisation. Concrètement, le système fonctionne en deux temps : il récupère d'abord les passages pertinents dans un corpus de documents (contrats, manuels, bases de connaissance), puis les injecte dans un grand modèle de langage qui génère une réponse cohérente et contextualisée. Le terme lui-même n'est apparu qu'en 2020, dans un article de recherche signé par Patrick Lewis alors chez Facebook AI Research, en collaboration avec l'University College London et l'université de New York, et présenté à la conférence académique NeurIPS.
Pour les entreprises, l'intérêt est immédiat : un LLM seul, aussi puissant soit-il, n'a pas accès aux ressources internes de l'organisation. Il peut répondre de façon générale, mais il invente lorsqu'il ne sait pas, un phénomène connu sous le nom d'hallucination. Un chatbot de support client qui fabrique des informations sur des produits ou des procédures est un risque concret. Le RAG réduit ce risque en ancrant chaque réponse dans des documents réels et vérifiables. Il va aussi plus loin qu'une simple documentation bien organisée : là où un moteur de recherche classique exige que l'utilisateur sache exactement quoi chercher, navigue, lise et synthétise lui-même plusieurs pages, le RAG comprend une question formulée approximativement, croise plusieurs sources en simultané, et produit une réponse directe sans effort de navigation.
L'émergence du RAG comme technologie phare des entreprises n'est pas un hasard de calendrier. Elle résulte de la convergence de deux évolutions qui ont mis des années à mûrir : d'un côté, les LLM sont devenus accessibles au grand public avec le lancement de ChatGPT fin 2022, appuyé sur une explosion des capacités de calcul ; de l'autre, la recherche sémantique dense, qui représente le sens d'un texte sous forme de vecteurs mathématiques comparables dans des millions de documents, a atteint une maturité industrielle suffisante. Le RAG se positionne exactement à l'intersection de ces deux mondes : ni moteur de recherche pur qui trouve sans répondre, ni IA générative pure qui répond sans chercher. Google, Microsoft et Meta ont tous structuré leurs offres enterprise autour de cette architecture, signe que le RAG est devenu la colonne vertébrale des assistants IA déployés en environnement professionnel.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.


