OutilsMarkTechPost3h· 2 min de lecture

LlamaIndex "legal-kb" : recherche à base d'agents sur Index v2 avec les outils retrieve, find, read et grep

LlamaIndex a publié legal-kb, une application de référence disponible sur GitHub, conçue comme une base de connaissances pour documents juridiques. Le projet s'appuie sur Index v2, la plateforme LlamaParse, et se présente comme une application web fonctionnelle construite avec TanStack Start. Un utilisateur se connecte, crée un projet, télécharge des fichiers, puis discute avec un agent qui interroge en direct un index LlamaCloud associé au projet. Chaque document envoyé est automatiquement analysé et indexé en arrière plan. L'agent, implémenté dans le fichier src/lib/agent.ts, dispose de quatre outils calqués sur des opérations de système de fichiers familières aux développeurs: retrieve pour la recherche hybride sémantique et par mots clés avec reclassement optionnel, findFiles pour rechercher des fichiers par nom exact ou partiel, readFile pour lire le contenu brut avec des fenêtres de décalage et de longueur, et grepFile pour repérer un motif précis dans un fichier avec sa position exacte. Le prompt système impose un ordre strict: l'agent doit d'abord appeler findFiles pour établir l'inventaire des documents, puis affiner sa recherche avec retrieve, avant de confirmer le texte exact via readFile ou grepFile avant toute citation.

Cette approche, que l'équipe appelle un Retrieval Harness, ou harnais de récupération, change la logique habituelle des systèmes de recherche documentaire assistés par IA. Plutôt qu'une simple recherche par embedding en une seule passe, l'agent explore activement une base de connaissances volumineuse et évolutive pour résoudre une tâche, un peu comme un utilisateur qui naviguerait dans un système de fichiers. Pour un domaine aussi sensible que le juridique, où l'exactitude des citations et la traçabilité des sources sont essentielles, cette méthode réduit le risque d'hallucination en forçant l'agent à vérifier le texte exact avant de répondre. Le versionnage des documents, géré par paire projet et nom de fichier, permet en outre de conserver plusieurs versions d'un même contrat ou accord de confidentialité côte à côte, avec un filtrage par métadonnées lors de la récupération.

Sur le plan technique, les fichiers téléchargés sont envoyés vers le répertoire source LlamaCloud du projet, puis une ligne File et ProjectFile est écrite dans PostgreSQL via Prisma, pendant que l'interface interroge le statut de synchronisation de l'index. L'agent repose sur ToolLoopAgent du Vercel AI SDK 6, avec un choix possible entre modèles OpenAI ou Anthropic à chaque échange, chacun utilisant ses propres clés API. Les modèles Claude activent le raisonnement étendu, tandis que les modèles de raisonnement d'OpenAI utilisent un effort de raisonnement moyen. En publiant ce code comme référence ouverte, LlamaIndex illustre une tendance plus large du secteur: doter les agents d'outils génériques et composables, réutilisables au-delà du cas d'usage juridique initial, plutôt que de construire des pipelines de récupération rigides et spécifiques à chaque application.

Dans nos dossiers

OpenAI Anthropic

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AWS ML Blog

Des agents avec recherche web grâce à Strands et Exa

AWS a publié une intégration native entre son SDK open source Strands Agents et le moteur de recherche Exa, permettant aux agents IA d'accéder au web en temps réel sans couche de post-traitement. Cette combinaison expose deux outils principaux : exasearch, qui effectue des recherches sémantiques avec prise en charge de catégories comme les articles d'actualité, les publications de recherche ou les dépôts de code, et exaget_contents, qui récupère le contenu complet de pages web ciblées. Le SDK Strands Agents, distribué en open source par AWS, repose sur une architecture pilotée par le modèle : plutôt que de définir des workflows figés, le développeur fournit un modèle de langage, un prompt système et une liste d'outils, puis c'est le modèle lui-même qui décide quels outils appeler, dans quel ordre, et quand la tâche est accomplie. Le SDK embarque déjà plus de 40 outils préconstruits couvrant la gestion de fichiers, l'exécution de code, les API AWS, la mémoire et la recherche web. Pour les développeurs qui construisent des agents dédiés à la veille, à la vérification des faits ou à l'intelligence concurrentielle, cette intégration élimine un obstacle persistant : la plupart des API de recherche généralistes renvoient des pages HTML chargées de balisage et des snippets courts optimisés pour la navigation humaine, ce qui oblige à construire des couches supplémentaires de parsing, de nettoyage et de reclassement avant de pouvoir injecter ces données dans une fenêtre de contexte LLM. Exa résout ce problème à la source en fournissant un contenu propre, structuré et directement exploitable. Concrètement, un agent peut enchaîner plusieurs appels de recherche, accumuler les résultats dans son historique de conversation et raisonner sur l'ensemble pour produire une réponse finale, sans que le développeur n'ait à orchestrer chaque étape manuellement. Exa se distingue des moteurs traditionnels par son approche sémantique : une requête comme "startups développant des solutions climatiques" retourne effectivement des entreprises du secteur, même si leurs pages ne contiennent pas cette formulation exacte, car le moteur travaille sur la similarité de sens plutôt que sur la correspondance de mots-clés. Le SDK supporte également le Model Context Protocol (MCP), ce qui facilite l'ajout de tout nouveau serveur d'outils sans travail d'intégration supplémentaire. L'intégration Exa est disponible via le package strands-agents-tools et s'ajoute à la liste d'outils en une ligne de code. Dans un contexte où les agents IA peinent encore à accéder à des informations récentes et fiables, cette combinaison d'un framework agentique piloté par le modèle et d'un moteur de recherche conçu pour les LLM ouvre des perspectives concrètes pour des cas d'usage comme l'analyse de marché, la recherche documentaire automatisée ou le suivi de l'actualité technologique en temps réel.

OutilsOutil

1 source

2MarkTechPost

Construire un assistant de recherche à base d'agents avec Groq, LangGraph, sous-agents et mémoire

Un tutoriel publié récemment détaille la construction d'un assistant de recherche agentique fonctionnant sur l'infrastructure d'inférence de Groq, en combinant LangGraph, LangChain et le modèle open source Llama 3.3 70B Versatile de Meta. L'architecture repose sur l'endpoint compatible OpenAI de Groq, disponible gratuitement via console.groq.com, ce qui permet d'utiliser l'interface ChatOpenAI de LangChain sans modifier le code en profondeur, simplement en redirigeant la clé API et l'URL de base. L'agent ainsi construit dispose d'un ensemble d'outils concrets: recherche web via DuckDuckGo, récupération de pages, lecture et écriture de fichiers, exécution de code Python, délégation à des sous-agents spécialisés, et une mémoire persistante entre les sessions. Le tout s'appuie sur des bibliothèques comme BeautifulSoup4 pour le parsing HTML et Pydantic pour la validation des données. Ce qui rend cette approche notable, c'est la combinaison d'une infrastructure gratuite et d'une architecture capable de raisonnement multi-étapes. L'agent ne se contente pas de répondre à une question: il décompose un sujet de recherche en sous-questions, interroge plusieurs sources, croise les informations pour identifier les consensus et les divergences, puis génère des rapports structurés sauvegardés dans un répertoire de sortie. La mémoire à long terme lui permet de réutiliser des connaissances acquises lors d'exécutions précédentes, évitant de recommencer from scratch à chaque session. Pour les développeurs et chercheurs qui cherchent à automatiser des workflows de veille ou d'analyse documentaire, cette architecture offre un point de départ fonctionnel sans coût d'inférence immédiat. Ce tutoriel s'inscrit dans une tendance de fond qui voit LangGraph s'imposer comme framework de référence pour les systèmes agentiques en Python, face à des alternatives comme AutoGen ou CrewAI. Groq, de son côté, mise sur la vitesse d'inférence permise par ses puces LPU propriétaires pour attirer les développeurs avec un tier gratuit généreux, dans l'espoir de les convertir en clients payants à l'échelle. L'utilisation de Llama 3.3 70B, modèle open source de Meta, illustre également la montée en puissance des modèles non propriétaires capables d'exécuter du tool calling fiable, compétence longtemps réservée aux modèles fermés comme GPT-4. La prochaine étape naturelle pour ce type de système serait l'intégration de sources structurées, une mémoire vectorielle plus sophistiquée, ou le déploiement dans des environnements de production avec contrôle des coûts.

OutilsTuto

1 source

3The Decoder

NotebookLM de Google intègre désormais un ordinateur cloud avec exécution de code et recherche à base d'agents

Google a annoncé une mise à jour majeure de NotebookLM, son outil de recherche et de synthèse documentaire. La nouvelle version tourne désormais sur Gemini 2.5 Flash et dispose d'un ordinateur cloud dédié capable d'exécuter du code directement depuis l'interface. Plus significatif encore, NotebookLM peut désormais trouver ses propres sources de manière autonome via Google Search, sans que l'utilisateur ait à importer manuellement des documents. Lors des tests internes, le nouveau système a surpassé l'ancienne version dans 78,2 % des cas. Ces évolutions transforment NotebookLM d'un simple outil d'analyse documentaire en un véritable agent de recherche autonome. La capacité d'exécution de code ouvre la voie à des analyses de données directement dans l'outil, sans passer par un environnement externe. L'intégration native à Google Search signifie que les utilisateurs n'ont plus besoin de sélectionner manuellement leurs sources : l'outil explore le web et construit lui-même sa base documentaire. Pour les chercheurs, journalistes, consultants ou étudiants, cela réduit considérablement le temps de préparation avant d'obtenir une synthèse exploitable. NotebookLM avait été lancé par Google en 2023 comme outil expérimental de prise de notes augmentée par l'IA, avant de connaître un succès inattendu, notamment grâce à sa fonctionnalité de podcast audio généré automatiquement. Cette montée en puissance vers l'agentique s'inscrit dans la tendance générale des grands acteurs de l'IA à doter leurs outils de capacités d'action autonome. Google positionne ainsi NotebookLM comme un concurrent direct des assistants de recherche comme Perplexity ou les modes "deep research" de ChatGPT et Gemini Advanced.

UELes professionnels et chercheurs en France et en Europe gagnent accès à un agent de recherche autonome capable d'explorer le web et d'exécuter du code, réduisant significativement le temps de préparation documentaire.

OutilsOutil

1 source

4MarkTechPost

Le Context Bridge d'IWE : graphe de connaissances IA avec RAG à base d'agents et appels de fonctions OpenAI

Un tutoriel publié récemment sur la plateforme analytique Towards Data Science détaille l'implémentation d'IWE, un système open-source de gestion des connaissances personnelles écrit en Rust, transformé en graphe de connaissances piloté par intelligence artificielle. Le projet s'appuie sur l'API OpenAI, la bibliothèque Python Graphviz et un pipeline RAG agentique (Retrieval-Augmented Generation) pour permettre à un agent IA de naviguer dans des notes Markdown interconnectées. Concrètement, le tutoriel guide le développeur dans la construction d'une base de connaissances complète à partir de zéro : chaque note devient un nœud dans un graphe orienté, les liens wiki ([[note]]) et les liens Markdown standard constituent les arêtes, et IWE expose ses opérations clés via une interface CLI — recherche floue (find), récupération contextuelle (retrieve), affichage de hiérarchie (tree), consolidation de documents (squash), statistiques (stats) et export au format DOT pour visualisation. L'intérêt concret de cette architecture réside dans la capacité d'un agent à effectuer un raisonnement multi-sauts entre documents reliés, à identifier des lacunes dans la base de connaissances et à générer automatiquement de nouvelles notes qui s'intègrent dans la structure existante. Pour les développeurs et les équipes techniques, cela représente un changement significatif dans la façon d'exploiter la documentation interne : au lieu de chercher manuellement dans des dossiers de notes, un agent invoque des outils de function calling OpenAI pour traverser le graphe, extraire des résumés, suggérer des liens manquants et isoler les tâches à accomplir (todo extraction). La précision du graphe de rétroliens — chaque document connaît ses documents référents — permet un contexte réellement pertinent transmis au modèle de langage, contrairement aux approches RAG classiques basées sur la similarité vectorielle seule. IWE s'inscrit dans un mouvement plus large autour des systèmes de gestion des connaissances personnelles (PKM) popularisés par des outils comme Obsidian ou Roam Research, mais avec une philosophie orientée développeur : tout est fichier texte, tout est scriptable, et le LSP (Language Server Protocol) permet une intégration directe dans les éditeurs de code comme Neovim ou VS Code. En greffant OpenAI par-dessus cette infrastructure légère, le tutoriel illustre une tendance croissante dans l'outillage IA : plutôt que de recourir à des plateformes centralisées et coûteuses, construire des pipelines agentiques sur des bases de connaissances locales, contrôlées, versionnées sous Git. La prochaine étape logique pour ce type de système serait l'intégration de modèles locaux via Ollama, afin de s'affranchir totalement des API externes pour les cas d'usage sensibles ou hors-ligne.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic