Aller au contenu principal
Les LLMs de connaissance selon Karpathy : une bibliothèque markdown évolutive gérée par IA, en alternative au RAG
OutilsVentureBeat AI13sem· 2 min de lecture

Les LLMs de connaissance selon Karpathy : une bibliothèque markdown évolutive gérée par IA, en alternative au RAG

Source originale ↗·

Andrej Karpathy, ancien directeur de l'IA chez Tesla et co-fondateur d'OpenAI, a publié sur X une description détaillée de son architecture personnelle qu'il nomme "LLM Knowledge Bases". Le principe : confier à un LLM le rôle de bibliothécaire permanent, chargé de compiler, organiser et maintenir une bibliothèque de fichiers Markdown (.md) représentant ses projets et sujets de recherche. Le système fonctionne en trois étapes : les matières brutes (articles, dépôts GitHub, papers de recherche) sont déposées dans un répertoire raw/, converties en Markdown via l'outil Obsidian Web Clipper ; le LLM "compile" ensuite ces données en rédigeant des articles encyclopédiques, des résumés et des liens croisés entre concepts ; enfin, des passes de "linting" régulières permettent au modèle de détecter les incohérences et les connexions manquantes, rendant la base auto-réparatrice.

Cette approche s'attaque à un problème concret que tout développeur utilisant des LLMs connaît bien : la réinitialisation du contexte à chaque nouvelle session. Reconstruire l'état d'un projet complexe consomme des tokens précieux et du temps. En maintenant une base de connaissances structurée, lisible par l'humain et directement exploitable par le modèle, Karpathy élimine ce "reset lobotomisant". Par rapport au RAG classique — où les documents sont découpés en fragments arbitraires, transformés en vecteurs mathématiques et stockés dans une base spécialisée — son système évite la boîte noire des embeddings : chaque information est traçable jusqu'à un fichier Markdown qu'un humain peut lire, modifier ou supprimer. Pour les datasets de taille intermédiaire, la complexité opérationnelle d'une infrastructure vectorielle n'est tout simplement plus justifiée.

Le RAG domine la scène enterprise depuis trois ans, mais les limites de l'approche par chunks sont de plus en plus visibles à mesure que les fenêtres de contexte des LLMs s'élargissent. Karpathy reconnaît lui-même que son système reste "une collection hacky de scripts", mais la réaction de la communauté a immédiatement pointé vers le potentiel commercial : comme l'a formulé l'entrepreneur Vamshi Reddy, "chaque entreprise possède déjà un répertoire raw/ — personne ne l'a jamais compilé". Karpathy a acquiescé, évoquant une "incroyable nouvelle catégorie de produits". La plupart des organisations se noient dans des données non structurées — logs Slack, wikis internes, rapports PDF — sans jamais avoir les moyens de les synthétiser. Une couche enterprise inspirée de cette architecture pourrait transformer ces silos en bases de connaissances vivantes, auditables et maintenues en continu par l'IA elle-même.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

L'ère du RAG pour les agents IA touche à sa fin : place à une couche de connaissances intégrée à la compilation
1VentureBeat AI 

L'ère du RAG pour les agents IA touche à sa fin : place à une couche de connaissances intégrée à la compilation

Pinecone, pionnière des bases de données vectorielles, a annoncé ce 4 mai 2026 le lancement en accès anticipé de Nexus, qu'elle présente non pas comme une amélioration de la recherche vectorielle, mais comme un moteur de connaissance entièrement repensé pour les agents IA. Le produit introduit un compilateur de contexte qui transforme les données brutes d'une entreprise en artefacts de connaissance persistants et adaptés à des tâches spécifiques, avant même qu'un agent ne formule sa première requête. Nexus embarque également KnowQL, un nouveau langage de requête déclaratif permettant aux agents de spécifier la forme des résultats attendus, les exigences de confiance et les contraintes de latence. Sur un benchmark interne, une tâche d'analyse financière qui consommait auparavant 2,8 millions de tokens a été traitée par Nexus avec seulement 4 000 tokens, soit une réduction de 98 %, bien que Pinecone n'ait pas encore validé ce chiffre en déploiement client réel. Cette rupture répond à une limite structurelle du paradigme RAG (retrieval-augmented generation), conçu pour des interactions humaines ponctuelles, une requête, une réponse, un interprète humain dans la boucle. Les agents IA fonctionnent différemment : ils reçoivent des tâches complexes, agrègent des sources multiples, résolvent des conflits d'information et enchaînent les requêtes de façon autonome. Or, dans une architecture RAG classique, chaque session repart de zéro, redécouvrant à chaque fois quelles tables sont liées, quelles sources font autorité, quels formats sont exploitables. Pinecone estime que 85 % de la puissance de calcul des agents est absorbée par ce cycle de redécouverte, au détriment de la tâche réelle. Il en résulte une latence imprévisible, des coûts en tokens incontrôlés et des résultats non déterministes, deux exécutions identiques sur les mêmes données peuvent produire des réponses différentes, sans traçabilité des sources, ce qui constitue un blocage rédhibitoire pour les entreprises soumises à des obligations de conformité. La sondage Pulse de VentureBeat pour le premier trimestre 2026 confirme ce tournant : chaque base de données vectorielle standalone perd des parts d'adoption, tandis que l'intention de récupération hybride a triplé pour atteindre 33,3 %, la position stratégique à la croissance la plus rapide du secteur. En déplaçant le travail de raisonnement du moment de l'inférence vers une phase de compilation préalable, Nexus tente de résoudre ce que le PDG Ash Ashutosh résume ainsi : les agents sont des machines contraintes de travailler sur des systèmes conçus pour des humains. L'enjeu dépasse Pinecone, c'est toute une catégorie technologique, celle des bases vectorielles nées avec ChatGPT, qui doit se réinventer pour survivre à l'ère agentique.

UELes entreprises françaises et européennes qui développent des agents IA sur des architectures RAG devront surveiller ce tournant vers des moteurs de connaissance compilés, susceptible de remodeler les choix d'infrastructure.

OutilsOutil
1 source
Comment créer une base de connaissances IA entièrement interrogeable avec OpenKB, OpenRouter et Llama
2MarkTechPost 

Comment créer une base de connaissances IA entièrement interrogeable avec OpenKB, OpenRouter et Llama

Un tutoriel publié récemment détaille comment construire une base de connaissances locale entièrement interrogeable en combinant trois outils : OpenKB, la plateforme OpenRouter et le modèle Llama 3.3 70B de Meta, accessible gratuitement sans carte bancaire. Le guide couvre l'ensemble du pipeline, de l'installation d'OpenKB via pip jusqu'à l'interrogation structurée de documents Markdown, en passant par la génération automatique de résumés et de pages conceptuelles au format wiki. La clé API OpenRouter est récupérée de façon sécurisée via la bibliothèque Python getpass, sans jamais être inscrite en dur dans le code. Le résultat est un système de connaissance navigable, avec gestion des liens croisés entre pages, capable de répondre à des requêtes en langage naturel et d'être mis à jour de manière incrémentale. Ce type d'architecture présente un intérêt concret pour les développeurs, chercheurs et équipes qui souhaitent organiser et interroger des corpus de documents internes sans envoyer leurs données vers des services cloud payants. En s'appuyant sur un modèle de 70 milliards de paramètres disponible gratuitement via OpenRouter, l'approche élimine le coût d'inférence tout en offrant des capacités de synthèse comparables à des solutions propriétaires. La possibilité d'analyser programmatiquement les relations entre pages et les liens croisés ouvre également des usages avancés : cartographie de concepts, détection de lacunes documentaires, ou navigation thématique automatisée dans de larges volumes de texte. L'émergence de ce genre de tutoriel s'inscrit dans une tendance plus large de démocratisation des outils RAG (retrieval-augmented generation), qui permettent d'ancrer les réponses d'un LLM dans une base documentaire locale plutôt que dans ses seuls paramètres d'entraînement. OpenRouter joue ici un rôle d'intermédiaire unifié, donnant accès à des dizaines de modèles open source via une API commune, ce qui réduit la friction technique pour expérimenter. OpenKB, de son côté, se positionne comme une couche d'abstraction au-dessus de ces modèles, spécialisée dans la structuration wiki et la navigation sémantique. Alors que des acteurs comme Notion AI ou Confluence intègrent des fonctions similaires dans des produits fermés, des solutions comme celle-ci permettent de garder le contrôle total sur les données et l'infrastructure, un enjeu croissant pour les entreprises soumises à des contraintes de confidentialité ou de souveraineté.

UECette architecture locale répond directement aux enjeux de souveraineté des données pour les entreprises et administrations européennes soumises au RGPD et aux contraintes de confidentialité.

OutilsTuto
1 source
Onyx : une alternative à Claude, plus puissante, open-source et locale ?
3Le Big Data 

Onyx : une alternative à Claude, plus puissante, open-source et locale ?

Onyx est une plateforme d'intelligence artificielle open source qui a franchi le cap des 20 000 étoiles sur GitHub début avril 2026, attirant l'attention des équipes techniques à la recherche d'alternatives aux solutions propriétaires comme Claude d'Anthropic. Conçue pour s'installer en self-hosting via Docker, elle fonctionne comme une couche d'orchestration complète : elle se connecte à plus de 40 sources de données d'entreprise (stockage, messagerie, gestion de projet), indexe les contenus en continu et dialogue avec n'importe quel LLM, qu'il s'agisse de modèles cloud, d'API externes ou de modèles tournant entièrement en local. Sur les benchmarks de recherche approfondie, Onyx affiche des scores supérieurs à plusieurs solutions propriétaires, en combinant recherche sémantique, indexation permanente et exploration web intégrée pour produire des réponses contextualisées et traçables. L'enjeu concret est la souveraineté technologique des organisations. En permettant de choisir librement le modèle sous-jacent selon chaque usage et d'optimiser les coûts sans dépendre d'un fournisseur unique, Onyx élimine le risque de verrouillage propriétaire qui préoccupe de nombreux DSI et responsables de la sécurité informatique. Les réponses ne reposent plus sur des données d'entraînement génériques, mais sur les documents internes réels de l'entreprise, synchronisés en temps réel. Dans des environnements professionnels où chaque réponse doit être justifiable et auditable, cette traçabilité représente un avantage opérationnel direct. L'outil "Craft" intégré pousse la logique plus loin : il permet de générer non seulement des documents, mais aussi des tableaux de bord, des applications web et des visualisations à partir des données internes, dans des environnements isolés garantissant la confidentialité. Le lancement d'Onyx s'inscrit dans une dynamique plus large de professionnalisation de l'IA open source, portée par des projets comme LangChain, Ollama ou LlamaIndex, qui ont progressivement rendu accessibles des capacités jusqu'alors réservées aux grandes plateformes cloud. Face à la montée en puissance de Claude, GPT-4o et Gemini, une partie de l'écosystème technique cherche à construire des infrastructures IA qui restent sous contrôle de l'organisation. Onyx mise sur la dimension collaborative pour se différencier davantage : la plateforme gère des rôles, des accès granulaires et des agents automatisés configurables avec des règles précises, la rapprochant d'un système applicatif complet plutôt que d'un simple assistant conversationnel. La prochaine étape pour le projet sera de démontrer sa robustesse à l'échelle dans des environnements de production critiques, un terrain où les solutions propriétaires conservent encore une avance significative en matière de support et de garanties contractuelles.

UELes organisations européennes soucieuses de souveraineté numérique et de conformité RGPD peuvent déployer Onyx en self-hosting pour garder leurs données internes hors des clouds américains.

OutilsOutil
1 source
Google Cloud lance un format ouvert pour convertir des documents épars en fichiers Markdown destinés aux agents IA
4The Decoder 

Google Cloud lance un format ouvert pour convertir des documents épars en fichiers Markdown destinés aux agents IA

Google Cloud a lancé l'Open Knowledge Format (OKF), un nouveau standard destiné à transformer la documentation organisationnelle éparpillée en fichiers Markdown structurés avec frontmatter YAML. L'objectif : rendre la connaissance interne des entreprises portable et directement exploitable par des agents d'intelligence artificielle. La spécification, délibérément minimaliste, propose un cadre commun pour unifier des contenus aujourd'hui dispersés entre wikis, bases de données, outils SaaS et documents PDF. L'enjeu est considérable pour les entreprises qui déploient des agents IA en interne. Actuellement, ces agents peinent à accéder à la connaissance organisationnelle parce qu'elle ne respecte aucun format unifié. OKF résout ce problème structurel en imposant une couche de standardisation légère : chaque document devient un fichier texte lisible à la fois par un humain et par un LLM, avec des métadonnées explicites permettant aux agents de comprendre le contenu, sa portée et sa pertinence sans transformation préalable. La démarche de Google Cloud s'inscrit dans un mouvement intellectuel récent : Andrej Karpathy, chercheur emblématique passé par Tesla et OpenAI, avait popularisé ce concept sous l'appellation "LLM Wiki", plaidant pour des bases de connaissances conçues nativement pour les modèles de langage. En formalisant cette intuition sous forme de standard ouvert, Google Cloud cherche à s'imposer comme référence dans l'écosystème des agents d'entreprise, un marché en forte croissance où la qualité et l'accessibilité de la connaissance structurée sont devenues des avantages concurrentiels décisifs.

UELes entreprises et administrations européennes déployant des agents IA peuvent adopter ce standard ouvert pour structurer leur documentation interne et améliorer l'interopérabilité de leurs systèmes de gestion des connaissances.

💬 Le vrai goulot d'étranglement des agents IA en entreprise, c'est jamais le modèle, c'est la connaissance éparpillée dans 14 outils différents. Karpathy avait nommé le truc il y a un moment, Google vient juste de le mettre en costume corporate avec un nom de standard. Reste à voir combien d'éditeurs SaaS vont jouer le jeu, parce qu'un format ouvert sans adoption, c'est juste un PDF de plus.

OutilsOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic