Aller au contenu principal
Découvrez OpenViking : une base de données contextuelle open-source qui apporte la mémoire et la récupération basées sur le système de fichiers aux systèmes d'agents intelligents comme OpenClaw
OutilsMarkTechPost12sem· 2 min de lecture

Découvrez OpenViking : une base de données contextuelle open-source qui apporte la mémoire et la récupération basées sur le système de fichiers aux systèmes d'agents intelligents comme OpenClaw

Source originale ↗·

OpenViking, un projet open-source publié par Volcengine (la branche cloud de ByteDance), propose une approche radicalement différente de la gestion du contexte pour les systèmes d'agents IA. Plutôt que de stocker les informations sous forme de fragments textuels plats, OpenViking organise la mémoire des agents selon un paradigme de système de fichiers, accessible via le protocole viking://. Une rupture conceptuelle qui s'attaque directement aux limites des pipelines RAG (Retrieval-Augmented Generation) classiques.

L'enjeu est majeur pour les développeurs d'agents autonomes : plus une tâche dure longtemps, plus le contexte s'accumule, et plus les systèmes traditionnels peinent à retrouver la bonne information au bon moment. OpenViking répond à cinq problèmes récurrents identifiés dans le développement d'agents — contexte fragmenté, volume croissant lors de tâches longues, mauvaise qualité de récupération, faible observabilité et mémoire limitée à l'historique de conversation. En structurant le contexte en répertoires hiérarchiques (resources/, user/, agent/), le système permet à un agent de naviguer avec des opérations de type ls ou find, plutôt que de se fier uniquement à la similarité sémantique.

Le cœur technique repose sur trois mécanismes distincts. Le Directory Recursive Retrieval effectue une première recherche vectorielle pour identifier le répertoire le plus pertinent, puis affine récursivement dans les sous-répertoires — préservant à la fois la pertinence locale et la structure globale. Le Tiered Context Loading décompose automatiquement chaque contenu en trois niveaux : L0 (résumé en une phrase), L1 (vue d'ensemble pour la planification) et L2 (contenu complet), réduisant ainsi le coût en tokens en ne chargeant le détail qu'en cas de nécessité. Enfin, la Visualized Retrieval Trajectory enregistre le chemin de navigation suivi lors de chaque récupération, offrant aux développeurs une visibilité concrète sur les erreurs de routage de contexte — souvent responsables des mauvaises réponses, indépendamment des capacités du modèle sous-jacent.

OpenViking intègre également un système de mémoire de session avec boucle d'auto-itération, permettant à l'agent de consolider et réviser ses souvenirs au fil du temps, au-delà du simple log de conversation. Porté par Volcengine, ce projet positionne ByteDance comme un acteur sérieux dans l'infrastructure des agents IA, un domaine où des solutions comme LangChain, LlamaIndex ou Mem0 dominent actuellement. La nature open-source du projet pourrait accélérer son adoption dans les pipelines d'agents complexes qui souffrent des limites structurelles du RAG conventionnel.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Découvrez la pile de commerce à base d'agents d'AMEX : contrats d'intention et tokens à usage unique pour sécuriser les transactions IA
1VentureBeat AI 

Découvrez la pile de commerce à base d'agents d'AMEX : contrats d'intention et tokens à usage unique pour sécuriser les transactions IA

American Express développe un système permettant à des agents IA d'effectuer des achats et des paiements au nom des utilisateurs, via un kit développeur baptisé ACE (Agentic Commerce Experiences). Présenté par Luke Gebb, vice-président exécutif et responsable mondial de l'innovation chez Amex, ce dispositif repose sur une architecture en boucle fermée : Amex agit simultanément comme émetteur de carte et réseau de paiement, ce qui lui permet de valider les transactions initiées par des agents IA sans dépendre d'un intermédiaire tiers. Le kit offre aux développeurs un accès à plusieurs services intégrés : enregistrement des agents, activation de compte, gestion des intentions, émission de jetons de paiement à usage unique, contexte du panier d'achat. Amex participe par ailleurs au projet Agent Pay Protocol (AP2) de Google, centré sur l'interopérabilité entre plateformes. Ce système s'attaque à l'un des problèmes fondamentaux du commerce dit "agentique" : la confiance. Aujourd'hui, ni les consommateurs, ni les marchands, ni les banques ne veulent s'exposer aux risques qu'un agent autonome pourrait faire peser sur leurs transactions, achats non autorisés, articles impayés, fraudes ou afflux de contestations. En positionnant Amex comme premier émetteur à entrer dans cette conversation, Gebb revendique un angle mort comblé : "C'est vraiment la première fois qu'un émetteur s'assoit à la table." Contrairement à Visa ou Mastercard, qui opèrent des réseaux sans émettre de cartes elles-mêmes, Amex contrôle l'ensemble du circuit, ce qui lui donne une capacité de validation de bout en bout que ses concurrents n'ont pas. Malgré ces ambitions, le système n'est pas sans zones d'ombre. Raj Ananthanpillai, fondateur et PDG de Trua, un fournisseur de systèmes d'identité et de vérification, souligne que des outils comme ACE, la suite Agentic Commerce de Stripe ou la chaîne de preuve d'intention vérifiable de Google "excellent dans la gestion des preuves et des autorisations vérifiables, mais laissent la validation humaine en amont opaque et peu développée." Sans lien cryptographique clair prouvant qu'un agent agit sous l'autorité explicite d'un humain vérifié, les risques de répudiation, de fraude et de transactions par des personnes sous sanctions restent élevés. Amex affirme que ses agents peuvent soumettre un panier et le confronter à l'intention initiale de l'utilisateur, mais n'a pas divulgué le mécanisme exact de cette validation. C'est précisément ce manque de transparence que l'écosystème du commerce agentique devra résoudre pour atteindre une adoption à grande échelle.

UELes standards de commerce agentique en cours de définition aux États-Unis (Amex ACE, Stripe, Google AP2) pourraient devenir des références que les acteurs européens du paiement devront intégrer pour garantir l'interopérabilité, mais sans impact direct immédiat sur la France ou l'UE.

OutilsOutil
1 source
CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils
2MarkTechPost 

CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils

CopilotKit a annoncé son Enterprise Intelligence Platform, une nouvelle couche d'infrastructure managée qui dote les applications agentiques d'une mémoire persistante entre les sessions, les utilisateurs et les appareils. Jusqu'ici, chaque nouvelle session forçait l'agent à repartir de zéro : aucun souvenir des échanges précédents, des workflows en cours ou des décisions déjà prises. Pour contourner ce problème, les équipes de développement devaient construire manuellement leur propre couche de stockage, en choisissant une base de données, en sérialisant l'état applicatif et en gérant les identifiants de session avant même d'écrire la moindre ligne de logique produit. La plateforme résout ce problème en fournissant une infrastructure clé en main, compatible avec n'importe quel framework agentique. Elle peut être auto-hébergée sur Kubernetes, avec une option cloud managée en développement, et répond aux exigences de sécurité enterprise : conformité SOC 2 Type II, intégration SSO, contrôle d'accès par rôles, déploiements hors ligne air-gapped et souveraineté totale des données via une base de données personnalisée. L'élément central de l'architecture est le concept de "Thread" : un objet de session persistant et structuré qui survit aux déconnexions, aux changements d'appareils et aux relances d'agent. Contrairement à un simple historique de messages texte stocké en base, un Thread capture six dimensions de l'interaction : les composants d'interface générés dynamiquement par l'agent, les étapes humaines dans la boucle (approbations, corrections, décisions guidées), l'état partagé entre le backend agentique et le frontend, les entrées et sorties vocales, les fichiers uploadés ou générés, et l'ensemble des interactions multimodales au sein d'un objet unique. Concrètement, un workflow complexe démarré par un collaborateur peut être repris exactement là où il s'était arrêté par un autre membre de l'équipe sur un appareil différent, sans perte d'état ni de contexte. CopilotKit est déjà connu pour son SDK open-source dédié au frontend des agents IA, ainsi que pour l'AG-UI Protocol, un standard ouvert qui connecte les agents aux interfaces utilisateur. Cette plateforme Enterprise ne remplace pas le SDK existant : elle l'enrichit avec la couche d'infrastructure qui lui manquait. L'enjeu est considérable pour l'industrie, car la persistance de l'état est l'un des principaux freins au déploiement en production d'applications agentiques dans les entreprises. Les cas d'usage visés, comme la rédaction collaborative de documents juridiques ou la gestion de pipelines de données en plusieurs étapes, illustrent un marché qui commence à dépasser les chatbots pour entrer dans la logique de workflows longs et critiques. La disponibilité d'une infrastructure standardisée pourrait significativement accélérer cette transition.

UELa plateforme propose des options de souveraineté des données (base de données personnalisée, déploiement air-gapped sur Kubernetes) susceptibles de faciliter la conformité RGPD pour les équipes de développement européennes qui adoptent des architectures agentiques.

OutilsOutil
1 source
Chroma lance Context-1 : un modèle de recherche à base d'agents de 20 milliards de paramètres pour la récupération multi-saut et la gestion du contexte
3MarkTechPost 

Chroma lance Context-1 : un modèle de recherche à base d'agents de 20 milliards de paramètres pour la récupération multi-saut et la gestion du contexte

Chroma, l'entreprise derrière la base de données vectorielle open source du même nom, a lancé Context-1, un modèle de recherche agentique de 20 milliards de paramètres conçu pour résoudre l'un des problèmes les plus tenaces des systèmes RAG (Retrieval-Augmented Generation) modernes. Dérivé de l'architecture Mixture of Experts gpt-oss-20B et affiné par apprentissage supervisé combiné à du renforcement via CISPO, ce modèle ne joue pas le rôle d'un moteur de raisonnement généraliste : il agit comme un sous-agent de recherche ultra-spécialisé. Concrètement, face à une question complexe nécessitant plusieurs étapes de raisonnement, Context-1 décompose la requête en sous-questions ciblées, exécute des appels d'outils en parallèle — 2,56 appels en moyenne par tour — et parcourt itérativement un corpus documentaire via des outils comme searchcorpus (hybride BM25 + recherche dense), grepcorpus et readdocument, avant de transmettre les passages pertinents à un modèle frontier pour la réponse finale. L'innovation la plus significative de Context-1 est ce que Chroma appelle le "Self-Editing Context" : le modèle ne se contente pas de chercher, il gère activement sa propre fenêtre de contexte. Au fil de la recherche, les documents s'accumulent — beaucoup s'avèrent redondants ou hors sujet. Plutôt que de se noyer dans ce bruit, Context-1 a été entraîné avec une précision de pruning de 0,94 : il exécute proactivement une commande prunechunks pour éliminer les passages inutiles en cours de recherche. Ce mécanisme lui permet de maintenir une fenêtre de contexte de 32 000 tokens propre et efficace, là où les modèles généralistes "s'étranglent" sur des chaînes de raisonnement longues. Le découplage entre la logique de recherche — traditionnellement gérée par le développeur — et la génération de réponse représente un changement architectural majeur pour les équipes qui construisent des pipelines RAG en production. Pour entraîner et évaluer ce type de modèle, Chroma a également publié en open source son outil de génération de données synthétiques, context-1-data-gen. Ce pipeline produit des tâches multi-hop dans quatre domaines — recherche web, dépôts SEC (10-K, 20-F), brevets USPTO et corpus d'emails (Enron, fichiers Epstein) — selon un processus structuré en quatre étapes : Explorer, Vérifier, Distraire, Indexer. L'astuce centrale est l'injection de "distracteurs thématiques", des documents apparemment pertinents mais logiquement inutiles, qui forcent le modèle à raisonner plutôt qu'à faire du simple matching de mots-clés. Ce faisant, Chroma s'attaque à un angle mort bien connu des benchmarks statiques, et positionne Context-1 comme compétitif face à GPT-5 sur les tâches de recherche complexes — tout en étant nettement moins coûteux à faire tourner pour des volumes industriels.

OutilsOpinion
1 source
Comment construire un système d'agents IA avec routage dynamique des outils, planification et injection de contexte
4MarkTechPost 

Comment construire un système d'agents IA avec routage dynamique des outils, planification et injection de contexte

Un tutoriel récemment publié détaille la construction complète d'un système d'agent IA de type MCP (Model Context Protocol) en Python, depuis la configuration jusqu'à l'exécution de tâches réelles. Le système repose sur un serveur d'outils modulaire qui expose des capacités structurées : recherche web via DuckDuckGo, récupération de documents locaux par similarité TF-IDF, chargement de jeux de données et exécution de code Python. Le tout s'appuie sur l'API OpenAI avec le modèle gpt-4.1-mini, et mobilise des bibliothèques comme Pydantic pour la validation des schémas, scikit-learn pour la recherche vectorielle, et Rich pour l'affichage console. Les paramètres globaux limitent volontairement l'agent à trois appels d'outils maximum par tâche, cinq résultats web, et trois documents récupérés, afin de maintenir des performances prévisibles. Ce que ce tutoriel apporte de concret, c'est une réponse au problème central des agents IA en production : comment éviter qu'un agent appelle n'importe quel outil dans n'importe quel contexte. Le système implémente un routeur hybride qui combine des heuristiques simples et du raisonnement LLM pour décider dynamiquement quels outils rendre visibles selon la tâche en cours. Un agent qui répond à une question factuelle simple ne voit pas les outils d'exécution de code ; un agent qui analyse des données n'a pas accès à la recherche web si elle est inutile. Cette exposition sélective réduit les coûts d'inférence, améliore la traçabilité des décisions, et limite la surface d'erreur, trois enjeux critiques pour quiconque déploie des agents dans un environnement professionnel. Le Model Context Protocol, popularisé par Anthropic en novembre 2024 comme standard ouvert pour connecter les LLM à des outils externes, cherche à résoudre un problème de fragmentation : chaque développeur réinventait sa propre façon de brancher des modèles à des APIs ou des bases de données. Ce tutoriel illustre comment les principes MCP, notamment l'injection de contexte structuré, les politiques de routage et le contrôle d'accès aux outils, peuvent être implémentés sans framework propriétaire, en Python pur. À mesure que les systèmes multi-agents se multiplient dans les entreprises, cette approche d'exposition minimale et contrôlée des capacités s'impose comme une bonne pratique d'architecture, opposée aux agents monolithiques qui ont accès à tout et dont le comportement devient difficile à auditer ou à reproduire.

💬 Le routage sélectif des outils, c'est exactement ce qui manque à 90% des démos d'agents qu'on voit tourner. Un agent qui n'expose que ce dont il a besoin pour la tâche en cours, c'est pas glamour, mais c'est ce qui fait la différence entre un prototype et quelque chose qu'on peut vraiment auditer en prod. Reste à voir si les gens implémentent ça sérieusement ou si c'est encore du "best practice" qu'on lit le dimanche et qu'on oublie le lundi.

OutilsTuto
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic