Aller au contenu principal
Les journaux de requêtes SQL donnent aux agents IA le contexte nécessaire pour éviter les jointures halluccinées
OutilsVentureBeat AI1j

Les journaux de requêtes SQL donnent aux agents IA le contexte nécessaire pour éviter les jointures halluccinées

Résumé IASource uniqueImpact UE
Source originale ↗·

DataHub lance ce jeudi une nouvelle couche baptisée Context Intelligence, conçue pour résoudre l'un des problèmes les plus concrets des agents IA en entreprise : les erreurs de jointure sur des entrepôts de données massifs. Le déclencheur est parlant. Lorsque l'équipe data de Miro a branché ses agents IA directement sur son environnement Snowflake, ceux-ci produisaient de mauvaises réponses dans plus de 65 % des cas. La cause n'était pas le modèle de langage, mais l'absence de contexte : avec plus de 10 000 tables et aucune couche sémantique pour orienter les requêtes, les agents ne pouvaient pas savoir quelles données correspondaient à quelles questions métier. Context Intelligence répond à ce problème en exploitant les journaux de requêtes SQL existants pour construire un index sémantique, exposé ensuite aux agents via MCP, LangChain, le Google Agent Development Kit et CrewAI. La technologie s'appuie sur la même infrastructure d'extraction de logs que DataHub utilise depuis des années pour la traçabilité des données dans ses quelque 3 000 déploiements en production dans le monde.

L'enjeu est considérable pour les équipes data des grandes organisations. Aujourd'hui, les agents IA qui génèrent du SQL à la volée n'ont accès qu'aux schémas bruts, sans connaître les jointures qui ont déjà fonctionné, les métriques validées par les équipes métier, ou la logique éprouvée encodée dans des années de requêtes d'analystes. Context Intelligence renverse cette logique : le moteur filtre les journaux de requêtes pour extraire ce que Shirshanka Das, co-fondateur et CTO de DataHub, appelle les "golden queries", c'est-à-dire les requêtes de haute qualité et les pipelines planifiés représentant une logique métier validée. Ces requêtes sont ensuite inversées en définitions textuelles structurées, appelées "semantic anchors", qui constituent la base de récupération dont les agents disposent avant de générer du SQL. Une couche de validation humaine, Context Hub, permet aux experts métier de réviser les définitions proposées, de résoudre les conflits entre équipes qui calculent la même métrique différemment, et de simuler l'impact des changements avant publication.

DataHub est une société fondée par l'équipe qui a construit l'outil éponyme en open source chez LinkedIn, où Das a dirigé l'infrastructure data pendant près de onze ans. Le projet open source, mis à disposition du public début 2020 après six ans de développement interne, compte aujourd'hui plus de 15 000 contributeurs. PostgreSQL est la source la plus connectée dans la base mondiale de déploiements DataHub, devant MySQL, Oracle, Snowflake et Google BigQuery, avec plus de 100 sources de métadonnées supportées. Ce capital d'infrastructure est précisément ce qui distingue Context Intelligence d'une solution construite from scratch : les capacités d'extraction et de parsing de requêtes SQL mobilisées ici ont été forgées en production, pas pour ce lancement. "La couche de consommation a changé : ce ne sont plus des humains, ce sont des agents", résume Das. Le cas Miro illustre la suite logique : avec un index sémantique ancré dans l'historique réel des requêtes, les agents ont pu naviguer dans les 10 000 tables Snowflake avec une précision radicalement supérieure.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AWS ML Blog 

Des heures aux minutes : comment les agents IA ont redonné du temps aux marketeurs pour l'essentiel

L'équipe Technology, AI, and Analytics (TAA) d'AWS Marketing a développé, en partenariat avec la startup Gradial, une solution d'IA agentique capable de réduire le temps de publication d'une page web de quatre heures à environ dix minutes, soit une diminution de plus de 95 %. Déployée sur Amazon Bedrock, cette solution s'appuie sur les modèles Anthropic Claude et Amazon Nova pour orchestrer l'ensemble du workflow de création de contenu : interprétation des briefs en langage naturel, assemblage des composants de page, validation des standards d'accessibilité et de conformité, jusqu'au lancement effectif sur les canaux digitaux. Le système intègre un serveur Model Context Protocol (MCP) pour la validation en temps réel et se connecte directement aux systèmes de gestion de contenu (CMS) d'entreprise. Cette accélération libère les équipes marketing, Digital Marketing Managers et Product Marketing Managers chez AWS, des tâches de coordination et d'assemblage répétitives qui monopolisaient leur temps. Auparavant, la publication d'une seule page nécessitait un appel de lancement, une file d'attente de priorisation, plusieurs allers-retours entre équipes, puis des cycles de révision successifs pour valider les textes, les visuels, les liens et la conformité technique. Un seul problème d'accessibilité sur une image suffisait à relancer un nouveau cycle complet. En automatisant cette orchestration, les équipes peuvent désormais se concentrer sur les tâches à plus forte valeur ajoutée : identifier les problèmes clients, affiner les messages et concevoir des campagnes plus efficaces. Ce projet s'inscrit dans une tendance de fond où les grandes entreprises tech cherchent à industrialiser leurs workflows marketing grâce à l'IA agentique. AWS, qui opère l'une des infrastructures digitales les plus complexes au monde, fait face à des exigences particulièrement élevées en matière de cohérence de marque, d'accessibilité et de conformité réglementaire à grande échelle. Le recours à Gradial, une startup spécialisée dans la modernisation des organisations marketing, illustre la montée en puissance des solutions verticales construites sur des plateformes d'IA fondationnelles comme Bedrock. L'enjeu dépasse AWS : toute organisation publiant du contenu web en volume est confrontée aux mêmes goulots d'étranglement. La généralisation de ce type d'agent autonome capable de piloter des CMS d'entreprise pourrait profondément transformer les métiers du marketing digital, en faisant de la coordination humaine l'exception plutôt que la règle.

OutilsOutil
1 source
Les agents IA ratent toutes les discussions de votre équipe. SageOX propose une infrastructure de contexte pour agents autonomes
2VentureBeat AI 

Les agents IA ratent toutes les discussions de votre équipe. SageOX propose une infrastructure de contexte pour agents autonomes

SageOX, une startup de Seattle fondée par des vétérans ayant construit l'infrastructure originale d'AWS EC2 et EBS, est sortie du mode furtif en annonçant un tour de financement de 15 millions de dollars mené par Canaan, avec la participation d'A.Capital, Pioneer Square Labs et Founders' Co-op. L'entreprise, dirigée par Ajit Banerjee, ancien ingénieur chez Hugging Face, Meta, Amazon et Apple, commercialise ce qu'elle appelle une "infrastructure de contexte agentique" : un système conçu pour garder les agents IA aussi informés que les employés humains sur les décisions, discussions et objectifs d'une équipe. La suite produit repose sur deux composants principaux : l'Ox Dot, un petit appareil physique placé dans les espaces partagés qui enregistre réunions et séances de travail d'une simple pression, et l'Ox CLI, un outil en ligne de commande open source sous licence MIT qui permet aux assistants de codage comme Claude Code ou Codex d'interroger la mémoire collective de l'équipe avant d'écrire du code. Le problème que SageOX cherche à résoudre est celui du "drift" des agents, c'est-à-dire leur tendance à s'écarter des intentions réelles de l'équipe parce qu'ils démarrent chaque tâche sans historique ni contexte. Si une équipe décide en réunion d'utiliser un schéma d'authentification précis, l'agent de codage l'ignorera complètement, sauf si quelqu'un le lui précise explicitement dans chaque prompt. L'Ox Dot capture audio, transcrit et identifie les intervenants, puis distille ces échanges en une mémoire d'équipe accessible aux humains et aux agents. Sa fonctionnalité "Auto Rewind" permet même de capturer rétrospectivement une conversation informelle qui s'est tenue sans enregistrement, évitant la perte de décisions prises lors d'échanges spontanés. La commande ox agent prime intègre ensuite cet historique directement dans le contexte de travail des agents. Le problème de l'"ingénierie du contexte" est l'un des défis majeurs non résolus de l'ère agentique. À mesure que les grands fournisseurs de modèles comme OpenAI, Anthropic ou Google descendent dans la chaîne de valeur en proposant leurs propres agents métier, la question de comment équiper ces agents d'un contexte riche et fidèle à la réalité d'une organisation reste entière. SageOX parie que la réponse n'est pas dans le prompt engineering ou la documentation statique, mais dans une couche d'infrastructure dédiée qui capte le contexte là où il se forme naturellement : conversations, tableaux blancs, standups. Ryan Snodgrass, CTO et ancien d'Amazon, pousse même plus loin en remettant en question les principes classiques de gestion de code source, estimant que les historiques "propres" de commits sont souvent contre-productifs pour les agents. La startup s'attaque ainsi à un marché encore peu balisé, à l'intersection de la collaboration d'équipe et de l'orchestration agentique.

OutilsOutil
1 source
3InfoQ AI 

LinkedIn présente son agent de mémoire cognitive pour les agents IA

LinkedIn a dévoilé le Cognitive Memory Agent (CMA), une couche d'infrastructure d'IA générative destinée à rendre les systèmes d'intelligence artificielle persistants et conscients du contexte dans lequel ils opèrent. Ce framework fournit une mémoire durable organisée en trois couches distinctes : épisodique, qui retient les interactions passées ; sémantique, qui stocke les connaissances générales ; et procédurale, qui encode les comportements appris. Le CMA prend également en charge la coordination entre plusieurs agents, la récupération d'informations et la gestion complète du cycle de vie des mémoires. Cette initiative s'attaque à une limitation fondamentale des grands modèles de langage : leur absence d'état entre les sessions. Sans mémoire externe, chaque interaction repart de zéro, rendant impossible toute personnalisation durable. En déployant le CMA dans ses propres applications, LinkedIn ouvre la voie à des assistants IA capables de se souvenir des préférences professionnelles d'un utilisateur, de ses recherches d'emploi passées ou de ses habitudes de networking, transformant ainsi l'expérience sur une plateforme de plus d'un milliard d'utilisateurs. La mémoire des agents est devenue l'un des chantiers prioritaires de l'industrie, alors que les entreprises cherchent à faire passer leurs systèmes d'IA du mode réactif au mode autonome et continu. OpenAI, Google DeepMind et Anthropic développent des architectures comparables, mais LinkedIn dispose d'un avantage singulier : une base de données professionnelles sans équivalent. Le CMA positionne l'entreprise pour intégrer ces capacités directement dans ses outils de recrutement, de formation et de recommandation, avec des implications profondes sur la façon dont les professionnels interagiront avec l'IA au quotidien.

UELes millions de professionnels français inscrits sur LinkedIn pourraient voir leurs interactions avec les outils de recrutement et de formation de la plateforme profondément transformées par cette couche de mémoire persistante.

OutilsOpinion
1 source
Les meilleures API de recherche et récupération de données pour construire des agents IA en 2026 : outils, compromis et offres gratuites
4MarkTechPost 

Les meilleures API de recherche et récupération de données pour construire des agents IA en 2026 : outils, compromis et offres gratuites

La recherche web et la récupération de contenu sont devenues en 2026 des infrastructures critiques pour tout développeur construisant des agents IA. Un panorama des principales API Search et Fetch disponibles ce printemps révèle deux acteurs à retenir : TinyFish et Tavily. TinyFish propose des points d'accès dédiés aux agents, disponibles gratuitement avec des limites généreuses : 5 requêtes par minute pour la recherche (api.search.tinyfish.ai) et 25 requêtes par minute pour la récupération de pages (api.fetch.tinyfish.ai), sans carte bancaire requise. Sa latence médiane pour la recherche est inférieure à 0,5 seconde, ce qui le rend compatible avec les boucles d'outils en temps réel. La plateforme déploie sa propre flotte Chromium pour effectuer un rendu complet de chaque URL, y compris les applications JavaScript dynamiques et les pages protégées contre les robots, retournant ensuite du contenu propre en Markdown, JSON ou HTML. Tavily, de son côté, propose un plan gratuit incluant 1 000 crédits API par mois, avec des offres payantes à partir de 30 dollars par mois (4 000 crédits) jusqu'à 220 dollars par mois (38 000 crédits), ainsi qu'une option à la demande à 0,008 dollar par crédit. Ce qui distingue ces outils de la génération précédente tient à leur conception orientée agents : là où les solutions classiques injectaient du HTML brut, avec scripts, publicités et bannières de cookies, dans les fenêtres de contexte des LLM, TinyFish filtre tout ce bruit en amont. Le résultat est une consommation de tokens par page nettement inférieure, et donc un coût par appel LLM réduit. Pour les entreprises utilisant des agents à grande échelle, cet écart n'est pas marginal. TinyFish s'intègre directement dans les environnements que les développeurs utilisent déjà : Claude Code, Cursor, Codex, LangChain, CrewAI, n8n, Dify et Vercel Skills. Une configuration MCP s'installe en un seul fichier JSON ; une CLI (npm install -g @tiny-fish/cli) écrit les résultats directement sur le système de fichiers sans passer par la fenêtre de contexte du modèle, limitant ainsi l'utilisation des tokens. Tavily, quant à lui, est reconnu pour ses intégrations profondes avec LangChain et LlamaIndex, les frameworks les plus répandus dans l'écosystème RAG. Ces évolutions s'inscrivent dans un mouvement plus large : la maturation rapide de l'outillage autour des agents IA en production. En 2024, la pratique dominante consistait à envelopper les données brutes des SERP Google et à les passer directement à un modèle de langage. En 2026, cette approche est dépassée, remplacée par des API conçues dès le départ pour les contraintes spécifiques des agents : latence, efficacité des tokens, stabilité du rendu et compatibilité avec les frameworks d'orchestration. TinyFish et Tavily illustrent une tendance dans laquelle l'infrastructure de récupération d'information devient aussi déterminante que le choix du modèle LLM lui-même. Les prochaines lignes de différenciation porteront probablement sur la fraîcheur des index, la gestion des contenus derrière authentification et l'intégration native avec les standards d'agents émergents comme le protocole MCP.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour