OutilsThe Decoder · 8 mars 2026, 10:00· 1 min de lecture

Références hallucinées passent le contrôle par les pairs dans les principales conférences sur l'IA et un nouvel outil ouvert souhaite y remédier.

Faux références apparaissent dans les revues par les pairs des principales conférences en IA, et les grands modèles linguistiques commerciaux ne distinguent pas les fausses citations qu'ils produisent. Un nouveau outil open-source nommé CiteAudit se propose de corriger ce problème.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Verge AI

L'IA était partout à la grande conférence des développeurs de jeux — sauf dans les jeux

Lors du GDC Festival of Gaming 2026, l'IA générative était omniprésente côté outils et exposants : Tencent proposait un monde fantasy en pixel-art généré par IA, Razer démontrait un assistant QA automatisé, et Google DeepMind présentait des espaces de jeu générés par IA à guichet fermé. Pourtant, les développeurs de jeux interrogés restaient largement absents de cette tendance dans leurs propres productions. Un paradoxe frappant : l'IA envahit l'industrie du jeu vidéo sans encore s'imposer dans les jeux eux-mêmes.

OutilsOutil

1 source

2The Decoder

AWS juge les agents IA insuffisants en contexte métier et sécurité, et lance deux services pour y remédier

Lors de son sommet à New York, AWS a dévoilé deux nouveaux services destinés à combler les lacunes des agents IA en entreprise. Le premier, baptisé Continuum, détecte automatiquement les vulnérabilités dans le code, les priorise et propose des correctifs sans intervention humaine. Le second, Context, construit un graphe de connaissances à partir des données internes de l'entreprise afin de fournir aux agents IA le contexte métier dont ils ont besoin pour opérer correctement. Ces deux services s'attaquent à un problème central qui freine l'adoption des agents IA dans les environnements professionnels : ces systèmes produisent du code rapidement, mais commettent trop souvent des erreurs, qu'il s'agisse de failles de sécurité ou de décisions inadaptées faute de comprendre le fonctionnement réel de l'organisation. Continuum réduit la surface d'attaque en automatisant la détection de vulnérabilités, tandis que Context évite les hallucinations et les erreurs de jugement en ancrant les agents dans la réalité de l'entreprise, ses processus, ses données, ses contraintes. Cette annonce intervient alors que les grands fournisseurs cloud rivalisent pour s'imposer comme l'infrastructure de référence pour les agents IA d'entreprise. Microsoft Azure, Google Cloud et AWS se disputent un marché en pleine expansion, où la promesse d'automatisation se heurte encore à des problèmes de fiabilité et de sécurité. En proposant des couches de correction et de contextualisation natives, AWS cherche à rassurer les DSI et RSSI qui hésitent encore à déployer ces agents en production sur des systèmes critiques.

UELes DSI et RSSI européens pourront évaluer ces services AWS pour sécuriser et contextualiser leurs déploiements d'agents IA en environnement de production.

💬 AWS dit tout haut ce que les DSI savent depuis un moment : les agents IA produisent du code vite, mais sans contexte métier ni filet de sécurité, ça casse en prod. Context et Continuum s'attaquent enfin aux deux vrais blocages, ce qui change quelque chose pour les équipes qui hésitaient à franchir le pas en environnement critique. C'est le genre de couche infrastructure qui manquait pour que les agents IA deviennent un outil sérieux, pas juste une démo.

OutilsOutil

1 source

3ZDNET FR

Ce nouvel outil Claude Code Review utilise des agents IA pour détecter les bugs dans vos pull requests. Voici comment cela fonctionne

Un nouvel outil appelé Claude Code Review utilise des agents IA pour analyser automatiquement les pull requests et détecter les bugs avant leur fusion. Chaque analyse peut coûter jusqu'à 25 $ par pull request. Malgré ce coût élevé, les entreprises pourraient juger l'investissement rentable pour prévenir des bugs critiques en production.

OutilsOutil

1 source

4VentureBeat AI

Les journaux de requêtes SQL donnent aux agents IA le contexte nécessaire pour éviter les jointures halluccinées

DataHub lance ce jeudi une nouvelle couche baptisée Context Intelligence, conçue pour résoudre l'un des problèmes les plus concrets des agents IA en entreprise : les erreurs de jointure sur des entrepôts de données massifs. Le déclencheur est parlant. Lorsque l'équipe data de Miro a branché ses agents IA directement sur son environnement Snowflake, ceux-ci produisaient de mauvaises réponses dans plus de 65 % des cas. La cause n'était pas le modèle de langage, mais l'absence de contexte : avec plus de 10 000 tables et aucune couche sémantique pour orienter les requêtes, les agents ne pouvaient pas savoir quelles données correspondaient à quelles questions métier. Context Intelligence répond à ce problème en exploitant les journaux de requêtes SQL existants pour construire un index sémantique, exposé ensuite aux agents via MCP, LangChain, le Google Agent Development Kit et CrewAI. La technologie s'appuie sur la même infrastructure d'extraction de logs que DataHub utilise depuis des années pour la traçabilité des données dans ses quelque 3 000 déploiements en production dans le monde. L'enjeu est considérable pour les équipes data des grandes organisations. Aujourd'hui, les agents IA qui génèrent du SQL à la volée n'ont accès qu'aux schémas bruts, sans connaître les jointures qui ont déjà fonctionné, les métriques validées par les équipes métier, ou la logique éprouvée encodée dans des années de requêtes d'analystes. Context Intelligence renverse cette logique : le moteur filtre les journaux de requêtes pour extraire ce que Shirshanka Das, co-fondateur et CTO de DataHub, appelle les "golden queries", c'est-à-dire les requêtes de haute qualité et les pipelines planifiés représentant une logique métier validée. Ces requêtes sont ensuite inversées en définitions textuelles structurées, appelées "semantic anchors", qui constituent la base de récupération dont les agents disposent avant de générer du SQL. Une couche de validation humaine, Context Hub, permet aux experts métier de réviser les définitions proposées, de résoudre les conflits entre équipes qui calculent la même métrique différemment, et de simuler l'impact des changements avant publication. DataHub est une société fondée par l'équipe qui a construit l'outil éponyme en open source chez LinkedIn, où Das a dirigé l'infrastructure data pendant près de onze ans. Le projet open source, mis à disposition du public début 2020 après six ans de développement interne, compte aujourd'hui plus de 15 000 contributeurs. PostgreSQL est la source la plus connectée dans la base mondiale de déploiements DataHub, devant MySQL, Oracle, Snowflake et Google BigQuery, avec plus de 100 sources de métadonnées supportées. Ce capital d'infrastructure est précisément ce qui distingue Context Intelligence d'une solution construite from scratch : les capacités d'extraction et de parsing de requêtes SQL mobilisées ici ont été forgées en production, pas pour ce lancement. "La couche de consommation a changé : ce ne sont plus des humains, ce sont des agents", résume Das. Le cas Miro illustre la suite logique : avec un index sémantique ancré dans l'historique réel des requêtes, les agents ont pu naviguer dans les 10 000 tables Snowflake avec une précision radicalement supérieure.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic