Édito du lundi 8 juin 2026

Des chercheurs de l'Université de l'Illinois, d'UC Berkeley et de la startup Chroma ont publié Harness-1, un agent de recherche documentaire de 20 milliards de paramètres entraîné par apprentissage par renforcement sur le modèle gpt-oss-20b. Sa particularité : une mémoire d'état persistante entre les requêtes, l'agent accumule du contexte au fil de la session au lieu de repartir de zéro à chaque tour. Un changement d'architecture qui rapproche enfin les agents de recherche d'un vrai comportement d'investigation.

NVIDIA a publié un tutoriel complet sur garak, son framework open source dédié au red-teaming défensif des LLM. L'outil propose une architecture modulaire, sondes d'attaque, détecteurs, générateurs, rapports, pour évaluer systématiquement la robustesse d'un modèle face aux tentatives de manipulation. À l'heure où les entreprises déploient des modèles en production à la chaîne, garak devient une référence difficile à ignorer.

VentureBeat met le doigt sur une tension croissante : les agents IA ont résolu l'écriture du code, mais ce faisant, ils ont exposé tous les autres goulots d'étranglement du génie logiciel. Revue de code, dette technique, tests, architecture, tout ce qui encadre le code reste humain et lent. C'est le fil conducteur de cette matinée : l'IA progresse vite sur les tâches d'exécution, et c'est désormais l'organisation humaine qui doit rattraper son retard.