Analyse dans une boucle de feedback où les agents s'améliorent d'eux-mêmes
Roland Gavrilescu, cofondateur et PDG d'Introspection, s'est exprimé cette semaine lors de l'AI Engineer World's Fair à l'occasion de sa session intitulée « Autoresearch in the Wild ». Avant de lancer sa startup, Gavrilescu travaillait chez xAI sur l'infrastructure des agents et les agents cloud, où il a rencontré son cofondateur Julian Bright. Les deux hommes ont quitté xAI l'an dernier pour fonder Introspection, une entreprise qui construit l'infrastructure nécessaire au déploiement de systèmes dits « auto-améliorants ». Le concept central qu'ils défendent s'appelle l'autoresearch : il s'agit de construire une boucle externe dans laquelle des agents contribuent eux-mêmes à maintenir et améliorer le système principal, en s'appuyant sur des signaux de retour, des évaluations (evals) et des apports humains pour progresser dans le temps, sans dépendre en permanence d'une validation humaine à chaque étape.
Cette approche marque, selon Gavrilescu, un déplacement progressif de l'attention : d'abord centrée sur les modèles, puis sur les harnais applicatifs (harnesses), elle se concentre désormais sur les boucles de rétroaction elles-mêmes, qui deviennent le produit. L'enjeu pour les entreprises est de concevoir les bons mécanismes de feedback afin que les agents absorbent davantage de tâches sans pour autant générer du contenu de mauvaise qualité, ce que l'industrie appelle familièrement le « slop ». Introspection propose un second concept, celui de recette d'agent (agent recipe), un conteneur regroupant les évaluations, les juges automatisés, le traitement des signaux et l'expertise humaine capturée au fil du temps, inspiré des recettes de données utilisées en post-entraînement des modèles. L'objectif est de créer un format portable et indépendant des fournisseurs, que les agents peuvent eux-mêmes faire évoluer, à la manière d'un laboratoire de recherche autonome.
Pour Gavrilescu, la trajectoire empruntée par des entreprises comme Cursor et Cognition démontre déjà la viabilité de ces systèmes en production. La prochaine étape consiste à les rendre plus accessibles, plus rapides et moins coûteux, en distillant progressivement les capacités des modèles de pointe dans des systèmes détenus et personnalisés par chaque organisation. Cette évolution s'inscrit dans un mouvement plus large de l'ingénierie IA, où les équipes cherchent à automatiser non seulement la production de code ou de contenu, mais aussi l'amélioration continue de leurs propres outils, en s'appuyant sur des boucles qui apprennent d'abord des humains avant de gagner en autonomie. Reste à voir si ces « usines logicielles autonomes » sauront limiter les dérives de qualité tout en réduisant les coûts, un équilibre que plusieurs startups du secteur cherchent désormais à démontrer concrètement.
Ce qui change avec Introspection, c'est que la boucle de feedback devient elle-même le produit, plus le modèle ni le harnais. Sur le papier, l'idée de recette d'agent portable et auto-améliorante a de l'allure, mais Cursor et Cognition restent deux exemples, pas une preuve généralisée. Reste à voir combien d'équipes tiendront ce genre de boucle en prod sans se noyer dans le slop.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




