
Import AI 463 : robots qui s'améliorent seuls, cluster GPU chinois de 10k, et essai élégiaque sur l'ère humaine
Des chercheurs de NVIDIA ont présenté ENPIRE, un système logiciel conçu pour permettre aux robots physiques de s'améliorer de manière autonome, sans intervention humaine continue. Le principe s'inspire directement des boucles d'expérimentation utilisées par les agents IA : des bras robotiques tentent des tâches, échouent, analysent leurs erreurs et affinent leur approche de façon répétée. Le système repose sur quatre modules distincts, un module d'environnement qui réinitialise automatiquement la scène entre chaque essai, un module d'amélioration de politique qui lance le raffinement des stratégies, un module d'exécution qui évalue les performances en temps réel, et un module d'évolution dans lequel des agents de codage analysent les journaux d'erreurs, consultent la littérature scientifique et modifient le code d'entraînement pour corriger les défaillances. Côté matériel, chaque station de test est équipée de deux bras YAM (Yet Another Manipulator) de l'entreprise I2RT en configuration bimanuelle, d'un ensemble de caméras, et d'un poste de travail animé par une NVIDIA RTX 5090. Les modèles testés pour piloter ces agents incluent GPT-5.5 via Codex, Claude Opus 4.7 via Claude Code et Kimi-2.6, les deux premiers se disputant la première place selon les tâches.
Les résultats obtenus sur des tâches de manipulation dextère sont frappants : le système atteint un taux de réussite de 99 % sur des exercices comme le jeu PushT, le rangement de broches dans un boîtier ou la découpe de colliers de serrage avec un cutter. Les chercheurs ont également testé l'insertion de cartes GPU dans une carte mère. L'un des enseignements clés est l'avantage du passage à l'échelle multi-agents : faire travailler en parallèle 8 agents au lieu d'un seul permet non seulement d'arriver plus vite à de bonnes solutions, mais parfois d'atteindre un score absolu plus élevé, grâce à une exploration plus large de l'espace des solutions possibles.
ENPIRE s'inscrit dans une tendance de fond qui vise à réduire la dépendance à l'effort humain dans l'entraînement robotique, deux des obstacles historiques étant précisément l'évaluation manuelle des essais et la remise en état de la scène après chaque échec. En automatisant ces deux étapes, NVIDIA ouvre la voie à des cycles d'apprentissage continus et peu supervisés, ce que les auteurs qualifient de "procédure d'optimisation contrôlable". Des limites subsistent néanmoins : lorsque les agents lisent des journaux, écrivent du code ou attendent une réponse du modèle de langage, les robots restent inactifs, ce qui fait chuter l'utilisation effective de la flotte à mesure que le nombre de machines augmente. La question de la généralisation à des tâches plus complexes, nécessitant des évaluations et des resets que seul un humain peut effectuer, reste entière.
Cette avancée en robotique autonome pourrait à terme influencer les stratégies d'automatisation industrielle en Europe, notamment dans les secteurs manufacturiers, mais l'impact direct sur la France ou l'UE reste indirect à ce stade.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




