Aller au contenu principal
Les modèles d'IA échouent à contrôler les robots sans structures humaines, mais les agents autonomes comblent cet écart
RobotiqueThe Decoder13sem· 1 min de lecture

Les modèles d'IA échouent à contrôler les robots sans structures humaines, mais les agents autonomes comblent cet écart

Source originale ↗·

Des chercheurs de Nvidia, de l'UC Berkeley et de Stanford ont publié un nouveau cadre d'évaluation destiné à mesurer systématiquement la capacité des modèles d'IA à contrôler des robots via du code. Leurs résultats sont sans appel : sans abstractions conçues par des humains, c'est-à-dire sans briques logicielles préfabriquées qui simplifient les tâches complexes, même les meilleurs modèles disponibles échouent à piloter efficacement un robot. En revanche, des approches comme le "test-time compute scaling" ciblé, qui consiste à allouer davantage de puissance de calcul au moment de l'inférence plutôt qu'à l'entraînement, permettent de combler significativement cet écart de performance.

Ces conclusions ont des implications directes pour l'industrie de la robotique autonome. Elles remettent en question l'idée que les grands modèles de langage peuvent, seuls et sans infrastructure spécialisée, prendre en charge le contrôle bas niveau de machines physiques. Pour les entreprises qui misent sur des robots autonomes dans la logistique, la fabrication ou les services, cela signifie que la conception humaine reste indispensable, du moins à court terme, et que l'autonomie complète exige encore un travail d'ingénierie non négligeable.

Ce travail s'inscrit dans une course plus large entre les laboratoires de recherche et les industriels pour rendre les robots véritablement programmables par l'IA. Nvidia, déjà très présent dans l'infrastructure d'entraînement des modèles, cherche à étendre son influence vers la couche applicative de la robotique. L'approche par échafaudage agentique, qui enchaîne des modules spécialisés plutôt que de tout déléguer à un seul modèle, semble aujourd'hui la piste la plus prometteuse pour franchir ce verrou technique.

Impact France/UE

Les industriels européens de la robotique (logistique, fabrication, services) doivent intégrer que l'autonomie complète par IA nécessite encore une ingénierie humaine substantielle, ce qui prolonge les délais et coûts de déploiement dans leurs feuilles de route.

💬 L'analyse de Mathieu

Sans abstractions humaines, même les meilleurs modèles ratent le contrôle robotique, et ça, c'est pas vraiment une surprise. La vraie info, c'est que l'échafaudage agentique (enchaîner des modules spécialisés plutôt que tout déléguer à un seul modèle) tient mieux ses promesses que le scaling brut à l'entraînement. Reste à voir si ça tient en prod ou si ça reste un beau résultat de labo Stanford.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Des agents IA de codage ont appris à des robots à installer des GPU et couper des serre-câbles
1Ars Technica AI 

Des agents IA de codage ont appris à des robots à installer des GPU et couper des serre-câbles

Des chercheurs du laboratoire NVIDIA GEAR (Generalist Embodied Agent Research), en collaboration avec des équipes de la Carnegie Mellon University à Pittsburgh et de l'Université de Californie à Berkeley, ont développé un cadre logiciel appelé ENPIRE. Ce système permet à des agents IA spécialisés dans l'écriture de code de concevoir et de piloter de manière entièrement autonome des programmes d'entraînement pour des bras robotiques, en leur allouant un budget de tokens étendu. Résultat concret : ces agents ont réussi à apprendre à des robots à couper des serre-câbles et à insérer des cartes graphiques dans des slots de cartes mères, une tâche de précision particulièrement délicate. Jim Fan, directeur de l'IA chez NVIDIA, a résumé l'expérience ainsi dans un post LinkedIn : "Une partie de notre laboratoire NVIDIA GEAR s'améliore désormais sans relâche pendant la nuit. Nous lisons simplement les rapports le matin." L'enjeu central d'ENPIRE est de supprimer le goulet d'étranglement humain dans la boucle d'entraînement robotique. Le cadre dote les agents d'outils, de mémoire, de contexte, de contraintes et de mécanismes de rétroaction, leur permettant de boucler le cycle complet, conception, test, correction, sans supervision. Jusqu'ici, définir ces régimes d'apprentissage exigeait une expertise humaine considérable. Avec ce type d'automatisation, le rythme de développement des robots industriels pourrait s'accélérer radicalement, avec des implications directes pour la fabrication électronique, la logistique et toute industrie nécessitant de la dextérité manuelle répétable. NVIDIA investit depuis plusieurs années dans la robotique humanoïde et l'IA physique, et le laboratoire GEAR représente l'un de ses fronts de recherche les plus actifs. Cette démonstration s'inscrit dans une tendance de fond : les agents IA ne se limitent plus à produire du texte ou du code, mais deviennent des orchestrateurs capables d'agir sur des systèmes physiques dans le monde réel. La collaboration avec CMU et UC Berkeley, deux institutions leaders en robotique, renforce la crédibilité académique de l'approche. La prochaine étape naturelle serait d'étendre ENPIRE à des tâches plus complexes et moins structurées, rapprochant encore davantage la vision d'une usine pilotée en grande partie par des agents autonomes.

UEImpact indirect sur les industries européennes de fabrication électronique et de logistique, qui pourraient bénéficier à terme d'une accélération de l'automatisation robotique, sans implication directe d'acteurs français ou européens.

RobotiqueActu
1 source
Des robots humanoïdes commencent à trier les bagages dans un aéroport de Tokyo face à la pénurie de main-d'œuvre
2Ars Technica AI 

Des robots humanoïdes commencent à trier les bagages dans un aéroport de Tokyo face à la pénurie de main-d'œuvre

Japan Airlines lance en mai 2026 une expérimentation de robots humanoïdes à l'aéroport international de Haneda, à Tokyo. Ces machines seront déployées pour trier les bagages et charger le fret, avec l'ambition d'élargir progressivement leurs missions au nettoyage des cabines d'avion et à la manipulation d'équipements au sol comme les chariots à bagages. Les essais sont prévus jusqu'en 2028, ce qui signifie que les passagers en transit à Haneda pourront vraisemblablement croiser ces robots en action sur le tarmac ou dans les zones de traitement des bagages au cours des deux prochaines années. Cette initiative répond à une pression concrète sur le marché du travail japonais : la fréquentation des aéroports a fortement progressé ces dernières années, creusant un écart entre les besoins en personnel et les candidats disponibles. Pour Japan Airlines, automatiser des tâches physiques répétitives et pénibles comme la manutention des bagages permettrait de compenser ce déficit sans dépendre de recrutements difficiles à réaliser. Si les essais s'avèrent concluants, ce modèle pourrait s'étendre à d'autres compagnies ou aéroports confrontés aux mêmes contraintes démographiques, notamment dans un Japon où le vieillissement de la population aggrave les tensions sur l'emploi manuel. Les robots humanoïdes franchissent ainsi une nouvelle étape après leurs premiers déploiements dans les usines automobiles et les entrepôts logistiques, environnements relativement contrôlés où les tâches sont prévisibles. Un aéroport représente un défi autrement plus complexe : espaces ouverts, flux irréguliers, interactions avec des humains, objets de formes variées. La grande majorité des automatisations industrielles reposent encore sur des bras robotisés spécialisés, conçus pour répéter indéfiniment un geste identique. Les robots humanoïdes, eux, doivent s'adapter en temps réel à des situations changeantes, ce qui met à l'épreuve les dernières générations de logiciels de perception et de contrôle moteur. L'expérience de Haneda servira de test grandeur nature pour mesurer si la technologie actuelle est réellement à la hauteur de ces environnements imprévisibles.

UELes aéroports européens confrontés à des tensions similaires sur le marché du travail pourraient s'appuyer sur les résultats de cette expérimentation pour évaluer la maturité des robots humanoïdes dans leurs propres opérations de piste et de bagagerie.

RobotiqueOpinion
1 source
Les modèles du monde au service d'interventions endovasculaires robotisées autonomes et sûres
3arXiv cs.RO 

Les modèles du monde au service d'interventions endovasculaires robotisées autonomes et sûres

Des chercheurs ont développé un système d'intelligence artificielle capable de naviguer de manière autonome dans les vaisseaux sanguins pour traiter des accidents vasculaires cérébraux, sans intervention humaine directe. Publiés sur arXiv, leurs travaux portent sur la thrombectomie mécanique, une procédure d'urgence qui consiste à retirer un caillot obstruant une artère cérébrale. L'agent IA repose sur TD-MPC2, un algorithme d'apprentissage par renforcement basé sur un modèle du monde, capable de planifier ses actions en anticipant les conséquences de ses mouvements. Testé sur des anatomies vasculaires propres à chaque patient, il affiche un taux de succès de 58 % en simulation, contre 36 % pour le meilleur algorithme concurrent (SAC, Soft Actor-Critic), une différence statistiquement significative (p < 0,001). En laboratoire, sur des répliques physiques de vaisseaux réels guidées par fluoroscopie, TD-MPC2 atteint 68 % de succès contre 60 % pour SAC, avec une trajectoire plus optimale, bien qu'au prix de procédures légèrement plus longues. La force exercée par l'outil sur les parois vasculaires reste en moyenne à 0,15 newton, très en dessous du seuil de rupture estimé à 1,5 newton. Ces résultats constituent une première mondiale : c'est la première fois qu'un système d'IA autonome pour la thrombectomie est validé à la fois en simulation sur des données patient inédites et sur des fantômes vasculaires physiques sous guidage fluoroscopique. L'enjeu est considérable car la thrombectomie mécanique est une course contre la montre : chaque minute perdue aggrave les séquelles neurologiques. Un système autonome fiable pourrait réduire la dépendance aux neuroradiologues interventionnels, dont la disponibilité 24h/24 est limitée, notamment dans les hôpitaux de taille moyenne. La thrombectomie robotisée fait l'objet d'une compétition intense depuis plusieurs années, portée par des acteurs comme Siemens Healthineers, Corindus (filiale de Siemens) ou des startups comme Endowave. L'approche par modèles du monde est plus récente dans ce domaine : elle permet à l'agent de simuler mentalement les conséquences de ses actions avant d'agir, ce qui améliore la robustesse face à la diversité anatomique des patients. Les prochaines étapes passeront probablement par des essais précliniques sur animal avant toute perspective d'application clinique humaine.

UELa technologie pourrait à terme réduire les inégalités d'accès aux soins dans les hôpitaux européens de taille moyenne manquant de neuroradiologues interventionnels disponibles 24h/24.

RobotiquePaper
1 source
GENESIS AI veut apprendre aux robots les gestes humains à grande échelle
4FrenchWeb 

GENESIS AI veut apprendre aux robots les gestes humains à grande échelle

Genesis AI, startup cofondée entre Paris et la Californie, ambitionne de reproduire dans le domaine physique la révolution qu'a opérée l'intelligence artificielle générative dans le logiciel. La société développe une approche destinée à enseigner aux robots des gestes humains complexes à grande échelle, en s'inspirant directement de la logique des grands modèles de langage : collecter des volumes massifs de données pour permettre une généralisation large des capacités motrices. L'objectif est de doter les systèmes robotiques d'une flexibilité comparable à celle que les LLMs ont apportée aux tâches cognitives. L'enjeu est considérable pour l'ensemble de la filière robotique industrielle et grand public. Aujourd'hui, programmer un robot pour qu'il reproduise fidèlement un geste humain reste une tâche laborieuse, spécifique à chaque contexte, et difficile à transférer d'une situation à une autre. Si Genesis AI parvient à construire un modèle généraliste du mouvement physique, cela pourrait accélérer massivement le déploiement de robots dans des environnements non structurés : entrepôts, soins à domicile, industrie manufacturière. La robotique connaît depuis 2023 une véritable effervescence autour des "foundation models" appliqués au mouvement, avec des acteurs comme Physical Intelligence (Pi), Figure AI ou Apptronik qui investissent massivement dans cette direction aux États-Unis. Genesis AI se distingue par son ancrage européen, notamment parisien, dans un secteur dominé par les capitaux américains et asiatiques. La capacité à générer et annoter des données de mouvement à grande échelle reste le verrou technologique central que la startup entend faire sauter.

UEGenesis AI, co-fondée à Paris, représente une initiative européenne dans la robotique fondationnelle, un secteur jusqu'ici dominé par les capitaux américains et asiatiques.

RobotiqueOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic