Aller au contenu principal
Les modèles d'IA échouent à contrôler les robots sans structures humaines, mais les agents autonomes comblent cet écart
RobotiqueThe Decoder3h

Les modèles d'IA échouent à contrôler les robots sans structures humaines, mais les agents autonomes comblent cet écart

1 source couvre ce sujet·Source originale ↗·

Des chercheurs de Nvidia, de l'UC Berkeley et de Stanford ont publié un nouveau cadre d'évaluation destiné à mesurer systématiquement la capacité des modèles d'IA à contrôler des robots via du code. Leurs résultats sont sans appel : sans abstractions conçues par des humains, c'est-à-dire sans briques logicielles préfabriquées qui simplifient les tâches complexes, même les meilleurs modèles disponibles échouent à piloter efficacement un robot. En revanche, des approches comme le "test-time compute scaling" ciblé, qui consiste à allouer davantage de puissance de calcul au moment de l'inférence plutôt qu'à l'entraînement, permettent de combler significativement cet écart de performance.

Ces conclusions ont des implications directes pour l'industrie de la robotique autonome. Elles remettent en question l'idée que les grands modèles de langage peuvent, seuls et sans infrastructure spécialisée, prendre en charge le contrôle bas niveau de machines physiques. Pour les entreprises qui misent sur des robots autonomes dans la logistique, la fabrication ou les services, cela signifie que la conception humaine reste indispensable, du moins à court terme, et que l'autonomie complète exige encore un travail d'ingénierie non négligeable.

Ce travail s'inscrit dans une course plus large entre les laboratoires de recherche et les industriels pour rendre les robots véritablement programmables par l'IA. Nvidia, déjà très présent dans l'infrastructure d'entraînement des modèles, cherche à étendre son influence vers la couche applicative de la robotique. L'approche par échafaudage agentique, qui enchaîne des modules spécialisés plutôt que de tout déléguer à un seul modèle, semble aujourd'hui la piste la plus prometteuse pour franchir ce verrou technique.

Impact France/UE

Les industriels européens de la robotique (logistique, fabrication, services) doivent intégrer que l'autonomie complète par IA nécessite encore une ingénierie humaine substantielle, ce qui prolonge les délais et coûts de déploiement dans leurs feuilles de route.

À lire aussi

Les robotaxis vont bientôt débarquer en Europe avec l’aide d’Uber, voici où
1Presse-citron 

Les robotaxis vont bientôt débarquer en Europe avec l’aide d’Uber, voici où

L'article fourni est très court (titre + 2 phrases) et ne contient pas les détails nécessaires — ville test, partenaire AV, dates, chiffres — pour écrire un article autonome précis de 150-200 mots. Pour produire ce résumé, j'aurais besoin du corps complet de l'article. Pouvez-vous le coller ici ?

UELe déploiement de robotaxis en Europe via Uber marque une étape concrète vers l'autonomie véhiculaire sur le marché européen, avec des implications réglementaires et de mobilité directes pour les pays concernés.

RobotiqueActu
1 source
Bloqué 1h30 dans un robot taxi sans aucune assistance : Baidu vient de tuer la confiance des usagers en un seul bug
2Frandroid 

Bloqué 1h30 dans un robot taxi sans aucune assistance : Baidu vient de tuer la confiance des usagers en un seul bug

Des centaines de robotaxis Baidu se sont immobilisés simultanément en plein milieu de trajets en cours, en Chine, provoquant des embouteillages importants et plusieurs collisions. Les passagers, bloqués à l'intérieur des véhicules sans possibilité de reprendre la main sur le volant, ont attendu jusqu'à une heure trente sans recevoir aucune assistance humaine. Le bug, dont l'origine technique n'a pas encore été officiellement communiquée par Baidu, a touché le service Apollo Go, le bras autonome du géant technologique chinois. L'incident illustre de manière brutale la principale vulnérabilité des flottes de véhicules autonomes connectés : une défaillance logicielle centralisée peut paralyser des centaines de véhicules en même temps, sans aucun filet de sécurité humain immédiat. Pour les usagers coincés, l'absence totale de support en temps réel a transformé un simple bug en expérience anxiogène. C'est précisément ce type d'événement qui érode la confiance du grand public bien plus efficacement que n'importe quel accident isolé — car il touche à la fois la fiabilité technique et à l'abandon perçu des passagers. Baidu est l'un des leaders mondiaux du robotaxi, avec des milliers de véhicules déployés dans plusieurs grandes villes chinoises comme Wuhan et Chengdu dans le cadre d'un service commercial sans chauffeur de sécurité. La course à l'autonomie totale, partagée avec Waymo aux États-Unis et WeRide en Chine, pousse les opérateurs à retirer rapidement les superviseurs humains pour réduire les coûts — un arbitrage qui montre ici ses limites. Des enquêtes réglementaires et une révision des protocoles d'assistance d'urgence sont désormais attendues.

UECet incident pourrait accélérer les discussions réglementaires européennes sur les protocoles d'assistance obligatoires et les exigences de sécurité pour les flottes de véhicules autonomes commerciales déployées sans superviseur humain à bord.

💬 1h30 bloqué dans une boîte en métal sans pouvoir sortir, sans personne au bout du fil, c'est pas un bug, c'est un scénario de film d'horreur. Le vrai problème n'est pas la panne elle-même, c'est que Baidu a retiré le filet humain avant d'avoir un plan B, parce que ça coûte moins cher. Reste à voir si les régulateurs vont enfin poser des exigences claires, ou si on attend le prochain incident.

RobotiqueOpinion
1 source
L'université de Floride déploie des robots de livraison autonomes
3AI Business 

L'université de Floride déploie des robots de livraison autonomes

Une université de Floride a lancé un service de livraison autonome par robots sur son campus, déployant une flotte de petits engins capables de se déplacer de manière indépendante pour acheminer colis et commandes directement aux étudiants et personnels. Ce type de déploiement représente une étape concrète vers l'automatisation des services du quotidien dans les environnements universitaires. Pour les usagers du campus, cela signifie des livraisons plus rapides, sans interaction humaine, accessibles à toute heure — un avantage particulièrement notable pour la restauration ou les fournitures. Pour les établissements, c'est aussi une réduction potentielle des coûts logistiques et une vitrine technologique attractive pour recruter. Les campus universitaires américains sont devenus un terrain d'expérimentation privilégié pour les robots de livraison autonomes, notamment depuis les déploiements pionniers de Starship Technologies dans plusieurs dizaines d'universités aux États-Unis. Ces environnements semi-fermés, avec des voies piétonnes balisées et une population dense, offrent des conditions idéales pour tester et affiner ces systèmes avant un éventuel déploiement en milieu urbain ouvert. La Floride, avec son climat favorable toute l'année, constitue un cadre particulièrement propice à ce type d'initiative.

RobotiqueActu
1 source
Des travailleurs indépendants forment des robots humanoïdes, et des benchmarks IA plus fiables
4MIT Technology Review 

Des travailleurs indépendants forment des robots humanoïdes, et des benchmarks IA plus fiables

Des travailleurs à la tâche, recrutés dans plus de 50 pays dont le Nigeria, l'Inde et l'Argentine, filment désormais leurs gestes quotidiens pour entraîner les robots humanoïdes de demain. C'est le modèle de Micro1, une entreprise qui collecte ces vidéos — souvent captées via un iPhone fixé sur le front — et les revend aux fabricants de robots. Pendant ce temps, OpenAI a bouclé la plus grande levée de fonds de l'histoire de la Silicon Valley : 122 milliards de dollars, en amont d'une introduction en bourse très attendue pour plus tard cette année. Et selon le MIT Technology Review, les benchmarks actuels d'évaluation de l'IA seraient fondamentalement inadaptés à l'usage réel de ces systèmes. Ces trois signaux convergent vers un même constat : l'IA et la robotique entrent dans une phase d'industrialisation massive, avec des modèles économiques qui soulèvent autant de questions qu'ils n'apportent de réponses. Les travailleurs de Micro1 sont bien payés à l'échelle locale, mais leur travail pose des problèmes sérieux de consentement éclairé et de confidentialité des données — qui est filmé, dans quel contexte, et qui en profite réellement ? Du côté des benchmarks, Angela Aristidou, professeure à l'University College London et chercheuse associée au Stanford Human-Centered AI Institute, plaide pour une évaluation radicalement différente : non plus des performances isolées sur des tâches abstraites, mais une mesure de la capacité de l'IA à fonctionner dans des environnements réels, multi-acteurs, sur la durée. Sans cette réforme, les risques et les capacités réelles de l'IA resteront systématiquement mal évalués. L'essor des humanoïdes n'est pas un phénomène marginal : les lecteurs du MIT Technology Review l'ont récemment élu « 11e percée technologique » à ajouter à la liste 2026 des dix innovations majeures. Ce vote populaire illustre l'appétit du public pour ces machines, au moment même où les entreprises du secteur se disputent les données d'entraînement les plus précieuses — les vidéos de gestes humains dans des contextes domestiques. Quant à OpenAI, sa valorisation stratosphérique s'accompagne d'ambitions sociales affichées : selon Vanity Fair, l'entreprise préparerait un projet visant à « repenser le contrat social ». Dans ce contexte, les appels de militants à quitter ChatGPT, relayés par le MIT Technology Review lui-même, témoignent d'une tension croissante entre l'accélération technologique et ses implications pour la société.

UELa chercheuse Angela Aristidou (University College London / Stanford HAI) plaide pour une réforme des benchmarks IA, un enjeu directement lié à l'évaluation des systèmes soumis à l'AI Act européen.

RobotiqueActu
1 source