Aller au contenu principal
RobotiqueMarkTechPost45min· 2 min de lecture

NVIDIA AI présente ASPIRE, un framework robotique auto-améliorant qui atteint 31% en zero-shot sur les tâches longues de LIBERO-Pro

Source originale ↗·

Un consortium de chercheurs de NVIDIA, de l'université du Michigan, de l'UIUC, de UC Berkeley et de Carnegie Mellon a présenté ASPIRE (Agentic Skill Programming through Iterative Robot Exploration), un système d'apprentissage continu destiné à la robotique par code. Contrairement aux agents de codage robotique classiques, qui ne reçoivent qu'un retour grossier indiquant simplement l'échec ou la réussite d'une tâche, ASPIRE s'appuie sur un moteur d'exécution en boucle fermée capturant des traces multimodales détaillées pour chaque appel de perception, de planification et de contrôle: images RGB, superpositions visuelles, candidats de préhension, poses d'objets et résultats de planification de mouvement. Dans les tests en simulation, l'agent de codage utilisé est Claude Code avec Claude Opus 4.6 et une fenêtre de contexte d'un million de tokens, les programmes étant écrits dans CaP-X, un cadre open source basé sur MuJoCo Playground. L'agent n'a accès à aucune donnée privilégiée du simulateur: toute lecture directe de fichiers physiques ou d'assets comme les fichiers .bddl, .xml ou .urdf est interdite, seule l'information qu'un robot réel équipé d'une caméra pourrait obtenir étant autorisée. Sur le benchmark LIBERO-Pro pour les tâches longues, le système atteint 31% de réussite en zero-shot.

L'apport principal d'ASPIRE tient à sa capacité à transformer chaque échec en connaissance réutilisable plutôt qu'en information perdue. Une architecture coordinateur-acteurs orchestre plusieurs agents de codage qui n'échangent jamais l'historique complet de leurs conversations ni leurs trajectoires brutes, mais uniquement des compétences distillées et validées, stockées dans une bibliothèque centrale. Ces compétences prennent la forme de règles compactes comprenant une signature d'échec, une condition d'application et une stratégie de réparation, parfois accompagnée d'un exemple de code. Le coordinateur ne les admet qu'après validation par débogage et vérification de conformité à l'API. Concrètement, cela signifie qu'un robot confronté à sa centième tâche bénéficie de l'expérience accumulée sur les quatre-vingt-dix-neuf précédentes, contrairement aux systèmes actuels où chaque tâche repart de zéro. Pour l'industrie robotique, cela ouvre la voie à des flottes de robots capables de s'améliorer progressivement en production, réduisant le besoin de reprogrammation manuelle coûteuse à chaque nouvel échec rencontré sur le terrain.

Le défi de fond que résout ASPIRE est celui de la fragilité des systèmes de code-as-policy, où les modèles de langage composent des programmes robotiques exécutables à partir de perception multimodale, de dynamiques de contact physique et de configurations variées, un processus jusqu'ici difficile à faire passer à l'échelle. L'équipe illustre le mécanisme par un exemple concret tiré du benchmark BEHAVIOR-1K: un robot chargé de saisir une radio près d'une table échoue de manière répétée car la position cible se situe à environ vingt centimètres du bord de la table, à l'intérieur de la zone tampon d'évitement de collision, provoquant une erreur de planification du planificateur de mouvement cuRobo. En analysant la trace d'exécution, l'agent identifie que la cause est l'inaccessibité de la cible et non un problème de perception ou de préhension, puis génère une réparation en échantillonnant plusieurs poses de retrait autour de l'objet. Pour éviter que le système ne s'enferme dans des boucles de correction locales sur une même stratégie défaillante, ASPIRE intègre aussi une recherche évolutive proposant plusieurs programmes candidats à chaque itération, conditionnés sur les meilleures versions précédentes et leurs traces d'échec restantes, ce qui favorise l'exploration de stratégies véritablement distinctes plutôt que le simple raffinement d'une solution unique.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Un robot humanoïde prend en charge la collecte de données et les tâches administratives sur un chantier britannique
1Interesting Engineering 

Un robot humanoïde prend en charge la collecte de données et les tâches administratives sur un chantier britannique

La société de construction britannique Tilbury Douglas est devenue la première grande entreprise du secteur au Royaume-Uni à déployer un robot humanoïde sur un chantier réel. Baptisé Douglas, le robot de 30 kg est fabriqué par Unitree, l'un des leaders mondiaux du marché des robots humanoïdes. Il a déjà prouvé son utilité lors d'un essai de dix semaines sur site actif. Sa mission n'est pas de poser des briques ni de couler du béton, mais de prendre en charge les tâches administratives et de collecte de données qui mobilisent quotidiennement les équipes. Équipé de capteurs LiDAR et de caméras 360 degrés, Douglas parcourt le chantier de façon autonome, photographie les avancées de la construction depuis des coordonnées identiques chaque jour, effectue des scans laser pour générer des nuages de points en trois dimensions, et alimente directement les flux de travail liés à la sécurité. Résultat : environ 40 heures de travail administratif économisées chaque mois, soit une semaine complète rendue aux équipes terrain. Cet apport concret change la donne pour les chefs de chantier, qui passaient jusqu'ici une partie de leur journée à arpenter les structures en acier et les pièces inachevées pour documenter l'avancement des travaux. En confiant cette routine à la machine, Tilbury Douglas libère ses professionnels pour des tâches à plus forte valeur ajoutée : coordination technique, résolution de problèmes complexes, management des équipes. La précision du robot dépasse également celle d'un humain sur certains points : en capturant les données depuis exactement les mêmes positions chaque jour, il permet aux logiciels d'IA de détecter automatiquement les déviations et les défauts de construction que l'oeil humain pourrait rater. À 15 000 livres sterling, son coût reste relativement accessible pour une entreprise du secteur. Le timing de ce déploiement n'est pas anodin. Le secteur de la construction britannique traverse une pénurie de compétences structurelle, peinnant à recruter la prochaine génération d'ingénieurs et de chefs de projet. C'est dans ce contexte que Tilbury Douglas, via son directeur technique Mark Buckle, présente Douglas non pas comme un substitut aux travailleurs, mais comme un outil pour les renforcer en automatisant les tâches répétitives. Pour l'heure, le robot est maintenu à distance des bords de chantier pour éviter les chutes, et sera prochainement équipé de marquages haute visibilité et d'une balise d'avertissement pour évoluer en sécurité à proximité d'engins lourds dès les phases de fondation. Cette expérience illustre une tendance de fond : l'IA et la robotique bouleversent les métiers manuels tout autant que les fonctions de bureau, redessinant en profondeur l'organisation du travail dans les industries physiques.

UELe secteur du BTP européen, confronté aux mêmes pénuries structurelles de main-d'œuvre qualifiée qu'au Royaume-Uni, pourrait rapidement s'inspirer de ce déploiement, les robots Unitree étant déjà commercialisés en Europe.

RobotiqueActu
1 source
NVIDIA Research fait progresser la robotique de la simulation au monde réel
2NVIDIA AI Blog 

NVIDIA Research fait progresser la robotique de la simulation au monde réel

À l'occasion de l'International Conference on Robotics and Automation (ICRA) 2026, NVIDIA Research a présenté huit articles scientifiques parmi les 28 acceptés, tous centrés sur le transfert simulation-vers-réel en robotique. Les travaux couvrent l'ensemble de la chaîne de développement : coordination de bras multiples, navigation sur des morphologies de robots variées, préhension d'objets inconnus et manipulation de matières déformables. Parmi les systèmes présentés, ScheduleStream exploite les GPU pour planifier les mouvements de plusieurs bras robotiques en parallèle, atteignant une accélération de 3x par rapport aux approches séquentielles classiques, et tourne notamment sur la plateforme embarquée Jetson de NVIDIA. COMPASS, un cadre de politique de navigation, combine apprentissage par imitation et apprentissage par renforcement résiduel dans le simulateur Isaac Lab pour généraliser à des robots de morphologies très différentes, sans jamais utiliser de données réelles lors de l'entraînement. Résultat : un taux de succès moyen 4,5 fois supérieur à la référence, et environ 80 % de réussite sur 20 essais réels avec des robots mobiles autonomes et des humanoïdes. Grasp-MPC, de son côté, a été entraîné sur 2 millions de trajectoires simulées issues de 8 000 objets différents, apprenant à saisir des objets inédits dans des environnements encombrés avec un taux de succès de 75 %, contre 41 % pour la méthode de référence. L'importance de ces résultats tient à ce qu'ils résolvent des verrous concrets qui bloquaient l'industrialisation de la robotique. Former un robot à naviguer dans un environnement et devoir tout recommencer dès qu'on change de plateforme physique est un frein majeur au déploiement à grande échelle. COMPASS supprime ce problème en apprenant des compétences transférables entre corps mécaniques différents, ouvrant la voie à des flottes hétérogènes d'agents robotiques dans des entrepôts, des hôpitaux ou des usines. Grasp-MPC, lui, corrige en temps réel la trajectoire d'approche du robot dans les derniers centimètres, là où les systèmes à plan fixe échouent le plus souvent. Ces avancées signifient qu'il devient possible de déployer des robots capables de traiter des tâches non scriptées dans des environnements désordonnés et imprévisibles, sans recalibration permanente. Ces recherches s'inscrivent dans une mutation profonde du secteur : la robotique sort de l'ère des démos contrôlées pour entrer dans celle de l'autonomie généralisable. NVIDIA joue un rôle structurant dans cette transition en fournissant à la fois les outils de simulation (Isaac Lab, Omniverse NuRec pour les jumeaux numériques), les bibliothèques de calcul (cuRobo, GraspGen) et le matériel embarqué (Jetson). Le fait que COMPASS et Grasp-MPC atteignent des performances robustes sans aucune donnée réelle lors de l'entraînement est une preuve de maturité du sim-to-real. La prochaine étape sera l'intégration de modèles vision-langage-action capables de raisonner avant d'agir, plusieurs des papiers ICRA ouvrant déjà cette direction.

UELes industriels et laboratoires de robotique européens (automobile, logistique, santé) pourront exploiter ces avancées sim-to-real pour déployer des flottes robotiques hétérogènes sans recalibration permanente entre plateformes.

RobotiqueActu
1 source
Ce que les discussions entre LG et NVIDIA révèlent sur l'avenir de l'IA physique
3AI News 

Ce que les discussions entre LG et NVIDIA révèlent sur l'avenir de l'IA physique

LG et NVIDIA sont actuellement en discussions exploratoires portant sur l'IA physique, les centres de données et la mobilité. Une rencontre à Séoul entre Ryu Jae-cheol, PDG de LG, et Madison Huang, directeur senior marketing produit pour Omniverse et la robotique chez NVIDIA, a permis de poser les bases d'une coopération potentielle. Aucun montant ni calendrier n'a encore été formalisé, mais les deux entreprises ont des priorités matérielles qui se recoupent sur deux fronts distincts : l'infrastructure thermique des centres de données et la robotique domestique. Sur le premier point, LG a présenté au CES 2026 des solutions de climatisation et de gestion thermique haute efficacité spécifiquement conçues pour les fermes de serveurs IA. Sur le second, le groupe coréen a dévoilé CLOiD, un robot domestique doté de deux bras à sept degrés de liberté et de cinq doigts à actuation individuelle, fonctionnant sur sa plateforme maison baptisée "Affectionate Intelligence". En parallèle, NVIDIA vient de conclure un essai de deux semaines sur un site Siemens en janvier 2026, annoncé en avril à la foire de Hanovre, où un robot humanoïde HMND 01 Alpha a exécuté des opérations logistiques réelles sur une plage de huit heures. Ces discussions révèlent une dépendance structurelle croissante entre les fabricants d'équipements physiques et les fournisseurs de puissance de calcul. Les racks de serveurs NVIDIA génèrent des densités de chaleur que les systèmes de refroidissement conventionnels ne peuvent plus absorber sans dégrader les performances : lorsque les nœuds de calcul surchauffent, ils réduisent automatiquement leur cadence, détruisant le retour sur investissement des puces haut de gamme. Intégrer les solutions thermiques de LG directement dans l'écosystème NVIDIA permettrait aux opérateurs d'entasser plus de puissance de calcul dans moins d'espace physique. Du côté robotique, LG manque aujourd'hui des environnements de simulation, des modèles de manipulation pré-entraînés et de l'infrastructure de jumeaux numériques nécessaires pour déployer CLOiD en toute sécurité dans des logements réels. La pile Omniverse et Isaac de NVIDIA offre précisément cette architecture, optimisée pour l'inférence physique en temps réel, ce qui permettrait de comprimer drastiquement le délai entre prototype et production commerciale. L'enjeu central de ces négociations illustre une fracture fondamentale de l'IA physique : les environnements industriels, comme l'usine Siemens d'Erlangen, sont structurés et prévisibles, ce qui facilite le déploiement de robots. Les intérieurs domestiques, eux, présentent une variabilité extrême en termes d'éclairage, de disposition et de comportement humain imprévisible, rendant le passage à l'échelle bien plus complexe. LG mise sur NVIDIA pour combler cette lacune via la puissance de simulation et l'inférence en périphérie de réseau. Pour NVIDIA, dont les revenus du segment centres de données battent régulièrement des records, nouer des partenariats avec des constructeurs d'appareils grand public comme LG représente une voie pour ancrer sa plateforme Omniverse comme standard de l'industrie robotique, avant que la concurrence chinoise ou les acteurs spécialisés ne s'imposent.

UELe déploiement d'un robot humanoïde sur le site Siemens d'Erlangen (Allemagne) signale une accélération de l'IA physique dans l'industrie manufacturière européenne, avec des implications pour les équipementiers et intégrateurs du secteur.

RobotiqueOpinion
1 source
RISE : politique robotique auto-améliorante avec modèle du monde compositionnel
4arXiv cs.RO 

RISE : politique robotique auto-améliorante avec modèle du monde compositionnel

Des chercheurs ont présenté RISE, un framework d'apprentissage par renforcement pour robots qui s'améliore sans interaction physique coûteuse. Publié sur arXiv (2602.11075), le système repose sur un modèle du monde compositional constitué de deux blocs distincts : un modèle de dynamique contrôlable qui prédit l'évolution visuelle de la scène depuis plusieurs angles de caméra, et un modèle d'évaluation de la progression qui note les résultats imaginés. Ces deux composants alimentent une boucle fermée dans laquelle le robot simule des séquences d'actions en imagination, estime leur qualité, puis met à jour sa politique sans jamais bouger un seul moteur. Testé sur trois tâches réelles, RISE obtient des gains spectaculaires : +35 % en tri dynamique de briques, +45 % pour emballer un sac à dos, et +35 % pour fermer une boîte. Ce résultat compte car il s'attaque à un problème fondamental de la robotique moderne : les modèles Vision-Language-Action, malgré des capacités croissantes, restent fragiles dès qu'une manipulation implique des contacts physiques ou une dynamique rapide. La moindre déviation d'exécution peut déclencher une cascade d'échecs. L'apprentissage par renforcement classique permettrait théoriquement de rendre les robots plus robustes, mais il exige des milliers d'essais sur du matériel réel, avec des risques de casse et des procédures de remise en état longues et onéreuses. RISE contourne cette contrainte en déplaçant l'essentiel de l'apprentissage dans un espace imaginaire, rendant l'amélioration continue à la fois sûre et scalable. La robotique de manipulation est aujourd'hui dominée par l'imitation, on montre au robot des démonstrations humaines, et il reproduit. Cette approche atteint ses limites dans des environnements non contrôlés, où les objets bougent et les conditions varient. Le mouvement vers des modèles du monde capables de simuler des conséquences futures s'inscrit dans une tendance plus large, partagée avec les travaux sur les world models en jeux vidéo et en conduite autonome. RISE représente une étape concrète vers des robots capables d'auto-amélioration continue, sans dépendre d'un accès permanent à des environnements physiques instrumentés.

RobotiquePaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic