Dossier Robots humanoïdes — page 2

469 articles · page 2 sur 10

L'industrie des robots humanoïdes : Unitree, Fauna Robotics, Tesla Optimus, Chery, Sony, défis techniques et premiers déploiements en entreprise.

51arXiv cs.RO RobotiqueOpinion

Exécution en temps réel avec des politiques autorégressives

Un article de recherche déposé sur arXiv (référence 2606.13355) en juin 2026 démontre que les politiques autoregressives -- la famille de modèles qui génère les actions token par token, à la manière d'un LLM classique -- peuvent atteindre une exécution en temps réel sur des robots physiques. La méthode repose sur deux leviers combinés : l'ajustement de l'horizon de tokenisation (la granularité temporelle des séquences d'actions encodées) et le décodage contraint (constrained decoding), qui impose des bornes de latence strictes à chaque inférence. En rendant l'inférence asynchrone, le système garantit des trajectoires d'action fluides tout en maintenant une réactivité suffisante pour absorber les perturbations de l'environnement. Les auteurs montrent, sur des benchmarks simulés et en conditions réelles, que la politique autoregressive surpasse systématiquement son équivalent basé sur le flow-matching (variante des politiques de diffusion) tout en atteignant des vitesses de complétion de tâche nettement supérieures à celles obtenues en inférence synchrone. Le multi-trajectory decoding -- rendu possible par les garanties de latence -- permet en outre d'explorer plusieurs trajectoires candidates en parallèle pour maximiser la performance. Ce résultat est significatif car il remet en cause une hypothèse dominante dans la robotique d'apprentissage : celle selon laquelle les politiques de diffusion seraient structurellement mieux adaptées à l'exécution temps réel en raison de leur parallélisme d'échantillonnage. Les modèles VLA (Vision-Language-Action) autoregressifs, qui traitent séquentiellement pixels, instructions textuelles et commandes moteur dans un même réseau, souffraient d'un goulot d'étranglement de latence jugé rédhibitoire pour le déploiement sur robots industriels ou humanoïdes. Cette publication suggère que ce surcoût peut être absorbé par architecture -- sans sacrifier la performance ni la généralisation aux instructions. Pour un intégrateur ou un COO industriel évaluant des briques VLA, le message est pratique : les modèles autoregressifs offrent également une convergence plus rapide à l'entraînement et une meilleure généralisation aux nouvelles instructions, deux propriétés critiques pour les déploiements à petits volumes de données. Sur le plan du contexte, le débat autoregressif contre diffusion structure la recherche en politiques robotiques depuis la publication des diffusion policies (Chi et al., 2023), rapidement adoptées par des projets comme pi-0 de Physical Intelligence ou ACT. Les modèles VLA à architecture autoregressive, dont OpenVLA ou les variantes de GR00T N2 (NVIDIA), peinent en revanche à s'imposer en déploiement temps réel faute de latence acceptable. Ce preprint, qui n'est pas encore évalué par les pairs, repositionne cette famille comme compétitive pour l'exécution physique, à condition d'intégrer les deux mécanismes proposés dès la conception du pipeline d'inférence. Les prochaines étapes naturelles seront la validation sur des robots industriels à haute fréquence de contrôle (au-dessus de 50 Hz) et l'ouverture éventuelle du code.

Dossier Robots humanoïdes — page 2

Exécution en temps réel avec des politiques autorégressives

EmbodiSteer : guidage articulaire de politiques visuomotrices universelles pour un déploiement zéro-shot multi-robots

WT-UMI : manipulation corps entier guidée par le toucher via planification consciente des contacts supervisée par la force

Apprendre quoi dire à son modèle VLA : un guidage presque inoffensif

NEURA ROBOTICS lève 1,2 milliard d’euros : la robotique devient le nouveau pari stratégique de l’Europe

Tye Brady (Amazon) : les robots du futur « se fondront dans le décor »

Vulnérabilités des modèles vision-langage-action (VLA) face aux défauts physiques d'articulation

Vidéo : ce robot clown a donné un coup de pied à un enfant en pleine démonstration

Le guide du sceptique face aux robots humanoïdes qui font le buzz sur Internet

Amazon développe un robot d'entrepôt que les employés peuvent piloter à la voix

CoRe-MoE : un mélange d'experts contrastif pour la locomotion multi-terrain des robots humanoïdes avec adaptation de la démarche

SplitAdapter : loco-manipulation humanoïde sensible à la charge par adaptation factorisée

PHASER : rejeu d'expérience sémantique et par phase pour les modèles VLA

Cosmos 3 : Nvidia lance l’IA qui comprend (enfin) la vraie vie

Erreur par groupe, pas MSE totale : affinage de modèles VLA pour la manipulation mobile à 11 DOF

Intégration IA-IoT-Robotique : panorama des frameworks, tendances émergentes et voie vers la robotique connectée

Wall-OSS-0.5 : rapport technique

TARIC : VLN extérieur à mémoire augmentée et traversabilité adaptative sous indices sémantiques discontinus

Any-ttach : le remplacement rapide d'effecteurs finaux améliore la dextérité de manipulation

Une startup forme des robots en envoyant des humains filmer le ménage chez vous

L’IA physique : le prochain marché que surveille déjà Wall Street

L'avenir de l'IA physique n'est pas humanoïde : il est spécialisé et rentable

L'avenir de l'IA physique passe par des interfaces plus intelligentes, pas des robots plus capables

Robot moonwalk façon Michael Jackson : le fiasco

Manipulation corps entier des humanoïdes via un cerveau spatial actif et un cervelet d'action généralisable

Des robots humanoïdes de Figure AI gèrent des colis sous le regard fasciné d'internet

Amorçage auto-supervisé du raisonnement incarné pour la prédiction d'actions

NORM-Nav : navigation de robot mobile sans apprentissage préalable, guidée par contraintes comportementales en langage naturel

San Francisco accueille un club de combat de robots, General Catalyst fait le buzz

Comment l'IA à base d'agents permet la navigation robotique généraliste

RLWRLD dévoile un modèle fondation axé sur la dextérité pour robots humanoïdes

Unitree Robotics : du pionnier de la locomotion quadrupède aux humanoïdes

Modèles d'action du monde : la prochaine frontière de l'IA incarnée

Locomotion humanoïde de bout en bout apprise à partir de pixels bruts

Piloter un robot humanoïde par instructions en langage libre : un modèle d'action à grand vocabulaire de mouvement unifié

Préhension volumétrique équivariante

Humanoids Summit Tokyo 2026, la robotique humanoïde entre dans sa phase industrielle

Vidéo : deux robots de Figure AI coopèrent seuls pour nettoyer une chambre

La Corée du Sud vient de créer un moine robot : même Black Mirror n’avait pas osé

Vidéo : le robot Atlas bouge déjà mieux que certains gymnastes

BifrostUMI : des démonstrations sans robot pour la manipulation corps entier des humanoïdes

RLDX-1 : rapport technique

Tutor Intelligence crée une Data Factory pour entraîner ses robots par IA dans le monde réel

Les robots humanoïdes vont-ils (vraiment) prendre votre travail ? Notre rédacteur en chef répond sur France 24

Top Robots Avril 2026 : Usine, sport, salon… l’IA prend le contrôle

Familiar : ce robot veut devenir le nouveau membre de votre famille

VOFA : poussée d'objets vers un objectif visuel avec contrôle adaptatif en force pour humanoïdes

AutoSpatial : raisonnement vision-langage pour la navigation sociale des robots humanoïdes par apprentissage spatial efficace

Physical AI : l’intelligence artificielle incarne enfin le monde réel

ExoActor : génération de vidéos exocentriques pour le contrôle généralisable d'humanoïdes interactifs