Robotique — page 6

628 articles · page 6 sur 13

Actualités robotique et IA : robots autonomes, drones, véhicules autonomes et robots humanoïdes.

LLMs Recherche Business Éthique Outils Régulation Sécurité Société Infrastructure Création Autre

PriorVLA : adaptation préservant les acquis pour les modèles vision-langage-action (VLA)

Des chercheurs ont publié le 15 mai 2026 sur arXiv (2605.10925) PriorVLA, un framework d'adaptation pour les modèles Vision-Language-Action (VLA) destinés à la manipulation robotique généraliste. L'approche repose sur deux composants distincts : un Prior Expert gelé, utilisé en lecture seule pour conserver les représentations apprises lors du pré-entraînement, et un Adaptation Expert entraînable sur la tâche cible. Des Expert Queries extraient des priors de scène depuis le VLM pré-entraîné et des priors moteurs depuis le Prior Expert, puis les injectent dans l'Adaptation Expert pour guider la spécialisation. Résultat : PriorVLA ne met à jour que 25 % des paramètres modifiés par un fine-tuning complet. Sur le benchmark RoboTwin 2.0-Hard, il dépasse pi0.5 de 11 points ; sur LIBERO, il atteint 99,1 % de taux de succès moyen. Sur huit tâches réelles et deux plateformes embarquées, le modèle affiche 81 % de succès en distribution et 57 % hors distribution. En régime few-shot à 10 démonstrations par tâche, il atteint respectivement 48 % et 32 %, surpassant pi0.5 de 24 et 22 points. Le problème central que PriorVLA attaque est bien documenté : le fine-tuning complet d'un VLA pré-entraîné sur de grandes quantités de données tend à écraser les priors larges au profit de patterns étroits propres à la distribution d'entraînement, dégradant la généralisation hors distribution. C'est précisément le noeud du déploiement industriel, un robot doit fonctionner dans des environnements légèrement différents de ceux vus à l'entraînement. Les gains OOD de PriorVLA, conjugués à ses performances few-shot, suggèrent une voie plus efficace en données et en calcul pour adapter des fondations générales à des cellules de production spécifiques, sans réentraîner l'intégralité du modèle. PriorVLA s'inscrit dans la course à l'adaptation des VLA généralistes, un segment dominé par Physical Intelligence avec pi0 et pi0.5, et par NVIDIA avec GR00T N2 côté infrastructure. L'article utilise pi0.5 comme baseline principale, ce qui positionne PriorVLA explicitement comme une amélioration de l'état de l'art issu de Physical Intelligence. L'approche par expert gelé rappelle des techniques issues du PEFT (Parameter-Efficient Fine-Tuning) en NLP, ici transposées à l'action robotique. Les benchmarks RoboTwin 2.0 et LIBERO sont des standards académiques simulés ; les résultats sur tâches réelles, bien que prometteurs, restent limités à un contexte de laboratoire. Aucun déploiement industriel ni partenariat industriel n'est mentionné dans la publication.

UELes laboratoires de robotique européens (CEA-List, INRIA) pourraient appliquer cette méthode pour adapter des VLA généraux à leurs plateformes avec moins de données et de calcul, mais aucune entité française ou européenne n'est directement impliquée dans la publication.

Robotique — page 6

PriorVLA : adaptation préservant les acquis pour les modèles vision-langage-action (VLA)

Locomotion humanoïde de bout en bout apprise à partir de pixels bruts

Piloter un robot humanoïde par instructions en langage libre : un modèle d'action à grand vocabulaire de mouvement unifié

Préhension volumétrique équivariante

RLWRLD lance RLDX-1, un modèle fondation centré sur la dextérité pour mains robotiques

LaST-R1 : un nouveau paradigme de raisonnement physique atteint 99,9 % de succès sur le benchmark LIBERO

Large Video Planner permet un contrôle robotique généralisable

BioProVLA-Agent : système multi-agents incarné avec VLA et raisonnement en boucle fermée en laboratoire biologique

IA incarnée : PathPainter transfère les capacités de généralisation des modèles génératifs à la navigation robotique

Les événements à ne pas rater pour comprendre la montée en puissance de la robotique en 2026

MACHINA by RAISE 2026, Paris veut devenir l’un des centres européens de la “physical AI”

ROBOTICS SUMMIT & EXPO 2026, Boston au cœur de la nouvelle économie robotique

AUTOMATE SHOW 2026, la robotique industrielle entre dans l’ère de l’usine autonome

Humanoids Summit Tokyo 2026, la robotique humanoïde entre dans sa phase industrielle

Video Friday : l'IA confère aux mains robotiques une dextérité humaine

SynapX lance SYNData : un système de collecte de données multimodal pour l'ère de l'IA incarnée

SynapX lance SYNData : un système multimodal de collecte de données pour l'ère de l'IA incarnée

La collecte de données robotiques traditionnelle est obsolète : ce qui la remplace

Vidéo : deux robots de Figure AI coopèrent seuls pour nettoyer une chambre

TriRelVLA : structure relationnelle triadique pour la manipulation incarnée généralisable

Quand faire confiance à l'imagination : exécution adaptative des actions pour les modèles d'action du monde

Podcast : Colin Angle parle de la conception de robots compagnons avec Familiar Machines et Magic

Les robots sont trop nuls dans la vraie vie : ces chercheurs ont enfin trouvé la solution

Genesis AI développe un cerveau robotique pour doter les robots polyvalents d'une dextérité comparable à celle de l'humain

GENESIS AI veut apprendre aux robots les gestes humains à grande échelle

ConsisVLA-4D : vers une meilleure cohérence spatiotemporelle pour la manipulation robotique avec un modèle VLA

Apprendre à sentir le futur : DreamTacVLA pour la manipulation riche en contacts

Hugging Face lance un App Store open source pour robots avec plus de 200 applications pour Reachy Mini

Genesis AI introduit GENE-26.5, un modèle pour une manipulation robotique plus dextérique

Genesis AI présente GENE-26.5, un modèle pour une manipulation robotique plus dextérique

Vidéo : le robot Atlas bouge déjà mieux que certains gymnastes

Préhension dextérique réactive par planification RL hiérarchique en espace de tâche et contrôle QP en espace articulaire

Préhension indépendante du point de vue par VLM et observations partielles

RLDX-1 : rapport technique

BifrostUMI : des démonstrations sans robot pour la manipulation corps entier des humanoïdes

Tutor Intelligence crée une Data Factory pour entraîner ses robots par IA dans le monde réel

Les robots humanoïdes vont-ils (vraiment) prendre votre travail ? Notre rédacteur en chef répond sur France 24

La technologie bionique doit faire ses preuves hors des laboratoires

Top Robots Avril 2026 : Usine, sport, salon… l’IA prend le contrôle

Familiar : ce robot veut devenir le nouveau membre de votre famille

MolmoAct2 : un modèle de raisonnement d'action pour le déploiement réel

Sentinel-VLA : modèle VLA métacognitif à surveillance active pour le raisonnement dynamique et la récupération d'erreurs

VILAS : une architecture bas coût intégrant un modèle VLA avec préhension souple pour la manipulation robotique

Phone2Act : système de téléopération économique et universel pour la collecte de données VLA à grande échelle

Champs de contact sémantiques pour la manipulation tactile d'outils généralisable par catégorie

Apprendre à agir par le contact : une vision unifiée de l'apprentissage multi-tâches pour les robots

VOFA : poussée d'objets vers un objectif visuel avec contrôle adaptatif en force pour humanoïdes

AutoSpatial : raisonnement vision-langage pour la navigation sociale des robots humanoïdes par apprentissage spatial efficace

Le fondateur d'iRobot veut placer un compagnon robotique dans votre foyer

Physical AI : l’intelligence artificielle incarne enfin le monde réel