RobotiqueHuggingFace Blog34sem· 1 min de lecture

LeRobot 0.4.0 : Accélérateur d'apprentissage des robots open source

LeRobot v0.4.0, une nouvelle version du logiciel open-source pour l'apprentissage des robots, vise à accélérer et à optimiser le développement de systèmes d'IA robotique grâce à des améliorations significatives, notamment une meilleure intégration avec les frameworks OSS existants et une augmentation des capacités d'apprentissage automatique.

Impact France/UE

La mise à jour de LeRobot v0.4.0, développée par la startup française Hugging Face, renforce la position européenne dans la robotique open-source en offrant aux chercheurs et entreprises du continent un outil compétitif pour développer des systèmes d'IA robotique.

Dans nos dossiers

Open weight & Open source

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1arXiv cs.RO

L'apprentissage par démonstration avec détection d'échecs pour la navigation sécurisée des robots

Des chercheurs ont publié un article de recherche présentant un nouveau cadre d'apprentissage pour la navigation robotique, intitulé "Learning from Demonstration with Failure Awareness for Safe Robot Navigation" (arXiv:2604.23360). Leur approche s'attaque à un problème fondamental des systèmes d'apprentissage par démonstration : les robots apprennent principalement à partir de comportements réussis, ce qui les rend vulnérables dès qu'ils rencontrent des situations inédites ou dangereuses. Pour y remédier, l'équipe propose un cadre qui exploite explicitement les expériences d'échec, comme les collisions, jusqu'ici largement ignorées car elles n'offrent pas de comportement directement imitable. Le coeur de l'innovation réside dans une séparation stricte des rôles des deux types de données. Les expériences d'échec servent exclusivement à calibrer l'estimation de la valeur dans les zones à risque, signalant au robot les régions à éviter, tandis que l'apprentissage de la politique de navigation reste cantonné aux démonstrations réussies. Cette dissociation permet d'intégrer les données d'échec sans dégrader les performances globales, un écueil habituel des approches naïves qui mélangent les deux. Le tout est implémenté dans un cadre d'apprentissage par renforcement hors ligne, ce qui signifie que le robot apprend à partir d'un jeu de données fixe, sans nécessiter d'interactions supplémentaires avec l'environnement pendant l'entraînement. Les évaluations menées à la fois en simulation et en environnements réels montrent une réduction significative des taux de collision, tout en maintenant un taux de succès des tâches équivalent, avec une bonne généralisation sur différentes plateformes robotiques. Cette recherche s'inscrit dans un effort plus large pour rendre les robots autonomes fiables dans des contextes ouverts et imprévisibles, un enjeu critique pour leur déploiement dans des entrepôts logistiques, des hôpitaux ou des espaces publics. L'apprentissage par démonstration reste l'une des approches les plus pratiques pour programmer des robots sans expertise en RL, mais sa fragilité face aux situations hors distribution freine son adoption industrielle. En valorisant les données d'échec autrement que comme du bruit à écarter, ce travail ouvre une voie prometteuse pour construire des politiques de navigation plus robustes, sans coût de collecte de données supplémentaire.

RobotiqueActu

1 source

2arXiv cs.RO

Apprentissage augmenté par référence pour le contrôle précis de robots continus à tendons

Des chercheurs ont développé une nouvelle approche d'apprentissage automatique pour améliorer le contrôle précis des robots continus à tendons, une classe de robots flexibles dont les mouvements sont guidés par des câbles internes. Présentée dans un article publié sur arXiv (référence 2604.25698), la méthode repose sur un cadre d'apprentissage hors-ligne dit « augmenté par références », capable de piloter ces robots avec six degrés de liberté. Les tests ont été conduits sur une plateforme robotique à trois sections, et les résultats montrent une réduction de 50,9 % de l'erreur de position moyenne par rapport aux méthodes d'apprentissage non augmentées, ainsi qu'une nette supériorité face aux contrôleurs classiques dits « jacobiens », tant en précision qu'en stabilité, quelle que soit la vitesse de déplacement. Ce gain de performance est significatif pour les applications médicales et industrielles où ces robots flexibles sont utilisés, notamment en chirurgie mini-invasive, en endoscopie ou en exploration de structures encombrées. Le problème central des robots à tendons réside dans leur comportement non linéaire et dépendant de leur historique de mouvement : les câbles introduisent des effets d'hystérésis qui provoquent des oscillations difficiles à corriger avec les méthodes de contrôle traditionnelles. La nouvelle approche force le modèle à apprendre des mécanismes de récupération d'erreur variés sans nécessiter d'interactions physiques supplémentaires avec le robot, ce qui réduit les coûts et les risques d'usure matérielle pendant l'entraînement. La difficulté à contrôler précisément ces robots flexibles freine depuis longtemps leur déploiement dans des environnements cliniques réels, où la moindre déviation de trajectoire peut avoir des conséquences graves. Les approches par réseau de neurones récurrents (RNN), utilisées ici comme pont différentiable pour optimiser la politique de contrôle, permettent de modéliser la dépendance temporelle des dynamiques sans recourir à des modèles analytiques trop simplifiés. L'équipe introduit également une augmentation multi-échelle combinant biais stochastiques, perturbations harmoniques et marches aléatoires, ce qui expose le modèle à une grande diversité de trajectoires pendant l'entraînement. Les prochaines étapes probables incluent une validation sur des scénarios cliniques réels et une extension à des robots à sections multiples plus complexes.

UELes avancées en contrôle de précision des robots flexibles médicaux pourraient bénéficier aux établissements hospitaliers et entreprises européennes actifs en chirurgie mini-invasive et endoscopie.

RobotiqueOpinion

1 source

3arXiv cs.RO

ESPADA : accélération de l'apprentissage par imitation via sous-échantillonnage sémantique des démonstrations

Des chercheurs ont publié ESPADA, un système conçu pour accélérer les robots apprenants par imitation sans sacrifier leur précision. Présenté dans un article arXiv (2512.07371), le cadre analyse les démonstrations humaines enregistrées grâce à un pipeline combinant un grand modèle de vision (VLM) et un grand modèle de langage (LLM), qui segmente chaque séquence de mouvement en phases critiques et non critiques en tenant compte des relations spatiales 3D entre la pince du robot et les objets manipulés. Les segments jugés non essentiels sont fortement sous-échantillonnés, ce qui réduit les délais d'exécution, tandis que les phases de précision restent intactes. Pour étendre cette annotation d'un seul épisode à l'ensemble d'un jeu de données, ESPADA propage automatiquement les étiquettes via le Dynamic Time Warping (DTW) appliqué aux caractéristiques dynamiques. Testée sur deux architectures de référence, ACT et Diffusion Policy, aussi bien en simulation que dans des environnements réels, la méthode atteint en moyenne un gain de vitesse de 2x tout en conservant les taux de réussite initiaux. Ce résultat est concret : un robot industriel deux fois plus rapide sans perte de fiabilité représente un levier direct de rentabilité pour les lignes de production automatisées. L'absence de retraining et de modification architecturale est tout aussi importante, car elle permet d'intégrer ESPADA sur des systèmes existants sans refaire des campagnes d'entraînement coûteuses. Le principal verrou levé ici est psychologique autant que technique : les robots imitateurs ont tendance à reproduire la prudence humaine, ce tempo lent et hésitant qui, chez l'humain, compense l'incertitude mais devient un frein en production continue. La robotique par imitation a connu un essor rapide ces dernières années grâce à des architectures comme ACT (Action Chunking Transformer) ou les politiques de diffusion, qui permettent à des robots de généraliser à partir de quelques dizaines de démonstrations filmées. Les tentatives précédentes d'accélération reposaient sur des heuristiques statistiques, ignorant le sens des tâches, et échouaient sur des manipulations variées. ESPADA tranche en intégrant une compréhension sémantique de ce qui compte vraiment dans un mouvement, ouvrant la voie à des robots industriels plus compétitifs face à la programmation traditionnelle.

UELes industries manufacturières européennes utilisant la robotique par imitation pourraient bénéficier d'un doublement de la cadence sans surcoût de réentraînement, mais la méthode reste au stade de la recherche arXiv sans déploiement commercial annoncé.

RobotiquePaper

1 source

4IEEE Spectrum AI

Des agents IA pour les équipes de robots

Le laboratoire de physique appliquée de l'université Johns Hopkins (APL) a publié une présentation détaillant ses travaux récents sur l'IA agentique appliquée aux équipes de robots collaboratifs. Baptisée "Agentic AI for Robot Teams", cette communication expose une architecture scalable conçue pour doter des systèmes robotiques hétérogènes de capacités d'autonomie, de coordination et d'adaptabilité. Les chercheurs y décrivent comment des agents fondés sur des grands modèles de langage (LLM) peuvent être déployés sur du matériel réel, avec des démonstrations impliquant des équipes de robots aux profils et capacités différents. Le document, disponible sous forme de livre blanc, présente également les leçons tirées des phases de recherche et développement en cours. L'enjeu est considérable : faire travailler ensemble des robots qui ne partagent ni les mêmes capteurs, ni les mêmes actionneurs, ni les mêmes logiciels impose des défis de coordination que les architectures classiques peinent à résoudre. En intégrant des LLM comme couche de raisonnement et de planification, les équipes de l'APL cherchent à rendre ces systèmes capables de s'adapter dynamiquement aux imprévus, de se répartir les tâches et de maintenir une cohérence collective sans supervision humaine constante. Cette approche pourrait transformer des domaines comme la logistique autonome, la gestion de catastrophes, les opérations militaires ou l'exploration de milieux hostiles, où envoyer des équipes humaines reste risqué ou impossible. Le Johns Hopkins APL est l'un des principaux centres de recherche appliquée du Département de la Défense américain, ce qui situe ces travaux dans un contexte stratégique lié à la robotique militaire et aux systèmes autonomes multi-agents. La montée en puissance des LLM depuis 2022 a ouvert une nouvelle voie pour la robotique agentique, jusqu'ici freinée par la rigidité des architectures de contrôle traditionnelles. Les suites annoncées portent sur la généralisation de l'architecture à des équipes plus larges et plus hétérogènes, ainsi que sur l'amélioration de la robustesse dans des environnements dégradés ou incertains.

RobotiqueActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic