Aller au contenu principal
Modélisation dynamique par apprentissage automatique et contrôle robuste pour robots continus à tendons
RobotiquearXiv cs.RO2h

Modélisation dynamique par apprentissage automatique et contrôle robuste pour robots continus à tendons

Résumé IASource uniqueImpact UE
Source originale ↗·

Des chercheurs ont publié le 29 avril 2026 une nouvelle approche pour contrôler les robots continus à tendons (TDCRs), une catégorie de robots souples dont les mouvements sont pilotés par des câbles ou tendons internes. Ces systèmes sont particulièrement difficiles à modéliser en raison de non-linéarités complexes : hystérésis de friction, compliance de transmission et comportements dynamiques qui s'amplifient sur de longues séquences de mouvements. L'équipe propose un cadre d'apprentissage différentiable combinant un modèle de dynamique haute fidélité basé sur des réseaux GRU (Gated Recurrent Units) avec une politique de contrôle neuronal entraînée de bout en bout. Le modèle intègre une connectivité bidirectionnelle multi-canaux et une prédiction résiduelle pour supprimer l'accumulation d'erreurs lors des prédictions auto-régressives sur le long terme. Les expériences ont été menées sur un robot physique à trois sections, validant les performances en conditions réelles.

Cette approche dépasse les méthodes classiques basées sur le jacobien, qui génèrent des oscillations auto-entretenues problématiques pour la précision et la stabilité. En traitant le modèle de dynamique comme un "pont de gradient", la politique de contrôle apprend implicitement à compenser les non-linéarités intrinsèques du robot sans qu'il soit nécessaire de les modéliser explicitement. Le résultat est un suivi de trajectoire précis et une robustesse supérieure face à des charges utiles inconnues, c'est-à-dire des poids non intégrés lors de l'entraînement, ce qui est critique pour les applications en environnements variables.

Les robots continus à tendons suscitent un intérêt croissant en chirurgie mini-invasive, inspection industrielle et manipulation en espaces confinés, précisément parce que leur souplesse leur permet d'évoluer là où les bras rigides échouent. Le principal verrou restait leur contrôle fiable dans des conditions dynamiques réelles. Cette publication s'inscrit dans une tendance plus large d'intégration de l'apprentissage automatique dans la robotique physique, où les modèles appris remplacent progressivement les équations analytiques trop simplificatrices. Les prochaines étapes pourraient inclure la généralisation à des robots à plus de sections, l'adaptation en temps réel au vieillissement mécanique des tendons, et une intégration dans des systèmes chirurgicaux assistés.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Apprentissage augmenté par référence pour le contrôle précis de robots continus à tendons
1arXiv cs.RO 

Apprentissage augmenté par référence pour le contrôle précis de robots continus à tendons

Des chercheurs ont développé une nouvelle approche d'apprentissage automatique pour améliorer le contrôle précis des robots continus à tendons, une classe de robots flexibles dont les mouvements sont guidés par des câbles internes. Présentée dans un article publié sur arXiv (référence 2604.25698), la méthode repose sur un cadre d'apprentissage hors-ligne dit « augmenté par références », capable de piloter ces robots avec six degrés de liberté. Les tests ont été conduits sur une plateforme robotique à trois sections, et les résultats montrent une réduction de 50,9 % de l'erreur de position moyenne par rapport aux méthodes d'apprentissage non augmentées, ainsi qu'une nette supériorité face aux contrôleurs classiques dits « jacobiens », tant en précision qu'en stabilité, quelle que soit la vitesse de déplacement. Ce gain de performance est significatif pour les applications médicales et industrielles où ces robots flexibles sont utilisés, notamment en chirurgie mini-invasive, en endoscopie ou en exploration de structures encombrées. Le problème central des robots à tendons réside dans leur comportement non linéaire et dépendant de leur historique de mouvement : les câbles introduisent des effets d'hystérésis qui provoquent des oscillations difficiles à corriger avec les méthodes de contrôle traditionnelles. La nouvelle approche force le modèle à apprendre des mécanismes de récupération d'erreur variés sans nécessiter d'interactions physiques supplémentaires avec le robot, ce qui réduit les coûts et les risques d'usure matérielle pendant l'entraînement. La difficulté à contrôler précisément ces robots flexibles freine depuis longtemps leur déploiement dans des environnements cliniques réels, où la moindre déviation de trajectoire peut avoir des conséquences graves. Les approches par réseau de neurones récurrents (RNN), utilisées ici comme pont différentiable pour optimiser la politique de contrôle, permettent de modéliser la dépendance temporelle des dynamiques sans recourir à des modèles analytiques trop simplifiés. L'équipe introduit également une augmentation multi-échelle combinant biais stochastiques, perturbations harmoniques et marches aléatoires, ce qui expose le modèle à une grande diversité de trajectoires pendant l'entraînement. Les prochaines étapes probables incluent une validation sur des scénarios cliniques réels et une extension à des robots à sections multiples plus complexes.

UELes avancées en contrôle de précision des robots flexibles médicaux pourraient bénéficier aux établissements hospitaliers et entreprises européennes actifs en chirurgie mini-invasive et endoscopie.

RobotiqueOpinion
1 source
Robots à tendons avec colonne vertébrale polymère flexible conique : conception, fabrication et modélisation
2arXiv cs.RO 

Robots à tendons avec colonne vertébrale polymère flexible conique : conception, fabrication et modélisation

Des chercheurs ont présenté une nouvelle génération de robots continus à actionnement par tendons, fabriqués par impression 3D à partir de polyuréthane thermoplastique (TPU), un matériau souple et économique. La caractéristique centrale du design est son architecture conique, c'est-à-dire que la colonne vertébrale flexible du robot s'affine progressivement de la base vers l'extrémité, ce qui lui confère une souplesse accrue à la pointe et une rigidité maintenue à la base. Le système intègre une électronique embarquée permettant de contrôler et de mesurer en temps réel la tension des tendons grâce à des actionneurs et des cellules de charge. Les chercheurs ont validé leur modèle de simulation face à des données de capture de mouvement réelle, atteignant une précision de prédiction de forme à l'échelle du centimètre. En démonstration finale, le robot a réussi des tâches de préhension téléopérée en utilisant une pince endoscopique montée sur un bras robotique à 6 degrés de liberté. L'intérêt de ce travail réside dans la combinaison rare entre performance mécanique et accessibilité. La plupart des robots continus existants sont conçus pour un usage unique, coûteux à produire et difficiles à modifier. Ici, le design paramétrique permet d'adapter rapidement la géométrie via des scripts CAD fournis en accès libre, ce qui ouvre la voie à des applications dans l'inspection industrielle, la chirurgie mini-invasive ou la manipulation en environnement contraint, sans nécessiter de moyens de fabrication industriels. La conformation conique améliore notamment la manipulabilité distale, c'est-à-dire la capacité du robot à atteindre des angles et des configurations variées en bout de bras, un paramètre clé pour les tâches en espace confiné. Les robots continus, inspirés de la biologie des tentacules et des trompes, font l'objet d'une attention croissante dans la robotique médicale et industrielle depuis une décennie. Leur principal verrou technologique reste la modélisation précise de leur comportement mécanique, particulièrement complexe car ils déforment tout leur corps plutôt qu'un seul joint articulé. Les auteurs s'appuient sur la théorie des tiges de Cosserat, un formalisme mathématique reconnu, qu'ils étendent ici pour intégrer la variation géométrique longitudinale de la section transversale. La diffusion des scripts de génération paramétrique et l'utilisation exclusive d'imprimantes FDM grand public positionnent cette approche comme une base reproductible pour d'autres équipes souhaitant explorer la robotique souple sans infrastructure lourde.

RobotiqueOpinion
1 source
Apprentissage du contrôle multimodal du corps entier pour robots humanoïdes réels
3arXiv cs.RO 

Apprentissage du contrôle multimodal du corps entier pour robots humanoïdes réels

Des chercheurs en robotique ont publié sur arXiv une avancée notable dans le contrôle des robots humanoïdes, présentant le Masked Humanoid Controller (MHC), un système d'apprentissage automatique capable de piloter l'ensemble du corps d'un robot à partir d'une interface unifiée. Concrètement, le MHC reçoit des commandes sous forme de trajectoires partiellement spécifiées, seules certaines parties du corps sont ciblées à la fois, et les exécute en maintenant l'équilibre général de la machine. Le système a été validé sur le robot humanoïde réel Digit V3 du fabricant Agility Robotics, démontrant que les comportements appris en simulation se transfèrent effectivement au monde physique. Ce qui distingue le MHC, c'est sa capacité à traiter des entrées radicalement différentes avec un seul contrôleur : séquences de pas planifiées par un algorithme d'optimisation, clips de capture de mouvement humain, vidéos retransposées sur le robot, ou signaux de téléopération en temps réel via joystick. Jusqu'ici, chacun de ces modes nécessitait généralement un pipeline dédié. Cette unification simplifie considérablement l'architecture des systèmes robotiques et ouvre la voie à des robots capables de recevoir des instructions hybrides, par exemple suivre une trajectoire planifiée tout en imitant simultanément des gestes captés sur une vidéo. Le problème du contrôle corps entier est l'un des verrous majeurs de la robotique humanoïde commerciale, alors que des acteurs comme Boston Dynamics, Figure AI ou Tesla Optimus investissent massivement dans ce secteur. La tendance actuelle consiste à entraîner des contrôleurs en simulation, moins coûteux et plus sûr, puis à les transférer sur du matériel réel, une approche que le MHC illustre avec le Digit V3. L'utilisation d'un curriculum d'entraînement couvrant l'ensemble des modalités d'entrée est la clé qui permet cette polyvalence sans sacrifier la robustesse. Les prochaines étapes logiques concerneront l'intégration de modèles de langage comme interface de haut niveau, permettant à terme de donner des instructions verbales à un humanoïde qui les traduirait en commandes motrices complexes.

RobotiqueActu
1 source
Apprentissage des intentions humaines à partir de démonstrations massives pour la manipulation robotique
4arXiv cs.RO 

Apprentissage des intentions humaines à partir de démonstrations massives pour la manipulation robotique

Des chercheurs ont publié MoT-HRA, un nouveau cadre d'apprentissage robotique capable d'extraire des intentions humaines à partir de vidéos brutes pour les transférer à des bras robotiques. Pour entraîner le système, l'équipe a constitué HA-2.2M, un jeu de données massif de 2,2 millions d'épisodes reconstruit à partir de vidéos hétérogènes d'humains en train de manipuler des objets. Ces données ont été traitées via un pipeline en quatre étapes : filtrage centré sur les mains, reconstruction spatiale 3D, segmentation temporelle et alignement avec du langage naturel. Le modèle décompose ensuite la manipulation en trois experts couplés : un expert vision-langage qui prédit une trajectoire 3D indépendante du corps, un expert d'intention qui modélise le mouvement de la main selon le format MANO comme prior latent, et un expert fin qui traduit cette représentation en séquences d'actions concrètes pour le robot. L'enjeu est de taille : les robots peinent aujourd'hui à généraliser leurs apprentissages hors des conditions d'entraînement, un problème connu sous le nom de "distribution shift". MoT-HRA améliore significativement la plausibilité des mouvements générés et la robustesse du contrôle précisément dans ces situations dégradées, là où les approches classiques échouent. En apprenant non pas ce que fait la main, mais pourquoi elle le fait, le système produit des comportements plus cohérents et transférables à différents robots sans nécessiter de réentraînement spécifique par plateforme. Ce travail s'inscrit dans une tendance forte de la robotique actuelle : exploiter les milliards d'heures de vidéos humaines disponibles sur internet pour former des politiques de contrôle sans recourir à des démonstrations téléopérées coûteuses. Le défi technique central est de séparer dans ces vidéos ce qui relève de l'intention (invariant au corps) de ce qui relève de la mécanique propre à chaque main ou bras. Le mécanisme de partage d'attention et de transfert clé-valeur en lecture seule utilisé dans MoT-HRA est une réponse architecturale directe à ce problème d'interférence. Les résultats sur des tâches réelles ouvrent la voie à des robots capables d'apprendre depuis YouTube autant que depuis un laboratoire.

RobotiquePaper
1 source