Aller au contenu principal
Flow Matching indépendant du temps pour un contrôle robotique génératif, adaptatif et robuste
RobotiquearXiv cs.RO2sem

Flow Matching indépendant du temps pour un contrôle robotique génératif, adaptatif et robuste

Résumé IASource uniqueImpact UE
Source originale ↗·

Des chercheurs ont publié GeCO (Generative Control as Optimization), un nouveau cadre d'apprentissage par imitation pour robots, présenté dans un article soumis à arXiv (arXiv:2603.17834). Là où les systèmes actuels basés sur la diffusion ou le flow matching consacrent un budget de calcul fixe à chaque mouvement, quelle qu'en soit la complexité, GeCO fonctionne différemment : il transforme la génération d'actions en un processus d'optimisation itérative. Concrètement, le modèle apprend un champ de vitesse stationnaire dans lequel les comportements experts forment des attracteurs stables, ce qui permet à l'inférence de s'arrêter dès convergence plutôt qu'après un nombre prédéterminé d'étapes. Le système s'intègre comme remplacement direct des têtes de flow matching existantes, notamment dans les modèles pi0-series de type Vision-Language-Action (VLA), sans nécessiter de réentraînement de l'architecture complète.

L'impact principal est double. D'un côté, GeCO alloue automatiquement plus de calcul aux situations difficiles et s'arrête plus tôt pour les mouvements simples, ce qui améliore à la fois l'efficacité et le taux de succès sur les benchmarks de simulation standards. De l'autre, la géométrie stationnaire du champ de vitesse fournit un signal de sécurité natif et sans entraînement supplémentaire : la norme du champ au point d'action optimisé reste faible pour les situations connues, et augmente significativement en présence d'anomalies ou de situations hors distribution. C'est un détecteur d'OOD (out-of-distribution) gratuit, ce qui est rare dans ce type de systèmes.

La robotique apprenante est aujourd'hui dominée par les politiques diffusion et flow matching, héritées des générateurs d'images, avec leur cortège d'étapes d'intégration fixes. Le problème de la détection de situations inconnues est un verrou majeur pour le déploiement sûr de robots en environnement réel. GeCO attaque les deux limites simultanément depuis un angle géométrique plutôt que supervisé, ce qui le distingue des approches concurrentes. Les prochaines étapes naturelles seront la validation sur matériel physique et l'intégration dans des pipelines de manipulation industrielle, domaines où l'adaptabilité computationnelle et la robustesse aux anomalies ont une valeur opérationnelle directe.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Modélisation dynamique par apprentissage automatique et contrôle robuste pour robots continus à tendons
1arXiv cs.RO 

Modélisation dynamique par apprentissage automatique et contrôle robuste pour robots continus à tendons

Des chercheurs ont publié le 29 avril 2026 une nouvelle approche pour contrôler les robots continus à tendons (TDCRs), une catégorie de robots souples dont les mouvements sont pilotés par des câbles ou tendons internes. Ces systèmes sont particulièrement difficiles à modéliser en raison de non-linéarités complexes : hystérésis de friction, compliance de transmission et comportements dynamiques qui s'amplifient sur de longues séquences de mouvements. L'équipe propose un cadre d'apprentissage différentiable combinant un modèle de dynamique haute fidélité basé sur des réseaux GRU (Gated Recurrent Units) avec une politique de contrôle neuronal entraînée de bout en bout. Le modèle intègre une connectivité bidirectionnelle multi-canaux et une prédiction résiduelle pour supprimer l'accumulation d'erreurs lors des prédictions auto-régressives sur le long terme. Les expériences ont été menées sur un robot physique à trois sections, validant les performances en conditions réelles. Cette approche dépasse les méthodes classiques basées sur le jacobien, qui génèrent des oscillations auto-entretenues problématiques pour la précision et la stabilité. En traitant le modèle de dynamique comme un "pont de gradient", la politique de contrôle apprend implicitement à compenser les non-linéarités intrinsèques du robot sans qu'il soit nécessaire de les modéliser explicitement. Le résultat est un suivi de trajectoire précis et une robustesse supérieure face à des charges utiles inconnues, c'est-à-dire des poids non intégrés lors de l'entraînement, ce qui est critique pour les applications en environnements variables. Les robots continus à tendons suscitent un intérêt croissant en chirurgie mini-invasive, inspection industrielle et manipulation en espaces confinés, précisément parce que leur souplesse leur permet d'évoluer là où les bras rigides échouent. Le principal verrou restait leur contrôle fiable dans des conditions dynamiques réelles. Cette publication s'inscrit dans une tendance plus large d'intégration de l'apprentissage automatique dans la robotique physique, où les modèles appris remplacent progressivement les équations analytiques trop simplificatrices. Les prochaines étapes pourraient inclure la généralisation à des robots à plus de sections, l'adaptation en temps réel au vieillissement mécanique des tendons, et une intégration dans des systèmes chirurgicaux assistés.

RobotiqueOpinion
1 source
Fonctions de barrière de contrôle résolues par programmation quadratique hiérarchique pour une interaction physique sûre entre humains et robots
2arXiv cs.RO 

Fonctions de barrière de contrôle résolues par programmation quadratique hiérarchique pour une interaction physique sûre entre humains et robots

Des chercheurs ont publié sur arXiv (réf. 2604.23039) une nouvelle approche pour sécuriser l'interaction physique entre humains et robots, en combinant les Fonctions de Barrière de Contrôle (CBF) avec un cadre de Programmation Quadratique Hiérarchique (HQP). L'objectif est de permettre à un robot de maintenir des comportements souhaités au point de contact avec l'humain, tout en respectant simultanément un ensemble de contraintes de sécurité parfois conflictuelles. Les expériences ont été menées sur un vrai robot redondant, c'est-à-dire un bras articulé disposant de plus de degrés de liberté que nécessaire, ce qui lui confère une flexibilité supplémentaire pour résoudre ces compromis en temps réel. L'intérêt de cette approche réside dans sa capacité à gérer un grand nombre de tâches de sécurité sans sacrifier les performances du robot. Jusqu'ici, quand plusieurs contraintes de sécurité entraient en conflit, les systèmes existants peinaient à trouver une solution réalisable. La hiérarchisation permet de relâcher certaines contraintes de moindre priorité de façon contrôlée, évitant ainsi les blocages tout en préservant les garanties essentielles. Pour des applications comme les robots de rééducation médicale ou les cobots industriels travaillant aux côtés d'opérateurs humains, cette flexibilité représente une avancée concrète en termes de fiabilité et de déploiement dans des environnements réels. Les Fonctions de Barrière de Contrôle sont devenues ces dernières années un outil théorique de référence pour la sécurité des systèmes autonomes, déjà appliquées au régulateur de vitesse adaptatif dans l'automobile ou à la navigation des robots quadrupèdes. Le défi persistant restait leur passage à l'échelle lorsque les tâches se multiplient et se contredisent. Ce travail s'inscrit dans un effort plus large de l'industrie robotique pour certifier formellement la sécurité des robots collaboratifs, un prérequis imposé par les régulateurs européens et les assureurs avant tout déploiement clinique ou industriel à grande échelle. Les prochaines étapes pourraient porter sur l'adaptation dynamique de la hiérarchie en fonction du contexte de l'interaction.

UELes régulateurs européens imposent une certification formelle de sécurité pour les cobots médicaux et industriels avant déploiement ; cette approche CBF-HQP fournit une base théorique et expérimentale pour répondre à ces exigences de conformité.

RobotiqueOpinion
1 source
Compensation de force sans contact en temps réel pour capteurs de poignet en chirurgie robotique haptique
3arXiv cs.RO 

Compensation de force sans contact en temps réel pour capteurs de poignet en chirurgie robotique haptique

Des chercheurs ont publié sur arXiv une méthode de compensation en temps réel des forces parasites affectant les capteurs force/couple montés au poignet de robots chirurgicaux, dans le cadre d'une plateforme d'entraînement appelée RoboScope. Le système présenté intègre un capteur force/couple (F/T) directement sur le poignet du bras robotisé, une configuration qui contourne les difficultés liées aux capteurs placés à l'extrémité des instruments mais qui génère en contrepartie des forces dites non-contact : gravité, biais du capteur, décalages d'installation et couples associés. Pour neutraliser ces perturbations sans sacrifier la réactivité, l'équipe propose un algorithme basé sur les moindres carrés récursifs (RLS), capable de fonctionner en continu sans phase de collecte de données préalable ni recalibrations répétées. Les résultats expérimentaux montrent une réduction des erreurs supérieure à 95 % pour les forces parasites et à 91 % pour les couples, des performances qui surpassent nettement les méthodes existantes. L'enjeu est direct : le retour haptique, c'est-à-dire la capacité à ressentir la résistance des tissus et à doser précisément la force appliquée, est une fonctionnalité absente de la grande majorité des systèmes de chirurgie robotisée actuels. Sans elle, les chirurgiens opèrent "à l'aveugle" mécaniquement, ce qui complique l'apprentissage et augmente le risque de traumatismes tissulaires lors des procédures délicates. En rendant fiable le retour haptique sur une plateforme à faible coût, cette avancée rend la formation plus réaliste et accessible à des hôpitaux ou centres de recherche ne disposant pas des budgets nécessaires aux systèmes commerciaux haut de gamme comme le Da Vinci. La chirurgie robotisée assistée connaît une expansion rapide, mais l'intégration du retour haptique reste un problème ouvert depuis des années, freinée par la complexité technique et les coûts. Les rares systèmes commerciaux qui commencent à proposer cette fonctionnalité restent inaccessibles pour la plupart des établissements de formation. RoboScope s'inscrit dans une tendance plus large de démocratisation des outils chirurgicaux avancés via des architectures open-source et abordables. La robustesse de la méthode RLS face aux variations de conditions opératoires laisse envisager une intégration dans des robots réels, au-delà du seul contexte d'entraînement.

UELes hôpitaux et centres de formation chirurgicale en France et en Europe pourraient bénéficier de plateformes d'entraînement robotique haptique accessibles et peu coûteuses, réduisant la dépendance aux systèmes commerciaux haut de gamme aujourd'hui inaccessibles à la majorité des établissements.

RobotiquePaper
1 source
MOMO : un cadre pour l'apprentissage et l'adaptation des compétences robotiques, physiques, verbales et graphiques
4arXiv cs.RO 

MOMO : un cadre pour l'apprentissage et l'adaptation des compétences robotiques, physiques, verbales et graphiques

Des chercheurs ont présenté MOMO, un framework permettant à des utilisateurs non experts de programmer et d'adapter des robots industriels sans écrire une seule ligne de code. Le système repose sur trois modalités d'interaction complémentaires : la guidance physique directe (kinesthetic teaching), les commandes en langage naturel, et une interface web graphique permettant de visualiser les trajectoires, ajuster des paramètres et déplacer des points de passage par glisser-déposer. La validation a eu lieu sur un robot industriel à 7 degrés de liberté à contrôle par couple, présenté lors du salon Automatica 2025, l'une des principales foires mondiales de robotique et d'automatisation. Ce que MOMO change concrètement, c'est la barrière entre l'opérateur et la machine. Jusqu'ici, modifier le comportement d'un robot industriel nécessitait des compétences en programmation ou l'intervention d'un intégrateur spécialisé. Avec ce framework, un technicien peut corriger une trajectoire en guidant physiquement le bras, demander verbalement une modification sémantique ("sois plus lent sur le bord droit"), ou retoucher visuellement la courbe dans un navigateur. L'architecture LLM adoptée est dite "à base d'outils" : le modèle de langage ne génère pas de code libre, mais sélectionne et paramètre des fonctions prédéfinies, ce qui limite les risques d'erreurs et de comportements imprévus sur un vrai site de production. L'article s'inscrit dans un effort de recherche plus large pour démocratiser la robotique flexible, particulièrement dans un contexte de pénurie de compétences techniques et de demande croissante de personnalisation en usine. Les cinq composants du système, détection d'intention humaine par énergie, LLM outillé, Kernelized Movement Primitives pour l'encodage du mouvement, Virtual Fixtures probabilistes et contrôle ergodique pour la finition de surface, forment une architecture modulaire. Le fait que la même approche LLM fonctionne aussi bien pour les mouvements classiques que pour le contrôle ergodique (utilisé en polissage ou peinture de surface) suggère une généralisation possible à un large spectre de tâches industrielles. Les prochaines étapes pourraient inclure des tests en conditions réelles de production et une éventuelle commercialisation via des partenariats industriels.

UELa démocratisation de la programmation robotique via interfaces multimodales pourrait bénéficier aux PME manufacturières européennes confrontées à une pénurie de compétences en automatisation industrielle.

RobotiqueOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour