Complémentarité par construction : approche par…

Fonctions de barrière de contrôle résolues par programmation quadratique hiérarchique pour une interaction physique sûre entre humains et robots

56

1arXiv cs.RO

Fonctions de barrière de contrôle résolues par programmation quadratique hiérarchique pour une interaction physique sûre entre humains et robots

Des chercheurs ont publié sur arXiv (réf. 2604.23039) une nouvelle approche pour sécuriser l'interaction physique entre humains et robots, en combinant les Fonctions de Barrière de Contrôle (CBF) avec un cadre de Programmation Quadratique Hiérarchique (HQP). L'objectif est de permettre à un robot de maintenir des comportements souhaités au point de contact avec l'humain, tout en respectant simultanément un ensemble de contraintes de sécurité parfois conflictuelles. Les expériences ont été menées sur un vrai robot redondant, c'est-à-dire un bras articulé disposant de plus de degrés de liberté que nécessaire, ce qui lui confère une flexibilité supplémentaire pour résoudre ces compromis en temps réel. L'intérêt de cette approche réside dans sa capacité à gérer un grand nombre de tâches de sécurité sans sacrifier les performances du robot. Jusqu'ici, quand plusieurs contraintes de sécurité entraient en conflit, les systèmes existants peinaient à trouver une solution réalisable. La hiérarchisation permet de relâcher certaines contraintes de moindre priorité de façon contrôlée, évitant ainsi les blocages tout en préservant les garanties essentielles. Pour des applications comme les robots de rééducation médicale ou les cobots industriels travaillant aux côtés d'opérateurs humains, cette flexibilité représente une avancée concrète en termes de fiabilité et de déploiement dans des environnements réels. Les Fonctions de Barrière de Contrôle sont devenues ces dernières années un outil théorique de référence pour la sécurité des systèmes autonomes, déjà appliquées au régulateur de vitesse adaptatif dans l'automobile ou à la navigation des robots quadrupèdes. Le défi persistant restait leur passage à l'échelle lorsque les tâches se multiplient et se contredisent. Ce travail s'inscrit dans un effort plus large de l'industrie robotique pour certifier formellement la sécurité des robots collaboratifs, un prérequis imposé par les régulateurs européens et les assureurs avant tout déploiement clinique ou industriel à grande échelle. Les prochaines étapes pourraient porter sur l'adaptation dynamique de la hiérarchie en fonction du contexte de l'interaction.

UELes régulateurs européens imposent une certification formelle de sécurité pour les cobots médicaux et industriels avant déploiement ; cette approche CBF-HQP fournit une base théorique et expérimentale pour répondre à ces exigences de conformité.

RobotiqueOpinion

1 source

Apprentissage des intentions humaines à partir de démonstrations massives pour la manipulation robotique

51

2arXiv cs.RO

Apprentissage des intentions humaines à partir de démonstrations massives pour la manipulation robotique

Des chercheurs ont publié MoT-HRA, un nouveau cadre d'apprentissage robotique capable d'extraire des intentions humaines à partir de vidéos brutes pour les transférer à des bras robotiques. Pour entraîner le système, l'équipe a constitué HA-2.2M, un jeu de données massif de 2,2 millions d'épisodes reconstruit à partir de vidéos hétérogènes d'humains en train de manipuler des objets. Ces données ont été traitées via un pipeline en quatre étapes : filtrage centré sur les mains, reconstruction spatiale 3D, segmentation temporelle et alignement avec du langage naturel. Le modèle décompose ensuite la manipulation en trois experts couplés : un expert vision-langage qui prédit une trajectoire 3D indépendante du corps, un expert d'intention qui modélise le mouvement de la main selon le format MANO comme prior latent, et un expert fin qui traduit cette représentation en séquences d'actions concrètes pour le robot. L'enjeu est de taille : les robots peinent aujourd'hui à généraliser leurs apprentissages hors des conditions d'entraînement, un problème connu sous le nom de "distribution shift". MoT-HRA améliore significativement la plausibilité des mouvements générés et la robustesse du contrôle précisément dans ces situations dégradées, là où les approches classiques échouent. En apprenant non pas ce que fait la main, mais pourquoi elle le fait, le système produit des comportements plus cohérents et transférables à différents robots sans nécessiter de réentraînement spécifique par plateforme. Ce travail s'inscrit dans une tendance forte de la robotique actuelle : exploiter les milliards d'heures de vidéos humaines disponibles sur internet pour former des politiques de contrôle sans recourir à des démonstrations téléopérées coûteuses. Le défi technique central est de séparer dans ces vidéos ce qui relève de l'intention (invariant au corps) de ce qui relève de la mécanique propre à chaque main ou bras. Le mécanisme de partage d'attention et de transfert clé-valeur en lecture seule utilisé dans MoT-HRA est une réponse architecturale directe à ce problème d'interférence. Les résultats sur des tâches réelles ouvrent la voie à des robots capables d'apprendre depuis YouTube autant que depuis un laboratoire.

RobotiquePaper

1 source

MOMO : un cadre pour l'apprentissage et l'adaptation des compétences robotiques, physiques, verbales et graphiques

46

3arXiv cs.RO

MOMO : un cadre pour l'apprentissage et l'adaptation des compétences robotiques, physiques, verbales et graphiques

Des chercheurs ont présenté MOMO, un framework permettant à des utilisateurs non experts de programmer et d'adapter des robots industriels sans écrire une seule ligne de code. Le système repose sur trois modalités d'interaction complémentaires : la guidance physique directe (kinesthetic teaching), les commandes en langage naturel, et une interface web graphique permettant de visualiser les trajectoires, ajuster des paramètres et déplacer des points de passage par glisser-déposer. La validation a eu lieu sur un robot industriel à 7 degrés de liberté à contrôle par couple, présenté lors du salon Automatica 2025, l'une des principales foires mondiales de robotique et d'automatisation. Ce que MOMO change concrètement, c'est la barrière entre l'opérateur et la machine. Jusqu'ici, modifier le comportement d'un robot industriel nécessitait des compétences en programmation ou l'intervention d'un intégrateur spécialisé. Avec ce framework, un technicien peut corriger une trajectoire en guidant physiquement le bras, demander verbalement une modification sémantique ("sois plus lent sur le bord droit"), ou retoucher visuellement la courbe dans un navigateur. L'architecture LLM adoptée est dite "à base d'outils" : le modèle de langage ne génère pas de code libre, mais sélectionne et paramètre des fonctions prédéfinies, ce qui limite les risques d'erreurs et de comportements imprévus sur un vrai site de production. L'article s'inscrit dans un effort de recherche plus large pour démocratiser la robotique flexible, particulièrement dans un contexte de pénurie de compétences techniques et de demande croissante de personnalisation en usine. Les cinq composants du système, détection d'intention humaine par énergie, LLM outillé, Kernelized Movement Primitives pour l'encodage du mouvement, Virtual Fixtures probabilistes et contrôle ergodique pour la finition de surface, forment une architecture modulaire. Le fait que la même approche LLM fonctionne aussi bien pour les mouvements classiques que pour le contrôle ergodique (utilisé en polissage ou peinture de surface) suggère une généralisation possible à un large spectre de tâches industrielles. Les prochaines étapes pourraient inclure des tests en conditions réelles de production et une éventuelle commercialisation via des partenariats industriels.

UELa démocratisation de la programmation robotique via interfaces multimodales pourrait bénéficier aux PME manufacturières européennes confrontées à une pénurie de compétences en automatisation industrielle.

RobotiqueOpinion

1 source

Approcher puis agir : séquençage comportemental pour une manipulation robotique humanoïde

53

4arXiv cs.RO

Approcher puis agir : séquençage comportemental pour une manipulation robotique humanoïde

Des chercheurs ont publié Move-Then-Operate (MTO), un nouveau cadre d'apprentissage pour la manipulation robotique qui s'inspire directement du fonctionnement du cerveau humain. L'approche sépare explicitement chaque geste robotique en deux phases distinctes : une phase de déplacement grossier vers la cible (move), puis une phase d'interaction de précision avec l'objet (operate). Pour orchestrer ce découpage, le système utilise une architecture à double expert, pilotée par un sélecteur de phase entraînable. Les étiquettes de phase sont générées automatiquement via un pipeline basé sur un modèle de langage multimodal, qui analyse des indicateurs contextuels légers comme la vitesse de l'effecteur terminal et la décomposition des sous-tâches. Sur le benchmark RoboTwin2, MTO atteint un taux de réussite moyen de 68,9 %, surpassant le modèle de référence monolithique pi zéro de 24 points de pourcentage, tout en atteignant ses performances maximales en 40 % moins d'étapes d'entraînement. Ces résultats ont une portée significative pour la robotique industrielle et domestique. En isolant structurellement la phase de navigation de la phase de manipulation fine, MTO parvient à égaler, voire dépasser, des modèles entraînés sur dix fois plus de données. Cette efficacité d'apprentissage représente un avantage économique et pratique considérable : moins de données coûteuses à collecter, des cycles d'entraînement plus courts, et des robots capables de tâches de haute précision comme assembler des composants délicats, manipuler des objets fragiles ou effectuer des gestes médicaux assistés. La robotique moderne bute depuis des années sur le problème des politiques monolithiques, ces systèmes qui tentent d'apprendre tous les comportements moteurs dans un seul modèle unifié, sans distinguer les régimes dynamiques fondamentalement différents que sont le déplacement et la manipulation précise. Des frameworks comme pi zéro de Physical Intelligence ont marqué des avancées, mais restent limités par cette indifférenciation. MTO s'inscrit dans une tendance plus large visant à introduire des biais structurels inspirés de la cognition humaine dans les architectures robotiques. Les prochaines étapes naturelles incluent la validation sur des robots physiques réels et l'extension à des environnements non structurés, là où la généralisation reste le défi central du domaine.

RobotiqueOpinion

1 source

Complémentarité par construction : approche par groupes de Lie pour les programmes quadratiques à complémentarité linéaire

À lire aussi

Fonctions de barrière de contrôle résolues par programmation quadratique hiérarchique pour une interaction physique sûre entre humains et robots

Apprentissage des intentions humaines à partir de démonstrations massives pour la manipulation robotique

MOMO : un cadre pour l'apprentissage et l'adaptation des compétences robotiques, physiques, verbales et graphiques

Approcher puis agir : séquençage comportemental pour une manipulation robotique humanoïde