Aller au contenu principal
Fonctions de barrière de contrôle résolues par programmation quadratique hiérarchique pour une interaction physique sûre entre humains et robots
RobotiquearXiv cs.RO3h

Fonctions de barrière de contrôle résolues par programmation quadratique hiérarchique pour une interaction physique sûre entre humains et robots

Résumé IASource uniqueImpact UE
Source originale ↗·

Des chercheurs ont publié sur arXiv (réf. 2604.23039) une nouvelle approche pour sécuriser l'interaction physique entre humains et robots, en combinant les Fonctions de Barrière de Contrôle (CBF) avec un cadre de Programmation Quadratique Hiérarchique (HQP). L'objectif est de permettre à un robot de maintenir des comportements souhaités au point de contact avec l'humain, tout en respectant simultanément un ensemble de contraintes de sécurité parfois conflictuelles. Les expériences ont été menées sur un vrai robot redondant, c'est-à-dire un bras articulé disposant de plus de degrés de liberté que nécessaire, ce qui lui confère une flexibilité supplémentaire pour résoudre ces compromis en temps réel.

L'intérêt de cette approche réside dans sa capacité à gérer un grand nombre de tâches de sécurité sans sacrifier les performances du robot. Jusqu'ici, quand plusieurs contraintes de sécurité entraient en conflit, les systèmes existants peinaient à trouver une solution réalisable. La hiérarchisation permet de relâcher certaines contraintes de moindre priorité de façon contrôlée, évitant ainsi les blocages tout en préservant les garanties essentielles. Pour des applications comme les robots de rééducation médicale ou les cobots industriels travaillant aux côtés d'opérateurs humains, cette flexibilité représente une avancée concrète en termes de fiabilité et de déploiement dans des environnements réels.

Les Fonctions de Barrière de Contrôle sont devenues ces dernières années un outil théorique de référence pour la sécurité des systèmes autonomes, déjà appliquées au régulateur de vitesse adaptatif dans l'automobile ou à la navigation des robots quadrupèdes. Le défi persistant restait leur passage à l'échelle lorsque les tâches se multiplient et se contredisent. Ce travail s'inscrit dans un effort plus large de l'industrie robotique pour certifier formellement la sécurité des robots collaboratifs, un prérequis imposé par les régulateurs européens et les assureurs avant tout déploiement clinique ou industriel à grande échelle. Les prochaines étapes pourraient porter sur l'adaptation dynamique de la hiérarchie en fonction du contexte de l'interaction.

Impact France/UE

Les régulateurs européens imposent une certification formelle de sécurité pour les cobots médicaux et industriels avant déploiement ; cette approche CBF-HQP fournit une base théorique et expérimentale pour répondre à ces exigences de conformité.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Complémentarité par construction : approche par groupes de Lie pour les programmes quadratiques à complémentarité linéaire
1arXiv cs.RO 

Complémentarité par construction : approche par groupes de Lie pour les programmes quadratiques à complémentarité linéaire

Des chercheurs ont publié sur arXiv un nouveau solveur mathématique baptisé Marble, conçu pour résoudre une classe de problèmes d'optimisation particulièrement délicats en robotique : les programmes quadratiques avec contraintes de complémentarité linéaire, ou LCQPs. Le code est disponible en open source, implémenté en C++ avec des interfaces pour Julia et Python. L'article, référencé arXiv:2604.11991v2, propose une approche fondée sur la théorie des groupes de Lie pour contourner les limitations des solveurs existants sur ce type de problèmes. Les LCQPs interviennent au coeur de nombreux défis en robotique : modéliser le contact entre un bras manipulateur et un objet, ou gérer les phases d'appui et de décollage dans la locomotion. Ces problèmes sont non convexes et mélangent dynamique continue et événements discrets, ce qui les rend très difficiles à résoudre. Très peu de solveurs permettent aujourd'hui d'en calculer de bonnes solutions locales utilisables dans des pipelines de planification. Marble démontre sur une suite de benchmarks standardisés qu'il est compétitif face aux meilleures méthodes actuelles, et qu'il parvient à converger sur plusieurs problèmes robotiques concrets où les approches existantes échouent. L'intuition mathématique centrale du travail est que les contraintes de complémentarité forment un groupe de Lie sous relaxation infinitésimale, une structure géométrique qui permet d'effectuer l'optimisation directement sur la variété correspondante. Les auteurs introduisent une carte de rétraction numériquement stable, ce qui leur permet de paramétrer les contraintes de façon à ce qu'elles soient satisfaites par construction, éliminant les instabilités numériques classiques associées à ce type de contraintes. Cette avancée s'inscrit dans un effort plus large de la communauté robotique pour doter les systèmes autonomes de méthodes de planification capables de gérer des scénarios complexes impliquant contacts et transitions dynamiques, un verrou technique majeur pour les robots manipulateurs et les plateformes de locomotion avancées.

RobotiqueOpinion
1 source
OmniUMI : vers un apprentissage robotique ancré dans le monde physique par interaction multimodale alignée sur l'humain
2arXiv cs.RO 

OmniUMI : vers un apprentissage robotique ancré dans le monde physique par interaction multimodale alignée sur l'humain

Des chercheurs ont présenté OmniUMI, un nouveau cadre d'apprentissage robotique conçu pour dépasser les limites des systèmes actuels en intégrant des données multimodales physiquement ancrées. Là où les interfaces de type UMI existantes se limitent à des observations visuelles RGB et des trajectoires, OmniUMI capture simultanément six types de données : images RGB, profondeur, trajectoire, retour tactile, force de préhension interne et couple d'interaction externe. Ce dispositif tient dans la main et maintient une cohérence entre la phase de collecte des démonstrations humaines et le déploiement sur le robot, grâce à une conception d'embodiment partagé. Les politiques apprises reposent sur une extension de la diffusion policy intégrant ces signaux visuels, tactiles et de force, déployée via une exécution à impédance pour réguler conjointement le mouvement et le contact. Les expériences valident le système sur des tâches comme le saisissement et le dépôt sensibles à la force, l'effacement de surface interactif, et le relâchement sélectif guidé par le toucher. La portée de cette avancée tient à un problème fondamental de la robotique : les tâches impliquant un contact physique riche, comme assembler des pièces fragiles, manipuler des objets déformables ou effectuer des gestes précis avec pression calibrée, restent hors de portée des systèmes purement visuels. La vision seule ne peut pas inférer la dynamique de contact, la force exercée, ni les micro-glissements tactiles. En permettant au démonstrateur humain de percevoir et moduler naturellement ces forces via un retour bilatéral du préhenseur, OmniUMI aligne la démonstration humaine sur la réalité physique du robot, rendant les données collectées directement exploitables. Le contexte est celui d'une course à la manipulation robotique généraliste, où des laboratoires et entreprises comme Google DeepMind, Physical Intelligence ou Boston Dynamics investissent massivement. Les interfaces UMI, popularisées ces dernières années pour leur facilité de collecte de données à grande échelle, butaient précisément sur ce mur du toucher et de la force. OmniUMI ouvre une voie vers des systèmes capables d'apprendre des tâches industrielles ou médicales où la précision physique est critique, tout en conservant le paradigme de démonstration humaine qui a fait le succès des approches d'imitation à grande échelle.

RobotiqueOpinion
1 source
Agent de sécurité guidé par LLM pour la robotique embarquée avec une architecture perception-calcul-contrôle conforme ISO
3arXiv cs.RO 

Agent de sécurité guidé par LLM pour la robotique embarquée avec une architecture perception-calcul-contrôle conforme ISO

Des chercheurs ont publié une architecture permettant d'intégrer un agent de sécurité guidé par un grand modèle de langage (LLM) dans des robots embarqués fonctionnant à la périphérie du réseau, tout en respectant les normes industrielles de sécurité fonctionnelle. Le système, présenté dans une prépublication arXiv (2604.20193), repose sur une architecture perception-calcul-contrôle conforme à la norme ISO 13849. Concrètement, il convertit des règles de sécurité formulées en langage naturel en prédicats exécutables, déployés sur un environnement d'exécution hétérogène et redondant. Pour garantir la tolérance aux pannes, les chercheurs adoptent une redondance duale symétrique : deux modules indépendants fonctionnent en parallèle pour la perception, le calcul et le contrôle. Le prototype tourne sur une plateforme à double processeur RK3588, une puce ARM développée par Rockchip, et a été évalué dans des scénarios typiques d'interaction humain-robot. L'enjeu est fondamental : la sécurité fonctionnelle industrielle exige des comportements déterministes, c'est-à-dire prévisibles et reproductibles à chaque exécution, alors que la perception par IA reste intrinsèquement probabiliste. Cette incompatibilité freine depuis des années le déploiement de robots intelligents dans des espaces où des humains circulent. En atteignant le niveau ISO 13849 Catégorie 3 et Performance Level d avec du matériel grand public peu coûteux, cette approche ouvre la voie à des systèmes robotiques certifiables sans processeurs spécialisés hors de prix. Pour les intégrateurs industriels et fabricants de cobots, c'est un signal clair : la sécurité certifiable pourrait bientôt s'appliquer à bien plus large échelle. La montée en puissance des robots collaboratifs dans les usines, entrepôts et environnements de soins a rendu urgente la question de la certification. Les normes ISO 13849 définissent des niveaux de performance de PL a à PL e selon la probabilité de défaillance dangereuse ; atteindre PL d est généralement requis pour des équipements opérant à proximité directe d'humains. L'utilisation d'un LLM pour interpréter et codifier automatiquement des règles de sécurité en langage naturel est une approche originale qui pourrait simplifier radicalement la configuration de ces systèmes. La prochaine étape décisive sera la validation formelle par des organismes de certification indépendants, condition indispensable à une adoption industrielle à grande échelle.

UELes fabricants européens de cobots et intégrateurs industriels pourraient accéder à une voie de certification ISO 13849 PL d à moindre coût, sous réserve de validation par des organismes notifiés européens.

RobotiqueOpinion
1 source
CubeDAgger : apprentissage par imitation interactif pour systèmes dynamiques, avec une interaction efficace et à faible risque
4arXiv cs.RO 

CubeDAgger : apprentissage par imitation interactif pour systèmes dynamiques, avec une interaction efficace et à faible risque

Des chercheurs ont publié CubeDAgger, une nouvelle méthode d'apprentissage par imitation interactive conçue pour les systèmes robotiques dynamiques. Présentée dans un article soumis à arXiv (identifiant 2505.04897), elle s'appuie sur un cadre existant appelé EnsembleDAgger et y apporte trois améliorations distinctes : une régularisation explicite du seuil de déclenchement des corrections humaines, un mécanisme de consensus entre plusieurs candidats d'action en lieu et place du simple basculement entre expert et agent, et enfin l'injection d'un bruit coloré autorégressif dans les actions du robot pour garantir une exploration cohérente dans le temps. Les expériences réelles ont été conduites sur une tâche de ramassage avec une cuillère, un robot apprenant à exécuter ce geste correctement à partir de zéro en seulement 30 minutes d'interaction avec un expert humain. L'enjeu central que CubeDAgger cherche à résoudre est la stabilité dynamique, un problème négligé par la majorité des méthodes actuelles. Les algorithmes d'apprentissage par imitation interactive existants fonctionnent bien pour des tâches statiques, où l'expert peut intervenir ponctuellement sans perturber le comportement du robot. Mais dès que la tâche implique du mouvement continu, ramasser un objet, stabiliser une trajectoire, un basculement brutal entre le mode expert et le mode autonome provoque des à-coups mécaniques qui compromettent la sécurité et la fiabilité. CubeDAgger réduit ces discontinuités, ce qui le rend pertinent pour des applications industrielles ou médicales où la précision du geste est critique. L'apprentissage par imitation interactive, dont DAgger est le pionnier depuis 2011, reste une approche de référence pour entraîner des politiques robotiques robustes sans nécessiter des millions d'exemples. Le défi a toujours été de minimiser la charge imposée à l'expert humain tout en conservant la qualité de l'apprentissage. Les variantes récentes comme EnsembleDAgger avaient progressé sur ce point, mais butaient sur les tâches dynamiques. CubeDAgger s'inscrit dans une tendance plus large visant à rendre la robotique apprenante opérationnelle en dehors des environnements contrôlés de laboratoire, avec des horizons d'application dans la logistique, la chirurgie assistée, ou encore les robots d'assistance domestique.

RobotiqueOpinion
1 source