Fausse faisabilité dans le MPC à impédance variable…

Des actions à la compréhension : interprétabilité conformale des concepts temporels dans les agents LLM

47

1arXiv cs.RO

Des actions à la compréhension : interprétabilité conformale des concepts temporels dans les agents LLM

Des chercheurs ont publié un article (arXiv:2604.19775) présentant un nouveau cadre d'interprétabilité pour les agents basés sur des grands modèles de langage (LLM). Baptisé "conformal interpretability framework for temporal tasks", ce système combine la modélisation des récompenses étape par étape avec la prédiction conforme, une méthode statistique rigoureuse, pour étiqueter les représentations internes du modèle à chaque instant : succès, échec ou dérive du raisonnement. Des sondes linéaires sont ensuite entraînées sur ces représentations afin d'identifier des directions latentes dans l'espace d'activation du modèle, des vecteurs qui correspondent à des notions cohérentes de réussite ou d'échec. Les expériences ont été menées sur deux environnements interactifs simulés, ScienceWorld et AlfWorld, et confirment que ces concepts temporels sont linéairement séparables. Cette capacité à "lire" ce qui se passe à l'intérieur d'un agent LLM en cours d'action représente une avancée concrète pour la fiabilité des systèmes autonomes. Jusqu'ici, les agents capables de planification multi-étapes restaient des boîtes noires : impossible de savoir, avant la fin d'une tâche, si le modèle était en train de dériver ou de raisonner correctement. Ce cadre ouvre la voie à une détection précoce des défaillances, mais aussi à des interventions actives : les auteurs montrent des résultats préliminaires indiquant qu'il est possible de "piloter" l'agent vers les directions de succès identifiées, améliorant ainsi ses performances en cours d'exécution. L'interprétabilité des LLM est devenue l'un des chantiers les plus actifs de la recherche en IA, notamment sous la pression des exigences de transparence portées par des régulateurs comme la Commission européenne. Ce travail s'inscrit dans un mouvement plus large qui cherche à dépasser la simple observation des sorties pour comprendre les mécanismes internes, en particulier dans des tâches séquentielles où l'erreur peut se propager et s'amplifier. Les outils développés ici pourraient à terme être intégrés dans des systèmes de supervision d'agents déployés dans des contextes critiques, que ce soit en robotique, en assistance médicale ou en automatisation industrielle.

UECe cadre d'interprétabilité pourrait faciliter la conformité à l'AI Act européen, qui impose des exigences de transparence et d'explicabilité pour les systèmes d'IA à haut risque déployés dans l'UE.

RecherchePaper

1 source

De la cinématique à la dynamique : apprendre à affiner des plans hybrides pour une exécution physiquement faisable

40

2arXiv cs.RO

De la cinématique à la dynamique : apprendre à affiner des plans hybrides pour une exécution physiquement faisable

Une équipe de chercheurs présente dans un préprint arXiv (2604.12474, avril 2026) une méthode d'apprentissage par renforcement (RL) conçue pour corriger les trajectoires générées par des planificateurs hybrides temporels avant exécution réelle sur un robot. Le problème central est classique : lorsqu'un robot doit traverser une séquence de régions spatiales en respectant des contraintes de délais, de fenêtres temporelles et de limites en vitesse ou accélération, les planificateurs hybrides actuels modélisent le mouvement via des dynamiques linéaires du premier ordre (cinématique pure), sans tenir compte des contraintes physiques réelles du système. Il en résulte des plans qui sont logiquement valides mais dynamiquement infaisables. Les auteurs formalisent ce problème de raffinement comme un processus de décision markovien (MDP) intégrant explicitement des contraintes analytiques du second ordre (accélération, couple) et entraînent un agent RL en espace continu pour transformer le plan initial en une trajectoire exécutable. L'intérêt pratique est direct pour les intégrateurs et les équipes robotique : le sim-to-real gap le plus coûteux n'est souvent pas dans la perception ou la préhension, mais dans le suivi de trajectoire. Un plan validé par un planificateur symbolique peut générer des couples impossibles ou des profils de vitesse non bornés, forçant les équipes terrain à retoucher les trajectoires à la main ou à surcontraindre le planificateur. La méthode proposée agit comme une couche de post-traitement apprenante qui récupère la faisabilité physique de manière fiable, sans rejeter la séquence d'actions de haut niveau, et sans nécessiter une re-planification complète. Cela positionne l'approche comme un outil de robustification entre le niveau symbolique et le contrôleur bas niveau, un segment peu adressé dans la littérature. Les planificateurs hybrides temporels comme PDDL+ ou ENHSP tentent depuis une décennie d'intégrer la dynamique continue dans la planification symbolique, avec des résultats limités dès que les modèles s'éloignent de la linéarité. Les approches concurrentes incluent le MPC (Model Predictive Control) et les méthodes de trajectory optimization (iLQR, MPPI), mais elles supposent généralement un plan discret déjà fixé ou ignorent les contraintes temporelles symboliques. La contribution ici est leur combinaison explicite via RL. Le papier reste au stade de la preuve de concept sur des scénarios de navigation structurés ; les prochaines étapes naturelles seraient la validation sur hardware avec des dynamiques plus riches (bras manipulateurs, humanoïdes) et des benchmarks comparatifs contre MPC sur des horizons longs.

RecherchePaper

1 source

Améliorer la stabilité des robots mobiles sur terrain accidenté grâce à la surveillance des vibrations

49

3Robotics Business Review

Améliorer la stabilité des robots mobiles sur terrain accidenté grâce à la surveillance des vibrations

Des ingénieurs spécialisés en robotique mobile publient un retour d'expérience terrain démontrant que la surveillance vibratoire permet de prédire les instabilités d'un véhicule terrestre non habité (UGV) avant que les capteurs visuels ne les détectent. Lors d'un essai avec un UGV de taille intermédiaire sur sol accidenté - quelques pierres, légère inclinaison - l'engin a basculé malgré une image caméra jugée correcte et un scan lidar ne signalant aucun danger. Des tests comparatifs ont ensuite couvert trois surfaces : terre compacte (signal vibratoire stable, faible amplitude), gravier meuble (signal chaotique, pics haute fréquence) et sable mou (oscillations lentes, basse fréquence). La distinction est opérationnelle : les pics haute fréquence indiquent des impacts avec roches ou débris susceptibles de provoquer un transfert de charge brutal, tandis que les oscillations basse fréquence signalent une perte progressive de sustentation (roue qui s'enfonce ou glisse). Dans un test de type rover, une couche de sable masquait des roches enchâssées invisibles aux caméras et au lidar : l'IMU a détecté les pics vibratoires correspondants avant que le robot n'atteigne physiquement la zone critique. Ce que ces résultats remettent en cause, c'est la domination des architectures de navigation purement visuelles - caméras, lidar, SLAM - dans les stacks robotiques actuels. Ces systèmes cartographient l'espace mais ne prédisent pas la réponse mécanique du sol à la charge : un terrain peut paraître compact et se comporter comme de la poudre sous le poids d'un UGV de plusieurs dizaines de kilos. La surveillance vibratoire, fondée sur des capteurs inertiels (IMU) et accéléromètres embarqués, apporte une rétroaction proprioceptive : le robot ressent le terrain plutôt que de seulement le voir. Pour un intégrateur ou un COO industriel déployant des AMR ou des UGV en milieu extérieur non structuré, l'argument économique est direct - réduire les incidents de basculement sans alourdir la pile de perception externe ni ajouter de capteurs coûteux. La valeur tient dans l'exploitation analytique de signaux déjà présents sur toute plateforme équipée d'un IMU standard. Ces travaux s'inscrivent dans une tendance active depuis plusieurs années en robotique quadrupède - Boston Dynamics Spot, ANYmal d'ANYbotics, recherches de DeepMind sur la locomotion adaptative - mais encore peu transposée aux UGV à roues. Les approches équivalentes sont explorées par Clearpath Robotics (Husky, Warthog), AGCO pour l'agriculture autonome, et des spécialistes du tout-terrain comme Neobotix ou Robopec en Europe. En France, le LAAS-CNRS dispose d'un historique de recherche sur la navigation tout-terrain qui rejoint cette problématique. Il convient de noter que l'article ne mentionne ni produit commercialisé ni timeline de déploiement : il s'agit d'un retour d'expérience méthodologique, pas d'une annonce produit. Les prochaines étapes naturelles seraient l'intégration de ces signaux vibratoires dans des contrôleurs adaptatifs temps réel et leur fusion formelle avec les planificateurs de trajectoire existants, notamment pour les applications de livraison autonome et d'inspection en milieu dégradé.

UELes intégrateurs européens de robots mobiles tout-terrain, notamment Neobotix et Robopec, et le LAAS-CNRS disposent d'une base de recherche directement exploitable pour intégrer la surveillance vibratoire dans leurs stacks de navigation UGV extérieur.

RecherchePaper

1 source

Analyse cinématique des degrés de liberté de la paume pour améliorer l'opposabilité du pouce dans les mains robotiques

51

4arXiv cs.RO

Analyse cinématique des degrés de liberté de la paume pour améliorer l'opposabilité du pouce dans les mains robotiques

Des chercheurs ont soumis sur arXiv (identifiant 2604.22283) une analyse cinématique du rôle des degrés de liberté (DoF) palmaires dans l'opposabilité du pouce au sein d'une main robotique à cinq doigts. Le modèle étudié intègre un pouce à 5 DoF et quatre doigts disposant chacun de 3 à 4 DoF, avec un mouvement palmaire introduit entre les doigts adjacents. Pour quantifier l'interaction pouce-doigt, les auteurs calculent un volume d'espace de travail partagé à partir de régions d'accessibilité voxelisées en bout de doigts. Sept configurations sont évaluées : certaines augmentent le total de DoF, d'autres le maintiennent constant en redistribuant des DoF des doigts vers la paume. Les résultats montrent que les DoF palmaires améliorent significativement l'opposabilité, notamment pour l'annulaire et l'auriculaire, non en étendant leur portée individuelle mais en repositionnant leur point d'ancrage à la base. Ce mécanisme est distinct de celui produit par les DoF de doigt, ce qui invalide l'hypothèse souvent implicite que les deux sont interchangeables lors de la conception. En revanche, lorsque le nombre total de DoF est contraint, cas quasi-universel dans les mains robotiques industrielles pour des raisons de coût et de complexité mécanique, la redistribution vers la paume crée des compromis entre l'expansion de l'espace de travail partagé et la redondance cinématique. L'étude propose un cadre d'évaluation quantitatif utilisable sans modèle d'objet ni de contact, ce qui simplifie l'exploration de l'espace de conception en phase amont. La conception des mains robotiques polyvalentes reste l'un des verrous majeurs de la robotique humanoïde et dextre. Des acteurs comme Shadow Robot, DexHand, Inspire Robots et le projet LEAP Hand (Carnegie Mellon) ont chacun fait des choix différents sur la répartition paume-doigt. Cette contribution s'inscrit dans une tendance plus large vers des effecteurs anthropomorphes capables de manipulation fine, nécessaires aux architectures VLA (Vision-Language-Action) qui supposent une morphologie proche de la main humaine. L'étude reste purement théorique, aucun prototype physique ni partenariat industriel n'est mentionné, et ses lignes directrices devront être validées expérimentalement, notamment par l'intégration de modèles de contact et de dynamique de préhension.

RecherchePaper

1 source

Fausse faisabilité dans le MPC à impédance variable pour la locomotion sur pattes

À lire aussi

Des actions à la compréhension : interprétabilité conformale des concepts temporels dans les agents LLM

De la cinématique à la dynamique : apprendre à affiner des plans hybrides pour une exécution physiquement faisable

Améliorer la stabilité des robots mobiles sur terrain accidenté grâce à la surveillance des vibrations

Analyse cinématique des degrés de liberté de la paume pour améliorer l'opposabilité du pouce dans les mains robotiques