Robot Inference Asynchrone: Découplage Prédiction…

Navigation autonome d'un robot par apprentissage structurel en ligne et planification par inférence active

47

1arXiv cs.RO

Navigation autonome d'un robot par apprentissage structurel en ligne et planification par inférence active

Des chercheurs de l'université de Gand ont publié sur arXiv un système de navigation robotique autonome baptisé AIMAPP (Active Inference MAPping and Planning), capable d'explorer des environnements inconnus sans carte préalable ni phase d'entraînement. Le robot construit en temps réel une carte topologique sparse, apprend dynamiquement les transitions d'états et planifie ses actions en minimisant ce que les auteurs appellent l'Énergie Libre Attendue (Expected Free Energy), un principe emprunté à la théorie de l'inférence active. Le système est compatible avec ROS, indépendant du type de capteurs utilisés et fonctionne en mode entièrement auto-supervisé, sans aucune intervention humaine préalable. L'intérêt principal d'AIMAPP réside dans sa robustesse face aux conditions réelles d'opération : il continue de fonctionner même en cas de défaillance partielle des capteurs ou de dérive odométrique cumulative, deux problèmes qui paralysent souvent les systèmes classiques de navigation SLAM. Contrairement aux approches par apprentissage profond qui nécessitent d'importants volumes de données annotées, AIMAPP s'adapte en ligne à des environnements changeants et à des observations ambiguës. Dans des évaluations conduites à grande échelle, en environnements réels et simulés, le système surpasse ou égale les planificateurs de référence actuels, ouvrant la voie à des robots déployables dans des contextes non structurés comme des entrepôts, des zones sinistrées ou des espaces extérieurs. L'inférence active est un cadre théorique issu des neurosciences computationnelles, initialement développé pour modéliser la perception et l'action chez les êtres vivants. Son application à la robotique est encore émergente, mais AIMAPP représente une des implémentations les plus complètes à ce jour, combinant cartographie, localisation et prise de décision dans un modèle génératif unifié. Le code est disponible publiquement sur GitHub (decide-ugent/aimapp), ce qui pourrait accélérer son adoption dans la communauté robotique. La prochaine étape naturelle sera de tester le système sur des flottes de robots opérant en parallèle, ainsi que dans des environnements dynamiques peuplés d'humains.

UERecherche conduite par l'Université de Gand (Belgique), le code open-source publié sur GitHub est directement exploitable par les laboratoires et industriels européens actifs en robotique autonome.

💬 Pas de données annotées, pas de carte préalable, et ça tient quand les capteurs flanchent, là où SLAM se plante souvent. C'est le problème qu'on n'arrivait pas à régler proprement depuis des années en robotique mobile. Le code est sur GitHub et compatible ROS, donc les labos n'ont pas besoin de repartir de zéro.

RobotiquePaper

1 source

AsyncShield : un adaptateur edge prêt à l'emploi pour la navigation VLA asynchrone dans le cloud

44

2arXiv cs.RO

AsyncShield : un adaptateur edge prêt à l'emploi pour la navigation VLA asynchrone dans le cloud

Des chercheurs ont présenté AsyncShield, un module de contrôle conçu pour corriger les problèmes de latence qui affectent les robots mobiles pilotés par des modèles de vision-langage-action (VLA) hébergés dans le cloud. Ces modèles, capables de généraliser sans entraînement préalable sur de nouvelles tâches, sont devenus une référence en robotique, mais leur taille massive, plusieurs dizaines de milliards de paramètres, impose leur déploiement à distance. AsyncShield s'intercale entre le cloud et le robot comme un adaptateur léger, sans modifier le modèle fondamental, et corrige en temps réel le décalage entre les instructions reçues et la position réelle du robot au moment de leur exécution. Le problème résolu est concret et critique : quand un robot mobile reçoit une instruction générée plusieurs centaines de millisecondes plus tôt, sa position a changé. L'intention du modèle, tourner à gauche, avancer de 50 cm, est exprimée dans un référentiel spatial désormais obsolète, ce qui peut provoquer des collisions. AsyncShield convertit ce décalage temporel en un offset spatial calculable par transformation cinématique, restituant l'intention géométrique d'origine du modèle VLA. Un algorithme d'apprentissage par renforcement contraint (PPO-Lagrangian sur un processus de décision de Markov contraint) arbitre ensuite dynamiquement entre la fidélité à cette intention et les contraintes de sécurité physique imposées par le LiDAR embarqué, qui détecte les obstacles à haute fréquence. L'enjeu dépasse le cadre académique : à mesure que les robots de livraison, d'entrepôt ou d'assistance domestique s'appuient sur des modèles fondamentaux cloud, la fiabilité de la connexion réseau devient un facteur de sécurité directement lié aux accidents physiques. AsyncShield propose une réponse modulaire, une interface de sous-objectif standardisée, une randomisation de domaine et une inflation du rayon de collision, qui lui permet de fonctionner sans réentraînement sur différents robots et environnements. Les expériences en simulation et en conditions réelles confirment une amélioration du taux de succès et de la sécurité physique, ouvrant la voie à un déploiement cloud de VLA dans des environnements dynamiques sans attendre que la latence réseau soit résolue côté infrastructure.

RobotiqueActu

1 source

☕️ Amazon s’offre la startup Fauna Robotics et son robot dédié aux interactions humaines

43

3Next INpact

☕️ Amazon s’offre la startup Fauna Robotics et son robot dédié aux interactions humaines

Amazon a acquis Fauna Robotics, une startup new-yorkaise fondée en 2024 et financée à hauteur de 30 millions de dollars. L'équipe de 50 personnes développe Sprout, un robot humanoïde de 107 cm et 22,7 kg présenté officiellement le 27 janvier 2026. Doté de 29 degrés de liberté, d'une interface vocale naturelle et d'un design arrondi, Sprout est conçu pour interagir avec des humains dans des environnements comme l'hôtellerie, le commerce ou l'enseignement. Les deux cofondateurs et l'ensemble des équipes rejoignent la division robotique d'Amazon. Cette acquisition marque un tournant dans la stratégie robotique d'Amazon, jusqu'ici concentrée sur la logistique et le transport. Avec Sprout, le géant du e-commerce signale un intérêt renouvelé pour la robotique de service à la personne — un marché potentiellement immense, mais techniquement difficile. Amazon espère capitaliser sur sa relation de confiance établie avec des millions de foyers via ses activités retail et ses appareils connectés pour introduire des robots directement dans les espaces de vie et de travail. Ce n'est pas la première incursion d'Amazon dans la robotique personnelle : Astro, son robot domestique lancé en 2021, s'était soldé par un échec commercial et technique. L'acquisition de Fauna Robotics, qui fait suite à celle de la startup suisse Rivr spécialisée dans la livraison autonome, témoigne d'une volonté persistante de conquérir ce terrain malgré les déconvenues passées.

RobotiqueOpinion

1 source

Les modèles vision-langage-action en robotique : panorama des jeux de données, benchmarks et moteurs de données

46

4arXiv cs.RO

Les modèles vision-langage-action en robotique : panorama des jeux de données, benchmarks et moteurs de données

Une équipe de chercheurs a publié sur arXiv (référence 2604.23001) une analyse exhaustive de l'état des données dans les modèles Vision-Langage-Action (VLA) appliqués à la robotique. Ces modèles, qui permettent à un robot de percevoir son environnement visuel, d'interpréter des instructions en langage naturel et d'exécuter des actions physiques, connaissent des progrès spectaculaires depuis deux ans. Pourtant, selon les auteurs, le vrai goulot d'étranglement n'est pas l'architecture des modèles : c'est l'infrastructure des données. L'étude passe en revue trois dimensions clés, les jeux de données, les benchmarks d'évaluation, et les moteurs de génération de données, en cartographiant systématiquement leurs forces et leurs lacunes. Ce travail met en lumière un problème fondamental qui freine toute la discipline : collecter des données robotiques de haute fidélité coûte extrêmement cher, ce qui pousse les équipes vers des données synthétiques moins réalistes. Les benchmarks actuels, censés mesurer les capacités des robots, peinent à évaluer deux compétences pourtant cruciales, la généralisation compositionnelle (combiner des tâches apprises pour en résoudre de nouvelles) et le raisonnement sur des séquences longues. Autrement dit, les robots paraissent performants dans les tests, mais restent fragiles face à des situations légèrement différentes de celles rencontrées lors de l'entraînement. Pour les industriels et les laboratoires qui investissent massivement dans la robotique autonome, ce décalage entre métriques et réalité représente un risque concret. Le domaine de l'IA incarnée (embodied AI) est aujourd'hui dominé par des acteurs comme Google DeepMind, Meta, Physical Intelligence ou encore des équipes universitaires qui rivalisent pour entraîner des robots généralistes. Les auteurs identifient quatre défis ouverts : aligner les représentations visuelles et textuelles, améliorer la supervision multimodale, mieux évaluer le raisonnement, et générer des données à grande échelle sans perdre en réalisme physique. Leur conclusion est nette : traiter l'infrastructure de données comme un objet de recherche à part entière, et non comme un arrière-plan technique, est la condition pour que les prochaines générations de VLA tiennent leurs promesses hors des laboratoires.

RobotiqueOpinion

1 source

Robot Inference Asynchrone: Découplage Prédiction et Exécution d'Actions

À lire aussi

Navigation autonome d'un robot par apprentissage structurel en ligne et planification par inférence active

AsyncShield : un adaptateur edge prêt à l'emploi pour la navigation VLA asynchrone dans le cloud

☕️ Amazon s’offre la startup Fauna Robotics et son robot dédié aux interactions humaines

Les modèles vision-langage-action en robotique : panorama des jeux de données, benchmarks et moteurs de données