Aller au contenu principal
Système ouvert de bout en bout pour la navigation autonome de robots en conditions réelles
RobotiquearXiv cs.RO6sem

Système ouvert de bout en bout pour la navigation autonome de robots en conditions réelles

Résumé IASource uniqueImpact UE
Source originale ↗·

Des chercheurs ont présenté un système embarqué léger et à architecture ouverte permettant à un robot quadrupède de naviguer de manière autonome dans des environnements réels, inconnus et dynamiques, sans apprentissage préalable spécifique à ces lieux. Déployé sur un robot Unitree Go2 à quatre pattes, le système atteint un taux de réussite supérieur à 88 % dans plusieurs environnements intérieurs testés. Il repose sur ROS2 comme middleware de communication entre les différents composants embarqués, et accepte des instructions de navigation formulées en langage naturel. Les capteurs du robot alimentent en continu un système de localisation et de cartographie, qui construit des graphes de scènes hiérarchiques enrichis de sémantique ouverte, c'est-à-dire capables d'identifier des objets sans liste prédéfinie. Un planificateur basé sur un grand modèle de langage (LLM) exploite ces graphes pour générer et adapter des plans d'action en temps réel, au fur et à mesure que la scène évolue.

Ce résultat est significatif car la navigation autonome en environnement réel reste un problème difficile que la majorité des systèmes actuels ne résolvent qu'en simulation, là où les conditions sont contrôlées et les incertitudes absentes. Le fait qu'un robot puisse interpréter une consigne en langue naturelle, construire une représentation sémantique de son environnement à la volée et s'y adapter dynamiquement ouvre la voie à des déploiements pratiques dans des bâtiments industriels, des entrepôts, des hôpitaux ou des espaces publics, sans configuration manuelle préalable.

La robotique autonome bute depuis des années sur quatre obstacles fondamentaux : la perception imparfaite, l'observabilité partielle, l'incertitude de localisation et les contraintes de sécurité. L'intégration des LLM comme couche de planification symbolique, combinée à une cartographie sémantique continue, représente une approche émergente qui capitalise sur les progrès récents en traitement du langage naturel et en vision par ordinateur. Ce travail s'inscrit dans une tendance plus large visant à doter les robots de capacités de raisonnement général plutôt que de comportements pré-programmés, un chantier sur lequel rivalisent des équipes académiques et des acteurs industriels comme Boston Dynamics, Figure AI ou Agility Robotics.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

L'IA physique soulève des questions de gouvernance pour les systèmes autonomes
1AI News 

L'IA physique soulève des questions de gouvernance pour les systèmes autonomes

La convergence de l'intelligence artificielle et des systèmes physiques pose des questions de gouvernance inédites pour les entreprises, les régulateurs et les ingénieurs. En 2024, la Fédération internationale de la robotique recensait 542 000 robots industriels installés dans le monde, soit plus du double du niveau enregistré dix ans plus tôt. Les projections tablent sur 575 000 unités en 2025 et plus de 700 000 d'ici 2028. Dans ce contexte, le marché de ce que les analystes appellent désormais la "Physical AI" -- robotique, edge computing et machines autonomes -- était estimé à 81,64 milliards de dollars en 2025 par Grand View Research, avec des projections atteignant 960,38 milliards en 2033. En mars 2025, Google DeepMind a franchi une étape concrète en lançant Gemini Robotics et Gemini Robotics-ER, deux modèles construits sur Gemini 2.0 et conçus pour le contrôle direct de robots et le raisonnement spatial. En avril 2026, une nouvelle version, Gemini Robotics-ER 1.6, a été mise en préversion via l'API Gemini, avec des capacités renforcées de planification de tâches, de détection de succès et de raisonnement par étapes intermédiaires. L'enjeu dépasse largement celui de l'automatisation logicielle classique. Lorsqu'un modèle de langage produit une réponse incorrecte, l'erreur reste dans le domaine informationnel. Lorsqu'un modèle piloté un robot, une sortie erronée peut se traduire par un mouvement physique dans un environnement partagé avec des humains ou connecté à des équipements industriels critiques. Google DeepMind identifie trois propriétés fondamentales pour des robots véritablement utiles : la généralité (capacité à traiter des objets et environnements inconnus), l'interactivité (adaptation aux instructions humaines et aux conditions changeantes), et la dextérité (précision des gestes physiques). Des systèmes comme Gemini Robotics peuvent suivre des instructions en langage naturel et exécuter des séquences complexes -- plier du papier, emballer des objets, manipuler des éléments jamais vus à l'entraînement. Mais cette même flexibilité complique la définition de limites de sécurité claires et de procédures d'arrêt d'urgence. Derrière la performance technique se profile un problème de gouvernance systémique encore non résolu. Contrairement aux logiciels, les systèmes physiques autonomes opèrent dans des espaces réels, soumis à des normes de sécurité industrielles, de responsabilité civile et de certification qui n'ont pas été conçues pour des agents capables de raisonner et de décider de façon autonome. La mise à disposition de Gemini Robotics-ER 1.6 via l'API Gemini rapproche le développement de ces systèmes des environnements de tests accessibles aux développeurs, mais transfère aussi une partie de la responsabilité vers les intégrateurs. Le secteur se retrouve face à une question centrale : qui valide, surveille et peut arrêter un agent physique lorsque son comportement s'écarte des limites prévues ? Les réponses réglementaires et industrielles à cette question seront déterminantes pour le déploiement à grande échelle de la Physical AI dans les prochaines années.

UELes industriels et régulateurs européens devront réviser les cadres de responsabilité civile, de certification et de sécurité des machines pour couvrir des agents physiques autonomes capables de raisonner, un vide que l'AI Act actuel n'adresse pas encore directement.

RobotiqueOpinion
1 source
ANCHOR : système en boucle fermée ancré physiquement pour robots mobiles de service à domicile
2arXiv cs.RO 

ANCHOR : système en boucle fermée ancré physiquement pour robots mobiles de service à domicile

Des chercheurs ont publié sur arXiv un nouveau cadre logiciel baptisé ANCHOR, conçu pour rendre les robots de service à domicile nettement plus fiables lors de tâches complexes en environnement réel. Testé sur 60 essais avec de vrais robots dans des maisons inconnues, ANCHOR a permis de faire passer le taux de réussite des tâches de 53,3 % à 71,7 %, tout en atteignant un taux de récupération de 71,4 % face à des perturbations imprévues. Le système repose sur trois mécanismes : une planification ancrée physiquement qui vérifie l'état réel de la scène après chaque action, un alignement de la base mobile qui garantit que le robot peut effectivement saisir un objet depuis l'endroit où il s'est positionné, et un système de récupération hiérarchique qui localise les erreurs au bon niveau plutôt que de tout replannifier à zéro. Ces résultats sont significatifs parce qu'ils s'attaquent à un problème concret qui bloque le déploiement domestique des robots depuis des années : non pas l'incapacité à reconnaître les objets, mais l'incohérence entre ce que le robot a planifié symboliquement et la réalité physique changeante de l'environnement. Le problème dit "arrived but inoperable", le robot arrive devant l'objet mais ne peut pas le saisir parce qu'il s'est mal positionné, est l'un des échecs les plus frustrants et les plus courants. ANCHOR le corrige en intégrant les contraintes cinématiques dès la phase de navigation. La manipulation mobile en environnement ouvert est un défi de longue date en robotique domestique. Des systèmes comme SayCan d'Alphabet ou les travaux de recherche de Boston Dynamics ont montré qu'il est possible de combiner LLM et robots physiques, mais la robustesse en conditions réelles restait le maillon faible. ANCHOR s'inscrit dans une tendance récente qui consiste à ne pas faire confiance aux seules cartes sémantiques pré-scannées, qui deviennent obsolètes dès qu'un objet est déplacé, et à ancrer chaque décision dans l'état physique vérifiable du moment. Les prochaines étapes probables seront l'intégration avec des modèles de vision-langage plus récents et des tests à plus grande échelle.

RobotiqueOpinion
1 source
RecoverFormer : récupération en boucle fermée avec conscience des contacts pour robots humanoïdes
3arXiv cs.RO 

RecoverFormer : récupération en boucle fermée avec conscience des contacts pour robots humanoïdes

Des chercheurs ont présenté RecoverFormer, un système de contrôle entièrement automatisé permettant aux robots humanoïdes de récupérer leur équilibre après des chutes ou des poussées imprévues. Publié sur arXiv (2604.22911), ce travail introduit une politique d'apprentissage bout-en-bout testée sur le robot Unitree G1 dans le simulateur MuJoCo. L'architecture repose sur un transformeur causal analysant les 50 dernières étapes d'observation du robot, combiné à deux modules inédits : un « mode de récupération latent » permettant de passer fluidement entre différentes stratégies d'équilibre, et une tête de prédiction de contacts qui identifie les surfaces environnantes exploitables, murs, rambardes, bords de table. Entraîné uniquement sur sol plat et ouvert, RecoverFormer atteint 100 % de succès de récupération face à des poussées de 100 à 300 newtons, et ce quelle que soit la distance au mur (de 0,25 à 1,4 mètre), sans avoir jamais vu ces obstacles pendant l'entraînement. Ces résultats sont significatifs car ils montrent qu'un seul modèle peut gérer des situations radicalement différentes sans reprogrammation manuelle ni supervision par mode de récupération. Sous des conditions dégradées simulant des écarts dynamiques réels, le système maintient 75,5 % de succès avec une masse augmentée de 25 %, 89 % sous une latence de 30 millisecondes, et 91,5 % sur sol à faible friction. Combinées, ces perturbations n'abaissent le taux qu'à 99 %, ce qui est remarquable. Pour les industriels et les laboratoires déployant des humanoïdes dans des environnements réels non contrôlés, cette robustesse en transfert zéro-shot représente un saut qualitatif par rapport aux approches modulaires classiques qui nécessitent des comportements préprogrammés pour chaque scénario. La récupération après perturbation reste l'un des problèmes les plus difficiles de la robotique humanoïde, domaine où Boston Dynamics, Figure AI ou Agility Robotics investissent massivement. La plupart des systèmes actuels recourent à des pipelines hiérarchiques séparant détection, planification et exécution. RecoverFormer mise au contraire sur une politique unifiée, dont les modes de comportement émergent spontanément, validé par une analyse t-SNE sur 300 épisodes, sans étiquetage supervisé. La prochaine étape logique sera le déploiement sur robot réel, hors simulation, pour confirmer que cette généralisation tient face aux imprévisibilités du monde physique.

RobotiqueOpinion
1 source
L'apprentissage par démonstration avec détection d'échecs pour la navigation sécurisée des robots
4arXiv cs.RO 

L'apprentissage par démonstration avec détection d'échecs pour la navigation sécurisée des robots

Des chercheurs ont publié un article de recherche présentant un nouveau cadre d'apprentissage pour la navigation robotique, intitulé "Learning from Demonstration with Failure Awareness for Safe Robot Navigation" (arXiv:2604.23360). Leur approche s'attaque à un problème fondamental des systèmes d'apprentissage par démonstration : les robots apprennent principalement à partir de comportements réussis, ce qui les rend vulnérables dès qu'ils rencontrent des situations inédites ou dangereuses. Pour y remédier, l'équipe propose un cadre qui exploite explicitement les expériences d'échec, comme les collisions, jusqu'ici largement ignorées car elles n'offrent pas de comportement directement imitable. Le coeur de l'innovation réside dans une séparation stricte des rôles des deux types de données. Les expériences d'échec servent exclusivement à calibrer l'estimation de la valeur dans les zones à risque, signalant au robot les régions à éviter, tandis que l'apprentissage de la politique de navigation reste cantonné aux démonstrations réussies. Cette dissociation permet d'intégrer les données d'échec sans dégrader les performances globales, un écueil habituel des approches naïves qui mélangent les deux. Le tout est implémenté dans un cadre d'apprentissage par renforcement hors ligne, ce qui signifie que le robot apprend à partir d'un jeu de données fixe, sans nécessiter d'interactions supplémentaires avec l'environnement pendant l'entraînement. Les évaluations menées à la fois en simulation et en environnements réels montrent une réduction significative des taux de collision, tout en maintenant un taux de succès des tâches équivalent, avec une bonne généralisation sur différentes plateformes robotiques. Cette recherche s'inscrit dans un effort plus large pour rendre les robots autonomes fiables dans des contextes ouverts et imprévisibles, un enjeu critique pour leur déploiement dans des entrepôts logistiques, des hôpitaux ou des espaces publics. L'apprentissage par démonstration reste l'une des approches les plus pratiques pour programmer des robots sans expertise en RL, mais sa fragilité face aux situations hors distribution freine son adoption industrielle. En valorisant les données d'échec autrement que comme du bruit à écarter, ce travail ouvre une voie prometteuse pour construire des politiques de navigation plus robustes, sans coût de collecte de données supplémentaire.

RobotiqueActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour