Aller au contenu principal
Des agents IA pour les équipes de robots
RobotiqueIEEE Spectrum AI6sem· 1 min de lecture

Des agents IA pour les équipes de robots

Source originale ↗·

Le laboratoire de physique appliquée de l'université Johns Hopkins (APL) a publié une présentation détaillant ses travaux récents sur l'IA agentique appliquée aux équipes de robots collaboratifs. Baptisée "Agentic AI for Robot Teams", cette communication expose une architecture scalable conçue pour doter des systèmes robotiques hétérogènes de capacités d'autonomie, de coordination et d'adaptabilité. Les chercheurs y décrivent comment des agents fondés sur des grands modèles de langage (LLM) peuvent être déployés sur du matériel réel, avec des démonstrations impliquant des équipes de robots aux profils et capacités différents. Le document, disponible sous forme de livre blanc, présente également les leçons tirées des phases de recherche et développement en cours.

L'enjeu est considérable : faire travailler ensemble des robots qui ne partagent ni les mêmes capteurs, ni les mêmes actionneurs, ni les mêmes logiciels impose des défis de coordination que les architectures classiques peinent à résoudre. En intégrant des LLM comme couche de raisonnement et de planification, les équipes de l'APL cherchent à rendre ces systèmes capables de s'adapter dynamiquement aux imprévus, de se répartir les tâches et de maintenir une cohérence collective sans supervision humaine constante. Cette approche pourrait transformer des domaines comme la logistique autonome, la gestion de catastrophes, les opérations militaires ou l'exploration de milieux hostiles, où envoyer des équipes humaines reste risqué ou impossible.

Le Johns Hopkins APL est l'un des principaux centres de recherche appliquée du Département de la Défense américain, ce qui situe ces travaux dans un contexte stratégique lié à la robotique militaire et aux systèmes autonomes multi-agents. La montée en puissance des LLM depuis 2022 a ouvert une nouvelle voie pour la robotique agentique, jusqu'ici freinée par la rigidité des architectures de contrôle traditionnelles. Les suites annoncées portent sur la généralisation de l'architecture à des équipes plus larges et plus hétérogènes, ainsi que sur l'amélioration de la robustesse dans des environnements dégradés ou incertains.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Chine : 70 équipes de robots prêtes pour le 2e semi-marathon humanoïde
1Le Big Data 

Chine : 70 équipes de robots prêtes pour le 2e semi-marathon humanoïde

Le 19 avril 2026, Pékin accueillera la deuxième édition du semi-marathon humanoïde, une compétition inédite où des robots bipèdes doivent parcourir 21 kilomètres sur un tracé identique à celui des coureurs humains. Cette année, plus de 70 équipes se sont inscrites pour engager leurs machines dans l'épreuve, contre une vingtaine seulement lors de la première édition en 2025, soit une participation qui a presque quintuplé en un an. Les robots doivent avancer sans assistance humaine permanente, gérer leur équilibre sur la durée, éviter les chutes et coordonner leurs systèmes dans des situations imprévues. Environ 40 % des équipes misent désormais sur une navigation entièrement autonome. Les meilleurs robots approchent les 10 secondes au 100 mètres, et les organisateurs ont ajouté de nouveaux prix récompensant non seulement la vitesse, mais aussi l'endurance et la simple capacité à franchir la ligne d'arrivée. L'enjeu dépasse largement la performance sportive : chaque kilomètre couru constitue un test grandeur nature pour les ingénieurs, qui récupèrent en temps réel des données mécaniques et algorithmiques impossibles à obtenir en laboratoire. La distance d'un semi-marathon impose aux systèmes une charge thermique, une usure des articulations et une gestion de l'énergie sur la durée que peu de prototypes ont jusqu'ici dû affronter. Pour l'industrie robotique, ces courses accélèrent directement le cycle de développement : les chutes sur le bitume, les défaillances de coordination, les problèmes d'autonomie observés en course seront intégrés dans les prochaines versions des modèles. Une équipe universitaire a même assemblé son robot le jour de la course avant de l'engager directement sur le tracé, illustrant à quel point l'épreuve est aussi un banc d'essai assumé. La première édition, organisée également à Pékin en 2025, avait posé les bases d'un format qui prenait alors des allures d'expérience de niche. L'explosion du nombre de participants en 2026 reflète l'accélération généralisée du secteur de la robotique humanoïde en Chine, où plusieurs entreprises et laboratoires universitaires investissent massivement dans des bipèdes capables d'opérer dans des environnements conçus pour l'homme. Pékin s'est positionnée comme capitale de facto de cette compétition, dans un contexte où la robotique de service et industrielle est devenue un axe stratégique national. La navigation autonome, encore instable à 40 % des équipes, représente la prochaine frontière technique à franchir : si les robots peuvent un jour courir 21 kilomètres sans intervention extérieure, ils pourront théoriquement opérer dans n'importe quel environnement humain sans supervision constante.

UEL'accélération de la robotique humanoïde en Chine représente une pression concurrentielle croissante sur les industriels et laboratoires de recherche européens du secteur.

RobotiqueActu
1 source
NVIDIA lance des compétences agents pour l'IA physique : véhicules autonomes, robotique et vision
2NVIDIA AI Blog 

NVIDIA lance des compétences agents pour l'IA physique : véhicules autonomes, robotique et vision

NVIDIA a profité de la conférence CVPR 2026 pour dévoiler une série de nouveaux outils d'IA physique destinés aux chercheurs travaillant sur les véhicules autonomes, la robotique et les systèmes de vision artificielle. Ces annonces s'appuient sur le lancement, quelques jours plus tôt, de NVIDIA Cosmos 3, présenté comme le premier modèle fondamental unifié de l'industrie combinant raisonnement visuel, génération de mondes et génération d'actions. Parmi les outils dévoilés figurent InstantNuRec, qui reconstruit des scènes routières en 3D à partir d'images sans optimisation par scène ; AlpaGym, un framework open source d'apprentissage par renforcement en boucle fermée capable de s'exécuter sur des milliers de GPU ; OmniDreams, un modèle génératif qui produit des rendus photoréalistes en temps réel en réponse aux actions d'une politique de conduite ; et Alpamayo 2 Super, un modèle VLA (vision-langage-action) de 32 milliards de paramètres conçu pour le développement de véhicules autonomes de niveau 4. Le problème central que cherche à résoudre NVIDIA est la fragmentation des workflows en IA physique. Aujourd'hui, reconstruire une scène réelle, générer des scénarios rares, entraîner une politique, évaluer son comportement et itérer rapidement implique de jongler entre des outils disparates, ce qui ralentit considérablement la recherche. Pour les véhicules autonomes en particulier, le défi est la « longue traîne » des situations de conduite : les interactions rares, les géométries routières inhabituelles, les variations d'éclairage qui sont difficiles à collecter en conditions réelles mais critiques pour la validation. Les nouveaux outils de NVIDIA permettent aux agents IA d'automatiser ces étapes, de la reconstruction de scènes à partir de données de flotte jusqu'à la génération de conditions synthétiques variées. Pour la vision industrielle, des compétences Metropolis permettent de générer des défauts visuels rares sur différentes surfaces, résolvant le problème chronique du manque de données pour la détection d'anomalies. Ces annonces s'inscrivent dans une stratégie cohérente de NVIDIA pour s'imposer comme infrastructure de référence de l'IA physique, un marché qu'elle considère comme la prochaine vague majeure après les grands modèles de langage. Cosmos 3, socle de l'ensemble de l'écosystème présenté, est positionné comme modèle ouvert dominant sur les benchmarks publics de l'IA physique. En combinant simulation haute fidélité, modèles fondateurs ouverts et frameworks d'entraînement scalables, NVIDIA tente de reproduire avec l'IA embarquée et robotique ce qu'elle a réussi dans le calcul haute performance : rendre son infrastructure si centrale que les chercheurs n'envisagent pas d'alternatives. Les prochaines étapes passeront par l'adoption de ces outils par les grands constructeurs automobiles et les laboratoires de robotique, qui testent actuellement leurs capacités sur des flottes réelles.

UELes constructeurs automobiles européens (Renault, Stellantis, BMW) et les laboratoires de recherche en robotique pourront utiliser ces outils open-source pour accélérer le développement de véhicules autonomes de niveau 4 et réduire leur dépendance à la collecte de données réelles.

RobotiqueOpinion
1 source
Les 10 meilleurs modèles d'IA physique pour robots en 2026
3MarkTechPost 

Les 10 meilleurs modèles d'IA physique pour robots en 2026

En 2026, une nouvelle génération de modèles d'IA dits "physiques" s'impose comme la colonne vertébrale de la robotique industrielle et de recherche. Ces systèmes ne génèrent pas du texte, mais des commandes motrices : ils permettent à des robots réels d'exécuter des tâches complexes dans des usines, entrepôts et laboratoires. Dix modèles dominent ce paysage. NVIDIA a lancé sa série GR00T N dès mars 2025 au GTC, avec une première version ouverte et personnalisable. La version N1.7, publiée le 17 avril 2026 en accès anticipé, est un modèle de 3 milliards de paramètres, sous licence Apache 2.0, entraîné sur 20 854 heures de vidéo égocentrique humaine couvrant plus de 20 catégories de tâches. NVIDIA a également identifié la première loi d'échelle pour la dextérité robotique : passer de 1 000 à 20 000 heures de données humaines double les performances. Google DeepMind, de son côté, a dévoilé Gemini Robotics 1.5 en septembre 2025, un modèle vision-langage-action bâti sur Gemini 2.0, et a publié le 14 avril 2026 une version Gemini Robotics-ER 1.6 améliorant le raisonnement spatial, développée en collaboration avec Boston Dynamics. Ces avancées marquent un tournant concret pour l'industrie robotique. Des partenaires comme Agile Robots, Agility Robotics, Foxlink, NEURA Robotics et Lightwheel testent ou déploient déjà ces systèmes sur du matériel réel. Les modèles permettent désormais à des robots bimanuels d'accomplir des tâches en plusieurs étapes, de lire des instruments complexes, ou d'apprendre à partir de simples vidéos d'humains au travail, sans nécessiter des mois de génération de données synthétiques. NVIDIA a réduit ce délai à environ 36 heures grâce à son architecture GR00T-Dreams. Pour les opérateurs industriels, cela signifie des cycles de déploiement raccourcis et une polyvalence accrue des robots sans reprogrammation manuelle lourde. Ce bond technologique s'inscrit dans une convergence entre les grands modèles de langage et la robotique physique, amorcée depuis 18 mois environ. Des acteurs comme Physical Intelligence, avec ses modèles pi0 et pi0.5 basés sur le flow matching, Figure AI avec Helix, ou encore OpenVLA et le SmolVLA open-source d'HuggingFace LeRobot, enrichissent un écosystème désormais très dense. NVIDIA s'appuie également sur ses Cosmos World Foundation Models pour simuler des environnements d'entraînement réalistes. La compétition s'intensifie entre approches ouvertes, comme GR00T N1.7, et systèmes propriétaires à accès restreint comme Gemini Robotics 1.5, dont la disponibilité reste limitée à des partenaires sélectionnés. Les prochains mois verront probablement les premières mises en production à grande échelle dans les lignes d'assemblage et la logistique automatisée.

UEL'entreprise allemande NEURA Robotics figure parmi les partenaires industriels testant ces systèmes, et les opérateurs européens de la logistique et de l'assemblage pourraient bénéficier de cycles de déploiement robotique significativement raccourcis.

RobotiqueActu
1 source
Mecka AI obtient 60 millions de dollars pour développer ses robots IA
4Le Big Data 

Mecka AI obtient 60 millions de dollars pour développer ses robots IA

La startup new-yorkaise Mecka AI a annoncé le 1er juin 2026 une levée de fonds totale de 60 millions de dollars pour accélérer le développement de son infrastructure de données destinée à la robotique intelligente. Ce financement se décompose en deux tours menés par Framework Ventures : une série A de 25 millions de dollars bouclée en novembre 2025, suivie d'un second tour de 35 millions. Parmi les autres investisseurs figurent Menlo Ventures, SV Angel, Kindred Ventures et Ted Xiao, ancien chercheur chez Google DeepMind. La société affirme déjà avoir sécurisé des contrats lui permettant de viser 100 millions de dollars de revenus annuels. Fondée par Josh Gao et Mogen Cheng, qui n'ont aucun passé dans les grands laboratoires d'IA mais viennent de la fintech et de la crypto, Mecka AI développe des dispositifs propriétaires combinant capteurs corporels et iPhone pour enregistrer à grande échelle les gestes, déplacements et interactions physiques des humains. L'enjeu central est de résoudre un problème fondamental de la robotique moderne : le manque de données dites "incarnées". Contrairement à l'IA générative, qui s'entraîne sur du texte, des images ou de l'audio, un robot qui doit agir dans le monde physique a besoin de comprendre comment un corps humain coordonne ses mouvements. Mecka AI transforme ces comportements en données d'entraînement structurées, offrant aux modèles robotiques une base plus naturelle et plus riche que la téléopération classique, où un humain pilote directement le robot pour générer des exemples d'apprentissage. Cette approche pourrait accélérer le développement de robots polyvalents capables d'opérer dans des environnements non contrôlés, de l'entrepôt logistique au domicile. Le financement de Mecka AI s'inscrit dans un repositionnement plus large du capital-risque technologique. Après des années d'investissements massifs dans les grands modèles de langage, une fraction croissante du capital se déplace vers l'IA physique, ce segment qui cherche à connecter les capacités algorithmiques à des actions concrètes dans le monde réel. Wayve, de son côté, entraîne ses systèmes de conduite autonome sur des flux vidéo embarqués, tandis que MicroAGI collecte des données dans des foyers américains pour sa robotique domestique. Mecka AI ambitionne d'industrialiser cette collecte à travers des verticales multiples et d'en faire une couche d'infrastructure partagée pour l'ensemble de l'écosystème robotique. L'originalité du profil de ses fondateurs, venus de la fintech plutôt que de la recherche académique, suggère une approche davantage orientée vers la scalabilité commerciale que vers la publication scientifique.

RobotiqueOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic