Aller au contenu principal

Robotique — page 7

628 articles · page 7 sur 13

Actualités robotique et IA : robots autonomes, drones, véhicules autonomes et robots humanoïdes.

L'IA physique soulève des questions de gouvernance pour les systèmes autonomes
301AI News RobotiqueOpinion

L'IA physique soulève des questions de gouvernance pour les systèmes autonomes

La convergence de l'intelligence artificielle et des systèmes physiques pose des questions de gouvernance inédites pour les entreprises, les régulateurs et les ingénieurs. En 2024, la Fédération internationale de la robotique recensait 542 000 robots industriels installés dans le monde, soit plus du double du niveau enregistré dix ans plus tôt. Les projections tablent sur 575 000 unités en 2025 et plus de 700 000 d'ici 2028. Dans ce contexte, le marché de ce que les analystes appellent désormais la "Physical AI" -- robotique, edge computing et machines autonomes -- était estimé à 81,64 milliards de dollars en 2025 par Grand View Research, avec des projections atteignant 960,38 milliards en 2033. En mars 2025, Google DeepMind a franchi une étape concrète en lançant Gemini Robotics et Gemini Robotics-ER, deux modèles construits sur Gemini 2.0 et conçus pour le contrôle direct de robots et le raisonnement spatial. En avril 2026, une nouvelle version, Gemini Robotics-ER 1.6, a été mise en préversion via l'API Gemini, avec des capacités renforcées de planification de tâches, de détection de succès et de raisonnement par étapes intermédiaires. L'enjeu dépasse largement celui de l'automatisation logicielle classique. Lorsqu'un modèle de langage produit une réponse incorrecte, l'erreur reste dans le domaine informationnel. Lorsqu'un modèle piloté un robot, une sortie erronée peut se traduire par un mouvement physique dans un environnement partagé avec des humains ou connecté à des équipements industriels critiques. Google DeepMind identifie trois propriétés fondamentales pour des robots véritablement utiles : la généralité (capacité à traiter des objets et environnements inconnus), l'interactivité (adaptation aux instructions humaines et aux conditions changeantes), et la dextérité (précision des gestes physiques). Des systèmes comme Gemini Robotics peuvent suivre des instructions en langage naturel et exécuter des séquences complexes -- plier du papier, emballer des objets, manipuler des éléments jamais vus à l'entraînement. Mais cette même flexibilité complique la définition de limites de sécurité claires et de procédures d'arrêt d'urgence. Derrière la performance technique se profile un problème de gouvernance systémique encore non résolu. Contrairement aux logiciels, les systèmes physiques autonomes opèrent dans des espaces réels, soumis à des normes de sécurité industrielles, de responsabilité civile et de certification qui n'ont pas été conçues pour des agents capables de raisonner et de décider de façon autonome. La mise à disposition de Gemini Robotics-ER 1.6 via l'API Gemini rapproche le développement de ces systèmes des environnements de tests accessibles aux développeurs, mais transfère aussi une partie de la responsabilité vers les intégrateurs. Le secteur se retrouve face à une question centrale : qui valide, surveille et peut arrêter un agent physique lorsque son comportement s'écarte des limites prévues ? Les réponses réglementaires et industrielles à cette question seront déterminantes pour le déploiement à grande échelle de la Physical AI dans les prochaines années.

UELes industriels et régulateurs européens devront réviser les cadres de responsabilité civile, de certification et de sécurité des machines pour couvrir des agents physiques autonomes capables de raisonner, un vide que l'AI Act actuel n'adresse pas encore directement.

1 source
Meta veut devenir l’Android des robots humanoïdes
302Next INpact 

Meta veut devenir l’Android des robots humanoïdes

Meta a confirmé auprès de Bloomberg l'acquisition d'Assured Robot Intelligence (ARI), une startup spécialisée dans le développement de modèles d'intelligence artificielle pour la robotique. L'équipe d'ARI, présentée par Meta comme se situant « à la pointe de l'intelligence robotique, conçue pour permettre aux robots de comprendre, prévoir et s'adapter aux comportements humains dans des environnements complexes et dynamiques », rejoint le Meta Superintelligence Labs. Elle travaillera étroitement avec le Meta Robotics Studio, une division créée en février 2025 pour développer les technologies de base des robots humanoïdes. Ce rachat s'inscrit dans une stratégie plus large : Meta a déjà présenté en octobre 2025 des prototypes de capteurs tactiles avancés, le Digit Plexus, une solution matérielle pour intégrer des capteurs dans une main robotique, et le Digit 360, un capteur en forme de doigt fournissant des données haptiques très précises. Le géant des réseaux sociaux aurait par ailleurs déjà engagé des discussions avec Unitree Robotics, fabricant chinois connu pour ses robots acrobatiques, ainsi qu'avec Figure AI. L'ambition de Meta ne se limite pas à fabriquer ses propres robots : l'entreprise veut jouer un rôle de plateforme transversale pour toute l'industrie, sur le modèle d'Android et des puces Qualcomm dans l'écosystème des smartphones. Si ce positionnement réussit, Meta se retrouverait en position centrale dans un marché potentiellement colossal, en fournissant les briques logicielles et matérielles sur lesquelles d'autres constructeurs bâtiront leurs produits. L'enjeu industriel est réel : Amazon estime que les robots humanoïdes lui permettront d'éviter 600 000 embauches d'ici 2033, signal fort que la demande en environnements professionnels précède largement celle du grand public. Ce mouvement s'inscrit dans une dynamique de fond déclenchée par l'essor de l'IA générative, qui a fourni aux robots la capacité de comprendre des consignes en langage naturel, de décomposer des tâches complexes et de s'adapter à des situations imprévues, ce que les systèmes robotiques classiques ne pouvaient pas faire seuls. De nombreuses entreprises ont flairé l'opportunité d'un nouveau marché lucratif, et la compétition se structure rapidement. Tesla mise sur une approche intégrée verticalement avec Optimus, Elon Musk ayant promis lors du Forum de Davos une commercialisation possible dès fin 2026. Meta, dont le laboratoire de recherche fondamentale FAIR a vu son influence diminuer depuis le départ de Yann LeCun, réoriente clairement ses ressources vers ce chantier via le Superintelligence Labs. La question est désormais de savoir si le modèle « couche d'infrastructure ouverte » peut s'imposer face aux acteurs qui cherchent à tout contrôler, de la puce au châssis.

Les modèles VLA sont restreints mais capables de généraliser à des instructions inédites
303arXiv cs.RO 

Les modèles VLA sont restreints mais capables de généraliser à des instructions inédites

Une étude publiée sur arXiv (référence 2505.03500, version 5, mai 2026) expose une limitation structurelle des modèles VLA (Vision-Language-Action) : leur incapacité à combiner des compétences apprises séparément pour exécuter des tâches inédites. L'exemple présenté est parlant, un VLA peut réussir à placer du fromage frais dans un bol et à poser ce bol sur une armoire, mais échoue à placer directement le fromage sur l'armoire. Pour quantifier ce déficit, les chercheurs ont créé libero-ood, un benchmark de 20 tâches extrapolées depuis les suites standards LIBERO. Résultat net : l'ensemble des VLA état-de-l'art testés plafonnent à moins de 15 % de succès. En appliquant leur technique d'interpolation de latents textuels au modèle π0 de Physical Intelligence, les auteurs atteignent 83 % sans aucun réentraînement. Autre découverte préoccupante : des prompts illisibles pour un humain, obtenus par décodage du latent textuel, suffisent à piloter le VLA à 70 % de succès sur LIBERO standard, ouvrant la voie à des attaques de type backdoor ou à des instructions privées non auditables. La méthode repose sur l'extraction d'un "latent textuel" par tâche de base, en moyennant les états cachés des tokens textuels sur l'ensemble des trajectoires démontrées. Pour exécuter une tâche composite inédite, les chercheurs interpolent temporellement les latents de deux tâches sources et les réinjectent dans le modèle à l'inférence, activant séquentiellement les sous-comportements correspondants. Ce résultat remet en question l'hypothèse d'une compréhension sémantique robuste dans les VLA actuels : l'analyse qualitative révèle un phénomène de surapprentissage spatial, les modèles associant les noms d'objets à des emplacements démontrés plutôt qu'à des entités abstraites. Pour les intégrateurs et décideurs industriels, cela signifie que les benchmarks standards ne détectent pas ces angles morts compositionnels, et que la qualification de systèmes autonomes en production devrait systématiquement inclure des tâches out-of-distribution. LIBERO est depuis plusieurs années une référence en manipulation robotique tabletop ; libero-ood comble un angle mort important sur la généralisation hors distribution. π0, développé par Physical Intelligence (fondée en 2023 par d'anciens chercheurs de Google et DeepMind, dont Sergey Levine et Chelsea Finn), s'est imposé comme l'un des VLA les plus performants du marché via son architecture flow-matching. Les modèles concurrents testés ici, notamment OpenVLA (Berkeley) et Octo, affichent les mêmes limites compositionnelles. Ce travail, encore au stade preprint, pose les bases d'un nouveau critère d'évaluation pour les VLA et soulève des questions de sécurité concrètes qui devraient alerter les équipes déployant ces modèles en environnement industriel non supervisé.

UELes équipes R&D et industriels européens déployant des VLA en production doivent revoir leurs protocoles de qualification pour y intégrer des tâches hors-distribution, les benchmarks standards ne détectant pas les angles morts compositionnels exposés ici.

RobotiqueOpinion
1 source
L'IA physique est la véritable révolution de l'industrie manufacturière
304Robotics Business Review 

L'IA physique est la véritable révolution de l'industrie manufacturière

Pour Steve Ricketts, vice-président du développement commercial chez Fictiv, 2026 marque le basculement de l'IA conversationnelle vers ce qu'il nomme l'"IA physique" : la convergence entre réseaux de neurones et systèmes mécaniques embarqués. Sur le terrain, cette transition se manifeste dans trois segments concrets : les robots mobiles autonomes (AMR) capables d'interagir avec les rayonnages en bout de ligne, les cobots équipés de perception haptique pour l'assemblage électronique aux côtés d'opérateurs humains, et les bras robotisés dotés de vision IA pour le contrôle qualité, capables selon Fictiv de détecter des microfissures dans des aubes de turbines invisibles à l'oeil nu. L'article ne fournit pas de chiffres de déploiement précis et s'appuie sur des cas génériques. Sur le plan industriel, MISUMI, distributeur japonais de composants coté en bourse, a acquis Fictiv, marketplace de fabrication à la demande (CNC, injection, impression 3D). La combinaison des deux a permis à un client entreprise non nommé de rapatrier sa production aux États-Unis, en consolidant flux matière et production multi-régions pour accélérer le ramp-up. Ce qui distingue cette vague des précédentes est le raccourcissement de la boucle de développement via les pipelines "sim-to-real" : des agents IA s'entraînent dans des jumeaux numériques photoréalistes, exécutant des millions d'itérations en quelques heures avant tout déploiement physique. Cette approche permet de traiter des tâches à haute variabilité, comme le tri de ferraille non structurée ou la navigation en couloir hospitalier, jusqu'ici impossibles à automatiser de façon fiable. Pour les intégrateurs et les décideurs industriels, le signal opérationnel est double : le rôle du développeur bascule de "programmeur" à "entraîneur", et le critère de sélection des plateformes se déplace vers la capacité à absorber des feedbacks terrain en production réelle. Le vrai goulot d'étranglement identifié pour 2026 n'est plus algorithmique mais physique : la "scaling wall", soit la capacité à fabriquer des milliers d'unités de hardware en qualité constante dans une supply chain mondiale sous tension. Il faut noter que cet article est signé par le VP de Fictiv lui-même, lui conférant une tonalité promotionnelle assumée plutôt qu'analytique indépendante. Dans le paysage concurrentiel, Amazon déploie déjà des humanoïdes Digit d'Agility Robotics dans ses entrepôts, tandis que Boston Dynamics, Figure et 1X intensifient leurs pipelines commerciaux. Du côté européen, des acteurs comme Enchanted Tools ou Wandercraft avancent sur des niches spécifiques (robotique hospitalière, exosquelettes), mais restent absents de cette analyse orientée marché nord-américain. Le prochain jalon annoncé est la conférence Robotics Summit & Expo de Boston, en mai 2026, où Ricketts interviendra sur le thème "Emergent Robotics : AI at the Edge of Hardware Innovation".

RobotiqueOpinion
1 source
Pourquoi les matériaux déformables sont le véritable défi de l'IA physique en fabrication
305Robotics Business Review 

Pourquoi les matériaux déformables sont le véritable défi de l'IA physique en fabrication

Depuis plus de deux siècles, l'industrie textile repose sur le même paradigme : une aiguille traversant du tissu, mécanisée depuis 1830 mais jamais fondamentalement repensée. Aujourd'hui encore, la quasi-totalité des vêtements sont assemblés par des opérateurs humains, seuls capables de gérer la déformation continue du tissu, qui s'étire, se froisse et change d'état à chaque opération. Des acteurs comme Createme avancent une thèse alternative : plutôt qu'automatiser la couture existante, il faut redesigner le procédé pour que le robot puisse le contrôler. Concrètement, cela signifie remplacer la piqûre fil-aiguille par du collage ou du soudage, stabiliser la géométrie via des moules tridimensionnels, limiter l'accès à une seule face de la pièce pour réduire la complexité de coordination, et déployer des préhenseurs conçus pour les matériaux poreux et souples. L'objectif est de rendre le tissu suffisamment prédictible pour qu'un système d'apprentissage automatique puisse en généraliser la manipulation. L'enjeu dépasse largement le secteur textile. Les matériaux déformables constituent aujourd'hui le test le plus exigeant pour l'IA physique, ces systèmes robotiques capables de percevoir, raisonner sur les contacts et s'adapter en temps réel, par opposition aux robots industriels classiques qui rejouent des trajectoires pré-scriptées. Le critère de commercialisation n'est pas qu'un robot réussisse une tâche en démonstration, mais qu'il la répète en continu, face à la variabilité des matériaux, avec un uptime, un cycle time et un rendement acceptables en production. Les matériaux déformables révèlent très vite l'écart entre une démo convaincante et un système déployable : là où un robot de soudage opère sur des géométries rigides et prévisibles, le tissu change d'état à chaque manipulation. Toute progression sérieuse dans ce domaine ouvre une base transférable à d'autres matériaux flexibles, des emballages souples aux câblages industriels en passant par les composites. Pendant des décennies, la robotique industrielle a contourné ce problème en automatisant d'autres segments de la chaîne textile, notamment la coupe automatisée (Gerber, Lectra dès les années 1970) et la manutention logistique, en laissant l'assemblage aux bassins à bas coûts salariaux en Asie du Sud-Est. La pression combinée du reshoring industriel post-Covid, de la hausse des salaires dans ces régions et des exigences de traçabilité ESG relance aujourd'hui l'intérêt pour une automatisation plus profonde de l'assemblage. Côté IA physique, les avancées récentes en simulation (sim-to-real) et en modèles d'action visuels (VLA) rendent crédible un contrôle adaptatif en temps réel, mais uniquement si le procédé physique est conçu dès le départ pour réduire la variabilité à la source. C'est là la thèse centrale : pour l'assemblage de matériaux déformables, l'intelligence et la conception du procédé sont inséparables. Les systèmes qui gagnent ne sont pas ceux qui superposent de l'IA sur des workflows existants, mais ceux qui co-conçoivent robotique, méthodes d'assemblage et apprentissage automatique comme un système intégré unique.

UELectra, pionnier français de la découpe textile automatisée, est cité comme référence historique, et la pression combinée du reshoring post-Covid et des exigences ESG relance directement la demande d'automatisation d'assemblage dans les bassins industriels européens.

RobotiqueOpinion
1 source
ExoActor : génération de vidéos exocentriques pour le contrôle généralisable d'humanoïdes interactifs
306arXiv cs.RO 

ExoActor : génération de vidéos exocentriques pour le contrôle généralisable d'humanoïdes interactifs

Un framework de contrôle humanoïde baptisé ExoActor a été publié en preprint sur arXiv (2604.27711, avril 2026) par une équipe proposant d'utiliser la génération vidéo en vue tierce comme interface unifiée de commande robotique. Le principe : à partir d'une instruction textuelle et du contexte visuel de la scène, ExoActor génère une vidéo synthétique d'exécution plausible, extrait les cinématiques humaines correspondantes, puis les transmet à un contrôleur de mouvement généraliste pour produire une séquence comportementale exécutable. Le pipeline complet, implémenté de bout en bout, est évalué sur des scénarios inédits sans collecte additionnelle de données réelles. L'intérêt de l'approche réside dans la manière dont elle attaque un verrou central du contrôle humanoïde : modéliser des comportements riches en interactions entre le robot, son environnement et les objets manipulés, tout en capturant simultanément contexte spatial, dynamiques temporelles et intention de tâche. Plutôt qu'un VLA classique mappant directement observations vers actions, ExoActor intercale une représentation vidéo comme espace latent intermédiaire, dont la capacité de généralisation provient de grands modèles vidéo pré-entraînés à l'échelle. Si les résultats de généralisation sont confirmés sur des benchmarks indépendants, cela ouvrirait une alternative sérieuse à la collecte coûteuse de données de téléopération que supportent actuellement des acteurs comme Figure AI, Agility Robotics ou 1X Technologies. Cette publication s'inscrit dans un courant cherchant à court-circuiter les démonstrations réelles via des modèles génératifs. Elle dialogue avec Pi-0 de Physical Intelligence (diffusion sur flux d'actions), GR00T N2 de NVIDIA (entraîné sur données humaines synthétiques et réelles), ainsi qu'avec UniSim et IRASim qui utilisent la synthèse vidéo comme simulateur de politique. La spécificité d'ExoActor est l'usage explicite d'une perspective exocentrique, vue tierce personne, là où d'autres approches travaillent en vue égocentrique. Les auteurs reconnaissent les limitations actuelles, notamment la qualité de l'estimation de mouvement humain à partir de vidéo synthétique. Aucun déploiement industriel ni partenariat commercial n'est annoncé : ExoActor reste à ce stade une contribution académique.

RobotiqueOpinion
1 source
ImagineNav++ : piloter des modèles vision-langage comme navigateurs incarnés par imagination de scènes
307arXiv cs.RO 

ImagineNav++ : piloter des modèles vision-langage comme navigateurs incarnés par imagination de scènes

Une équipe de chercheurs a publié ImagineNav++ (arXiv:2512.17435, décembre 2024, version 3 en mai 2025), un système de navigation visuelle pour robots d'assistance domestique fonctionnant sans carte préalable, à partir d'un flux RGB ou RGB-D embarqué uniquement. Plutôt que de planifier en texte pur comme les agents LLM classiques, le système génère des images futures depuis des positions candidates du robot, puis soumet ces vues synthétiques à un modèle vision-langage (VLM) qui sélectionne la trajectoire la plus prometteuse. Deux composants structurent l'approche : un module d'imagination de vues futures entraîné sur des préférences de navigation humaine pour produire des points de vue à fort potentiel exploratoire, et un mécanisme de mémoire par fovéation sélective (sparse-to-dense) maintenant la cohérence spatiale sur de longues séquences. Sur les benchmarks open-vocabulary d'object navigation et d'instance navigation, ImagineNav++ atteint l'état de l'art en configuration sans carte, surpassant la majorité des méthodes basées sur des cartes explicites. Ce résultat remet en question une hypothèse structurante du domaine : que la navigation autonome en intérieur requiert impérativement une cartographie préalable (SLAM, occupancy maps). Si des VLMs peuvent raisonner spatialement à partir de flux visuels bruts, le pipeline de déploiement se simplifie considérablement pour les intégrateurs d'AMR et de robots d'assistance en environnements non structurés comme des logements ou des établissements de soins. La reformulation du problème comme sélection de meilleure vue est aussi une contribution méthodologique notable : elle rend le raisonnement spatial interprétable et compatible avec les interfaces VLM standard, sans nécessiter d'architecture spécialisée coûteuse. Ce travail prolonge une séquence de recherches cherchant à dépasser les LLM de navigation purement textuels, dont SayNav et LM-Nav, en y intégrant une perception visuelle fine. Les concurrents directs sont les méthodes map-based via SLAM et les approches hybrides récentes comme ESC ou CoW. Architecturalement, ImagineNav++ se rapproche des paradigmes VLA (Vision-Language-Action) explorés par des équipes chez Google DeepMind, Physical Intelligence (pi-0) ou dans le cadre de GR00T N2 chez NVIDIA. Aucun déploiement industriel n'est annoncé à ce stade : il s'agit d'une publication académique évaluée sur simulateurs et benchmarks standardisés, dont la généralisation en conditions réelles reste à valider.

RobotiqueOpinion
1 source
Ce que les discussions entre LG et NVIDIA révèlent sur l'avenir de l'IA physique
308AI News 

Ce que les discussions entre LG et NVIDIA révèlent sur l'avenir de l'IA physique

LG et NVIDIA sont actuellement en discussions exploratoires portant sur l'IA physique, les centres de données et la mobilité. Une rencontre à Séoul entre Ryu Jae-cheol, PDG de LG, et Madison Huang, directeur senior marketing produit pour Omniverse et la robotique chez NVIDIA, a permis de poser les bases d'une coopération potentielle. Aucun montant ni calendrier n'a encore été formalisé, mais les deux entreprises ont des priorités matérielles qui se recoupent sur deux fronts distincts : l'infrastructure thermique des centres de données et la robotique domestique. Sur le premier point, LG a présenté au CES 2026 des solutions de climatisation et de gestion thermique haute efficacité spécifiquement conçues pour les fermes de serveurs IA. Sur le second, le groupe coréen a dévoilé CLOiD, un robot domestique doté de deux bras à sept degrés de liberté et de cinq doigts à actuation individuelle, fonctionnant sur sa plateforme maison baptisée "Affectionate Intelligence". En parallèle, NVIDIA vient de conclure un essai de deux semaines sur un site Siemens en janvier 2026, annoncé en avril à la foire de Hanovre, où un robot humanoïde HMND 01 Alpha a exécuté des opérations logistiques réelles sur une plage de huit heures. Ces discussions révèlent une dépendance structurelle croissante entre les fabricants d'équipements physiques et les fournisseurs de puissance de calcul. Les racks de serveurs NVIDIA génèrent des densités de chaleur que les systèmes de refroidissement conventionnels ne peuvent plus absorber sans dégrader les performances : lorsque les nœuds de calcul surchauffent, ils réduisent automatiquement leur cadence, détruisant le retour sur investissement des puces haut de gamme. Intégrer les solutions thermiques de LG directement dans l'écosystème NVIDIA permettrait aux opérateurs d'entasser plus de puissance de calcul dans moins d'espace physique. Du côté robotique, LG manque aujourd'hui des environnements de simulation, des modèles de manipulation pré-entraînés et de l'infrastructure de jumeaux numériques nécessaires pour déployer CLOiD en toute sécurité dans des logements réels. La pile Omniverse et Isaac de NVIDIA offre précisément cette architecture, optimisée pour l'inférence physique en temps réel, ce qui permettrait de comprimer drastiquement le délai entre prototype et production commerciale. L'enjeu central de ces négociations illustre une fracture fondamentale de l'IA physique : les environnements industriels, comme l'usine Siemens d'Erlangen, sont structurés et prévisibles, ce qui facilite le déploiement de robots. Les intérieurs domestiques, eux, présentent une variabilité extrême en termes d'éclairage, de disposition et de comportement humain imprévisible, rendant le passage à l'échelle bien plus complexe. LG mise sur NVIDIA pour combler cette lacune via la puissance de simulation et l'inférence en périphérie de réseau. Pour NVIDIA, dont les revenus du segment centres de données battent régulièrement des records, nouer des partenariats avec des constructeurs d'appareils grand public comme LG représente une voie pour ancrer sa plateforme Omniverse comme standard de l'industrie robotique, avant que la concurrence chinoise ou les acteurs spécialisés ne s'imposent.

UELe déploiement d'un robot humanoïde sur le site Siemens d'Erlangen (Allemagne) signale une accélération de l'IA physique dans l'industrie manufacturière européenne, avec des implications pour les équipementiers et intégrateurs du secteur.

RobotiqueOpinion
1 source
Groupe SoftBank lance une pépite robotique déjà valorisée 100 milliards
309Le Big Data 

Groupe SoftBank lance une pépite robotique déjà valorisée 100 milliards

SoftBank prépare le lancement d'une nouvelle entité baptisée Roze AI, dédiée à l'automatisation de la construction de centres de données, avec une introduction en bourse envisagée dès le second semestre 2026 aux États-Unis. Selon le Financial Times et le Wall Street Journal, le groupe japonais vise une valorisation de 100 milliards de dollars pour cette structure encore embryonnaire. L'idée centrale : déployer des robots autonomes pour accélérer, standardiser et réduire les coûts de construction des data centers, infrastructures devenues critiques pour alimenter la demande explosive en puissance de calcul liée à l'IA générative. L'enjeu est colossal. Construire un centre de données reste aujourd'hui un processus long, coûteux et très dépendant de la main-d'œuvre humaine. En automatisant cette chaîne, Roze AI pourrait réduire significativement les délais de mise en service au moment précis où hyperscalers, gouvernements et entreprises technologiques se disputent la capacité de calcul disponible. Si la formule fonctionne, SoftBank ne se contenterait plus d'être un investisseur dans l'écosystème IA : il deviendrait un acteur industriel direct, capturant une part de la chaîne de valeur physique de l'intelligence artificielle, au même titre qu'un grand fournisseur cloud comme AWS ou Microsoft Azure. SoftBank évolue depuis des années dans une logique de paris technologiques massifs, parfois triomphants comme avec Alibaba, parfois catastrophiques comme avec Zume, la startup de livraison de pizzas robotisées qui a tourné court. Cette fois, la stratégie change de nature : il ne s'agit plus de financer des startups prometteuses depuis l'extérieur, mais de créer de toutes pièces une entité industrielle intégrée. SoftBank n'est pas seul sur ce terrain : Jeff Bezos a cofondé Project Prometheus, initiative visant à racheter des entreprises industrielles pour les moderniser par l'IA, signalant une convergence plus large entre capital technologique et transformation des infrastructures physiques. En interne, le projet Roze AI suscite néanmoins des interrogations : selon le Financial Times, plusieurs employés du groupe doutent de la pertinence d'une valorisation à 100 milliards pour une entité qui n'a pas encore prouvé son modèle à grande échelle, et le calendrier d'IPO pour fin 2026 est jugé très ambitieux. La question reste entière : Roze AI deviendra-t-elle un standard de l'infrastructure IA mondiale, ou un nouveau pari à haut risque dans la longue histoire des investissements de SoftBank ?

RobotiqueOpinion
1 source
DAIMON Robotics veut doter les mains robotiques du sens du toucher
310IEEE Spectrum AI 

DAIMON Robotics veut doter les mains robotiques du sens du toucher

En avril 2026, la startup hongkongaise DAIMON Robotics a publié Daimon-Infinity, qu'elle décrit comme le plus grand jeu de données omni-modal au monde pour l'IA physique. Ce corpus regroupe des millions d'heures de données multimodales issues de plus de 80 scénarios réels et de 2 000 compétences humaines référencées, couvrant des tâches aussi variées que le pliage de linge à domicile et l'assemblage industriel en usine. Dix mille heures de ces données ont été rendues publiques en open source. Le projet a été développé en partenariat avec Google DeepMind, l'Université Northwestern et la National University of Singapore. Au coeur du dispositif : un capteur tactile visuel monochrome capable d'intégrer plus de 110 000 unités de détection dans un module de la taille d'un bout de doigt, alimenté par un réseau de collecte décentralisé pouvant générer plusieurs millions d'heures de données par an. Ce lancement s'attaque à l'un des verrous les plus persistants de la robotique : l'absence de retour tactile dans les modèles d'apprentissage. Les architectures Vision-Language-Action (VLA), qui dominent aujourd'hui le domaine, reposent quasi exclusivement sur la vision, laissant les robots aveugles au toucher lors des manipulations physiques. DAIMON propose une alternative baptisée VTLA (Vision-Tactile-Language-Action), qui élève la perception tactile au rang de modalité à part entière, au même niveau que la vision. Pour les industriels et les chercheurs, l'enjeu est concret : un robot qui "sent" ce qu'il manipule peut gérer des objets fragiles, s'adapter à des textures inattendues et réduire drastiquement les erreurs de préhension. La publication de 10 000 heures en open source vise également à abaisser la barrière d'entrée pour les équipes de recherche qui peinent à constituer des datasets de qualité. Fondée il y a deux ans et demi, DAIMON s'est construite autour de la technologie de capteurs tactiles haute résolution avant d'élargir son ambition vers la donnée d'entraînement à grande échelle. La stratégie est portée par le professeur Michael Yu Wang, cofondateur et directeur scientifique, titulaire d'un doctorat de Carnegie Mellon où il a étudié la manipulation sous la direction de Matt Mason, et fondateur de l'Institut de robotique de l'Université des sciences et technologies de Hong Kong. Fellow IEEE et ancien rédacteur en chef de la revue IEEE Transactions on Automation Science and Engineering, il cumule quatre décennies dans le domaine. À terme, DAIMON vise des déploiements commerciaux dans des environnements à forte manipulation manuelle, comme les hôtels et les supérettes en Chine, où des robots dotés du sens du toucher pourraient remplacer des tâches aujourd'hui infranchissables pour les machines.

UELes équipes de recherche européennes en robotique peuvent accéder aux 10 000 heures de données tactiles publiées en open source, mais l'initiative est portée par des acteurs asiatiques sans implication directe de partenaires français ou européens.

RobotiqueOpinion
1 source
AI² Robotics défend les modèles VLA et lance NeuroVLA
311Pandaily 

AI² Robotics défend les modèles VLA et lance NeuroVLA

Guo Yandong, fondateur et PDG d'AI² Robotics, a présenté NeuroVLA, un modèle d'action robotique de troisième génération qui réduit la latence de réponse de plusieurs centaines de millisecondes à quelques dizaines de millisecondes. L'entreprise articule l'évolution des architectures VLA (Vision-Language-Action) en trois stades : les modèles end-to-end de première génération unifiant perception et contrôle ; les systèmes de deuxième génération intégrant des world models pour le raisonnement prédictif ; et désormais NeuroVLA, architecture neuro-inspirée permettant une optimisation continue comparable à la mémoire musculaire. En parallèle, AI² Robotics a lancé AlphaBrain Platform, une boîte à outils open-source combinant modèles VLA neuro-inspirés, entraînement par reinforcement learning à base de tokens et architectures modulaires de world model, avec support des benchmarks de référence LIBERO et CALVIN. L'annonce ne précise ni contexte de déploiement réel, ni clients industriels : il s'agit d'un lancement de modèle et de plateforme, pas d'un déploiement terrain. La réduction de latence revendiquée est le chiffre à surveiller. En manipulation robotique, passer sous 50 ms est généralement considéré comme le seuil nécessaire pour des gestes précis en environnement non structuré. Si NeuroVLA tient ces performances hors laboratoire, cela représenterait une avancée concrète sur le sim-to-real gap, obstacle persistant à la commercialisation des robots VLA. L'ouverture d'AlphaBrain en open-source signale une stratégie d'écosystème : AI² Robotics cherche à fédérer des contributeurs autour de son approche architecturale, à l'image de ce que tente Physical Intelligence avec pi0. AI² Robotics est une startup chinoise spécialisée dans l'embodied AI pour robots manipulateurs et humanoïdes. La prise de position publique de Guo Yandong en faveur des VLA intervient dans un débat architectural actif : les pipelines VLA end-to-end, portés aussi par Figure AI et 1X Technologies, s'affrontent aux approches hybrides modulaires de Sanctuary AI ou Apptronik. Les prochains jalons crédibles à suivre sont les résultats publiés sur LIBERO et CALVIN, qui permettront une comparaison objective avec les modèles concurrents, ainsi que l'annonce éventuelle de pilotes industriels validant les métriques en conditions réelles.

RobotiqueOpinion
1 source
FalconApp : déploiement rapide sur iPhone d'un système de perception bout-en-bout via données synthétiques labellisées automatiquement
312arXiv cs.RO 

FalconApp : déploiement rapide sur iPhone d'un système de perception bout-en-bout via données synthétiques labellisées automatiquement

FalconApp, présentée dans un preprint arXiv publié fin avril 2026 (arXiv:2604.25949), est une application iPhone couplée à un pipeline backend qui transforme une courte vidéo capturée à la main en un module de perception opérationnel pour la robotique, capable de détection de masque et d'estimation de pose à 6 degrés de liberté (6-DoF). Le pipeline complet fonctionne ainsi : l'utilisateur filme un objet rigide, l'application reconstruit un asset 3D au format GSplat (Gaussian Splatting), le composite sur des fonds photorealistes variés, génère des images synthétiques avec masques et poses de vérité terrain en étiquetage automatique, entraîne le module de perception, puis le redéploie sur l'iPhone. Sur cinq objets de géométries et textures diverses, le système atteint en moyenne 20 minutes de génération de données synthétiques et d'entraînement par objet, une latence bout-en-bout d'environ 30 ms sur l'appareil, et surpasse un algorithme de référence PnP (Perspective-n-Point) sur 4 objets sur 5, tant en simulation qu'en évaluation réelle. L'intérêt industriel est direct : le goulot d'étranglement classique de la perception en robotique est l'annotation manuelle de données réelles, coûteuse et chronophage. Ramener ce délai à 20 minutes via de la donnée synthétique auto-étiquetée représente un changement de paradigme pour les intégrateurs robotiques qui doivent adapter rapidement des systèmes de préhension ou de localisation à de nouveaux objets sans pipeline MLOps lourd. La latence de 30 ms sur smartphone est compatible avec un usage temps réel embarqué. Cela dit, la validation reste modeste : cinq objets rigides seulement, sans test sur des surfaces réfléchissantes, des objets partiellement occultés ou des scènes encombrées, ce qui laisse ouverte la question de la robustesse en conditions industrielles réelles. Le Gaussian Splatting (3DGS) est devenu un outil central de reconstruction 3D depuis son introduction au SIGGRAPH 2023, et plusieurs équipes l'exploitent désormais pour générer de la donnée d'entraînement synthétique en robotique. Sur le terrain de la donnée synthétique pour la pose 6-DoF, FalconApp s'inscrit dans la lignée de travaux académiques comme MegaPose, développé notamment par des chercheurs de l'INRIA en France. La différence revendiquée ici est l'intégration verticale mobile-to-deployment en moins de 30 minutes, sans infrastructure cloud spécialisée. L'étape suivante logique serait d'élargir la validation à des objets déformables ou semi-rigides, et de tester le pipeline dans des environnements à éclairage variable, deux conditions fréquentes en atelier.

UEL'INRIA française est co-auteur de MegaPose, travail de référence dont FalconApp s'inspire directement, mais le pipeline lui-même n'émane pas d'une institution européenne et aucun déploiement en France ou en UE n'est identifié.

RobotiquePaper
1 source
STARRY : modélisation du monde centrée sur l'action spatio-temporelle pour la manipulation robotique
313arXiv cs.RO 

STARRY : modélisation du monde centrée sur l'action spatio-temporelle pour la manipulation robotique

Des chercheurs ont publié sur arXiv (arXiv:2604.26848) un nouveau modèle de politique robotique appelé STARRY, conçu pour améliorer la manipulation d'objets en intégrant un module de prédiction spatiotemporelle directement dans la boucle de génération d'actions. L'architecture repose sur un débruitage conjoint de latents spatiotemporels futurs et de séquences d'actions, complété par un mécanisme baptisé Geometry-Aware Selective Attention Modulation (GASAM), qui convertit la profondeur prédite et la géométrie de l'effecteur terminal en poids d'attention alignés sur les tokens d'action. Sur le benchmark RoboTwin 2.0, STARRY atteint 93,82 % de taux de succès moyen en configuration propre (Clean) et 93,30 % en configuration aléatoire (Randomized). En conditions réelles, le modèle améliore le taux de succès de 42,5 % à 70,8 % par rapport à π0.5, la politique de référence de Physical Intelligence. Ce résultat en conditions réelles mérite attention : le delta de +28,3 points sur π0.5 suggère que l'intégration explicite de la structure spatiotemporelle dans la politique, plutôt qu'en post-traitement, apporte un gain concret au-delà du benchmark simulé. Pour les intégrateurs et décideurs industriels, c'est un signal que le sim-to-real gap sur des tâches de manipulation précise reste un vrai verrou, et que les architectures VLA (Vision-Language-Action) classiques, sans modélisation de l'interaction future, plafonnent sur les scénarios à forte contrainte géométrique. La distinction entre prédire le monde et prédire ce qui est pertinent pour l'action semble être la clé ici, ce que STARRY formalise avec GASAM. STARRY s'inscrit dans une compétition dense autour des politiques VLA pour la manipulation : π0 et π0.5 (Physical Intelligence), GR00T N2 (NVIDIA), OpenVLA, et les travaux issus des labos de Stanford, CMU ou Berkeley. Le benchmark RoboTwin 2.0, utilisé comme terrain d'évaluation principal, est un environnement de simulation récent orienté tâches bimanuelles. Il convient de noter que cette publication est un preprint arXiv, sans revue par les pairs à ce stade, et que les expériences réelles décrites semblent limitées en nombre de tâches et de contextes. Les prochaines étapes naturelles seraient une évaluation sur des benchmarks plus diversifiés comme LIBERO ou Open X-Embodiment, et une validation à plus grande échelle en environnement industriel réel.

RobotiqueOpinion
1 source
Shengshu Technology lance Motubrain, son modèle monde-action
314Pandaily 

Shengshu Technology lance Motubrain, son modèle monde-action

La société chinoise Shengshu Technology a annoncé Motubrain, un modèle dit "monde-action" (world-action model) conçu comme cerveau unifié pour systèmes d'IA incarnée. L'architecture fusionne modélisation du monde et génération d'actions dans un cadre unique, avec pour ambition de couvrir l'adaptation cross-embodiment, la généralisation multi-tâches et l'exécution de séquences longues. Sur les benchmarks, Motubrain revendique la première place dans deux évaluations internationales : un score EWM de 63,77 sur WorldArena, et un score supérieur à 95 sur RoboTwin 2.0 en environnement aléatoire, ce qui en ferait le seul modèle à franchir ce seuil. En démonstration réelle, le système a été présenté sur des tâches comme la composition florale, le service de cocktails et la cuisine, en maintenant, selon l'entreprise, des performances cohérentes sur plusieurs plateformes robotiques distinctes. Shengshu annonce des partenariats avec plusieurs fabricants de robots pour accélérer le déploiement, sans préciser lesquels ni sur quels volumes. L'annonce s'inscrit dans une dynamique de fond : la convergence entre modèles de monde et modèles d'action est devenue l'un des paris stratégiques majeurs de la robotique généraliste. Là où les approches VLA (Vision-Language-Action) classiques séparent compréhension et génération de mouvement, Motubrain prétend les unifier, ce qui, si les résultats benchmark sont confirmés en conditions industrielles, changerait le calcul pour les intégrateurs : moins de pipelines à orchestrer, meilleure robustesse aux variations d'environnement. Le score RoboTwin 2.0 est particulièrement scruté car ce benchmark cible spécifiquement la manipulation bimanuele en environnement non structuré, un goulot d'étranglement persistant pour le déploiement en atelier. Il convient néanmoins de noter que les démonstrations vidéo publiées restent des cas sélectionnés, sans données de taux de succès sur cycles répétés ni de latence end-to-end, ce qui rend difficile une comparaison rigoureuse avec des systèmes comme Pi-0 de Physical Intelligence ou GR00T N2 de NVIDIA. Shengshu Technology est actif dans l'espace de la génération vidéo et des modèles génératifs chinois depuis plusieurs années, mais Motubrain marque un pivot explicite vers l'IA incarnée. Sur le plan concurrentiel, le modèle se positionne face à Pi-0 (Physical Intelligence), Helix (Figure), RDT-1B (Tsinghua) et les initiatives en cours chez 1X et Agility. La Chine accélère significativement dans ce segment, avec des acteurs comme Unitree, AGIBOT et désormais Shengshu qui visent une commercialisation de modèles fondationnels pour robots plutôt que des robots clés en main. Les prochaines étapes annoncées concernent le déploiement chez des partenaires industriels non nommés, sans calendrier précis ni confirmation d'un accès public au modèle.

UELa montée en puissance des modèles fondationnels chinois pour la robotique incarnée intensifie la pression concurrentielle sur les acteurs européens du VLA et de l'IA physique, sans impact direct identifiable à ce stade.

RobotiqueOpinion
1 source
Galbot lance LDA-1B, un modèle du monde-action en open source
315Pandaily 

Galbot lance LDA-1B, un modèle du monde-action en open source

Galbot a publié LDA-1B, un modèle fondation monde-action cross-embodiment de 1,6 milliard de paramètres, construit sur son architecture propriétaire WAM (World-Action Model). Ce modèle unifie modèles de monde et modèles d'action au niveau des données, permettant un apprentissage conjoint sur données de simulation et données réelles, données humaines et robotiques, ainsi que sur jeux de données d'action labellisés et non labellisés. LDA-1B peut s'adapter à différentes morphologies de robots après seulement une heure de post-entraînement, selon Galbot. À mesure que le volume de données d'entraînement est passé de 5 000 à 30 000 heures, l'erreur de prédiction d'action a diminué de façon continue, démontrant un comportement de scaling cohérent. La recherche a été acceptée à RSS 2026 et le code source est désormais public. Le modèle est intégré dans AstraBrain et AstraData, l'infrastructure de déploiement de Galbot, couvrant la logistique industrielle, les tâches domestiques et les scénarios retail. En avril 2026, la société est l'entreprise d'IA incarnée non cotée la mieux valorisée en Chine, avec une valorisation dépassant 20 milliards de yuans (2,8 milliards de dollars). Plusieurs points méritent attention. La capacité d'adaptation cross-embodiment en une heure de fine-tuning est une affirmation forte, mais elle reste à valider hors démonstrations contrôlées. Le comportement de scaling confirmé entre 5 000 et 30 000 heures de données est un signal positif pour les VLA (Vision-Language-Action models) à grande échelle, suggérant que les lois d'échelle s'appliquent à l'action robotique de façon analogue aux LLM textuels. L'open-source du codebase réduit la barrière d'entrée pour les intégrateurs souhaitant expérimenter sans infrastructure propriétaire, et positionne Galbot comme fournisseur d'infrastructure fondationale, pas seulement constructeur de robots. Galbot est une startup spécialisée dans les robots humanoïdes et l'IA incarnée. LDA-1B entre en compétition directe avec pi0 de Physical Intelligence, GR00T N2 de NVIDIA, et les approches internes de Figure AI et Agility Robotics côté américain. En Chine, la société rivalise avec Unitree et UBTECH sur le terrain humanoïde. L'acceptation à RSS 2026 lui confère une légitimité académique rare dans ce secteur encore dominé par les communiqués marketing. Les prochaines étapes probables incluent des pilotes industriels en logistique et retail, et une expansion internationale que la valorisation de 2,8 milliards de dollars rend plausible.

UEPression concurrentielle indirecte sur les équipes VLA européennes (INRIA, CEA-List), mais aucun déploiement ni partenariat européen annoncé.

💬 Le comportement de scaling sur les données robotiques, c'est le vrai signal ici, pas le chiffre de valorisation. Que les lois d'échelle s'appliquent à l'action physique comme au texte, ça dit quelque chose sur ce qu'on va voir dans 3 ans, et tu commences à comprendre pourquoi les gros acteurs américains s'agitent. L'open source est une bonne décision stratégique, mais une heure de fine-tuning pour changer de morphologie de robot, j'attends de voir ça hors démo contrôlée.

RobotiqueOpinion
1 source
C’est incroyable ! Figure AI passe à 55 robots en une semaine (et ça inquiète)
316Le Big Data 

C’est incroyable ! Figure AI passe à 55 robots en une semaine (et ça inquiète)

Figure AI vient de franchir un cap industriel majeur dans la robotique humanoïde. En seulement 120 jours, la startup californienne a multiplié par 24 sa cadence de production sur son site BotQ, passant d'un robot par jour à un robot par heure, soit 55 unités sur la semaine du 29 avril 2026. Cette montée en puissance repose sur une chaîne de fabrication entièrement repensée : plus de 150 postes de travail connectés, un logiciel maison pilotant chaque étape, plus de 50 points de contrôle qualité, et plus de 80 tests fonctionnels par unité avant validation. Les robots subissent des cycles intensifs de squats, de jogging et de mouvements répétés pour simuler les conditions réelles dès la sortie de ligne. Les résultats sont saisissants : un rendement supérieur à 80 % dès la première sortie, un taux de réussite de 99,3 % sur les batteries, et plus de 9 000 actionneurs déjà produits. Cette accélération industrielle dépasse la simple performance logistique. Chaque robot déployé devient un capteur de données qui alimente Helix, le système d'intelligence artificielle maison de Figure AI. Plus la flotte s'agrandit, plus l'IA apprend vite, et plus les robots gagnent en autonomie réelle. Les nouvelles capacités s'appuient sur une approche dite de contrôle corporel complet guidé par la perception : équipés de caméras embarquées, les robots reconstruisent une vision 3D de leur environnement et anticipent leurs mouvements, que ce soit pour monter des escaliers, traverser des surfaces irrégulières ou s'adapter à des situations imprévues sans assistance humaine. Figure AI a également développé une infrastructure de gestion de flotte incluant diagnostic en temps réel, maintenance à distance et mises à jour simultanées sur l'ensemble des unités déployées. Figure AI s'inscrit dans une course industrielle qui oppose désormais plusieurs géants et startups bien financées sur un même terrain : la capacité à produire des humanoïdes en série et à les rendre opérationnels à grande échelle. Tesla, avec son robot Optimus, et Boston Dynamics font figure de concurrents directs, mais la vraie bataille se joue aujourd'hui sur les données réelles accumulées en déploiement. Celui qui dispose de la plus grande flotte apprenante accumule un avantage compétitif difficile à rattraper. Figure AI, soutenue par des investisseurs majeurs de la Silicon Valley et des partenariats industriels actifs notamment avec BMW, mise sur cette logique de flywheel : plus de robots, plus de données, de meilleures décisions, encore plus de robots. La question qui reste ouverte est celle de la vitesse à laquelle ces humanoïdes vont effectivement remplacer de la main-d'oeuvre dans des environnements industriels réels, une perspective qui fascine autant qu'elle inquiète.

UELe partenariat actif de Figure AI avec BMW expose directement le tissu industriel européen à la robotique humanoïde en série, avec des implications concrètes sur l'emploi dans les usines du continent.

RobotiqueOpinion
1 source
La Chine freine les autorisations de robotaxis après un incident à Wuhan, selon des sources
317SCMP Tech 

La Chine freine les autorisations de robotaxis après un incident à Wuhan, selon des sources

La Chine a resserré ses conditions de délivrance de licences pour les robotaxis à la suite d'un incident survenu à Wuhan, où des passagers ont été bloqués à bord de véhicules autonomes pendant plusieurs heures, perturbant la circulation de manière significative. Selon deux sources proches du dossier, qui ont requis l'anonymat faute d'autorisation à s'exprimer publiquement, les autorités ont commencé à réduire le rythme d'attribution de nouvelles licences de conduite autonome pendant l'enquête en cours sur les causes de l'incident. Cette décision ne constitue pas un gel total du secteur, mais elle marque un coup de frein notable pour des entreprises comme Baidu (Apollo Go), Pony.ai ou WeRide, qui avaient obtenu des autorisations d'exploitation commerciale dans plusieurs grandes villes chinoises. Le ralentissement administratif risque de freiner leur expansion géographique et de retarder des levées de fonds ou des introductions en bourse pour lesquelles la dynamique réglementaire est un signal fort envoyé aux investisseurs. La Chine s'était imposée ces dernières années comme l'un des marchés les plus permissifs au monde pour les tests et le déploiement commercial de véhicules autonomes, notamment à Wuhan, Pékin et Guangzhou. Cet incident illustre la tension persistante entre la volonté d'avancer vite sur une technologie stratégique et la pression politique qu'exercent les incidents publics sur des régulateurs soucieux de leur image. L'issue de l'enquête déterminera si ce coup de frein reste temporaire ou si des exigences techniques plus strictes viennent redéfinir durablement les conditions d'accès au marché.

RobotiqueReglementation
1 source
La Chine gèle les nouvelles licences de robotaxi après le chaos Baidu
318The Verge 

La Chine gèle les nouvelles licences de robotaxi après le chaos Baidu

La Chine a suspendu la délivrance de nouvelles licences pour les véhicules autonomes, selon Bloomberg, qui cite des sources proches du dossier. Cette décision fait suite à un incident survenu le mois dernier à Wuhan, où des dizaines de robotaxis opérés par le géant technologique Baidu via sa filiale Apollo Go se sont immobilisés simultanément en pleine circulation, provoquant d'importants embouteillages. Les restrictions en vigueur empêchent désormais les entreprises d'ajouter de nouveaux véhicules sans conducteur à leurs flottes, de s'étendre vers de nouvelles villes ou de lancer de nouveaux projets de tests. La date à laquelle les autorités reprendront l'octroi de licences reste inconnue. L'incident de Wuhan a visiblement alarmé Pékin, qui a demandé aux gouvernements locaux de procéder à un examen approfondi du secteur pour éviter la répétition de tels épisodes. Pour l'industrie, ce gel représente un coup de frein significatif : les entreprises qui misaient sur une expansion rapide de leurs flottes se retrouvent bloquées dans leur développement, tandis que la confiance du public envers les véhicules autonomes risque d'être ébranlée à un moment crucial pour le secteur. La Chine s'était positionnée comme l'un des marchés les plus ambitieux au monde pour la mobilité autonome, avec Wuhan comme ville pilote emblématique du déploiement de Baidu Apollo Go. Le pays avait jusqu'ici adopté une approche relativement permissive en matière de licences, cherchant à concurrencer les acteurs américains comme Waymo. Cette suspension marque un tournant réglementaire et soulève des questions sur le rythme réel auquel les véhicules autonomes peuvent être déployés à grande échelle sans risque pour la fluidité du trafic urbain.

RobotiqueReglementation
1 source
La Chine prévoit 8 500 robots IA pour son réseau électrique, avec un investissement d'un milliard de dollars
319Interesting Engineering 

La Chine prévoit 8 500 robots IA pour son réseau électrique, avec un investissement d'un milliard de dollars

La State Grid Corporation of China, le plus grand opérateur électrique du monde, va déployer environ 8 500 robots dopés à l'intelligence artificielle sur son réseau en 2026, avec un budget de 6,8 milliards de yuans, soit près d'un milliard de dollars. Ces machines couvriront plus de 600 tâches spécialisées : quelque 5 000 chiens-robots quadrupèdes assureront la surveillance et l'inspection des lignes dans les zones montagneuses difficiles d'accès, 500 robots humanoïdes interviendront sur les infrastructures à très haute tension en conditions de travail sous tension, et 3 000 robots à bras doubles sur roues effectueront des opérations de maintenance coordonnée. Les fournisseurs retenus sont parmi les fleurons de la robotique chinoise : Unitree Robotics, Deep Robotics, AgiBot, UBTech Robotics et Fourier Intelligence. En comptant les investissements de China Southern Power Grid et des autres acteurs du secteur, les dépenses totales en robots embarqués devraient dépasser 10 milliards de yuans (1,46 milliard de dollars) pour la seule année 2026. L'enjeu est considérable : automatiser la gestion d'un réseau électrique qui dessert 26 des 31 provinces continentales chinoises, dans des environnements souvent hostiles ou dangereux pour les techniciens humains. En janvier 2026, des chercheurs chinois avaient déjà ramené le temps de réponse aux défaillances de réseau à 0,1 seconde, permettant une isolation et une restauration quasi instantanées des pannes, y compris la détection de micro-défauts de courant à l'échelle de la centaine de milliampères. Confier l'inspection et la maintenance quotidiennes à des robots réduit les risques humains, améliore la continuité de service et libère les techniciens pour des interventions à plus haute valeur ajoutée. Pour les utilisateurs industriels et les ménages, l'objectif est une grille électrique plus fiable et plus résiliente face aux aléas. Ce virage robotique s'inscrit dans une stratégie industrielle plus large. La Chine domine déjà les expéditions mondiales de robots incarnés et vise 2,1 millions d'unités produites d'ici 2030. Le réseau électrique sert ici de laboratoire grandeur nature pour valider des systèmes d'IA en conditions réelles à très grande échelle. China Southern Power Grid a même commencé à exporter ses propres chiens-robots pour l'inspection de sous-stations au Chili, signe que la filière lorgne désormais les marchés internationaux. À mesure que l'autonomie des systèmes augmentera, le secteur énergétique chinois pourrait devenir la référence mondiale pour l'intégration massive de l'IA dans des infrastructures critiques.

UELa montée en puissance de la filière robotique chinoise, déjà exportatrice (Chili) et visant 2,1 millions d'unités d'ici 2030, accroît la pression concurrentielle sur les industriels et opérateurs d'infrastructures critiques européens qui devront choisir entre adoption et développement de capacités propres.

RobotiqueActu
1 source
Oxford va concevoir des solutions robotiques de nouvelle génération pour les sites nucléaires avec AtkinsRéalis
320Interesting Engineering 

Oxford va concevoir des solutions robotiques de nouvelle génération pour les sites nucléaires avec AtkinsRéalis

AtkinsRéalis, groupe d'ingénierie canadien, et l'Oxford Robotics Institute (ORI) ont annoncé un partenariat mondial pour déployer des robots autonomes et des systèmes d'IA physique dans les centrales nucléaires. L'ORI, rattaché à l'Université d'Oxford et dirigé par le professeur Nick Hawes, apporte sa recherche avancée en robotique, tandis qu'AtkinsRéalis fournit l'expertise industrielle nécessaire pour transformer ces travaux en solutions opérationnelles sur le terrain. Le partenariat s'appuie sur une expérience déjà concrète : les systèmes de l'ORI ont été déployés sur le site de Sellafield, en Angleterre, où ils ont cartographié des zones de radiation et navigué dans des environnements encombrés de débris. Le cycle de développement suit une logique en trois étapes, conception en laboratoire, entraînement dans des jumeaux numériques (répliques virtuelles fidèles des installations), puis intégration dans des robots industriels par AtkinsRéalis avant déploiement dans les sites énergétiques à travers le monde. L'enjeu est considérable : dans l'industrie nucléaire, les zones les plus critiques sont précisément celles où la présence humaine doit être réduite au strict minimum en raison des doses de radiation. Ces robots autonomes, plateformes mobiles d'inspection et bras robotisés, peuvent désormais réaliser des contrôles et des réparations qui exigeaient autrefois des équipements de protection lourds et des interventions minutées. Dotés de capteurs avancés, ils interprètent des environnements dégradés, opèrent dans l'obscurité totale et prennent des décisions en temps réel sans script préprogrammé. Résultat : une meilleure collecte de données pour les décisions opérationnelles, une réduction des coûts d'intervention, et surtout une exposition humaine aux rayonnements ramenée à zéro. Sam Stephens, responsable du numérique nucléaire chez AtkinsRéalis, souligne que l'objectif est de "passer rapidement de la recherche au déploiement opérationnel dans des centrales du monde entier". Ce partenariat s'inscrit dans une tendance de fond qui voit l'industrie nucléaire investir massivement dans la robotique pour sécuriser et moderniser ses opérations. AtkinsRéalis construit activement un écosystème technologique en s'associant à des acteurs comme NVIDIA pour le traitement IA et Kinova pour le matériel robotique. Parallèlement, d'autres institutions avancent sur des problématiques connexes : l'Institute of Science Tokyo a récemment annoncé le développement d'un récepteur Wi-Fi résistant aux radiations, capable de fonctionner sous des doses mille fois supérieures aux seuils tolérés par l'électronique standard, ce qui permettrait aux robots de maintenir des communications haut débit jusque dans le coeur des réacteurs. La prochaine génération de gestion du nucléaire se dessine ainsi : des machines qui ne se fatiguent pas, ne craignent pas les rayonnements, et collectent en continu les données dont dépendent les décisions les plus critiques du secteur.

UELe partenariat mobilise l'Université d'Oxford et couvre déjà le site de Sellafield au Royaume-Uni, avec des retombées potentielles pour les opérateurs nucléaires européens cherchant à réduire l'exposition aux rayonnements de leurs travailleurs.

RobotiqueActu
1 source
SHAREBOT lève plusieurs centaines de millions de yuans pour accélérer son réseau de déploiement de robots
321Pandaily 

SHAREBOT lève plusieurs centaines de millions de yuans pour accélérer son réseau de déploiement de robots

SHAREBOT, plateforme chinoise de location de robots, a bouclé un nouveau tour de table de pré-série A d'un montant de plusieurs centaines de millions de yuans, son quatrième financement en seulement quatre mois d'existence. Le tour a attiré des investisseurs stratégiques de premier plan, notamment Chia Tai Robot (filiale du conglomérat thaïlandais CP Group), Changxin Shares, ainsi que deux sociétés cotées en bourse, Mecury Intelligent (002881.SZ) et Lens Technology (300433.SZ / 06613.HK). Les investisseurs historiques Mingjia Capital, Zhixing Investment et Ruizi Venture Capital ont pour leur part sursouscrit massivement leurs allocations. À la mi-avril 2026, la plateforme SHAREBOT intégrait plus de 4 000 robots déployables, avec une couverture s'étendant à plus de 100 villes chinoises. Les fonds levés seront principalement affectés au développement d'un réseau national de distribution et de services, à l'amélioration des systèmes de gestion et de dispatch des actifs robotiques, au renforcement des infrastructures d'assurance logistique, et à l'expansion des capacités à l'international. Ce financement illustre la transition en cours dans l'industrie robotique chinoise : la compétition ne se joue plus sur les prouesses techniques ou les démonstrations, mais sur la capacité d'exécution à grande échelle. Le PDG Li Yiyan a déclaré que l'enjeu n'est pas d'augmenter simplement le volume de locations, mais de construire un système intégré couvrant l'approvisionnement en équipements, la mise en relation avec les besoins des entreprises, les services urbains, la garantie de livraison et les réseaux mondiaux. Pour les clients industriels et commerciaux, cela signifie un accès à des robots opérationnels de manière standardisée, sans avoir à gérer la complexité de la maintenance ou du renouvellement du parc. SHAREBOT a également noué un partenariat avec PICC Property & Casualty pour créer un système d'assurance dédié à la robotique, couvrant déjà plus d'un millier de robots et traitant ses premiers sinistres dans le domaine de l'IA incarnée. La montée en puissance de SHAREBOT s'inscrit dans un contexte d'accélération du déploiement commercial des robots en Chine, porté par des investissements massifs dans l'IA embarquée et la robotique humanoïde. L'entrée de CP Group via Chia Tai Robot est particulièrement significative : le conglomérat a précédemment investi dans Zhiyuan Robotics, spécialiste de l'IA incarnée, signalant une stratégie cohérente pour dominer l'écosystème robotique en Asie et au-delà. L'annonce du 17 avril 2026 d'une expansion internationale sous la marque SHAREBOT, combinée à la participation de Lens Technology et Mecury Intelligent, renforce les capacités de la plateforme en connectivité des appareils, gestion à distance, dispatch des commandes et coordination de la chaîne d'approvisionnement mondiale. Alors que le secteur bascule de la phase de prototypage vers le déploiement commercial répété et massif, SHAREBOT entend s'imposer comme la couche applicative incontournable permettant aux robots de quitter les labs pour s'intégrer durablement dans l'économie réelle.

RobotiqueActu
1 source
Genie Sim 3.0 : une plateforme de simulation haute fidélité pour robots humanoïdes
322arXiv cs.RO 

Genie Sim 3.0 : une plateforme de simulation haute fidélité pour robots humanoïdes

AgibotTech a publié Genie Sim 3.0, une plateforme de simulation unifiée destinée à l'apprentissage de la manipulation robotique. Son composant central, le Genie Sim Generator, utilise un grand modèle de langage (LLM) pour construire automatiquement des environnements 3D haute fidélité à partir de simples instructions en langage naturel. La plateforme intègre également le premier benchmark de robotique dont l'évaluation est entièrement automatisée par LLM : il génère en masse des scénarios de test, puis s'appuie sur un modèle vision-langage (VLM) pour noter les performances des robots sans intervention humaine. AgibotTech publie simultanément un jeu de données open source de plus de 10 000 heures de données synthétiques couvrant plus de 200 tâches distinctes, accessible sur GitHub. L'enjeu central est le fossé entre simulation et monde réel, le fameux problème du "sim-to-real transfer", qui freine depuis des années le déploiement à grande échelle des robots apprenants. Collecter des données dans le monde physique coûte extrêmement cher et se heurte à des contraintes de passage à l'échelle quasi insurmontables. Genie Sim 3.0 démontre expérimentalement que ses données synthétiques permettent un transfert "zéro-shot" vers le monde réel, c'est-à-dire que des politiques de contrôle entraînées uniquement en simulation fonctionnent directement sur des robots physiques, sans phase d'adaptation supplémentaire. Pour les laboratoires de robotique et les startups du secteur, cela ouvre la possibilité de produire des volumes de données d'entraînement plusieurs ordres de grandeur supérieurs à ce qu'autorise la réalité physique, à une fraction du coût. Cette publication s'inscrit dans une course mondiale à la robotique humanoïde impliquant des acteurs comme Figure AI, Physical Intelligence, Boston Dynamics ou encore Tesla avec Optimus. L'un des goulots d'étranglement communs à tous est précisément la rareté des données d'entraînement de qualité et la fragmentation des benchmarks, chaque laboratoire travaillant dans son propre silo de simulation. En proposant une plateforme ouverte, un dataset massif et une procédure d'évaluation standardisée et automatisée, AgibotTech tente de poser une infrastructure commune au champ. La prochaine étape sera de vérifier si ce transfert zéro-shot tient dans des conditions moins contrôlées, avec des objets, des éclairages et des configurations inédits.

UELes laboratoires de robotique et startups européens peuvent accéder librement aux 10 000 heures de données synthétiques sur GitHub pour accélérer leurs recherches sur le transfert sim-to-réel, sans avoir à produire ces données coûteusement en conditions réelles.

💬 Le fossé sim-to-real, c'est le mur sur lequel tous les labos de robotique se cognent depuis des années. Que des données purement synthétiques suffisent à piloter du vrai métal sans phase d'adaptation, c'est la promesse qu'on attendait vraiment. Reste à voir si ça tient avec des objets imprévus, un mauvais éclairage, le vrai bazar du monde réel.

RobotiqueActu
1 source
MiMo-Embodied : rapport technique du modèle de fondation X-Embodied
323arXiv cs.RO 

MiMo-Embodied : rapport technique du modèle de fondation X-Embodied

Xiaomi a publié en open source MiMo-Embodied, un modèle fondamental dit "cross-embodied" conçu pour unifier deux domaines jusqu'ici distincts : la conduite autonome et l'IA incarnée (robots, agents physiques). Selon le rapport technique associé, le modèle établit de nouveaux records sur 29 benchmarks au total, 17 en IA incarnée, couvrant la planification de tâches, la prédiction d'affordance et la compréhension spatiale, et 12 en conduite autonome, sur la perception environnementale, la prédiction d'état et la planification de trajectoire. Il surpasse à la fois les modèles open source, les modèles propriétaires et les systèmes spécialisés sur ces évaluations. Le code et les poids sont disponibles sur GitHub sous l'organisation XiaomiMiMo. Ce qui rend ce résultat notable, c'est que les deux domaines ont longtemps été traités séparément : un robot domestique et un véhicule autonome semblent peu comparables. Or MiMo-Embodied démontre qu'ils partagent suffisamment de structure sous-jacente, compréhension de l'espace, planification d'action, interaction avec un environnement physique, pour se renforcer mutuellement lors de l'entraînement. Cette synergie, appelée "transfert positif", signifie qu'apprendre à conduire rend le modèle meilleur pour manipuler des objets, et vice versa. Pour l'industrie, cela ouvre la voie à des modèles généraux capables de s'adapter à plusieurs types de corps ou de véhicules sans être réentraînés depuis zéro. L'approche repose sur un entraînement multi-étapes, une construction soigneuse des données d'entraînement, et un affinage par chain-of-thought (CoT) combiné à du reinforcement learning, des techniques popularisées par les grands modèles de langage mais ici appliquées à des agents physiques. Xiaomi s'inscrit ainsi dans une course internationale au modèle fondamental robotique, aux côtés de Google, Physical Intelligence ou Tesla pour Optimus. La publication en open source constitue un signal fort : l'entreprise mise sur la recherche communautaire pour accélérer le développement, tout en positionnant ses propres écosystèmes matériels, smartphones, robots, voitures connectées, comme terrain d'application naturel.

RobotiquePaper
1 source
Capteurs tactiles et de proximité comme a priori d'observation pour l'évitement de collisions des humanoïdes
324arXiv cs.RO 

Capteurs tactiles et de proximité comme a priori d'observation pour l'évitement de collisions des humanoïdes

Des chercheurs ont présenté un cadre d'apprentissage par renforcement pour permettre à un robot humanoïde H1-2 d'éviter les collisions avec l'ensemble de son corps, en s'appuyant uniquement sur des capteurs tactiles et de proximité répartis sur sa partie supérieure. Pour évaluer le système, l'équipe a utilisé le dodgeball comme tâche de référence : le robot doit esquiver des balles lancées dans sa direction, sans recourir à des caméras externes. Les chercheurs ont ensuite fait varier systématiquement les propriétés des capteurs, notamment leur couverture spatiale, leur type et leur portée, afin de comprendre comment chacun de ces paramètres influence le comportement d'évitement appris. Les résultats bousculent certaines intuitions du domaine. Contrairement à ce qu'on pourrait supposer, des mesures de proximité brutes, sans localisation explicite des objets, suffisent à produire un comportement d'évitement efficace, à condition que la portée des capteurs soit suffisante. Plus surprenant encore, des signaux de proximité clairsemés et non directionnels surpassent des alternatives plus denses et directionnelles en termes d'efficacité d'apprentissage : le robot apprend plus vite avec moins d'information, pour peu que celle-ci couvre bien l'espace autour de lui. Ces conclusions ont des implications directes pour la conception matérielle des robots humanoïdes, en suggérant qu'un équipement sensoriel plus simple peut suffire là où l'on cherchait à maximiser la précision. L'enjeu derrière ces travaux est la sécurité des robots en environnement non contrôlé. Les caméras externes souffrent d'occlusions fréquentes dès que le robot interagit avec son environnement ou d'autres personnes, ce qui rend les capteurs embarqués sur le corps particulièrement précieux. Le H1-2 est l'un des robots humanoïdes commerciaux les plus accessibles du marché, ce qui donne à cette recherche une portée concrète au-delà du laboratoire. Alors que les déploiements industriels et domestiques de robots humanoïdes s'accélèrent, comprendre comment minimiser le risque de collision tout en réduisant la complexité sensorielle est une question centrale pour rendre ces machines réellement utilisables au quotidien.

RobotiqueActu
1 source
VISION-SLS : contrôle sûr par représentations visuelles apprises via synthèse système
325arXiv cs.RO 

VISION-SLS : contrôle sûr par représentations visuelles apprises via synthèse système

Des chercheurs ont publié VISION-SLS, une méthode de contrôle robotique capable de piloter un robot en temps réel à partir d'images RGB haute résolution tout en garantissant formellement la sécurité du comportement. La méthode a été testée sur plusieurs systèmes simulés : une voiture à 4 dimensions d'état, un quadrirotor à 10 dimensions, et un humanoïde à 59 dimensions opérant dans des conditions de visibilité partielle, le tout avec des flux vidéo d'au moins 512 x 512 pixels. Elle a également été validée sur un véritable véhicule terrestre contrôlé uniquement par ses caméras embarquées, surpassant les approches concurrentes en termes de taux de sécurité et de temps de calcul. Le code source est disponible sur GitHub. Ce qui distingue VISION-SLS des approches existantes, c'est sa capacité à combiner apprentissage profond et garanties formelles de sécurité, deux mondes qui s'ignoraient largement jusqu'ici. En robotique autonome, un système peut prendre de bonnes décisions en moyenne tout en échouant catastrophiquement dans des cas limites. VISION-SLS résout ce problème en construisant des bornes d'erreur calibrées empiriquement sur la représentation visuelle apprise, puis en intégrant ces incertitudes directement dans l'optimisation de la politique de contrôle via un cadre appelé System Level Synthesis (SLS). Résultat : le robot adopte un comportement actif de réduction d'incertitude, cherchant à mieux se localiser, tout en restant dans des zones certifiées sûres. Le défi fondamental que cherche à résoudre VISION-SLS est vieux comme la robotique moderne : comment piloter un système physique depuis des capteurs imparfaits, avec des dynamiques non linéaires, sans garanties de collision ? Les méthodes de contrôle classiques exigent un état complet et précis du système ; les méthodes d'apprentissage par renforcement offrent de bonnes performances moyennes mais sans garanties. SLS est un cadre de théorie du contrôle qui permet de concevoir des politiques robustes avec des garanties mathématiques, mais il était jusqu'ici inapplicable à des entrées visuelles haute dimension. VISION-SLS lève cet obstacle en apprenant une représentation compacte des images avec des bornes d'erreur exploitables, et en développant un solveur original basé sur la programmation convexe séquentielle couplée à des récursions de Riccati pour rendre le tout calculable en temps réel.

RobotiqueOpinion
1 source
ProDrive : planification proactive pour la conduite autonome par co-évolution véhicule-environnement
326arXiv cs.RO 

ProDrive : planification proactive pour la conduite autonome par co-évolution véhicule-environnement

Des chercheurs ont présenté ProDrive, un nouveau système de planification proactive pour la conduite autonome, dans un article soumis sur arXiv (référence 2604.25329). Contrairement aux approches classiques qui génèrent des trajectoires uniquement à partir de l'observation instantanée de l'environnement, ProDrive repose sur un modèle du monde entraîné conjointement avec le planificateur de trajectoires, dans une architecture bout-en-bout. Le système produit simultanément plusieurs trajectoires candidates et des représentations internes de l'ego du véhicule, que le modèle du monde utilise pour prédire l'évolution future de la scène de conduite en vue aérienne (bird's-eye view). Toutes les trajectoires candidates sont évaluées en parallèle, et le gradient circule dans les deux sens, ce qui permet au modèle du monde d'influencer directement la sélection de trajectoire. Sur le benchmark NAVSIM v1, ProDrive surpasse les meilleures solutions existantes en matière de sécurité et d'efficacité de planification. L'enjeu est majeur : les systèmes de conduite autonome actuels peinent à anticiper l'évolution dynamique de la route, ce qui entraîne des décisions myopes et des situations à risque. ProDrive rompt avec cette logique purement réactive en permettant au véhicule de simuler mentalement l'impact de ses décisions futures avant de les exécuter, un peu comme un conducteur expérimenté qui anticipe les mouvements des autres usagers. Ce couplage bidirectionnel entre planification et modélisation du monde représente une avancée architecturale significative pour l'industrie, qui cherche depuis plusieurs années à doter les véhicules autonomes d'une forme de raisonnement prospectif plutôt que d'une simple réaction aux stimuli immédiats. La conduite autonome de niveau 4 et 5 bute depuis longtemps sur le problème des situations rares et imprévisibles, où les systèmes réactifs échouent faute d'avoir pu anticiper. Les approches par modèles du monde, inspirées des travaux en IA générale et en robotique, gagnent du terrain dans la recherche, avec des acteurs comme Wayve, Tesla ou des équipes universitaires qui y investissent massivement. ProDrive s'inscrit dans cette tendance de fond, avec une contribution technique précise : l'injection des représentations du planificateur dans le modèle du monde pour créer une boucle de rétroaction différentiable. La prochaine étape sera de valider ces résultats sur des données réelles et dans des conditions de déploiement, au-delà du seul benchmark NAVSIM.

UELes constructeurs européens (Renault, Stellantis, Volkswagen) et les laboratoires de recherche en conduite autonome pourraient s'appuyer sur cette architecture pour améliorer leurs systèmes de planification, dans un secteur stratégique où l'Europe cherche à rester compétitive face aux acteurs américains et asiatiques.

RobotiquePaper
1 source
Sélection de capteurs pour la cueillette de fruits par préhenseurs à ventouses
327arXiv cs.RO 

Sélection de capteurs pour la cueillette de fruits par préhenseurs à ventouses

Des chercheurs ont développé et testé un système de capteurs multimodaux intégré dans un préhenseur à ventouse souple conçu pour la cueillette automatisée de pommes. Présenté dans une étude publiée sur arXiv (référence 2604.24906), le travail a été conduit directement dans un verger réel, ce qui lui confère une valeur pratique immédiate. L'objectif central est de détecter avec fiabilité si un fruit a été correctement saisi ou s'il risque de glisser, deux événements que les robots actuels peinent à distinguer. Les algorithmes testés, un Random Forest et un réseau de neurones multicouche (MLP), atteignent tous deux plus de 90 % de précision dans la classification de l'état de prise, et le Random Forest parvient à prédire un glissement ou un échec dans un délai de 0,09 seconde par rapport aux annotations humaines de référence. Ce résultat est significatif pour l'automatisation agricole, un secteur sous forte pression face au manque de main-d'œuvre saisonnière et aux coûts croissants de la récolte manuelle. Détecter un échec de préhension avant qu'il ne se produise permet d'éviter les chutes de fruits, les dommages mécaniques et les pertes de rendement. En identifiant précisément quels capteurs sont les plus utiles selon chaque phase de la prise, les auteurs ouvrent aussi la voie à des systèmes moins coûteux et plus robustes, en se limitant au nombre minimal de capteurs nécessaires plutôt qu'en multipliant les composants. La robotique agricole bute depuis des années sur la complexité des environnements de verger : occultations par le feuillage, variabilité des attaches de tiges, déformation des fruits sous pression. Les approches précédentes reposaient essentiellement sur la vision ou sur des fusions de capteurs non optimisées, sans tenir compte du fait que les besoins en information évoluent au fil des phases de la cueillette. Cette étude introduit une logique de sélection adaptée à chaque phase, une piste prometteuse pour rendre les robots agricoles à la fois plus précis et économiquement viables à grande échelle.

UELa pénurie de main-d'œuvre saisonnière agricole étant un enjeu structurel en Europe, des systèmes de préhension robotique plus fiables pourraient réduire la dépendance aux travailleurs détachés et améliorer la rentabilité des filières fruitières françaises et européennes.

RobotiqueActu
1 source
Améliorer la couverture sensorielle et la conformité des peaux artificielles imprimées en 3D grâce à des capteurs multimodaux et des matériaux souples
328arXiv cs.RO 

Améliorer la couverture sensorielle et la conformité des peaux artificielles imprimées en 3D grâce à des capteurs multimodaux et des matériaux souples

Des chercheurs ont développé une nouvelle génération de peaux artificielles imprimées en 3D capables de couvrir l'ensemble du corps d'un robot avec des capteurs tactiles et de proximité. Présentés dans une étude diffusée sur arXiv (arXiv:2504.25563), ces revêtements hybrides combinent deux modalités de détection : le temps de vol (ToF), qui mesure la distance par impulsions lumineuses, et la capacitance propre (SC), qui détecte le contact ou la pression via des variations électriques. Le système a été validé sur un bras robotique FR3, équipé de six unités de peau totalisant 40 éléments sensoriels répartis sur sa surface. Ce que cette recherche change concrètement, c'est la capacité des robots à percevoir leur environnement de manière fine et continue, sans dépendre d'une seule source d'information sensorielle. La combinaison ToF et SC permet simultanément de détecter les contacts, de reconstruire une scène spatiale et de mesurer la pression exercée sur le revêtement souple. Ce dernier point est particulièrement significatif : les matériaux souples utilisés absorbent les chocs et transmettent les variations de pression en signaux exploitables, là où les implémentations précédentes restaient cantonnées à des matériaux rigides et à un seul type de capteur. Pour les applications en robotique collaborative, où un bras mécanique partage l'espace de travail avec des humains, cette sensibilité multi-modale est un prérequis de sécurité. Jusqu'ici, les peaux artificielles pour robots se heurtaient à deux obstacles majeurs : la rigidité des matériaux, qui limite leur adhérence et leur confort sur des surfaces courbes, et l'absence de combinaison sensorielle, qui rendait la détection partielle. L'impression 3D offre une voie de fabrication scalable, c'est-à-dire adaptable à différentes morphologies robotiques sans recourir à des processus industriels coûteux. L'intégration d'une interface électrique simplifiée entre les traces conductrices imprimées et l'électronique externe représente également un progrès pratique. La prochaine étape logique sera d'étendre cette couverture à des robots entiers et de tester la robustesse du système dans des environnements industriels réels.

UECes travaux pourraient bénéficier aux fabricants européens de robots collaboratifs, notamment dans l'industrie allemande et française où l'adoption des cobots est en forte croissance, en réduisant les coûts de fabrication des revêtements sensoriels via l'impression 3D.

RobotiqueOpinion
1 source
asRoBallet : réduire l'écart sim-réel grâce au renforcement intégrant la friction pour sphères sous-actionnées
329arXiv cs.RO 

asRoBallet : réduire l'écart sim-réel grâce au renforcement intégrant la friction pour sphères sous-actionnées

Des chercheurs ont présenté asRoBallet, décrit comme le premier robot humanoïde ballbot à être piloté avec succès par apprentissage par renforcement (RL) sur un vrai matériel. Un ballbot est un robot qui s'équilibre sur une sphère, à l'instar d'un jongleur sur un ballon. L'article, déposé sur arXiv sous la référence 2604.24916, décrit comment l'équipe a développé une simulation haute fidélité sous MuJoCo pour modéliser avec précision la mécanique des roues omnidirectionnelles de type ETH, capturant notamment les vibrations parasites et les discontinuités de contact habituellement ignorées. Cette simulation alimenter un cadre nommé Friction-Aware Reinforcement Learning, qui maîtrise simultanément les frictions de roulement, latérale et torsionnelle aux interfaces roue-sphère et sphère-sol. Le robot a également été conçu à faible coût en réutilisant des composants d'un quadrupède existant, et un écosystème iOS a été développé pour permettre à un seul opérateur de le piloter via des mouvements naturels sur smartphone. L'enjeu central de ce travail est le fossé sim2real, ce gouffre notoire entre les comportements appris en simulation et les résultats obtenus sur le vrai matériel. Ici, le transfert est qualifié de zero-shot : le robot n'a besoin d'aucun recalibrage entre la simulation et le déploiement physique. C'est un résultat significatif, car les modèles de friction complexes ont historiquement rendu ce type de transfert très difficile pour les systèmes sous-actionnés. Pour l'industrie de la robotique humanoïde, cette démonstration ouvre la voie à des plateformes d'équilibrage dynamique plus agiles et plus économiques, sans passer par des méthodes de contrôle classiques lourdes à paramétrer. Les ballbots sont depuis longtemps un banc d'essai de référence pour le contrôle non-holonome et sous-actionné. Jusqu'ici, les approches dominantes restaient le LQR et le MPC, efficaces pour l'équilibrage 3D mais peu adaptés à des comportements expressifs ou à une généralisation robuste. La latence des actionneurs et les risques d'exploration non sécurisée sur le matériel réel avaient freiné l'adoption du RL dans ce domaine. En levant ces obstacles via une modélisation fine du contact et une interface de contrôle intuitive, asRoBallet pose les bases d'une nouvelle génération de robots humanoïdes capables de mouvements complexes appris entièrement en simulation.

RobotiqueOpinion
1 source
HANDFUL : manipulation dextre séquentielle conditionnée par la préhension et les ressources disponibles
330arXiv cs.RO 

HANDFUL : manipulation dextre séquentielle conditionnée par la préhension et les ressources disponibles

Des chercheurs ont publié le 29 avril 2026 sur arXiv un article présentant HANDFUL, un nouveau cadre d'apprentissage pour la manipulation dextère séquentielle par des robots à main articulée. L'idée centrale est de permettre à un robot d'effectuer plusieurs actions successives sur des objets, par exemple saisir un objet puis le pousser, le tirer ou appuyer dessus, sans relâcher sa prise initiale. Pour cela, HANDFUL modélise l'usage des doigts comme une ressource limitée et entraîne le robot à adopter des prises "économes" qui réservent des doigts disponibles pour les tâches suivantes. L'approche repose sur des récompenses de contact au niveau de chaque doigt et un apprentissage par curriculum. Les chercheurs ont également créé HANDFUL-Bench, un benchmark de simulation dédié aux tâches de manipulation dextère séquentielle sous contrainte de prise partagée, couvrant trois types de sous-tâches : pousser, tirer et presser. Le système a été validé en simulation et sur un robot physique équipé d'une main LEAP. Ce travail ouvre la voie à des robots capables de manipulations multitâches complexes, là où la quasi-totalité des recherches antérieures se limitait à des tâches mono-objet et mono-action. En pratique, la capacité à planifier une prise en anticipant les actions futures améliore significativement le taux de réussite des sous-tâches secondaires, ainsi que la robustesse globale du robot, par rapport à une approche naïve qui optimise chaque prise sans tenir compte de la suite. Pour l'industrie, cela représente une avancée concrète vers des bras robotiques capables d'enchaîner des gestes dans des environnements non structurés, comme l'assemblage, la logistique ou l'assistance à domicile. La manipulation dextère reste l'un des défis les plus difficiles de la robotique : les mains à plusieurs doigts sont mécaniquement complexes et difficiles à contrôler par apprentissage par renforcement. La plupart des approches existantes cherchent à optimiser une seule tâche à la fois, ignorant les contraintes imposées par les actions ultérieures. HANDFUL s'inscrit dans une tendance émergente qui pousse les robots vers une planification holistique de leurs ressources motrices. Les prochaines étapes naturelles incluront l'extension à des chaînes de tâches plus longues et à des objets plus variés, ainsi que le transfert depuis la simulation vers des robots réels dans des conditions non contrôlées.

RobotiqueActu
1 source
Modélisation dynamique par apprentissage automatique et contrôle robuste pour robots continus à tendons
331arXiv cs.RO 

Modélisation dynamique par apprentissage automatique et contrôle robuste pour robots continus à tendons

Des chercheurs ont publié le 29 avril 2026 une nouvelle approche pour contrôler les robots continus à tendons (TDCRs), une catégorie de robots souples dont les mouvements sont pilotés par des câbles ou tendons internes. Ces systèmes sont particulièrement difficiles à modéliser en raison de non-linéarités complexes : hystérésis de friction, compliance de transmission et comportements dynamiques qui s'amplifient sur de longues séquences de mouvements. L'équipe propose un cadre d'apprentissage différentiable combinant un modèle de dynamique haute fidélité basé sur des réseaux GRU (Gated Recurrent Units) avec une politique de contrôle neuronal entraînée de bout en bout. Le modèle intègre une connectivité bidirectionnelle multi-canaux et une prédiction résiduelle pour supprimer l'accumulation d'erreurs lors des prédictions auto-régressives sur le long terme. Les expériences ont été menées sur un robot physique à trois sections, validant les performances en conditions réelles. Cette approche dépasse les méthodes classiques basées sur le jacobien, qui génèrent des oscillations auto-entretenues problématiques pour la précision et la stabilité. En traitant le modèle de dynamique comme un "pont de gradient", la politique de contrôle apprend implicitement à compenser les non-linéarités intrinsèques du robot sans qu'il soit nécessaire de les modéliser explicitement. Le résultat est un suivi de trajectoire précis et une robustesse supérieure face à des charges utiles inconnues, c'est-à-dire des poids non intégrés lors de l'entraînement, ce qui est critique pour les applications en environnements variables. Les robots continus à tendons suscitent un intérêt croissant en chirurgie mini-invasive, inspection industrielle et manipulation en espaces confinés, précisément parce que leur souplesse leur permet d'évoluer là où les bras rigides échouent. Le principal verrou restait leur contrôle fiable dans des conditions dynamiques réelles. Cette publication s'inscrit dans une tendance plus large d'intégration de l'apprentissage automatique dans la robotique physique, où les modèles appris remplacent progressivement les équations analytiques trop simplificatrices. Les prochaines étapes pourraient inclure la généralisation à des robots à plus de sections, l'adaptation en temps réel au vieillissement mécanique des tendons, et une intégration dans des systèmes chirurgicaux assistés.

RobotiqueOpinion
1 source
Combler le fossé intérieur-extérieur : télémétrie multi-technologie pour la navigation de robots
332arXiv cs.RO 

Combler le fossé intérieur-extérieur : télémétrie multi-technologie pour la navigation de robots

Des chercheurs ont publié une étude préliminaire sur le positionnement des robots mobiles en transition entre espaces extérieurs et intérieurs, s'appuyant sur le jeu de données HYMN (pour "Hybrid Measurement Navigation"). Ce dataset compile des mesures brutes et synchronisées provenant de quatre technologies de localisation distinctes : le GNSS (GPS et systèmes satellites), l'Ultra-Wideband (UWB), le WiFi Fine Time Measurement (FTM) et le Bluetooth Low Energy (BLE). Toutes ces données sont confrontées à une vérité terrain précise au millimètre, collectées dans un environnement industriel réel. L'article, déposé sur arXiv sous la référence 2504.25541, est signé par une équipe qui rend le dataset librement accessible à la communauté. Le problème central est bien connu dans la robotique mobile : le GNSS fonctionne bien en extérieur mais devient inutilisable dès que le robot passe sous un toit, tandis que les technologies radio terrestres comme l'UWB ou le WiFi FTM opèrent efficacement en intérieur mais perdent leurs ancres de référence dès qu'on sort du bâtiment. Le point de transition, la porte, le couloir de chargement, le seuil d'entrepôt, est précisément la zone où les deux classes de technologies se dégradent simultanément. Les auteurs montrent que leurs comportements d'erreur sont complémentaires, ce qui ouvre la voie à une fusion au niveau des mesures brutes plutôt qu'au niveau des positions estimées, une approche bien plus robuste théoriquement mais quasi inexploitée jusqu'ici. Ce travail s'inscrit dans un contexte d'essor des robots logistiques et industriels qui doivent naviguer de façon autonome entre quais de chargement, cours extérieures et entrepôts, sans interruption de service ni recalibration manuelle. Les grandes plateformes d'automatisation d'entrepôts, qu'il s'agisse de solutions déployées par Amazon Robotics, Locus Robotics ou leurs concurrents européens, se heurtent toutes à ce problème de continuité de positionnement. En mettant le dataset HYMN à disposition, les auteurs visent à permettre à d'autres équipes de développer et comparer des algorithmes de fusion multi-technologies, un chantier encore largement ouvert malgré son importance opérationnelle croissante.

UELes entreprises européennes d'automatisation logistique peuvent exploiter le dataset HYMN (librement accessible) pour développer des algorithmes de fusion multi-technologies et améliorer la continuité de navigation de leurs robots en transition intérieur-extérieur, un verrou opérationnel clé pour la compétitivité industrielle européenne.

RobotiqueOpinion
1 source
Robots à tendons avec colonne vertébrale polymère flexible conique : conception, fabrication et modélisation
333arXiv cs.RO 

Robots à tendons avec colonne vertébrale polymère flexible conique : conception, fabrication et modélisation

Des chercheurs ont présenté une nouvelle génération de robots continus à actionnement par tendons, fabriqués par impression 3D à partir de polyuréthane thermoplastique (TPU), un matériau souple et économique. La caractéristique centrale du design est son architecture conique, c'est-à-dire que la colonne vertébrale flexible du robot s'affine progressivement de la base vers l'extrémité, ce qui lui confère une souplesse accrue à la pointe et une rigidité maintenue à la base. Le système intègre une électronique embarquée permettant de contrôler et de mesurer en temps réel la tension des tendons grâce à des actionneurs et des cellules de charge. Les chercheurs ont validé leur modèle de simulation face à des données de capture de mouvement réelle, atteignant une précision de prédiction de forme à l'échelle du centimètre. En démonstration finale, le robot a réussi des tâches de préhension téléopérée en utilisant une pince endoscopique montée sur un bras robotique à 6 degrés de liberté. L'intérêt de ce travail réside dans la combinaison rare entre performance mécanique et accessibilité. La plupart des robots continus existants sont conçus pour un usage unique, coûteux à produire et difficiles à modifier. Ici, le design paramétrique permet d'adapter rapidement la géométrie via des scripts CAD fournis en accès libre, ce qui ouvre la voie à des applications dans l'inspection industrielle, la chirurgie mini-invasive ou la manipulation en environnement contraint, sans nécessiter de moyens de fabrication industriels. La conformation conique améliore notamment la manipulabilité distale, c'est-à-dire la capacité du robot à atteindre des angles et des configurations variées en bout de bras, un paramètre clé pour les tâches en espace confiné. Les robots continus, inspirés de la biologie des tentacules et des trompes, font l'objet d'une attention croissante dans la robotique médicale et industrielle depuis une décennie. Leur principal verrou technologique reste la modélisation précise de leur comportement mécanique, particulièrement complexe car ils déforment tout leur corps plutôt qu'un seul joint articulé. Les auteurs s'appuient sur la théorie des tiges de Cosserat, un formalisme mathématique reconnu, qu'ils étendent ici pour intégrer la variation géométrique longitudinale de la section transversale. La diffusion des scripts de génération paramétrique et l'utilisation exclusive d'imprimantes FDM grand public positionnent cette approche comme une base reproductible pour d'autres équipes souhaitant explorer la robotique souple sans infrastructure lourde.

RobotiqueOpinion
1 source
GS-Playground : un simulateur photoréaliste haute cadence pour l'apprentissage robotique par vision
334arXiv cs.RO 

GS-Playground : un simulateur photoréaliste haute cadence pour l'apprentissage robotique par vision

Des chercheurs ont publié sur arXiv un article présentant GS-Playground, un simulateur haute performance conçu pour entraîner des robots à partir de données visuelles. Le système repose sur une combinaison inédite : un moteur physique parallèle développé spécifiquement pour fonctionner avec le rendu 3D Gaussian Splatting (3DGS), une technique de reconstruction visuelle photorréaliste. Le résultat est un débit de 10 000 images par seconde à une résolution de 640x480 pixels, ce qui représente une rupture significative par rapport aux simulateurs existants. GS-Playground intègre également un pipeline automatisé baptisé Real2Sim, capable de reconstruire des environnements simulés fidèles à la réalité physique à partir de scènes du monde réel, sans modélisation manuelle fastidieuse. L'enjeu est majeur pour la robotique et l'IA incarnée : entraîner un robot à agir dans le monde réel requiert des millions de simulations, mais les simulateurs visuellement réalistes sont jusqu'ici trop lents pour fonctionner à grande échelle. GS-Playground réduit drastiquement ce goulot d'étranglement computationnel, rendant possible l'apprentissage par renforcement visuel à grande échelle. Les expériences présentées couvrent trois catégories de tâches : la locomotion, la navigation et la manipulation d'objets au contact, trois domaines où la précision visuelle est déterminante pour transférer les comportements appris en simulation vers des robots réels. Le problème du "sim-to-real gap", c'est-à-dire l'écart entre ce qu'un robot apprend en simulation et ce qu'il peut réellement faire dans le monde physique, est l'un des verrous centraux de la robotique moderne. Les simulateurs massivement parallèles comme Isaac Gym d'NVIDIA ont déjà transformé l'apprentissage moteur basé sur la proprioception, mais ils restent aveugles sur le plan visuel. GS-Playground s'attaque à cette limite en combinant physique et rendu réaliste dans un seul pipeline cohérent. Si les résultats se confirment hors du cadre académique, ce type d'infrastructure pourrait accélérer sensiblement le développement de robots capables d'opérer dans des environnements non structurés.

RobotiqueOpinion
1 source
SAMe : un moteur de cartographie anatomique sémantique pour l'échographie robotique
335arXiv cs.RO 

SAMe : un moteur de cartographie anatomique sémantique pour l'échographie robotique

Des chercheurs ont présenté SAMe, un moteur de cartographie anatomique sémantique conçu pour automatiser l'initialisation des examens d'échographie robotique. Publié sur arXiv (référence 2604.25646), ce système résout l'un des verrous majeurs de l'échographie autonome : savoir quoi scanner, où commencer et comment s'adapter à l'anatomie propre de chaque patient. Concrètement, SAMe fonctionne en trois étapes : il traduit une plainte clinique vague en organe cible précis, génère une représentation anatomique personnalisée à partir d'une simple photo externe du corps, puis calcule automatiquement la position et l'orientation de la sonde en six degrés de liberté, sans recours à une imagerie préopératoire IRM ou scanner. Lors des tests sur robot réel, SAMe a atteint un taux de localisation correcte de 97,3 % pour le foie et de 81,7 % pour le rein, surpassant dans les deux cas la méthode de référence basée sur des heuristiques de surface. Ces résultats représentent une avancée décisive pour rendre l'échographie robotique véritablement autonome. Jusqu'ici, même les systèmes les plus sophistiqués dépendaient d'un expert humain pour initialiser le scan, c'est-à-dire positionner correctement la sonde en début d'examen. SAMe supprime cette dépendance en intégrant une couche de compréhension anatomique explicite directement dans la boucle de contrôle du robot. Le moteur est également très léger : l'inférence pour un organe prend seulement 0,08 seconde, ce qui le rend compatible avec des systèmes embarqués et des contextes cliniques temps réel. L'échographie robotique se développe dans un contexte de tension croissante entre la demande mondiale d'imagerie médicale et la pénurie de spécialistes qualifiés, notamment dans les zones sous-dotées. Les systèmes existants avaient progressé sur le contrôle local de l'image et la régulation du contact avec la peau, mais butaient sur cette étape d'initialisation. SAMe s'inscrit dans une ambition plus large : des pipelines d'échographie autonome pilotés par la plainte du patient, sans intervention spécialisée à chaque étape. La prochaine étape attendue sera l'intégration de cette couche anatomique avec les modules de navigation et d'interprétation d'image pour former un système d'échographie entièrement autonome de bout en bout.

RobotiqueOpinion
1 source
ANCHOR : système en boucle fermée ancré physiquement pour robots mobiles de service à domicile
336arXiv cs.RO 

ANCHOR : système en boucle fermée ancré physiquement pour robots mobiles de service à domicile

Des chercheurs ont publié sur arXiv un nouveau cadre logiciel baptisé ANCHOR, conçu pour rendre les robots de service à domicile nettement plus fiables lors de tâches complexes en environnement réel. Testé sur 60 essais avec de vrais robots dans des maisons inconnues, ANCHOR a permis de faire passer le taux de réussite des tâches de 53,3 % à 71,7 %, tout en atteignant un taux de récupération de 71,4 % face à des perturbations imprévues. Le système repose sur trois mécanismes : une planification ancrée physiquement qui vérifie l'état réel de la scène après chaque action, un alignement de la base mobile qui garantit que le robot peut effectivement saisir un objet depuis l'endroit où il s'est positionné, et un système de récupération hiérarchique qui localise les erreurs au bon niveau plutôt que de tout replannifier à zéro. Ces résultats sont significatifs parce qu'ils s'attaquent à un problème concret qui bloque le déploiement domestique des robots depuis des années : non pas l'incapacité à reconnaître les objets, mais l'incohérence entre ce que le robot a planifié symboliquement et la réalité physique changeante de l'environnement. Le problème dit "arrived but inoperable", le robot arrive devant l'objet mais ne peut pas le saisir parce qu'il s'est mal positionné, est l'un des échecs les plus frustrants et les plus courants. ANCHOR le corrige en intégrant les contraintes cinématiques dès la phase de navigation. La manipulation mobile en environnement ouvert est un défi de longue date en robotique domestique. Des systèmes comme SayCan d'Alphabet ou les travaux de recherche de Boston Dynamics ont montré qu'il est possible de combiner LLM et robots physiques, mais la robustesse en conditions réelles restait le maillon faible. ANCHOR s'inscrit dans une tendance récente qui consiste à ne pas faire confiance aux seules cartes sémantiques pré-scannées, qui deviennent obsolètes dès qu'un objet est déplacé, et à ancrer chaque décision dans l'état physique vérifiable du moment. Les prochaines étapes probables seront l'intégration avec des modèles de vision-langage plus récents et des tests à plus grande échelle.

RobotiqueOpinion
1 source
SlicerRoboTMS : extension open source de 3D Slicer pour la stimulation magnétique transcrânienne robotisée
337arXiv cs.RO 

SlicerRoboTMS : extension open source de 3D Slicer pour la stimulation magnétique transcrânienne robotisée

Une équipe de chercheurs a publié SlicerRoboTMS, une extension open-source pour la plateforme logicielle 3D Slicer, dédiée à la stimulation magnétique transcrânienne assistée par robot (Robo-TMS). L'article, déposé sur arXiv (référence 2504.25661), décrit une infrastructure logicielle unifiée qui combine navigation neurologique par IRM, vision par ordinateur et contrôle robotique au sein d'un même environnement. L'extension s'appuie sur les capacités existantes de 3D Slicer en matière d'imagerie médicale et communique avec les systèmes robotiques via des protocoles standardisés et des descriptions de configuration modulaires. Le code source est disponible librement sur GitHub, sous l'organisation OpenRoboTMS. La TMS conventionnelle est une technique non invasive de stimulation cérébrale largement utilisée en psychiatrie, neurologie et recherche en neurosciences, notamment pour traiter la dépression résistante aux médicaments. Son principal défaut : la précision du positionnement de la bobine magnétique sur le crâne dépend entièrement de l'opérateur humain, ce qui nuit à la reproductibilité des traitements et des expériences. SlicerRoboTMS vise à résoudre ce problème en guidant un bras robotique à partir de données IRM du patient, améliorant ainsi la précision et la cohérence entre sessions. Pour les cliniques et les laboratoires, cela représente un gain concret en qualité de soin et en rigueur expérimentale, sans avoir à développer une infrastructure logicielle propriétaire coûteuse. Le développement de systèmes Robo-TMS bute depuis des années sur un obstacle majeur : l'intersection entre imagerie médicale, robotique et traitement du signal exige des compétences multidisciplinaires rares, que peu d'équipes réunissent. En proposant une solution open-source construite sur un logiciel médical déjà adopté mondialement, les auteurs abaissent significativement ce seuil d'entrée et facilitent le prototypage rapide. L'extension est conçue pour s'adapter à diverses configurations matérielles, ce qui la rend potentiellement compatible avec différents fabricants de bras robotiques. Les prochaines étapes naturelles concerneront la validation clinique à grande échelle et l'intégration dans des workflows hospitaliers certifiés.

UELes laboratoires de neurosciences et cliniques européens pratiquant la TMS pourraient adopter cet outil open-source pour standardiser et améliorer la précision de leurs protocoles, sans coût de développement logiciel propriétaire.

RobotiqueActu
1 source
Libra-VLA : un double système asynchrone pour équilibrer l'apprentissage du global au précis
338arXiv cs.RO 

Libra-VLA : un double système asynchrone pour équilibrer l'apprentissage du global au précis

Des chercheurs ont présenté Libra-VLA, une nouvelle architecture de modèle robotique de type Vision-Langage-Action (VLA) capable de traduire des instructions en langage naturel en mouvements physiques précis. Publiée sur arXiv (référence 2604.24921), l'étude propose une rupture avec les approches dominantes qui mappent directement les commandes linguistiques vers des signaux moteurs à haute fréquence dans une logique plate et non hiérarchisée. Libra-VLA introduit à la place un système à deux niveaux : un Planificateur Sémantique qui prédit des tokens d'action discrets capturant l'intention directionnelle générale, et un Raffineur d'Action qui s'appuie sur cette intention grossière pour générer des mouvements continus à haute fréquence permettant un alignement de précision. Les deux modules s'exécutent de manière asynchrone, chacun opérant à son propre rythme. Ce découplage hiérarchique répond à un problème fondamental des robots manipulateurs actuels : le fossé entre la sémantique de haut niveau et l'actuation motrice. En forçant un seul modèle à simultanément interpréter une instruction comme "saisir l'objet rouge" et générer des milliers de commandes moteur par seconde, les architectures monolithiques imposent une charge représentationnelle excessive. Libra-VLA allège cette charge en la répartissant intelligemment entre deux sous-systèmes spécialisés, rendant l'entraînement plus stable et plus efficace. L'approche s'avère également plus résiliente et plus réactive dans des scénarios de manipulation en monde ouvert, là où les imprévus sont nombreux. L'analyse empirique centrale de l'équipe révèle un résultat surprenant : les performances suivent une courbe en U inversé selon la granularité de la décomposition des actions, avec un pic exactement lorsque la difficulté d'apprentissage est équilibrée entre les deux sous-systèmes. Ce concept d'"équilibre d'apprentissage" ouvre une nouvelle direction de recherche pour calibrer les architectures VLA. Le domaine de la robotique généraliste est en pleine effervescence, porté par des travaux récents de Google, Physical Intelligence et Figure AI. Libra-VLA s'inscrit dans cette course à des modèles capables de manipuler des objets variés dans des environnements non contrôlés, une condition sine qua non pour des robots véritablement utiles hors des laboratoires.

RobotiqueOpinion
1 source
SODA-CitrON : association de données d'objets statiques par regroupement de détections multimodales en ligne
339arXiv cs.RO 

SODA-CitrON : association de données d'objets statiques par regroupement de détections multimodales en ligne

Des chercheurs ont publié sur arXiv une nouvelle méthode baptisée SODA-CitrON (Static Object Data Association by Clustering Multi-Modal Sensor Detections Online), conçue pour améliorer la fusion et le suivi d'objets statiques à partir de capteurs hétérogènes en temps réel. L'approche repose sur un algorithme d'apprentissage automatique non supervisé capable de regrouper des détections issues de plusieurs types de capteurs, afin d'estimer les positions d'objets immobiles et de maintenir un suivi persistant, même lorsque le nombre d'objets à détecter n'est pas connu à l'avance. Évaluée dans des scénarios de simulation Monte Carlo, la méthode affiche une complexité au pire cas log-linéaire en fonction du nombre de détections, garantissant une scalabilité applicable à des environnements denses. Les résultats sont significatifs : SODA-CitrON surpasse systématiquement les méthodes de référence testées, parmi lesquelles le filtrage basé sur POM (Probabilistic Occupancy Map), le clustering DBSTREAM et l'algorithme JPDA (Joint Probabilistic Data Association), sur quatre métriques clés : le score F1, l'erreur quadratique moyenne de position (RMSE), le MOTP (Multi-Object Tracking Precision) et le MOTA (Multi-Object Tracking Accuracy). Pour les systèmes autonomes comme les voitures sans conducteur ou les robots industriels, la capacité à cartographier précisément des objets fixes, tels que des panneaux de signalisation, des bornes ou des obstacles permanents, est aussi critique que le suivi de cibles mobiles, mais bien moins étudiée jusqu'ici. Le problème de l'association de données pour objets statiques est longtemps resté dans l'ombre des méthodes classiques pensées pour des cibles en mouvement. Les algorithmes comme JPDA supposent des modèles de déplacement qui perdent toute pertinence face à des objets immobiles détectés de façon intermittente et avec des incertitudes variables selon les capteurs. SODA-CitrON répond à ce manque en opérant de manière entièrement en ligne, sans corrélation temporelle requise entre les mesures, et en offrant une explicabilité complète de ses sorties, un atout non négligeable pour la certification de systèmes critiques dans des contextes réglementés. Cette publication, versionnée v2 sur arXiv sous l'identifiant 2602.22243, ouvre la voie à des intégrations pratiques dans des architectures de perception embarquée pour la robotique et la conduite autonome.

UELes équipementiers et constructeurs automobiles européens spécialisés dans la perception embarquée et les systèmes ADAS pourraient intégrer cette méthode pour améliorer le suivi d'objets statiques dans leurs architectures de conduite autonome.

RobotiquePaper
1 source
Paramétrisations de croyances neuronales variationnelles pour une préhension dextre robuste sous incertitude multimodale
340arXiv cs.RO 

Paramétrisations de croyances neuronales variationnelles pour une préhension dextre robuste sous incertitude multimodale

Des chercheurs ont publié sur arXiv (référence 2604.25897) une nouvelle approche pour améliorer la fiabilité de la préhension robotique en présence d'incertitudes multiples : variation des contacts entre les doigts et l'objet, imprécision des capteurs, et perturbations extérieures. Leur système, baptisé "variational neural belief", représente l'état d'incertitude du robot sous forme d'un mélange gaussien différentiable, combiné à une technique d'échantillonnage appelée Gumbel-Softmax. L'objectif n'est pas d'optimiser la performance moyenne, mais de minimiser le risque dans les scénarios les plus défavorables, via un indicateur statistique nommé CVaR (Conditional Value-at-Risk). En simulation, la méthode réduit le temps de planification d'un facteur dix par rapport aux approches à filtre particulaire, qui constituent l'état de l'art actuel. Sur un bras robotique réel équipé d'une main multi-doigts, le système réussit à saisir et soulever des objets en présence d'incertitudes de pose, en moins d'étapes et en moins de temps qu'une approche gaussienne classique. L'erreur de calibration du risque reste en dessous de 0,14, contre 0,58 pour un planificateur concurrent basé sur la méthode d'entropie croisée. Ce résultat est important car la manipulation d'objets reste l'un des talons d'Achille de la robotique industrielle et domestique. Un robot qui calcule sa stratégie de saisie en se basant sur la performance moyenne échoue systématiquement dans les situations imprévues : surface glissante, légère erreur de positionnement, vibration. En passant à une optimisation orientée sur les cas extrêmes, cette approche rend la préhension robuste là où elle compte vraiment, sans sacrifier la vitesse de décision. La robotique de manipulation est depuis des années un champ de recherche intense, notamment dans les laboratoires de DeepMind, OpenAI Robotics et Carnegie Mellon, ainsi qu'au sein de startups comme Figure et Apptronik. L'approche des POMDPs sensibles au risque existait déjà en théorie, mais les méthodes à filtres particulaires se révèlent trop lentes et trop difficiles à optimiser par gradient pour un usage pratique. En substituant une représentation différentiable et différentiable par conception, les auteurs ouvrent la voie à une intégration dans des pipelines d'apprentissage end-to-end, ce qui pourrait accélérer significativement le déploiement de robots manipulateurs autonomes dans des environnements non contrôlés.

RobotiqueOpinion
1 source
RISE : politique robotique auto-améliorante avec modèle du monde compositionnel
341arXiv cs.RO 

RISE : politique robotique auto-améliorante avec modèle du monde compositionnel

Des chercheurs ont présenté RISE, un framework d'apprentissage par renforcement pour robots qui s'améliore sans interaction physique coûteuse. Publié sur arXiv (2602.11075), le système repose sur un modèle du monde compositional constitué de deux blocs distincts : un modèle de dynamique contrôlable qui prédit l'évolution visuelle de la scène depuis plusieurs angles de caméra, et un modèle d'évaluation de la progression qui note les résultats imaginés. Ces deux composants alimentent une boucle fermée dans laquelle le robot simule des séquences d'actions en imagination, estime leur qualité, puis met à jour sa politique sans jamais bouger un seul moteur. Testé sur trois tâches réelles, RISE obtient des gains spectaculaires : +35 % en tri dynamique de briques, +45 % pour emballer un sac à dos, et +35 % pour fermer une boîte. Ce résultat compte car il s'attaque à un problème fondamental de la robotique moderne : les modèles Vision-Language-Action, malgré des capacités croissantes, restent fragiles dès qu'une manipulation implique des contacts physiques ou une dynamique rapide. La moindre déviation d'exécution peut déclencher une cascade d'échecs. L'apprentissage par renforcement classique permettrait théoriquement de rendre les robots plus robustes, mais il exige des milliers d'essais sur du matériel réel, avec des risques de casse et des procédures de remise en état longues et onéreuses. RISE contourne cette contrainte en déplaçant l'essentiel de l'apprentissage dans un espace imaginaire, rendant l'amélioration continue à la fois sûre et scalable. La robotique de manipulation est aujourd'hui dominée par l'imitation, on montre au robot des démonstrations humaines, et il reproduit. Cette approche atteint ses limites dans des environnements non contrôlés, où les objets bougent et les conditions varient. Le mouvement vers des modèles du monde capables de simuler des conséquences futures s'inscrit dans une tendance plus large, partagée avec les travaux sur les world models en jeux vidéo et en conduite autonome. RISE représente une étape concrète vers des robots capables d'auto-amélioration continue, sans dépendre d'un accès permanent à des environnements physiques instrumentés.

RobotiquePaper
1 source
Apprentissage augmenté par référence pour le contrôle précis de robots continus à tendons
342arXiv cs.RO 

Apprentissage augmenté par référence pour le contrôle précis de robots continus à tendons

Des chercheurs ont développé une nouvelle approche d'apprentissage automatique pour améliorer le contrôle précis des robots continus à tendons, une classe de robots flexibles dont les mouvements sont guidés par des câbles internes. Présentée dans un article publié sur arXiv (référence 2604.25698), la méthode repose sur un cadre d'apprentissage hors-ligne dit « augmenté par références », capable de piloter ces robots avec six degrés de liberté. Les tests ont été conduits sur une plateforme robotique à trois sections, et les résultats montrent une réduction de 50,9 % de l'erreur de position moyenne par rapport aux méthodes d'apprentissage non augmentées, ainsi qu'une nette supériorité face aux contrôleurs classiques dits « jacobiens », tant en précision qu'en stabilité, quelle que soit la vitesse de déplacement. Ce gain de performance est significatif pour les applications médicales et industrielles où ces robots flexibles sont utilisés, notamment en chirurgie mini-invasive, en endoscopie ou en exploration de structures encombrées. Le problème central des robots à tendons réside dans leur comportement non linéaire et dépendant de leur historique de mouvement : les câbles introduisent des effets d'hystérésis qui provoquent des oscillations difficiles à corriger avec les méthodes de contrôle traditionnelles. La nouvelle approche force le modèle à apprendre des mécanismes de récupération d'erreur variés sans nécessiter d'interactions physiques supplémentaires avec le robot, ce qui réduit les coûts et les risques d'usure matérielle pendant l'entraînement. La difficulté à contrôler précisément ces robots flexibles freine depuis longtemps leur déploiement dans des environnements cliniques réels, où la moindre déviation de trajectoire peut avoir des conséquences graves. Les approches par réseau de neurones récurrents (RNN), utilisées ici comme pont différentiable pour optimiser la politique de contrôle, permettent de modéliser la dépendance temporelle des dynamiques sans recourir à des modèles analytiques trop simplifiés. L'équipe introduit également une augmentation multi-échelle combinant biais stochastiques, perturbations harmoniques et marches aléatoires, ce qui expose le modèle à une grande diversité de trajectoires pendant l'entraînement. Les prochaines étapes probables incluent une validation sur des scénarios cliniques réels et une extension à des robots à sections multiples plus complexes.

UELes avancées en contrôle de précision des robots flexibles médicaux pourraient bénéficier aux établissements hospitaliers et entreprises européennes actifs en chirurgie mini-invasive et endoscopie.

RobotiqueOpinion
1 source
Coopération optimale UGV-UAV : partitionnement et inspection des plus courts chemins
343arXiv cs.RO 

Coopération optimale UGV-UAV : partitionnement et inspection des plus courts chemins

Des chercheurs ont publié le 29 avril 2026 une étude portant sur la planification coopérative de trajets entre un véhicule terrestre autonome (UGV) et un drone aérien (UAV), dans des environnements où certaines routes sont bloquées mais où ces obstacles ne sont découverts qu'au moment où un robot les atteint physiquement. L'algorithme proposé divise l'inspection du chemin en deux zones : le drone survole et inspecte la portion finale du trajet pendant que le véhicule terrestre explore la portion initiale. Testée sur les réseaux routiers réels des 50 villes les plus peuplées du monde, avec des blocages simulés aléatoirement, cette méthode réduit le temps de déplacement du véhicule terrestre jusqu'à 30 %. L'intérêt concret de cette approche réside dans la capacité à décider à l'avance comment répartir les tâches d'exploration entre les deux robots, plutôt que de réagir au fil des obstacles rencontrés. Les auteurs prouvent mathématiquement que, sans drone, le pire scénario pour un UGV seul sur un réseau composé de k chemins disjoints est d'un ratio de compétitivité de 2k-1, c'est-à-dire qu'il peut parcourir jusqu'à 2k-1 fois la distance optimale. Avec l'assistance d'un drone, ce ratio tombe à 2(vG / (vA + vG))k - 1, où vG et v_A désignent respectivement les vitesses du véhicule au sol et du drone : plus le drone est rapide par rapport au véhicule, plus le gain est important. Ce travail s'inscrit dans la continuité du "Canadian Traveller Problem", un problème classique d'optimisation formulé dans les années 1990 pour modéliser la navigation en terrain incertain. L'originalité ici est d'étendre ce cadre à une équipe hétérogène de robots, en tenant compte des coûts réels de transit et de repositionnement du drone, souvent ignorés dans les modèles théoriques antérieurs. Les applications visées incluent la gestion de crises, la logistique post-catastrophe ou la livraison autonome dans des zones où l'infrastructure routière est dégradée, des contextes où la capacité à anticiper les blocages sans explorer physiquement chaque route représente un avantage opérationnel majeur.

RobotiqueOpinion
1 source
Anyverse Dynamics lève plus de 200 millions de dollars et décroche une grande commande robotique à l'étranger
344Pandaily 

Anyverse Dynamics lève plus de 200 millions de dollars et décroche une grande commande robotique à l'étranger

La startup chinoise Anyverse Dynamics vient de boucler son tour Angel++, portant le financement total au stade angel à plus de 200 millions de dollars. Ce tour a été co-piloté par Envision Group et le Beijing AI Industry Investment Fund, avec la participation d'investisseurs déjà présents au capital comme Sequoia China, Linear Capital, Hillhouse Capital et Baidu Ventures. La société serait par ailleurs sur le point de finaliser un tour Angel+++, soutenu par de grands noms de l'internet chinois et des fonds USD et RMB de premier rang. En parallèle du financement, Envision Group a signé avec Anyverse Dynamics une commande commerciale de plus de 500 millions de yuans (environ 69 millions de dollars), couvrant des déploiements dans plusieurs régions d'Europe et d'Asie. Ce contrat, décroché dès février 2026, vise à moderniser des infrastructures d'énergies renouvelables (éolien, solaire, stockage) et à soutenir l'exploitation de centres de données IA. Il est présenté comme la première commande internationale dans le secteur de l'IA incarnée dépassant 100 millions de yuans, et le plus grand contrat international individuel jamais signé par une entreprise chinoise du domaine. Ce niveau d'engagement marque une rupture avec les expérimentations à petite échelle qui ont longtemps caractérisé le secteur. Le déploiement sera massif, avec un volet de R&D conjoint et une mise en conformité avec les normes réglementaires européennes, ce qui soulève la barre pour l'ensemble des acteurs. Au-delà de l'énergie, Anyverse Dynamics a annoncé des partenariats stratégiques avec des équipementiers automobiles comme ZF Lifetec et Aumovio, ancienne filiale de Continental, avec des robots déjà intégrés dans des lignes de production industrielles. Un accord avec une chaîne internationale de cafés pour des scénarios de service en extérieur est également évoqué, sans que la marque soit encore révélée. La rapidité de la levée s'explique en grande partie par le positionnement technique de la société. Là où la majorité des acteurs misent sur l'architecture Vision-Language-Action (VLA), Anyverse Dynamics a développé un cerveau IA généraliste baptisé MWA, fondé sur un modèle du monde en espace latent. L'argument central : les architectures VLA souffrent de pertes d'information lors du passage entre le langage et l'action, alors qu'un espace latent unifié permet la perception, l'entraînement et l'inférence dans un même cadre représentationnel. L'apprentissage par renforcement est intégré en boucle fermée pour optimiser continuellement la prise de décision. Cette vision est portée par le co-fondateur et co-CTO Xia Zhongpu, pionnier des modèles du monde et du RL en Chine, fort de plus de 15 ans d'expérience dans le domaine et crédité de la construction de l'un des premiers systèmes de conduite autonome bout-en-bout du pays. Dans un secteur où la concurrence entre acteurs chinois et occidentaux s'intensifie, Anyverse Dynamics s'impose comme l'un des paris les plus ambitieux du moment.

UELa commande commerciale de 69 millions de dollars inclut explicitement des déploiements en Europe pour moderniser des infrastructures d'énergies renouvelables, avec une mise en conformité aux normes réglementaires européennes.

RobotiqueActu
1 source
Flex et Teradyne renforcent leur partenariat pour déployer l'IA physique à grande échelle
345Robotics Business Review 

Flex et Teradyne renforcent leur partenariat pour déployer l'IA physique à grande échelle

Flex et Teradyne Robotics ont annoncé l'élargissement de leur partenariat de longue date pour accélérer le déploiement de l'IA physique et de la robotique intelligente dans le secteur manufacturier mondial. Concrètement, la collaboration repose sur une double stratégie : Flex produit les composants clés des robots de Teradyne tout en devenant l'un des principaux terrains d'expérimentation de ces mêmes machines. L'entreprise prévoit de déployer des robots collaboratifs (cobots) d'Universal Robots et des robots mobiles autonomes (AMR) de Mobile Industrial Robot, deux filiales de Teradyne, dans ses propres usines à travers le monde. Les deux groupes ont déclaré qu'ils travailleront ensemble à résoudre les défis liés à l'alimentation électrique, à la gestion thermique et au passage à l'échelle, en s'appuyant sur des infrastructures IT avancées et des technologies de refroidissement de pointe. Ce rapprochement représente bien plus qu'un accord industriel classique : il efface la frontière traditionnelle entre fabricant de robots et utilisateur final. En intégrant directement les cobots et AMR de Teradyne dans ses lignes de production tout en construisant les composants qui les alimentent, Flex tente de résoudre le problème de mise à l'échelle qui freine depuis des années l'adoption massive de l'automatisation intelligente. Pour le secteur industriel au sens large, ce cas concret devra prouver que la synergie entre fabrication avancée et robotique pilotée par l'IA peut enfin transformer des expérimentations isolées en déploiements cohérents à l'échelle planétaire. Les retours opérationnels continus issus des usines de Flex permettront de valider les technologies en conditions réelles et d'accélérer la réplication des workflows d'automatisation réussis. Flex et Teradyne collaborent depuis plus de vingt ans sur des équipements de test de semi-conducteurs, ce qui donne à ce partenariat élargi une base technique et relationnelle solide. Flex est un géant discret de la chaîne d'approvisionnement mondiale : l'entreprise exploite plus de 100 sites dans 30 pays, emploie 140 000 personnes, travaille avec 16 000 fournisseurs et revendique la gestion de 80 % des besoins critiques en alimentation et en calcul pour les centres de données mondiaux. Teradyne Robotics, dont le siège est à North Reading dans le Massachusetts, s'appuie sur Universal Robots et MiR pour s'imposer comme un acteur central de la robotique industrielle collaborative. L'extension de l'accord vers l'automatisation intelligente reflète une évolution naturelle face à la complexité croissante des environnements de fabrication, notamment dans l'électronique, les équipements industriels et l'infrastructure des centres de données, secteurs en pleine expansion sous l'effet de la course mondiale à l'IA.

UEFlex, qui exploite des sites de fabrication dans plusieurs pays européens parmi ses 100+ usines mondiales, pourrait déployer ces cobots et AMR dans ses lignes de production européennes dans le cadre de ce partenariat élargi.

RobotiqueActu
1 source
Apptronik recrute un nouveau CPO, une avancée majeure
346Robotics Business Review 

Apptronik recrute un nouveau CPO, une avancée majeure

Apptronik, la startup texane spécialisée dans la robotique humanoïde, vient de recruter Daniel Chu comme directeur produit (CPO). Chu est surtout connu pour avoir piloté le lancement du premier service de voitures autonomes sans conducteur humain chez Waymo, avant de rejoindre 23andMe en tant que CPO pour y développer des solutions de santé personnalisée. Cette nomination s'accompagne de plusieurs autres recrutements issus d'Amazon, Boston Dynamics et Paramount+. Elle intervient quelques semaines après qu'Apptronik a bouclé une levée de fonds Série A de 935 millions de dollars, l'une des plus importantes jamais réalisées dans le secteur de la robotique. La société, basée à Austin au Texas, s'apprête à commercialiser son robot humanoïde phare, Apollo, destiné dans un premier temps aux environnements industriels. Ce recrutement marque un tournant stratégique : Apptronik ne se présente plus comme un laboratoire de recherche avancée, mais comme une entreprise en phase d'industrialisation et de conquête commerciale. La présence de Chu est particulièrement significative parce qu'il a déjà traversé ce passage critique entre innovation de laboratoire et déploiement à grande échelle dans deux domaines exigeants, la conduite autonome et la médecine de précision. Pour le secteur de la robotique humanoïde, qui peine encore à démontrer sa viabilité en dehors des démonstrations contrôlées, cette crédibilité opérationnelle est un signal fort. L'ambition affichée d'Apptronik dépasse les entrepôts : l'entreprise cible à terme les soins aux personnes âgées, un marché colossal face au vieillissement démographique mondial, où les robots pourraient compenser le manque de personnel soignant. La robotique humanoïde traverse une période d'accélération sans précédent, portée par des acteurs comme Figure AI, 1X Technologies, Tesla avec Optimus ou encore Boston Dynamics. Apptronik se distingue par sa feuille de route progressive : applications industrielles d'abord, santé et aide à domicile ensuite. Le CEO Jeff Cardenas résume cette vision en parlant d'une "étoile du Nord" orientée vers les soins assistés. Chu, de son côté, décrit les robots humanoïdes comme une "IA incarnée", une rupture avec les logiciels cantonnés aux écrans, vers une plateforme universelle capable d'interagir physiquement avec le monde réel. Avec 935 millions en caisse et une équipe dirigeante renforcée, Apptronik dispose désormais des ressources pour tenter de transformer cette vision en réalité industrielle dans les prochaines années.

RobotiqueActu
1 source
Des robots humanoïdes commencent à trier les bagages dans un aéroport de Tokyo face à la pénurie de main-d'œuvre
347Ars Technica AI 

Des robots humanoïdes commencent à trier les bagages dans un aéroport de Tokyo face à la pénurie de main-d'œuvre

Japan Airlines lance en mai 2026 une expérimentation de robots humanoïdes à l'aéroport international de Haneda, à Tokyo. Ces machines seront déployées pour trier les bagages et charger le fret, avec l'ambition d'élargir progressivement leurs missions au nettoyage des cabines d'avion et à la manipulation d'équipements au sol comme les chariots à bagages. Les essais sont prévus jusqu'en 2028, ce qui signifie que les passagers en transit à Haneda pourront vraisemblablement croiser ces robots en action sur le tarmac ou dans les zones de traitement des bagages au cours des deux prochaines années. Cette initiative répond à une pression concrète sur le marché du travail japonais : la fréquentation des aéroports a fortement progressé ces dernières années, creusant un écart entre les besoins en personnel et les candidats disponibles. Pour Japan Airlines, automatiser des tâches physiques répétitives et pénibles comme la manutention des bagages permettrait de compenser ce déficit sans dépendre de recrutements difficiles à réaliser. Si les essais s'avèrent concluants, ce modèle pourrait s'étendre à d'autres compagnies ou aéroports confrontés aux mêmes contraintes démographiques, notamment dans un Japon où le vieillissement de la population aggrave les tensions sur l'emploi manuel. Les robots humanoïdes franchissent ainsi une nouvelle étape après leurs premiers déploiements dans les usines automobiles et les entrepôts logistiques, environnements relativement contrôlés où les tâches sont prévisibles. Un aéroport représente un défi autrement plus complexe : espaces ouverts, flux irréguliers, interactions avec des humains, objets de formes variées. La grande majorité des automatisations industrielles reposent encore sur des bras robotisés spécialisés, conçus pour répéter indéfiniment un geste identique. Les robots humanoïdes, eux, doivent s'adapter en temps réel à des situations changeantes, ce qui met à l'épreuve les dernières générations de logiciels de perception et de contrôle moteur. L'expérience de Haneda servira de test grandeur nature pour mesurer si la technologie actuelle est réellement à la hauteur de ces environnements imprévisibles.

UELes aéroports européens confrontés à des tensions similaires sur le marché du travail pourraient s'appuyer sur les résultats de cette expérimentation pour évaluer la maturité des robots humanoïdes dans leurs propres opérations de piste et de bagagerie.

RobotiqueOpinion
1 source
Les robots livreurs s'imposent dans l'automatisation moderne
348Robotics & Automation News 

Les robots livreurs s'imposent dans l'automatisation moderne

Les robots de livraison s'imposent comme un maillon central de la nouvelle vague d'automatisation industrielle. Longtemps cantonnée aux chaînes de montage et aux entrepôts, l'automatisation évolue vers un modèle en réseau piloté par l'intelligence artificielle, la robotique autonome et les systèmes numériques connectés. Dans ce cadre, les robots de livraison ne se contentent plus de déplacer des colis : ils assurent des opérations physiques complexes dans des environnements dynamiques, aux côtés des humains, dans des secteurs aussi variés que la logistique, la santé et le commerce de détail. L'enjeu concret est de taille. En comblant le fossé entre les tâches numériques automatisées et les opérations physiques de terrain, ces machines permettent aux entreprises de réduire leur dépendance à la main-d'œuvre pour les tâches répétitives, d'accélérer les délais de traitement et de maintenir des opérations continues, sans interruption. Dans le secteur hospitalier par exemple, des robots assurent déjà le transport de médicaments et de matériel entre services, libérant le personnel soignant pour des tâches à plus forte valeur ajoutée. Cette transformation s'inscrit dans un mouvement plus large de convergence entre l'IA et la robotique physique, porté par des acteurs comme Boston Dynamics, Starship Technologies ou encore Amazon avec ses systèmes Proteus et Hercules. La baisse des coûts des capteurs et des modèles d'IA embarqués accélère l'adoption. La prochaine étape attendue est l'intégration de ces robots dans des écosystèmes logistiques entièrement pilotés par des agents autonomes, capables de s'adapter en temps réel aux flux et aux incidents.

UEL'automatisation par robots livreurs touche les secteurs de la logistique et de la santé en Europe, poussant les entreprises européennes à repenser leur organisation du travail pour les tâches répétitives.

RobotiqueOpinion
1 source
Des ingénieurs du MIT développent des micro-robots imprimés en 3D contrôlés par aimants
349Interesting Engineering 

Des ingénieurs du MIT développent des micro-robots imprimés en 3D contrôlés par aimants

Des ingénieurs du Massachusetts Institute of Technology (MIT), de l'École polytechnique fédérale de Lausanne (EPFL) et de l'Université de Cincinnati ont mis au point un nouveau type d'hydrogel magnétique souple qui peut être imprimé en 3D à l'échelle microscopique. Ces structures, plus petites qu'un grain de sable, peuvent se déformer et se mouvoir de façon indépendante sous l'effet d'un aimant externe. Pour démontrer la précision du matériau, l'équipe a fabriqué des "sucettes" miniatures en gel magnétique, dont chaque composant peut réagir avec une intensité différente à un simple aimant de réfrigérateur. Lorsqu'on approche l'aimant, les structures se transforment instantanément en pinces robotiques coordonnées, reproduisant le mouvement de doigts qui se referment. Les chercheurs ont également conçu un interrupteur bistable d'un millimètre de long, équipé de "rames" de la taille d'un globule rouge, capable de se verrouiller en position marche ou arrêt par simple commande magnétique à distance. L'enjeu médical est central : des robots aussi miniaturisés, guidés sans fil par un aimant externe, pourraient traverser le corps humain pour effectuer des biopsies ciblées, collecter des échantillons biologiques ou administrer des médicaments avec une précision millimétrique, sans contact physique ni réaction chimique lente. Ce qui distingue cette approche des micro-robots existants, c'est la capacité à programmer des déformations complexes au sein d'une seule et même structure microscopique. Jusqu'ici, les matériaux magnétiques à cette échelle se déplaçaient comme un bloc rigide. Ici, chaque partie du robot peut répondre différemment au même champ magnétique. "Pour la micro-robotique souple, ce pourrait être une capacité qui change la donne", résume Carlos Portela, co-auteur de l'étude. La principale difficulté technique résidait dans l'impression 3D elle-même : les nanoparticules magnétiques dispersent la lumière laser utilisée en lithographie biphotonique et s'agglomèrent, compromettant la structure des pièces imprimées. Pour contourner cela, l'équipe a adopté un procédé en deux temps, baptisé "double-dip" : la structure polymère est d'abord imprimée sans particules magnétiques, puis plongée dans des bains chimiques successifs pour faire croître des nanoparticules d'oxyde de fer directement au sein du gel. La densité du gel, et donc son degré de magnétisme, peut être ajustée finement en modulant la puissance du laser lors de l'impression initiale, ce qui permet de programmer des niveaux de réactivité distincts dans un même robot. Ce travail s'inscrit dans une course mondiale à la micro-robotique médicale, où le contrôle sans fil à distance représente l'un des verrous technologiques les plus convoités par les équipes de chirurgie mini-invasive et de délivrance ciblée de médicaments.

UEL'EPFL de Lausanne est co-auteure de cette avancée, positionnant la recherche européenne comme contributrice clé dans la course mondiale aux micro-robots chirurgicaux guidés sans fil.

RobotiqueActu
1 source
De DeepSeek à DeepRoute : pourquoi un chercheur en IA de premier plan a misé sur le monde physique
350Pandaily 

De DeepSeek à DeepRoute : pourquoi un chercheur en IA de premier plan a misé sur le monde physique

Le 25 avril 2026, lors du Salon de l'automobile de Pékin, la startup chinoise d'autonomie véhiculaire DeepRoute.ai a tenu une conférence de presse inhabituelle dans le hall A4 du China International Exhibition Center : aucun véhicule en exposition, aucun prototype sur scène. Son PDG, Maxwell Zhou, a choisi ce vide comme manifeste. En une après-midi, il a dévoilé la nouvelle architecture stratégique de l'entreprise autour du concept de "Physical AI", son modèle fondateur (Foundation Model), une ébauche d'agent intégrant conduite et habitacle, et un chiffre clé : un véhicule sur trois équipé d'un système NOA urbain en Chine tourne aujourd'hui sur la technologie DeepRoute, soit plus de 300 000 voitures en circulation. L'événement a également marqué la première apparition publique de Ruan Chong, ancien directeur R&D de DeepSeek et chercheur central en IA multimodale, depuis son arrivée chez DeepRoute en tant que Chief Scientist. Ce repositionnement marque une rupture nette avec la logique dominante du secteur. Là où les acteurs de la conduite autonome se sont longtemps concurrencés sur des benchmarks techniques, quelle pluie, quel angle mort, quel cas limite, DeepRoute revendique désormais un rôle d'infrastructure, comparable selon Zhou à "l'électricité ou les télécommunications". L'objectif affiché est d'atteindre 1 000 miles ou plus entre deux interventions critiques (MPCI) d'ici fin 2026. "Quatre-vingt-dix pour cent de ce qui compte, c'est la sécurité", a déclaré Zhou, ajoutant que Tesla a déjà atteint ce seuil et que les petits modèles ne permettront jamais d'y parvenir : "Quoi que vous fassiez dans le monde des petits modèles, vous ne pouvez pas obtenir dix fois mieux en travaillant plus fort." Le virage vers les grands modèles de fondation est donc présenté comme une nécessité structurelle, pas une option. Le recrutement de Ruan Chong illustre une dynamique plus large que Zhou a explicitement nommée : les responsables de la recherche multimodale des grands groupes internet chinois migrent vers la conduite autonome. Ruan lui-même a expliqué ce choix avec franchise : "Les modèles de langage sont très matures, presque n'importe quelle tâche peut être traitée par un seul modèle. Mais dans l'intelligence multimodale et incarnée, on en est loin. Je préfère être à la frontière." Cette migration de talents, si elle se confirme, signale que le centre de gravité de l'IA appliquée se déplace du texte vers le monde physique. DeepRoute entend capitaliser sur cette fenêtre, avant que le secteur n'atteigne lui-même la maturité qu'a connue le NLP.

UELa montée en puissance de DeepRoute et la migration de talents IA vers l'autonomie véhiculaire en Chine renforcent la pression compétitive sur les constructeurs automobiles européens dans la course au véhicule autonome.

RobotiqueOpinion
1 source