Aller au contenu principal

Dossier Robots humanoïdes — page 5

469 articles · page 5 sur 10

L'industrie des robots humanoïdes : Unitree, Fauna Robotics, Tesla Optimus, Chery, Sony, défis techniques et premiers déploiements en entreprise.

Vidéo : ce robot clown a donné un coup de pied à un enfant en pleine démonstration
201Le Big Data RobotiqueActu

Vidéo : ce robot clown a donné un coup de pied à un enfant en pleine démonstration

Lors d'une démonstration publique en Chine le 5 juin 2026, un robot humanoïde déguisé en clown, perruque colorée incluse, a donné un coup de pied circulaire dans le ventre d'un enfant positionné au premier rang du public. La scène, capturée en vidéo et relayée sur le réseau social X par le compte Culture Crave, a rapidement accumulé plusieurs millions de vues. Sur les images, on distingue nettement le robot effectuer une rotation, son pied venant heurter l'enfant qui recule sous l'impact. Les personnes présentes semblent immédiatement réagir. On ignore pour l'instant l'identité du fabricant du robot, le lieu exact de la démonstration, et si l'enfant a été blessé. Les circonstances précises, dysfonctionnement technique ou mouvement non anticipé de la chorégraphie programmée, restent également indéterminées. L'incident remet brutalement en lumière la question de la sécurité des robots humanoïdes déployés dans des espaces publics, au contact direct du grand public et d'enfants. Même conçus à des fins de divertissement, ces machines sont capables de produire des gestes rapides, puissants et difficiles à anticiper pour un spectateur non averti. Les fabricants investissent depuis des années dans des mécanismes de détection de proximité et de limitation de force pour réduire les risques de collision avec les humains, mais aucun dispositif n'est infaillible. Un mauvais calibrage, une erreur de programmation ou une mauvaise lecture de l'environnement suffisent à transformer une démonstration ludique en incident. La mise en scène, un robot grimé en clown censé amuser un public familial, rend l'image d'autant plus frappante et questionne le cadre réglementaire entourant ce type d'événements. La robotique humanoïde connaît depuis quelques années une accélération remarquable : les machines marchent, courent, sautent et dansent avec une fluidité croissante, réalisant des figures jugées hors de portée il y a encore peu. Des acteurs comme Boston Dynamics, Unitree ou Figure AI poussent les limites des capacités physiques de ces systèmes, tandis que la Chine a massivement investi dans ce secteur pour en faire un axe stratégique de son industrie technologique. Mais cette montée en puissance s'accompagne d'un déploiement accéléré dans des contextes grand public, salons, centres commerciaux, événements, avant que les standards de sécurité n'aient pleinement suivi. Cet épisode, aussi anecdotique qu'il puisse paraître, est susceptible d'alimenter les débats sur les normes de cohabitation entre robots et humains dans des espaces non contrôlés, un enjeu que régulateurs et industriels devront inévitablement trancher à mesure que ces machines se banalisent.

UEL'incident alimente indirectement le débat européen sur les normes de sécurité encadrant le déploiement de robots humanoïdes dans des espaces publics.

1 source
WALL-WM : modélisation des actions du monde aux points d'articulation d'événements
202arXiv cs.RO 

WALL-WM : modélisation des actions du monde aux points d'articulation d'événements

Une équipe de chercheurs a publié le 2 juin 2026 sur arXiv (arXiv:2606.01955) les travaux portant sur WALL-WM, un World Action Model (WAM) qui propose de repenser la manière dont les modèles Vision-Language-Action (VLA) sont entraînés pour la robotique généraliste. Là où les approches dominantes, comme celles exploitées par Physical Intelligence (Pi-0) ou NVIDIA (GR00T N2), optimisent des "chunks" d'actions à longueur fixe conditionnés sur l'observation courante, WALL-WM substitue à cette unité temporelle arbitraire l'événement sémantique : une séquence d'actions cohérente du point de vue du sens (attraper un objet, ouvrir un tiroir), extraite automatiquement par des légendes au niveau événementiel et un échantillonnage cluster-balancé. Le modèle expose deux modes d'inférence : un mode "event" qui consomme des descriptions de l'événement suivant et produit des chunks à longueur variable, et un mode "unified" qui applique un mécanisme baptisé Staircase Decoding pour conserver une inférence à longueur fixe tout en maintenant un chemin VLA à gradient continu. Le tout est entraîné à grande échelle via l'optimiseur Muon, et les auteurs revendiquent des performances état de l'art sur une évaluation de généralisation en monde réel à large échelle, sans préciser les benchmarks ni les données de déploiement. L'intérêt de l'approche réside dans le diagnostic qu'elle formule : le désalignement de granularité entre langage (objectifs sémantiques), vision (dynamique de scène continue) et actions (timescales de contrôle) transforme l'entraînement VLA classique en simple fitting de corrélations à court horizon, ce qui explique les difficultés de généralisation observées hors distribution. En traitant l'événement comme unité atomique d'apprentissage, WALL-WM offre une piste sérieuse pour réduire le sim-to-real gap et améliorer le transfer sur des tâches et des scènes non vues, deux verrous majeurs qui bloquent le passage à l'échelle industrielle des robots manipulateurs. Il convient cependant de rester prudent : il s'agit d'un preprint sans revue par les pairs, sans données de déploiement terrain, et sans détail sur les benchmarks précis utilisés pour établir la supériorité annoncée. WALL-WM s'inscrit dans une vague de recherche sur les WAMs qui a pris de l'ampleur depuis 2024, portée notamment par Physical Intelligence avec Pi-0 et Pi-0.5, Google DeepMind avec RT-2 et ses successeurs, et NVIDIA avec GR00T N2 pour les humanoïdes. Ces modèles partagent l'ambition de pré-entraîner des politiques robotiques générales sur des données hétérogènes avant de les affiner par tâche. La contribution de WALL-WM est théoriquement propre et l'infrastructure Muon suggère un effort de calcul significatif, mais l'absence de résultats quantitatifs détaillés dans le résumé limite l'évaluation externe. Les prochaines étapes attendues sont une publication complète avec benchmarks reproduisibles (LIBERO, OpenVLA-OFT, RoboMimic) et, idéalement, des partenariats industriels pour validation en environnement de production.

RobotiqueOpinion
1 source
« Des dizaines de milliards de robots d’ici 10 à 20 ans » : la prédiction folle de Nvidia
203Frandroid 

« Des dizaines de milliards de robots d’ici 10 à 20 ans » : la prédiction folle de Nvidia

Un cadre dirigeant de Nvidia a affirmé que le nombre de robots sur Terre dépassera un jour celui des êtres humains, prédisant l'émergence de dizaines de milliards d'appareils dans un horizon de dix à vingt ans. Cette déclaration, rapportée par Frandroid, illustre l'ambition vertigineuse avec laquelle le géant américain des semi-conducteurs positionne désormais la robotique physique au coeur de sa stratégie de croissance. L'enjeu dépasse largement la provocation chiffrée : Nvidia cherche à s'imposer comme la colonne vertébrale computationnelle de la prochaine vague industrielle. L'entreprise a déjà lancé Project GR00T, un modèle fondateur pour robots humanoïdes, et sa plateforme Isaac pour la simulation et l'entraînement robotique. Si des dizaines de milliards de robots nécessitent des puces, des logiciels et des infrastructures d'entraînement, Nvidia se retrouve en position de fournisseur incontournable, reproduisant à l'échelle physique le rôle qu'elle joue aujourd'hui dans l'IA générative. Cette prédiction s'inscrit dans une course mondiale où Tesla, Figure AI, 1X Technologies et Boston Dynamics parient tous sur l'humanoides à grande échelle. Les gouvernements chinois et américain y voient un enjeu de souveraineté industrielle. La question n'est donc plus de savoir si les robots envahiront les usines, les entrepôts et les foyers, mais à quelle vitesse, et qui contrôlera la chaîne de valeur, des capteurs aux modèles d'IA embarqués, en passant par les puces qui les font tourner.

RobotiqueOpinion
1 source
Robot moonwalk façon Michael Jackson : le fiasco
204Le Big Data 

Robot moonwalk façon Michael Jackson : le fiasco

Une vidéo devenue virale le 20 mai 2026 montre un robot humanoïde s'effondrer sur scène en pleine démonstration de danse, devant un public en direct. La machine avait été mise en scène pour interpréter quelques pas sur "Billie Jean" de Michael Jackson, le titre emblématique sorti en 1982. Les premières secondes sont convaincantes : le robot balance les bras, enchaîne quelques mouvements rythmés et tente même une ébauche de moonwalk. Puis la scène bascule. L'humanoïde heurte une marche sur le plancher de la scène, vacille, semble se stabiliser, le public retient son souffle. Puis, quelques secondes plus tard, il retourne exactement au même endroit, percute à nouveau le même obstacle et s'effondre lourdement, immobile, avant d'être évacué hors scène. Ce type d'incident illustre un problème structurel que l'industrie robotique peine encore à résoudre : l'écart entre la performance scénarisée et l'adaptabilité réelle. Les démonstrations virales de robots donnent souvent l'impression d'une maîtrise presque humaine de l'espace et du mouvement. En réalité, ces séquences reposent la plupart du temps sur des routines préprogrammées exécutées dans des conditions parfaitement contrôlées. Une marche sur une scène, un objet déplacé de quelques centimètres, un obstacle non prévu dans le code : il suffit d'un seul élément inattendu pour que les limites apparaissent sans ambiguïté. Ce n'est pas un problème de puissance de calcul ni de mécanique, mais de perception et d'adaptation en temps réel à un environnement non modélisé. La robotique humanoïde avance à un rythme soutenu depuis quelques années, portée par des acteurs comme Boston Dynamics, Figure AI, Agility Robotics ou encore Unitree, qui multiplient les démonstrations spectaculaires. Mais la plupart des cas d'usage concrets restent limités à des environnements industriels très structurés, où chaque variable est anticipée. Déployer un robot dans un espace quotidien, qu'il s'agisse de ranger des objets épars, de naviguer dans une maison ou de réagir à une foule, reste un défi considérable. Les investissements dans le secteur atteignent des montants records, plusieurs milliards de dollars levés en 2024-2025 rien qu'aux États-Unis, mais la promesse d'un robot véritablement autonome face à l'imprévu reste encore hors de portée. Cette chute sur scène, anecdotique en apparence, résume en quelques secondes le principal obstacle du domaine.

RobotiqueOpinion
1 source
PhysBrain 1.0 : rapport technique
205arXiv cs.RO 

PhysBrain 1.0 : rapport technique

PhysBrain 1.0 (arXiv:2605.15298, mai 2026) est un pipeline VLA (vision-language-action) qui convertit de la vidéo égocentrique humaine à grande échelle en supervision de commonsense physique structuré, avant de transférer ce savoir vers le contrôle robotique. Un moteur de données extrait quatre types d'informations depuis ces vidéos (éléments de scène, dynamiques spatiales, exécution d'actions, relations géométriques tenant compte de la profondeur) et les transforme en paires questions-réponses pour entraîner les VLM PhysBrain. Les priors physiques résultants sont ensuite injectés dans des politiques VLA via un mécanisme d'adaptation qualifié de "capability-preserving et language-sensitive". Évalué sur cinq benchmarks (ERQA, PhysBench, SimplerEnv-WidowX, LIBERO, RoboCasa), le modèle revendique des résultats état de l'art, avec des performances hors domaine particulièrement fortes sur SimplerEnv. L'abstract ne fournit pas de métriques chiffrées; le rapport complet reste nécessaire pour valider ces affirmations. L'argument central est que les trajectoires robot constituent une source de supervision trop étroite pour acquérir une compréhension physique générale: coûteuses à collecter par téléopération et peu diversifiées, elles limitent structurellement la généralisation des VLA. La vidéo égocentrique humaine, disponible en volumes bien supérieurs, couvre une variété d'interactions physiques avec le monde (saisies, contacts, équilibre, textures) que les datasets robot n'atteignent pas. La robustesse hors domaine sur SimplerEnv est le signal le plus intéressant: si elle se confirme à la lecture du rapport complet, cela suggère que cette stratégie atténue le problème de généralisation qui frappe la majorité des VLA entraînés uniquement sur données robot. Pour un intégrateur ou un COO industriel, cela laisse entrevoir une réduction du volume de démonstrations téléopérées nécessaires lors de chaque nouveau déploiement. PhysBrain s'inscrit dans une compétition dense autour des VLA physiques. Physical Intelligence (pi0, pi0.5) capitalise sur de larges datasets de téléopération multi-robot; NVIDIA GR00T N2 cible la compréhension physique via simulation massive; Google DeepMind (RT-2) et le modèle open-source Octo ont posé les bases de la catégorie. L'angle de PhysBrain, passant par un intermédiaire de commonsense structuré en QA plutôt que par un entraînement direct sur trajectoires, rappelle les stratégies de pre-training visuel comme R3M ou MVP, mais va plus loin avec un pipeline d'extraction supervisée à quatre dimensions. Le modèle est pour l'instant validé sur robot WidowX, une plateforme de manipulation accessible; la prochaine étape logique serait de tester le transfert sur des architectures humanoïdes ou à plus haute dextérité, là où la compréhension physique générale apporte le plus de valeur.

💬 Le vrai problème des VLA, c'est qu'ils apprennent à partir de données robot trop étroites et trop chères à collecter. PhysBrain contourne ça en allant chercher le commonsense physique dans des vidéos humaines à grande échelle, et je trouve les perfs hors domaine sur SimplerEnv plus convaincantes que les benchmarks habituels. Testé sur WidowX seulement pour l'instant, donc on attend la suite.

RobotiqueOpinion
1 source
San Francisco accueille un club de combat de robots, General Catalyst fait le buzz
206The Information AI 

San Francisco accueille un club de combat de robots, General Catalyst fait le buzz

Jeudi dernier, une boîte de nuit du quartier SoMa à San Francisco accueillait un spectacle pour le moins inhabituel : des combats de robots humanoïdes de la taille d'un enfant dans une cage octogonale, sur fond de musique électronique et d'un animateur en blazer à paillettes. L'événement, baptisé "Robot Fight Night and Dance Off", réunissait quelques centaines de spectateurs venus encourager des machines maladroites à se frapper mutuellement. Derrière ce cirque technologique se cache Nebius, une société de cloud computing cherchant à se faire connaître : les robots, fabriqués par la firme chinoise Unitree, avaient été entraînés et chorégraphiés par Ultimate Fighting Bots, une ligue de sports pour robots humanoïdes, sur la plateforme cloud de Nebius. Dans le même temps, General Catalyst, l'un des fonds de capital-risque les plus influents de la Silicon Valley, publiait une vidéo marketing qui a cumulé 2,5 millions de vues sur Twitter en quelques jours, déclenchant une vive polémique dans le milieu du venture capital. Ces deux événements illustrent, chacun à leur manière, une forme de surchauffe dans l'industrie technologique. La robotique concentre aujourd'hui des sommes colossales : Jensen Huang de Nvidia y voit "la prochaine frontière de l'IA", Elon Musk présente Optimus comme "le plus grand produit de Tesla", et la startup Figure de Brett Adcock atteignait une valorisation de 39 milliards de dollars l'an dernier. Des dizaines de milliards ont été injectés dans des entreprises qui promettent de remplacer des millions de travailleurs dans les usines et les maisons de retraite. Transformer ces machines en attractions de combat revient, selon Shane Wilson, associé chez Citta Capital, à démontrer "le biais testostérone des startups en phase d'amorçage". La vidéo de General Catalyst, elle, a agacé Marc Andreessen et ses équipes : le personnage du capital-risqueur imprudent et peu sérieux qu'elle met en scène ressemble de façon troublante à Andreessen lui-même. Propulsée par ses réactions en ligne, la vidéo est devenue l'un des sujets les plus commentés entre investisseurs cette semaine, certains la qualifiant de "de mauvais goût". La soirée SoMa confirmait pourtant une chose : la révolution robotique annoncée ressemble pour l'instant moins à une armée de Terminators qu'à une procession de machines titubantes peinent à se porter des coups. Un ingénieur d'OpenAI présent dans la salle reconnaissait que les robots n'avaient guère progressé depuis un an. Quant à General Catalyst, habituellement discret dans les joutes verbales entre fonds, cette incursion dans le marketing viral marque un tournant dans la guerre d'image qui oppose les grandes firmes de la Silicon Valley. Le secteur du venture capital, sous pression alors que la bulle IA s'emballe, ne résiste plus à la tentation de la mise en scène, qu'il s'agisse de robots qui se battent maladroitement ou de vidéos qui règlent des comptes à peine voilés.

💬 Des robots humanoïdes qui trébuchent dans une cage octogonale pendant qu'un mec en blazer à paillettes crie dessus, c'est le meilleur résumé de l'état réel de la robotique en 2025. Un ingénieur d'OpenAI sur place qui admet que ça n'a pas bougé depuis un an, ça dit tout. La hype à 39 milliards pour Figure, les discours de Jensen Huang... bon, sur le papier ça claque, mais le produit, lui, peine encore à lever le bras sans tomber.

RobotiqueOpinion
1 source
Wavelet Policy : apprentissage par imitation dans le domaine des échelles avec mémoire a priori du monde
207arXiv cs.RO 

Wavelet Policy : apprentissage par imitation dans le domaine des échelles avec mémoire a priori du monde

Une équipe de chercheurs propose Wavelet Policy (arXiv:2504.04991), un framework léger d'apprentissage par imitation pour la manipulation robotique. L'approche combine deux innovations : une mémoire de scène persistante appelée World Prior Memory (WPM), qui encode la structure statique de l'environnement à partir d'images de fond dans des vecteurs compacts, et une modélisation des actions par décomposition en ondelettes (wavelet-domain decomposition). L'architecture résultante, baptisée Single-Encoder Multiple-Decoder (SE2MD), décompose les représentations latentes des actions en sous-bandes temporelles distinctes, reconstruites via transformée inverse avant d'être projetées en séquences d'actions exécutables. Validée sur quatre tâches simulées et six tâches réelles de manipulation robotique, la méthode surpasse les baselines de référence sur l'ensemble des benchmarks. Le code source, les données et les poids du modèle sur tâches simulées sont disponibles publiquement sur GitHub. L'enjeu central est double. D'une part, les politiques visuomotrices classiques (ACT, Diffusion Policy) opèrent entièrement dans le domaine temporel et peinent à maintenir une conscience cohérente de la scène physique sur des horizons longs. D'autre part, les architectures à modèle du monde qui résolvent ce problème imposent un surcoût computationnel significatif, incompatible avec un déploiement embarqué sur robot. Wavelet Policy avance que la décomposition fréquentielle des représentations d'actions latentes suffit à capturer simultanément les composantes rapides (corrections fines) et lentes (planification gestuelle) sans recourir à un modèle du monde explicite. Pour les intégrateurs industriels et les équipes R&D embarquées, cela ouvre la voie à des politiques de manipulation longue-horizon déployables avec des ressources de calcul modestes. Le travail s'inscrit dans une compétition intense sur les politiques visuomotrices généralisées : Physical Intelligence a publié π0 fin 2024 sur des tâches de manipulation complexes, NVIDIA a proposé GR00T N2 avec apprentissage par simulation, et des laboratoires académiques comme Stanford ou Berkeley poussent des variantes de Diffusion Policy et d'imitation par Transformer. Wavelet Policy se positionne comme une alternative légère, sans prétendre au déploiement sur robot humanoïde : les expériences réelles restent au stade du bras manipulateur en environnement contrôlé. Publié en version preprint (v4, avril 2025), le travail n'a pas encore fait l'objet d'une publication dans une conférence de rang A (ICRA, CoRL, RSS), ce qui invite à nuancer la portée des résultats annoncés avant validation par les pairs.

RechercheOpinion
1 source
Joanna Stern n'est pas un robot, mais elle a vécu avec eux
208The Verge AI 

Joanna Stern n'est pas un robot, mais elle a vécu avec eux

Joanna Stern, ancienne chroniqueuse senior en technologies personnelles au Wall Street Journal et cofondatrice du site The Verge, a quitté son poste au sein du quotidien américain pour lancer sa propre entreprise médiatique, baptisée New Things. Ce changement de cap s'accompagne de la publication de son premier livre, I Am Not a Robot, sorti le 12 mai 2026. L'ouvrage raconte une expérience radicale : pendant douze mois complets, Stern a laissé l'intelligence artificielle s'infiltrer dans chaque aspect de sa vie quotidienne, professionnelle et personnelle, ses enfants inclus. Le livre est structuré par saisons et se présente sous la forme d'un récit à la fois personnel et analytique. New Things est lancée en partenariat avec NBC, ce qui permet à Stern de maintenir une exposition grand public tout en opérant de manière indépendante. Cette transition illustre un mouvement plus large dans le journalisme tech : des figures établies quittent les grands titres pour reprendre le contrôle éditorial et économique de leur travail, notamment via YouTube et les médias directs. Les conclusions de Stern après une année d'immersion totale dans l'IA sont à nuancer : les gadgets humanoïdes très médiatisés, comme les robots domestiques, ne sont selon elle pas du tout prêts, et pourraient ne pas l'être avant longtemps. En revanche, elle se montre clairement optimiste quant à l'IA portable, les wearables, qu'elle estime capables de devenir la première véritable application grand public justifiant tous les compromis technologiques, éthiques et financiers que l'industrie demande à la société d'accepter. Son témoignage direct a une valeur rare : peu de journalistes tech ont réellement soumis leur quotidien entier à ces outils pendant une durée aussi longue. Stern représente une génération de journalistes technologiques qui ont couvert l'essor des smartphones, des plateformes sociales et maintenant de l'IA depuis ses débuts récents dans le grand public. Elle a cofondé The Verge en 2011 avec Nilay Patel et d'autres, avant de rejoindre le Journal. Son départ vers l'indépendance s'inscrit dans un contexte où les grands médias traditionnels peinent à retenir leurs signatures les plus fortes, face à des modèles alternatifs viables, newsletters, YouTube, podcasts monétisés. Qu'elle utilise elle-même l'IA pour structurer New Things est symptomatique : la technologie qu'elle analyse devient aussi l'outil de sa propre reconversion. Les prochains mois diront si ce pari éditorial tient face aux exigences de l'algorithme YouTube, qu'elle décrit comme une nouvelle contrainte éditoriale à apprivoiser.

SociétéOpinion
1 source
BioProVLA-Agent : système multi-agents incarné avec VLA et raisonnement en boucle fermée en laboratoire biologique
209arXiv cs.RO 

BioProVLA-Agent : système multi-agents incarné avec VLA et raisonnement en boucle fermée en laboratoire biologique

Des chercheurs ont présenté en mai 2026 BioProVLA-Agent (arXiv:2605.07306), un système multi-agents conçu pour automatiser les manipulations en laboratoire biologique humide à coût maîtrisé. L'architecture combine trois modules : un agent LLM qui décompose les protocoles biologiques en sous-tâches vérifiables, un agent de vérification VLM-RAG (Vision-Language Model avec Retrieval-Augmented Generation) qui évalue l'état visuel de la scène entre chaque étape, et un agent VLA (Vision-Language-Action) qui exécute les gestes via une politique légère. Pour robustifier l'exécution face aux difficultés visuelles des labos humides (labware transparent, reflets, surexposition), les auteurs ont développé AugSmolVLA, une stratégie d'augmentation en ligne appliquée au modèle SmolVLA. Évalué sur 15 tâches atomiques (chargement de tubes, tri, vissage de bouchons, versage de liquides), 6 workflows composites et 3 tâches bimanuelles, AugSmolVLA surpasse les baselines ACT, X-VLA et SmolVLA original dans des conditions normales et de forte exposition lumineuse. Le point saillant n'est pas la performance brute mais la boucle fermée de vérification (closed-loop reasoning) : contrairement aux systèmes VLA classiques qui exécutent une instruction en one-shot, BioProVLA-Agent valide chaque sous-étape avant de progresser, ce qui adresse directement le "demo-to-reality gap" bien documenté en robotique manipulatrice. Pour les intégrateurs biotech et les COO de CRO, l'argument clé est l'accessibilité : le système s'appuie sur SmolVLA, un modèle léger open-source, plutôt que sur des LLM propriétaires massifs, réduisant la barrière à l'entrée pour les laboratoires académiques ou mid-size. Cela ouvre une voie crédible vers l'automatisation de tâches manuelles répétitives sans recourir à des équipements dédiés ou des interfaces robotiques propriétaires. Ce travail s'inscrit dans l'extension des modèles VLA, popularisés dans la robotique humanoïde (Pi-0 de Physical Intelligence, GR00T N2 de NVIDIA), vers des niches industrielles verticales comme la biologie. L'automatisation laboratoire est déjà dominée par Hamilton Robotics, Tecan et Beckman Coulter sur des workflows figés et des instruments dédiés ; BioProVLA-Agent vise le segment des labos non équipés de systèmes propriétaires. Aucun déploiement opérationnel ni partenariat industriel n'est annoncé : il s'agit d'une preuve de concept académique, évaluée uniquement sur un benchmark contrôlé, non encore validée en conditions de production réelles.

UELes laboratoires académiques et start-ups biotech européens pourraient s'appuyer sur cette approche open-source (SmolVLA) pour démarrer des projets d'automatisation de manipulations biologiques sans équipements propriétaires, mais aucun partenariat ni déploiement européen n'est annoncé.

RobotiqueOpinion
1 source
Video Friday : l'IA confère aux mains robotiques une dextérité humaine
210IEEE Spectrum Robotics 

Video Friday : l'IA confère aux mains robotiques une dextérité humaine

Cette semaine dans la sphère robotique, l'annonce la plus médiatisée émane de Genesis AI, qui présente GENE-26.5, décrit par la société comme "le premier cerveau IA à conférer aux robots des capacités de manipulation physique au niveau humain." Les démonstrations vidéo montrent un système cuisant un repas complet, cassant un oeuf d'une seule main, conduisant des expériences de laboratoire, réalisant du câblage de harnais électrique et jouant du piano. Aucun détail technique sur le matériel robotique utilisé, les taux de succès, ou les conditions d'environnement contrôlées n'est communiqué, ce qui invite à la prudence avant de valider ces affirmations. En parallèle, le Robotics and AI Institute publie une démonstration du quadrupède Spot de Boston Dynamics piloté par un réseau de neurones entraîné par apprentissage par renforcement combiné à une distillation multi-expert: le robot s'accroupit, saute, escalade des caisses et franchit des vides. Du côté de la NASA, les ingénieurs du Jet Propulsion Laboratory ont passé la barrière du son avec des pales de rotor de prochaine génération pour hélicoptère martien, atteignant Mach 1 dans une chambre simulant l'atmosphère de Mars, dont la densité représente environ 1 % de celle de la Terre. Jim Fan, qui dirige le groupe de recherche en autonomie incarnée chez Nvidia, affirme pour sa part que la robotique entre dans sa "phase finale" et que le plan de jeu est déjà écrit. Les affirmations de Genesis AI sur la manipulation humanoïde méritent d'être contextualisées: le secteur est parsemé d'annonces de "dextérité humaine" qui peinent à se vérifier hors conditions contrôlées. L'absence de métriques objectives, taux de succès, nombre de tentatives, variété des objets manipulés, est un signal d'alerte classique dans les communications de ce type, et le demo-to-reality gap reste la question centrale pour tout décideur B2B qui évalue ces systèmes. La prouesse NASA sur les rotors martiens est, en revanche, une avancée mesurable: franchir Mach 1 dans une atmosphère aussi ténue implique des vitesses de rotation extrêmes et des matériaux composites capables de résister à des charges aérodynamiques inédites, ouvrant la voie à des hélicoptères plus capables pour de futures missions. Quant à Atlas, le discours officiel de Boston Dynamics sur l'équilibre entre objectifs commerciaux et recherche fondamentale traduit la pression croissante que subissent les constructeurs de plateformes humanoïdes pour démontrer une rentabilité tangible après des années d'investissement massif. Genesis AI est peu connue du grand public; sa mise en avant via TechCrunch suggère une stratégie de visibilité plutôt qu'un lancement produit au sens strict. Dans l'écosystème concurrent, Physical Intelligence avec Pi-0, Figure Robotics avec le Figure 03, Agility Robotics et 1X mènent des efforts comparables sur la manipulation généraliste, tandis que Nvidia prépare le terrain pour GR00T N2 et les prochains modèles de foundation pour corps physiques. Le thème de l'Open Duck Mini, version open-source des droids BDX de Disney publiée par la communauté, rappelle que l'innovation en robotique ne se limite pas aux acteurs industriels. La communauté se retrouvera à ICRA 2026 du 1er au 5 juin à Vienne, puis à RSS 2026 du 13 au 17 juillet à Sydney, deux rendez-vous où ces avancées seront soumises à une évaluation scientifique rigoureuse, loin des vidéos de démonstration soigneusement sélectionnées.

💬 Genesis AI sort le grand jeu avec GENE-26.5, mais zéro métrique, zéro taux de réussite, ça reste une démo marketing jusqu'à preuve du contraire. Ce qui me retient vraiment dans cette actu, c'est la prouesse NASA sur les rotors martiens: Mach 1 dans 1% de densité atmosphérique, ça c'est de la physique vérifiable, pas du storytelling. Jim Fan parle de "phase finale" pour la robotique, bon, sur le papier c'est enthousiasmant, reste à voir ce que ça donne à ICRA en juin face aux pairs.

RobotiqueActu
1 source
Podcast : Colin Angle parle de la conception de robots compagnons avec Familiar Machines et Magic
211The Robot Report 

Podcast : Colin Angle parle de la conception de robots compagnons avec Familiar Machines et Magic

Colin Angle, cofondateur et ancien PDG d'iRobot, sort de la discrétion avec une nouvelle startup baptisée Familiar Machines & Magic (FM&M). La société vient de lever le voile sur son projet : développer des robots compagnons appelés "Familiars", conçus pour entretenir des relations à long terme avec leurs utilisateurs, avec une dimension d'intelligence émotionnelle embarquée. FM&M se positionne dans le segment de la "physical AI grand public". Aux côtés d'Angle, l'équipe fondatrice comprend Ira Renfrew, directrice des ressources humaines et du produit, et le Dr Chris Jones, directeur R&D, tous deux vétérans de l'industrie avec des parcours chez iRobot, Amazon et d'autres grandes plateformes technologiques. Le reste de l'équipe cumule des expertises issues de Disney Research, du MIT, de Boston Dynamics et de l'USC. Collectivement, les fondateurs revendiquent le déploiement de plus de 50 millions de robots grand public dans le monde. La société opère depuis Boston, Los Angeles et Hong Kong. Le retour de Colin Angle dans la robotique grand public constitue un signal notable pour un secteur aujourd'hui dominé par les annonces industrielles et les humanoïdes de laboratoire. FM&M mise sur un segment encore peu commercialisé : le robot domestique à vocation relationnelle, distinct du simple assistant vocal ou du robot aspirateur. L'enjeu central est de démontrer qu'une intelligence émotionnelle peut être embarquée dans un produit physique viable sur le marché de masse, hypothèse que plusieurs tentatives précédentes (Jibo, Anki Vector, Embodied Moxie) n'ont pas réussi à valider à grande échelle. Le pedigree de l'équipe apporte une crédibilité rare dans ce segment, notamment sur les questions de navigation, de robustesse produit et de capacité manufacturière. Cela dit, FM&M n'a annoncé ni produit concret, ni prix, ni calendrier de lancement : on reste strictement au stade de la sortie de stealth, sans prototype montré publiquement. Angle a quitté iRobot début 2024 après l'échec du rachat par Amazon, bloqué par la Commission européenne en janvier 2024 pour des raisons de concurrence, ce qui avait contraint l'entreprise à licencier environ 31 % de ses effectifs et Angle à démissionner. Cette rupture a libéré l'un des profils les plus expérimentés de la robotique grand public pour fonder FM&M. Dans le paysage concurrent, les robots compagnons peinent structurellement à trouver un modèle économique pérenne : Embodied a fermé ses portes, Sony perpétue Aibo sur un segment premium très niche, et des acteurs comme 1X Technologies ou Apptronik visent prioritairement l'industrie. Aucune levée de fonds n'a été communiquée publiquement par FM&M, et la formulation retenue par la société, construire "une plateforme à long terme pour la vie artificielle", suggère un horizon commercial encore lointain.

UELe blocage par la Commission européenne du rachat d'iRobot par Amazon (janvier 2024) a indirectement libéré l'équipe fondatrice pour créer FM&M, mais la société n'a annoncé aucune présence ni activité en Europe à ce stade.

SlotVLA : vers la modélisation des représentations objet-relation pour la manipulation robotique
212arXiv cs.RO 

SlotVLA : vers la modélisation des représentations objet-relation pour la manipulation robotique

Des chercheurs présentent dans un preprint arXiv (2511.06754v3, troisième révision, mai 2026) SlotVLA, un framework de manipulation robotique multitatches qui repose sur des représentations centrées sur les objets et leurs relations plutôt que sur les plongements denses utilisés par la majorité des modèles VLA actuels. L'architecture combine trois composants : un tokeniseur visuel à slots qui maintient des représentations temporellement cohérentes pour chaque objet détecté dans la scène, un décodeur centré sur les relations entre objets pour produire des embeddings pertinents à la tâche, et un module LLM qui traduit ces embeddings en séquences d'actions exécutables. En parallèle, les auteurs publient LIBERO+, un benchmark de manipulation dérivé du jeu de données LIBERO existant, enrichi d'annotations objet-centriques au niveau des boîtes englobantes et des masques de segmentation, ainsi qu'un suivi temporel des instances entre frames. Les expériences conduites sur LIBERO+ montrent que les représentations à slots réduisent significativement le nombre de tokens visuels nécessaires tout en conservant des performances de généralisation comparables aux baselines denses. L'intérêt principal de cette approche réside dans la tension qu'elle adresse directement : les VLAs déployés à ce jour (Pi-0 de Physical Intelligence, GR00T N2 de NVIDIA, Helix de Figure) s'appuient sur des encodeurs visuels qui traitent la scène comme un champ dense, sans distinction explicite entre objets manipulables et arrière-plan. Cette architecture entraîne une redondance computationnelle et rend difficile l'audit du raisonnement du modèle, ce qui freine l'adoption industrielle dans des contextes certifiables. SlotVLA propose que des représentations structurées, inspirées de la cognition humaine sur les objets discrets, puissent constituer une base plus efficace et interprétable pour le contrôle visuomoteur. La réduction du nombre de tokens visuels est un levier concret de coût d'inférence pour des systèmes embarqués ou des flottes de robots. Il convient toutefois de noter que les résultats présentés restent confinés à l'environnement simulé LIBERO+ : aucune validation physique sur robot réel n'est rapportée dans ce preprint, ce qui laisse ouverte la question du sim-to-real gap pour ce type de représentation. Cette publication s'inscrit dans un courant actif de recherche sur les architectures objet-centriques pour la robotique, dont les travaux fondateurs incluent les modèles de slot attention de Locatello et al. (2020) et les approches OCRL. LIBERO avait déjà été introduit comme benchmark multitatches pour la manipulation, mais sans annotations objet-centriques fines : LIBERO+ vient combler ce manque pour faciliter l'évaluation comparative de ce type de représentation. Sur le plan concurrentiel, les laboratoires académiques (notamment ceux liés à CMU, Berkeley, Stanford) et industriels travaillent en parallèle sur des architectures plus interprétables pour répondre aux demandes croissantes de traçabilité dans l'automatisation industrielle. Les prochaines étapes naturelles seront la validation sim-to-real sur des plateformes physiques standard (Franka, UR, ou humanoïdes) et l'intégration dans des pipelines de fine-tuning avec des modèles fondateurs publics.

RechercheOpinion
1 source
Tutor Intelligence crée une Data Factory pour entraîner ses robots par IA dans le monde réel
213Robotics Business Review 

Tutor Intelligence crée une Data Factory pour entraîner ses robots par IA dans le monde réel

Tutor Intelligence a inauguré DF1, sa "Data Factory" installée dans une ancienne manufacture de Watertown, Massachusetts : un parc de 100 robots semi-humanoïdes bimanaux baptisés Sonny, destinés à collecter des données réelles pour entraîner son modèle vision-langage-action (VLA) Ti0. Fondée en 2021 par Josh Gruenstein (CEO) et Alon Kosowsky-Sachs (CTO) issus du MIT-CSAIL, la startup revendique avoir constitué la plus grande infrastructure de ce type aux États-Unis. Elle a levé 34 millions de dollars en Série A en décembre 2025, puis tenu une journée portes ouvertes en avril 2026. Entre 45 et 50 téléopérateurs distants au Mexique et aux Philippines pilotent les robots par téleopération proprioceptive pour leur enseigner des tâches de picking, kitting et préparation de commandes e-commerce. En évaluant simultanément le même comportement sur 100 unités, la détection d'anomalies s'effectue 100 fois plus vite qu'en opération solo : un cas limite normalement visible après 8 heures d'opération sur un robot unique devient détectable en 5 minutes de fonctionnement de la flotte. Une méthode de prétraitement baptisée "velocity normalization" standardise les profils de démonstration entre téléopérateurs pour homogénéiser le corpus d'entraînement. L'enjeu central est de s'affranchir de la dépendance à la simulation, un pari sur la donnée réelle là où la majorité des acteurs humanoïdes s'appuient encore sur des environnements synthétiques pour réduire leurs coûts de collecte. La thèse de Gruenstein est directe : sans équivalent robotique de Wikipédia, le transfert d'intelligence à l'échelle industrielle passe nécessairement par des humains enseignant des machines en conditions réelles. DF1 est conçue comme le premier maillon d'un cycle vertueux, déploiements commerciaux, données à l'échelle, amélioration continue de Ti0. Pour les intégrateurs et décideurs industriels, cette approche ouvre une trajectoire vers un modèle généraliste capable d'absorber de nouvelles tâches sans reprogrammation lourde, précisément le verrou économique du marché actuel. Les performances annoncées restent toutefois auto-déclarées, sans validation indépendante. Tutor Intelligence a émergé du MIT-CSAIL en 2021, avant l'essor commercial des VLA. La startup est membre de la première promotion du Physical AI Fellowship, programme co-animé par AWS, NVIDIA et MassRobotics, qui lui fournit ressources de calcul cloud et expertise technique. Dans un paysage concurrentiel où Physical Intelligence (pi0), Figure, Apptronik et Boston Dynamics développent chacun leurs propres stacks d'entraînement, Tutor se différencie en contrôlant à la fois le hardware d'entraînement (Sonny), la plateforme de téleopération et le modèle VLA, sans dépendre d'une simulation propriétaire. L'objectif déclaré est de lancer le premier déploiement commercial humanoïde généraliste, en alimentant la boucle de données depuis la production réelle pour piloter les itérations suivantes. Les conditions commerciales, les performances comparatives de Ti0 et les éventuels clients pilotes n'ont pas encore été communiqués.

RobotiqueOpinion
1 source
L'IA physique est la véritable révolution de l'industrie manufacturière
214Robotics Business Review 

L'IA physique est la véritable révolution de l'industrie manufacturière

Pour Steve Ricketts, vice-président du développement commercial chez Fictiv, 2026 marque le basculement de l'IA conversationnelle vers ce qu'il nomme l'"IA physique" : la convergence entre réseaux de neurones et systèmes mécaniques embarqués. Sur le terrain, cette transition se manifeste dans trois segments concrets : les robots mobiles autonomes (AMR) capables d'interagir avec les rayonnages en bout de ligne, les cobots équipés de perception haptique pour l'assemblage électronique aux côtés d'opérateurs humains, et les bras robotisés dotés de vision IA pour le contrôle qualité, capables selon Fictiv de détecter des microfissures dans des aubes de turbines invisibles à l'oeil nu. L'article ne fournit pas de chiffres de déploiement précis et s'appuie sur des cas génériques. Sur le plan industriel, MISUMI, distributeur japonais de composants coté en bourse, a acquis Fictiv, marketplace de fabrication à la demande (CNC, injection, impression 3D). La combinaison des deux a permis à un client entreprise non nommé de rapatrier sa production aux États-Unis, en consolidant flux matière et production multi-régions pour accélérer le ramp-up. Ce qui distingue cette vague des précédentes est le raccourcissement de la boucle de développement via les pipelines "sim-to-real" : des agents IA s'entraînent dans des jumeaux numériques photoréalistes, exécutant des millions d'itérations en quelques heures avant tout déploiement physique. Cette approche permet de traiter des tâches à haute variabilité, comme le tri de ferraille non structurée ou la navigation en couloir hospitalier, jusqu'ici impossibles à automatiser de façon fiable. Pour les intégrateurs et les décideurs industriels, le signal opérationnel est double : le rôle du développeur bascule de "programmeur" à "entraîneur", et le critère de sélection des plateformes se déplace vers la capacité à absorber des feedbacks terrain en production réelle. Le vrai goulot d'étranglement identifié pour 2026 n'est plus algorithmique mais physique : la "scaling wall", soit la capacité à fabriquer des milliers d'unités de hardware en qualité constante dans une supply chain mondiale sous tension. Il faut noter que cet article est signé par le VP de Fictiv lui-même, lui conférant une tonalité promotionnelle assumée plutôt qu'analytique indépendante. Dans le paysage concurrentiel, Amazon déploie déjà des humanoïdes Digit d'Agility Robotics dans ses entrepôts, tandis que Boston Dynamics, Figure et 1X intensifient leurs pipelines commerciaux. Du côté européen, des acteurs comme Enchanted Tools ou Wandercraft avancent sur des niches spécifiques (robotique hospitalière, exosquelettes), mais restent absents de cette analyse orientée marché nord-américain. Le prochain jalon annoncé est la conférence Robotics Summit & Expo de Boston, en mai 2026, où Ricketts interviendra sur le thème "Emergent Robotics : AI at the Edge of Hardware Innovation".

RobotiqueOpinion
1 source
SHAREBOT lève plusieurs centaines de millions de yuans pour accélérer son réseau de déploiement de robots
215Pandaily 

SHAREBOT lève plusieurs centaines de millions de yuans pour accélérer son réseau de déploiement de robots

SHAREBOT, plateforme chinoise de location de robots, a bouclé un nouveau tour de table de pré-série A d'un montant de plusieurs centaines de millions de yuans, son quatrième financement en seulement quatre mois d'existence. Le tour a attiré des investisseurs stratégiques de premier plan, notamment Chia Tai Robot (filiale du conglomérat thaïlandais CP Group), Changxin Shares, ainsi que deux sociétés cotées en bourse, Mecury Intelligent (002881.SZ) et Lens Technology (300433.SZ / 06613.HK). Les investisseurs historiques Mingjia Capital, Zhixing Investment et Ruizi Venture Capital ont pour leur part sursouscrit massivement leurs allocations. À la mi-avril 2026, la plateforme SHAREBOT intégrait plus de 4 000 robots déployables, avec une couverture s'étendant à plus de 100 villes chinoises. Les fonds levés seront principalement affectés au développement d'un réseau national de distribution et de services, à l'amélioration des systèmes de gestion et de dispatch des actifs robotiques, au renforcement des infrastructures d'assurance logistique, et à l'expansion des capacités à l'international. Ce financement illustre la transition en cours dans l'industrie robotique chinoise : la compétition ne se joue plus sur les prouesses techniques ou les démonstrations, mais sur la capacité d'exécution à grande échelle. Le PDG Li Yiyan a déclaré que l'enjeu n'est pas d'augmenter simplement le volume de locations, mais de construire un système intégré couvrant l'approvisionnement en équipements, la mise en relation avec les besoins des entreprises, les services urbains, la garantie de livraison et les réseaux mondiaux. Pour les clients industriels et commerciaux, cela signifie un accès à des robots opérationnels de manière standardisée, sans avoir à gérer la complexité de la maintenance ou du renouvellement du parc. SHAREBOT a également noué un partenariat avec PICC Property & Casualty pour créer un système d'assurance dédié à la robotique, couvrant déjà plus d'un millier de robots et traitant ses premiers sinistres dans le domaine de l'IA incarnée. La montée en puissance de SHAREBOT s'inscrit dans un contexte d'accélération du déploiement commercial des robots en Chine, porté par des investissements massifs dans l'IA embarquée et la robotique humanoïde. L'entrée de CP Group via Chia Tai Robot est particulièrement significative : le conglomérat a précédemment investi dans Zhiyuan Robotics, spécialiste de l'IA incarnée, signalant une stratégie cohérente pour dominer l'écosystème robotique en Asie et au-delà. L'annonce du 17 avril 2026 d'une expansion internationale sous la marque SHAREBOT, combinée à la participation de Lens Technology et Mecury Intelligent, renforce les capacités de la plateforme en connectivité des appareils, gestion à distance, dispatch des commandes et coordination de la chaîne d'approvisionnement mondiale. Alors que le secteur bascule de la phase de prototypage vers le déploiement commercial répété et massif, SHAREBOT entend s'imposer comme la couche applicative incontournable permettant aux robots de quitter les labs pour s'intégrer durablement dans l'économie réelle.

RobotiqueActu
1 source
asRoBallet : réduire l'écart sim-réel grâce au renforcement intégrant la friction pour sphères sous-actionnées
216arXiv cs.RO 

asRoBallet : réduire l'écart sim-réel grâce au renforcement intégrant la friction pour sphères sous-actionnées

Des chercheurs ont présenté asRoBallet, décrit comme le premier robot humanoïde ballbot à être piloté avec succès par apprentissage par renforcement (RL) sur un vrai matériel. Un ballbot est un robot qui s'équilibre sur une sphère, à l'instar d'un jongleur sur un ballon. L'article, déposé sur arXiv sous la référence 2604.24916, décrit comment l'équipe a développé une simulation haute fidélité sous MuJoCo pour modéliser avec précision la mécanique des roues omnidirectionnelles de type ETH, capturant notamment les vibrations parasites et les discontinuités de contact habituellement ignorées. Cette simulation alimenter un cadre nommé Friction-Aware Reinforcement Learning, qui maîtrise simultanément les frictions de roulement, latérale et torsionnelle aux interfaces roue-sphère et sphère-sol. Le robot a également été conçu à faible coût en réutilisant des composants d'un quadrupède existant, et un écosystème iOS a été développé pour permettre à un seul opérateur de le piloter via des mouvements naturels sur smartphone. L'enjeu central de ce travail est le fossé sim2real, ce gouffre notoire entre les comportements appris en simulation et les résultats obtenus sur le vrai matériel. Ici, le transfert est qualifié de zero-shot : le robot n'a besoin d'aucun recalibrage entre la simulation et le déploiement physique. C'est un résultat significatif, car les modèles de friction complexes ont historiquement rendu ce type de transfert très difficile pour les systèmes sous-actionnés. Pour l'industrie de la robotique humanoïde, cette démonstration ouvre la voie à des plateformes d'équilibrage dynamique plus agiles et plus économiques, sans passer par des méthodes de contrôle classiques lourdes à paramétrer. Les ballbots sont depuis longtemps un banc d'essai de référence pour le contrôle non-holonome et sous-actionné. Jusqu'ici, les approches dominantes restaient le LQR et le MPC, efficaces pour l'équilibrage 3D mais peu adaptés à des comportements expressifs ou à une généralisation robuste. La latence des actionneurs et les risques d'exploration non sécurisée sur le matériel réel avaient freiné l'adoption du RL dans ce domaine. En levant ces obstacles via une modélisation fine du contact et une interface de contrôle intuitive, asRoBallet pose les bases d'une nouvelle génération de robots humanoïdes capables de mouvements complexes appris entièrement en simulation.

RobotiqueOpinion
1 source
Apptronik recrute un nouveau CPO, une avancée majeure
217Robotics Business Review 

Apptronik recrute un nouveau CPO, une avancée majeure

Apptronik, la startup texane spécialisée dans la robotique humanoïde, vient de recruter Daniel Chu comme directeur produit (CPO). Chu est surtout connu pour avoir piloté le lancement du premier service de voitures autonomes sans conducteur humain chez Waymo, avant de rejoindre 23andMe en tant que CPO pour y développer des solutions de santé personnalisée. Cette nomination s'accompagne de plusieurs autres recrutements issus d'Amazon, Boston Dynamics et Paramount+. Elle intervient quelques semaines après qu'Apptronik a bouclé une levée de fonds Série A de 935 millions de dollars, l'une des plus importantes jamais réalisées dans le secteur de la robotique. La société, basée à Austin au Texas, s'apprête à commercialiser son robot humanoïde phare, Apollo, destiné dans un premier temps aux environnements industriels. Ce recrutement marque un tournant stratégique : Apptronik ne se présente plus comme un laboratoire de recherche avancée, mais comme une entreprise en phase d'industrialisation et de conquête commerciale. La présence de Chu est particulièrement significative parce qu'il a déjà traversé ce passage critique entre innovation de laboratoire et déploiement à grande échelle dans deux domaines exigeants, la conduite autonome et la médecine de précision. Pour le secteur de la robotique humanoïde, qui peine encore à démontrer sa viabilité en dehors des démonstrations contrôlées, cette crédibilité opérationnelle est un signal fort. L'ambition affichée d'Apptronik dépasse les entrepôts : l'entreprise cible à terme les soins aux personnes âgées, un marché colossal face au vieillissement démographique mondial, où les robots pourraient compenser le manque de personnel soignant. La robotique humanoïde traverse une période d'accélération sans précédent, portée par des acteurs comme Figure AI, 1X Technologies, Tesla avec Optimus ou encore Boston Dynamics. Apptronik se distingue par sa feuille de route progressive : applications industrielles d'abord, santé et aide à domicile ensuite. Le CEO Jeff Cardenas résume cette vision en parlant d'une "étoile du Nord" orientée vers les soins assistés. Chu, de son côté, décrit les robots humanoïdes comme une "IA incarnée", une rupture avec les logiciels cantonnés aux écrans, vers une plateforme universelle capable d'interagir physiquement avec le monde réel. Avec 935 millions en caisse et une équipe dirigeante renforcée, Apptronik dispose désormais des ressources pour tenter de transformer cette vision en réalité industrielle dans les prochaines années.

RobotiqueActu
1 source
UniX AI renforce sa stratégie en robotique domestique et gagne en visibilité internationale
218Pandaily 

UniX AI renforce sa stratégie en robotique domestique et gagne en visibilité internationale

UniX AI, une entreprise chinoise de robotique fondée en 2024, attire une attention internationale croissante pour ses développements dans le domaine des robots humanoïdes. Son produit phare, le Wanda 2.0, est commercialisé à partir de 88 000 yuans (environ 12 000 dollars), et se distingue par ses deux bras robotiques et sa base mobile omnidirectionnelle, conçus pour accomplir des tâches concrètes dans des environnements domestiques et commerciaux. En l'espace de quelques mois seulement, la société a enchaîné les itérations produit et atteint une production ainsi qu'une livraison à petite échelle. Cette trajectoire s'inscrit dans un marché mondial en pleine explosion : selon les données sectorielles, les expéditions mondiales de robots humanoïdes ont atteint environ 18 600 unités en 2025, soit une croissance de plus de 500 % en un an. UniX AI se distingue d'une grande partie de ses concurrents en ciblant délibérément le segment des services domestiques, alors que la majorité des acteurs du secteur se concentrent sur les applications industrielles et logistiques. Ce positionnement est stratégique : les robots de service à domicile représentent encore un marché émergent, avec un potentiel de masse considérable si les obstacles à l'adoption sont levés. La Chine joue un rôle central dans cette dynamique, représentant une part significative de la demande mondiale et de la capacité des chaînes d'approvisionnement, certains fabricants étrangers sourçant jusqu'à 70 % de leurs composants auprès de fournisseurs chinois. La montée en puissance d'UniX AI reflète une transformation plus large du secteur robotique chinois, qui passe d'une position de sous-traitant à celle d'innovateur de premier plan. La société a été citée dans plusieurs médias internationaux et intégrée à des analyses globales du secteur, signe d'une reconnaissance croissante au-delà des frontières. Reste que l'adoption à grande échelle des robots domestiques demeure à valider : le passage du prototype livré en petite série à un déploiement de masse dans les foyers constitue le véritable défi des prochaines années pour l'ensemble de l'industrie.

RobotiqueOpinion
1 source
Cadre cinématique pour évaluer les configurations de pincement en robotique, sans modèle d'objet ni de contact
219arXiv cs.RO 

Cadre cinématique pour évaluer les configurations de pincement en robotique, sans modèle d'objet ni de contact

Des chercheurs ont publié sur arXiv (référence 2604.20692) un cadre d'évaluation cinématique permettant d'analyser les configurations de pincement des mains robotiques sans avoir recours à des modèles d'objets ni à des modèles de force de contact. La méthode repose sur le calcul de l'espace de travail atteignable par chaque bout de doigt à partir des configurations articulaires, puis sur la détection de configurations de pincement réalisables en évaluant les relations géométriques entre les paires de bouts de doigts. Quatre structures cinématiques différentes de main ont été comparées afin d'examiner leur influence sur les configurations de pincement possibles. Pour les concepteurs de mains robotiques, cet apport est concret : il devient possible d'évaluer la dextérité de préhension d'un prototype dès les premières phases de conception, sans avoir à modéliser les objets à saisir ni à simuler les forces de contact. Ces étapes, traditionnellement coûteuses en temps de calcul et en données, constituaient un frein majeur à l'itération rapide sur les designs. En permettant une évaluation fondée uniquement sur la structure cinématique de la main, le framework ouvre la voie à des cycles de développement plus courts et à une comparaison objective entre différentes architectures mécaniques. La robotique de manipulation traverse une période d'intense compétition, portée par l'essor des robots humanoïdes et des bras industriels autonomes. Les mains robotiques dotées d'une dextérité fine restent l'un des grands défis non résolus du secteur, que ce soit pour des usages industriels ou médicaux. Les méthodes d'évaluation existantes supposent généralement que l'objet à manipuler est connu à l'avance, ce qui les rend peu utiles lors des premières étapes de conception matérielle. Ce travail s'inscrit dans un courant de recherche visant à abstraire l'évaluation de la dextérité, et pourrait à terme être intégré dans des outils de conception assistée par ordinateur pour accélérer le développement de nouvelles générations de mains robotiques polyvalentes.

RobotiqueActu
1 source
Optimisation cinématique des rapports de longueur des phalanges dans les mains robotiques par dextérité potentielle
220arXiv cs.RO 

Optimisation cinématique des rapports de longueur des phalanges dans les mains robotiques par dextérité potentielle

Des chercheurs ont publié sur arXiv (référence 2604.20686) un cadre méthodologique permettant d'optimiser les proportions des phalanges dans les mains robotiques à cinq doigts, sans avoir à définir au préalable des objets précis ou des tâches de manipulation. Le système repose sur quatre métriques d'évaluation : la manipulabilité globale, le volume de l'espace de travail atteignable, le volume d'espace de travail partagé entre les doigts, et la sensibilité des extrémités. L'espace de travail est discrétisé via une représentation en voxels, et les mouvements articulaires sont découpés à intervalles uniformes pour permettre une évaluation systématique. L'optimisation s'applique séparément au pouce et aux quatre autres doigts, en excluant les combinaisons de conception qui ne génèrent pas de chevauchement d'espace de travail entre les doigts. Ce travail répond à un problème concret du développement robotique : jusqu'ici, évaluer quantitativement l'impact des ratios de longueur des phalanges sur la dextérité nécessitait de simuler des scénarios de manipulation spécifiques, ce qui rendait la phase de conception longue et peu généralisable. En proposant une fonction objectif pondérée applicable dès la phase de conception cinématique, les auteurs offrent aux ingénieurs un outil de décision précoce, indépendant des cas d'usage. Les résultats montrent que chaque phalange ne contribue pas de manière égale à la dextérité globale, et que le choix des coefficients de pondération ne conduit pas mécaniquement à maximiser chaque indicateur individuellement, en raison de la distribution non uniforme des mesures dans l'espace de conception. La conception des mains robotiques multi-doigts constitue l'un des défis persistants de la robotique humanoïde et de la manipulation industrielle. Des acteurs comme Boston Dynamics, Shadow Robot ou Agility Robotics investissent massivement dans la dextérité des effecteurs, qui conditionne directement l'utilisabilité des robots dans des environnements non structurés. Ce cadre méthodologique, en analysant systématiquement les compromis entre accessibilité, dextérité et contrôlabilité, pourrait accélérer les cycles de prototypage et s'imposer comme référence dans la conception cinématique des mains robotiques de nouvelle génération.

RobotiquePaper
1 source
X Square Robot lance WALL-B, un modèle d'IA embarquée pour usage domestique
221Pandaily 

X Square Robot lance WALL-B, un modèle d'IA embarquée pour usage domestique

La startup chinoise X Square Robot a présenté le 21 avril 2026 WALL-B, qu'elle décrit comme le premier modèle fondamental d'IA incarnée au monde basé sur une architecture World Unified Model (WUM). Contrairement aux approches traditionnelles de type Vision-Language-Action (VLA), WALL-B fusionne nativement la vision, le langage, le mouvement et la prédiction physique dans un entraînement conjoint. Le modèle repose sur trois capacités clés : la multimodalité native, la compréhension de la dynamique du monde physique, et la capacité d'auto-amélioration après un échec. Pour construire ce modèle, X Square Robot a utilisé une combinaison de données expérimentales et de scénarios réels, incluant des données collectées dans des centaines de foyers. La société a annoncé qu'en l'espace de 35 jours, des robots équipés de WALL-B et d'un hardware amélioré seront déployés dans de vraies maisons, avec un recrutement d'utilisateurs déjà lancé. Des détails techniques supplémentaires seront dévoilés le 27 avril lors de la première conférence sur les applications de l'IA du Guangdong. Ce lancement marque une rupture significative dans la robotique domestique. Les architectures VLA classiques souffrent de pertes d'information entre leurs modules et peinent à modéliser la physique du monde réel, deux limitations directement adressées par WALL-B. La capacité d'auto-évolution après l'échec est particulièrement notable : elle permettrait à un robot de s'adapter aux imprévus du quotidien sans intervention humaine, ce qui est le principal obstacle à la commercialisation grand public de robots domestiques. Pour les utilisateurs, cela ouvre la voie à des assistants capables de naviguer dans l'environnement complexe et imprévisible d'un foyer réel. La Chine investit massivement dans la robotique humanoïde et incarnée, avec une concurrence intense entre startups locales et géants comme Huawei ou Xiaomi. X Square Robot s'inscrit dans cette dynamique en ciblant explicitement le marché résidentiel, là où des acteurs comme Figure AI ou Boston Dynamics se concentrent davantage sur l'industrie. Pour lever les freins liés à la vie privée, la société a intégré une anonymisation visuelle locale, une autorisation explicite des utilisateurs et des restrictions d'usage strictes. La prochaine étape sera le déploiement en conditions réelles dans des foyers, un test grandeur nature qui déterminera si l'approche WUM tient ses promesses face aux exigences du monde domestique.

RobotiqueActu
1 source
Alibaba lance l'avatar "Qwen XiaoJiuWo" pour unifier son écosystème d'assistants IA
222Pandaily 

Alibaba lance l'avatar "Qwen XiaoJiuWo" pour unifier son écosystème d'assistants IA

Alibaba a officiellement lancé le 22 avril 2026 "Qwen XiaoJiuWo", un avatar numérique destiné à incarner l'interface unifiée de tout son écosystème d'intelligence artificielle Qwen. Ce personnage virtuel sera intégré à l'application Qwen avant d'être progressivement déployé sur les grandes plateformes du groupe : Taobao, Fliggy, Amap et Alipay. Selon les données du registre commercial, Alibaba (China) Co., Ltd. a déposé plusieurs marques liées à "Qwen XiaoJiuWo" dès le 10 mars 2026, couvrant des domaines aussi variés que l'IA en tant que service (AIaaS), les logiciels de chatbot et la robotique humanoïde. Ces dépôts sont encore en cours d'examen. L'application Qwen comptait en mars 2026 quelque 166 millions d'utilisateurs actifs mensuels, selon QuestMobile, ce qui la place en deuxième position parmi les applications natives d'IA en Chine. Sur le seul premier trimestre 2026, la base d'utilisateurs a progressé d'environ 126 millions. Ce lancement ne constitue pas un nouveau produit à proprement parler, mais une stratégie de cohérence de marque dans un marché extrêmement concurrentiel. En dotant son assistant d'une identité visuelle forte et reconnaissable, Alibaba cherche à fidéliser ses utilisateurs et à créer un sentiment de continuité entre des plateformes très différentes. La fréquence d'utilisation mensuelle reste cependant un point de vigilance : avec 19,8 sessions par utilisateur en moyenne, Qwen se situe en dessous de plusieurs concurrents directs, ce qui suggère que l'engagement reste à consolider malgré la croissance spectaculaire du nombre d'inscrits. Ce mouvement s'inscrit dans une compétition acharnée entre les géants technologiques chinois pour dominer le marché de l'IA grand public. Baidu avec Ernie Bot, ByteDance et ses propres modèles, ainsi que des acteurs plus récents comme DeepSeek exercent une pression croissante sur Alibaba. Le dépôt de marques incluant la robotique humanoïde laisse entrevoir des ambitions bien au-delà du simple chatbot. Alibaba semble vouloir faire de Qwen XiaoJiuWo un point d'entrée transversal vers l'ensemble de ses services numériques, pariant sur l'unification de l'expérience utilisateur comme levier de différenciation à long terme.

OutilsOpinion
1 source
Alibaba présente l'avatar "Qwen Dimples" pour unifier son écosystème d'assistants IA
223Pandaily 

Alibaba présente l'avatar "Qwen Dimples" pour unifier son écosystème d'assistants IA

Alibaba a officiellement dévoilé le 22 avril 2026 "Qwen Dimples", un avatar numérique conçu pour incarner l'interface unifiée de son écosystème d'IA Qwen. Ce personnage virtuel sera d'abord intégré à l'application Qwen, puis progressivement déployé sur les grandes plateformes du groupe, dont Taobao, Fliggy, Amap et Alipay. Il ne s'agit pas d'un nouveau produit autonome, mais d'une couche d'identité visuelle et d'interaction destinée à fédérer l'ensemble des services IA d'Alibaba sous une même présence reconnaissable. En amont du lancement, la filiale Alibaba (China) Co., Ltd. avait déposé plusieurs marques commerciales liées à "Qwen Dimples" dès le 10 mars 2026, couvrant des domaines aussi variés que l'IA-as-a-service, les logiciels de chatbot et la robotique humanoïde. Ces demandes sont actuellement en cours d'examen. L'initiative intervient alors que l'application Qwen affiche une audience considérable : selon QuestMobile, elle comptait 166 millions d'utilisateurs actifs mensuels en mars 2026, ce qui la place au deuxième rang parmi les applications d'IA natives en Chine. Sa base d'utilisateurs a bondi d'environ 126 millions au seul premier trimestre 2026, une croissance particulièrement rapide. Toutefois, la fréquence d'utilisation mensuelle moyenne reste à 19,8 sessions par utilisateur, un chiffre inférieur à certains concurrents, ce qui suggère un enjeu d'engagement et de fidélisation que l'avatar cherche peut-être à adresser. La stratégie d'Alibaba s'inscrit dans une tendance plus large où les grandes plateformes technologiques cherchent à humaniser leurs interfaces IA pour renforcer l'attachement des utilisateurs. En dotant Qwen d'un visage et d'une personnalité cohérente sur l'ensemble de son écosystème, Alibaba suit une logique similaire à celle d'autres géants comme ByteDance ou Baidu, qui ont également misé sur des avatars et des mascottes numériques. Les dépôts de marques dans le domaine de la robotique humanoïde laissent également entrevoir des ambitions au-delà du logiciel, dans un secteur que le groupe suit de près.

BusinessOpinion
1 source
ARM : modélisation des récompenses par avantage pour la manipulation à long horizon
224arXiv cs.RO 

ARM : modélisation des récompenses par avantage pour la manipulation à long horizon

Une équipe de chercheurs propose ARM (Advantage Reward Modeling, arXiv:2604.03037), un framework pour améliorer l'apprentissage par renforcement (RL) sur des tâches de manipulation robotique à long horizon. Le problème de fond : les récompenses éparses fournissent trop peu de signal pour guider l'apprentissage quand une tâche implique des dizaines d'étapes. ARM substitue la mesure de progression absolue par une estimation de l'avantage relatif, via un protocole de labeling à trois états : Progressif, Régressif, Stagnant. Ce schéma tri-état réduit la charge cognitive des annotateurs humains tout en assurant une forte cohérence inter-annotateurs. Intégré dans un pipeline de RL offline, il pondère les données de façon adaptative pour filtrer les échantillons sous-optimaux. Résultat annoncé : 99,4 % de réussite sur une tâche de pliage de serviette à long horizon, avec quasi-absence d'intervention humaine pendant l'entraînement. L'atout principal d'ARM est son coût d'annotation réduit face aux méthodes classiques de reward shaping dense, qui exigent une ingénierie fine de la fonction de récompense et peinent à modéliser des comportements non monotones comme le backtracking ou la récupération d'erreur. ARM ramène l'annotation à une classification intuitive, applicable aux démonstrations complètes comme aux données fragmentées issues de DAgger (imitation learning itératif). Les auteurs rapportent un gain sur les baselines VLA (Vision-Language-Action) actuels en stabilité et en efficacité des données, mais le benchmark se limite à un seul scénario de pliage de serviette : un résultat prometteur qui reste à confirmer sur un panel de tâches plus large et diversifié. La manipulation à long horizon demeure l'un des problèmes les plus ouverts de la robotique, au coeur de la compétition entre Pi-0 (Physical Intelligence), GR00T N2 (NVIDIA) et d'autres architectures VLA. ARM s'inscrit dans le courant qui vise à rendre le RL applicable en conditions réelles sans dépendre massivement de la simulation (sim-to-real) ni de fonctions de récompense codifiées manuellement. Il s'agit d'un résultat de laboratoire : aucun déploiement terrain ni partenaire industriel n'est mentionné dans la publication. Les suites attendues sont une validation sur des tâches plus variées et des plateformes robotiques commerciales, notamment les humanoïdes actuellement en phase de commercialisation.

AutreOpinion
1 source
La réalité virtuelle pour faciliter la collecte de données dans les tâches d'IA incarnée
225arXiv cs.RO 

La réalité virtuelle pour faciliter la collecte de données dans les tâches d'IA incarnée

Des chercheurs ont publié sur arXiv (arXiv:2604.16903) un framework de collecte de données pour robots embodied basé sur Unity, qui exploite la réalité virtuelle et les mécaniques de jeu vidéo pour contourner le goulet d'étranglement majeur du domaine : obtenir des démonstrations humaines en quantité suffisante. Le système combine génération procédurale de scènes, téléopération d'un robot humanoïde en VR, évaluation automatique des tâches et journalisation de trajectoires. Un prototype concret a été développé et validé : une tâche de pick-and-place de déchets, dans laquelle l'opérateur incarne le robot via un casque VR pour saisir et trier des objets dans des environnements générés aléatoirement. Les résultats expérimentaux montrent que les démonstrations collectées couvrent largement l'espace état-action, et que l'augmentation de la difficulté de la tâche entraîne une intensité de mouvement plus élevée ainsi qu'une exploration plus étendue de l'espace de travail du bras. Ce travail s'attaque à un problème structurel de l'intelligence embodied : les interfaces de téléopération classiques (manettes, bras maître-esclave, exosquelettes) sont coûteuses, peu accessibles et difficiles à déployer à grande échelle. En gamifiant la collecte, le framework ouvre la possibilité de recruter des opérateurs non spécialisés via des interfaces VR grand public, réduisant potentiellement le coût marginal par démonstration. La couverture large de l'espace état-action est un signal positif pour l'entraînement de politiques robustes, notamment les VLA (Vision-Language-Action models) qui dépendent de la diversité des trajectoires. Il faut toutefois nuancer : le prototype reste une tâche simple (ramassage d'objet), et les auteurs ne fournissent pas de métriques de transfert vers un robot physique réel, la question du sim-to-real gap reste entière. Ce type d'approche s'inscrit dans une tendance plus large de recours aux environnements synthétiques pour l'entraînement robotique, portée notamment par Physical Intelligence (pi0), Google DeepMind (RoboVQA, RT-2) et NVIDIA (GROOT). La génération procédurale de scènes est également au coeur des pipelines de simulation massive comme IsaacLab. L'originalité ici est l'angle "jeu vidéo" assumé, qui rapproche la collecte de données des méthodes de crowdsourcing humain utilisées en NLP. Les prochaines étapes naturelles seraient un benchmark sur robot physique, une extension à des tâches bimanuelle, et une évaluation de la qualité des politiques entraînées sur ces données face à des baselines téléopérées classiques.

AutreActu
1 source
L’IA va voler votre job, Musk veut vous donner un salaire (et pas un petit)
226Le Big Data 

L’IA va voler votre job, Musk veut vous donner un salaire (et pas un petit)

Le 17 avril 2026, Elon Musk a publié sur le réseau X un message qui a immédiatement enflammé les débats économiques : selon lui, la meilleure réponse au chômage de masse causé par l'intelligence artificielle serait un « Universal High Income » (UHI), soit un Revenu Universel Élevé versé sous forme de chèques par le gouvernement fédéral américain. Ce n'est plus le simple filet de sécurité qu'il évoquait dès 2018 sous le nom d'UBI, mais une promesse d'aisance généralisée. Son argument central : l'IA et la robotique vont produire des biens et services en quantité tellement excédentaire par rapport à la masse monétaire injectée que l'inflation serait mécaniquement neutralisée, rendant un revenu confortable pour tous non seulement possible, mais nécessaire. Cette déclaration intervient alors que les robots humanoïdes et les modèles d'IA générative s'apprêtent à automatiser une part inédite du travail physique et intellectuel en ce début d'année 2026. L'impact potentiel d'une telle proposition est considérable, mais sa faisabilité économique est sévèrement contestée. Si Musk a raison, des dizaines de millions de travailleurs déplacés par l'automatisation bénéficieraient d'un revenu suffisant pour maintenir un niveau de vie correct, évitant une crise sociale d'ampleur historique. Mais la majorité des économistes jugent son calcul mathématiquement intenable : injecter massivement de l'argent public sans créer d'inflation suppose que la productivité des machines suive une courbe de déflation technologique sans précédent et soutenue, ce qui reste une hypothèse non démontrée. Le financement d'un tel programme représenterait des milliers de milliards de dollars annuels pour les seuls États-Unis, sans source de revenus fiscaux clairement identifiée dans un monde où les grandes entreprises tech optimisent déjà leur fiscalité. Cette sortie de Musk s'inscrit dans une trajectoire qui dure depuis plusieurs années, mais marque une rupture de ton. En 2018, il parlait de filet de sécurité ; pendant la pandémie, il saluait les chèques de 1 400 dollars comme un « UBI lite ». Aujourd'hui, il parle d'abondance et de post-rareté, une vision qui n'est plus défensive mais utopique. Derrière l'annonce se profile aussi une question philosophique que peu d'économistes osent quantifier : si le travail disparaît, comment des sociétés entières trouveront-elles sens, identité et cohésion sociale ? Le risque d'une dépendance généralisée à l'État, que certains appellent déjà le « techno-féodalisme », est réel. Musk lui-même, à la tête de Tesla, SpaceX et xAI, est l'un des principaux acteurs de cette automatisation qu'il propose maintenant de compenser financièrement, ce qui ne manque pas d'alimenter les questions sur les conflits d'intérêts et la sincérité du projet.

SociétéOpinion
1 source
Comment les robots apprennent : une courte histoire contemporaine
227MIT Technology Review 

Comment les robots apprennent : une courte histoire contemporaine

En 2025, les investisseurs ont injecté 6,1 milliards de dollars dans les robots humanoïdes, soit quatre fois plus qu'en 2024. Ce chiffre illustre un tournant spectaculaire pour une industrie longtemps boudée par la Silicon Valley après des décennies de promesses non tenues. Le changement de paradigme remonte à plusieurs ruptures technologiques successives : d'abord, vers 2015, l'abandon des systèmes à base de règles codées manuellement au profit de l'apprentissage par renforcement, où un robot simulé s'améliore par essais et erreurs sur des millions d'itérations. Puis, en 2022, l'irruption de ChatGPT a tout accéléré : les grands modèles de langage, entraînés sur des corpus massifs de textes, ont été adaptés à la robotique pour ingérer images, capteurs et positions articulaires, et prédire en temps réel la prochaine action à exécuter, en émettant des dizaines de commandes motrices par seconde. Ce glissement conceptuel, de la programmation exhaustive vers des modèles d'IA nourris de données massives, change radicalement ce qui est désormais possible. Un robot n'a plus besoin qu'un ingénieur anticipe chaque cas particulier, plier une chemise froissée, gérer une manche tordue, adapter le geste à un tissu délicat. Il apprend à generaliser. Cette approche fonctionne aussi bien pour des robots conversationnels que pour des machines qui naviguent dans un environnement physique ou accomplissent des tâches complexes. Pour les industriels, la perspective d'une main-d'œuvre robotique sans salaire devient crédible ; pour les acteurs du soin et du maintien à domicile, celle d'assistants capables d'interagir naturellement avec des personnes âgées ou à mobilité réduite se rapproche aussi. L'histoire de Jibo illustre parfaitement ce chemin parcouru. Ce petit robot social sans bras ni jambes, présenté en 2014 par la chercheuse du MIT Cynthia Breazeal, avait levé 3,7 millions de dollars en crowdfunding et suscité 4 800 précommandes à 749 dollars pièce. Il pouvait se présenter, danser pour des enfants, mais restait très limité faute de véritables capacités langagières, un domaine où il peinait à rivaliser avec Siri d'Apple. La société a fermé ses portes en 2019, victime de ses ambitions prématurées. Rétrospectivement, Jibo manquait précisément des modèles de langage qui existent aujourd'hui. C'est cette convergence, entre LLMs, apprentissage par renforcement et déploiement de robots imparfaits pour qu'ils apprennent dans leur environnement réel, qui redonne aujourd'hui à la Silicon Valley l'audace de rêver aux robots de science-fiction.

UEL'essor des robots humanoïdes ouvre des perspectives pour les secteurs français du soin et du maintien à domicile, mais les investissements restent largement concentrés hors d'Europe.

RobotiqueOpinion
1 source
Le nouveau modèle de Google rend les cerveaux robotiques un peu plus intelligents
228The Information AI 

Le nouveau modèle de Google rend les cerveaux robotiques un peu plus intelligents

Google DeepMind a publié cette semaine Gemini Robotics-ER-1.6, un nouveau modèle de vision et de langage conçu pour aider les robots à interpréter leur environnement. Pour illustrer ses capacités, Boston Dynamics, qui dispose d'un accord pour intégrer Gemini dans ses robots humanoïdes, a publié une vidéo de ses robots quadrupèdes utilisant le modèle pour lire un thermomètre lors d'une inspection dans une installation industrielle. Selon les benchmarks internes de Google, les gains restent modestes sur un seul flux caméra : le modèle n'améliore que marginalement la capacité du robot à détecter la fin d'une tâche par rapport aux versions précédentes. En revanche, les performances progressent nettement lorsque le robot exploite plusieurs flux caméra simultanément. C'est précisément là que réside l'enjeu pratique : la majorité des environnements robotiques industriels, qu'il s'agisse d'usines ou d'entrepôts, s'appuient sur plusieurs points de vue combinés, comme une caméra en hauteur et une caméra fixée sur le bras du robot. Le système doit être capable de fusionner ces perspectives pour construire une compréhension cohérente de ce qu'il accomplit et savoir quand la tâche est terminée. Ce lancement s'inscrit dans une course intense entre les grands laboratoires d'IA pour doter les robots d'une intelligence de perception plus robuste. Google DeepMind et Boston Dynamics ont formalisé leur partenariat autour de Gemini pour les robots humanoïdes, signalant une convergence entre les modèles de fondation et la robotique physique. Si les progrès annoncés restent incrémentaux, l'amélioration sur les configurations multi-caméras est directement applicable aux déploiements industriels existants, ce qui pourrait accélérer l'adoption de robots autonomes dans des environnements de travail réels. Les prochaines versions du modèle seront à surveiller pour évaluer si ces gains se traduisent en performances significatives sur des tâches complexes en conditions réelles.

RobotiqueActu
1 source
Vidéo : Edward le robot prend en chasse une meute de sangliers dans Varsovie !
229Le Big Data 

Vidéo : Edward le robot prend en chasse une meute de sangliers dans Varsovie !

Le 12 avril 2026, les habitants d'un parking de Varsovie ont assisté à une scène inattendue : un robot humanoïde poursuivant un groupe de sangliers pour les repousser vers la forêt. Le robot en question s'appelle Edward, et il s'agit d'un Unitree G1, modèle conçu pour évoluer dans des environnements urbains complexes. Mesurant 1,32 mètre, équipé d'un sac à dos et capable de se déplacer sur différents types de terrains, Edward a avancé calmement vers les animaux, les suivant sur plusieurs mètres sans geste brusque ni contact direct, jusqu'à ce qu'ils quittent la zone. La vidéo de l'intervention a rapidement circulé sur les réseaux sociaux, cumulant des millions de vues en quelques heures sur TikTok, Instagram et X, où Edward dépasse déjà les 500 millions de vues au total. Cette opération illustre une approche radicalement différente de la gestion de la faune urbaine. Les sangliers représentent un problème récurrent dans plusieurs quartiers de Varsovie : ils fouillent les poubelles, effraient les passants et créent des nuisances durables. Les méthodes traditionnelles, fondées sur la chasse ou les pièges, divisent régulièrement l'opinion publique et engendrent des tensions. Le robot propose une troisième voie : éloigner les animaux sans violence, sans risque pour les agents municipaux, et sans confrontation directe. L'approche séduit car elle combine efficacité opérationnelle et acceptabilité sociale, deux critères que les villes cherchent de plus en plus à concilier dans la gestion de leurs espaces publics. Edward n'est pas un prototype improvisé. Le robot a suivi un entraînement spécifique en Chine fin 2025, et son logiciel pilote ses déplacements en temps réel selon les contraintes du terrain. À Varsovie, il est devenu une figure publique à part entière : il discute avec des passants, est apparu à la télévision et s'est rendu au Parlement polonais, incarnant une forme nouvelle de robot à la fois fonctionnel et influenceur. La Pologne s'impose ainsi comme un terrain d'expérimentation sérieux pour l'usage civil de la robotique humanoïde en milieu urbain. Reste une question ouverte que cette séquence virale pose avec acuité : à mesure que ces robots gagnent en autonomie et en visibilité, comment les sociétés vont-elles définir leur rôle légitime dans l'espace public, et jusqu'où peut aller leur déploiement sans encadrement réglementaire clair ?

UELa Pologne expérimente le déploiement civil de robots humanoïdes en milieu urbain, soulevant des questions concrètes sur l'encadrement réglementaire européen de la robotique autonome dans l'espace public, un enjeu directement couvert par l'AI Act.

RobotiqueOpinion
1 source
Plus précis que LeBron ? Découvrez CUE7, le robot basketteur révolutionnaire de Toyota
230Le Big Data 

Plus précis que LeBron ? Découvrez CUE7, le robot basketteur révolutionnaire de Toyota

Toyota a dévoilé le 14 avril 2026 la septième génération de son robot basketteur CUE7, une machine capable de tirer au panier, dribbler et se déplacer avec une précision remarquable. Par rapport à son prédécesseur CUE6, ce robot a été considérablement allégé, passant de 120 kg à 74 kg, et adopte une structure à deux roues inversées qui améliore sa stabilité et son agilité. Techniquement, CUE7 repose sur une combinaison de vision artificielle, de planification de mouvement et d'un système hybride mêlant apprentissage par renforcement et contrôle classique : le robot analyse le panier, calcule la distance, ajuste sa posture et déclenche le tir avec une régularité quasi mécanique. En 2019 déjà, la version CUE3 avait enchaîné 2 020 lancers francs réussis d'affilée, une série arrêtée volontairement par les ingénieurs alors que la machine pouvait continuer. En 2024, CUE6 avait décroché un record Guinness avec un tir longue distance impressionnant. Au-delà de l'exploit sportif, CUE7 représente une étape concrète dans le développement de ce que Toyota appelle l'intelligence artificielle incarnée, des systèmes capables d'interagir physiquement avec leur environnement de façon autonome et adaptative. Le basket-ball n'est pas un choix anodin : ce sport impose des défis simultanés complexes, comme la détection de cible, le calcul de trajectoire, la coordination motrice et l'ajustement en temps réel, ce qui en fait un terrain d'expérimentation idéal pour des technologies destinées à des applications industrielles, médicales ou domestiques beaucoup plus larges. La capacité du robot à apprendre de ses erreurs et à affiner ses gestes par itération rapproche son fonctionnement de celui d'un athlète humain s'entraînant séance après séance. Le projet CUE est né à l'origine d'une initiative parallèle portée par des employés passionnés de Toyota, avant d'être intégré dans une démarche de recherche plus structurée. Depuis ses débuts sous forme de prototype LEGO, la série a progressé de génération en génération vers plus d'autonomie, de mobilité et de précision. CUE7 marque le saut le plus visible à ce jour, avec un robot capable non seulement de tirer mais aussi de se déplacer et de dribbler. Cette trajectoire s'inscrit dans une course plus large menée par les grands acteurs industriels, Toyota, Boston Dynamics, Figure, Tesla, pour doter les robots humanoïdes et semi-humanoïdes de capacités physiques comparables à celles de l'humain, ouvrant la voie à des usages concrets dans des environnements non structurés.

RobotiqueActu
1 source
Qu'est-ce qui cloche chez les géants de l'IA ?
231Ars Technica AI 

Qu'est-ce qui cloche chez les géants de l'IA ?

Sam Altman, PDG d'OpenAI, a publié l'an dernier un billet de blog intitulé "A Gentle Singularity", lu par près de 600 000 personnes. Sa thèse centrale : l'IA ne présente que des avantages, et tout ce qui s'est produit jusqu'ici n'est qu'un avant-goût d'un avenir encore plus radieux. Altman y décrit un scénario de croissance exponentielle : fabriquer un premier million de robots humanoïdes "à l'ancienne", puis laisser ces robots gérer l'intégralité de la chaîne d'approvisionnement, de l'extraction minière à la fabrication de puces, pour produire ensuite encore plus de robots et de centres de données. Des "boucles auto-renforçantes" qui, selon lui, vont transformer le rythme du progrès de façon radicale. Ce discours pose un problème fondamental : il évacue systématiquement les risques. Interrogé sur les inconvénients, Altman répond, en substance, que les humains s'adaptent vite. Cette posture n'est pas anodine venant du patron de l'entreprise la plus influente du secteur. Quand le PDG d'OpenAI présente une vision aussi unilatéralement optimiste à 600 000 lecteurs, il contribue à façonner la manière dont l'industrie, les investisseurs et les décideurs politiques perçoivent les risques liés à l'IA. L'absence de nuance n'est pas une légèreté rhétorique, c'est un choix éditorial avec des conséquences réelles sur les régulations et les priorités de recherche en matière de sécurité. Ce billet s'inscrit dans un pattern plus large chez les dirigeants des grandes entreprises d'IA : des déclarations qui ressemblent davantage à des arguments de vente qu'à une réflexion sincère sur l'avenir technologique. Altman n'est pas seul dans ce registre, mais il occupe une position particulièrement centrale. OpenAI reste l'acteur de référence du secteur, et chaque prise de parole de son PDG est amplifiée à l'échelle mondiale. La question que pose cet article dépasse le cas Altman : peut-on faire confiance aux architectes de cette révolution pour en évaluer lucidement les risques, ou leur intérêt économique rend-il cette lucidité structurellement impossible ?

UELes discours unilatéralement optimistes des dirigeants d'IA américains influencent directement les décideurs politiques européens et risquent de biaiser les priorités de l'AI Act vers l'innovation au détriment de la sécurité.

ÉthiqueOpinion
1 source
MindOn : ce cerveau IA transforme n’importe quel robot en femme de ménage
232Le Big Data 

MindOn : ce cerveau IA transforme n’importe quel robot en femme de ménage

La startup chinoise MindOn, basée à Shenzhen, a dévoilé début avril 2026 un système baptisé MindOn Brain, un cerveau IA conçu pour doter le robot humanoïde G1 d'Unitree Robotics d'une autonomie domestique complète. Le G1, qui mesure 1,30 mètre et embarque des dizaines d'articulations, des capteurs et des caméras 3D, était jusqu'ici limité à des tâches télécommandées ou préprogrammées. Avec cette couche logicielle, le robot est désormais capable d'arroser des plantes, d'ouvrir des rideaux, de nettoyer des surfaces, de déplacer des objets et même de monter sur un lit pour aspirer un matelas, le tout sans intervention humaine en temps réel. Les démonstrations diffusées en ligne, relayées notamment par le compte Space and Technology sur X, montrent un robot qui interprète des objectifs plutôt que de simples instructions séquentielles. Ce qui distingue cette avancée des robots domestiques précédents, c'est précisément ce saut vers l'autonomie au niveau des tâches. Jusqu'ici, la majorité des humanoïdes commerciaux nécessitait un pilotage constant ou des environnements très contraints. MindOn propose un cerveau numérique capable d'observer l'environnement, d'adapter les actions en temps réel et de gérer des séquences complexes de manière cohérente. Pour l'industrie de la robotique de service, cela représente un changement de paradigme : la valeur ne réside plus uniquement dans le hardware, mais dans le logiciel qui l'anime. Un même châssis physique pourrait changer totalement d'usage selon le système d'intelligence qui le pilote, ouvrant la voie à une modularité inédite dans le secteur. Cette annonce s'inscrit dans un contexte de convergence entre des LLM de plus en plus capables d'interpréter des contextes complexes et des robots dont le hardware a atteint un niveau de précision suffisant pour exécuter ces décisions. La demande de fond, elle, est structurelle : vieillissement de la population, pénurie de main-d'oeuvre domestique et recherche de confort poussent le marché vers des assistants autonomes. Cela dit, les démonstrations actuelles se déroulent dans des environnements soigneusement contrôlés, loin du chaos d'un foyer réel avec ses imprévus, ses enfants, ses animaux et ses instructions implicites. La fiabilité, la sécurité et la capacité à gérer des situations non anticipées restent des défis ouverts. MindOn illustre une direction que toute la robotique humanoïde cherche à prendre, mais la distance entre une démo convaincante et un produit déployable à grande échelle reste, pour l'instant, considérable.

RobotiqueOpinion
1 source
Il y a 30 ans, les robots ont appris à marcher sans tomber
233IEEE Spectrum AI 

Il y a 30 ans, les robots ont appris à marcher sans tomber

En 1996, Honda a présenté le Prototype 2 (P2), le premier robot humanoïde autonome capable de marcher sans tomber. Mesurant 183 centimètres pour 210 kilogrammes, le P2 pouvait contrôler sa posture pour maintenir l'équilibre et actionner plusieurs articulations simultanément. Cette réalisation vient d'être reconnue comme un IEEE Milestone, avec une cérémonie de dédicace prévue le 28 avril au Honda Collection Hall, sur le circuit Mobility Resort Motegi au Japon. Derrière cette prouesse, quatre ingénieurs Honda : Kazuo Hirai, Masato Hirose, Yuji Haikawa et Toru Takenaka, qui avaient lancé le projet dès 1986 avec l'ambition de créer un robot domestique capable de monter des escaliers, contourner des obstacles et manipuler des outils. Cette avancée a redéfini les standards de la robotique mondiale. Avant le P2, aucun robot ne pouvait se déplacer de manière autonome sans perdre l'équilibre — le WABOT-1, construit en 1973 à l'Université Waseda de Tokyo, pouvait certes marcher et parler japonais, mais de façon instable et sans capacité à éviter les obstacles. L'équipe Honda a dû repenser entièrement la biomécanique humaine : analyser les mouvements du corps, adapter le nombre d'articulations (hanches, genoux, chevilles, épaules), et installer des moteurs DC avec des systèmes de réduction harmonique pour concilier compacité et couple élevé. Les premiers prototypes, comme le E0 — une simple paire de jambes — mettaient 15 secondes par pas. Chaque itération a permis de passer de la marche statique en ligne droite à une locomotion dynamique et autonome, ouvrant la voie aux robots humanoïdes modernes comme l'ASIMO ou ceux développés aujourd'hui par Boston Dynamics, Figure ou 1X. Quand C-3PO est apparu sur grand écran en 1977, l'idée d'un androïde marchant et interagissant comme un humain relevait de la science-fiction. Il aura fallu près de vingt ans à l'ingénierie réelle pour rattraper cette vision — et le P2 en a posé la première pierre concrète.

RobotiqueOpinion
1 source
Amazon rachète Fauna, fabricant de robots « accessibles »
234AI Business 

Amazon rachète Fauna, fabricant de robots « accessibles »

Amazon a acquis Fauna, une startup spécialisée dans la robotique humanoïde grand public, dans une opération dont les détails financiers n'ont pas été divulgués. Cette transaction marque l'entrée officielle du géant technologique sur le marché en pleine expansion des robots humanoïdes destinés aux consommateurs. Ce rachat est significatif car il signale qu'Amazon ne se contente plus de la robotique industrielle et logistique — domaine où il est déjà très actif via ses entrepôts automatisés. En ciblant un fabricant positionné sur l'accessibilité et l'aspect « approchable » des robots, Amazon vise directement le marché domestique, potentiellement pour des usages à domicile ou en interaction directe avec les clients. La robotique humanoïde grand public connaît une effervescence sans précédent, avec des acteurs comme Figure, 1X ou Boston Dynamics se disputant ce nouveau terrain. Amazon rejoint ainsi une course technologique qui s'intensifie rapidement.

UEL'entrée d'Amazon sur le marché des robots humanoïdes grand public pourrait accélérer leur déploiement dans les entrepôts et foyers européens, où Amazon est déjà fortement implanté.

RobotiqueActu
1 source
Sunday Robotics lève 165 millions pour son robot domestique
235Le Big Data 

Sunday Robotics lève 165 millions pour son robot domestique

Sunday Robotics, fondée par Tony Zhao et Cheng Chi (doctorants de Stanford), vient de lever 165 millions de dollars en série B auprès de Coatue Management, Tiger Global et Bain Capital Ventures, atteignant une valorisation de 1,15 milliard de dollars. La startup développe Memo, un robot humanoïde domestique autonome destiné aux tâches ménagères courantes (lessive, débarrassage), avec un déploiement prévu dès 2026 et déjà plus de 1 000 personnes sur liste d'attente. L'entreprise ambitionne de dépasser les démonstrations spectaculaires habituelles du secteur en proposant un robot réellement opérationnel dans des environnements domestiques imprévisibles.

RobotiqueActu
1 source
Nouvel alliance pour offrir des robots intelligents dans des environnements à haut risque
236AI News 

Nouvel alliance pour offrir des robots intelligents dans des environnements à haut risque

ADLINK Technology et Under Control Robotics (derrière la startup Noble Machines) ont conclu un partenariat stratégique pour développer une nouvelle génération de robots humanoïdes bipèdes destinés aux environnements industriels dangereux. Leur solution combinera la plateforme edge AI DLAP d'ADLINK (basée sur NVIDIA Jetson Thor) avec le logiciel d'autonomie et de contrôle corporel de Noble Machines, pour des robots capables de percevoir, raisonner et manipuler des charges lourdes en conditions extrêmes. Les secteurs cibles initiaux incluent la construction, les mines, l'énergie et la pétrochimie — des industries confrontées à des pénuries de main-d'œuvre et à des risques élevés pour les travailleurs humains.

RobotiqueActu
1 source
Vidéo : le robot Figure sait maintenant faire toutes les corvées (contrairement à moi)
237Le Big Data 

Vidéo : le robot Figure sait maintenant faire toutes les corvées (contrairement à moi)

La startup américaine Figure a publié une démonstration de son robot humanoïde capable d'effectuer des tâches domestiques — ranger des objets, replacer des coussins — sans programmation détaillée pour chaque geste. Le robot s'appuie sur une architecture Vision-Language-Action (VLA) et un modèle baptisé Helix, capable de manipuler des objets jamais vus auparavant en combinant vision, compréhension du langage naturel et exécution de mouvements physiques. Cette démonstration illustre une compétition mondiale croissante autour des robots humanoïdes domestiques.

RobotiqueActu
1 source