Aller au contenu principal
Google DeepMind publie Gemini Robotics-ER 1.6 : raisonnement incarné amélioré et lecture d'instruments pour l'IA physique
RobotiqueMarkTechPost6j

Google DeepMind publie Gemini Robotics-ER 1.6 : raisonnement incarné amélioré et lecture d'instruments pour l'IA physique

1 source couvre ce sujet·Source originale ↗·

Google DeepMind a publié Gemini Robotics-ER 1.6, une mise à jour majeure de son modèle de raisonnement incarné destiné à servir de cerveau cognitif aux robots évoluant dans des environnements physiques réels. Ce modèle ne contrôle pas directement les membres d'un robot, c'est le rôle du modèle jumeau Gemini Robotics 1.5, dit VLA (vision-language-action), qui traduit les instructions en commandes motrices. Gemini Robotics-ER 1.6 joue plutôt le rôle du stratège : il analyse l'espace, planifie les tâches, détecte les succès et peut appeler des outils externes comme Google Search ou des fonctions définies par l'utilisateur. Par rapport à la version 1.5, la nouvelle itération améliore nettement les capacités de raisonnement spatial et physique, pointage précis au pixel près, comptage d'objets, raisonnement relationnel ("l'objet le plus petit", "déplacer X vers Y"), et introduit une fonctionnalité entièrement nouvelle : la lecture d'instruments analogiques.

L'impact de ces améliorations est concret et mesurable. Dans les benchmarks internes, Gemini Robotics-ER 1.6 identifie correctement le nombre de marteaux, ciseaux, pinceaux, pinces et outils de jardin présents dans une scène, et refuse de pointer des objets absents de l'image, là où la version 1.5 hallucine une brouette inexistante et rate plusieurs objets. Cette fiabilité est critique : dans un pipeline robotique, une fausse détection d'objet provoque des erreurs en cascade, le robot tentant d'interagir avec du vide. La détection de succès multi-vues, savoir quand une tâche est réellement terminée en fusionnant plusieurs flux caméra simultanément, améliore également la capacité du système à décider entre relancer une tentative échouée ou passer à l'étape suivante. La lecture d'instruments, elle, permet pour la première fois à un robot de lire un cadran analogique, un thermomètre ou un manomètre sans avoir besoin que l'instrument soit numérique.

Cette publication s'inscrit dans une course effrénée à l'IA physique, où Google DeepMind affronte des acteurs comme Figure AI, Physical Intelligence ou Boston Dynamics sur le terrain de la robotique généraliste. L'architecture duale stratège/exécuteur choisie par DeepMind tranche avec les approches bout-en-bout de certains concurrents, pari sur une meilleure modularité et une plus grande capacité à intégrer des outils tiers. La lecture d'instruments ouvre des perspectives industrielles immédiates : inspection d'équipements dans des usines ou des centrales, environnements où la numérisation complète des capteurs reste coûteuse. Gemini Robotics-ER 1.6 est disponible via Google AI Studio et l'API Gemini, et DeepMind a annoncé un programme d'accès anticipé pour les entreprises souhaitant l'intégrer dans leurs pipelines robotiques.

Impact France/UE

Les capacités de lecture d'instruments analogiques et d'inspection visuelle ouvrent des débouchés immédiats pour les industriels européens (usines, centrales) souhaitant déployer des robots dans des environnements non numérisés.

À lire aussi

Tesla et Optimus : pourquoi Elon Musk ne peut plus se passer de la Chine
1Frandroid 

Tesla et Optimus : pourquoi Elon Musk ne peut plus se passer de la Chine

Tesla a officiellement annoncé un pivot stratégique majeur : la production de ses modèles historiques est réduite au profit du robot humanoïde Optimus, qu'Elon Musk présente comme l'avenir de l'entreprise. L'objectif affiché est de produire plusieurs millions d'unités d'Optimus par an à terme, un volume qui dépasse largement les capacités actuelles des usines américaines et européennes. Pour atteindre cette échelle industrielle, Tesla s'appuie de façon croissante sur sa Gigafactory de Shanghai et sur le tissu de fournisseurs chinois spécialisés dans les moteurs, actionneurs et composants mécaniques nécessaires aux robots. Cette dépendance pose un problème stratégique de taille. Dans un contexte de guerre commerciale entre Washington et Pékin, Pékin dispose d'un levier considérable : les terres rares et les composants électroniques avancés, dont la Chine contrôle une part dominante de la production mondiale. Une restriction d'exportation ciblée pourrait paralyser la montée en cadence d'Optimus bien avant que Tesla n'ait pu diversifier ses approvisionnements. Pour Musk, qui cherche à positionner Optimus comme une réponse à la pénurie de main-d'oeuvre industrielle, l'enjeu est directement lié à la valorisation future de Tesla. Ce paradoxe illustre une tension plus large dans l'industrie robotique américaine : les entreprises qui veulent produire à grande échelle n'ont pas d'alternative crédible à court terme aux chaînes d'approvisionnement chinoises. BYD, Huawei et plusieurs groupes industriels de Shenzhen développent leurs propres robots humanoïdes, ce qui signifie que Tesla est simultanément dépendante et concurrencée par le même écosystème industriel chinois.

UELa dépendance européenne aux terres rares chinoises pour la robotique industrielle expose les industriels de l'UE aux mêmes risques d'approvisionnement, fragilisant les ambitions de souveraineté robotique européenne.

💬 Tesla mise tout sur Optimus, mais le pari repose sur des composants que Pékin peut couper en deux coups de stylo. C'est le genre de dépendance qu'on accepte quand on veut aller vite, et là Musk veut aller très vite. Sauf qu'être à la fois client et concurrent du même écosystème chinois, c'est une position qui tient jusqu'à ce qu'elle ne tienne plus.

RobotiqueOpinion
1 source
Le professeur de l'USC qui a ouvert la voie à la robotique d'assistance sociale
2IEEE Spectrum AI 

Le professeur de l'USC qui a ouvert la voie à la robotique d'assistance sociale

Maja Matarić, professeure d'informatique, de neurosciences et de pédiatrie à l'Université de Californie du Sud (USC) à Los Angeles, a reçu en 2025 la médaille Robotics de MassRobotics, une récompense qui distingue les chercheuses faisant avancer le domaine de la robotique. Pionnière de la robotique socialement assistive, une discipline qu'elle a contribué à définir en 2005, Matarić développe depuis deux décennies des robots capables de mener des conversations, de jouer à des jeux et de réagir aux émotions. Ses travaux actuels portent sur l'utilisation de robots pour aider des étudiants souffrant d'anxiété et de dépression à suivre une thérapie cognitivo-comportementale (TCC), une approche clinique visant à modifier les schémas de pensée négatifs. Membre de l'IEEE au rang de Fellow, elle a été formée à l'Université du Kansas, où elle a obtenu son diplôme en informatique en 1987, puis au MIT, où elle a réalisé son master et son doctorat en intelligence artificielle et robotique, obtenus respectivement en 1990 et 1994. L'impact des recherches de Matarić touche des populations particulièrement vulnérables : enfants autistes, adolescents en souffrance psychologique, patients nécessitant une rééducation personnalisée. En remplaçant ou en complétant l'interaction humaine par des robots capables d'adapter leur comportement en temps réel, ses travaux ouvrent une voie concrète pour démocratiser l'accès à certaines formes de thérapie, notamment dans des contextes où les professionnels de santé sont en nombre insuffisant. La TCC assistée par robot, en particulier, représente une avancée significative : elle permet de délivrer un accompagnement structuré et répétable, sans les biais relationnels qui peuvent freiner certains patients dans un cadre clinique traditionnel. Née à Belgrade, en Serbie, Matarić a grandi dans une famille marquée par l'ingénierie : son père était ingénieur, son oncle travaillait dans l'aérospatiale. Après le décès de son père à ses 16 ans, elle émigre aux États-Unis avec sa mère. Au MIT, elle rejoint le laboratoire de Rodney Brooks, pionnier des systèmes robotiques réactifs, et développe Toto, le premier robot navigant à base de comportements, capable de cartographier un bâtiment grâce à des capteurs sonars. Ce parcours l'a menée à Brandeis University, puis à USC, où elle dirige aujourd'hui un laboratoire de référence mondiale. À une époque où la robotique sociale suscite un intérêt croissant des géants technologiques et des fonds d'investissement, les travaux fondateurs de Matarić rappellent que les applications les plus durables de la robotique sont souvent celles centrées sur l'humain.

RobotiqueOpinion
1 source
Vidéo : ce robot chinois a battu le record du semi-marathon détenu par un humain
3Le Big Data 

Vidéo : ce robot chinois a battu le record du semi-marathon détenu par un humain

Un robot humanoïde du fabricant chinois Honor a bouclé un semi-marathon à Pékin en 50 minutes et 26 secondes, surpassant le record humain de la discipline détenu par l'athlète ougandais Jacob Kiplimo. Surnommé "Lightning", ce robot aux jambes de 95 centimètres a reproduit une foulée longue et efficace, proche de celle des athlètes professionnels. Honor n'a pas engagé un seul robot dans cette course, mais trois, signalant une stratégie industrielle assumée plutôt qu'un simple coup de communication. Parmi les plus de 100 robots humanoïdes présents sur la ligne de départ, près de la moitié ont franchi l'arrivée sans aucune assistance humaine directe, analysant leur environnement en temps réel et ajustant leur trajectoire de manière autonome. Ce résultat marque un saut qualitatif net par rapport à l'édition précédente, où beaucoup de robots abandonnaient en chemin, perdaient l'équilibre ou s'immobilisaient en plein effort. En 2026, les machines tiennent la distance, accélèrent, et certaines dépassent des coureurs professionnels sur plusieurs segments. Le chiffre le plus révélateur n'est pas le chrono, mais la croissance du nombre de participants : d'une vingtaine de robots l'an dernier à plus de 100 cette année. Ce que démontre Honor, c'est la capacité à faire sortir des technologies grand public, développées à l'origine pour les smartphones, vers des machines capables de performances physiques comparables à celles d'un humain entraîné. Pour l'industrie robotique mondiale, c'est la preuve que l'endurance et l'autonomie de déplacement en milieu réel ne sont plus des obstacles théoriques. La Chine investit massivement dans la robotique humanoïde depuis plusieurs années, portée par une volonté politique de dominer ce secteur jugé stratégique, au même titre que les semi-conducteurs ou l'intelligence artificielle. Des entreprises comme Unitree, Fourier Intelligence ou désormais Honor s'imposent dans un marché mondial où Boston Dynamics et Tesla (avec Optimus) font figure de références. Le semi-marathon de Pékin fonctionne comme un banc d'essai public : les robots y affrontent des conditions réelles, imprévisibles, face à des milliers de coureurs humains. Chaque édition sert à mesurer les progrès effectifs, loin des démonstrations contrôlées en laboratoire. La prochaine étape logique sera de voir ces systèmes opérer dans des environnements industriels ou de service, où la robustesse et l'autonomie comptent autant que la vitesse. La course au semi-marathon n'est qu'un indicateur parmi d'autres d'une compétition technologique beaucoup plus large qui ne fait que commencer.

UELa montée en puissance de la Chine dans la robotique humanoïde, illustrée par Honor, Unitree et Fourier, représente un défi stratégique direct pour l'industrie européenne, qui accuse un retard croissant face à des acteurs soutenus par une volonté politique nationale forte.

Physical Intelligence présente un modèle robotique à généralisation similaire aux LLM, défauts compris
4The Decoder 

Physical Intelligence présente un modèle robotique à généralisation similaire aux LLM, défauts compris

La start-up américaine Physical Intelligence a présenté π0.7, un nouveau modèle de fondation pour robots capable de recombiner des compétences acquises lors de l'entraînement pour accomplir des tâches inédites. Le principe rappelle directement le fonctionnement des grands modèles de langage, qui assemblent des fragments de leur corpus d'entraînement pour générer du texte nouveau. Les chercheurs qualifient ce phénomène de premières traces de "généralisation compositionnelle" en robotique, une capacité jusqu'ici considérée comme l'un des grands verrous du domaine. L'enjeu est considérable : un robot capable de composer librement ses compétences peut théoriquement s'adapter à des environnements non prévus lors de l'entraînement, sans reprogrammation manuelle. C'est précisément ce qui distingue l'intelligence artificielle générale de la robotique traditionnelle, figée dans des séquences prédéfinies. Physical Intelligence reconnaît toutefois que le modèle présente encore des défauts notables, signe que cette généralisation reste fragile et partielle à ce stade. Physical Intelligence, fondée en 2023 par d'anciens chercheurs de Google, DeepMind et Berkeley, s'est imposée comme l'un des acteurs les plus ambitieux de la robotique dite "généraliste". La société avait déjà publié π0 en 2024, un premier modèle de fondation polyvalent entraîné sur une large variété de tâches physiques. L'annonce de π0.7 s'inscrit dans une course plus large impliquant Figure AI, Agility Robotics et Tesla, tous en quête du même Graal : un robot capable d'apprendre une fois et de s'adapter partout.

RobotiqueOpinion
1 source