Aller au contenu principal
MolmoAct : implémentation pour le raisonnement spatial 3D, le suivi de trajectoire et la prédiction robotique
RobotiqueMarkTechPost5h

MolmoAct : implémentation pour le raisonnement spatial 3D, le suivi de trajectoire et la prédiction robotique

1 source couvre ce sujet·Source originale ↗·

Des chercheurs d'AllenAI ont publié MolmoAct, un modèle multimodal de 7 milliards de paramètres conçu pour raisonner dans l'espace tridimensionnel à partir d'observations visuelles. Le modèle, identifié sous la référence allenai/MolmoAct-7B-D-0812, accepte des entrées multi-vues, c'est-à-dire plusieurs images prises sous différents angles, et génère à partir d'instructions en langage naturel trois types de sorties : une estimation de profondeur, une trajectoire visuelle tracée, et des commandes d'action directement exploitables par un système robotique. Un tutoriel d'implémentation complet a été publié pour permettre aux développeurs de reproduire l'ensemble du pipeline dans Google Colab, en s'appuyant sur PyTorch 2.0 ou supérieur, la bibliothèque Transformers en version 4.52, et une infrastructure GPU standard.

Ce type de modèle représente un changement de paradigme dans la robotique pilotée par l'IA : plutôt que de séparer la perception visuelle, la compréhension spatiale et la planification motrice dans des modules distincts, MolmoAct intègre ces trois capacités dans un seul réseau neuronal interrogeable en langage humain. Concrètement, un opérateur peut demander au modèle d'atteindre un objet dans une scène complexe, et le système produit directement la séquence d'actions requise, en tenant compte des distances et obstacles perçus dans les images. Pour les équipes travaillant sur des bras robotiques, des drones autonomes ou des systèmes d'assistance, cette architecture réduit considérablement la complexité d'intégration et ouvre la voie à des robots pilotables par des non-spécialistes.

MolmoAct s'inscrit dans une vague de modèles dits "action-reasoning" qui cherchent à combler le fossé entre vision par ordinateur et contrôle robotique. AllenAI, l'institut de recherche fondé par Paul Allen et affilié à l'Université de Washington, développe depuis plusieurs années la famille de modèles Molmo, positionnée comme une alternative ouverte aux modèles multimodaux propriétaires de Google ou OpenAI. La publication d'un tutoriel d'implémentation pas-à-pas, avec un code entièrement reproductible et accessible sur des GPUs grand public, traduit une volonté délibérée de démocratiser ces capacités. La prochaine étape naturelle sera l'évaluation de MolmoAct sur des benchmarks robotiques standardisés et son intégration dans des environnements physiques réels, où la robustesse face aux variations d'éclairage et d'occlusion restera le principal défi.

À lire aussi

Unitree R1 : le robot humanoïde arrive sur AliExpress à 5 900 dollars
1Frandroid 

Unitree R1 : le robot humanoïde arrive sur AliExpress à 5 900 dollars

Unitree, le fabricant chinois de robots déjà célèbre pour ses chiens-robots quadrupèdes, vient de mettre en vente son humanoïde R1 sur AliExpress à partir de 5 900 dollars. Le robot est proposé directement sur la marketplace d'Alibaba, accessible à tout acheteur disposant d'un compte et d'un budget suffisant. Le R1 mesure environ 1,60 mètre, pèse autour de 50 kilogrammes, et embarque des capacités de locomotion bipède ainsi qu'une paire de bras articulés capables de manipuler des objets du quotidien. Aucune date de livraison globale n'a été précisée pour l'ensemble des marchés, mais la mise en vente marque une première concrète dans la démocratisation de la robotique humanoïde. Ce prix de 5 900 dollars représente un seuil symbolique : il place pour la première fois un robot humanoïde dans une fourchette accessible à des entreprises de taille moyenne, des laboratoires universitaires, voire à des particuliers aisés et passionnés de technologie. Jusqu'ici, les humanoïdes commerciaux les plus avancés, comme le Figure 01 ou l'Atlas de Boston Dynamics, visaient exclusivement des clients industriels avec des tarifs bien au-delà de 100 000 dollars. Unitree court-circuite cette logique en passant directement par un canal grande consommation. Cette mise en vente s'inscrit dans une dynamique d'industrialisation rapide de la robotique chinoise, portée par des coûts de fabrication compétitifs et une chaîne d'approvisionnement mature en composants électroniques et en actionneurs. Unitree a bâti sa réputation sur le Spot-like Go1 et Go2, vendus à des milliers d'unités dans le monde entier, avant de pivoter vers l'humanoïde. La concurrence avec Boston Dynamics, Agility Robotics ou Tesla Optimus se déplace désormais sur le terrain du prix, et Pékin semble avoir une longueur d'avance sur ce front.

UELa mise en vente d'un humanoïde à 5 900 dollars ouvre pour la première fois ce marché aux laboratoires universitaires et PME européens, jusqu'ici exclus par des tarifs industriels prohibitifs.

💬 5 900 dollars sur AliExpress, c'est le genre de chiffre qui rend Boston Dynamics nerveux. Unitree ne joue pas sur leur terrain, il le court-circuite complètement en passant par la grande conso, directement accessible à un labo universitaire ou une PME curieuse. Bon, sur le papier le R1 ne va pas remplacer un Optimus, mais à ce prix-là, beaucoup de gens vont quand même appuyer sur "Acheter".

RobotiqueActu
1 source
GoZTASP : une plateforme zero-trust pour la gouvernance des systèmes autonomes à grande échelle
2IEEE Spectrum AI 

GoZTASP : une plateforme zero-trust pour la gouvernance des systèmes autonomes à grande échelle

GoZTASP est une plateforme de gouvernance et d'assurance conçue pour superviser des systèmes autonomes déployés à grande échelle dans des environnements réels. Elle intègre au sein d'une architecture zero-trust unifiée des équipements hétérogènes, drones, robots, capteurs et opérateurs humains, en s'appuyant sur deux modules clés : le Secure Runtime Assurance (SRTA), qui vérifie en continu l'intégrité des systèmes, et le Secure Spatio-Temporal Reasoning (SSTR), qui raisonne sur les données spatiales et temporelles pour maintenir la cohérence opérationnelle. La plateforme a franchi le niveau de maturité technologique TRL 7, validant son fonctionnement dans des environnements à haute criticité. Les composants centraux, notamment les contrôleurs de vol sécurisés Saluki, ont atteint le TRL 8 et sont d'ores et déjà déployés dans des systèmes clients en production. L'enjeu de ZTASP dépasse largement le cadre militaire dans lequel il a été initialement développé. La capacité à maintenir une opération résiliente même dans des conditions dégradées, pannes partielles, attaques, perte de connectivité, répond à un besoin critique dans des secteurs comme la santé, les transports autonomes et les infrastructures sensibles. En imposant une vérification permanente de chaque composant sans présupposer de confiance implicite entre les sous-systèmes, le modèle zero-trust apporte une couche de sécurité fondamentalement différente des approches périmètriques traditionnelles, particulièrement adaptée aux flottes de robots ou de véhicules autonomes où la surface d'attaque est distribuée et dynamique. Le concept de zero-trust, né dans la cybersécurité des réseaux d'entreprise dans les années 2010, connaît aujourd'hui une extension vers les systèmes cyber-physiques autonomes, où les conséquences d'une compromission sont directement matérielles. La prolifération des drones commerciaux et des robots industriels dans des environnements non contrôlés rend la question de la gouvernance à l'exécution de plus en plus pressante. ZTASP s'inscrit dans une tendance plus large où des acteurs de la défense et de l'industrie cherchent à formaliser des cadres d'assurance capables de répondre aux exigences réglementaires émergentes autour des systèmes autonomes, notamment en Europe et aux États-Unis, où plusieurs initiatives législatives sont en cours d'élaboration.

UELes initiatives législatives européennes sur les systèmes autonomes (drones, véhicules autonomes, robots industriels) pourraient s'appuyer sur ce type de cadre d'assurance zero-trust pour définir des exigences de conformité opérationnelle.

RobotiqueOpinion
1 source
Asylon et Thrive Logic déploient l'IA physique pour la sécurité périmétrique en entreprise
3AI News 

Asylon et Thrive Logic déploient l'IA physique pour la sécurité périmétrique en entreprise

Asylon Robotics et Thrive Logic ont annoncé un partenariat pour déployer ce qu'ils appellent de l'« IA physique » dans la sécurité périmétrique d'entreprise. Asylon, spécialisée dans la robotique de sécurité, opère un centre de commandement baptisé RSOC (Robotic Security Operations Centre) qui gère des patrouilles robotisées autonomes sur les périmètres extérieurs. Thrive Logic, de son côté, propose une plateforme d'intelligence opérationnelle pilotée par des agents IA. Leur intégration commune connecte les flux vidéo captés par les robots d'Asylon directement à l'agent IA de Thrive Logic, qui analyse les incidents en temps réel, déclenche des alertes auprès des équipes concernées et génère automatiquement des procédures de réponse alignées sur les standards opérationnels de chaque site. Le système produit également des rapports horodatés et prêts pour l'audit, pour chaque environnement où il est déployé. L'enjeu dépasse la simple surveillance vidéo. Là où les systèmes traditionnels se contentent d'enregistrer des événements pour une analyse ultérieure, cette solution intervient en continu et de manière proactive : les robots patrouillent, l'IA analyse, et les équipes humaines reçoivent des instructions d'action claires plutôt que de devoir interpréter des heures de footage. Pour les responsables sécurité opérant sur des périmètres étendus, soumis à une forte volatilité des effectifs humains et à des rondes d'agents souvent peu fiables, cela représente un changement de paradigme concret. La cohérence de la réponse aux incidents s'améliore, la friction opérationnelle diminue, et la traçabilité documentaire devient automatique, ce qui facilite les audits de conformité et les reportings internes. Ce partenariat s'inscrit dans une tendance plus large d'intégration entre robotique autonome et IA agentique dans les environnements physiques à risque. Damon Henry, PDG d'Asylon, résume l'objectif ainsi : les responsables sécurité n'ont pas besoin de nouveaux tableaux de bord, mais de couverture fiable, de réponse cohérente et de reporting défendable. Nate Green, PDG de Thrive Logic, insiste sur le fait que l'IA physique transforme la visibilité en action concrète. Pour l'instant, l'intégration est réservée aux grandes entreprises gérant des environnements extérieurs à forte activité, mais les deux sociétés indiquent vouloir étendre l'accès à des organisations de plus petite taille dans un avenir proche. La sécurité périmétrique autonome, longtemps cantonnée aux grandes infrastructures critiques, semble donc amorcer une démocratisation progressive vers l'ensemble du tissu entreprise.

RobotiqueActu
1 source
Waymo : l’entreprise qui veut conquérir la mobilité autonome
4Le Big Data 

Waymo : l’entreprise qui veut conquérir la mobilité autonome

Waymo, filiale d'Alphabet, a franchi en 2026 un seuil décisif dans la course aux véhicules autonomes. L'entreprise opère désormais une flotte de près de 3 000 robotaxis dans 10 métropoles américaines, dont San Francisco, Orlando et Houston, et revendique 500 000 courses payantes par semaine. En février 2026, elle a bouclé une levée de fonds record de 16 milliards de dollars, portant sa valorisation à 126 milliards. Son système de conduite, baptisé Waymo Driver et arrivé à sa sixième génération, combine 13 caméras, 6 radars et un lidar capable d'envoyer des millions de pulsations laser par seconde pour cartographier l'environnement en trois dimensions jusqu'à 500 mètres. Un modèle d'IA embarqué traite ces données en temps réel pour anticiper les comportements des autres usagers de la route. L'impact sur l'industrie du transport est considérable. À San Francisco, le tarif moyen d'une course Waymo s'établit autour de 17,25 dollars, soit deux à trois dollars de plus qu'un Uber classique, un écart appelé à se réduire à mesure que les volumes augmentent. L'objectif affiché est d'atteindre le million de courses hebdomadaires avant 2027, seuil à partir duquel le modèle économique deviendrait rentable malgré le coût élevé des capteurs. Pour les chauffeurs de taxi et les plateformes comme Uber ou Lyft, la menace est structurelle : Waymo contrôle verticalement la technologie, la flotte et la maintenance, ce qui lui confère un avantage compétitif durable sur des acteurs qui dépendent de conducteurs humains. Waymo n'est pas né en 2026. Le projet a démarré en 2009 au sein de Google X avant de devenir une entité indépendante d'Alphabet en 2016. Pendant des années, l'entreprise a accumulé des millions de kilomètres de tests sans parvenir à déployer un service commercial à grande échelle. Le tournant s'est produit avec le lancement de Waymo One à San Francisco, puis l'accélération vers d'autres villes, transformant ce qui ressemblait à une expérimentation permanente en véritable offre de mobilité urbaine. La concurrence reste présente, Tesla promettant son propre robotaxi et des acteurs chinois comme Baidu avançant sur leur marché intérieur, mais aucun n'a encore atteint la profondeur de déploiement de Waymo aux États-Unis. Avec 126 milliards de valorisation et le soutien financier d'Alphabet, l'entreprise aborde la prochaine phase, celle de la rentabilité, avec des moyens que ses rivaux peinent à égaler.

RobotiqueOpinion
1 source