Aller au contenu principal
The Download : Pokémon Go pour entraîner des modèles du monde, et la course États-Unis/Chine pour trouver des extraterrestres
RobotiqueMIT Technology Review14sem· 1 min de lecture

The Download : Pokémon Go pour entraîner des modèles du monde, et la course États-Unis/Chine pour trouver des extraterrestres

Source originale ↗·

Niantic Spatial, spin-off d'IA de Niantic (créateur de Pokémon Go), exploite les données massives collectées par ses 500 millions d'utilisateurs pour construire un « world model » destiné à aider les robots de livraison à naviguer avec précision. Par ailleurs, la sonde Perseverance a découvert en juillet 2024 des formations rocheuses prometteuses pour la recherche de vie martienne, mais le programme NASA de retour d'échantillons est aujourd'hui en sursis — laissant potentiellement la Chine prendre la tête de cette course scientifique. En parallèle, Anthropic craint de perdre des milliards de dollars suite à son inscription sur liste noire par le Pentagone, tandis que Microsoft la soutient dans son recours judiciaire.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Comment Pokémon GO contribue à faire livrer la pizza à temps par des robots
1MIT Technology Review 

Comment Pokémon GO contribue à faire livrer la pizza à temps par des robots

Niantic Spatial, spin-off d'intelligence artificielle issu de Niantic (créateur de Pokémon GO), exploite les données crowdsourcées de 500 millions de joueurs pour construire un modèle du monde capable de localiser un point avec une précision de quelques centimètres. La startup Coco Robotics, qui opère environ 1 000 robots livreurs dans des villes comme Los Angeles, Chicago et Helsinki, utilise cette technologie pour pallier les défaillances du GPS en milieu urbain dense — là où le signal peut dériver de 50 mètres. Avec plus de 500 000 livraisons effectuées à ce jour, Coco mise sur cette précision de localisation pour garantir des arrivées à l'heure exacte promise aux clients.

RobotiqueActu
1 source
Nouveaux modèles de robotique : Ai2 met à disposition des versions entraînées uniquement en simulation pour éviter la collecte de données dans le monde réel
2The Decoder 

Nouveaux modèles de robotique : Ai2 met à disposition des versions entraînées uniquement en simulation pour éviter la collecte de données dans le monde réel

Ai2 dévoile de nouveaux modèles de robotique entièrement formés en simulation, évitant ainsi la collecte de données réelles dans le monde réel. Ces robots, selon Ai2, peuvent fonctionner efficacement sans nécessiter de formation sur des données provenant de la réalité.

RobotiqueActu
1 source
ZD Tech : Niantic utilise les 30 milliards d'images de Pokémon Go pour créer un système de navigation pour les robots
3ZDNET FR 

ZD Tech : Niantic utilise les 30 milliards d'images de Pokémon Go pour créer un système de navigation pour les robots

Niantic, le studio derrière Pokémon Go, a exploité les 30 milliards d'images collectées par les joueurs dans le monde réel pour entraîner un système de navigation destiné aux robots. Ce projet révèle que la chasse aux Pokémon était en réalité un vaste programme de cartographie du monde physique à l'échelle industrielle. Ces données visuelles massives permettent désormais à des robots de se repérer et de se déplacer dans des environnements réels.

RobotiqueOpinion
1 source
Qwen-RobotSuite : trois modèles d'IA incarnée pour la manipulation VLA, la modélisation du monde et la navigation
4MarkTechPost 

Qwen-RobotSuite : trois modèles d'IA incarnée pour la manipulation VLA, la modélisation du monde et la navigation

L'équipe Qwen, la division IA d'Alibaba, a publié Qwen-Robot-Suite, une collection de trois modèles d'IA incarnée destinés à la robotique. Les trois modèles sont distincts et ciblent des problèmes différents : Qwen-RobotManip est un modèle Vision-Language-Action (VLA) pour la manipulation physique, construit sur le backbone Qwen3.5-4B ; Qwen-RobotWorld est un modèle de simulation vidéo du monde réel, doté de 60 couches MMDiT et d'un encodeur Qwen2.5-VL gelé ; Qwen-RobotNav, disponible en versions 2B, 4B et 8B, est dédié à la navigation mobile et s'appuie sur Qwen3-VL. RobotManip et RobotNav sont déjà accompagnés de dépôts GitHub publics. Pour alimenter RobotManip, l'équipe a constitué un corpus d'environ 38 100 heures de données de manipulation, exclusivement issues de jeux de données open source et de vidéos humaines, dont 24 808 heures générées synthétiquement à partir de démonstrations à la première personne converties en trajectoires robotiques sur 15 plateformes différentes. Cette publication s'attaque à l'un des obstacles fondamentaux de la robotique moderne : la fragmentation des données. Chaque robot utilise des formats d'observation et d'action incompatibles, ce qui rend quasi impossible le transfert d'une politique entraînée sur un bras vers un autre. RobotManip résout ce problème via un cadre d'alignement unifié reposant sur un vecteur d'état canonique de 80 dimensions avec masquage binaire par dimension, une paramétrisation des actions en delta dans le référentiel caméra, et un mécanisme d'adaptation en contexte qui lit l'historique d'exécution récent pour identifier l'embodiment sans mettre à jour les paramètres du modèle. RobotWorld, quant à lui, utilise le langage comme interface d'action unifiée pour prédire des séquences vidéo futures, tandis que RobotNav expose une interface d'observation contrôlable pour générer des trajectoires de points de passage en navigation. Ces travaux s'inscrivent dans une course mondiale à la robotique fondationnelle, portée par des acteurs comme Google DeepMind avec RT-2, Physical Intelligence avec pi0, ou encore Tesla avec Optimus. Qwen adopte ici une stratégie modulaire plutôt qu'un modèle généraliste unique, en pariant sur la spécialisation par domaine tout en partageant un même écosystème de backbones de vision-langage. L'accent mis sur des données entièrement open source et des pipelines de synthèse automatisée indique une volonté de démocratiser l'entraînement de politiques robotiques sans dépendre de coûteuses collectes propriétaires. La mise à disposition des codes sources pour deux des trois modèles suggère que Qwen cherche à fédérer une communauté de recherche autour de ces fondations, dans un domaine ou la donnée reste le principal goulot d'étranglement.

RobotiqueOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic