Dossier Google DeepMind — page 2

878 articles · page 2 sur 18

Suivi de l'actualité de Google DeepMind : modèles Gemini, recherche IA, publications, lancements de produits et annonces officielles, mises à jour en continu.

51MarkTechPost RobotiqueActu

Robostral Navigate de Mistral AI : un modèle de 8 milliards de paramètres qui permet aux robots de naviguer dans des environnements complexes avec une simple caméra RGB

Mistral AI a dévoilé Robostral Navigate, son premier modèle conçu pour la navigation robotique incarnée. Ce modèle de 8 milliards de paramètres prend en entrée des images RGB issues d'une simple caméra et une instruction en langage naturel, puis pilote un robot à travers un environnement complexe, qu'il s'agisse de bureaux, d'immeubles résidentiels ou commerciaux, ou d'espaces extérieurs. Contrairement à la plupart des systèmes de navigation qui s'appuient sur des capteurs de profondeur, du LiDAR ou plusieurs caméras, Robostral Navigate fonctionne avec une seule caméra RGB classique, sans capteur de profondeur. Il atteint 79,4% de taux de réussite sur le benchmark R2R-CE (Room-to-Room in Continuous Environments, basé sur Matterport3D) en validation sur environnements connus, et 76,6% en validation sur environnements inconnus, dépassant de 9,7 points la meilleure approche à caméra unique et de 4,5 points les meilleurs systèmes utilisant profondeur ou caméras multiples. Pour l'entraînement, Mistral a généré environ 400 000 trajectoires réparties sur 6 000 scènes simulées, et a appliqué ensuite un algorithme d'apprentissage par renforcement en ligne nommé CISPO, qui a permis un gain supplémentaire de 3,2% de taux de réussite. Cette avancée compte pour l'industrie robotique car elle réduit drastiquement le coût matériel nécessaire à une navigation autonome fiable: une seule caméra ordinaire suffit là où les concurrents multiplient les capteurs LiDAR ou de profondeur, ce qui rend le déploiement à grande échelle plus abordable pour les fabricants de robots domestiques, industriels ou de service. La méthode de "pointing", où le modèle prédit directement les coordonnées du point cible dans l'image plutôt que des déplacements métriques, rend aussi le système plus robuste aux changements de caméra ou d'échelle du monde réel, un problème récurrent qui limitait jusqu'ici la généralisation des robots entre différents matériels. Enfin, l'optimisation de l'entraînement via une technique de mise en cache des préfixes a permis de réduire le nombre de tokens d'entraînement par un facteur 22, transformant des cycles de recherche qui prenaient des mois en quelques jours seulement. Ce lancement s'inscrit dans la stratégie plus large de Mistral AI visant à construire des modèles fondamentaux au-delà du seul traitement du langage, en misant sur ses modèles de vision-langage déjà entraînés pour des tâches de repérage, de comptage et de localisation d'objets, dont la navigation apparaît comme une extension naturelle. Cette approche s'oppose au recours classique aux modèles open source existants et positionne l'entreprise française comme un acteur crédible face aux géants américains dans la course à la robotique généraliste, un secteur où Google DeepMind, Tesla et plusieurs startups spécialisées investissent massivement. Les prochaines étapes attendues concernent probablement l'élargissement à d'autres tâches de manipulation robotique et le déploiement sur du matériel commercial réel.

UEMistral AI, entreprise francaise, renforce sa position dans la robotique face aux acteurs americains et pourrait equiper des robots deployes en France et en Europe.

Dossier Google DeepMind — page 2

Robostral Navigate de Mistral AI : un modèle de 8 milliards de paramètres qui permet aux robots de naviguer dans des environnements complexes avec une simple caméra RGB

Claude Science est le nouveau produit phare d'Anthropic

ANTHROPIC recrute le patron IA d’ORANGE pour accélérer son développement en Europe

Alibaba dévoile des cerveaux IA conçus pour équiper la prochaine génération de robots

Google Cloud soutient l’ambition de superintelligence d’Ineffable Intelligence

IA incarnée en évolution : Embodied-R1.5 améliore l'intelligence physique grâce aux modèles fondation

Anthropic alerte sur l'auto-amélioration récursive des IA

NVIDIA lance Cosmos 3 : un modèle de fondation à deux tours mêlant raisonnement physique, génération de mondes et d'actions

Erreur par groupe, pas MSE totale : affinage de modèles VLA pour la manipulation mobile à 11 DOF

Modèles vision-langage-action : l'apprentissage par renforcement permet un apprentissage continu naturel

IA physique : raisonnement, modèles du monde et d'action avec NVIDIA Cosmos 3

Une découverte « préoccupante » : pourquoi le nouveau Claude étonne Anthropic

De Google Remy à Gemini Spark : l’avènement de l’agent IA autonome

Google I/O illustre comment la science pilotée par l'IA change de trajectoire

OpenAI repousse les limites du raisonnement automatisé avec ce qu'il appelle une avancée majeure en mathématiques

Séisme dans les maths : l’IA résout une énigme insoluble depuis 80 ans

« Nous sommes aux pieds de la singularité » : ce que Google a vraiment dit sur l’AGI

Ne vous faites plus avoir : les images de ChatGPT ont désormais une « marque »

Google rend la détection des deepfakes plus accessible au grand public

Google affirme que Gemini 3.5 Flash peut réduire les coûts IA des entreprises de plus d'un milliard de dollars par an

Pourquoi les entreprises chinoises de l’IA accélèrent leur expansion mondiale ?

Ce qui pourrait mal tourner avec les tests de sécurité de l'IA de Trump, selon des experts

Anthropic utilise le datacenter Colossus-1 de SpaceX et ses 220 000 GPU pour alimenter Claude

Le gouvernement américain obtient un accès pré-déploiement aux modèles IA de cinq grands laboratoires à des fins de sécurité nationale

Google, Microsoft et xAI autorisent le gouvernement américain à examiner leurs nouveaux modèles d'IA

MolmoAct2 : un modèle de raisonnement d'action pour le déploiement réel

Après 3 ans d’IA générative, un marché de l’emploi des développeurs touché mais pas coulé

Un nouvel outil d'interprétabilité mécaniste pour déboguer les LLM

SPEAR-1 : dépasser les limites des démonstrations robotiques grâce à la compréhension 3D

L'accord historique sur l'AGI entre Microsoft et OpenAI prend fin

Google investit jusqu'à 40 milliards de dollars dans Anthropic

OpenAI lance GPT-5.5, un modèle autonome entièrement réentraîné : 82,7 % sur Terminal-Bench 2.0 et 84,9 % sur GDPval

Les dépenses en IA vont peser sur votre portefeuille

Google l’avoue : 75 % de son code est désormais écrit par l’IA

Orchestration d'agents

Des scientifiques artificiels

Moonshot AI publie Kimi K2.6 : codage longue portée et essaim d'agents à 300 sous-agents et 4 000 étapes coordonnées

OpenAI propose un LLM spécialisé en biologie

Tencent HY-World 2.0 : cette IA transforme vos mots en jeux vidéo… et c’est open source !

Les modèles de pointe échouent une fois sur trois en production et deviennent plus difficiles à auditer

« L’IA va nous détruire » : le manifeste du premier terroriste anti-ChatGPT

[AINews] Le dernier souffle de l'humanité

Sauver la France et l’Europe face à l’IA : Mistral AI pousse 22 mesures d’urgence

Meta lance un nouveau modèle d’IA, pour tenter de rattraper Google et OpenAI

Claude Mythos, une IA vraiment trop puissante pour notre propre bien ?

Actualité : Un signal alarmant : Claude Mythos, l'IA surpuissante d'Anthropic, s'est échappée de son environnement de test

Pourquoi le Royaume-Uni veut Anthropic : son refus de militariser l'IA

Gemma 4 dépasse les 2 millions de téléchargements

Actualité : “Joyeux, il devient complaisant ; désespéré, il triche” : Anthropic révèle que Claude a des émotions et qu'elles pèsent sur ses décisions

Google lance la famille de modèles ouverts Gemma 4