NVIDIA lance Cosmos 3, Nemotron 3 Ultra et RTX Spark
NVIDIA a profité de la semaine du Computex 2026 à Taïwan pour lancer plusieurs modèles ouverts majeurs. Le plus attendu est Cosmos 3, une famille de modèles de monde omnimodaux capables de traiter simultanément le langage, l'image, la vidéo, l'audio et les actions physiques. L'architecture repose sur un mélange de transformeurs (Mixture-of-Transformers) combinant un raisonneur autorégressif et un générateur par diffusion, déclinée en deux versions : Nano (16 milliards de paramètres, deux tours de 8B) et Super (64 milliards, deux tours de 32B). Artificial Analysis a immédiatement classé Cosmos 3 en première position parmi les modèles ouverts sur ses classements Text-to-Image et Image-to-Video. NVIDIA a également annoncé Nemotron 3 Ultra, un modèle de langage de 550 milliards de paramètres dont 55 milliards actifs, salué comme le meilleur modèle ouvert américain à ce jour, capable de générer plus de 300 tokens par seconde selon certaines configurations. Enfin, le RTX Spark, un superchip personnel atteignant 1 pétaflop, a été présenté en partenariat avec Microsoft et OpenClaw.
Ces annonces marquent un tournant dans la stratégie ouverte de NVIDIA. En publiant poids, code, jeux de données et recettes de fine-tuning pour Cosmos 3, l'entreprise positionne ses modèles comme une infrastructure commune pour l'IA physique, robotique, véhicules autonomes, simulation industrielle. La Cosmos Coalition, lancée avec des partenaires dont Runway, vise à construire un écosystème ouvert autour de ces modèles de monde. Pour Nemotron 3 Ultra, la communauté a réagi avec un enthousiasme inhabituel : sa densité d'activation, autour de 10 % contre 3 % pour des concurrents comme DeepSeek V4 ou Kimi K2, le rend à la fois plus coûteux à faire tourner, mais potentiellement plus prévisible en comportement, ce qui intéresse les entreprises cherchant de la fiabilité à grande échelle.
Ces sorties s'inscrivent dans une semaine particulièrement dense pour les modèles ouverts. MiniMax a simultanément lancé M3, un modèle agent multimodal avec 1 million de tokens de contexte, affichant 59 % sur SWE-Bench Pro et un support immédiat chez Vercel, Cloudflare et Novita. Qwen3.7-Plus et Mellum2 de JetBrains ont également été publiés dans la même fenêtre. NVIDIA cherche à consolider sa domination au-delà du matériel : en proposant des modèles de référence ouverts pour l'IA physique, la société se place au cœur de la chaîne de valeur logicielle, là où Google et Meta se livrent déjà bataille. La convergence entre le RTX Spark, Cosmos 3 et l'écosystème de partenaires suggère une ambition claire : faire du PC local le prochain terrain de déploiement de l'IA agentique.
Les poids, code et données d'entraînement de Cosmos 3 et Nemotron 3 Ultra étant publiés en open source, les entreprises et laboratoires européens peuvent les adopter sans dépendance à une API propriétaire américaine, ouvrant de nouvelles options pour l'IA physique et les grands modèles de langage.
NVIDIA ne se contente plus de vendre des GPU, il cherche à posséder la pile logicielle de l'IA physique. Cosmos 3 open source avec poids et données, Nemotron Ultra pour la fiabilité en prod, RTX Spark pour le local, c'est une stratégie trop cohérente pour être coïncidence. Google et Meta sont déjà sur ce terrain, sauf qu'eux ne contrôlent pas le silicium en dessous.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




