Aller au contenu principal

NVIDIA· sujet

710 articlesmis à jour le 10 juin 2026

NVIDIA, l'arsenal de la course IA : Blackwell, Vera Rubin, Vera CPU, partenariats hyperscalers, Omniverse, et la rente CUDA face aux puces Huawei et Trainium.

Hub d'actualité sur NVIDIA, agrégé en continu depuis 72 sources éditoriales. Pour les analyses long-form, voir /analyses.

Le pouls du sujet · 30 derniers jours

données Le Fil IA
569 92%
articles (vs 30j préc.)
42.8%
de la couverture IA
Souvent associé à
InférenceGoogle DeepMindFine-tuningAgenticOpenAI

Mesuré sur notre corpus de 50+ sources, fenêtre glissante de 30 jours. Part de voix = part des articles IA de la période mentionnant NVIDIA. Voir le Baromètre IA complet

À retenir · 30 derniers jours

NVIDIA n'est pas un fournisseur dans la guerre IA, c'est l'arsenal. Tous les modèles frontière (GPT-5.5, Claude Mythos, Gemini 3, Mistral Medium 3.5, DeepSeek V4-Pro sur sa partie GPU) tournent sur des GPU NVIDIA. Le partenariat OpenAI/NVIDIA officialisé en avril 2025 chiffre 35× sur le coût par jeton dans le déploiement de GPT-5.5. Mistral lève 722 M€ pour acheter 13 800 GPU NVIDIA. Amazon engage 100 milliards de dollars sur 10 ans avec Anthropic, dont une part substantielle revient à NVIDIA via AWS.

Mais 2026 ouvre les premières fissures dans la rente CUDA. Google TPU v8 défie Blackwell sur la performance entrainement (4 mai 2026). DeepSeek prouve que les puces Huawei Ascend peuvent porter les modèles frontière. NVIDIA Spectrum-X répond avec un réseau Ethernet ouvert dédié IA, devenu référence à grande échelle. La bataille passe du chip à l'écosystème.

Comment lire ce hub

Si vous suivez l'actualité IA au quotidien, c'est votre flux par défaut sur NVIDIA. Toutes les publications agrégées de 72 sources éditoriales (NVIDIA Developer Blog, Le Big Data, MIT Technology Review, ZDNET, Pandaily, etc.).

Si vous arrivez par une recherche, la chronologie remet les épisodes-clés dans leur ordre, les essentiels couvrent les angles puces / partenariats hyperscalers / concurrence Huawei / réseau Ethernet IA.

Hub d'actualité, pas analyse éditoriale

Ce hub agrège et oriente. Quand un sujet NVIDIA mérite une lecture verticale (la rente CUDA face aux alternatives, les arbitrages cloud), c'est dans la section analyses que le format long-form se déploie.

Pourquoi NVIDIA compte

NVIDIA compte parce que c'est l'unique acteur dont la position structurelle dépend de quasi-tous les autres mouvements 2026. Quand OpenAI accélère sur l'agentique, NVIDIA encaisse plus de demande compute. Quand Anthropic s'engage à 100 Md$ AWS, NVIDIA encaisse via Amazon. Quand Mistral lève en France pour 13 800 GPU, NVIDIA encaisse en Europe. La position est tellement transversale qu'il faut la nommer : NVIDIA est devenu un fournisseur monopolistique.

Trois fronts de pression émergent en 2026. Premier : le hardware concurrent. Google TPU v8 défie Blackwell sur l'entrainement, démontre des gains de coût par token comparable. Huawei Ascend porte DeepSeek V4 sans dépendance NVIDIA. Trainium chez Amazon avance lentement mais continument. La part de marché commence à s'effriter par le haut.

Deuxième : la régulation. La Commission européenne et le DOJ américain examinent l'écosystème CUDA comme potentiel verrouillage anti-concurrentiel. Si une décision impose l'ouverture des stacks à des compilateurs alternatifs (ROCm AMD, MAX d'Intel), la rente baisse mécaniquement.

Troisième : la géopolitique. Les contrôles export US restreignent les ventes haute-perf à la Chine. DeepSeek V4 ayant prouvé qu'on peut faire frontière sous embargo, la pression sur NVIDIA pour sécuriser des marges en marchés autorisés s'amplifie. La réponse : Spectrum-X (réseau Ethernet IA), Vera Rubin (CPU), Omniverse (verticalisation logicielle). NVIDIA cherche les angles où la rente reste défendable.

Chronologie

  1. Mar 2024GTC 2024 : Blackwell B200 dévoilé, performance entrainement ×4 vs H100
  2. Sept 2024Premiers Blackwell livrés aux hyperscalers (Microsoft, AWS, Google)
  3. Janv 2025DeepSeek-R1 provoque la première chute de NVIDIA en bourse — révèle l'efficacité chinoise
  4. Mar 2025GTC 2025 : Vera Rubin GPU + Vera CPU, roadmap 2026-2027
  5. Avr 2025Partenariat OpenAI / NVIDIA officialisé : 35× sur le coût par jeton sur GPT-5.5
  6. Mar 2026Le proxy IA populaire LiteLLM infecté par un malware se propage dans les clusters Kubernetes équipés NVIDIA
  7. 30 mar 2026Mistral lève 722 M€ pour acheter 13 800 GPU NVIDIA — première gigafactory GPU française
  8. 21 avr 2026Amazon engage 33 Md$ dans Anthropic + 100 Md$ AWS sur 10 ans — substantielle part vers NVIDIA via AWS
  9. 4 mai 2026Google TPU v8 défie NVIDIA Blackwell : première menace concurrentielle crédible sur l'entrainement frontière
  10. 6 mai 2026NVIDIA Spectrum-X (réseau Ethernet ouvert pour IA) s'impose comme référence à grande échelle

Cinq articles essentiels

Sélection éditoriale. Ces cinq pièces couvrent les angles les plus utiles pour comprendre NVIDIA en 2026.

  1. Google TPU v8 défie NVIDIA Blackwell : première menace concurrentielle crédible sur l'entrainement frontière depuis 2024.

  2. NVIDIA Spectrum-X s'impose comme référence à grande échelle : la riposte par l'écosystème, pas seulement par le silicium.

  3. Mistral lève 722 M€ pour 13 800 GPU NVIDIA : la souveraineté européenne reste structurellement dépendante de l'arsenal américain.

  4. Amazon engage 33 Md$ dans Anthropic + 100 Md$ AWS sur 10 ans : substantielle part vers NVIDIA via la chaîne AWS.

  5. Le proxy IA LiteLLM infecté par un malware se propage dans les clusters Kubernetes équipés NVIDIA : la surface d'attaque dans la stack agentique inclut maintenant l'orchestration GPU.

  6. Mistral lève 830 M$ pour son centre de données IA : la deuxième jambe française de la stratégie infrastructure souveraine, NVIDIA-dépendante.

Analyses long-form sur NVIDIA

Quand un sujet mérite un format long, c'est ici.

Questions fréquentes

Quel est le dernier GPU IA de NVIDIA en 2026 ?

Blackwell B200 (lancé en septembre 2024) reste la production volume haute-performance. Vera Rubin (la génération suivante) est annoncée pour 2026-2027 avec des gains attendus ×3 sur l'entrainement et ×5 sur l'inférence. Vera CPU complète l'offre côté processeur hôte. La roadmap a été présentée à GTC 2025.

Combien NVIDIA contrôle-t-elle du marché GPU IA ?

Estimations 2026 : ~85-90 % du marché GPU IA datacenter (en valeur), avec des concurrents qui montent (Google TPU pour usage interne, AMD Instinct pour HPC, Huawei Ascend en Chine, Trainium chez AWS). La part de marché en volume est en baisse depuis la sortie du TPU v8 et de Huawei Ascend porteur de DeepSeek.

NVIDIA est-elle exposée aux contrôles export américains ?

Oui. Les ventes haute-performance à la Chine sont restreintes depuis 2022 et l'embargo s'est durci en 2024-2025. NVIDIA propose des versions bridées (H800, A800) pour le marché chinois mais Pékin a poussé l'industrie nationale vers Huawei Ascend. La perte de revenus chinois est réelle mais compensée par la demande hyperscaler US/UE/JP.

CUDA est-il toujours un avantage concurrentiel ?

Oui, mais l'avantage s'érode. CUDA reste le standard de fait pour le développement IA (utilisé par PyTorch, TensorFlow, JAX en backend optimisé), mais les concurrents ouvrent : ROCm chez AMD, MAX chez Intel, alternatives open-source. Le verrouillage logiciel est plus durable que le verrouillage hardware mais finit par ouvrir aussi.

NVIDIA peut-elle être attaquée par des régulateurs ?

C'est étudié. La Commission européenne et le DOJ américain examinent l'écosystème CUDA comme potentiel verrouillage anti-concurrentiel. Pas d'enquête formelle ouverte en mai 2026, mais les plaintes des concurrents (AMD, Intel) et des hyperscalers cherchant à diversifier (Microsoft, Google) augmentent. Une décision DMA-like serait structurelle pour la rente.

Toute l'actualité NVIDIA

Flux automatique. Articles classés par pertinence, agrégés en continu.

NVIDIA accélère DiffusionGemma de Google DeepMind pour l'IA locale
1NVIDIA AI Blog LLMsActu

NVIDIA accélère DiffusionGemma de Google DeepMind pour l'IA locale

Google DeepMind a lancé DiffusionGemma, un modèle de langage expérimental open source qui abandonne la génération séquentielle au profit d'une approche par diffusion. Construit sur l'architecture Gemma 4, un modèle mixture-of-experts de 26 milliards de paramètres n'activant que 3,8 milliards par étape, DiffusionGemma génère jusqu'à 256 tokens en parallèle à chaque passe plutôt qu'un seul à la fois. NVIDIA a optimisé ce modèle pour l'ensemble de sa gamme matérielle, et les chiffres sont frappants : 1 000 tokens par seconde sur une carte H100, 150 tokens/sec sur le DGX Spark, 800 tokens/sec sur la DGX Station, et environ quatre fois plus vite qu'un modèle autorégressif équivalent en usage mono-utilisateur. Le modèle est disponible sous licence Apache 2.0 avec un support immédiat dans Hugging Face Transformers, vLLM et Unsloth, et s'exécute entièrement en local sans coût par token. Cette vitesse change concrètement l'expérience pour les développeurs, chercheurs et passionnés d'IA qui font tourner des workflows agentiques ou des assistants interactifs. Les modèles autorégressifs classiques sont fondamentalement limités par la bande passante mémoire en usage mono-utilisateur : le GPU attend plus qu'il ne calcule. L'approche par diffusion retourne l'équation. En traitant un bloc de 256 tokens d'un coup, DiffusionGemma exploite pleinement les Tensor Cores de NVIDIA, conçus pour des calculs matriciels denses en parallèle. Les boucles agentiques, les chats interactifs et les assistants embarqués peuvent désormais répondre à la vitesse à laquelle un développeur pense et itère. Le modèle tourne localement sur les GPU GeForce RTX, les stations de travail RTX PRO 6000, le DGX Spark avec ses 128 Go de mémoire unifiée, et la DGX Station avec ses 748 Go de mémoire cohérente. L'approche par diffusion pour le texte s'inspire du domaine de la génération d'images, où le principe consiste à débruiter progressivement un signal aléatoire pour obtenir un résultat cohérent. Appliquée au langage, cette méthode restait jusqu'ici expérimentale et peu compétitive face aux LLM autorégressifs dominant le marché. DiffusionGemma marque une étape plus sérieuse : Google DeepMind lui apporte une base architecturale solide avec Gemma 4, et NVIDIA l'optimisation matérielle nécessaire pour en faire un outil pratique dès le premier jour. Un support llama.cpp pour les GeForce RTX grand public est annoncé prochainement, ce qui pourrait rendre la génération ultra-rapide accessible au plus grand nombre sans infrastructure cloud. Si les performances en qualité de génération se confirment à l'usage, le modèle pourrait bousculer les hypothèses de base sur lesquelles repose l'architecture de tous les grands LLM actuels.

UELa disponibilité sous licence Apache 2.0 et l'exécution locale sans coût par token ouvrent de nouvelles options pour les développeurs et chercheurs européens souhaitant déployer des workflows agentiques sans dépendance au cloud.

1 source
OpenAI négocie la location d'un datacenter de 10 gigawatts en Ohio, avec le soutien de Nvidia
2The Information AI 

OpenAI négocie la location d'un datacenter de 10 gigawatts en Ohio, avec le soutien de Nvidia

OpenAI est en négociations avancées pour louer un campus de centres de données colossal sur des terres fédérales en Ohio, avec le soutien financier potentiel de Nvidia. Le projet, dont les discussions impliquent deux sources ayant une connaissance directe des négociations, porterait sur une capacité totale de 10 gigawatts, ce qui en ferait l'un des plus grands complexes de ce type au monde. Le coût total du projet, s'il est entièrement réalisé, atteindrait au moins 500 milliards de dollars aux prix actuels des puces, de la main-d'oeuvre, de l'énergie et des matériaux. OpenAI contrôlerait les équipements via un bail à long terme et serait responsable des paiements dès le lancement des opérations, la première phase étant attendue pour 2028. L'ampleur de cet investissement reflète la course effrénée aux infrastructures de calcul que se livrent les grands acteurs de l'IA. Un campus de 10 gigawatts représente une puissance électrique équivalente à celle de plusieurs grandes villes, signalant que les besoins en calcul de l'IA générative dépassent largement ce que les centres de données classiques peuvent offrir. L'implication de Nvidia, dont les GPU alimentent la quasi-totalité des systèmes d'IA de pointe, suggère une intégration verticale inédite entre fournisseur de puces et opérateur d'infrastructure. Ce projet s'inscrit dans la stratégie Stargate annoncée début 2025, par laquelle OpenAI, SoftBank et Oracle s'étaient engagés à investir jusqu'à 500 milliards de dollars en infrastructures IA aux États-Unis. Le choix de terres fédérales en Ohio souligne aussi le rôle croissant du gouvernement américain dans la facilitation de ces méga-projets, dans un contexte de concurrence technologique avec la Chine. Si les négociations aboutissent, ce campus deviendrait un pilier central de la capacité de calcul mondiale d'OpenAI pour la prochaine décennie.

UECe méga-projet amplifie l'écart d'infrastructure IA entre les États-Unis et l'Europe, où aucun investissement d'ampleur comparable n'est prévu, renforçant le risque de dépendance européenne aux capacités de calcul américaines.

InfrastructureActu
1 source
NVIDIA intègre le calcul confidentiel pour renforcer le Private Cloud Compute d'Apple
3NVIDIA AI Blog 

NVIDIA intègre le calcul confidentiel pour renforcer le Private Cloud Compute d'Apple

Apple vient d'annoncer lors de sa conférence annuelle WWDC 2026 l'extension de son infrastructure Private Cloud Compute (PCC) au-delà de ses propres centres de données, vers Google Cloud. Pour sécuriser cette expansion, Apple s'appuie désormais sur les GPU NVIDIA avec Confidential Computing, notamment les puces Blackwell de dernière génération. Ces GPU servent à l'inférence confidentielle côté serveur pour les Apple Foundation Models, des modèles d'IA propriétaires développés conjointement par Apple et Google à partir des technologies qui sous-tendent la famille Gemini. C'est la première fois qu'Apple intègre explicitement du matériel NVIDIA dans l'architecture de sécurité matérielle de PCC, un système conçu pour traiter des requêtes d'intelligence artificielle sensibles sans exposer les données des utilisateurs. Cette collaboration soulève un enjeu fondamental pour l'IA à grande échelle : comment traiter des données personnelles dans le cloud sans sacrifier ni la performance ni la confidentialité. Le Confidential Computing de NVIDIA répond à cette contrainte en isolant les charges de travail dans des environnements d'exécution sécurisés, en chiffrant les flux de communication entre composants, et en permettant une attestation à distance, un mécanisme cryptographique qui permet au logiciel de vérifier que l'infrastructure n'a pas été compromise avant d'y envoyer des données sensibles. Concrètement, cela signifie que personne, y compris les ingénieurs d'Apple, de Google ou de NVIDIA, ne peut accéder aux conversations ou données des utilisateurs pendant le traitement. Pour des centaines de millions d'utilisateurs Apple qui activent des fonctions Apple Intelligence impliquant du traitement cloud, cette garantie est directement opérationnelle. Cette annonce s'inscrit dans une tendance de fond : à mesure que les expériences d'IA hybrides combinent traitement sur l'appareil et inférence serveur, la pression sur la chaîne de confiance s'intensifie. Apple avait fait de la confidentialité de PCC une promesse centrale depuis l'introduction d'Apple Intelligence, mais ses centres de données propriétaires limitaient sa capacité à monter en puissance. Le recours à Google Cloud, avec des GPU Blackwell sécurisés, lui permet de scaler sans renoncer à cette promesse. Pour NVIDIA, c'est une validation de son positionnement sur la sécurité de l'IA, un segment encore peu exploité mais stratégique face à des régulations croissantes sur les données personnelles. L'intégration de ces trois acteurs majeurs, Apple, Google et NVIDIA, autour d'un standard commun de confidentialité computationnelle pourrait accélérer l'adoption de ce type d'architecture dans l'ensemble de l'industrie.

UEL'architecture de confidentialité computationnelle décrite pourrait devenir un standard pour les entreprises européennes soumises au RGPD cherchant à déployer l'IA dans le cloud sans compromettre la protection des données personnelles.

💬 Apple qui sous-traite sa confidentialité à Google Cloud, c'est un paradoxe savoureux. Mais le Confidential Computing de NVIDIA change la lecture : l'attestation à distance garantit que même les ingénieurs des trois boîtes ne touchent pas aux données pendant l'inférence, c'est pas du branding, c'est de la cryptographie. Reste à voir si ça tient à l'échelle, mais sur le papier c'est le template qu'on attendait pour que l'IA cloud passe enfin le test RGPD.

Mettre à l'échelle l'apprentissage par renforcement robotique avec NVIDIA Isaac Lab sur Amazon SageMaker AI
4AWS ML Blog 

Mettre à l'échelle l'apprentissage par renforcement robotique avec NVIDIA Isaac Lab sur Amazon SageMaker AI

NVIDIA et Amazon Web Services ont publié un guide technique détaillant comment entraîner des politiques de comportement pour le robot humanoïde Unitree H1 en utilisant NVIDIA Isaac Lab sur Amazon SageMaker AI. La solution s'appuie sur deux options de calcul complémentaires : SageMaker HyperPod, une infrastructure distribuée managée pour des clusters persistants, et SageMaker Training Jobs, une approche entièrement à la demande où les instances GPU sont provisionnées à la volée puis supprimées à la fin du job. Le code complet est disponible publiquement sur GitHub. L'objectif est de permettre aux équipes robotique de lancer des entraînements par renforcement (RL) à grande échelle, aussi bien en phase d'expérimentation rapide qu'en production sur de longues durées, sans gérer eux-mêmes l'infrastructure de calcul. Cette publication répond à un défi concret : l'entraînement par renforcement pour des comportements complexes, comme la locomotion humanoïde sur terrain accidenté, est extrêmement gourmand en GPU. Un seul run d'entraînement peut durer de quelques heures à plusieurs jours. SageMaker HyperPod intègre un agent de surveillance de santé sur chaque nœud, capable de détecter automatiquement les pannes matérielles, de remplacer les instances défaillantes et de reprendre l'entraînement depuis le dernier checkpoint, sans intervention humaine. Le système publie en parallèle des centaines de métriques de cluster vers Amazon Managed Service for Prometheus, visualisables dans des dashboards Grafana préconfigurés, couvrant l'utilisation GPU, la mémoire, le débit réseau et les performances par tâche. Pour les expériences courtes, SageMaker Training Jobs élimine tout coût de calcul inactif entre les runs, chaque job ne consommant de ressources que le temps de son exécution. L'IA physique bascule progressivement de la recherche vers la production industrielle. Les robots sont désormais formés dans des simulations haute-fidélité accélérées par GPU avant leur déploiement en usine, en entrepôt ou dans des centres logistiques, parce que l'entraînement en conditions réelles reste lent, coûteux et risqué. Cette simulation compresse des mois d'apprentissage en quelques heures, mais déplace le problème vers la gestion du calcul distribué. C'est précisément le créneau que cherchent à occuper AWS et NVIDIA avec cette intégration : en abstraisant la couche infrastructure, ils permettent aux ingénieurs de se concentrer sur la conception des politiques de comportement robotique plutôt que sur la configuration des clusters. SageMaker HyperPod supporte l'orchestration via Amazon EKS ou Slurm, avec un système de quotas fins par instance, GPU entier ou partition MIG (NVIDIA Multi-Instance GPU), couvrant les accélérateurs, les vCPU et la mémoire. La prochaine étape logique sera l'extension de ces pipelines aux modèles de fondation robotique, qui nécessitent des infrastructures similaires mais à une échelle encore supérieure.

RobotiqueActu
1 source
NVIDIA et LG Group construisent une usine IA pour entraîner des robots et alimenter la mobilité du futur
5Interesting Engineering 

NVIDIA et LG Group construisent une usine IA pour entraîner des robots et alimenter la mobilité du futur

NVIDIA et le groupe sud-coréen LG ont annoncé lors du Computex 2026 un partenariat stratégique multisectoriel visant à construire un écosystème d'intelligence artificielle physique couvrant la robotique industrielle, les robots domestiques, la mobilité autonome et les infrastructures de calcul. La collaboration mobilise plusieurs entités du conglomérat LG : LG Electronics, LG CNS, LG Innotek, LG Uplus et LG Energy Solution, chacune apportant un périmètre spécifique. Concrètement, LG prévoit de déployer NVIDIA Isaac Sim et Isaac Lab dans ses workflows robotique pour entraîner ses robots domestiques en environnements virtuels avant tout déploiement physique, et d'explorer le modèle de fondation GR00T pour renforcer leurs capacités de raisonnement. LG Electronics construit par ailleurs ce qu'il appelle une "data factory pour l'IA physique", utilisant les world models NVIDIA Cosmos pour générer des datasets synthétiques destinés à la robotique et à l'automatisation industrielle. Sur le volet infrastructure, LG Uplus s'engage à construire des centres de données à grande échelle compatibles avec les dernières générations de GPU NVIDIA, LG Electronics travaillera sur des technologies de refroidissement liquide alignées avec la plateforme NVIDIA DSX, et LG Energy Solution évalue des architectures d'alimentation en courant continu 800 volts pour les installations nouvelle génération. L'intérêt de ce partenariat pour les décideurs industriels tient moins à l'annonce elle-même qu'à ce qu'elle révèle sur la maturité du cycle de développement robotique. L'adoption d'Isaac Sim comme environnement d'entraînement primaire signale que le sim-to-real gap, longtemps le principal obstacle au déploiement à grande échelle, est considéré comme suffisamment maîtrisé pour structurer une chaîne industrielle dessus. La création d'une data factory synthétique répond à l'un des goulots d'étranglement les plus critiques du secteur : la rareté des données labellisées de qualité pour entraîner des VLA (Vision-Language-Action models). Pour les intégrateurs et les COO industriels, le message est que les outils de simulation et les modèles de fondation convergent vers une stack unifiée, ce qui devrait réduire les coûts et délais de portage de nouvelles applications robotiques. Il convient toutefois de noter que l'annonce reste au stade de la feuille de route : aucun chiffre de déploiement, aucun timeline de livraison ni prix n'ont été communiqués. Le contexte de ce rapprochement est celui d'une course mondiale à l'IA physique dans laquelle NVIDIA cherche à s'imposer comme couche d'infrastructure universelle face à des concurrents comme Boston Dynamics Atlas (désormais intégré chez Hyundai), Figure AI avec son modèle Helix, ou encore Physical Intelligence (pi-0) côté recherche. LG, de son côté, investit depuis plusieurs années dans la robotique de service avec ses robots CLOi, sans avoir encore atteint une adoption commerciale significative. Le groupe fait aussi face à la pression de concurrents coréens comme Samsung, qui développe ses propres robots domestiques avec Ballie. Les prochaines étapes annoncées incluent l'intégration des technologies NVIDIA DRIVE dans les systèmes ADAS de LG Electronics pour les véhicules définis par logiciel, et le déploiement de la plateforme d'automatisation industrielle de LG CNS enrichie de briques NVIDIA. La concrétisation de ces engagements sur les 12 à 24 prochains mois sera le véritable indicateur de la profondeur du partenariat.

UECe partenariat accélère la convergence vers une stack NVIDIA (Isaac Sim, GR00T, Cosmos) comme infrastructure d'entraînement robotique de référence, forçant les intégrateurs et OEM européens à évaluer leur alignement avec cet écosystème dans leurs roadmaps 2026-2027.

💬 Le truc intéressant, c'est pas le deal NVIDIA-LG, c'est ce qu'il révèle : le sim-to-real gap est maintenant considéré comme suffisamment sous contrôle pour construire une filière industrielle dessus. Isaac Sim comme environnement d'entraînement primaire dans une data factory à l'échelle d'un conglomérat coréen, ça signale un vrai changement de maturité, pas juste un POC de plus. Sur le papier, du moins, parce qu'aucun chiffre ni calendrier n'a filtré.

RobotiqueOpinion
1 source
LG Group s’appuie sur NVIDIA pour accélérer ses projets d’AI Factory
6Le Big Data 

LG Group s’appuie sur NVIDIA pour accélérer ses projets d’AI Factory

LG Group et NVIDIA ont annoncé le 8 juin 2026 un partenariat stratégique pour construire une infrastructure d'AI Factory à grande échelle. Jensen Huang, PDG de NVIDIA, a rencontré Koo Kwang-mo, président du conglomérat sud-coréen, pour officialiser cette collaboration qui couvre plusieurs secteurs simultanément : robotique, conduite autonome, centres de données de nouvelle génération et services cloud GPU. Concrètement, plusieurs filiales du groupe sont engagées dans le projet. LG Uplus développera des infrastructures cloud hébergeant les dernières générations de GPU NVIDIA, LG CNS construira des usines IA fondées sur l'architecture DSX de NVIDIA, et LG Electronics intègre déjà les plateformes Isaac Sim et Isaac Lab pour concevoir et tester ses robots en environnements virtuels avant déploiement réel. LG explore également l'intégration du modèle NVIDIA Isaac GR00T pour améliorer les capacités de raisonnement de ses futurs robots domestiques, ainsi que les modèles Cosmos pour générer des données synthétiques d'entraînement. Ce partenariat transforme LG d'un conglomérat industriel traditionnel en un acteur piloté par la donnée et l'IA en temps réel, depuis l'approvisionnement en matières premières jusqu'à la livraison finale. L'enjeu est de connecter l'ensemble des opérations industrielles mondiales du groupe dans un écosystème unique capable de gérer l'entraînement de modèles, la simulation, la validation et le déploiement en périphérie via des jumeaux numériques. Pour les 220 000 employés et les dizaines de sites de production de LG à travers le monde, cela signifie une planification industrielle optimisée par l'IA et une gestion logistique autonomisée. Dans le secteur automobile, LG Electronics aligne également ses systèmes avancés d'aide à la conduite sur les technologies NVIDIA, positionnant le groupe comme fournisseur de référence pour les constructeurs qui intègrent des capacités d'autonomie. Ce rapprochement s'inscrit dans une course mondiale à l'infrastructure IA qui s'est considérablement accélérée depuis 2024, avec les grands conglomérats industriels asiatiques cherchant à ne pas se laisser distancer par les pure players technologiques occidentaux. NVIDIA, dont les puces dominent le marché de l'entraînement de modèles IA, multiplie ces alliances avec des groupes industriels pour diversifier ses débouchés au-delà des laboratoires de recherche et des hyperscalers. Pour LG, l'enjeu est existentiel : un groupe présent dans l'électronique grand public, les appareils ménagers, les écrans, la chimie et les télécommunications doit démontrer qu'il peut intégrer l'IA physique comme avantage compétitif structurel. Les prochaines étapes porteront sur le déploiement effectif des plateformes robotiques autonomes et la mise en service des centres de données nouvelle génération, dont les calendriers précis n'ont pas encore été communiqués.

InfrastructureActu
1 source
Tutoriel NVIDIA cuTile en Python : noyaux GPU tuilés pour vecteurs et matrices dans Colab
7MarkTechPost 

Tutoriel NVIDIA cuTile en Python : noyaux GPU tuilés pour vecteurs et matrices dans Colab

NVIDIA a lancé cuTile Python, une interface de programmation GPU par tuiles permettant d'écrire des kernels de style CUDA directement en Python, sans passer par le C++. Un tutoriel détaillé, conçu pour fonctionner sur Google Colab, guide les développeurs à travers trois exemples progressifs : addition de vecteurs, addition de matrices et multiplication de matrices. L'environnement requiert au minimum le pilote NVIDIA R580 et le CUDA Toolkit 13.1, des prérequis que Colab ne satisfait pas toujours en configuration standard. Le package s'installe via PyPI sous le nom cuda-tile[tileiras], et le tutoriel intègre un mode de repli automatique sur PyTorch pour garantir l'exécutabilité du notebook même lorsque les conditions du runtime ne sont pas réunies. L'enjeu est considérable pour la communauté des développeurs en machine learning et en IA. Jusqu'ici, écrire des kernels GPU personnalisés et hautement optimisés exigeait de maîtriser le CUDA C++, un langage bas niveau réservé à un profil d'ingénieur très spécialisé. cuTile Python abaisse cette barrière en exposant une abstraction par tuiles directement en Python, le langage de référence de l'écosystème IA. Concrètement, les développeurs peuvent désormais contrôler finement comment les tenseurs sont chargés, calculés et stockés en mémoire GPU, puis comparer les performances de leurs kernels personnalisés avec les opérations standard de PyTorch. Ce niveau de contrôle, auparavant réservé à des équipes spécialisées dans des laboratoires comme Google DeepMind ou Meta FAIR, devient accessible à un cercle bien plus large de praticiens. Cette initiative s'inscrit dans une tendance de fond chez NVIDIA à rendre son écosystème CUDA plus accessible aux développeurs Python, face à la montée en puissance de compilateurs alternatifs comme Triton d'OpenAI ou JAX de Google. Triton, intégré nativement à PyTorch depuis 2022, avait déjà ouvert cette voie en permettant d'écrire des opérations GPU optimisées en Python pur. cuTile se positionne comme la réponse directe de NVIDIA, en s'appuyant sur son propre stack logiciel et ses nouvelles générations de pilotes. Le fait que le tutoriel soit explicitement conçu pour Colab, l'environnement de notebooks gratuit de Google, signale une stratégie d'adoption large : abaisser le coût d'entrée pour que les étudiants, chercheurs et ingénieurs puissent expérimenter sans infrastructure dédiée. La prochaine étape naturelle sera l'intégration de cuTile dans les frameworks d'entraînement majeurs comme HuggingFace Accelerate ou PyTorch Lightning, ce qui pourrait redéfinir comment les équipes optimisent leurs pipelines à grande échelle.

OutilsTuto
1 source
Red Hat et NVIDIA dévoilent une nouvelle infrastructure dédiée aux agents IA
8Le Big Data 

Red Hat et NVIDIA dévoilent une nouvelle infrastructure dédiée aux agents IA

Red Hat et NVIDIA ont annoncé le 8 juin 2026, à l'occasion du Red Hat Summit 2026, une série d'évolutions majeures de leur plateforme conjointe Red Hat AI Factory. L'objectif affiché est de permettre aux entreprises de faire passer leurs agents IA autonomes du stade expérimental à la production à grande échelle. Parmi les nouveautés figurent l'intégration d'OpenShell, un projet open source initié par NVIDIA qui fournit un environnement d'exécution isolé pour agents autonomes, ainsi qu'un nouveau modèle MaaS (Model as a Service) gouverné offrant un accès à des modèles comme NVIDIA Nemotron via des interfaces compatibles avec les standards OpenAI. La plateforme embarque également un système de gestion du cycle de vie fondé sur MLflow, qui trace chaque appel aux modèles, les outils sollicités et les étapes de raisonnement des agents. En matière de sécurité, des capacités de calcul confidentiel basées sur NVIDIA Confidential Computing permettent désormais d'exécuter des conteneurs confidentiels au sein de Red Hat OpenShift, disponibles en préversion technologique. Cette annonce s'adresse directement aux entreprises qui butent sur les obstacles concrets à l'adoption industrielle de l'IA agentique : sécurité des données, auditabilité des décisions, conformité réglementaire. Contrairement aux assistants conversationnels classiques, les agents autonomes interagissent avec de multiples systèmes, exécutent des tâches complexes sur la durée et prennent des décisions sans intervention humaine permanente, ce qui exige un cadre de gouvernance nettement plus robuste. La traçabilité offerte par MLflow répond à une demande pressante des directions juridiques et de conformité, qui doivent justifier les actions automatisées de leurs systèmes IA. L'architecture zero-trust et le calcul confidentiel visent quant à eux à protéger les charges de travail sensibles, même dans des environnements cloud hybrides où les données circulent entre infrastructures on-premise et cloud public. Ce partenariat entre Red Hat et NVIDIA s'inscrit dans une compétition croissante entre les grands acteurs du cloud hybride et des semi-conducteurs pour imposer leurs stacks comme infrastructure standard de l'IA d'entreprise. NVIDIA, dont les GPU dominent l'entraînement des modèles, cherche à étendre son influence vers les couches logicielles de déploiement et de gouvernance, tandis que Red Hat apporte son positionnement historique dans les environnements OpenShift et son crédit auprès des DSI des grandes entreprises. La standardisation de la gouvernance des agents via OpenShell est particulièrement stratégique : celui qui contrôle la couche de politique d'exécution des agents contrôle de fait l'ensemble de l'écosystème applicatif qui s'y connecte. Les prochaines étapes passeront par l'intégration native d'OpenShell à l'écosystème Red Hat, avec une disponibilité générale attendue après la préversion actuelle.

UELes entreprises européennes soumises à l'AI Act peuvent s'appuyer sur la traçabilité MLflow et le calcul confidentiel pour répondre aux exigences d'auditabilité et de gouvernance des systèmes d'IA à haut risque.

InfrastructureOpinion
1 source
Intel retrouve une seconde vie : Google et Nvidia l'envisagent comme alternative à TSMC pour leurs puces IA
9The Decoder 

Intel retrouve une seconde vie : Google et Nvidia l'envisagent comme alternative à TSMC pour leurs puces IA

Google a passé une commande de plus de trois millions de puces d'intelligence artificielle auprès d'Intel, prévue pour 2028. Parallèlement, Nvidia teste les capacités de fabrication d'Intel pour sa prochaine architecture Feynman. Ces deux mouvements, révélés simultanément, marquent un tournant inattendu pour la division fonderie d'Intel, qui traverse une période difficile depuis plusieurs années. L'enjeu est direct : TSMC, le fabricant taïwanais qui domine la production de puces avancées, ne parvient plus à répondre à la demande explosive en semi-conducteurs pour l'IA. Google et Nvidia, deux des acteurs les plus gourmands en capacité de calcul, cherchent activement à diversifier leurs sources d'approvisionnement pour sécuriser leurs chaînes de production. Pour Intel, ces commandes représentent une bouée de sauvetage concrète et une validation industrielle de sa technologie de fabrication. Intel Foundry Services, la branche externe d'Intel lancée pour concurrencer TSMC et Samsung, peinait à convaincre les grands clients malgré des investissements massifs. La congestion chez TSMC, amplifiée par la ruée vers les GPU et les accélérateurs pour les centres de données IA, crée désormais une fenêtre d'opportunité réelle pour Intel. Si les tests de Nvidia sur l'architecture Feynman aboutissent positivement, Intel pourrait s'imposer comme un second fournisseur stratégique à l'échelle mondiale, réduisant la dépendance de l'industrie envers un seul acteur taïwanais dans un contexte géopolitique tendu.

UELa montée en puissance d'Intel Foundry renforce l'intérêt stratégique des usines Intel en Europe (Magdeburg, Allemagne), soutenues par le Chips Act européen, dans l'objectif de réduire la dépendance continentale au taïwanais TSMC.

SK hynix et NVIDIA étendent leur partenariat autour des AI Factories
10Le Big Data 

SK hynix et NVIDIA étendent leur partenariat autour des AI Factories

SK hynix et NVIDIA ont annoncé le 7 juin 2026 un partenariat technologique pluriannuel centré sur le codéveloppement de mémoires de nouvelle génération pour les infrastructures d'IA mondiales. L'accord couvre un spectre large : les supercalculateurs d'IA Vera Rubin, les processeurs Vera, les PC RTX Spark et les plateformes robotiques Jetson Thor. Au-delà de la mémoire, les deux groupes prévoient d'appliquer l'intelligence artificielle à la conception et à la fabrication des semi-conducteurs eux-mêmes, en mobilisant les bibliothèques CUDA-X de NVIDIA et le framework PhysicsNeMo pour accélérer les simulations de puces, la lithographie computationnelle et les flux de conception assistée par ordinateur. Ce partenariat répond à une tension structurelle qui pèse sur toute l'industrie : les cycles de conception et de production des mémoires avancées sont longs et coûteux, alors que la demande explose avec l'essor des centres de données spécialisés en IA. Pour NVIDIA, sécuriser un fournisseur mémoire synchronisé avec sa propre feuille de route est devenu aussi stratégique que la conception des GPU eux-mêmes. Pour SK hynix, l'accord représente une montée en gamme décisive : l'entreprise coréenne sort du marché traditionnel des centres de données pour s'imposer sur deux segments que NVIDIA considère comme ses prochains relais de croissance, l'IA personnelle et l'IA physique, c'est-à-dire la robotique. L'utilisation de jumeaux numériques pour simuler les usines de semi-conducteurs pourrait par ailleurs réduire significativement les délais de développement à mesure que la complexité des puces continue de croître. Ce rapprochement s'inscrit dans une recomposition plus large des chaînes d'approvisionnement technologiques, accélérée par la course mondiale aux infrastructures d'IA. Les grands fournisseurs de GPU ne se contentent plus de concevoir des accélérateurs : ils cherchent à verrouiller en amont les composants critiques, dont la mémoire à haute bande passante est aujourd'hui le principal goulot d'étranglement pour l'entraînement et l'inférence des grands modèles. SK hynix, déjà premier fournisseur mondial de mémoire HBM, renforce ainsi une position concurrentielle face à Samsung et Micron. L'intégration de l'IA dans les processus industriels de fabrication de puces ouvre également la voie à une collaboration plus étroite entre fondeurs, concepteurs de GPU et éditeurs de logiciels EDA, un écosystème encore fragmenté dont NVIDIA cherche visiblement à devenir le pivot central.

UELes centres de données européens dépendent des mémoires HBM de SK hynix pour leurs infrastructures IA, ce partenariat renforce la dépendance stratégique de l'UE envers des fournisseurs non-européens de composants critiques.

InfrastructureOpinion
1 source
Le Royaume-Uni concrétise ses ambitions en IA souveraine avec les technologies NVIDIA
11NVIDIA AI Blog 

Le Royaume-Uni concrétise ses ambitions en IA souveraine avec les technologies NVIDIA

Un an après que Jensen Huang, PDG de NVIDIA, et le Premier ministre britannique Keir Starmer ont pris l'engagement public de faire du Royaume-Uni un « créateur » et non un « consommateur » d'IA lors de la London Tech Week 2025, les premières réalisations concrètes se matérialisent. Le nombre de fournisseurs de cloud prévoyant de déployer des infrastructures IA sur le sol britannique a doublé en douze mois. Nebius va déployer trois nouvelles installations représentant 65 mégawatts à pleine capacité en 2027, CoreWeave s'installe dans les zones de croissance IA du gouvernement, et BT s'est associé à Nscale pour construire des datacenters souverains sur trois de ses sites existants. Au coeur du dispositif se trouve Isambard-AI, le supercalculateur le plus puissant du Royaume-Uni, assemblé autour de 5 400 puces NVIDIA GH200 Grace Hopper et alimenté à 100 % en électricité décarbonée. Le Fonds d'IA souverain du gouvernement s'appuie sur cette infrastructure pour financer des entreprises nationales, dont Ineffable Intelligence, qui développe la prochaine génération d'infrastructure d'apprentissage par renforcement en collaboration directe avec NVIDIA. Quatre startups membres du programme NVIDIA Inception illustrent l'ambition de ce fonds. Cosine développe une plateforme de codage IA souveraine destinée aux secteurs hautement réglementés, services financiers, infrastructures critiques, sécurité nationale, et entraîne via Isambard un grand modèle multimodal de type mixture-of-experts capable de traiter des types de données au-delà du texte et de l'image. Cursive construit des systèmes d'IA auto-apprenants à fenêtres de contexte étendues, capables de fonctionner de façon autonome sur de longues durées, en adoptant le framework NVIDIA Megatron-LM pour l'entraînement distribué. Doubleword, premier laboratoire britannique dédié à l'inférence, optimise l'ensemble de la pile logicielle pour maximiser le rapport qualité-coût : ses premiers résultats sur Isambard montrent des démarrages de modèles 70 fois plus rapides et une compression du cache KV quatre fois supérieure sans perte de qualité. Ce déploiement s'inscrit dans une tendance mondiale où les États cherchent à ne pas dépendre exclusivement d'infrastructures IA contrôlées par des acteurs américains. Pour le Royaume-Uni, la souveraineté numérique est devenue un argument commercial à part entière : les entreprises européennes et britanniques peuvent désormais proposer à leurs clients des garanties de localisation des données et de contrôle national que les géants américains ne peuvent offrir. La montée en puissance de l'écosystème NVIDIA au Royaume-Uni, avec sept autres partenaires cloud en attente de déploiement, signale que Londres entend rivaliser avec Paris, qui a fait d'annonces similaires autour de son propre plan IA. La question qui se pose désormais est de savoir si ces infrastructures souveraines produiront des modèles et des usages capables de concurrencer les grands acteurs américains et chinois, ou si elles resteront cantonnées à des niches réglementaires.

UELe déploiement souverain britannique crée une pression concurrentielle directe sur le plan IA français et offre aux entreprises européennes des garanties de localisation des données que les géants américains ne peuvent proposer.

InfrastructureActu
1 source
NVIDIA garak : construire un workflow complet de red-teaming défensif pour LLM avec sondes et détecteurs personnalisés
12MarkTechPost 

NVIDIA garak : construire un workflow complet de red-teaming défensif pour LLM avec sondes et détecteurs personnalisés

NVIDIA a publié un tutoriel complet sur garak, son framework open source dédié au red-teaming défensif des grands modèles de langage (LLM). L'outil, installable via pip, propose une architecture modulaire articulée autour de quatre types de composants : les probes (sondes d'attaque), les détecteurs, les générateurs et les buffs. Le tutoriel couvre l'ensemble du cycle de test, depuis la découverte des plugins jusqu'à l'export des résultats vers l'AVID (AI Vulnerability Database), en passant par la création de sondes et de détecteurs personnalisés. Concrètement, garak permet de soumettre un modèle à des attaques connues, comme le jailbreak DAN 11.0, l'injection via encodage Base64, ou la génération de contenu haineux (SlurUsage), et de mesurer automatiquement son taux de résistance via des scores de sécurité calculés par probe. L'enjeu est direct pour toute organisation qui déploie des LLM en production : identifier les failles avant qu'elles ne soient exploitées. Garak automatise ce processus de test offensif en mode défensif, générant des rapports JSONL analysables avec des outils comme pandas ou numpy. Il est possible de lancer des scans sur des modèles Hugging Face (comme GPT-2), des API externes, ou des générateurs de test internes, avec parallélisation des tentatives jusqu'à 16 threads simultanés. Les résultats sont agrégés en scores de sécurité par probe, ce qui permet à une équipe de sécurité ML de prioriser les vulnérabilités et de documenter la surface d'attaque d'un modèle de façon systématique et reproductible. Garak s'inscrit dans un mouvement plus large de professionnalisation de la sécurité des systèmes IA. Alors que les LLM sont de plus en plus intégrés dans des produits critiques, les attaques par prompt injection, jailbreak et contournement de garde-fous se multiplient. NVIDIA, qui positionne garak comme un outil de red-teaming défensif, rejoint ainsi un écosystème naissant comprenant des initiatives comme le projet AVID ou les travaux de l'OWASP sur les LLM Top 10. La capacité de garak à accepter des probes et détecteurs personnalisés en ouvre l'usage au-delà des scénarios préconfigurés, permettant à des équipes spécialisées de modéliser leurs propres vecteurs de menace. Les prochaines étapes naturelles de cet écosystème pointent vers l'intégration dans les pipelines CI/CD, afin que chaque mise à jour d'un modèle soit automatiquement auditée avant déploiement.

UELes organisations européennes soumises à l'AI Act peuvent utiliser garak pour documenter systématiquement la surface d'attaque de leurs LLM et répondre aux exigences de red-teaming imposées aux systèmes IA à haut risque.

💬 C'est exactement le genre d'outil qui manquait. Tout le monde parle de sécuriser ses LLM en production, mais tester de façon systématique et documentée, c'était encore du bricolage maison il y a six mois. Reste à voir si les équipes vont vraiment l'intégrer dans leurs pipelines CI/CD, ou si ça finira sur l'étagère des outils qu'on lance une fois avant la mise en prod et qu'on oublie.

SécuritéTuto
1 source
NVIDIA lance Nemotron 3 Ultra, un hybride Mamba-Transformer open source à 550 milliards de paramètres pour agents autonomes
13MarkTechPost 

NVIDIA lance Nemotron 3 Ultra, un hybride Mamba-Transformer open source à 550 milliards de paramètres pour agents autonomes

NVIDIA a dévoilé Nemotron 3 Ultra, son modèle d'intelligence artificielle le plus ambitieux à ce jour : un modèle à mélange d'experts (MoE) de 550 milliards de paramètres au total, dont seulement 55 milliards sont activés à chaque token. Conçu spécifiquement pour les agents autonomes de longue durée, il repose sur une architecture hybride Mamba-Attention, une alternative aux Transformers purs. Les couches Mamba gèrent les longues séquences avec une mise à l'échelle sous-quadratique, tandis que quelques couches Attention assurent un rappel précis sur de grands contextes. Le modèle a été pré-entraîné sur 20 000 milliards de tokens, puis sa fenêtre de contexte a été étendue à 1 million de tokens. NVIDIA annonce un débit d'inférence jusqu'à six fois supérieur à celui de modèles open source comparables, à précision équivalente. Le pipeline de post-entraînement combine apprentissage supervisé (SFT), apprentissage par renforcement à récompense vérifiable (RLVR) et une distillation multi-enseignants (MOPD). Les données publiées en open source incluent 50 millions d'exemples SFT, 2 millions de tâches RL et 55 environnements RL, auxquels s'ajoutent 173 milliards de tokens de code GitHub fraîchement collectés. Ce modèle répond à un défi concret du déploiement d'agents IA : plus un agent opère longtemps, plus le nombre de tokens traités explose, et plus le coût d'inférence devient prohibitif. Nemotron 3 Ultra inverse cette dynamique grâce à sa structure MoE et à l'architecture Mamba, dont le coût de décodage reste constant quelle que soit la longueur de la séquence. Pour les entreprises qui construisent des agents capables d'utiliser des outils, de planifier sur de nombreux tours et de raisonner sur de longs contextes, c'est une amélioration directe de viabilité économique. La publication simultanée des jeux de données d'entraînement et des 15 nouveaux environnements RL est également significative : elle permet à la communauté de reproduire et d'affiner le pipeline sans repartir de zéro, ce que les grands modèles fermés ne permettent pas. Nemotron 3 Ultra s'inscrit dans la stratégie de NVIDIA visant à imposer sa stack logicielle dans l'écosystème IA open source, en complément de ses GPU. L'entraînement n'a pas été sans accrocs : deux divergences de loss ont été documentées. La première, vers 8 000 milliards de tokens, était due à une réduction de gradient en BF16 qui écrasait silencieusement la contribution du mécanisme de prédiction multi-token. La seconde, vers 16 000 milliards de tokens, reste inexpliquée et a conduit NVIDIA à tronquer l'entraînement à 20 000 milliards de tokens. Ces incidents, publiquement documentés, constituent une contribution rare à l'ingénierie de l'entraînement à grande échelle. Le modèle est publié en open weights via Hugging Face, positionnant NVIDIA comme un acteur de référence dans la course aux modèles ouverts face à Meta, Mistral et Google.

UELa publication en open weights avec les jeux de données d'entraînement (50 M exemples SFT, 2 M tâches RL) permet aux équipes de recherche et entreprises européennes de reproduire, affiner et déployer ce modèle sans dépendance propriétaire, renforçant leur capacité à développer des agents autonomes compétitifs à moindre coût d'inférence.

💬 L'architecture Mamba pour des agents longs, c'est le problème qu'on se prend en pleine figure dès qu'on essaie de faire tourner quelque chose de sérieux en prod. 55 milliards actifs sur 550, contexte à un million de tokens sans faire exploser les coûts à chaque requête, les datasets publiés avec, ça change vraiment l'équation pour qui construit sur de l'open source. Et documenter deux divergences de loss en cours d'entraînement, dont une inexpliquée, c'est rare, et franchement plus utile que trois posts de blog soignés.

LLMsOpinion
1 source
NVIDIA lance des compétences agents pour l'IA physique : véhicules autonomes, robotique et vision
14NVIDIA AI Blog 

NVIDIA lance des compétences agents pour l'IA physique : véhicules autonomes, robotique et vision

NVIDIA a profité de la conférence CVPR 2026 pour dévoiler une série de nouveaux outils d'IA physique destinés aux chercheurs travaillant sur les véhicules autonomes, la robotique et les systèmes de vision artificielle. Ces annonces s'appuient sur le lancement, quelques jours plus tôt, de NVIDIA Cosmos 3, présenté comme le premier modèle fondamental unifié de l'industrie combinant raisonnement visuel, génération de mondes et génération d'actions. Parmi les outils dévoilés figurent InstantNuRec, qui reconstruit des scènes routières en 3D à partir d'images sans optimisation par scène ; AlpaGym, un framework open source d'apprentissage par renforcement en boucle fermée capable de s'exécuter sur des milliers de GPU ; OmniDreams, un modèle génératif qui produit des rendus photoréalistes en temps réel en réponse aux actions d'une politique de conduite ; et Alpamayo 2 Super, un modèle VLA (vision-langage-action) de 32 milliards de paramètres conçu pour le développement de véhicules autonomes de niveau 4. Le problème central que cherche à résoudre NVIDIA est la fragmentation des workflows en IA physique. Aujourd'hui, reconstruire une scène réelle, générer des scénarios rares, entraîner une politique, évaluer son comportement et itérer rapidement implique de jongler entre des outils disparates, ce qui ralentit considérablement la recherche. Pour les véhicules autonomes en particulier, le défi est la « longue traîne » des situations de conduite : les interactions rares, les géométries routières inhabituelles, les variations d'éclairage qui sont difficiles à collecter en conditions réelles mais critiques pour la validation. Les nouveaux outils de NVIDIA permettent aux agents IA d'automatiser ces étapes, de la reconstruction de scènes à partir de données de flotte jusqu'à la génération de conditions synthétiques variées. Pour la vision industrielle, des compétences Metropolis permettent de générer des défauts visuels rares sur différentes surfaces, résolvant le problème chronique du manque de données pour la détection d'anomalies. Ces annonces s'inscrivent dans une stratégie cohérente de NVIDIA pour s'imposer comme infrastructure de référence de l'IA physique, un marché qu'elle considère comme la prochaine vague majeure après les grands modèles de langage. Cosmos 3, socle de l'ensemble de l'écosystème présenté, est positionné comme modèle ouvert dominant sur les benchmarks publics de l'IA physique. En combinant simulation haute fidélité, modèles fondateurs ouverts et frameworks d'entraînement scalables, NVIDIA tente de reproduire avec l'IA embarquée et robotique ce qu'elle a réussi dans le calcul haute performance : rendre son infrastructure si centrale que les chercheurs n'envisagent pas d'alternatives. Les prochaines étapes passeront par l'adoption de ces outils par les grands constructeurs automobiles et les laboratoires de robotique, qui testent actuellement leurs capacités sur des flottes réelles.

UELes constructeurs automobiles européens (Renault, Stellantis, BMW) et les laboratoires de recherche en robotique pourront utiliser ces outils open-source pour accélérer le développement de véhicules autonomes de niveau 4 et réduire leur dépendance à la collecte de données réelles.

RobotiqueOpinion
1 source
NVIDIA lance Cosmos 3 : un modèle de fondation à deux tours mêlant raisonnement physique, génération de mondes et d'actions
15MarkTechPost 

NVIDIA lance Cosmos 3 : un modèle de fondation à deux tours mêlant raisonnement physique, génération de mondes et d'actions

NVIDIA a publié Cosmos 3, une nouvelle famille de modèles d'IA fondationnels conçus pour les systèmes d'IA physique, robots, véhicules autonomes et systèmes de surveillance industrielle. La particularité de cette version réside dans son architecture dite Mixture-of-Transformers (MoT) à deux tours, qui réunit pour la première fois dans un seul modèle trois capacités jusqu'ici séparées : le raisonnement physique, la génération de monde (vidéo, images, son) et la génération d'actions. NVIDIA a publié en open source les poids, scripts d'entraînement, outils de déploiement et jeux de données. Deux échelles sont disponibles au lancement : Cosmos3-Nano (16 milliards de paramètres, basé sur Qwen3-VL 8B) pour l'inférence sur GPU workstation comme la RTX PRO 6000, et Cosmos3-Super (64 milliards de paramètres, basé sur Qwen3-VL 32B) pour les datacenters équipés de GPU Hopper ou Blackwell. Des variantes spécialisées accompagnent cette sortie, dont Super Text2Image, Super Image2Video et Nano-Policy-DROID. L'unification de ces trois capacités dans un seul modèle représente un changement structurel pour les équipes qui développent des systèmes robotiques ou de conduite autonome. Jusqu'ici, il fallait orchestrer plusieurs modèles distincts, un pour percevoir, un pour prédire, un pour agir, ce qui multipliait la complexité d'intégration et les points de défaillance. Cosmos 3 propose un flux cohérent : la tour "reasoner" (un VLM autorégressif qui comprend images, vidéos et texte) conditionne la tour "generator" (diffusion pour la vidéo et les actions), l'information circulant dans un seul sens. Les équipes de robotique temps réel peuvent faire tourner le Nano sur du matériel de terrain, tandis que les équipes de R&D génèrent des données synthétiques à grande échelle avec le Super. Sur les benchmarks, Cosmos 3 domine VANTAGE-Bench et le leaderboard TAR (Traffic Anomaly Reasoning) dans leurs catégories respectives. Cette sortie s'inscrit dans la stratégie d'NVIDIA visant à s'imposer comme infrastructure logicielle de l'IA physique, au-delà de la simple vente de GPU. Les versions précédentes de Cosmos fragmentaient les capacités ; Cosmos 3 consolide l'approche autour d'un socle commun initialisé depuis les poids Qwen3-VL de l'écosystème open source. Le modèle gère nativement des entrées texte, image, vidéo et tableaux d'actions JSON, et produit des sorties allant jusqu'à 720p à 24 FPS avec son stéréo AAC 48 kHz, pour une durée maximale d'environ 12,5 secondes. Il supporte une gamme d'embodiments robotiques (caméra, véhicule, bras simple ou double, humanoïde), chacun avec des dimensions d'action fixes. Face à la montée en puissance de Google DeepMind, Boston Dynamics et des startups robotiques chinoises, NVIDIA mise sur l'open source et la verticalisation logicielle pour ancrer son écosystème dans les prochaines années de déploiement d'IA physique.

UELes équipes européennes de robotique et de véhicules autonomes peuvent accéder gratuitement à un modèle de fondation unifié pour l'IA physique, réduisant la complexité d'intégration et les coûts de R&D pour les industriels actifs dans l'automatisation et la mobilité autonome.

💬 Orchestrer trois modèles séparés pour percevoir, prédire et agir, c'était le quotidien douloureux des équipes robotique, et Cosmos 3 règle ça proprement. L'open source complet, poids + scripts + datasets, c'est pas de la comm, NVIDIA construit une base logicielle sur laquelle personne ne pourra se passer d'eux dans 3 ans. Reste à voir si le Nano tient en conditions réelles, parce que sur les benchmarks c'est toujours plus joli qu'en prod.

RobotiqueOpinion
1 source
NVIDIA et Microsoft s'associent pour un environnement unifié de déploiement d'agents IA, des appareils Windows au cloud
16NVIDIA AI Blog 

NVIDIA et Microsoft s'associent pour un environnement unifié de déploiement d'agents IA, des appareils Windows au cloud

NVIDIA et Microsoft ont dévoilé lors de Microsoft Build un partenariat élargi pour déployer une pile technologique unifiée dédiée à l'IA agentique, couvrant les PC Windows, le cloud Azure et les environnements locaux. Jensen Huang, fondateur et PDG de NVIDIA, est intervenu en direct depuis Taipei aux côtés de Satya Nadella pour présenter les nouvelles initiatives. Au programme : les PC RTX Spark et les stations DGX Station for Windows, l'accélération GPU de Microsoft Fabric, les modèles ouverts NVIDIA sur Microsoft Foundry, et le runtime sécurisé NVIDIA OpenShell intégré à GitHub Copilot. RTX Spark cible les laptops et petits ordinateurs de bureau avec 1 pétaflop de performance IA, jusqu'à 128 Go de mémoire unifiée et une autonomie toute la journée, avec des systèmes attendus cet automne chez Microsoft Surface, ASUS, Dell, HP, Lenovo et MSI. La DGX Station for Windows, propulsée par le superchip NVIDIA GB300 Grace Blackwell Ultra, offre jusqu'à 748 Go de mémoire cohérente et 20 pétaflops en FP4, capable de faire tourner des modèles jusqu'à 1 billion de paramètres, avec des livraisons prévues au quatrième trimestre 2026 chez ASUS, Dell, GIGABYTE, HP, MSI et Supermicro. Ce partenariat marque un tournant dans la course à l'IA agentique d'entreprise en proposant, pour la première fois, une chaîne complète allant du matériel personnel à l'infrastructure cloud. Pour les développeurs et les entreprises, cela signifie pouvoir construire, affiner et déployer des agents IA directement sur Windows sans dépendre exclusivement du cloud. Les modèles Claude d'Anthropic tournent désormais nativement sur les systèmes Blackwell Ultra dans Azure, avec une disponibilité annoncée dans les prochaines semaines. Sur Microsoft Foundry, le nouveau NVIDIA Nemotron 3 Ultra, conçu pour le raisonnement de longue durée dans des tâches de codage, de recherche et de workflows d'entreprise, est disponible dès ce mois-ci, accompagné de Nemotron 3.5 ASR pour la reconnaissance vocale et Nemotron 3.5 Content Safety pour la modération de contenu. Ce rapprochement intervient alors que l'ensemble de l'industrie cherche à concrétiser la promesse des agents IA autonomes capables d'exécuter des tâches complexes sur la durée. NVIDIA, dont les GPU sont devenus incontournables dans les data centers, étend son influence jusqu'au bureau et au PC personnel, concurrençant indirectement Apple Silicon et AMD sur le terrain de l'inférence locale. Le runtime OpenShell, sécurisé nativement, répond aux exigences de gouvernance des grandes entreprises qui hésitent encore à confier des tâches autonomes à des agents. L'intégration des bibliothèques CUDA-X comme cuDF, cuOpt et NeMo directement accessibles aux agents ouvre la voie à des workflows scientifiques plus complexes, notamment avec le modèle Cosmos 3 pour la simulation du monde physique et les modèles météo Earth-2 disponibles via Microsoft Planetary Computer Pro.

UELes entreprises européennes utilisant Azure et Windows bénéficieront d'une chaîne de déploiement IA unifiée du PC personnel au cloud, réduisant la dépendance exclusive à l'infrastructure cloud pour les workflows agentiques.

💬 Jensen Huang qui s'invite en hologramme depuis Taipei pendant le keynote de Satya, c'est le genre de mise en scène qui cache souvent un partenariat creux. Là, non : la DGX Station sous Windows avec 748 Go de mémoire cohérente et 20 pétaflops, c'est du concret pour les boîtes qui refusent de tout mettre dans Azure. Reste à voir si les prix seront accessibles à autre chose qu'aux grands comptes, mais l'idée d'une chaîne complète du laptop au datacenter sans changer de stack, ça change vraiment quelque chose pour les équipes qui font tourner des agents en prod.

InfrastructureActu
1 source
Microsoft lance MXC, un bac à sable au niveau OS pour agents IA, avec OpenAI et Nvidia à bord
17VentureBeat AI 

Microsoft lance MXC, un bac à sable au niveau OS pour agents IA, avec OpenAI et Nvidia à bord

Microsoft a présenté mardi, lors de sa conférence annuelle Build, une nouvelle couche de sécurité intégrée directement dans Windows : les Microsoft Execution Containers, ou MXC. Il ne s'agit pas d'un produit à acheter, mais d'un SDK et d'un modèle de politique embarqués dans le système d'exploitation et dans le Windows Subsystem for Linux. Concrètement, MXC permet aux développeurs et aux administrateurs informatiques de définir précisément ce qu'un agent IA peut ou ne peut pas faire, avec des limites appliquées en temps réel par le noyau du système. Le dispositif couvre un spectre allant de l'isolation légère de processus, déjà adoptée par la CLI de GitHub Copilot, jusqu'aux micro-machines virtuelles, conteneurs Linux et instances cloud tournant sous Windows 365. Chaque agent est lié à une identité forte, locale ou provisionnée via Microsoft Entra, ce qui permet d'attribuer, d'auditer et de gouverner chacune de ses actions. OpenAI et Nvidia font partie des premiers partenaires annoncés. L'annonce intervient à un moment charnière pour les entreprises. Jusqu'à présent, le déploiement d'agents IA autonomes sur des réseaux d'entreprise se heurtait à un paradoxe : plus un agent est capable, plus il est dangereux à laisser opérer sans garde-fous. MXC sépare l'exécution de l'agent du bureau de l'utilisateur, du presse-papiers, de l'interface graphique et des périphériques d'entrée, ce qui réduit drastiquement la surface d'attaque. Pour les directions informatiques et sécurité, c'est potentiellement le verrou qui empêchait de passer des démos à la production réelle : un environnement d'exécution de confiance, standardisé et intégré à l'OS, plutôt qu'une solution maison bricolée par chaque éditeur. Depuis deux ans, les chercheurs en sécurité ont multiplié les démonstrations montrant comment des agents IA pouvaient être manipulés par injection de prompt, appels d'outils malveillants ou exfiltration de données dissimulée dans des flux de travail normaux. Microsoft elle-même décrit le problème comme "un enjeu systémique multi-couches" : chaque interaction entre un agent et des humains, des outils, des applications ou d'autres agents ouvre de nouvelles failles. En intégrant MXC directement dans Windows plutôt qu'en le proposant comme une surcouche optionnelle, Microsoft cherche à établir un standard de facto pour l'industrie. Si les grands éditeurs de logiciels d'entreprise adoptent ce modèle, ce sont potentiellement toutes les entreprises du monde utilisant Windows qui bénéficieront automatiquement de ce cadre de sécurité pour leurs déploiements d'agents, sans action supplémentaire.

UELes entreprises françaises et européennes utilisant Windows pourraient bénéficier automatiquement de ce cadre d'exécution sécurisé pour leurs déploiements d'agents IA, sans développement de solution maison.

💬 C'est le verrou qui manquait pour passer des démos à la prod. On a tous vu des agents autonomes tourner en sandbox, faire des trucs impressionnants, et tout le monde savait qu'on ne pourrait jamais les laisser opérer sur un vrai réseau sans cage solide. Intégrer ça dans le noyau Windows plutôt qu'en surcouche optionnelle, c'est la seule façon d'en faire un standard, même si ça revient à confier les clés de la gouvernance IA mondiale à Redmond.

SécuritéOpinion
1 source
Cosmos 3 : Nvidia lance l’IA qui comprend (enfin) la vraie vie
18Le Big Data 

Cosmos 3 : Nvidia lance l’IA qui comprend (enfin) la vraie vie

Nvidia a présenté Cosmos 3 lors du GTC de Taipei le 1er juin 2026, en parallèle de son robot humanoïde Isaac GROOT. Il s'agit du premier omnimodèle entièrement open source dédié à l'IA physique, disponible en deux variantes dès le lancement : une version "Super" de 32 milliards de paramètres, optimisée pour la précision dans des tâches comme la robotique et la conduite autonome, et une version "Nano" de 8 milliards de paramètres, conçue pour des inférences rapides. Une troisième déclinaison "Edge", utilisable directement sur des appareils locaux sans connexion cloud, est annoncée prochainement. Le modèle a été entraîné sur un corpus colossal de 20 000 milliards de tokens incluant près d'un milliard d'images, 400 millions de vidéos réelles et générées, des données audio ambiantes, du texte, ainsi que des traces d'actions captées sur des humains et des robots. Parmi les premiers partenaires industriels figurent Agile Robots, Black Forest Labs et Runway. Ce qui distingue Cosmos 3 des générateurs vidéo ou des modèles multimodaux classiques, c'est sa capacité native à comprendre et produire des actions, et pas seulement des représentations visuelles. Le système peut générer des données concrètes comme les angles d'articulations d'un robot, des trajectoires ou des positions de pinces mécaniques, directement exploitables pour entraîner des machines à interagir avec le monde physique. Ming-Yu Liu, vice-président du Cosmos Lab chez Nvidia, a insisté sur ce point : modéliser les mouvements des machines, et non seulement l'apparence des environnements, est la clé des systèmes autonomes réellement opérationnels. Autre avantage majeur : Cosmos peut simuler des scénarios rares ou dangereux, comme des collisions robotiques ou des incidents routiers atypiques, qui sont coûteux et risqués à reproduire en conditions réelles. Nvidia affirme que des tâches d'entraînement qui demandaient auparavant plusieurs mois pourraient désormais être réalisées en quelques jours. La publication de Cosmos 3 en open source s'inscrit dans la stratégie de Nvidia de construire un écosystème ouvert autour de l'IA physique, dans la lignée de sa famille de modèles Nemotron. En rendant le modèle librement adaptable, l'entreprise cherche à accélérer l'adoption industrielle tout en captant les retours du terrain pour orienter ses futures versions. Ce lancement intervient dans un contexte de compétition intense autour des fondations logicielles de la robotique et des véhicules autonomes, secteurs dans lesquels Google, Tesla et plusieurs startups chinoises investissent massivement. En positionnant Cosmos comme l'infrastructure commune de l'IA physique, Nvidia tente de reproduire dans le monde des machines intelligentes le rôle dominant que CUDA joue depuis vingt ans dans le calcul GPU.

UELes laboratoires et entreprises européens de robotique et de conduite autonome peuvent désormais exploiter un modèle de fondation open source de référence pour l'IA physique, réduisant les coûts d'entraînement et la dépendance au cloud.

💬 C'est la comparaison avec CUDA qui dit tout : Nvidia ne veut pas vendre des GPU pour la robotique, il veut être l'infrastructure qu'on ne peut plus éviter. Cosmos 3 en open source, c'est le même coup que PyTorch, tu ouvres pour capter l'écosystème avant de le monétiser. Reste à voir si les labos européens ont vraiment les ressources pour en tirer parti.

RobotiqueActu
1 source
Nvidia dévoile son robot humanoïde Isaac GR00T… et il déchire grave
19Le Big Data 

Nvidia dévoile son robot humanoïde Isaac GR00T… et il déchire grave

Nvidia a présenté le 1er juin 2026, lors du Computex à Taipei, son robot humanoïde de référence baptisé Isaac GR00T Reference Humanoid Robot. Développé en partenariat avec Unitree, spécialiste chinois de la robotique, et Sharpa, entreprise singapourienne experte en mains robotiques, ce système repose sur le corps humanoïde H2 Plus d'Unitree, 1,80 mètre, 68 kilogrammes, 31 degrés de liberté. Les mains tactiles à cinq doigts de Sharpa ajoutent 22 degrés de liberté chacune, portant le total à 75 points d'articulation sur l'ensemble du corps. Chaque bras peut soulever 7 kilogrammes en continu, avec des pics à 15 kilogrammes. Le cerveau du système est le calculateur Jetson Thor, basé sur l'architecture Blackwell de Nvidia, capable de dépasser 2 000 téraflops dédiés à l'IA. Le robot embarque le modèle GR00T 1.7 dès sa sortie de boîte, et une batterie de 0,972 kWh offrirait environ trois heures d'autonomie, selon des sources non confirmées officiellement par Nvidia. L'enjeu de cette annonce dépasse largement le robot lui-même. Nvidia ne vend pas un produit commercial destiné aux entreprises ou aux particuliers, mais une plateforme de référence pour la recherche. L'idée est de fournir aux laboratoires un socle matériel et logiciel unifié, comparable à ce qu'un PC de référence représente pour l'informatique grand public : éviter que chaque équipe perde des mois à assembler et intégrer ses propres composants, pour se concentrer sur ce qui compte, à savoir développer des algorithmes, des comportements et des capacités cognitives. Stanford Robotics Center, ETH Zurich, Ai2 de Seattle et le laboratoire de robotique de l'UC San Diego figurent parmi les premiers partenaires confirmés. La disponibilité pour les développeurs et laboratoires intéressés est prévue d'ici fin 2026. Cette initiative s'inscrit dans une bataille industrielle et géopolitique de grande ampleur autour de la robotique humanoïde. Des acteurs comme Boston Dynamics, Figure, Tesla avec Optimus, ou encore 1X Technologies investissent massivement dans ce domaine, perçu comme le prochain grand marché de l'IA physique. Nvidia, jusqu'ici positionné comme fournisseur de puissance de calcul, tente avec Isaac GR00T de devenir la couche d'infrastructure incontournable de toute la filière robotique mondiale. L'absence notable d'institutions chinoises parmi les premiers partenaires, alors même qu'Unitree est un acteur chinois central du projet, révèle la tension géopolitique qui traverse ce secteur. En standardisant la plateforme de recherche, Nvidia espère non seulement accélérer les progrès scientifiques, mais aussi s'imposer comme le standard de référence avant que ses concurrents ne définissent les leurs.

UEETH Zurich figure parmi les premiers laboratoires partenaires confirmés, ouvrant aux chercheurs européens un accès potentiel à cette plateforme de référence en robotique humanoïde d'ici fin 2026.

💬 Ce qui m'intéresse, c'est pas le robot, c'est le coup qu'essaie de rejouer Nvidia. Imposer une plateforme de référence à la recherche avant que le marché se structure, c'est exactement comme ça que CUDA est devenu incontournable il y a vingt ans. L'absence des labos chinois dans les premiers partenaires alors qu'Unitree est au coeur du hardware, ça dit tout sur où se joue vraiment la bataille.

RobotiqueOpinion
1 source
NVIDIA lance Cosmos 3, Nemotron 3 Ultra et RTX Spark
20Latent Space 

NVIDIA lance Cosmos 3, Nemotron 3 Ultra et RTX Spark

NVIDIA a profité de la semaine du Computex 2026 à Taïwan pour lancer plusieurs modèles ouverts majeurs. Le plus attendu est Cosmos 3, une famille de modèles de monde omnimodaux capables de traiter simultanément le langage, l'image, la vidéo, l'audio et les actions physiques. L'architecture repose sur un mélange de transformeurs (Mixture-of-Transformers) combinant un raisonneur autorégressif et un générateur par diffusion, déclinée en deux versions : Nano (16 milliards de paramètres, deux tours de 8B) et Super (64 milliards, deux tours de 32B). Artificial Analysis a immédiatement classé Cosmos 3 en première position parmi les modèles ouverts sur ses classements Text-to-Image et Image-to-Video. NVIDIA a également annoncé Nemotron 3 Ultra, un modèle de langage de 550 milliards de paramètres dont 55 milliards actifs, salué comme le meilleur modèle ouvert américain à ce jour, capable de générer plus de 300 tokens par seconde selon certaines configurations. Enfin, le RTX Spark, un superchip personnel atteignant 1 pétaflop, a été présenté en partenariat avec Microsoft et OpenClaw. Ces annonces marquent un tournant dans la stratégie ouverte de NVIDIA. En publiant poids, code, jeux de données et recettes de fine-tuning pour Cosmos 3, l'entreprise positionne ses modèles comme une infrastructure commune pour l'IA physique, robotique, véhicules autonomes, simulation industrielle. La Cosmos Coalition, lancée avec des partenaires dont Runway, vise à construire un écosystème ouvert autour de ces modèles de monde. Pour Nemotron 3 Ultra, la communauté a réagi avec un enthousiasme inhabituel : sa densité d'activation, autour de 10 % contre 3 % pour des concurrents comme DeepSeek V4 ou Kimi K2, le rend à la fois plus coûteux à faire tourner, mais potentiellement plus prévisible en comportement, ce qui intéresse les entreprises cherchant de la fiabilité à grande échelle. Ces sorties s'inscrivent dans une semaine particulièrement dense pour les modèles ouverts. MiniMax a simultanément lancé M3, un modèle agent multimodal avec 1 million de tokens de contexte, affichant 59 % sur SWE-Bench Pro et un support immédiat chez Vercel, Cloudflare et Novita. Qwen3.7-Plus et Mellum2 de JetBrains ont également été publiés dans la même fenêtre. NVIDIA cherche à consolider sa domination au-delà du matériel : en proposant des modèles de référence ouverts pour l'IA physique, la société se place au cœur de la chaîne de valeur logicielle, là où Google et Meta se livrent déjà bataille. La convergence entre le RTX Spark, Cosmos 3 et l'écosystème de partenaires suggère une ambition claire : faire du PC local le prochain terrain de déploiement de l'IA agentique.

UELes poids, code et données d'entraînement de Cosmos 3 et Nemotron 3 Ultra étant publiés en open source, les entreprises et laboratoires européens peuvent les adopter sans dépendance à une API propriétaire américaine, ouvrant de nouvelles options pour l'IA physique et les grands modèles de langage.

💬 NVIDIA ne se contente plus de vendre des GPU, il cherche à posséder la pile logicielle de l'IA physique. Cosmos 3 open source avec poids et données, Nemotron Ultra pour la fiabilité en prod, RTX Spark pour le local, c'est une stratégie trop cohérente pour être coïncidence. Google et Meta sont déjà sur ce terrain, sauf qu'eux ne contrôlent pas le silicium en dessous.

LLMsOpinion
1 source
NVIDIA dévoile une plateforme complète pour robots humanoïdes, robotaxis et usines intelligentes
21Interesting Engineering 

NVIDIA dévoile une plateforme complète pour robots humanoïdes, robotaxis et usines intelligentes

Lors du GTC Taipei, NVIDIA a dévoilé une plateforme full-stack destinée aux robots humanoïdes, aux véhicules autonomes et à l'automatisation industrielle. Le cœur de l'annonce est Cosmos 3, un omnimodèle fondational open-source construit sur une architecture mixture-of-transformers, capable de traiter simultanément texte, images, vidéo, son et commandes d'action dans un seul système. Il se décline en Cosmos 3 Super, orienté haute précision pour la robotique et les véhicules autonomes, et Cosmos 3 Nano, optimisé pour l'inférence rapide. NVIDIA lance également l'Isaac GR00T Reference Humanoid Robot, un design de référence intégrant le robot Unitree H2 Plus, les mains articulées Sharpa, le calculateur embarqué Jetson Thor et la pile logicielle GR00T, adopté par Ai2, ETH Zurich, Stanford Robotics Center et UC San Diego. La collaboration avec TSMC porte les bibliothèques CUDA-X dans la fab pour la lithographie computationnelle, la simulation de transistors et l'inspection de plaquettes à l'échelle nanométrique. Alpamayo 2 Super, un modèle de raisonnement à 32 milliards de paramètres, cible quant à lui les applications robotaxi. La cohérence verticale de la plateforme est sa principale valeur ajoutée : NVIDIA prétend désormais couvrir l'intégralité de la chaîne de valeur de l'IA physique, de la génération de données synthétiques à la simulation, jusqu'au déploiement en production. Pour les équipes R&D en robotique humanoïde, GR00T Reference Robot réduit potentiellement plusieurs mois d'intégration hardware/software. Cosmos 3 s'attaque par ailleurs au sim-to-real gap en proposant un world model capable de générer des environnements d'entraînement réalistes, l'un des verrous structurels du secteur. Cela dit, les benchmarks avancés ("meilleur modèle ouvert" sur plusieurs évaluations) émanent de NVIDIA lui-même sans validation tierce, ce qui invite à une lecture prudente. L'intégration dans la fab TSMC est plus tangible : des gains d'efficacité mesurables dans la détection de défauts nanométriques signalent une adoption industrielle réelle, pas seulement un proof-of-concept. NVIDIA construit ce positionnement depuis plusieurs années via Isaac Sim, Omniverse et la famille GR00T N2 présentée en 2025. Sur le marché des humanoïdes, les concurrents directs incluent Figure (Figure 03), Tesla (Optimus Gen 3), Physical Intelligence (Pi-0), Boston Dynamics (Atlas) et Agility Robotics (Digit). Le choix du robot Unitree H2 Plus, acteur chinois concurrent sur le segment humanoïde, comme base matérielle du design de référence NVIDIA est notable. En Europe, Enchanted Tools (Miroki, France) et Wandercraft pourraient tirer parti de Cosmos 3 pour la génération de données d'entraînement, même si aucun partenariat public n'a été annoncé. Les prochaines étapes incluent l'accès des institutions de recherche à GR00T Reference Robot et la disponibilité de Cosmos 3 via NVIDIA NGC ; aucune tarification ni date de commercialisation n'a été communiquée pour l'ensemble de la plateforme.

UEEnchanted Tools et Wandercraft pourraient exploiter Cosmos 3 pour la génération de données d'entraînement, et ETH Zurich figure parmi les partenaires de recherche du GR00T Reference Robot, mais aucun déploiement commercial en Europe n'est confirmé à ce stade.

💬 NVIDIA ne vend plus du silicium, il vend une plateforme verticale, de la simulation jusqu'au robot en prod. Le détail qui m'a accroché : le choix d'Unitree, concurrent chinois direct, comme base matérielle du robot de référence GR00T. C'est soit du pragmatisme pur, soit une façon de dire que l'avantage NVIDIA est dans le software, pas le hardware.

RobotiqueOpinion
1 source
Nvidia mise sur l'IA physique au GTC Taipei : nouveau modèle de monde, cerveau de conduite et robot humanoïde open source
22The Decoder 

Nvidia mise sur l'IA physique au GTC Taipei : nouveau modèle de monde, cerveau de conduite et robot humanoïde open source

Lors du GTC Taipei, Nvidia a dévoilé plusieurs modèles destinés à accélérer son offensive dans l'IA physique. La conférence a été marquée par trois annonces majeures : Cosmos 3, un nouveau modèle de monde (world model) de dernière génération, Alpamayo 2 Super, une version considérablement élargie du modèle de conduite autonome, et une plateforme de référence ouverte pour robots humanoïdes. Ces annonces s'inscrivent dans la stratégie de Jensen Huang de faire de Nvidia le fournisseur incontournable de l'infrastructure pour les systèmes physiques intelligents. Ces outils visent des marchés en pleine explosion : la robotique industrielle, les véhicules autonomes et les systèmes de surveillance vidéo intelligents. Un world model comme Cosmos 3 permet à des robots ou des voitures autonomes de simuler leur environnement et d'anticiper les conséquences de leurs actions, une brique fondamentale pour passer de la démonstration laboratoire au déploiement à grande échelle. La plateforme humanoïde ouverte, quant à elle, vise à standardiser le développement matériel et logiciel pour les constructeurs de robots à deux jambes, réduisant les coûts d'entrée pour les startups du secteur. Nvidia capitalise ici sur sa domination dans les GPU d'entraînement pour étendre son empreinte vers l'inférence embarquée et les systèmes temps-réel. La concurrence s'intensifie avec des acteurs comme Qualcomm et Intel sur les puces pour véhicules autonomes, tandis que des entreprises comme Figure, Boston Dynamics ou 1X Technologies attendent des plateformes logicielles communes pour accélérer leurs développements. GTC Taipei confirme que Nvidia ne veut pas seulement alimenter les data centers de l'IA, il veut aussi être le cerveau des machines qui bougent.

UELes constructeurs automobiles européens (Renault, Stellantis, BMW, Volkswagen) et les startups robotiques européennes pourraient bénéficier de la plateforme humanoïde ouverte pour réduire leurs coûts d'entrée et accélérer leurs développements en robotique industrielle et véhicules autonomes.

RobotiqueOpinion
1 source
Comment Nvidia veut s’emparer du « cerveau » de nos ordinateurs personnels
23La Tribune 

Comment Nvidia veut s’emparer du « cerveau » de nos ordinateurs personnels

Au salon Computex de Taipei, fin mai 2026, Nvidia a présenté RTX Spark, sa première gamme de processeurs conçus pour équiper ordinateurs de bureau et ordinateurs portables sous Windows. Il s'agit d'une rupture nette dans la stratégie du fabricant californien, jusqu'ici centré sur les GPU dédiés : avec RTX Spark, Nvidia s'attaque au marché des processeurs centraux, territoire dominé depuis des décennies par Intel et AMD. La gamme intègre directement des capacités de traitement d'IA au cœur des machines grand public, sans nécessiter de carte graphique additionnelle. L'enjeu est considérable pour l'ensemble de l'industrie PC. En embarquant la puissance de calcul IA dans le processeur principal, Nvidia permet aux fabricants de proposer des machines plus compactes, moins gourmandes en énergie et capables d'exécuter des modèles de langage ou des outils d'IA générative en local, sans dépendre du cloud. Pour les professionnels et les utilisateurs exigeants, cela signifie des traitements plus rapides, plus privés et moins coûteux à long terme. Cette offensive s'inscrit dans une tendance de fond : la bataille pour le contrôle de l'IA dite « edge », c'est-à-dire déployée directement sur l'appareil de l'utilisateur plutôt que sur des serveurs distants. Microsoft pousse activement les PC Copilot+, Qualcomm a pris de l'avance avec ses puces ARM dédiées à l'IA, et Apple intègre depuis plusieurs années ses Neural Engine dans ses Mac. Nvidia, fort de sa domination sur les GPU de data centers, cherche désormais à reproduire ce leadership jusqu'au poste de travail individuel, transformant la définition même de ce qu'est un ordinateur personnel.

UEL'intégration de l'IA directement dans les processeurs grand public pourrait permettre aux entreprises et particuliers européens d'exécuter des modèles d'IA en local, réduisant la dépendance aux clouds américains et facilitant la conformité au RGPD.

💬 Nvidia arrive en retard sur l'IA edge, Qualcomm et Apple ont plusieurs longueurs d'avance depuis 2023. Mais intégrer l'IA dans le processeur principal plutôt que dans une carte graphique séparée à 800€, ça change le calcul pour tous les fabricants PC qui hésitaient à embarquer de l'IA locale. Sur le papier c'est solide, reste à voir ce que ça donne face aux puces ARM de Qualcomm en conditions réelles.

InfrastructureOpinion
1 source
Nvidia sur la touche ? BYD sort sa puce autonome maison et veut reprendre le volant
24Le Big Data 

Nvidia sur la touche ? BYD sort sa puce autonome maison et veut reprendre le volant

Le 28 mai 2026 à Shenzhen, BYD a présenté la Xuanji A3, une puce de conduite autonome conçue entièrement en interne et gravée en 4 nm, une première revendiquée pour l'automobile chinoise. Le composant est annoncé en production de masse et atteint 700 TOPS par unité, soit plus de 2 100 TOPS lorsque trois puces sont combinées dans un même véhicule, avec une bande passante de 273 Go/s, un processeur 16 cœurs cadencé à 420 000 DMIPS et une certification de sécurité ASIL-D. BYD affirme une consommation énergétique inférieure de 20 % aux solutions concurrentes équivalentes. Le groupe revendique plus de 7 000 ingénieurs dédiés aux semi-conducteurs et plus de 100 milliards de yuans investis dans la filière. La puce est conçue pour gérer des niveaux d'autonomie 3 et 4, et sera intégrée au système d'aide à la conduite maison de BYD, baptisé God's Eye. L'enjeu industriel dépasse largement la fiche technique. En développant son propre SoC, BYD cherche à s'affranchir de sa dépendance à Nvidia, dont les puces DRIVE AGX Thor dépassent les 1 000 TOPS INT8 mais restent soumises aux aléas géopolitiques et aux restrictions américaines sur les exportations vers la Chine. Maîtriser la conception de bout en bout permet au constructeur de réduire ses coûts, sécuriser ses approvisionnements et déployer des fonctions avancées sur des modèles d'entrée de gamme : BYD annonce ainsi une option God's Eye B à 12 000 yuans sur certains véhicules accessibles, ainsi qu'une prise en charge des sinistres liés à la navigation urbaine assistée en Chine. Si la promesse tient, cela représenterait un avantage concurrentiel décisif face à Tesla, Toyota ou Volkswagen sur le marché intérieur. Plusieurs zones d'ombre tempèrent toutefois l'annonce. BYD ne précise pas quelle fonderie fabrique effectivement ce 4 nm, un silence lourd de sens dans un secteur où l'accès aux nœuds avancés reste une contrainte géopolitique majeure, notamment depuis les restrictions imposées à SMIC. Les TOPS affichés constituent un repère utile, mais les performances réelles en conduite de nuit, sous la pluie ou dans des intersections complexes ne se mesurent pas en salle de presse. L'Europe n'a reçu aucun calendrier de déploiement, et la conduite autonome y reste étroitement encadrée par des réglementations qui avancent plus lentement que les puces. BYD a posé une pièce forte sur l'échiquier des semi-conducteurs automobiles, mais la validation commerciale et réglementaire de la Xuanji A3 s'écrira sur des milliers de kilomètres, pas sur une scène de keynote.

UEBYD, déjà présent sur le marché européen des véhicules électriques face à Volkswagen et Stellantis, pourrait intégrer cette puce dans ses modèles vendus en Europe, accentuant la pression technologique sur les constructeurs européens, mais aucun calendrier de déploiement n'est annoncé et les réglementations européennes sur la conduite autonome freinent toute adoption à court terme.

RobotiqueOpinion
1 source
IA physique : raisonnement, modèles du monde et d'action avec NVIDIA Cosmos 3
25NVIDIA Developer Blog 

IA physique : raisonnement, modèles du monde et d'action avec NVIDIA Cosmos 3

NVIDIA a annoncé Cosmos 3, un modèle fondamental de frontière dédié à l'IA physique, conçu pour doter les robots, les véhicules autonomes et les espaces intelligents d'une capacité de compréhension du monde réel. L'architecture de Cosmos 3 repose sur trois composantes intégrées : des modèles de raisonnement physique, des modèles de monde et des modèles d'action, permettant à un système de percevoir son environnement, d'anticiper les événements à venir et de produire des séquences d'actions adaptées à une incarnation physique et à une tâche spécifiques. Ce type d'approche unifiant raisonnement, simulation et action au sein d'un seul modèle fondamental représente un changement de paradigme pour les intégrateurs robotiques. Jusqu'ici, ces trois briques étaient souvent développées séparément, ce qui générait des lacunes au niveau du transfert sim-to-real. Un modèle entraîné à raisonner sur la physique du monde avant de planifier l'action offre théoriquement une meilleure généralisation sur des tâches non vues en production, bien que les benchmarks industriels indépendants restent à confirmer. NVIDIA avait introduit la plateforme Cosmos en janvier 2025 au CES, positionnant alors ses modèles génératifs de monde comme infrastructure pour les fabricants de robots et les constructeurs automobiles. Cosmos 3 s'inscrit dans cette trajectoire d'itération rapide, face à une concurrence directe : Google DeepMind avec les modèles Gemini Robotics et RT-2, Physical Intelligence (pi) avec Pi-0, et Figure AI avec ses propres VLA. L'enjeu pour NVIDIA est de s'imposer comme couche d'infrastructure fondamentale de l'IA physique, au-delà du seul matériel GPU.

UENVIDIA Cosmos 3 pourrait devenir une couche d'infrastructure fondamentale adoptée par les intégrateurs robotiques européens (ABB, KUKA, Stäubli), mais l'impact réel dépendra des benchmarks industriels indépendants et des conditions d'accès à la plateforme.

💬 Le vrai pari de NVIDIA avec Cosmos 3, c'est de s'imposer comme couche d'infrastructure logicielle de l'IA physique, au-delà du GPU. Raisonner sur la physique avant de planifier l'action, et unifier les trois briques dans un seul fondamental, c'est exactement ce qui manquait pour réduire les galères de transfert sim-to-real qui plombent les déploiements robotiques depuis des années. Sans benchmarks industriels indépendants, ça reste du déclaratif, mais la direction est la bonne.

RobotiqueOpinion
1 source
NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark
26NVIDIA AI Blog 

NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark

NVIDIA a profité du salon Computex Taipei, lors de sa conférence GTC dédiée, pour annoncer une nouvelle gamme de PC Windows baptisée RTX Spark, spécialement conçue pour faire tourner des agents d'intelligence artificielle en local. Ces machines embarquent 1 pétaflop de puissance de calcul IA et 128 Go de mémoire unifiée, ce qui leur permet de gérer des agents autonomes directement sur l'appareil, sans passer par le cloud. NVIDIA a également présenté la DGX Station pour Windows, un supercalculateur de bureau destiné aux professionnels, intégrant un GPU et un CPU de niveau datacenter dans un format compact. S'ajoutent à ces annonces : le runtime NVIDIA OpenShell pour Windows, le blueprint NemoClaw étendu à toute la gamme RTX et DGX, des gains de performance d'inférence multipliés par deux sur les modèles agentiques via la prédiction multi-token dans llama.cpp et vLLM, ainsi que des outils d'utilisation informatique développés par H Company pour les PC RTX et DGX. Des partenaires comme Adobe, Blender et ComfyUI intègrent également de nouvelles capacités graphiques propulsées par NVIDIA. L'ensemble de ces mises à jour est prévu pour l'automne 2025. Ces annonces marquent un tournant dans la démocratisation des agents IA personnels, jusqu'ici freinée par l'impossibilité de les exécuter de façon sécurisée et privée sur des machines grand public. Avec RTX Spark, NVIDIA veut transformer le PC de l'utilisateur en un véritable assistant autonome capable d'automatiser des tâches complexes, de raisonner sur des flux de travail multi-applications, de générer des contenus visuels et de rechercher sémantiquement dans des fichiers locaux, le tout sans envoyer de données sensibles vers des serveurs distants. Le runtime OpenShell, développé en partenariat avec Microsoft, introduit une couche de sécurité permettant à l'utilisateur de définir précisément ce que les agents peuvent ou ne peuvent pas faire, et de masquer les informations personnelles dans les requêtes envoyées vers des modèles cloud. Ce niveau de contrôle répond à une demande forte des utilisateurs professionnels et des développeurs qui hésitaient à déployer ces technologies faute de garanties suffisantes. L'engouement pour les agents IA en local s'est surtout manifesté jusqu'ici dans les communautés open source : des projets comme OpenClaw et Hermes Agent connaissent une adoption rapide sur GitHub, preuve d'un intérêt technique réel mais encore circonscrit aux initiés. NVIDIA s'appuie sur ce momentum pour structurer un écosystème plus large, en intégrant ces outils dans ses nouvelles primitives de sécurité Windows et en les distribuant via des installateurs simplifiés sur toute sa gamme de matériel. La collaboration avec Microsoft est centrale : les nouvelles primitives de sécurité Windows apportent identité, confinement et politique d'accès pour les agents natifs, tandis qu'NVIDIA comble les lacunes côté performance et confidentialité. Face à l'essor des solutions cloud d'OpenAI, Google ou Anthropic, NVIDIA joue clairement la carte de la souveraineté locale comme différenciateur, en pariant que la prochaine vague d'adoption des agents passera par des appareils personnels puissants et de confiance.

UEH Company, startup française spécialisée en agents IA, voit ses outils d'utilisation informatique intégrés nativement dans l'écosystème NVIDIA RTX et DGX, lui offrant une distribution mondiale sur du matériel grand public.

💬 NVIDIA joue la carte de la souveraineté locale contre le cloud, et c'est plus malin qu'il n'y paraît. OpenShell avec ses politiques d'accès par agent, c'est la réponse à la vraie question des pros : pas la performance, le contrôle. Et H Company en intégration native sur toute la gamme RTX, c'est le genre de deal qui change la trajectoire d'une startup.

Microsoft et Nvidia s'associent pour des PC IA capables d'exécuter de vrais agents autonomes
27The Decoder 

Microsoft et Nvidia s'associent pour des PC IA capables d'exécuter de vrais agents autonomes

Microsoft et Nvidia s'apprêtent à dévoiler conjointement une nouvelle génération d'ordinateurs sous Windows, prévue pour la semaine prochaine lors des conférences Computex et Build. Pour la première fois, Nvidia y imposera ses propres puces en tant que processeur principal, rompant avec le monopole d'Intel et AMD sur ce segment. Les premiers appareils concernés seront des machines Dell ainsi que des modèles de la gamme Surface de Microsoft, confirmant une collaboration industrielle inédite entre les deux géants. Le tournant majeur réside dans le logiciel : Microsoft prépare une nouvelle plateforme logicielle basée sur le framework OpenClaw, conçue pour permettre à des agents IA d'exécuter des tâches directement en local sur les PC Windows. Contrairement aux assistants cloud, ces agents fonctionneraient sans connexion internet, traitant données et automatisations directement sur la machine. Pour les professionnels et entreprises soucieux de confidentialité ou de latence, cela représente un changement de paradigme concret dans l'usage quotidien de l'IA. Cette initiative s'inscrit dans la tentative de Microsoft de relancer sa vision des PC augmentés par l'IA, après l'échec commercial relatif des Copilot+ PC lancés en 2024, dont les fonctionnalités comme Recall avaient suscité plus de controverses que d'enthousiasme. En s'appuyant cette fois sur les puces Nvidia et un cadre d'agents autonomes plus opérationnel, Microsoft cherche à convaincre le marché que l'IA embarquée peut tenir ses promesses de productivité réelle. La bataille pour définir le PC de l'ère agentique ne fait que commencer.

UELes entreprises françaises et européennes, particulièrement sensibles au RGPD, bénéficieront d'agents IA fonctionnant en local sans transfert de données vers le cloud, réduisant les risques de conformité.

💬 Après le fiasco Recall, Microsoft repart avec Nvidia et des agents qui tournent en local, sans connexion. Pour les boîtes coincées entre IA et RGPD, c'est le premier truc qui tient vraiment la route depuis longtemps. Bon, faut quand même que ça tienne en prod, parce que les promesses sur les PC IA, on commence à connaître.

InfrastructureOpinion
1 source
Nvidia mise 150 milliards de dollars sur Taiwan, contrecarrant le plan de Trump pour faire des États-Unis un hub de l'IA
28Ars Technica AI 

Nvidia mise 150 milliards de dollars sur Taiwan, contrecarrant le plan de Trump pour faire des États-Unis un hub de l'IA

Le PDG de Nvidia, Jensen Huang, a annoncé mercredi que son entreprise investirait 150 milliards de dollars par an à Taïwan pour maintenir l'île au cœur de la révolution de l'intelligence artificielle. Cet investissement massif servira notamment à construire un nouveau siège social taïwanais pour Nvidia, dont les travaux débuteront cette année pour une mise en service prévue d'ici 2030. Huang a tenu à souligner l'importance stratégique de Taïwan en déclarant : "C'est d'ici que viennent les puces, les boîtiers, c'est ici que sont fabriqués les systèmes, c'est ici que les supercalculateurs d'IA ont été créés." L'objectif affiché est de consolider Taïwan comme "le hub mondial de la fabrication technologique pour longtemps". Cette annonce constitue un signal fort sur la dépendance structurelle de l'industrie de l'IA à l'égard de Taïwan, en contradiction directe avec les ambitions de l'administration Trump de rapatrier la production technologique sur le sol américain. Nvidia, dont les puces sont le carburant indispensable des grands modèles d'IA, ancre ainsi ses chaînes d'approvisionnement à Taïwan plutôt que de les relocaliser aux États-Unis. Pour les acteurs du secteur, cela confirme que malgré les pressions politiques et les milliards investis dans des usines américaines comme celles de TSMC en Arizona, Taïwan conserve un avantage industriel et logistique impossible à reproduire rapidement ailleurs. Ce repositionnement de Nvidia s'inscrit dans un contexte de tensions géopolitiques croissantes autour de Taïwan, sur fond de concurrence technologique entre les États-Unis et la Chine. L'écosystème de fabrication taïwanais, dominé par TSMC mais aussi par des centaines de sous-traitants spécialisés, représente des décennies d'expertise accumulée que ni les États-Unis ni l'Europe ne peuvent égaler à court terme. En misant publiquement et massivement sur Taïwan, Huang envoie un message clair aux investisseurs et aux gouvernements : le discours de souveraineté technologique occidentale se heurte encore à des réalités industrielles qui ne se décrètent pas.

UEL'investissement massif de Nvidia à Taïwan confirme que l'Europe ne peut pas reproduire à court terme l'écosystème de fabrication de puces asiatique, fragilisant les ambitions de souveraineté technologique européenne.

💬 150 milliards par an à Taïwan, c'est Jensen Huang qui dit à Trump de garder ses discours de rapatriement pour lui. L'écosystème taïwanais, c'est 40 ans d'expertise et des centaines de sous-traitants spécialisés qu'on ne clone pas avec quelques usines en Arizona, peu importe le montant des subventions. C'est le genre de réalité qu'on préfère ne pas dire trop fort, mais Huang vient de l'écrire en gros.

InfrastructureOpinion
1 source
La puce Vera de Nvidia, le pari à 200 milliards de dollars que Jensen Huang veut mettre en avant
29AI News 

La puce Vera de Nvidia, le pari à 200 milliards de dollars que Jensen Huang veut mettre en avant

Nvidia a publié mercredi ses résultats du premier trimestre fiscal avec un chiffre d'affaires de 81,62 milliards de dollars, dépassant les 78,86 milliards attendus par les analystes. La guidance pour le deuxième trimestre est fixée à 91 milliards, là encore au-dessus des 86,84 milliards anticipés par Wall Street. Mais lors de la conférence avec les analystes, le PDG Jensen Huang a mis en avant un élément stratégique souvent éclipsé par les chiffres trimestriels : le processeur Vera. Huang estime que cette puce CPU ouvre un marché adressable de 200 milliards de dollars, entièrement distinct du marché d'un billion de dollars déjà projeté pour les GPU Blackwell et Rubin entre 2025 et 2027. Il prévoit que les revenus issus de Vera atteindront 20 milliards de dollars d'ici la fin de l'exercice fiscal en cours, ce qui en ferait le deuxième poste de revenus de l'entreprise. La plateforme complète Vera Rubin, combinant le CPU Vera avec les GPU Rubin, doit être lancée plus tard cette année. La mise sur Vera répond à une menace structurelle sur le segment de l'inférence. Google, Amazon et Microsoft devraient investir collectivement plus de 700 milliards de dollars dans l'infrastructure IA cette année, contre environ 400 milliards en 2025, mais développent simultanément leurs propres puces maison pour faire tourner les modèles d'IA à grande échelle. Les TPU de Google, Trainium d'Amazon, ainsi que les offres d'Intel et AMD positionnent désormais sérieusement leurs processeurs sur l'inférence, le maillon où la domination GPU de Nvidia est la plus exposée. Entraîner de grands modèles reste le terrain de chasse exclusif de Nvidia, mais générer des réponses en temps réel et à l'échelle, c'est là que la concurrence fait son chemin. La puce Vera a été développée en partie grâce à une technologie issue de Groq, une startup spécialisée dans l'inférence, dans le cadre d'un accord de licence estimé à environ 17 milliards de dollars. L'enjeu immédiat reste l'approvisionnement. Huang a reconnu sans détour que Nvidia sera probablement en tension sur les stocks durant toute la durée de vie de la plateforme Vera Rubin. Pour anticiper, les engagements d'approvisionnement de l'entreprise ont bondi à 119 milliards de dollars au premier trimestre, contre 95,2 milliards le trimestre précédent. Nvidia a également annoncé un programme de rachat d'actions de 80 milliards de dollars et relevé son dividende trimestriel de 1 centime à 25 cents par action. Malgré ces signaux de confiance, le titre a reculé de 1,6 % en after-hours : les analystes estiment que les performances record sont désormais intégrées dans le cours. La vraie question est de savoir si Nvidia peut convaincre que la dynamique de dépenses en IA restera solide jusqu'en 2027 et 2028, dans un contexte où les géants du cloud bâtissent activement des alternatives à ses GPU.

UELes entreprises européennes et data centers qui dépendent des GPU Nvidia pour leurs infrastructures IA pourraient être confrontés à des tensions d'approvisionnement prolongées sur la plateforme Vera Rubin, avec un impact potentiel sur les coûts et délais de déploiement.

💬 Le chiffre qui compte vraiment, c'est pas les 81 milliards de revenus. C'est que Google, Amazon et Microsoft vont dépenser 700 milliards en infra IA cette année, en bonne partie pour construire leurs propres puces et sortir de la dépendance Nvidia sur l'inférence. Vera, c'est Jensen qui joue défensif avant que les dégâts arrivent, et c'est ça que les résultats record font oublier.

La technologie de tatouage numérique SynthID de Google adoptée par OpenAI, Nvidia et d'autres
30Ars Technica AI 

La technologie de tatouage numérique SynthID de Google adoptée par OpenAI, Nvidia et d'autres

Google a annoncé que sa technologie de marquage SynthID, développée pour identifier les contenus générés par intelligence artificielle, est désormais adoptée par des acteurs majeurs du secteur, dont OpenAI et Nvidia. Lancée il y a trois ans, SynthID a déjà permis de labelliser 100 milliards d'images et de vidéos, ainsi que l'équivalent de 60 000 ans d'audio. Ce déploiement massif s'accélère avec l'ouverture de la technologie à des partenaires extérieurs à Google. Parallèlement, Google renforce son engagement envers le standard C2PA, une norme qui intègre des métadonnées dans les fichiers pour décrire leur mode de création. Les smartphones Pixel 10 sont les premiers à embarquer C2PA nativement : chaque photo prise avec l'appareil contient des informations sur son traitement, et les images comportant des éléments génératifs sont automatiquement taguées. Cette fonctionnalité sera étendue aux vidéos des Pixel 8, 9 et 10 dans les prochaines semaines. L'enjeu est considérable à une époque où les deepfakes et les contenus synthétiques atteignent un niveau de réalisme qui rend leur détection impossible à l'œil nu. Là où l'on repérait autrefois facilement une IA aux doigts en trop sur une image, les générateurs actuels produisent des visuels indiscernables du réel. SynthID répond à ce problème en inscrivant un filigrane numérique imperceptible directement dans le contenu, sans dégrader sa qualité. L'adoption par OpenAI et Nvidia élargit significativement la portée de cette solution, couvrant potentiellement une part croissante des contenus IA produits à l'échelle mondiale. Google intègre également ces capacités dans ses propres produits : Gemini sera bientôt capable d'analyser la provenance d'un fichier en s'appuyant sur les métadonnées C2PA, et cette même fonctionnalité arrivera dans Chrome et Google Search dans quelques mois. Cette stratégie à deux niveaux, SynthID pour le marquage invisible, C2PA pour les métadonnées explicites, positionne Google comme un acteur central dans la bataille pour la traçabilité des contenus à l'ère de l'IA générative, un sujet qui mobilise régulateurs, plateformes et sociétés civiles autour du monde.

UEL'adoption massive de SynthID et du standard C2PA par les grands acteurs de l'IA facilite la conformité des plateformes européennes aux exigences de traçabilité et de transparence des contenus imposées par l'AI Act.

SécuritéOpinion
1 source
Les puces IA d'Amazon commencent à séduire les développeurs face à Nvidia
31The Information AI 

Les puces IA d'Amazon commencent à séduire les développeurs face à Nvidia

Les puces Trainium d'Amazon commencent à séduire les développeurs d'intelligence artificielle, marquant une étape importante dans la stratégie du géant du cloud pour concurrencer Nvidia. Anthropic et OpenAI, qui ont conclu des accords d'investissement et d'infrastructure de plusieurs milliards de dollars avec Amazon, se sont déjà engagés à louer de grandes quantités de capacité Trainium, aussi bien les générations actuelles que futures. Des améliorations logicielles récentes ont en outre convaincu une demi-douzaine de développeurs plus modestes, selon des personnes qui utilisent ou travaillent avec ces puces, d'envisager de transférer davantage de leurs charges de travail vers cette architecture propriétaire d'AWS. Ce changement de perception est significatif pour l'industrie. Nvidia contrôle aujourd'hui plus de 80 % du marché des puces d'entraînement d'IA, ce qui lui confère un pouvoir de fixation des prix considérable. Si Amazon parvient à convaincre même une fraction des développeurs de basculer vers Trainium, cela pourrait réduire la dépendance structurelle de l'écosystème IA envers un seul fournisseur et faire pression sur les marges exceptionnelles de Nvidia. Amazon développe ses propres siliciums depuis plusieurs années, après le rachat d'Annapurna Labs en 2015. La stratégie repose sur l'intégration verticale : proposer des puces optimisées pour les services AWS, avec des prix potentiellement inférieurs à ceux des GPU H100 et H200 de Nvidia. L'adhésion d'acteurs aussi stratégiques qu'Anthropic, dans lequel Amazon a investi plus de 4 milliards de dollars, constitue à la fois une validation technique et un levier commercial pour attirer d'autres clients vers l'écosystème Trainium.

UELes développeurs et entreprises européennes hébergés sur AWS pourraient bénéficier d'une alternative moins coûteuse aux GPU Nvidia si l'adoption de Trainium se généralise, réduisant la dépendance structurelle de l'écosystème IA à un unique fournisseur de silicium.

💬 Quand Anthropic et OpenAI "adoptent" Trainium, faut garder en tête qu'Amazon leur a mis des milliards sur la table, donc c'est une validation arrangée autant que technique. Ce qui compte vraiment, c'est la demi-douzaine de développeurs indépendants qui commencent à y basculer des workloads pour des raisons de coût, sans deal en arrière-plan. C'est ce signal-là qui a du poids.

InfrastructureOpinion
1 source
L'accord Nvidia H200 avec la Chine a survécu au sommet Trump-Xi, mais pas comme prévu
32AI News 

L'accord Nvidia H200 avec la Chine a survécu au sommet Trump-Xi, mais pas comme prévu

Donald Trump s'est rendu à Pékin en mai 2026, accompagné à la dernière minute de Jensen Huang, PDG de Nvidia, et en est reparti en déclarant que "quelque chose pourrait se passer" sur les exportations de puces. Rien ne s'est passé. Pas un seul H200 de Nvidia n'a été livré en Chine depuis que Trump a autorisé ces ventes en décembre 2025. Le représentant américain au commerce, Jamieson Greer, a confirmé à Bloomberg que les contrôles sur les semi-conducteurs n'étaient même pas à l'ordre du jour bilatéral. En réalité, les licences d'exportation existent déjà : une dizaine d'entreprises chinoises, dont Alibaba, Tencent, ByteDance et JD.com, disposent chacune d'autorisations américaines pour jusqu'à 75 000 unités, avec Lenovo et Foxconn comme distributeurs agréés. Les puces ne bougent pas parce que c'est Pékin qui bloque ses propres entreprises. Le blocage repose sur une contradiction réglementaire structurelle. Les règles américaines exigent que les H200 exportés vers des clients chinois soient déployés uniquement sur le territoire chinois. Pékin, de son côté, a ordonné à ses grandes entreprises tech de réserver leurs achats de puces Nvidia à leurs opérations à l'étranger, tout en soutenant les fournisseurs domestiques. Les deux exigences s'excluent mutuellement : les puces autorisées à l'export ne peuvent légalement être déployées là où Pékin veut les déployer. Ce n'est pas une impasse accidentelle. Le secrétaire au Commerce Howard Lutnick a déclaré devant le Sénat que les firmes chinoises cherchent délibérément à concentrer leurs investissements sur les fournisseurs locaux, au premier rang desquels Huawei. Le Conseil d'État chinois a par ailleurs lancé une revue de la sécurité des chaînes d'approvisionnement visant à réduire la dépendance aux semi-conducteurs américains. Pendant que les diplomates négociaient, les données les plus significatives venaient d'ailleurs. DeepSeek a confirmé que son dernier modèle avait été optimisé pour tourner sur les processeurs Huawei. Le directeur stratégique de Tencent a annoncé que l'offre chinoise en GPU augmenterait progressivement tout au long de 2026, et Alibaba a confirmé que ses GPU propriétaires T-Head étaient désormais en production de masse. En avril, DeepSeek V4 était devenu le premier grand modèle frontier chinois adapté aux puces Ascend de Huawei dès la phase d'entraînement, et non plus seulement pour l'inférence. Le signal est clair : la substitution n'est plus expérimentale, elle est devenue une politique industrielle. Les revenus de Nvidia en Chine sont tombés à environ 5 % ces derniers trimestres, contre plus de 20 % avant le durcissement des contrôles à l'export, et la société anticipe désormais zéro revenu chinois pour le trimestre en cours. La présence de Huang à Pékin illustrait l'urgence ressentie par Nvidia ; son résultat illustre les limites de la diplomatie de PDG face à un blocage structurel.

UEL'impasse sino-américaine sur les GPU Nvidia accélère la montée en puissance d'alternatives chinoises (Huawei Ascend) et rappelle à l'Europe sa propre dépendance aux chaînes d'approvisionnement américaines, renforçant l'urgence de l'European Chips Act.

💬 Jensen Huang à Pékin avec Trump, et au final zéro H200 livré : la mise en scène était parfaite, le résultat nul. Ce qui est frappant, c'est que le blocage ne vient pas de Washington cette fois, ce sont les Chinois eux-mêmes qui freinent leurs propres entreprises pour les forcer vers Huawei. Pendant ce temps, DeepSeek optimisait sur Ascend et Alibaba lançait ses GPU en masse : la substitution n'est plus un plan B, c'est le plan A.

InfrastructureOpinion
1 source
OpenAI crée un protocole réseau avec AMD, Broadcom, Intel, Microsoft et NVIDIA pour résoudre les goulets d'étranglement des supercalculateurs IA
33The Decoder 

OpenAI crée un protocole réseau avec AMD, Broadcom, Intel, Microsoft et NVIDIA pour résoudre les goulets d'étranglement des supercalculateurs IA

OpenAI a annoncé la mise au point du protocole réseau MRC en collaboration avec AMD, Broadcom, Intel, Microsoft et NVIDIA. Ce protocole open source permet de transmettre des données simultanément sur des centaines de chemins entre les GPU, là où les architectures traditionnelles n'en empruntent qu'un à la fois. Là où les infrastructures classiques nécessitent trois ou quatre couches de commutateurs réseau pour relier des dizaines de milliers de puces, MRC n'en requiert que deux pour interconnecter plus de 100 000 GPU. Le protocole est déjà opérationnel sur le supercalculateur Stargate d'OpenAI. Cette simplification de l'architecture réseau a des conséquences directes sur les coûts et la consommation d'énergie des centres de données d'IA. Supprimer une à deux couches de commutateurs représente une économie substantielle en matériel, en câblage et en électricité, à une époque où les dépenses en infrastructure IA atteignent des dizaines de milliards de dollars par an. Pour les opérateurs de supercalculateurs, cette approche permet d'atteindre des échelles inédites tout en maîtrisant la facture énergétique, un enjeu majeur alors que la consommation des data centers est de plus en plus scrutée. Le projet Stargate, dont les investissements annoncés dépassent 500 milliards de dollars sur plusieurs années, illustre l'ambition d'OpenAI de bâtir sa propre infrastructure de calcul à très grande échelle. La création d'un protocole open source, développé en consortium avec les principaux fabricants de semi-conducteurs et Microsoft, signale une volonté de standardiser les communications entre GPU à l'échelle des supercalculateurs modernes. En ouvrant MRC, OpenAI mise sur une adoption large qui pourrait en faire un standard de fait pour l'industrie.

UELe protocole MRC pourrait réduire la consommation énergétique des supercalculateurs IA, un enjeu directement encadré par la réglementation européenne sur l'efficacité énergétique des centres de données.

💬 Enlever une à deux couches de commutateurs sur 100 000 GPU, ça veut dire des centaines de millions en matériel et en électricité économisés, pas un détail à cette échelle. Ce qui me frappe, c'est qu'OpenAI ouvre le protocole en consortium avec AMD, Broadcom, Intel et NVIDIA, plutôt que de le garder propriétaire. La stratégie est lisible : faire de MRC un standard de fait avant que quelqu'un d'autre s'y colle.

InfrastructureOpinion
1 source
Google TPU v8 : la puce IA qui défie NVIDIA Blackwell
34Le Big Data 

Google TPU v8 : la puce IA qui défie NVIDIA Blackwell

Google a officiellement présenté sa huitième génération de puces TPU le 22 avril 2026 lors du Google Cloud Next 2026, en introduisant pour la première fois une architecture scindée en deux variantes distinctes. La TPU v8t, baptisée "Sunfish", est dédiée à l'entraînement des modèles et affiche une puissance brute de 12,6 pétaflops en précision FP4, avec 216 Go de mémoire HBM3e. La TPU v8i, surnommée "Zebrafish", cible l'inférence et embarque 288 Go de mémoire HBM3e ainsi qu'une SRAM trois fois plus dense que la génération précédente, permettant de connecter jusqu'à 1 152 puces simultanément via le réseau Boardfly. Ces deux puces s'appuient sur les frameworks JAX et Pathways pour orchestrer des milliers d'unités comme un seul système cohérent, au sein de configurations appelées Superpods. Cette spécialisation marque une rupture stratégique majeure dans la conception des infrastructures IA. En séparant les charges d'entraînement et d'inférence, Google s'attaque directement au "mur de la mémoire" qui freine les modèles actuels les plus ambitieux. La v8i divise par deux la latence d'exécution par rapport à la génération précédente, ce qui est décisif pour les agents IA qui doivent répondre et agir en temps réel sans délai perceptible. Cette architecture répond directement aux exigences de ce que Google appelle l'"ère agentique", où les modèles ne se contentent plus de générer du texte mais exécutent des tâches complexes de manière autonome. Pour les entreprises clientes du cloud Google, cela se traduit par un coût total de possession potentiellement réduit par rapport aux GPU NVIDIA Blackwell, grâce à une intégration verticale complète entre le matériel, le logiciel et les services cloud. La sortie du TPU v8 s'inscrit dans une course à l'infrastructure qui oppose désormais directement les hyperscalers aux fabricants de puces. NVIDIA domine ce marché avec ses GPU Blackwell, mais Google, comme Amazon avec ses Trainium ou Microsoft avec ses Maia, cherche à réduire sa dépendance aux fournisseurs externes en contrôlant chaque couche de la chaîne. L'intégration verticale totale est devenue l'argument central : maîtriser simultanément le silicium, les frameworks d'entraînement et la plateforme cloud permet de proposer des performances optimisées que des solutions tierces ne peuvent pas répliquer à iso-coût. La prochaine bataille se jouera sur la disponibilité effective de ces puces, leur adoption par les grands laboratoires de recherche, et la capacité de Google à convaincre ses clients enterprise que son écosystème propriétaire est préférable à l'interopérabilité que garantit NVIDIA avec CUDA.

UELes entreprises européennes utilisant Google Cloud pour leurs workloads IA pourraient bénéficier d'une réduction du coût total de possession pour l'entraînement et l'inférence, mais l'impact reste conditionnel à l'adoption de l'écosystème propriétaire Google.

💬 Séparer entraînement et inférence sur deux puces distinctes, c'est la bonne décision. Google a compris que le "mur de la mémoire" n'est pas le même problème selon qu'on entraîne un modèle ou qu'on le fait tourner en prod, et diviser la latence par deux sur la v8i c'est pas rien pour les agents. Reste à convaincre les boîtes d'aller full Google, JAX et tout, face à CUDA et son écosystème de quinze ans.

InfrastructureOpinion
1 source
NVIDIA Nemotron 3 Nano Omni est désormais disponible sur Amazon SageMaker JumpStart
35AWS ML Blog 

NVIDIA Nemotron 3 Nano Omni est désormais disponible sur Amazon SageMaker JumpStart

NVIDIA vient de rendre disponible son modèle Nemotron 3 Nano Omni sur Amazon SageMaker JumpStart, avec une mise en ligne dite "day zero", soit le jour même du lancement officiel. Ce modèle de langage multimodal open source repose sur une architecture hybride Mamba2 Transformer avec Mixture of Experts (MoE), affichant 30 milliards de paramètres au total dont seulement 3 milliards actifs (architecture dite 30B A3B). Il intègre trois composants spécialisés : Nemotron 3 Nano LLM comme colonne vertébrale linguistique, CRADIO v4-H pour l'encodage visuel (images et vidéos), et Parakeet pour la transcription et la compréhension audio. Le modèle accepte des vidéos jusqu'à 2 minutes (256 images maximum), des fichiers audio jusqu'à 1 heure, des images JPEG et PNG, ainsi que du texte sur une fenêtre de contexte de 131 000 tokens. Il prend en charge le raisonnement en chaîne de pensée, les appels d'outils, la sortie JSON et les horodatages au niveau du mot pour la transcription. Disponible en précision FP8 sur SageMaker JumpStart, il est commercialisé sous la licence NVIDIA Open Model Agreement. L'apport concret de Nemotron 3 Nano Omni réside dans sa capacité à traiter vidéo, audio, images et texte en une seule passe d'inférence, là où les architectures actuelles empilent plusieurs modèles distincts pour chaque modalité. Cette fragmentation classique multiplie les allers-retours d'inférence, complique l'orchestration des pipelines, fragmente le contexte entre modalités et fait croître les coûts et les points de défaillance. En fonctionnant comme un sous-agent de perception unifié au sein d'un système d'agents, le modèle offre simultanément vision, ouïe et compréhension textuelle dans une même boucle de raisonnement. Les cas d'usage ciblés incluent les agents de contrôle d'interfaces graphiques, l'analyse documentaire, contrats, états financiers, rapports scientifiques, ainsi que la surveillance audio et vidéo pour le service client ou la recherche. Ce lancement s'inscrit dans une dynamique plus large de convergence des architectures multimodales, où les grands fournisseurs cherchent à réduire la complexité des systèmes agentiques d'entreprise. NVIDIA, historiquement dominant sur le matériel GPU, renforce ici sa présence sur la couche modèle avec une offre ouverte et commercialement exploitable, accessible directement via SageMaker JumpStart, la plateforme de déploiement géré d'Amazon Web Services. Cette disponibilité immédiate dans l'écosystème AWS facilite l'adoption pour les entreprises sans nécessiter de configuration d'infrastructure propre. La tendance vers des modèles unifiés capables de percevoir et raisonner sur plusieurs modalités simultanément devrait s'accélérer, à mesure que les architectures agentiques complexes cherchent à réduire latence, coûts et friction opérationnelle.

NVIDIA Nemotron 3 Nano Omni intègre le raisonnement d'agents multimodaux dans un modèle ouvert et efficace
36NVIDIA Developer Blog 

NVIDIA Nemotron 3 Nano Omni intègre le raisonnement d'agents multimodaux dans un modèle ouvert et efficace

NVIDIA a dévoilé Nemotron-N-Nano-3B-Omni, un modèle multimodal compact capable de traiter simultanément du texte, des images, des vidéos et de l'audio au sein d'une seule architecture unifiée. Conçu pour l'inférence efficace, ce modèle de 3 milliards de paramètres est publié en open weights, ce qui permet à n'importe quel développeur de le télécharger, le modifier et le déployer sans dépendre des serveurs NVIDIA. Il prend en charge le raisonnement agentique, c'est-à-dire la capacité à enchaîner des perceptions et des actions dans une boucle autonome, couvrant aussi bien l'analyse de documents que l'interprétation d'écrans ou la compréhension vocale. L'intérêt principal de ce modèle réside dans sa conception monolithique : là où les systèmes agentiques actuels assemblent des chaînes de modèles spécialisés distincts pour la vision, l'audio et le texte, Nemotron Nano Omni gère l'ensemble dans un seul passage d'inférence. Cela réduit significativement la latence, la complexité d'orchestration et le coût de calcul, tout en maintenant une cohérence contextuelle entre les modalités. Pour les entreprises qui déploient des agents IA en production, c'est une réduction directe de la facture cloud et des points de défaillance. Ce lancement s'inscrit dans la stratégie plus large de NVIDIA de dominer non seulement le matériel GPU, mais aussi la couche logicielle et les modèles fondamentaux pour l'IA d'entreprise. La série Nemotron, qui comprend également des modèles plus grands comme Nemotron-4, vise à offrir des alternatives performantes aux modèles propriétaires d'OpenAI ou d'Anthropic. Avec la montée en puissance des agents autonomes capables d'interagir avec des interfaces graphiques, des fichiers et des flux audio, un modèle omnimodal efficace et ouvert représente une brique stratégique pour la prochaine génération d'assistants et d'automatisations.

UELes développeurs et entreprises européennes peuvent déployer cet agent IA multimodal open weights directement sur leur propre infrastructure, réduisant la dépendance aux API cloud américaines et renforçant la souveraineté numérique.

Un robot humanoïde Nvidia tient un poste de 8 heures en usine Siemens à 60 bacs par heure
37Interesting Engineering 

Un robot humanoïde Nvidia tient un poste de 8 heures en usine Siemens à 60 bacs par heure

En janvier 2026, le robot humanoïde HMND 01 Alpha du startup britannique Humanoid a réalisé un déploiement de deux semaines dans l'usine électronique de Siemens à Erlangen, en Allemagne. Les résultats, annoncés à la Hannover Messe 2026 en partenariat avec Nvidia, ont dépassé tous les objectifs fixés : le robot à roues a opéré en continu pendant plus de huit heures, déplaçant 60 bacs de stockage par heure avec un taux de réussite supérieur à 90 %. Sa mission consistait à saisir des bacs, les transporter à travers l'usine et les déposer sur des convoyeurs aux points de transfert désignés pour les opérateurs humains, dans un environnement de production réel où ses performances avaient un impact direct sur les opérations. Stephan Schlauss, directeur mondial de la motion control chez Siemens, a qualifié l'usine d'Erlangen de "customer zero" : Siemens s'est volontairement positionné comme premier client payant et validateur de la technologie, avant de la proposer à d'autres industriels. Ce déploiement est significatif parce qu'il franchit la frontière entre démonstration contrôlée et production industrielle réelle. Le robot a travaillé aux côtés d'humains et de systèmes automatisés existants, coordonnant ses actions en temps réel avec des véhicules à guidage autonome et les systèmes de l'usine via la plateforme Siemens Xcelerator, qui a fourni des capacités de jumeau numérique, de perception par IA, d'interfaces PLC-robot et de gestion de flotte. C'est précisément ce niveau d'intégration enterprise qui distingue un vrai déploiement industriel d'une simple preuve de concept. Deepu Talla, vice-président robotique et edge AI chez Nvidia, a affirmé que ce déploiement ouvre la voie aux robots humanoïdes pour atteindre des objectifs de production réels sur des lignes actives. Humanoid, fondée en 2024 par Artem Sokolov et dont le siège est à Londres avec des bureaux à Boston et Vancouver, emploie plus de 200 ingénieurs issus d'Apple, Tesla, Google et Boston Dynamics. L'entreprise a développé le HMND 01 Alpha en environ sept mois, là où le cycle habituel dépasse 18 à 24 mois, grâce à une approche "simulation d'abord" utilisant Nvidia Isaac Lab pour l'apprentissage par renforcement et Nvidia Isaac Sim pour la validation virtuelle avant tout déploiement physique. La version bipède du robot dispose de 29 degrés de liberté et d'une suite complète de capteurs. Siemens et Humanoid présentent le déploiement d'Erlangen non comme une expérimentation isolée mais comme une architecture de référence reproductible par d'autres fabricants, dans un contexte où la pénurie de main-d'oeuvre dans l'industrie manufacturière et les contraintes de flexibilité rendent les lignes entièrement automatisées souvent inadaptées.

UEL'usine Siemens d'Erlangen (Allemagne) est positionnée comme architecture de référence reproductible pour les industriels européens confrontés à la pénurie de main-d'œuvre manufacturière.

💬 60 bacs par heure, 8 heures sans s'arrêter, en production réelle, pas dans un labo avec les caméras bien placées. Le positionnement de Siemens en "customer zero" dit tout : ils testent sur leur propre usine avant de revendre l'architecture à leurs clients industriels, c'est une stratégie commerciale autant qu'une validation technique. Sept mois de dev au lieu de deux ans grâce à la simulation, bon, faut confirmer ça sur 50 usines et pas une.

RobotiqueOpinion
1 source
38Le Big Data 

NVIDIA Vera : quand le CPU devient le cerveau de l’IA autonome

Le 16 mars 2026, lors de la conférence GTC 2026, Jensen Huang a présenté le processeur CPU Vera, une puce conçue spécifiquement pour l'intelligence artificielle agentique. Architecturé autour de la plateforme Olympus, Vera embarque 88 cœurs personnalisés basés sur la technologie ARM Neoverse, une mémoire SOCAMM en LPDDR6 atteignant une bande passante de 1,2 To/s, et une conception monolithique qui réduit la latence interne au minimum physiquement possible. Contrairement aux GPU Blackwell et Rubin qui gèrent le traitement parallèle massif, Vera prend en charge l'exécution séquentielle et logique : la planification, la vérification, l'enchaînement de décisions. Sa capacité à manipuler des contextes de plusieurs millions de tokens en temps réel en fait un composant radicalement différent des processeurs x86 traditionnels, jugés trop lents pour les exigences actuelles de l'IA. L'enjeu est fondamental pour toute entreprise qui cherche à déployer des agents IA dans des workflows réels. Jusqu'ici, les systèmes d'IA buttaient sur le goulot d'étranglement du raisonnement séquentiel : générer du texte rapidement ne suffit pas pour gérer du code complexe, de la logistique ou de la prise de décision multi-étapes. Vera permet à l'IA de passer d'un outil passif à un collaborateur capable d'orchestrer des tâches sur la durée, de corriger ses propres erreurs et d'enchaîner des raisonnements structurés sans latence perceptible. Pour les développeurs et les entreprises, cela ouvre concrètement la voie à des agents autonomes opérationnels dans des environnements de production exigeants, là où les solutions actuelles restent trop fragiles ou trop lentes. Cette annonce s'inscrit dans une accélération que NVIDIA pilote depuis plusieurs années en construisant une pile matérielle complète pour l'IA. Après avoir dominé l'entraînement des modèles avec ses GPU, puis l'inférence avec la gamme Blackwell, l'entreprise complète aujourd'hui l'architecture avec un CPU qui lui est propre, réduisant sa dépendance aux processeurs Intel et AMD pour les charges de travail IA. Le concept rappelle la distinction cognitive entre Système 1 (rapide, instinctif) et Système 2 (analytique, délibéré) : les GPU couvrent le premier, Vera prend en charge le second. Si l'adoption suit, NVIDIA pourrait imposer une architecture propriétaire de bout en bout pour les data centers orientés agents, ce qui renforcerait encore davantage sa position dominante dans l'infrastructure de l'IA mondiale au moment où la course aux systèmes autonomes s'intensifie chez Google, Microsoft et Meta.

UELes opérateurs de data centers européens déployant des agents IA devront évaluer une migration vers cette architecture propriétaire NVIDIA pour contourner les goulots d'étranglement du raisonnement séquentiel.

💬 Le goulot d'étranglement du raisonnement séquentiel, c'est le truc qui fait ramer les agents en prod depuis 2 ans, et Vera s'attaque frontalement à ça. La distinction Système 1/Système 2 appliquée au silicium, c'est bien vu, pas juste du marketing. Le revers, c'est que si t'as besoin de Vera pour que tes agents tournent vraiment, t'achètes le stack NVIDIA complet, de bout en bout, et ils le savent.

InfrastructureOpinion
1 source
Nvidia lance une plateforme d'agents IA pour entreprises avec Adobe, Salesforce et SAP parmi 17 adopteurs à GTC 2026
39VentureBeat AI 

Nvidia lance une plateforme d'agents IA pour entreprises avec Adobe, Salesforce et SAP parmi 17 adopteurs à GTC 2026

Lors de la conférence GTC 2026, Jensen Huang a présenté lundi l'Agent Toolkit de Nvidia, une plateforme open source destinée à la création d'agents d'IA autonomes en entreprise. Dix-sept géants du logiciel ont immédiatement annoncé leur adoption : Adobe, Salesforce, SAP, ServiceNow, Siemens, CrowdStrike, Atlassian, Cadence, Synopsys, IQVIA, Palantir, Box, Cohesity, Dassault Systèmes, Red Hat, Cisco et Amdocs. La plateforme regroupe quatre composants clés : Nemotron, une famille de modèles ouverts optimisés pour le raisonnement agentique ; AI-Q, un blueprint permettant aux agents de percevoir, raisonner et agir sur les données d'entreprise ; OpenShell, un environnement d'exécution open source imposant des garde-fous de sécurité, de réseau et de confidentialité ; et cuOpt, une bibliothèque d'optimisation. Ces agents peuvent traiter des tickets de support client, concevoir des semi-conducteurs, gérer des essais cliniques ou piloter des campagnes marketing, le tout de façon autonome. L'enjeu commercial est considérable. En faisant adopter cette pile logicielle par des entreprises présentes dans pratiquement chaque secteur du Fortune 500, Nvidia ne vend pas directement ses GPU — il conçoit un écosystème logiciel qui les rend indispensables. Le composant AI-Q promet par ailleurs de réduire les coûts de traitement de plus de 50 % en routant les tâches complexes vers des modèles frontier et les tâches de recherche vers les modèles Nemotron moins coûteux. Nvidia revendique également que son agent basé sur AI-Q se classe en tête des benchmarks DeepResearch Bench et DeepResearch Bench II, ce qui, si validé indépendamment, rendrait la plateforme non seulement pratique mais compétitivement incontournable. La confiance des entreprises, obstacle historique au déploiement d'agents autonomes, est adressée via OpenShell, développé en collaboration avec Cisco, CrowdStrike, Google, Microsoft Security et TrendAI. Cette annonce s'inscrit dans une stratégie plus large de Nvidia pour étendre son emprise au-delà du matériel. Jusqu'ici, construire un agent d'IA d'entreprise nécessitait d'assembler des briques disparates — modèle de langage, système de récupération d'information, couche de sécurité, orchestrateur — issues de fournisseurs différents jamais conçus pour fonctionner ensemble. Nvidia résout ce problème de fragmentation en proposant une fondation unifiée, open source dans sa licence mais optimisée pour ses propres puces. La stratégie rappelle celle d'une infrastructure de péage : ouverte à tous, mais dont Nvidia contrôle l'architecture. Alors que les entreprises s'apprêtent à déployer massivement des agents autonomes dans leurs systèmes informatiques, la question n'est plus tant de savoir si elles adopteront ces outils, mais si une alternative crédible à l'écosystème Nvidia pourra émerger avant que la dépendance ne soit totale.

UESAP, Siemens et Dassault Systèmes figurent parmi les 17 premiers adopteurs, exposant les grandes entreprises européennes à une dépendance croissante envers l'écosystème logiciel et matériel de Nvidia pour leurs déploiements d'agents IA.

OutilsOpinion
1 source
NVIDIA et Marvell s’unissent pour révolutionner les infrastructures IA
40Le Big Data 

NVIDIA et Marvell s’unissent pour révolutionner les infrastructures IA

NVIDIA et Marvell Technology ont annoncé un partenariat stratégique majeur, scellé par un investissement de 2 milliards de dollars de NVIDIA dans Marvell. L'accord s'articule autour de NVLink Fusion, une plateforme modulaire permettant de construire des infrastructures d'IA semi-personnalisées. Concrètement, Marvell apportera des XPU (processeurs accélérés sur mesure) et un réseau évolutif compatible, tandis que NVIDIA fournit l'ensemble de son arsenal matériel : processeurs Vera, cartes réseau ConnectX, DPU BlueField, interconnexion NVLink, commutateurs Spectrum-X et capacité de calcul déployable en rack. Le titre Marvell a bondi de 11 % dès l'annonce mardi, signe que les marchés ont immédiatement perçu la portée de l'accord. Le partenariat couvre également les réseaux télécoms, via NVIDIA Aerial AI-RAN, avec des ambitions sur la 5G et la future 6G, ainsi que sur des technologies d'interconnexion optique et de photonique sur silicium pour améliorer les performances et réduire la consommation énergétique. Pour les entreprises qui développent leurs propres puces d'accélération, NVLink Fusion ouvre la voie à des architectures hybrides entièrement compatibles avec l'écosystème NVIDIA — GPU, réseau et stockage compris. C'est un changement structurel : jusqu'ici, intégrer des composants tiers dans une infrastructure NVIDIA relevait du casse-tête d'interopérabilité. Désormais, les hyperscalers, opérateurs télécom et acteurs du cloud pourront combiner des XPU Marvell avec la stack NVIDIA sans friction. Pour les utilisateurs finaux, l'impact est indirect mais réel : des modèles d'IA générative plus complexes pourront tourner à moindre latence, ce qui se traduit par des services de recommandation, de création de contenu ou de simulation plus réactifs. Dans les télécoms, l'alliance prépare le terrain pour des réseaux 5G/6G capables de supporter des usages exigeants comme la télémédecine en temps réel ou les véhicules autonomes. Ce rapprochement s'inscrit dans un contexte de demande explosive en capacité de calcul, portée par la généralisation de l'IA générative et l'explosion des volumes de données. Jensen Huang, PDG de NVIDIA, parle lui-même d'une "ère de supercalcul" en cours d'avènement. Face à cette pression, les grandes entreprises technologiques mondiales s'engagent dans une course à la construction de centres de calcul dédiés, et NVIDIA cherche à s'imposer comme la colonne vertébrale incontournable de ces infrastructures. Marvell, de son côté, se repositionne comme fournisseur clé de silicium personnalisé pour l'IA — un marché en pleine effervescence où Amazon, Google et Microsoft développent déjà leurs propres puces. L'investissement de 2 milliards de dollars de NVIDIA dans Marvell est autant un signal industriel qu'une manœuvre défensive : consolider l'écosystème avant que les alternatives ne s'imposent.

UELes opérateurs télécom et fournisseurs cloud européens pourront intégrer des architectures hybrides XPU Marvell / stack NVIDIA sans friction, accélérant leurs déploiements 5G/6G et d'IA générative.

💬 NVIDIA ne se contente plus de vendre des GPU, il construit le système nerveux de toute l'infrastructure IA. NVLink Fusion, c'est le genre de coup qu'on voit venir mais dont on mesure mal l'ampleur : permettre à Marvell (et demain à d'autres) de brancher leurs puces custom directement dans l'écosystème NVIDIA, c'est verrouiller le marché de façon beaucoup plus subtile qu'un simple rachat. Les 2 milliards d'investissement, c'est pas de la philanthropie, c'est de la consolidation défensive avant qu'AMD ou les hyperscalers in-house ne s'imposent.

InfrastructureOpinion
1 source
Mistral réunit 722 millions d’euros pour financer l’achat de 13 800 GPU NVIDIA
41Next INpact 

Mistral réunit 722 millions d’euros pour financer l’achat de 13 800 GPU NVIDIA

Mistral AI a finalisé lundi 30 mars un emprunt de 830 millions de dollars (722 millions d'euros) auprès d'un pool de sept banques pour équiper son datacenter de Bruyères-le-Châtel, au sud de Paris. Cet argent servira à acquérir 13 800 puces GB300 de NVIDIA, les processeurs de dernière génération destinés aux charges d'IA intensives. Une fois déployée, cette infrastructure portera la puissance informatique disponible pour la startup à 44 mégawatts. Le financement mobilise une majorité d'acteurs français — Bpifrance, BNP Paribas, Crédit Agricole CIB, HSBC, La Banque Postale et Natixis — ainsi que la banque japonaise MUFG (groupe Mitsubishi). La mise en service est annoncée pour le deuxième trimestre 2026. Cet investissement positionne Mistral comme le premier opérateur d'infrastructure IA souveraine en Europe capable d'offrir à ses clients institutionnels une puissance de calcul hors de toute juridiction extraterritoriale américaine. C'est l'enjeu central de l'offre Mistral Compute, lancée en juin 2025 et déjà contractualisée avec le ministère des Armées français en janvier 2026. Pour les gouvernements, administrations et grandes entreprises qui cherchent à déployer des modèles IA sans dépendre d'AWS, Azure ou Google Cloud, cette infrastructure représente une alternative concrète et européenne — un argument commercial de poids dans un contexte de tensions géopolitiques et de débats sur la souveraineté numérique. Le projet avait été annoncé en février 2025, avec Eclairion — spécialiste français des datacenters haute densité — comme partenaire de construction. À l'époque, l'intégrateur britannique devenu américain Fluidstack était également associé au projet, mais Bloomberg indique qu'il a depuis réorienté ses investissements vers les États-Unis, laissant le champ plus libre à une configuration franco-française. En décembre 2025, le CEO d'Eclairion évoquait encore un cluster de puces GB200 comme « la plus grosse machine d'IA de France » sur le point d'entrer en production pour Mistral — les cartes semblent avoir été rebattues depuis, avec une transition vers les GB300, génération supérieure. En parallèle, Mistral a annoncé en février 2026 un second investissement de 1,2 milliard d'euros dans un autre projet de datacenter, confirmant une stratégie d'expansion infrastructure qui va bien au-delà du seul développement de modèles de langage. La startup cofondée par Arthur Mensch se construit désormais en fournisseur de cloud souverain à part entière.

UEMistral installe à Bruyères-le-Châtel la première infrastructure IA souveraine d'Europe hors juridiction américaine, déjà contractualisée avec le ministère des Armées français, offrant aux institutions et entreprises européennes une alternative concrète aux hyperscalers américains.

💬 722 millions d'euros de dette pour acheter des GPU, c'est pas anodin comme pari. Bon, sur le papier le timing est parfait : les gouvernements européens cherchent désespérément une sortie des hyperscalers américains, et Mistral vient d'arriver avec 13 800 GB300 et un contrat Armées déjà dans la poche. Ce qui me frappe surtout, c'est le pivot : on parle plus d'une boîte de modèles, mais d'un vrai fournisseur de cloud souverain.

InfrastructureOpinion
1 source
Nvidia Earth-2 : l’IA qui va révolutionner la prédiction météo dans le monde entier
42Le Big Data 

Nvidia Earth-2 : l’IA qui va révolutionner la prédiction météo dans le monde entier

En janvier 2026, Nvidia a lancé Earth-2, une plateforme de jumeau numérique de la Terre utilisant l'IA pour simuler le climat en temps réel, jusqu'à 1000 fois plus rapide que les supercalculateurs traditionnels. Les modèles agrègent des données de satellites, radars et stations météo pour générer des prévisions globales jusqu'à 14 jours en quelques secondes, sur une simple machine équipée de deux GPU RTX Pro 6000. Développée en collaboration avec la NOAA et MITRE, la plateforme sera open source pour démocratiser l'accès aux prévisions avancées, notamment dans les pays en développement.

UELes agences météorologiques européennes comme Météo-France ou l'ECMWF pourraient adopter cette plateforme open source pour améliorer leurs prévisions climatiques à moindre coût infrastructurel.

OutilsActu
1 source
43The Decoder 

Pékin approuve les ventes de la puce H200 de Nvidia, qui prépare une version adaptée au marché chinois de sa puce d'inférence Groq

Pékin a accordé à Nvidia l'autorisation de vendre sa puce IA H200 — la deuxième plus puissante de sa gamme — aux clients chinois, selon Reuters. La production avait été suspendue l'an dernier en raison d'obstacles réglementaires des deux côtés du Pacifique. Parallèlement, Nvidia travaillerait sur une version adaptée au marché chinois de sa puce d'inférence Groq.

UELa réautorisation des puces H200 en Chine modifie l'équilibre géopolitique des semi-conducteurs IA, renforçant la pression sur l'UE pour définir sa propre politique d'exportation de composants stratégiques.

BusinessReglementation
1 source
GTC 2026 : avec le Groq 3 LPX, Nvidia ajoute pour la première fois du matériel d'inférence dédié à sa plateforme
44The Decoder 

GTC 2026 : avec le Groq 3 LPX, Nvidia ajoute pour la première fois du matériel d'inférence dédié à sa plateforme

Lors de la GTC 2026, Nvidia a élargi sa plateforme Vera Rubin — présentée au CES — en y ajoutant pour la première fois des puces dédiées à l'inférence (Groq 3 LPX), des racks CPU personnalisés et une nouvelle architecture de stockage. La société a également annoncé un système d'exploitation dédié à l'inférence, des alliances autour de modèles ouverts et un logiciel de sécurité pour agents IA.

UELes entreprises européennes exploitant des infrastructures Nvidia pour l'inférence IA pourront bénéficier de puces dédiées plus performantes, réduisant potentiellement les coûts et la latence des déploiements de modèles à grande échelle.

OutilsActu
1 source
Nvidia avait finalement besoin de Groq
45The Information AI 

Nvidia avait finalement besoin de Groq

Nvidia a annoncé lors de sa conférence annuelle GTC à San Jose l'intégration de la technologie de la startup Groq dans ses systèmes de puces GPU, notamment pour les tâches d'inférence IA spécialisées comme le codage. C'est une admission implicite mais majeure que les GPU Nvidia seuls ne suffisent pas pour certaines des tâches de calcul IA les plus importantes aujourd'hui. Un revirement notable, étant donné que le PDG Jensen Huang avait tenu des propos plutôt dismissifs sur Groq en janvier dernier.

LLMsOpinion
1 source
[AINews] NVIDIA GTC : Jensen met le paquet sur OpenClaw et Vera CPU et annonce 1 000 milliards de dollars de commandes pour 2027
46Latent Space 

[AINews] NVIDIA GTC : Jensen met le paquet sur OpenClaw et Vera CPU et annonce 1 000 milliards de dollars de commandes pour 2027

Au GTC de NVIDIA, Jensen Huang a présenté les architectures Blackwell et Rubin en forte croissance, dévoilé le CPU Vera, et annoncé un carnet de commandes estimé à 1 000 milliards de dollars pour 2027, tout en lançant NemoClaw comme réponse aux failles de sécurité d'OpenClaw. En parallèle, Moonshot (Kimi) a publié un papier sur les "Attention Residuals" promettant un avantage de calcul de 1,25x avec moins de 2 % de surcoût à l'inférence, validé sur le modèle Kimi Linear 48B, bien que la nouveauté de l'approche soit débattue. Du côté d'OpenAI, Codex dépasse 2 millions d'utilisateurs actifs hebdomadaires (+4x depuis janvier), tandis que GPT-5.4 a atteint 5 000 milliards de tokens par jour et un milliard de dollars de revenus annualisés en une semaine.

UELes laboratoires et entreprises européens déployant des infrastructures IA devront intégrer les nouvelles architectures NVIDIA (Vera CPU, Rubin) dans leur feuille de route hardware, avec des implications budgétaires majeures sur les prochains cycles d'investissement.

LLMsActu
1 source
GTC : ce qu'il faut attendre de la puce Groq de Nvidia
47The Information AI 

GTC : ce qu'il faut attendre de la puce Groq de Nvidia

Nvidia ouvre aujourd'hui sa conférence annuelle GTC à San Jose, Californie, où le PDG Jensen Huang présentera demain sa keynote très attendue du secteur IA. L'annonce majeure attendue est un nouveau système de puces combinant la technologie Nvidia avec celle de Groq, une entreprise de puces indépendante dont Nvidia a acquis la licence pour environ 20 milliards de dollars fin 2024. C'est la première fois que Nvidia intègre le processeur IA d'une autre entreprise directement dans ses racks de serveurs.

OutilsOpinion
1 source
Nvidia s'engouffre dans le vide open source laissé par OpenAI, Meta et Anthropic
48The Decoder 

Nvidia s'engouffre dans le vide open source laissé par OpenAI, Meta et Anthropic

Nvidia prévoit d'investir 26 milliards de dollars sur cinq ans dans des modèles d'IA open-weight, selon un document déposé auprès de la SEC. Cette stratégie répond à la montée en puissance des modèles open-source chinois tout en maintenant les développeurs dans l'écosystème matériel de Nvidia. OpenAI, Meta et Anthropic ayant délaissé ce créneau, Nvidia s'y engouffre pour conserver son influence sur l'ensemble de la chaîne IA.

UEL'investissement massif de Nvidia dans les modèles open-weight menace directement la position de Mistral AI, principale licorne française de l'IA open-source, en introduisant un concurrent aux ressources quasi-illimitées sur ce créneau stratégique.

BusinessActu
1 source
Nvidia va investir 26 milliards de dollars dans des modèles d'IA open-weight, selon des documents officiels
49Wired AI 

Nvidia va investir 26 milliards de dollars dans des modèles d'IA open-weight, selon des documents officiels

Nvidia prévoit d'investir 26 milliards de dollars dans le développement de modèles d'IA open-weight, selon des documents officiels. Cette initiative positionnerait le géant de l'infrastructure IA pour concurrencer directement OpenAI, Anthropic et DeepSeek. Ce pivot stratégique marque une entrée significative de Nvidia dans la course aux modèles de fondation.

UEL'entrée de Nvidia dans le segment des modèles open-weight intensifie la concurrence pour Mistral, acteur français de référence dans ce domaine.

BusinessActu
1 source
Nebius, entreprise cloud IA, reçoit un investissement de 2 milliards de dollars de Nvidia
50The Information AI 

Nebius, entreprise cloud IA, reçoit un investissement de 2 milliards de dollars de Nvidia

Nvidia investit 2 milliards de dollars dans Nebius Group, société cloud IA basée à Amsterdam. Les deux entreprises collaboreront pour construire des centres de données atteignant 5 gigawatts de capacité énergétique d'ici la fin de la décennie.

UENebius Group, acteur cloud IA européen basé à Amsterdam, bénéficie d'un investissement massif de 2 milliards de dollars pour déployer des centres de données à grande échelle, renforçant la capacité d'infrastructure IA souveraine de l'Union Européenne.

BusinessActu
1 source

Suivre NVIDIA en continu

Recevez chaque jour les articles essentiels du sujet. Pas de bruit, pas de spam.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic