NVIDIA au COMPUTEX : les annonces de la GTC Taipei

NVIDIA et Google réduisent les coûts d'inférence en IA

47

1AI News

NVIDIA et Google réduisent les coûts d'inférence en IA

Lors de la conférence Google Cloud Next, Google et NVIDIA ont dévoilé une nouvelle génération d'infrastructure destinée à réduire drastiquement le coût de l'inférence IA à grande échelle. Les deux entreprises ont présenté les instances A5X bare-metal, reposant sur les systèmes rack NVIDIA Vera Rubin NVL72. Cette architecture promet une réduction jusqu'à dix fois du coût d'inférence par token par rapport aux générations précédentes, tout en multipliant par dix le débit de tokens par mégawatt. Pour atteindre ces performances, les instances A5X combinent les SuperNICs NVIDIA ConnectX-9 avec la technologie réseau Google Virgo, permettant de connecter jusqu'à 80 000 GPU NVIDIA Rubin au sein d'un même site, et jusqu'à 960 000 GPU dans un déploiement multi-sites. Mark Lohmeyer, VP et directeur général de l'infrastructure IA chez Google Cloud, a résumé l'enjeu : "La prochaine décennie de l'IA sera façonnée par la capacité des entreprises à faire tourner leurs charges de travail les plus exigeantes sur une infrastructure vraiment intégrée et optimisée pour l'IA." Ces annonces ont un impact direct sur les secteurs fortement réglementés, comme la finance et la santé, qui butent régulièrement sur des contraintes de souveraineté des données. Google et NVIDIA y répondent avec plusieurs initiatives concrètes : les modèles Gemini fonctionnant sur GPU NVIDIA Blackwell et Blackwell Ultra sont désormais disponibles en préversion sur Google Distributed Cloud, ce qui permet aux organisations de garder les modèles frontier entièrement dans leur environnement contrôlé, au plus près de leurs données sensibles. La sécurité est assurée par NVIDIA Confidential Computing, un protocole de chiffrement matériel qui protège les données d'entraînement et les prompts y compris vis-à-vis des opérateurs cloud eux-mêmes. Pour les environnements cloud public multi-tenant, des VM Confidential G4 équipées de GPU NVIDIA RTX PRO 6000 Blackwell sont également introduites en préversion, marquant la première offre de confidential computing cloud pour des GPU Blackwell. Cette collaboration s'inscrit dans une course plus large à l'optimisation de l'inférence, alors que les coûts opérationnels de l'IA générative restent un frein majeur à son adoption industrielle. Au-delà du matériel, le partenariat couvre aussi la couche logicielle : NVIDIA Nemotron 3 Super est désormais disponible sur la Gemini Enterprise Agent Platform, permettant aux développeurs de construire des systèmes agentiques complexes capables de raisonner, planifier et agir en chaîne. L'ensemble de la plateforme NVIDIA sur Google Cloud est optimisé pour les familles de modèles Gemini et Gemma. Avec des clusters dépassant le million de GPU et une ambition affichée de simplifier le déploiement d'IA souveraine, Google et NVIDIA repositionnent l'infrastructure cloud non plus comme un simple fournisseur de puissance de calcul, mais comme un levier stratégique pour les entreprises qui veulent industrialiser l'IA sans sacrifier performance, coût ou conformité réglementaire.

UELes entreprises européennes des secteurs réglementés (finance, santé) disposent désormais d'options d'infrastructure IA souveraine compatibles avec les exigences RGPD, réduisant un frein concret à l'industrialisation de l'IA en Europe.

InfrastructureActu

1 source

NVIDIA GTC : l'Omniverse au service de l'IA physique

47

2NVIDIA AI Blog

NVIDIA GTC : l'Omniverse au service de l'IA physique

Lors de la conférence GTC la semaine dernière, NVIDIA a présenté plusieurs avancées majeures pour ce que l'entreprise appelle l'« ère de l'IA physique » — une phase où robots, véhicules autonomes et usines intelligentes passent de déploiements isolés à des systèmes industriels à grande échelle. Au cœur de ces annonces figurent trois nouveaux modèles de frontière : Cosmos 3 pour la modélisation du monde réel, Isaac GR00T N1.7 dédié aux compétences des robots humanoïdes, et Alpamayo 1.5 pour la conduite autonome. NVIDIA a également lancé deux blueprints open source : le Physical AI Data Factory Blueprint, destiné à produire des données d'entraînement à partir de simulations, et l'Omniverse DSX Blueprint, une architecture de référence pour créer des jumeaux numériques d'usines d'IA complètes. Des partenaires comme FieldAI, Hexagon Robotics, Skild AI et Teradyne Robotics utilisent déjà ces outils, tandis que Microsoft Azure et Nebius sont les premiers clouds à proposer le blueprint en mode clé en main. L'enjeu central de ces annonces est de résoudre un problème structurel de l'IA physique : les données réelles ne suffisent plus. Le monde réel est imprévisible, les cas limites sont innombrables, et les pipelines de collecte restent fragmentés. NVIDIA positionne donc la puissance de calcul elle-même comme une fabrique de données — transformant des scènes simulées en datasets massifs, diversifiés et hautement qualifiés. Pour les développeurs de robots et de véhicules autonomes, cela signifie pouvoir entraîner des modèles sur des millions de situations synthétiques sans dépendre d'une collecte terrain coûteuse. Parallèlement, l'Omniverse DSX Blueprint permet aux opérateurs d'usines d'IA de simuler thermiques, réseaux électriques et charges réseau avant même d'installer le premier serveur — réduisant les délais et les dépassements de budget sur des infrastructures qui coûtent des centaines de millions de dollars. Ces développements s'inscrivent dans une stratégie plus large de NVIDIA pour imposer son écosystème comme couche universelle de l'IA industrielle. Le format OpenUSD — langage de description de scènes 3D initialement développé par Pixar — joue un rôle clé en permettant de convertir des fichiers CAO d'ingénierie en environnements de simulation directement exploitables. Des frameworks open source comme OpenClaw viennent compléter la pile en orchestrant des agents autonomes capables de gérer des workflows complexes sur des machines dédiées. Avec l'intégration de partenaires cloud majeurs et d'une dizaine d'acteurs industriels, NVIDIA consolide une position de plateforme incontournable à un moment où la compétition pour contrôler l'infrastructure de l'IA physique — robots, voitures, usines — s'intensifie face à des concurrents comme Google DeepMind, Boston Dynamics et les constructeurs automobiles investissant massivement dans leurs propres systèmes embarqués.

UELes industriels et startups européens en robotique ou véhicules autonomes peuvent accéder via Microsoft Azure aux blueprints open source NVIDIA pour entraîner des modèles sur données synthétiques, réduisant leur dépendance coûteuse à la collecte terrain.

InfrastructureOpinion

1 source

La France fait progresser l'avenir de l'IA en Europe avec les technologies NVIDIA

52

3NVIDIA AI Blog

La France fait progresser l'avenir de l'IA en Europe avec les technologies NVIDIA

La France accélère son infrastructure d'intelligence artificielle à grande échelle, avec plusieurs annonces majeures dévoilées cette semaine à VivaTech 2026. Mistral, la licorne française de l'IA, a mis en service son premier centre de données à Bruyères-le-Châtel, en région parisienne, équipé de 18 000 systèmes NVIDIA GB200. Ce site de 44 mégawatts constitue la première étape d'un plan visant 200 mégawatts de capacité de calcul répartis à travers l'Europe d'ici 2027. Mistral collabore par ailleurs avec la banque publique Bpifrance, la société d'investissement MGX et NVIDIA pour développer Campus AI, un réseau d'usines d'IA dont l'élément central devrait atteindre 1,4 gigawatt. Bull et Foxconn ont annoncé la production en Europe du supercalculateur NVIDIA Vera Rubin NVL72 : les systèmes seront fabriqués en République tchèque puis assemblés et validés dans l'usine Bull d'Angers. Le fournisseur de cloud Scaleway propose désormais des instances NVIDIA Blackwell B300-SXM, et un consortium de huit entreprises françaises a soumis une candidature pour accueillir une gigafactory européenne de l'IA sur le sol français. Ces investissements positionnent la France comme l'un des pivots de l'infrastructure IA en Europe, dans un contexte de compétition mondiale intense pour la puissance de calcul. Pour les entreprises et développeurs du continent, disposer de ces ressources localement réduit la dépendance aux infrastructures américaines et répond aux exigences de souveraineté et de conformité imposées par la réglementation européenne. L'essor de modèles ouverts, adaptés aux langues et aux cadres juridiques locaux, donne aux organisations publiques et privées la capacité d'inspecter, d'adapter et d'auditer leurs systèmes d'IA. Schneider Electric, associé à NVIDIA pour concevoir des plans de déploiement de centres de données à l'échelle du gigawatt, entend industrialiser ces infrastructures pour répondre à une demande qui ne cesse d'accélérer. Ce déploiement prolonge la dynamique lancée à GTC Paris lors de VivaTech 2025, où la France avait annoncé ses ambitions nationales en matière d'IA. Le programme France 2030, le Sommet pour l'action sur l'IA de 2025 et le sommet Choose France ont depuis mobilisé des milliards d'euros d'engagements d'investissement. Sur scène à VivaTech cette année, des responsables de Gradium, H Company, LINAGORA et Pleias ont débattu du rôle des modèles ouverts dans l'écosystème européen. Pierre-Carl Langlais, directeur technique de Pleias, a résumé l'enjeu : "On passe de la construction d'un modèle isolé à une infrastructure de modèles en continu, où les modèles s'entraînent mutuellement, gèrent les données et valident l'apprentissage par renforcement." L'objectif affiché est que les pratiques de pointe en IA se diffusent à l'ensemble de l'économie européenne, en dehors de toute dépendance exclusive aux acteurs américains.

UELe déploiement de 18 000 systèmes GB200 à Bruyères-le-Châtel et la production du supercalculateur Vera Rubin à Angers réduisent concrètement la dépendance des entreprises et institutions françaises aux infrastructures cloud américaines, en ligne avec les exigences de souveraineté de l'AI Act.

💬 18 000 GB200 à Bruyères-le-Châtel, un supercalculateur assemblé à Angers, Scaleway avec du Blackwell en prod, là on parle d'infrastructure qui existe vraiment. Ce que ça change pour les entreprises européennes, c'est la possibilité de faire tourner des modèles lourds sans passer par un datacenter américain, ce qui n'est pas qu'un argument marketing quand l'AI Act t'impose des audits de tes systèmes. Bon, les gigawatts annoncés pour 2027, on verra si les délais tiennent.

InfrastructureActu

1 source

Le Royaume-Uni concrétise ses ambitions en IA souveraine avec les technologies NVIDIA

44

4NVIDIA AI Blog

Le Royaume-Uni concrétise ses ambitions en IA souveraine avec les technologies NVIDIA

Un an après que Jensen Huang, PDG de NVIDIA, et le Premier ministre britannique Keir Starmer ont pris l'engagement public de faire du Royaume-Uni un « créateur » et non un « consommateur » d'IA lors de la London Tech Week 2025, les premières réalisations concrètes se matérialisent. Le nombre de fournisseurs de cloud prévoyant de déployer des infrastructures IA sur le sol britannique a doublé en douze mois. Nebius va déployer trois nouvelles installations représentant 65 mégawatts à pleine capacité en 2027, CoreWeave s'installe dans les zones de croissance IA du gouvernement, et BT s'est associé à Nscale pour construire des datacenters souverains sur trois de ses sites existants. Au coeur du dispositif se trouve Isambard-AI, le supercalculateur le plus puissant du Royaume-Uni, assemblé autour de 5 400 puces NVIDIA GH200 Grace Hopper et alimenté à 100 % en électricité décarbonée. Le Fonds d'IA souverain du gouvernement s'appuie sur cette infrastructure pour financer des entreprises nationales, dont Ineffable Intelligence, qui développe la prochaine génération d'infrastructure d'apprentissage par renforcement en collaboration directe avec NVIDIA. Quatre startups membres du programme NVIDIA Inception illustrent l'ambition de ce fonds. Cosine développe une plateforme de codage IA souveraine destinée aux secteurs hautement réglementés, services financiers, infrastructures critiques, sécurité nationale, et entraîne via Isambard un grand modèle multimodal de type mixture-of-experts capable de traiter des types de données au-delà du texte et de l'image. Cursive construit des systèmes d'IA auto-apprenants à fenêtres de contexte étendues, capables de fonctionner de façon autonome sur de longues durées, en adoptant le framework NVIDIA Megatron-LM pour l'entraînement distribué. Doubleword, premier laboratoire britannique dédié à l'inférence, optimise l'ensemble de la pile logicielle pour maximiser le rapport qualité-coût : ses premiers résultats sur Isambard montrent des démarrages de modèles 70 fois plus rapides et une compression du cache KV quatre fois supérieure sans perte de qualité. Ce déploiement s'inscrit dans une tendance mondiale où les États cherchent à ne pas dépendre exclusivement d'infrastructures IA contrôlées par des acteurs américains. Pour le Royaume-Uni, la souveraineté numérique est devenue un argument commercial à part entière : les entreprises européennes et britanniques peuvent désormais proposer à leurs clients des garanties de localisation des données et de contrôle national que les géants américains ne peuvent offrir. La montée en puissance de l'écosystème NVIDIA au Royaume-Uni, avec sept autres partenaires cloud en attente de déploiement, signale que Londres entend rivaliser avec Paris, qui a fait d'annonces similaires autour de son propre plan IA. La question qui se pose désormais est de savoir si ces infrastructures souveraines produiront des modèles et des usages capables de concurrencer les grands acteurs américains et chinois, ou si elles resteront cantonnées à des niches réglementaires.

UELe déploiement souverain britannique crée une pression concurrentielle directe sur le plan IA français et offre aux entreprises européennes des garanties de localisation des données que les géants américains ne peuvent proposer.

InfrastructureActu

1 source

NVIDIA GTC Taipei au COMPUTEX : les dernières annonces IA en direct

À lire aussi

NVIDIA et Google réduisent les coûts d'inférence en IA

NVIDIA GTC : l'Omniverse au service de l'IA physique

La France fait progresser l'avenir de l'IA en Europe avec les technologies NVIDIA

Le Royaume-Uni concrétise ses ambitions en IA souveraine avec les technologies NVIDIA