Dossier NVIDIA

296 articles

NVIDIA, l'arsenal de la course IA : Blackwell, Vera Rubin, Vera CPU, partenariats hyperscalers, Omniverse, et la rente CUDA face aux puces Huawei et Trainium.

OpenAI Anthropic Claude Mythos Claude Opus Claude Code GPT-5.5 GPT-5 DeepSeek DeepSeek V4 Gemini Mistral AI Meta IA Tous les dossiers →

1NVIDIA AI Blog LLMsActu

Le GPT-5.5 d'OpenAI propulse Codex sur l'infrastructure NVIDIA, déjà utilisée en interne

OpenAI a déployé GPT-5.5, son dernier modèle frontier, au coeur de Codex, son application de codage agentique. Ce modèle tourne sur les systèmes rack-scale NVIDIA GB200 NVL72, capables de délivrer un coût 35 fois inférieur par million de tokens et un débit 50 fois supérieur par seconde et par mégawatt par rapport à la génération précédente. Plus de 10 000 employés de NVIDIA, répartis dans tous les départements, ingénierie, juridique, marketing, finance, RH, ventes et opérations, utilisent déjà Codex propulsé par GPT-5.5 depuis quelques semaines. Les résultats sont concrets et mesurables : des cycles de débogage qui prenaient des jours se bouclent désormais en quelques heures, et des expérimentations qui nécessitaient des semaines aboutissent en une nuit sur des bases de code complexes et multi-fichiers. Des équipes livrent des fonctionnalités complètes à partir de simples instructions en langage naturel. L'impact dépasse le simple gain de productivité individuel. En rendant l'inférence de modèles frontier économiquement viable à l'échelle de l'entreprise, cette infrastructure change la donne pour toute organisation souhaitant intégrer des agents IA dans ses processus métier. Pour sécuriser ce déploiement, NVIDIA a doté chaque employé d'une machine virtuelle cloud dédiée connectée via SSH, dans laquelle l'agent Codex opère en sandbox avec une politique de rétention zéro donnée. Les agents n'accèdent aux systèmes de production qu'en lecture seule, garantissant auditabilité complète sans exposition des données internes. Jensen Huang, PDG et fondateur de NVIDIA, a incité l'ensemble de ses équipes à adopter l'outil dans un email interne : "Passons à la vitesse de la lumière. Bienvenue dans l'ère de l'IA." Ce lancement s'inscrit dans plus de dix ans de collaboration entre NVIDIA et OpenAI, une relation qui remonte à 2016 lorsque Jensen Huang avait livré en mains propres le premier supercalculateur DGX-1 au siège d'OpenAI à San Francisco. Depuis, les deux entreprises co-développent l'ensemble de la pile IA : NVIDIA était partenaire dès le premier jour pour le lancement du modèle open-weight gpt-oss d'OpenAI, en optimisant les poids du modèle pour TensorRT-LLM et des frameworks comme vLLM et Ollama. OpenAI s'est engagé à déployer plus de 10 gigawatts de systèmes NVIDIA pour sa prochaine infrastructure, mobilisant des millions de GPU pour l'entraînement et l'inférence dans les années à venir. Les deux sociétés sont également partenaires en co-conception matérielle, OpenAI contribuant au roadmap hardware de NVIDIA en échange d'un accès anticipé aux nouvelles architectures, ce qui a abouti à la mise en service commune du premier cluster de 100 000 GPU GB200 NVL72.

Dossier NVIDIA

Le GPT-5.5 d'OpenAI propulse Codex sur l'infrastructure NVIDIA, déjà utilisée en interne

NVIDIA et Google réduisent les coûts d'inférence en IA

Google échappe à la taxe Nvidia grâce à ses nouveaux TPUs

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents

Nvidia Rubin Ultra : le GPU qui transformera les AI Factories en 2027

Un robot humanoïde Nvidia tient un poste de 8 heures en usine Siemens à 60 bacs par heure

Adobe déploie des agents IA autonomes à grande échelle avec NVIDIA et WPP pour booster la créativité

NVIDIA et ses partenaires présentent l'avenir de la fabrication pilotée par l'IA à Hannover Messe 2026

NVIDIA Vera : quand le CPU devient le cerveau de l’IA autonome

Cadence étend ses partenariats en IA et robotique avec Nvidia et Google Cloud

NVIDIA vient de tuer le rendu 3D classique : découvrez Lyra 2.0 !

MIT, NVIDIA et Zhejiang University proposent TriAttention, une compression du cache KV à débit 2,5 fois supérieur

Nvidia vs Meta : qui contrôle vraiment l’IA en 2026 ?

Nebius en discussions pour racheter la startup israélienne AI21 après l'échec des négociations avec Nvidia

TensorWave peut-il dépasser l'avantage concurrentiel de Nvidia ?

Nvidia lance une plateforme d'agents IA pour entreprises avec Adobe, Salesforce et SAP parmi 17 adopteurs à GTC 2026

Google Gemma 4, NVIDIA et OpenClaw s'attaquent au coût des tokens pour les agents IA en local, du RTX au DGX Spark

NVIDIA optimise Gemma 4 pour les agents autonomes locaux, des GPU RTX aux serveurs Spark

NVIDIA et Marvell s’unissent pour révolutionner les infrastructures IA

ThinkLabs AI, soutenue par Nvidia, lève 28 millions de dollars pour répondre à la crise du réseau électrique

Mistral réunit 722 millions d’euros pour financer l’achat de 13 800 GPU NVIDIA

NVIDIA GTC : l'Omniverse au service de l'IA physique

Agents IA : CrowdStrike et NVIDIA accélèrent la cyberdéfense

Le nouveau rack serveur de Nvidia accueillera des puces IA de ses concurrents

Nvidia Earth-2 : l’IA qui va révolutionner la prédiction météo dans le monde entier

NVIDIA publie Nemotron-Cascade 2 : un MoE open source de 30 milliards de paramètres avec 3 milliards actifs, offrant un meilleur raisonnement et de solides capacités agentiques

Nvidia a une stratégie OpenClaw. Et vous ?

Le marché des serveurs IA change d’ère : Vera Rubin place NVIDIA au centre du jeu

NVIDIA veut rendre les agents IA d'entreprise suffisamment sûrs pour être vraiment déployés

OpenClaw est le nouveau ChatGPT selon NVIDIA : mais c’est quoi ?

Pékin approuve les ventes de la puce H200 de Nvidia, qui prépare une version adaptée au marché chinois de sa puce d'inférence Groq

GTC 2026 : IBM et NVIDIA accélèrent l’IA en entreprise avec une nouvelle stratégie

DLSS 5 : la technologie graphique IA de Nvidia est-elle allée trop loin ?

GTC 2026 : avec le Groq 3 LPX, Nvidia ajoute pour la première fois du matériel d'inférence dédié à sa plateforme

Nvidia avait finalement besoin de Groq

GTC met en avant les PC NVIDIA RTX et DGX Sparks pour faire tourner les derniers modèles open source et agents IA en local

[AINews] NVIDIA GTC : Jensen met le paquet sur OpenClaw et Vera CPU et annonce 1 000 milliards de dollars de commandes pour 2027

Nvidia dévoile NemoClaw, son logiciel pour agents IA

Jensen propulse les projections de ventes Blackwell et Vera Rubin de Nvidia dans la stratosphère des 1 000 milliards de dollars

Nvidia dévoile un système de puces basé sur Groq pour accélérer les tâches d'IA comme le codage

GTC 2026 : Nvidia veut remplacer le problème de données en robotique par un problème de calcul

GTC : ce qu'il faut attendre de la puce Groq de Nvidia

Nvidia et son partenaire cloud Nscale en négociations pour acquérir un grand site de data center aux États-Unis avant son introduction en bourse

Nvidia s'engouffre dans le vide open source laissé par OpenAI, Meta et Anthropic

Nvidia et des startups s'affrontent pour rendre OpenClaw plus sûr

Nvidia investit 2 milliards dans Nebius : tout ce qu’il faut savoir

Nvidia arrose de cash ; le président de la FCC défend SpaceX

Nvidia va investir 26 milliards de dollars dans des modèles d'IA open-weight, selon des documents officiels

Nebius, entreprise cloud IA, reçoit un investissement de 2 milliards de dollars de Nvidia

Nvidia prépare apparemment son propre concurrent open source à OpenClaw