InfrastructureNVIDIA AI Blog6sem· 2 min de lecture

Le CPU Vera de NVIDIA s'affirme comme un concurrent redoutable

Les premiers benchmarks publics du processeur Vera de NVIDIA, publiés le 27 mai 2026 par le site spécialisé Phoronix, révèlent des performances qui pourraient redessiner le paysage des processeurs pour centres de données. Le CPU Vera, conçu autour de 88 cœurs personnalisés baptisés Olympus et compatibles avec l'architecture Armv9.2, affiche une bande passante mémoire de 1,2 To/s grâce à un sous-système LPDDR5X de deuxième génération. Le tout dans une enveloppe thermique de 450 watts pour le processeur, avec moins de 30 watts dédiés à la mémoire. Les tests couvrent un large spectre de charges de travail : compilation de code, compression de fichiers, transcodage vidéo, Python, Java et gestion de bases de données. Michael Larabel, fondateur de Phoronix, conclut sans ambages : "C'est la concurrence la plus redoutable jamais vue face aux processeurs Intel et AMD x86_64."

Ces résultats ont une portée directe pour les entreprises qui construisent des infrastructures d'IA agentique, c'est-à-dire des systèmes où des agents autonomes exécutent simultanément du code, interrogent des bases de données et orchestrent des pipelines complexes. Sur le test STREAM TRIAD, Vera soutient 90% de sa bande passante mémoire de pointe, un taux qu'aucun autre processeur testé par Phoronix n'a atteint, tout en délivrant plus de quatre fois la bande passante mémoire par cœur comparé aux CPU x86 traditionnels. La société Prime Intellect a confirmé, dans des tests séparés, que Vera maintient une bande passante élevée et une latence mémoire faible et stable à mesure que le nombre de processus parallèles augmente. Pour les opérateurs d'infrastructures IA, cela se traduit par moins de serveurs nécessaires pour un même volume de travail, et une facture énergétique réduite.

NVIDIA a présenté Vera comme la réponse architecturale au virage vers l'IA agentique, qui impose aux processeurs des contraintes différentes de celles du deep learning classique : moins de calcul matriciel massif, davantage de traitement séquentiel, de branchements conditionnels et d'accès mémoire dispersés. Par rapport au processeur Grace de génération précédente, Vera affiche un gain de 1,6x en moyenne géométrique sur l'ensemble des benchmarks Phoronix, une progression que Larabel qualifie de "constamment au-delà de ce qu'on attend d'une génération à l'autre". Ce lancement intervient dans un contexte où AMD EPYC et Intel Xeon dominent encore les data centers d'entreprise, mais où NVIDIA cherche à imposer ses propres CPU aux côtés de ses GPU dans des plateformes intégrées. La prochaine étape sera de voir si ces performances en benchmark se confirment dans des déploiements de production à grande échelle, notamment dans les grandes fermes d'IA où le coût total par inférence reste le critère ultime.

Impact France/UE

Les opérateurs de centres de données européens pourraient réduire leur consommation énergétique et le nombre de serveurs nécessaires pour leurs charges IA agentique, un avantage concret dans le contexte des objectifs européens de sobriété numérique.

Dans nos dossiers

NVIDIA AMD Agents IA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Le Big Data

NVIDIA Vera : quand le CPU devient le cerveau de l’IA autonome

Le 16 mars 2026, lors de la conférence GTC 2026, Jensen Huang a présenté le processeur CPU Vera, une puce conçue spécifiquement pour l'intelligence artificielle agentique. Architecturé autour de la plateforme Olympus, Vera embarque 88 cœurs personnalisés basés sur la technologie ARM Neoverse, une mémoire SOCAMM en LPDDR6 atteignant une bande passante de 1,2 To/s, et une conception monolithique qui réduit la latence interne au minimum physiquement possible. Contrairement aux GPU Blackwell et Rubin qui gèrent le traitement parallèle massif, Vera prend en charge l'exécution séquentielle et logique : la planification, la vérification, l'enchaînement de décisions. Sa capacité à manipuler des contextes de plusieurs millions de tokens en temps réel en fait un composant radicalement différent des processeurs x86 traditionnels, jugés trop lents pour les exigences actuelles de l'IA. L'enjeu est fondamental pour toute entreprise qui cherche à déployer des agents IA dans des workflows réels. Jusqu'ici, les systèmes d'IA buttaient sur le goulot d'étranglement du raisonnement séquentiel : générer du texte rapidement ne suffit pas pour gérer du code complexe, de la logistique ou de la prise de décision multi-étapes. Vera permet à l'IA de passer d'un outil passif à un collaborateur capable d'orchestrer des tâches sur la durée, de corriger ses propres erreurs et d'enchaîner des raisonnements structurés sans latence perceptible. Pour les développeurs et les entreprises, cela ouvre concrètement la voie à des agents autonomes opérationnels dans des environnements de production exigeants, là où les solutions actuelles restent trop fragiles ou trop lentes. Cette annonce s'inscrit dans une accélération que NVIDIA pilote depuis plusieurs années en construisant une pile matérielle complète pour l'IA. Après avoir dominé l'entraînement des modèles avec ses GPU, puis l'inférence avec la gamme Blackwell, l'entreprise complète aujourd'hui l'architecture avec un CPU qui lui est propre, réduisant sa dépendance aux processeurs Intel et AMD pour les charges de travail IA. Le concept rappelle la distinction cognitive entre Système 1 (rapide, instinctif) et Système 2 (analytique, délibéré) : les GPU couvrent le premier, Vera prend en charge le second. Si l'adoption suit, NVIDIA pourrait imposer une architecture propriétaire de bout en bout pour les data centers orientés agents, ce qui renforcerait encore davantage sa position dominante dans l'infrastructure de l'IA mondiale au moment où la course aux systèmes autonomes s'intensifie chez Google, Microsoft et Meta.

UELes opérateurs de data centers européens déployant des agents IA devront évaluer une migration vers cette architecture propriétaire NVIDIA pour contourner les goulots d'étranglement du raisonnement séquentiel.

💬 Le goulot d'étranglement du raisonnement séquentiel, c'est le truc qui fait ramer les agents en prod depuis 2 ans, et Vera s'attaque frontalement à ça. La distinction Système 1/Système 2 appliquée au silicium, c'est bien vu, pas juste du marketing. Le revers, c'est que si t'as besoin de Vera pour que tes agents tournent vraiment, t'achètes le stack NVIDIA complet, de bout en bout, et ils le savent.

InfrastructureOpinion

1 source

2NVIDIA AI Blog

Le CPU NVIDIA Vera ouvre la voie à l'IA scientifique autonome au laboratoire de Los Alamos

Le laboratoire national de Los Alamos (LANL) va se doter de trois nouveaux supercalculateurs baptisés Mission, Vision et Veritas, construits en partenariat avec HPE et NVIDIA. Ces machines reposeront sur l'architecture HPE Cray Supercomputing GX5000 combinant les processeurs NVIDIA Vera, les GPU NVIDIA Rubin et le réseau InfiniBand Quantum-X800. Mission intégrera des nœuds GPU Vera Rubin et 2 300 processeurs Vera autonomes, tandis que Veritas en comptera environ 1 150, en complément de ses nœuds GPU. Mission et Vision sont attendus opérationnels en 2027 pour succéder au supercalculateur Crossroads sur les charges de travail nationales classifiées et la recherche fondamentale, matériaux, énergie, biomédical, IA. LANL a par ailleurs démontré que le processeur Vera délivre des performances 7 fois supérieures à celles des CPU x86 de Crossroads sur les charges URSA, et plus de 3 fois supérieures sur Branson, un outil de simulation Monte Carlo open source de transfert de chaleur. Ces performances ouvrent la voie à une nouvelle génération d'IA scientifique dite agentique : des systèmes capables de formuler des hypothèses, de sélectionner des outils, de lancer des simulations, d'analyser les résultats et d'affiner leur démarche de façon autonome. Le projet URSA (Universal Research and Scientific Agent), déjà en cours sur le supercalculateur Venado et bientôt déployé sur Mission et Vision, incarne cette ambition. Ce cadre modulaire à boucle de rétroaction aide les chercheurs à planifier des expériences et à interpréter des résultats à une vitesse que les workflows manuels ne permettent pas. Sur le plan matériel, le Vera CPU se distingue par son cœur personnalisé Olympus, sa mémoire LPDDR5 et son fabric intégré rapide : un socket Vera surpasse un socket x86 de plus de 3 fois tout en offrant plus de 4 fois la mémoire par cœur et 6 fois la mémoire par nœud, ce qui accélère directement la cadence des découvertes scientifiques. Ces trois supercalculateurs s'inscrivent dans une collaboration qui remonte à plus d'une décennie entre LANL et NVIDIA, couvrant les générations Grace et désormais Vera, avec une approche de co-design extrême où architectes matériels, développeurs système, scientifiques et mathématiciens appliqués façonnent conjointement les machines à partir de vrais cas d'usage. Veritas, plus petit, servira spécifiquement le programme de recherche interne du laboratoire (LDRD) comme banc d'essai pour les technologies qui alimenteront les systèmes plus grands. Mission deviendra le cinquième système de la série Advanced Technology System du programme Advanced Simulation and Computing de la National Nuclear Security Administration. Ces déploiements font suite à l'installation en 2024 de Venado, basé sur les superchips NVIDIA GH200 Grace Hopper, qui sert aujourd'hui de plateforme de référence pour valider cette nouvelle génération d'infrastructures HPC orientées IA.

InfrastructureActu

1 source

3The Information AI

TensorWave peut-il dépasser l'avantage concurrentiel de Nvidia ?

Nick Tatarchuk, fondateur de la startup TensorWave, a organisé mercredi à San Francisco un événement intitulé Beyond Summit, anciennement appelé Beyond CUDA. Ce changement de nom n'est pas anodin : l'édition précédente, tenue à San Jose en 2025 lors de la conférence GTC de Nvidia, avait attiré des centaines de participants désireux de discuter des alternatives au logiciel de Nvidia. Cette année, des sponsors et participants potentiels ont exprimé des réticences à s'associer à un événement aussi explicitement positionné contre le géant des puces. Tatarchuk lui-même reconnaît cette pression, d'autant que sa salle habituelle à San Jose avait été réservée pour plusieurs années... par Nvidia. L'événement réunit des startups qui développent des compilateurs, des noyaux et des couches d'optimisation pour concurrencer l'écosystème logiciel de Nvidia, dont plusieurs ont figuré dans les classements Top 50 Startups de 2024 et 2025. L'enjeu central est CUDA, la plateforme logicielle de Nvidia considérée comme son véritable fossé concurrentiel : elle simplifie radicalement l'utilisation du matériel Nvidia pour l'entraînement et l'inférence de modèles d'IA. Mais ce monopole commence à se fissurer. OpenAI et Meta ont récemment annoncé des accords importants avec AMD, rival direct de Nvidia, pour utiliser ses puces dans leurs infrastructures d'IA. Tatarchuk affirme que des laboratoires d'IA commencent désormais à réaliser des entraînements à grande échelle sur du matériel AMD, une pratique qui était à peine évoquée publiquement il y a encore peu. Pour la première fois depuis des années, des clients seraient prêts à envisager sérieusement des alternatives à CUDA, estime-t-il : "Il y a tellement d'entreprises sophistiquées qui n'ont pas besoin de CUDA." Ce mouvement s'inscrit dans un contexte de transformation profonde de l'industrie du calcul pour l'IA. La domination de Nvidia, dont les GPU représentent l'essentiel du marché de l'entraînement des grands modèles, est contestée à la fois par des fabricants de puces alternatifs et par un écosystème logiciel naissant. En parallèle, une autre initiative illustre l'effervescence du secteur : à l'université Stanford, un cours universitaire de premier cycle sur l'infrastructure IA est devenu un événement majeur, surnommé le "Compute Coachella". Le cours, complet, réunit cette semaine Jensen Huang (Nvidia), Lisa Su (AMD), Sam Altman (OpenAI), Satya Nadella (Microsoft) et Andrej Karpathy comme intervenants. Il est enseigné par Anjney Midha, ancien associé d'Andreessen Horowitz et investisseur précoce d'Anthropic, et Michael Abbott, ancien responsable ingénierie chez Apple, tous deux impliqués dans AMP, une initiative visant à faciliter l'accès aux ressources de calcul pour les entreprises.

UEL'émergence d'alternatives viables à CUDA pourrait à terme réduire la dépendance des entreprises et laboratoires européens envers Nvidia pour leurs infrastructures d'entraînement IA.

InfrastructureActu

1 source

4NVIDIA AI Blog

Les innovateurs de l'IA adoptent NVIDIA Vera : l'importance du CPU mono-thread maximal à grande échelle

Nvidia vient de présenter Vera, une puce qui inaugure une nouvelle catégorie de processeurs pensée spécifiquement pour l'ère de l'IA agentique : les CPU à performance monofil maximale à grande échelle. Dans le fonctionnement d'un système agentique, le CPU se trouve sur le chemin critique de chaque étape de raisonnement : c'est lui qui exécute les appels d'outils, le code, le traitement des données, la gestion du cache KV et l'analyse des résultats produits par le modèle. Or les processeurs de data center actuels n'ont pas été conçus pour ce rôle. Poussés par l'essor du cloud, les fabricants ont privilégié l'augmentation du nombre de cœurs par puce afin de réduire le coût par cœur louable, au détriment de la vitesse de chaque cœur pris individuellement. Le passage aux architectures en chiplets a aggravé le problème en introduisant ce que Nvidia appelle une "taxe chiplet" : chaque cœur perd l'accès à la pleine bande passante mémoire de la puce. Vera est présentée comme une réponse directe à ces limites, avec une architecture qui privilégie la vitesse par cœur, une bande passante mémoire suffisante par cœur et une latence prévisible. Cette approche change directement l'équation économique des usines à IA. Dans ces infrastructures, le GPU reste la ressource la plus coûteuse et la plus rare : chaque seconde où un GPU attend qu'un CPU termine une tâche annexe (exécution d'un outil, traitement d'une donnée) réduit son taux d'utilisation et, in fine, le revenu généré par l'installation. Pour un agent IA, qui fonctionne en boucle continue (le modèle raisonne, le CPU exécute, le résultat revient, le modèle décide de l'étape suivante), la vitesse d'exécution de chaque étape détermine la cadence de toute la chaîne, puisque chaque action dépend du résultat de la précédente. Ajouter davantage de cœurs augmente le débit global de tâches traitées en parallèle, mais ne réduit en rien le temps nécessaire à l'exécution d'une seule étape dans une seule boucle d'agent : c'est la performance individuelle de chaque cœur, et non leur nombre, qui fixe la vitesse réelle perçue par l'agent. Ce constat marque une rupture avec la trajectoire suivie par l'industrie du semi-conducteur depuis une décennie, où l'optimisation du coût par cœur avait pris le pas sur la performance brute, notamment pour servir des charges de travail traditionnelles, ponctuelles et pilotées par des utilisateurs humains. Les charges agentiques, elles, sont permanentes et massivement parallèles, avec des essaims d'agents qui tournent en continu à travers des chaînes d'étapes interdépendantes. En misant sur Vera, Nvidia cherche à repositionner le CPU comme un composant aussi stratégique que le GPU dans la conception des futures usines à IA, alors que la concurrence entre fabricants de puces pour l'infrastructure agentique s'intensifie.

💬 Nvidia vient de comprendre un truc que tout le monde avait loupé : dans une boucle d'agent, c'est le CPU qui fixe la cadence, pas le GPU. On a passé dix ans à optimiser le coût par cœur pour du cloud classique, et là on découvre que ça pénalise justement les charges agentiques qui tournent en continu. Selon Le Fil IA, la vraie bataille de l'infra IA en 2026 ne se joue plus seulement sur la puissance GPU mais sur la vitesse mono-thread du CPU qui l'alimente.

InfrastructureActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic