InfrastructureFrandroid · 16 mars 2026, 15:11· 1 min de lecture

La prochaine puce de Nvidia serait vraiment différente des autres

Nvidia pourrait marquer un tournant majeur dans sa stratégie de conception de puces. Après des décennies à dominer le marché avec ses GPU (unités de traitement graphique) polyvalentes et massivement parallèles, le géant américain des semi-conducteurs envisagerait de s'éloigner de son architecture historique « tout-en-un » pour proposer une puce radicalement différente.

Ce changement de cap serait significatif pour l'ensemble du secteur. L'approche monolithique de Nvidia, concentrer un maximum de capacités de calcul dans une seule puce, a jusqu'ici fait la force de ses produits, notamment dans le domaine de l'IA générative et de l'entraînement de grands modèles de langage. S'en éloigner suggère que même le leader incontesté du marché cherche à optimiser ses architectures face à des contraintes physiques et économiques croissantes.

Les détails techniques de cette nouvelle puce restent pour l'instant limités, mais l'orientation vers une conception modulaire ou spécialisée, à l'image des approches chiplet adoptées par des concurrents comme AMD ou Intel, pourrait permettre à Nvidia de gagner en flexibilité, en rendement de fabrication et en efficacité énergétique. Ce type d'architecture découplée permet d'assembler des blocs fonctionnels distincts plutôt que de tout intégrer sur un seul die.

Si cette évolution se confirme, elle pourrait redéfinir la feuille de route matérielle de Nvidia pour les prochaines générations de puces dédiées à l'IA, à un moment où la demande en infrastructure de calcul n'a jamais été aussi forte, et où la concurrence d'acteurs comme AMD, Intel ou les divisions silicium de Google, Microsoft et Amazon s'intensifie rapidement.

Dans nos dossiers

NVIDIA AMD Microsoft

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Information AI

Les parts de marché de Nvidia dans les puces d'inférence IA semblent progresser

Nvidia a vu sa part de marché dans les puces d'inférence IA grimper à 74%, contre 66% il y a un an, selon des estimations de The Information fondées sur les déclarations financières de Nvidia et de ses concurrents, ainsi que sur des entretiens avec des analystes spécialisés. Ce bond de huit points s'est produit alors même que plusieurs développeurs d'IA et grands fournisseurs cloud avaient lancé leurs propres puces serveur dans le but explicite de réduire leur dépendance vis-à-vis du géant des semi-conducteurs. Ce résultat contredit les prévisions de nombreux analystes et dirigeants qui anticipaient une érosion progressive de la domination de Nvidia. Les puces alternatives, qu'elles soient conçues par Google, Amazon, Microsoft ou des startups spécialisées, n'ont pas réussi à mordre significativement sur le segment de l'inférence, c'est-à-dire l'exécution des modèles déjà entraînés pour répondre aux requêtes des utilisateurs. C'est pourtant ce segment qui représente l'essentiel de la consommation de calcul en production. La montée en puissance de l'inférence comme principal cas d'usage de l'IA en entreprise place Nvidia dans une position encore plus stratégique qu'elle ne l'était lors du boom de l'entraînement des modèles. Malgré des investissements massifs dans des solutions alternatives, les écosystèmes logiciels de Nvidia, notamment CUDA, continuent de constituer une barrière à l'entrée difficile à franchir. La question n'est plus de savoir si Nvidia peut être délogé, mais à quelle vitesse ses concurrents pourront combler l'écart technologique et logiciel.

UELa domination croissante de Nvidia sur les puces d'inférence renforce la dépendance des acteurs européens du cloud et de l'IA vis-à-vis d'un fournisseur américain, soulevant des enjeux de souveraineté numérique pour l'Europe.

💬 74% de part de marché sur l'inférence, en hausse malgré les puces de Google, Amazon, Microsoft, c'est le genre de stat qui coupe court à pas mal de discours. CUDA ce n'est pas juste un outil, c'est dix ans de bibliothèques, de forums, de code en prod que personne n'a envie de migrer. La vraie dépendance en Europe c'est là, pas dans le matériel.

InfrastructureOpinion

1 source

2The Decoder

Anthropic explorerait la fabrication de puces sur mesure avec Samsung, tout en maintenant l'importance de Nvidia

Anthropic, la startup d'intelligence artificielle fondée par d'anciens ingénieurs d'OpenAI, serait engagée dans des discussions avec le géant sud-coréen Samsung Electronics en vue de la fabrication d'une puce IA sur mesure. Le projet en serait encore à un stade précoce, mais l'entreprise a déjà recruté des ingénieurs spécialisés dans la conception de semi-conducteurs pour le piloter. Cette démarche intervient peu après l'annonce par OpenAI de son propre projet de puce interne, baptisée "Jalapeño", confirmant une tendance de fond chez les grands acteurs de l'IA générative : développer leurs propres composants plutôt que de dépendre exclusivement des fournisseurs traditionnels. Malgré cette diversification vers le silicium propriétaire, Anthropic aurait tenu à préciser que Nvidia demeure un partenaire essentiel et que ses puces continueront de jouer un rôle central dans son infrastructure. Cette initiative illustre la pression croissante que subissent les entreprises d'IA face à l'explosion des coûts d'entraînement et d'exécution de leurs modèles. En s'associant à Samsung, l'un des rares fondeurs capables de produire des puces avancées à grande échelle, Anthropic chercherait à réduire sa dépendance aux GPU Nvidia, dont la demande mondiale dépasse largement l'offre et dont les prix restent élevés. Pour l'industrie, ce mouvement confirme que même les entreprises les mieux financées jugent nécessaire de maîtriser une partie de leur chaîne d'approvisionnement en calcul, un enjeu à la fois stratégique et économique. À terme, des puces sur mesure pourraient permettre à Anthropic d'optimiser ses coûts d'inférence tout en gagnant en indépendance vis-à-vis des cycles de production de Nvidia. Ce virage s'inscrit dans une dynamique plus large où plusieurs géants de la tech, dont Google avec ses puces TPU et Amazon avec ses processeurs Trainium, ont déjà investi massivement dans le silicium propriétaire pour l'IA. OpenAI a ouvert la voie avec Jalapeño, et Anthropic semble vouloir lui emboîter le pas, signe que la course à l'infrastructure devient un facteur de différenciation aussi important que la qualité des modèles eux-mêmes. Le choix de Samsung comme partenaire pourrait aussi refléter une volonté de diversifier les fournisseurs face à la position dominante de TSMC dans la fonderie avancée. Reste à savoir si ce projet aboutira à une puce déployée à grande échelle, et selon quel calendrier, dans un secteur où la demande en puissance de calcul continue de croître à un rythme vertigineux.

InfrastructureActu

1 source

3ZDNET FR

Le marché des serveurs IA change d’ère : Vera Rubin place NVIDIA au centre du jeu

NVIDIA franchit une nouvelle étape dans la transformation du marché des serveurs avec la présentation de l'architecture Vera Rubin lors de la GTC 2026. Cette plateforme redéfinit la manière dont les infrastructures d'IA sont conçues, exploitées et commercialisées, consolidant un peu plus le rôle central du fabricant de Santa Clara dans l'écosystème mondial de l'intelligence artificielle. L'enjeu dépasse la simple course aux performances. En positionnant ses nouvelles infrastructures comme des « usines d'IA », des systèmes intégrés, bout en bout, pensés pour la production à grande échelle, NVIDIA accélère le glissement du secteur vers des architectures propriétaires fortement verticalisées. Pour les acteurs du cloud, des datacenters et des entreprises qui construisent leurs propres capacités de calcul, ce changement de paradigme impose de reconsidérer leurs stratégies d'investissement et d'approvisionnement. L'architecture Vera Rubin succède à la génération Blackwell et s'appuie sur une intégration poussée entre CPU et GPU, optimisée pour les charges de travail d'inférence et d'entraînement à très grande échelle. Le nom rend hommage à l'astronome Vera Rubin, pionnière de la recherche sur la matière noire, une tradition chez NVIDIA de baptiser ses architectures du nom de scientifiques. La plateforme est conçue pour s'intégrer dans les systèmes NVLink et les racks GB300, formant des grappes de calcul denses qui maximisent le débit par watt consommé. Cette annonce intervient dans un contexte de compétition accrue, où AMD, Intel et des acteurs émergents comme Groq ou Cerebras cherchent à rogner les parts de marché de NVIDIA. En proposant une vision d'infrastructure complète plutôt qu'un simple composant, NVIDIA cherche à verrouiller l'écosystème et à s'imposer non plus comme un fournisseur de puces, mais comme l'architecte de référence de l'ère de l'IA industrielle.

InfrastructureOpinion

1 source

4Ars Technica AI

Le prochain chip IA d'Intel sera moins cher et moins énergivore que ceux de Nvidia et AMD

Intel prévoit de commercialiser d'ici la fin 2026 un nouveau processeur d'IA baptisé "Crescent Island", conçu pour concurrencer directement les puces de Nvidia et AMD sur le marché de l'inférence. Kevork Kechichian, directeur du groupe data center d'Intel, a confié au Financial Times que l'entreprise repart "des bases" en proposant un GPU utilisant une mémoire et un système de refroidissement moins coûteux que ceux des solutions rivales. L'objectif affiché est de capitaliser sur le redressement en cours du fabricant américain de semi-conducteurs. "Crescent Island" se concentre sur l'inférence, soit la phase où un utilisateur soumet une requête à un modèle d'IA déjà entraîné, plutôt que sur l'entraînement lui-même, segment encore verrouillé par Nvidia. En misant sur des composants moins onéreux, Intel cherche à proposer une alternative économiquement attractive aux centres de données et aux entreprises qui déploient massivement des services d'IA, sans recourir aux puces haut de gamme H100 ou Blackwell de Nvidia. Un positionnement prix agressif pourrait ouvrir une brèche réelle dans un marché aujourd'hui très concentré. Intel sort d'une période de profonde restructuration, marquée par des retards technologiques et une pression financière intense qui ont fragilisé sa position face à Nvidia et TSMC. Sur le segment de l'inférence, Nvidia détient une part de marché estimée à plus de 80 %, tandis qu'AMD tente de s'y imposer avec ses puces MI300X. Cibler ce créneau avec une offre plus accessible représente pour Intel un pari stratégique cohérent, mais le succès dépendra de la disponibilité réelle des puces et de leur adoption par les grands opérateurs cloud d'ici la fin de l'année.

UELes centres de données et entreprises européens déployant des services d'IA pourraient bénéficier d'une alternative moins coûteuse aux puces Nvidia pour l'inférence d'ici fin 2026.

InfrastructureOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic