Aller au contenu principal
La prochaine puce de Nvidia serait vraiment différente des autres
InfrastructureFrandroid12sem· 1 min de lecture

La prochaine puce de Nvidia serait vraiment différente des autres

Source originale ↗·

Nvidia pourrait marquer un tournant majeur dans sa stratégie de conception de puces. Après des décennies à dominer le marché avec ses GPU (unités de traitement graphique) polyvalentes et massivement parallèles, le géant américain des semi-conducteurs envisagerait de s'éloigner de son architecture historique « tout-en-un » pour proposer une puce radicalement différente.

Ce changement de cap serait significatif pour l'ensemble du secteur. L'approche monolithique de Nvidia — concentrer un maximum de capacités de calcul dans une seule puce — a jusqu'ici fait la force de ses produits, notamment dans le domaine de l'IA générative et de l'entraînement de grands modèles de langage. S'en éloigner suggère que même le leader incontesté du marché cherche à optimiser ses architectures face à des contraintes physiques et économiques croissantes.

Les détails techniques de cette nouvelle puce restent pour l'instant limités, mais l'orientation vers une conception modulaire ou spécialisée — à l'image des approches chiplet adoptées par des concurrents comme AMD ou Intel — pourrait permettre à Nvidia de gagner en flexibilité, en rendement de fabrication et en efficacité énergétique. Ce type d'architecture découplée permet d'assembler des blocs fonctionnels distincts plutôt que de tout intégrer sur un seul die.

Si cette évolution se confirme, elle pourrait redéfinir la feuille de route matérielle de Nvidia pour les prochaines générations de puces dédiées à l'IA, à un moment où la demande en infrastructure de calcul n'a jamais été aussi forte — et où la concurrence d'acteurs comme AMD, Intel ou les divisions silicium de Google, Microsoft et Amazon s'intensifie rapidement.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Le nouveau rack serveur de Nvidia accueillera des puces IA de ses concurrents
1The Information AI 

Le nouveau rack serveur de Nvidia accueillera des puces IA de ses concurrents

Nvidia a dévoilé lors de sa conférence GTC un nouveau rack serveur capable d'héberger aussi bien ses propres puces que celles de ses concurrents. Ces racks intègrent une technologie réseau qui assure une communication rapide et fiable entre les chips. Nvidia transforme ainsi la concurrence en opportunité commerciale en monétisant l'infrastructure même qui fait tourner les puces rivales.

UELes entreprises européennes qui achètent des infrastructures IA pourront bénéficier de racks interopérables, réduisant potentiellement la dépendance à un seul fournisseur de puces.

InfrastructureActu
1 source
2ZDNET FR 

Le marché des serveurs IA change d’ère : Vera Rubin place NVIDIA au centre du jeu

NVIDIA a dévoilé l'architecture Vera Rubin lors de la GTC 2026, marquant un tournant dans le marché des serveurs IA. Cette nouvelle génération positionne NVIDIA au cœur d'une transition vers des infrastructures intégrées, conçues comme de véritables « usines à IA ».

InfrastructureOpinion
1 source
Le prochain chip IA d'Intel sera moins cher et moins énergivore que ceux de Nvidia et AMD
3Ars Technica AI 

Le prochain chip IA d'Intel sera moins cher et moins énergivore que ceux de Nvidia et AMD

Intel prévoit de commercialiser d'ici la fin 2026 un nouveau processeur d'IA baptisé "Crescent Island", conçu pour concurrencer directement les puces de Nvidia et AMD sur le marché de l'inférence. Kevork Kechichian, directeur du groupe data center d'Intel, a confié au Financial Times que l'entreprise repart "des bases" en proposant un GPU utilisant une mémoire et un système de refroidissement moins coûteux que ceux des solutions rivales. L'objectif affiché est de capitaliser sur le redressement en cours du fabricant américain de semi-conducteurs. "Crescent Island" se concentre sur l'inférence, soit la phase où un utilisateur soumet une requête à un modèle d'IA déjà entraîné, plutôt que sur l'entraînement lui-même, segment encore verrouillé par Nvidia. En misant sur des composants moins onéreux, Intel cherche à proposer une alternative économiquement attractive aux centres de données et aux entreprises qui déploient massivement des services d'IA, sans recourir aux puces haut de gamme H100 ou Blackwell de Nvidia. Un positionnement prix agressif pourrait ouvrir une brèche réelle dans un marché aujourd'hui très concentré. Intel sort d'une période de profonde restructuration, marquée par des retards technologiques et une pression financière intense qui ont fragilisé sa position face à Nvidia et TSMC. Sur le segment de l'inférence, Nvidia détient une part de marché estimée à plus de 80 %, tandis qu'AMD tente de s'y imposer avec ses puces MI300X. Cibler ce créneau avec une offre plus accessible représente pour Intel un pari stratégique cohérent, mais le succès dépendra de la disponibilité réelle des puces et de leur adoption par les grands opérateurs cloud d'ici la fin de l'année.

UELes centres de données et entreprises européens déployant des services d'IA pourraient bénéficier d'une alternative moins coûteuse aux puces Nvidia pour l'inférence d'ici fin 2026.

InfrastructureOpinion
1 source
Deepseek v4 tournerait entièrement sur des puces Huawei, une avancée majeure pour l'indépendance de la Chine en IA
4The Decoder 

Deepseek v4 tournerait entièrement sur des puces Huawei, une avancée majeure pour l'indépendance de la Chine en IA

DeepSeek prépare le lancement de sa quatrième génération de modèle d'intelligence artificielle, attendue dans les prochaines semaines, et celui-ci tournera exclusivement sur des puces Huawei. Selon des sources citées par The Decoder, les grands groupes technologiques chinois auraient déjà passé des commandes portant sur des centaines de milliers d'unités de ces processeurs. Nvidia, le fabricant américain qui domine habituellement le marché de l'entraînement et de l'inférence IA, a été écarté des phases de test préliminaires. C'est un signal fort pour l'autonomie technologique chinoise en matière d'IA. Jusqu'ici, les puces Huawei Ascend étaient perçues comme inférieures aux GPU Nvidia H100 et H800, rendant leur adoption à grande échelle difficile pour des modèles de pointe. Si DeepSeek v4 tourne efficacement sur cette infrastructure domestique, cela validerait la montée en puissance de l'écosystème matériel chinois et réduirait concrètement la dépendance vis-à-vis des fabricants américains, une vulnérabilité stratégique majeure depuis les restrictions à l'export imposées par Washington. Ce développement s'inscrit dans un contexte de guerre technologique larvée entre les États-Unis et la Chine. Depuis 2022, les restrictions américaines sur l'exportation de semi-conducteurs avancés vers la Chine ont contraint Huawei et ses partenaires à accélérer massivement leurs efforts de R&D sur les puces Ascend. DeepSeek avait déjà surpris le monde en janvier 2025 avec des modèles très performants entraînés à moindre coût. Si v4 confirme la viabilité des puces Huawei à cette échelle, cela pourrait remodeler les équilibres du secteur mondial de l'IA.

UESi les puces Huawei Ascend s'avèrent compétitives pour l'IA de pointe, cela accélère la fragmentation du marché mondial des semi-conducteurs et renforce la pression sur l'Europe pour développer sa propre souveraineté en matière de hardware IA.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic