InfrastructureThe Decoder13sem· 1 min de lecture

Deepseek v4 tournerait entièrement sur des puces Huawei, une avancée majeure pour l'indépendance de la Chine en IA

DeepSeek prépare le lancement de sa quatrième génération de modèle d'intelligence artificielle, attendue dans les prochaines semaines, et celui-ci tournera exclusivement sur des puces Huawei. Selon des sources citées par The Decoder, les grands groupes technologiques chinois auraient déjà passé des commandes portant sur des centaines de milliers d'unités de ces processeurs. Nvidia, le fabricant américain qui domine habituellement le marché de l'entraînement et de l'inférence IA, a été écarté des phases de test préliminaires.

C'est un signal fort pour l'autonomie technologique chinoise en matière d'IA. Jusqu'ici, les puces Huawei Ascend étaient perçues comme inférieures aux GPU Nvidia H100 et H800, rendant leur adoption à grande échelle difficile pour des modèles de pointe. Si DeepSeek v4 tourne efficacement sur cette infrastructure domestique, cela validerait la montée en puissance de l'écosystème matériel chinois et réduirait concrètement la dépendance vis-à-vis des fabricants américains, une vulnérabilité stratégique majeure depuis les restrictions à l'export imposées par Washington.

Ce développement s'inscrit dans un contexte de guerre technologique larvée entre les États-Unis et la Chine. Depuis 2022, les restrictions américaines sur l'exportation de semi-conducteurs avancés vers la Chine ont contraint Huawei et ses partenaires à accélérer massivement leurs efforts de R&D sur les puces Ascend. DeepSeek avait déjà surpris le monde en janvier 2025 avec des modèles très performants entraînés à moindre coût. Si v4 confirme la viabilité des puces Huawei à cette échelle, cela pourrait remodeler les équilibres du secteur mondial de l'IA.

Impact France/UE

Si les puces Huawei Ascend s'avèrent compétitives pour l'IA de pointe, cela accélère la fragmentation du marché mondial des semi-conducteurs et renforce la pression sur l'Europe pour développer sa propre souveraineté en matière de hardware IA.

Dans nos dossiers

NVIDIA DeepSeek V4

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Decoder

Anthropic explorerait la fabrication de puces sur mesure avec Samsung, tout en maintenant l'importance de Nvidia

Anthropic, la startup d'intelligence artificielle fondée par d'anciens ingénieurs d'OpenAI, serait engagée dans des discussions avec le géant sud-coréen Samsung Electronics en vue de la fabrication d'une puce IA sur mesure. Le projet en serait encore à un stade précoce, mais l'entreprise a déjà recruté des ingénieurs spécialisés dans la conception de semi-conducteurs pour le piloter. Cette démarche intervient peu après l'annonce par OpenAI de son propre projet de puce interne, baptisée "Jalapeño", confirmant une tendance de fond chez les grands acteurs de l'IA générative : développer leurs propres composants plutôt que de dépendre exclusivement des fournisseurs traditionnels. Malgré cette diversification vers le silicium propriétaire, Anthropic aurait tenu à préciser que Nvidia demeure un partenaire essentiel et que ses puces continueront de jouer un rôle central dans son infrastructure. Cette initiative illustre la pression croissante que subissent les entreprises d'IA face à l'explosion des coûts d'entraînement et d'exécution de leurs modèles. En s'associant à Samsung, l'un des rares fondeurs capables de produire des puces avancées à grande échelle, Anthropic chercherait à réduire sa dépendance aux GPU Nvidia, dont la demande mondiale dépasse largement l'offre et dont les prix restent élevés. Pour l'industrie, ce mouvement confirme que même les entreprises les mieux financées jugent nécessaire de maîtriser une partie de leur chaîne d'approvisionnement en calcul, un enjeu à la fois stratégique et économique. À terme, des puces sur mesure pourraient permettre à Anthropic d'optimiser ses coûts d'inférence tout en gagnant en indépendance vis-à-vis des cycles de production de Nvidia. Ce virage s'inscrit dans une dynamique plus large où plusieurs géants de la tech, dont Google avec ses puces TPU et Amazon avec ses processeurs Trainium, ont déjà investi massivement dans le silicium propriétaire pour l'IA. OpenAI a ouvert la voie avec Jalapeño, et Anthropic semble vouloir lui emboîter le pas, signe que la course à l'infrastructure devient un facteur de différenciation aussi important que la qualité des modèles eux-mêmes. Le choix de Samsung comme partenaire pourrait aussi refléter une volonté de diversifier les fournisseurs face à la position dominante de TSMC dans la fonderie avancée. Reste à savoir si ce projet aboutira à une puce déployée à grande échelle, et selon quel calendrier, dans un secteur où la demande en puissance de calcul continue de croître à un rythme vertigineux.

InfrastructureActu

1 source

2The Decoder

Dix entreprises chinoises dont ByteDance auraient obtenu un accord américain pour des puces IA qui leur sont interdites

Une dizaine d'entreprises chinoises, dont Alibaba, Tencent et ByteDance, ont reçu l'autorisation du gouvernement américain d'acquérir jusqu'à 75 000 puces Nvidia H200 chacune. Ces autorisations, révélées par le secrétaire au Commerce Howard Lutnick, représentent un assouplissement notable des restrictions américaines sur les exportations de semi-conducteurs avancés vers la Chine. Pourtant, pas une seule puce n'a encore été livrée. La raison de ce blocage ne vient pas de Washington, mais de Pékin. Selon Lutnick, c'est le gouvernement chinois lui-même qui empêche ces achats, dans le but de protéger son industrie nationale de semi-conducteurs. Cette situation crée un paradoxe inédit : des entreprises chinoises de premier plan se voient refuser par leur propre gouvernement l'accès à des composants que les États-Unis ont accepté de leur vendre. Pour ces géants technologiques, l'impossibilité d'acquérir du matériel de pointe freine directement le développement de leurs modèles d'IA. Cet épisode s'inscrit dans une guerre technologique plus large entre les deux premières puissances mondiales. Depuis 2022, Washington a progressivement renforcé ses contrôles à l'exportation de puces avancées vers la Chine, poussant Pékin à accélérer ses investissements dans des acteurs comme Huawei et SMIC pour atteindre l'autonomie technologique. En bloquant ces achats, la Chine envoie un signal fort : elle préfère consolider sa filière domestique plutôt que de rester dépendante de fournisseurs américains, même lorsque la porte est temporairement ouverte.

UECe bras de fer sino-américain renforce la prise de conscience européenne sur la nécessité d'une souveraineté dans les semi-conducteurs avancés, thème central de l'European Chips Act, sans impact opérationnel direct immédiat sur les entreprises ou institutions françaises.

InfrastructureOpinion

1 source

3La Tribune

IA : cette avancée de Google qui fait trembler les fabricants de puces sur les marchés

Google a annoncé TurboQuant, un algorithme de compression capable de réduire drastiquement les besoins en mémoire vive des grands modèles de langage (LLM). L'annonce, faite en mars 2026, a provoqué une réaction immédiate sur les marchés financiers : les actions des fabricants de mémoires et de puces, dont Micron et SK Hynix, ont fortement chuté en Bourse dès la publication de la nouvelle. L'impact potentiel est considérable pour toute l'industrie des semi-conducteurs. Si TurboQuant tient ses promesses, les data centers et les développeurs d'IA auront besoin de beaucoup moins de RAM pour faire tourner des modèles de grande taille — ce qui représente une menace directe sur les volumes de vente de mémoire HBM (High Bandwidth Memory), un segment très lucratif dominé par Samsung, SK Hynix et Micron. Pour les utilisateurs et les entreprises qui déploient des LLM, cela pourrait en revanche signifier des coûts d'infrastructure nettement réduits et une accessibilité accrue à des modèles puissants. Cette avancée s'inscrit dans une course plus large à l'efficacité des modèles d'IA, où la quantisation et la compression sont devenues des axes majeurs de recherche depuis 2023. Des techniques comme GPTQ ou AWQ avaient déjà tracé la voie, mais Google, fort de ses ressources et de sa maîtrise de l'infrastructure, entend ici passer à une nouvelle échelle. La question qui agite désormais le secteur est de savoir si TurboQuant sera intégré à Gemini et aux offres cloud de Google, ce qui accélérerait considérablement son adoption industrielle.

UELes entreprises et développeurs européens déployant des LLM pourraient bénéficier d'une réduction sensible des coûts d'infrastructure mémoire si TurboQuant est intégré aux offres cloud grand public.

💬 TurboQuant ne change pas ce qu'on peut faire tourner sur nos GPU quant à la taille des modèles eux-mêmes — mais il transforme des modèles "techniquement possibles" en modèles réellement utilisables avec un vrai contexte long. Pour illustrer : avec une RTX 5080, les modèles 12-14B passent de ~10K à ~60-100K tokens de contexte, soit une fenêtre quasi illimitée pour ces tailles. De quoi faire trembler les fabricants de puces, effectivement.

InfrastructureOpinion

1 source

4The Information AI

Le chatbot de DeepSeek tombe en panne pendant plus de 10 heures

Le chatbot de DeepSeek a subi une panne majeure de plus de dix heures dans la nuit de dimanche à lundi, rendant inaccessibles à la fois le site web et l'application mobile de la startup chinoise. Il s'agit de l'interruption de service la plus longue enregistrée depuis que le modèle phare de l'entreprise avait connu un succès viral début 2025. Le service a été rétabli lundi matin, sans que DeepSeek n'ait fourni d'explication publique sur les causes de l'incident. Une panne de cette durée sur un service d'IA aussi fréquenté soulève des questions sérieuses sur la fiabilité de l'infrastructure de DeepSeek. Pour les millions d'utilisateurs qui dépendent du chatbot comme outil de travail quotidien, dix heures d'indisponibilité représentent une interruption significative. L'absence de communication officielle aggrave la situation : les entreprises et développeurs intégrant DeepSeek dans leurs flux de travail se retrouvent sans visibilité sur les risques opérationnels. DeepSeek s'était imposé comme un concurrent inattendu face à OpenAI et Google début 2025, en proposant des performances comparables à des coûts bien inférieurs, ce qui avait provoqué un choc boursier aux États-Unis. Mais la montée en charge rapide d'un service qui n'avait pas été conçu pour une adoption mondiale de masse expose désormais ses faiblesses infrastructurelles. Cette panne survient alors que la fiabilité et la souveraineté des outils d'IA font l'objet d'un examen croissant, notamment en Europe où la provenance chinoise de DeepSeek alimente des débats sur la dépendance technologique.

UELa panne relance le débat en Europe sur la dépendance aux outils d'IA d'origine chinoise et les risques pour la souveraineté technologique.

💬 10 heures, aucune explication, aucun post-mortem. C'est ça qui me pose problème, pas la panne en elle-même (tout tombe, même OpenAI). Quand tu intègres un service dans ton workflow sans avoir aucune visibilité sur ce qui s'est passé, tu travailles à l'aveugle. Bon, c'est le signal pour tous ceux qui hésitaient encore sur la question souveraineté.

InfrastructureOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic