Dossier NVIDIA — page 3

296 articles · page 3 sur 6

NVIDIA, l'arsenal de la course IA : Blackwell, Vera Rubin, Vera CPU, partenariats hyperscalers, Omniverse, et la rente CUDA face aux puces Huawei et Trainium.

101Latent Space LLMsActu

DeepSeek V4 Pro (1.6T-A49B) et Flash (284B-A13B), Base et Instruct, compatibles avec les puces Huawei Ascend

DeepSeek a publié les 23 et 24 avril 2026 deux nouveaux modèles d'intelligence artificielle, DeepSeek V4 Pro et DeepSeek V4 Flash, marquant la première mise à jour majeure de l'architecture depuis DeepSeek V3 en décembre 2024 et DeepSeek R1 en janvier 2025. Le modèle phare, V4 Pro, embarque 1 600 milliards de paramètres au total dont 49 milliards actifs simultanément via une architecture de type Mixture of Experts (MoE), tandis que V4 Flash reste plus compact avec 284 milliards de paramètres et 13 milliards actifs. Les deux modèles ont été entraînés sur 32 à 33 000 milliards de tokens en précision FP4 et atteignent une fenêtre contextuelle d'un million de tokens, contre 128 000 pour V3.2. DeepSeek a publié sous licence MIT à la fois les versions Base et Instruct, et livre un rapport technique de 58 pages salué par de nombreux chercheurs comme l'un des mieux documentés de l'année. Cette publication représente une avancée significative pour l'écosystème des modèles open-weights. V4 Pro se classe autour de la deuxième position parmi les modèles à poids ouverts, dans une fourchette comparable à Kimi K2.6 et GLM-5.1, et rivalise selon les benchmarks avec des modèles fermés de la gamme Claude Sonnet à Opus. La fenêtre d'un million de tokens, rendue possible par deux nouvelles techniques maison nommées Compressed Sparse Attention (CSA) et Heavily Compressed Attention (HCA), est l'élément le plus commenté : à cette longueur, le modèle ne consomme que 27 % des opérations flottantes et 10 % de la mémoire KV cache comparé à DeepSeek V3.2. Les performances en codage agentique et en traitement de documents longs sont particulièrement relevées. La licence MIT et la publication des poids de base ouvrent par ailleurs la voie à des variantes spécialisées et, potentiellement, à un futur DeepSeek R2 orienté raisonnement. La sortie intervient dans un contexte géopolitique tendu autour des semi-conducteurs. DeepSeek a conçu V4 pour fonctionner sur les puces Huawei Ascend via la pile CANN, réduisant explicitement sa dépendance aux GPU Nvidia soumis aux restrictions américaines à l'export. Une étape symbolique forte : les Ascend représentent encore environ un quart des volumes d'H100, mais leur compatibilité avec un modèle de cette envergure signale une trajectoire vers une autonomie technologique chinoise complète. Sur le plan technique, le rapport documente aussi l'intégration de Muon, l'optimiseur développé par Moonshot, ainsi que des hyper-connexions contraintes par variété (mHC), publiées en janvier 2025. La complexité architecturale du modèle suscite un débat dans la communauté : certains chercheurs estiment que peu de laboratoires ouverts disposent des moyens pour reproduire ou affiner une telle infrastructure, relativisant ainsi la portée réelle de la "démocratisation" annoncée.

UELa compatibilité avec les puces Huawei Ascend illustre la trajectoire vers l'autonomie technologique chinoise, renforçant indirectement les débats européens sur la souveraineté numérique et la dépendance aux semi-conducteurs américains.

Dossier NVIDIA — page 3

DeepSeek V4 Pro (1.6T-A49B) et Flash (284B-A13B), Base et Instruct, compatibles avec les puces Huawei Ascend

Anthropic et la stratégie marketing de la peur autour de sa nouvelle IA Mythos (2/3)

Microsoft et les fournisseurs cloud resserrent leur emprise sur les GPU, au détriment des clients IA

GPT-5.5 et la super-application OpenAI Codex

Les rumeurs disaient vrai : OpenAI lâche GPT-5.5, et ça change pas mal de choses

GPT-5.5 est arrivé et il ne rigole pas : devance légèrement Claude Mythos Preview sur Terminal-Bench 2.0

Mythos d'Anthropic attise les craintes en cybersécurité : quelles implications pour la Chine ?

Anthropic et Amazon étendent leur accord, 5 milliards de dollars contre 5 GW

☕️ Amazon envisage de vendre ses puces Trainium à des tiers

Anthropic garde un nouveau modèle IA secret après avoir découvert des milliers de failles externes

Claude Mythos : l’IA qu’Anthropic refuse de sortir (et pourquoi ça fait peur)

Mistral AI lève 830 millions de dollars pour un centre de données IA

Mistral AI emprunte 830 millions de dollars pour financer un nouveau datacenter près de Paris

Mistral AI lance un modèle de synthèse vocale qui surpasse ElevenLabs, disponible en open source

NVIDIA AI présente PivotRL : un nouveau framework d'IA atteignant une haute précision agentique avec 4 fois moins de tours de simulation

Le proxy IA populaire LiteLLM infecté par un malware qui se propage dans les clusters Kubernetes

Le PDG de Nvidia Jensen Huang : l'idée que l'IA va détruire le logiciel est "ridicule

Le PDG de Nvidia tente d'expliquer pourquoi DLSS 5 n'est pas du "contenu IA de mauvaise qualité

Nvidia DLSS : l’IA qui va rendre vos jeux préférés aussi réalistes qu’un film ?

Le PDG de Nvidia Jensen Huang dit qu'il serait "profondément inquiet" si un développeur à 500 000 $ dépensait moins de 250 000 $ en tokens d'IA

Nvidia étend son emprise sur la conduite autonome

NVIDIA et les géants des télécoms construisent des grilles IA pour optimiser l'inférence sur les réseaux distribués

Nvidia veut faire tourner l’IA directement dans l’espace

Nvidia invente le filtre de beauté Instagram pour les jeux vidéo : les joueurs détestent

SSD PCIe 6.0, HBM4 et SOCAMM2 : Micron fait « all-in » sur NVIDIA et l’IA

Nvidia veut mettre des serveurs dans l’espace : faut-il y croire ?

Roche déploie les usines IA NVIDIA à l'échelle mondiale pour accélérer la découverte de médicaments, les solutions diagnostiques et les avancées en fabrication

Nvidia lance Data Factory et des modèles robotiques dans son offensive pour l'IA physique

DLSS 5 : comment Nvidia exploite le rendu neuronal pour métamorphoser vos jeux PC

La prochaine puce de Nvidia serait vraiment différente des autres

Au-delà de la similarité sémantique: Introduction du pipeline d'acquisition généralisable d'Agencer NVIDIA NeMo

« Sans GeForce il n’y aurait pas de CUDA et sans CUDA il n’y aurait pas d’IA » : Nvidia rend hommage aux joueurs PC qui ont financé l’IA

Tout savoir sur NemoClaw, le futur concurrent d’OpenClaw signé Nvidia

Le sens du timing : comment AMD profite de la grande conférence de Nvidia pour faire du pied aux géants coréens

Étonnament, Nvidia prévoit de lancer son propre agent IA open source

Nvidia et Thinking Machines Lab de Mira Murati annoncent un partenariat à long terme pour l'IA

Thinking Machines Lab signe un accord majeur avec Nvidia pour ses capacités de calcul

Nvidia prévoit de lancer une plateforme d'agents IA open source

Nvidia : son partenaire cloud Together AI discuterait d’une levée géante valorisée 7,5 milliards

NVIDIA GTC : la conférence où l’industrie de l’IA se donne rendez-vous

Guerre froide de l’IA : pourquoi Nvidia lâche OpenAI et Anthropic en plein bras de fer avec le Pentagone

L'unité Cosmos Reason 2 d'NVIDIA apporte une raison avancée pour les intelligences artificielles physiques

NVIDIA donne vie à des agents avec DGX Spark et Reachy Mini

Le Standard d'Évaluation Ouverte : Évaluation de NVIDIA Nemotron 3 Nano avec NeMo Evaluator

Construire un robot de santé de la simulation à la mise en œuvre avec NVIDIA Isaac

Comment concevoir un robot de santé de la simulation à la mise en œuvre avec NVIDIA Isaac pour le secteur de la santé

OpenAI et NVIDIA annoncent un partenariat stratégique pour déployer 10 gigawatts de systèmes NVIDIA

NVIDIA publie un ensemble de données de raisonnement multilingue de 6 millions d'exemples

Accélérez un monde de grands modèles linguistiques sur Hugging Face avec NVIDIA NIM

Présentation du Cluster d'Entraînement en tant que Service : une nouvelle collaboration avec NVIDIA