Dossier DeepSeek

75 articles

DeepSeek, le laboratoire chinois qui a secoué les valeurs tech US : modèles open-weight V3, R1, V4, économie du compute et géopolitique de l'IA.

OpenAI Anthropic Claude Mythos Claude Opus Claude Code GPT-5.5 GPT-5 DeepSeek V4 Gemini Mistral AI Meta IA Apple Intelligence Tous les dossiers →

1Latent Space LLMsActu

DeepSeek V4 Pro (1.6T-A49B) et Flash (284B-A13B), Base et Instruct, compatibles avec les puces Huawei Ascend

DeepSeek a publié les 23 et 24 avril 2026 deux nouveaux modèles d'intelligence artificielle, DeepSeek V4 Pro et DeepSeek V4 Flash, marquant la première mise à jour majeure de l'architecture depuis DeepSeek V3 en décembre 2024 et DeepSeek R1 en janvier 2025. Le modèle phare, V4 Pro, embarque 1 600 milliards de paramètres au total dont 49 milliards actifs simultanément via une architecture de type Mixture of Experts (MoE), tandis que V4 Flash reste plus compact avec 284 milliards de paramètres et 13 milliards actifs. Les deux modèles ont été entraînés sur 32 à 33 000 milliards de tokens en précision FP4 et atteignent une fenêtre contextuelle d'un million de tokens, contre 128 000 pour V3.2. DeepSeek a publié sous licence MIT à la fois les versions Base et Instruct, et livre un rapport technique de 58 pages salué par de nombreux chercheurs comme l'un des mieux documentés de l'année. Cette publication représente une avancée significative pour l'écosystème des modèles open-weights. V4 Pro se classe autour de la deuxième position parmi les modèles à poids ouverts, dans une fourchette comparable à Kimi K2.6 et GLM-5.1, et rivalise selon les benchmarks avec des modèles fermés de la gamme Claude Sonnet à Opus. La fenêtre d'un million de tokens, rendue possible par deux nouvelles techniques maison nommées Compressed Sparse Attention (CSA) et Heavily Compressed Attention (HCA), est l'élément le plus commenté : à cette longueur, le modèle ne consomme que 27 % des opérations flottantes et 10 % de la mémoire KV cache comparé à DeepSeek V3.2. Les performances en codage agentique et en traitement de documents longs sont particulièrement relevées. La licence MIT et la publication des poids de base ouvrent par ailleurs la voie à des variantes spécialisées et, potentiellement, à un futur DeepSeek R2 orienté raisonnement. La sortie intervient dans un contexte géopolitique tendu autour des semi-conducteurs. DeepSeek a conçu V4 pour fonctionner sur les puces Huawei Ascend via la pile CANN, réduisant explicitement sa dépendance aux GPU Nvidia soumis aux restrictions américaines à l'export. Une étape symbolique forte : les Ascend représentent encore environ un quart des volumes d'H100, mais leur compatibilité avec un modèle de cette envergure signale une trajectoire vers une autonomie technologique chinoise complète. Sur le plan technique, le rapport documente aussi l'intégration de Muon, l'optimiseur développé par Moonshot, ainsi que des hyper-connexions contraintes par variété (mHC), publiées en janvier 2025. La complexité architecturale du modèle suscite un débat dans la communauté : certains chercheurs estiment que peu de laboratoires ouverts disposent des moyens pour reproduire ou affiner une telle infrastructure, relativisant ainsi la portée réelle de la "démocratisation" annoncée.

UELa compatibilité avec les puces Huawei Ascend illustre la trajectoire vers l'autonomie technologique chinoise, renforçant indirectement les débats européens sur la souveraineté numérique et la dépendance aux semi-conducteurs américains.

Dossier DeepSeek

DeepSeek V4 Pro (1.6T-A49B) et Flash (284B-A13B), Base et Instruct, compatibles avec les puces Huawei Ascend

Implémentation de Microsoft OpenMementos : analyse des traces, compression de contexte et préparation des données d'affinage

Le nouveau modèle V4 de DeepSeek : trois raisons pour lesquelles il compte

GPT-5.5 vs DeepSeek V4 : quelle IA va dominer la prochaine révolution tech ?

DeepSeek publie DeepSeek-V4 : deux mécanismes d'attention compressée permettent des contextes d'un million de tokens

DeepSeek-V4 : performances proches du meilleur niveau pour un sixième du coût d'Opus 4.7 et GPT-5.5

The Download : arnaques dopées et IA dans la santé à l'étude

DeepSeek dévoile un nouveau modèle d'IA, un an après avoir secoué ses rivaux américains

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis

L'IA à base d'agents pousse les prix à la hausse, Deepseek sort un modèle compétitif pour presque rien

Oubliez GPT-5.5 : DeepSeek-V4 est là et il est terrifiant

Les États-Unis accusent la Chine de vol de données IA à grande échelle, Pékin dément

Scandale dans l’IA : les États-Unis dénoncent un vol à grande échelle orchestré depuis la Chine

Vidéo : SamuRoid, le robot humanoïde chinois compact aux interactions plus intelligentes

Xiaomi lance MiMo-V2.5-Pro et MiMo-V2.5 : des performances comparables aux grands modèles pour un coût en tokens bien inférieur

Alibaba ouvre l'application Qwen à des partenaires externes avec China Eastern Airlines

Les « exportations de tokens » peuvent-elles donner un avantage à la Chine dans l'ère de l'IA ?

☕️ La vérification d’identité d’Anthropic limite l’accès de Claude en Chine

Pourquoi DeepSeek cherche encore des financements malgré ses importantes liquidités, selon des sources

Le pari open source de la Chine

LLMs+

Moonshot AI publie son modèle phare en open source

[AINews] Moonshot Kimi K2.6 : le meilleur modèle open source du monde se met à jour pour rivaliser avec Opus 4.6 (avant DeepSeek v4 ?)

Thunderbolt de Mozilla : vers une IA d’entreprise 100 % auto-hébergée et privée

OpenMythos : reconstruction open source de Claude Mythos en PyTorch, 770M paramètres équivalant à 1,3 milliard

L'équipe Qwen publie en open source Qwen3.6-35B-A3B, modèle vision-langage MoE à 3 milliards de paramètres actifs

Mozilla lance un client IA Thunderbolt axé sur l'infrastructure auto-hébergée

Les utilisateurs quittent-ils ChatGPT ? Ce que révèlent les chiffres

L'écart entre les États-Unis et la Chine en IA s'est réduit, mais pas sur l'IA responsable

Un dirigeant d'OpenAI dans une note interne : le marché est plus compétitif que jamais

Comprendre l'état actuel de l'IA : ces graphiques sont essentiels

On a testé le MacBook Pro M5 Pro avec 48 Go de RAM : la config parfaite pour de l’IA locale ?

OpenAI, Anthropic et Google s’allient contre le siphonnage de leurs modèles par la Chine

Deepseek v4 tournerait entièrement sur des puces Huawei, une avancée majeure pour l'indépendance de la Chine en IA

Google dévoile 4 IA qui peuvent tourner sur votre smartphone ou votre ordinateur, sans Internet

Arcee lance Trinity-Large-Thinking, un modèle d'IA open source américain puissant que les entreprises peuvent télécharger et personnaliser

Vous demandez des conseils perso à l’IA ? Mauvaise idée selon Stanford

OpenAI confirme officiellement sa méga-levée de fonds et la super-app ChatGPT

Hugging Face publie TRL v1.0 : une suite unifiée pour l'entraînement post-initial (SFT, DPO, GRPO)

OpenAI lève 3 milliards auprès d'investisseurs particuliers dans une levée record de 122 milliards

OpenAI lève 122 milliards de dollars lors d'un tour de table valorisant l'entreprise à 830 milliards

Le chatbot de DeepSeek tombe en panne pendant plus de 10 heures

Manus, une IA chinoise dernier cri prise dans la bataille technologique entre la Chine et les Etats-Unis

Tout le monde se fait berner par les flatteries de l'IA, selon une étude

OpenAI : Sam Altman évoque en interne un modèle "très puissant" capable d'"accélérer vraiment l'économie

Jailbreak IA 2026 : les techniques les plus efficaces sur Grok, Claude, Gemini, ChatGPT et DeepSeek

Nvidia va investir 26 milliards de dollars dans des modèles d'IA open-weight, selon des documents officiels

ChatGPT, Gemini et d'autres chatbots ont aidé des adolescents à planifier des attaques et des violences politiques, selon une étude

Intelligence artificielle : quand les États-Unis sabotent leur propre champion face à DeepSeek

L'avenir de l'écosystème mondial d'IA open-source : de DeepSeek à AI+