Aller au contenu principal
DeepSeek propose son modèle V4 à 97 % moins cher que GPT-5.5 d'OpenAI
BusinessSCMP Tech6sem· 1 min de lecture

DeepSeek propose son modèle V4 à 97 % moins cher que GPT-5.5 d'OpenAI

Source originale ↗·

DeepSeek a annoncé dimanche une baisse drastique des tarifs de ses modèles d'intelligence artificielle, dont son dernier modèle V4, désormais proposé à 97 % moins cher que les produits d'OpenAI. Concrètement, le coût minimum des entrées en cache pour les utilisateurs d'API tombe à environ 0,14 dollar par million de tokens, soit un dixième du prix précédent. Cette réduction s'applique aux "input cache hits", c'est-à-dire aux situations où un contexte déjà traité est réutilisé, ce qui concerne une grande partie des appels API en production.

Cette annonce pourrait déclencher une nouvelle guerre des prix dans un secteur déjà sous pression. Pour les développeurs et les entreprises qui s'appuient sur des API de LLMs pour leurs applications, un écart de prix de 97 % par rapport à GPT-5.5 d'OpenAI représente un argument économique difficile à ignorer. Cela contraint directement les acteurs occidentaux à revoir leur stratégie tarifaire ou à justifier différemment la valeur de leurs modèles.

DeepSeek s'est imposé début 2025 comme un compétiteur sérieux face aux géants américains, notamment avec son modèle R1 qui avait surpris l'industrie par ses performances à coût réduit. La startup chinoise capitalise sur des architectures optimisées et des coûts d'infrastructure inférieurs pour casser les prix. Cette dynamique s'inscrit dans une rivalité technologique plus large entre la Chine et les États-Unis sur le terrain de l'IA, où la course à la performance s'est progressivement doublée d'une course aux prix accessibles.

Impact France/UE

Les développeurs et entreprises européennes utilisant des APIs LLM peuvent réduire drastiquement leurs coûts d'inférence, tout en bénéficiant d'une pression à la baisse sur les tarifs des autres fournisseurs présents sur le marché européen.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Deepseek rend permanente sa réduction de 75 %, avec des tokens de sortie jusqu'à 34 fois moins chers que GPT-5.5
1The Decoder 

Deepseek rend permanente sa réduction de 75 %, avec des tokens de sortie jusqu'à 34 fois moins chers que GPT-5.5

Deepseek vient de rendre permanent son rabais de 75 % sur son modèle phare V3-Pro, ramenant le prix à 0,435 dollar par million de tokens en entrée. Sur les tokens de sortie, l'écart est encore plus frappant : le modèle chinois est au moins 34 fois moins cher que GPT-5.5 d'OpenAI, et plus de 11,5 fois moins cher sur les tokens d'entrée. Ce qui était présenté comme une promotion temporaire devient désormais la tarification de référence du laboratoire de Shenzhen. Pour les développeurs qui construisent des systèmes agentiques, ces chiffres changent radicalement les calculs économiques. Ces architectures, où un modèle enchaîne des dizaines voire des centaines d'appels successifs, consomment des volumes massifs de tokens de sortie. À parité de performance, un écart de 34x sur ce poste de coût peut transformer un projet non rentable en produit viable, ou simplement rendre un concurrent beaucoup plus compétitif. Les providers occidentaux comme OpenAI, Anthropic et Google se retrouvent sous pression directe sur leur modèle économique. Deepseek avait déjà bousculé le marché en janvier 2025 avec la sortie de son modèle R1, qui avait démontré qu'il était possible d'atteindre des performances comparables aux meilleurs modèles américains pour une fraction du coût de développement. La pérennisation de ce niveau de prix s'inscrit dans une stratégie de conquête de parts de marché à l'échelle mondiale, en pariant que le volume compensera les marges réduites. La question qui se pose désormais aux grands laboratoires américains est de savoir jusqu'où ils peuvent baisser leurs propres tarifs sans menacer leur modèle de financement.

UELes startups et développeurs européens qui construisent des systèmes agentiques peuvent réduire drastiquement leurs coûts en adoptant Deepseek V3-Pro, rendant viables des projets d'IA auparavant non rentables face aux tarifs des providers américains.

💬 34 fois moins cher sur les tokens de sortie, c'est pas une promo, c'est une déclaration de guerre. Pour les architectures agentiques qui enchaînent des centaines d'appels, cet écart transforme des projets impossibles en projets viables du jour au lendemain, sans changer une ligne de code. OpenAI et Anthropic ont un vrai problème.

BusinessOpinion
1 source
GPT-5.5 coûte 49 à 92 % plus cher que son prédécesseur, selon la longueur des entrées
2The Decoder 

GPT-5.5 coûte 49 à 92 % plus cher que son prédécesseur, selon la longueur des entrées

OpenAI a doublé le prix affiché de GPT-5.5 par rapport à GPT-5.4, justifiant cette hausse par la promesse que des réponses plus courtes compenseraient le surcoût pour les utilisateurs. Mais une analyse conduite par OpenRouter, plateforme d'agrégation de modèles de langage, révèle que la réalité est bien différente : en s'appuyant sur des données d'utilisation réelles, OpenRouter conclut que les coûts effectifs ont augmenté de 49 à 92 % selon la longueur des requêtes soumises au modèle. Cette hausse tarifaire a des conséquences directes pour les développeurs et les entreprises qui intègrent GPT-5.5 dans leurs applications via l'API d'OpenAI. Une augmentation pouvant frôler les 100 % sur certains usages représente un choc budgétaire significatif, en particulier pour les startups et les équipes traitant de gros volumes de requêtes. Le fait que l'écart entre le tarif officiel et le coût réel soit si prononcé soulève également des questions sur la transparence des grilles tarifaires publiées par OpenAI. Anthropic a, elle aussi, relevé le prix de son modèle haut de gamme Opus 4.7, confirmant une tendance de fond dans l'industrie. Les deux entreprises se préparent à une introduction en bourse, ce qui pourrait expliquer une stratégie visant à améliorer leur rentabilité à court terme. Alors que la concurrence entre les grands acteurs de l'IA reste intense, cette course à la hausse des prix suggère que la phase de conquête à prix coûtant laisse progressivement place à une logique de monétisation plus agressive.

UELes startups et développeurs européens intégrant GPT-5.5 ou Opus 4.7 via API subissent une hausse effective de 49 à 92 % de leurs coûts opérationnels, les contraignant à revoir leurs budgets ou à évaluer des alternatives open-source.

💬 La "promesse de réponses plus courtes qui compensent", c'était du flan. OpenRouter a sorti les vraies données d'utilisation : +49 à +92% sur les coûts réels selon la longueur des requêtes, loin de ce qu'annonce le tarif officiel. Entre les deux boîtes en pré-IPO qui remontent leurs marges simultanément, le signal est assez lisible.

BusinessOpinion
1 source
OpenAI renonce à son mode érotique pour ChatGPT
3TechCrunch AI 

OpenAI renonce à son mode érotique pour ChatGPT

OpenAI a renoncé à son projet de mode de contenu érotique pour ChatGPT, devenant ainsi la dernière d'une série d'initiatives abandonnées par la startup en l'espace d'une semaine. La fonctionnalité, qui aurait permis à ChatGPT de générer des contenus pour adultes explicites, n'a jamais été officiellement lancée à grande échelle avant d'être écartée. Cette décision illustre les tensions croissantes au sein d'OpenAI entre sa volonté d'élargir les cas d'usage de ses modèles — et donc ses revenus — et les contraintes éthiques, réglementaires et d'image de marque qui pèsent sur l'entreprise. Un tel mode aurait pu ouvrir un marché lucratif, mais exposait également OpenAI à des critiques sur la protection des mineurs et la modération des contenus. Ce recul s'inscrit dans un contexte plus large de repositionnement stratégique pour OpenAI, qui jongle entre sa mission déclarée de développer une IA bénéfique pour l'humanité et une pression commerciale intense pour diversifier ses sources de revenus. Plusieurs projets annexes ont été abandonnés en parallèle, sans explication publique détaillée, suggérant une remise à plat interne des priorités alors que la concurrence avec Anthropic, Google et Meta s'intensifie.

UELes réglementations européennes sur la protection des mineurs et le cadre de l'AI Act auraient rendu ce type de contenu particulièrement risqué à déployer dans l'UE.

BusinessOpinion
1 source
90 % moins cher : DeepSeek V4 déclare la guerre totale à OpenAI
4Le Big Data 

90 % moins cher : DeepSeek V4 déclare la guerre totale à OpenAI

DeepSeek a lancé le 24 avril 2026 la version préliminaire de son modèle V4, disponible en deux déclinaisons, Pro et Flash, toutes deux open source. Deux jours à peine après ce lancement, l'entreprise chinoise a enchaîné les annonces tarifaires : le 25 avril, une promotion de 75 % sur l'API V4-Pro, valable jusqu'au 5 mai 2026 à 15h59 UTC, ramenant le prix des entrées en cache de 0,145 dollar à 0,036 dollar, et les sorties de 3,48 à 0,87 dollar. Puis le 26 avril, DeepSeek a généralisé la baisse en réduisant à un dixième du tarif initial le coût d'accès au cache d'entrée pour l'ensemble de sa gamme d'API, effective immédiatement. Ces chiffres prennent tout leur sens face aux tarifs des concurrents américains : Claude Opus 4.7 facture 5 dollars l'entrée et 25 dollars la sortie, GPT-5.5 affiche 5 dollars en entrée et 30 dollars en sortie, et jusqu'à 180 dollars pour la version Pro, tandis que Gemini 3.1 Pro démarre à 2 dollars en entrée et 12 dollars en sortie, avec un doublement des prix au-delà de 200 000 tokens. Pour les développeurs et entreprises qui consomment des volumes importants de tokens, l'écart devient structurellement décisif : utiliser DeepSeek V4-Pro peut coûter dix à cinquante fois moins cher que les alternatives propriétaires comparables en termes de performances. Cela repositionne la question du choix du modèle moins comme un arbitrage qualité-prix que comme un choix purement économique, et met une pression réelle sur les marges des fournisseurs occidentaux. La capacité de DeepSeek à pratiquer ces prix sans sacrifier les performances repose sur une architecture repensée en profondeur. L'entreprise a développé un système hybride baptisé CSA (Compressed Sparse Attention) et HCA (Heavily Compressed Attention), qui compresse les données à chaque étape du traitement au lieu de les manipuler en totalité. Sur un contexte d'un million de tokens, V4-Pro ne mobilise que 27 % des ressources de calcul de son prédécesseur V3.2 et seulement 10 % de sa mémoire cache. DeepSeek a également remplacé l'optimiseur d'entraînement AdamW par Muon, ce qui accélère la convergence du modèle et améliore sa stabilité. Cette combinaison d'innovations architecturales explique comment une entreprise opérant sous contraintes, notamment les restrictions américaines sur l'export de puces haut de gamme vers la Chine, parvient à proposer des modèles qui rivalisent selon ses propres benchmarks avec Gemini 3.1 Pro et GPT-5.4, tout en cassant les prix du marché de façon spectaculaire.

UELes développeurs et entreprises européens consommant des volumes importants de tokens peuvent réduire leurs coûts d'inférence d'un facteur 10 à 50, mais s'exposent à une dépendance stratégique envers un fournisseur chinois soumis à la juridiction de Pékin.

💬 50x moins cher sur le même niveau de perf, c'est pas une promo, c'est une bombe sur les business models occidentaux. Ce qui me frappe, c'est que DeepSeek y arrive sous embargo de puces, en réinventant l'archi au lieu de balancer du compute. Si tu gères des volumes, t'as plus vraiment le luxe d'ignorer ça.

LLMsOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic