BusinessSCMP Tech · 28 avr. 2026, 01:00· 1 min de lecture

DeepSeek propose son modèle V4 à 97 % moins cher que GPT-5.5 d'OpenAI

DeepSeek a annoncé dimanche une baisse drastique des tarifs de ses modèles d'intelligence artificielle, dont son dernier modèle V4, désormais proposé à 97 % moins cher que les produits d'OpenAI. Concrètement, le coût minimum des entrées en cache pour les utilisateurs d'API tombe à environ 0,14 dollar par million de tokens, soit un dixième du prix précédent. Cette réduction s'applique aux "input cache hits", c'est-à-dire aux situations où un contexte déjà traité est réutilisé, ce qui concerne une grande partie des appels API en production.

Cette annonce pourrait déclencher une nouvelle guerre des prix dans un secteur déjà sous pression. Pour les développeurs et les entreprises qui s'appuient sur des API de LLMs pour leurs applications, un écart de prix de 97 % par rapport à GPT-5.5 d'OpenAI représente un argument économique difficile à ignorer. Cela contraint directement les acteurs occidentaux à revoir leur stratégie tarifaire ou à justifier différemment la valeur de leurs modèles.

DeepSeek s'est imposé début 2025 comme un compétiteur sérieux face aux géants américains, notamment avec son modèle R1 qui avait surpris l'industrie par ses performances à coût réduit. La startup chinoise capitalise sur des architectures optimisées et des coûts d'infrastructure inférieurs pour casser les prix. Cette dynamique s'inscrit dans une rivalité technologique plus large entre la Chine et les États-Unis sur le terrain de l'IA, où la course à la performance s'est progressivement doublée d'une course aux prix accessibles.

Impact France/UE

Les développeurs et entreprises européennes utilisant des APIs LLM peuvent réduire drastiquement leurs coûts d'inférence, tout en bénéficiant d'une pression à la baisse sur les tarifs des autres fournisseurs présents sur le marché européen.

Dans nos dossiers

OpenAI DeepSeek GPT-5.5

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Decoder

Deepseek rend permanente sa réduction de 75 %, avec des tokens de sortie jusqu'à 34 fois moins chers que GPT-5.5

Deepseek vient de rendre permanent son rabais de 75 % sur son modèle phare V3-Pro, ramenant le prix à 0,435 dollar par million de tokens en entrée. Sur les tokens de sortie, l'écart est encore plus frappant : le modèle chinois est au moins 34 fois moins cher que GPT-5.5 d'OpenAI, et plus de 11,5 fois moins cher sur les tokens d'entrée. Ce qui était présenté comme une promotion temporaire devient désormais la tarification de référence du laboratoire de Shenzhen. Pour les développeurs qui construisent des systèmes agentiques, ces chiffres changent radicalement les calculs économiques. Ces architectures, où un modèle enchaîne des dizaines voire des centaines d'appels successifs, consomment des volumes massifs de tokens de sortie. À parité de performance, un écart de 34x sur ce poste de coût peut transformer un projet non rentable en produit viable, ou simplement rendre un concurrent beaucoup plus compétitif. Les providers occidentaux comme OpenAI, Anthropic et Google se retrouvent sous pression directe sur leur modèle économique. Deepseek avait déjà bousculé le marché en janvier 2025 avec la sortie de son modèle R1, qui avait démontré qu'il était possible d'atteindre des performances comparables aux meilleurs modèles américains pour une fraction du coût de développement. La pérennisation de ce niveau de prix s'inscrit dans une stratégie de conquête de parts de marché à l'échelle mondiale, en pariant que le volume compensera les marges réduites. La question qui se pose désormais aux grands laboratoires américains est de savoir jusqu'où ils peuvent baisser leurs propres tarifs sans menacer leur modèle de financement.

UELes startups et développeurs européens qui construisent des systèmes agentiques peuvent réduire drastiquement leurs coûts en adoptant Deepseek V3-Pro, rendant viables des projets d'IA auparavant non rentables face aux tarifs des providers américains.

💬 34 fois moins cher sur les tokens de sortie, c'est pas une promo, c'est une déclaration de guerre. Pour les architectures agentiques qui enchaînent des centaines d'appels, cet écart transforme des projets impossibles en projets viables du jour au lendemain, sans changer une ligne de code. OpenAI et Anthropic ont un vrai problème.

BusinessOpinion

1 source

2The Decoder

GPT-5.5 coûte 49 à 92 % plus cher que son prédécesseur, selon la longueur des entrées

OpenAI a doublé le prix affiché de GPT-5.5 par rapport à GPT-5.4, justifiant cette hausse par la promesse que des réponses plus courtes compenseraient le surcoût pour les utilisateurs. Mais une analyse conduite par OpenRouter, plateforme d'agrégation de modèles de langage, révèle que la réalité est bien différente : en s'appuyant sur des données d'utilisation réelles, OpenRouter conclut que les coûts effectifs ont augmenté de 49 à 92 % selon la longueur des requêtes soumises au modèle. Cette hausse tarifaire a des conséquences directes pour les développeurs et les entreprises qui intègrent GPT-5.5 dans leurs applications via l'API d'OpenAI. Une augmentation pouvant frôler les 100 % sur certains usages représente un choc budgétaire significatif, en particulier pour les startups et les équipes traitant de gros volumes de requêtes. Le fait que l'écart entre le tarif officiel et le coût réel soit si prononcé soulève également des questions sur la transparence des grilles tarifaires publiées par OpenAI. Anthropic a, elle aussi, relevé le prix de son modèle haut de gamme Opus 4.7, confirmant une tendance de fond dans l'industrie. Les deux entreprises se préparent à une introduction en bourse, ce qui pourrait expliquer une stratégie visant à améliorer leur rentabilité à court terme. Alors que la concurrence entre les grands acteurs de l'IA reste intense, cette course à la hausse des prix suggère que la phase de conquête à prix coûtant laisse progressivement place à une logique de monétisation plus agressive.

UELes startups et développeurs européens intégrant GPT-5.5 ou Opus 4.7 via API subissent une hausse effective de 49 à 92 % de leurs coûts opérationnels, les contraignant à revoir leurs budgets ou à évaluer des alternatives open-source.

💬 La "promesse de réponses plus courtes qui compensent", c'était du flan. OpenRouter a sorti les vraies données d'utilisation : +49 à +92% sur les coûts réels selon la longueur des requêtes, loin de ce qu'annonce le tarif officiel. Entre les deux boîtes en pré-IPO qui remontent leurs marges simultanément, le signal est assez lisible.

BusinessOpinion

1 source

3La Tribune

DeepSeek casse les prix, Moonshot veut tout intégrer : comment l’IA chinoise attaque les modèles américains

DeepSeek a bousculé le marché de l'intelligence artificielle en lançant un modèle open source dont le coût d'utilisation est jusqu'à 85 % inférieur à celui de GPT5.5, la dernière génération de modèles d'OpenAI. Dans le même temps, Moonshot AI a aligné ses modèles Kimi et K2 pour concurrencer directement ChatGPT et Claude sur des tâches clés comme la génération de code et le raisonnement complexe. Ces deux entreprises chinoises, surnommées les "tigres" de l'IA locale, incarnent une nouvelle vague d'acteurs capables de rivaliser techniquement avec les géants américains tout en cassant radicalement les prix pratiqués jusqu'ici sur le marché. Cette stratégie tarifaire agressive change la donne pour les entreprises qui déploient l'IA à grande échelle, où le coût par requête devient un critère aussi déterminant que la performance brute. Pour les développeurs et les sociétés technologiques, l'apparition d'alternatives open source nettement moins chères réduit la dépendance aux fournisseurs américains et pourrait accélérer l'adoption de l'IA générative dans des marchés plus sensibles aux coûts, notamment dans les pays émergents. Cette offensive s'inscrit dans une stratégie plus large de Pékin, qui voit dans l'IA un levier diplomatique et économique. En proposant des modèles performants et bon marché, la Chine cherche à séduire les entreprises occidentales tout en offrant au Sud global une alternative complète aux services américains, de l'infrastructure aux applications. Cette bataille des prix et des capacités technique s'annonce comme un nouveau front de la rivalité sino-américaine dans la course à l'intelligence artificielle, avec des répercussions potentielles sur les équilibres géopolitiques et économiques mondiaux.

UELes entreprises et developpeurs europeens pourraient beneficier de couts d'IA reduits et d'une moindre dependance aux fournisseurs americains, sans qu'aucune entreprise ou regulation francaise ou europeenne ne soit directement citee.

💬 DeepSeek et Moonshot ne cassent pas les prix par générosité, ils cassent les prix parce que les Américains ont bâti leurs marges sur une pénurie qui n'existe plus. C'est le vrai sujet : dès que le coût par requête devient le critère qui compte, les modèles ricains perdent leur avantage même s'ils restent meilleurs de quelques points de benchmark. Reste à voir si ça tient en prod à cette échelle, mais pour une boîte qui déploie de l'IA H24, l'argument prix va peser lourd, et Pékin le sait très bien.

BusinessOpinion

1 source

4TechCrunch AI

OpenAI renonce à son mode érotique pour ChatGPT

OpenAI a renoncé à son projet de mode de contenu érotique pour ChatGPT, devenant ainsi la dernière d'une série d'initiatives abandonnées par la startup en l'espace d'une semaine. La fonctionnalité, qui aurait permis à ChatGPT de générer des contenus pour adultes explicites, n'a jamais été officiellement lancée à grande échelle avant d'être écartée. Cette décision illustre les tensions croissantes au sein d'OpenAI entre sa volonté d'élargir les cas d'usage de ses modèles — et donc ses revenus — et les contraintes éthiques, réglementaires et d'image de marque qui pèsent sur l'entreprise. Un tel mode aurait pu ouvrir un marché lucratif, mais exposait également OpenAI à des critiques sur la protection des mineurs et la modération des contenus. Ce recul s'inscrit dans un contexte plus large de repositionnement stratégique pour OpenAI, qui jongle entre sa mission déclarée de développer une IA bénéfique pour l'humanité et une pression commerciale intense pour diversifier ses sources de revenus. Plusieurs projets annexes ont été abandonnés en parallèle, sans explication publique détaillée, suggérant une remise à plat interne des priorités alors que la concurrence avec Anthropic, Google et Meta s'intensifie.

UELes réglementations européennes sur la protection des mineurs et le cadre de l'AI Act auraient rendu ce type de contenu particulièrement risqué à déployer dans l'UE.

BusinessOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic