Aller au contenu principal
BusinessSCMP Tech1h

DeepSeek propose son modèle V4 à 97 % moins cher que GPT-5.5 d'OpenAI

Résumé IASource uniqueImpact UE
Source originale ↗·

DeepSeek a annoncé dimanche une baisse drastique des tarifs de ses modèles d'intelligence artificielle, dont son dernier modèle V4, désormais proposé à 97 % moins cher que les produits d'OpenAI. Concrètement, le coût minimum des entrées en cache pour les utilisateurs d'API tombe à environ 0,14 dollar par million de tokens, soit un dixième du prix précédent. Cette réduction s'applique aux "input cache hits", c'est-à-dire aux situations où un contexte déjà traité est réutilisé, ce qui concerne une grande partie des appels API en production.

Cette annonce pourrait déclencher une nouvelle guerre des prix dans un secteur déjà sous pression. Pour les développeurs et les entreprises qui s'appuient sur des API de LLMs pour leurs applications, un écart de prix de 97 % par rapport à GPT-5.5 d'OpenAI représente un argument économique difficile à ignorer. Cela contraint directement les acteurs occidentaux à revoir leur stratégie tarifaire ou à justifier différemment la valeur de leurs modèles.

DeepSeek s'est imposé début 2025 comme un compétiteur sérieux face aux géants américains, notamment avec son modèle R1 qui avait surpris l'industrie par ses performances à coût réduit. La startup chinoise capitalise sur des architectures optimisées et des coûts d'infrastructure inférieurs pour casser les prix. Cette dynamique s'inscrit dans une rivalité technologique plus large entre la Chine et les États-Unis sur le terrain de l'IA, où la course à la performance s'est progressivement doublée d'une course aux prix accessibles.

Impact France/UE

Les développeurs et entreprises européennes utilisant des APIs LLM peuvent réduire drastiquement leurs coûts d'inférence, tout en bénéficiant d'une pression à la baisse sur les tarifs des autres fournisseurs présents sur le marché européen.

Dans nos dossiers

À lire aussi

OpenAI renonce à son mode érotique pour ChatGPT
1TechCrunch AI 

OpenAI renonce à son mode érotique pour ChatGPT

OpenAI a renoncé à son projet de mode de contenu érotique pour ChatGPT, devenant ainsi la dernière d'une série d'initiatives abandonnées par la startup en l'espace d'une semaine. La fonctionnalité, qui aurait permis à ChatGPT de générer des contenus pour adultes explicites, n'a jamais été officiellement lancée à grande échelle avant d'être écartée. Cette décision illustre les tensions croissantes au sein d'OpenAI entre sa volonté d'élargir les cas d'usage de ses modèles — et donc ses revenus — et les contraintes éthiques, réglementaires et d'image de marque qui pèsent sur l'entreprise. Un tel mode aurait pu ouvrir un marché lucratif, mais exposait également OpenAI à des critiques sur la protection des mineurs et la modération des contenus. Ce recul s'inscrit dans un contexte plus large de repositionnement stratégique pour OpenAI, qui jongle entre sa mission déclarée de développer une IA bénéfique pour l'humanité et une pression commerciale intense pour diversifier ses sources de revenus. Plusieurs projets annexes ont été abandonnés en parallèle, sans explication publique détaillée, suggérant une remise à plat interne des priorités alors que la concurrence avec Anthropic, Google et Meta s'intensifie.

UELes réglementations européennes sur la protection des mineurs et le cadre de l'AI Act auraient rendu ce type de contenu particulièrement risqué à déployer dans l'UE.

BusinessOpinion
1 source
90 % moins cher : DeepSeek V4 déclare la guerre totale à OpenAI
2Le Big Data 

90 % moins cher : DeepSeek V4 déclare la guerre totale à OpenAI

DeepSeek a lancé le 24 avril 2026 la version préliminaire de son modèle V4, disponible en deux déclinaisons, Pro et Flash, toutes deux open source. Deux jours à peine après ce lancement, l'entreprise chinoise a enchaîné les annonces tarifaires : le 25 avril, une promotion de 75 % sur l'API V4-Pro, valable jusqu'au 5 mai 2026 à 15h59 UTC, ramenant le prix des entrées en cache de 0,145 dollar à 0,036 dollar, et les sorties de 3,48 à 0,87 dollar. Puis le 26 avril, DeepSeek a généralisé la baisse en réduisant à un dixième du tarif initial le coût d'accès au cache d'entrée pour l'ensemble de sa gamme d'API, effective immédiatement. Ces chiffres prennent tout leur sens face aux tarifs des concurrents américains : Claude Opus 4.7 facture 5 dollars l'entrée et 25 dollars la sortie, GPT-5.5 affiche 5 dollars en entrée et 30 dollars en sortie, et jusqu'à 180 dollars pour la version Pro, tandis que Gemini 3.1 Pro démarre à 2 dollars en entrée et 12 dollars en sortie, avec un doublement des prix au-delà de 200 000 tokens. Pour les développeurs et entreprises qui consomment des volumes importants de tokens, l'écart devient structurellement décisif : utiliser DeepSeek V4-Pro peut coûter dix à cinquante fois moins cher que les alternatives propriétaires comparables en termes de performances. Cela repositionne la question du choix du modèle moins comme un arbitrage qualité-prix que comme un choix purement économique, et met une pression réelle sur les marges des fournisseurs occidentaux. La capacité de DeepSeek à pratiquer ces prix sans sacrifier les performances repose sur une architecture repensée en profondeur. L'entreprise a développé un système hybride baptisé CSA (Compressed Sparse Attention) et HCA (Heavily Compressed Attention), qui compresse les données à chaque étape du traitement au lieu de les manipuler en totalité. Sur un contexte d'un million de tokens, V4-Pro ne mobilise que 27 % des ressources de calcul de son prédécesseur V3.2 et seulement 10 % de sa mémoire cache. DeepSeek a également remplacé l'optimiseur d'entraînement AdamW par Muon, ce qui accélère la convergence du modèle et améliore sa stabilité. Cette combinaison d'innovations architecturales explique comment une entreprise opérant sous contraintes, notamment les restrictions américaines sur l'export de puces haut de gamme vers la Chine, parvient à proposer des modèles qui rivalisent selon ses propres benchmarks avec Gemini 3.1 Pro et GPT-5.4, tout en cassant les prix du marché de façon spectaculaire.

UELes développeurs et entreprises européens consommant des volumes importants de tokens peuvent réduire leurs coûts d'inférence d'un facteur 10 à 50, mais s'exposent à une dépendance stratégique envers un fournisseur chinois soumis à la juridiction de Pékin.

💬 50x moins cher sur le même niveau de perf, c'est pas une promo, c'est une bombe sur les business models occidentaux. Ce qui me frappe, c'est que DeepSeek y arrive sous embargo de puces, en réinventant l'archi au lieu de balancer du compute. Si tu gères des volumes, t'as plus vraiment le luxe d'ignorer ça.

LLMsOpinion
1 source
L'application et l'API de Sora sont abandonnées, mais OpenAI laisse entendre que le modèle vidéo survit dans ChatGPT
3The Decoder 

L'application et l'API de Sora sont abandonnées, mais OpenAI laisse entendre que le modèle vidéo survit dans ChatGPT

OpenAI met fin à son application Sora et à son API dédiée à la génération vidéo, quelques mois seulement après leur lancement. Dans la foulée, Disney annonce qu'il se retire du partenariat signé en décembre 2025 avec OpenAI, un accord évalué à plusieurs milliards de dollars. OpenAI laisse toutefois entendre que le modèle vidéo Sora ne disparaît pas complètement, mais serait intégré directement dans ChatGPT. Cette décision marque un revers significatif pour la stratégie vidéo d'OpenAI. Le retrait de Disney, l'un des partenaires les plus emblématiques et les plus médiatisés de l'accord, fragilise la crédibilité commerciale de Sora et soulève des questions sur la viabilité du produit tel qu'il était conçu. Supprimer l'API prive également les développeurs tiers de l'accès au modèle, réduisant considérablement l'écosystème qui avait commencé à se former autour de la technologie. L'intégration dans ChatGPT pourrait signifier une simplification de l'offre, mais aussi une perte de flexibilité pour les usages professionnels et créatifs avancés. Sora avait été présenté en grande pompe début 2024 comme une avancée majeure dans la génération vidéo par IA, capable de produire des séquences réalistes à partir de simples descriptions textuelles. Son lancement commercial, accompagné de partenariats haut de gamme comme celui avec Disney, devait asseoir la position d'OpenAI sur ce marché face à des concurrents comme Runway ou Google. La consolidation du modèle au sein de ChatGPT reflète une tendance plus large chez OpenAI à centraliser ses capacités dans son produit phare plutôt que de maintenir des offres distinctes.

BusinessActu
1 source
OpenAI met en pause le « mode adulte » de ChatGPT et change de cap stratégique
4Siècle Digital 

OpenAI met en pause le « mode adulte » de ChatGPT et change de cap stratégique

OpenAI a annoncé la suspension du développement de son « mode adulte » pour ChatGPT, une fonctionnalité qui devait permettre la génération de contenus explicites pour les adultes sur certaines plateformes partenaires. Cette décision intervient peu après l'arrêt de Sora, le générateur vidéo de la start-up, signalant un recentrage stratégique plus large au sein de l'entreprise. Le changement de cap concerne plusieurs initiatives expérimentales lancées ces derniers mois autour de ChatGPT. Ce revirement illustre la pression croissante que subit OpenAI face à une concurrence qui s'intensifie rapidement. Anthropic, son rival direct, a même lancé un outil de migration pour faciliter le passage de ChatGPT vers Claude, une manœuvre agressive qui cible directement la base d'utilisateurs d'OpenAI. En suspendant des projets secondaires, OpenAI semble vouloir concentrer ses ressources sur ses produits phares et sur des fonctionnalités à plus fort impact commercial, plutôt que de disperser ses équipes sur des expérimentations risquées sur le plan réputationnel. OpenAI se retrouve à un moment charnière : après avoir dominé l'espace des assistants IA grand public depuis le lancement de ChatGPT en 2022, la start-up doit désormais défendre sa position face à des concurrents mieux capitalisés ou plus agiles. La décision d'abandonner le mode adulte reflète aussi les tensions entre croissance de l'audience et gestion de l'image de marque, un équilibre délicat pour une entreprise qui cherche simultanément à lever des fonds, séduire les entreprises et maintenir la confiance du grand public.

BusinessOpinion
1 source