Le modèle open source Kimi K2.7 Code est jusqu'à…

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis

56

1Numerama

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis

DeepSeek vient de publier DeepSeek-V4-Preview, une famille de deux modèles open weight conçus pour rivaliser avec les meilleurs systèmes d'IA propriétaires américains. Le laboratoire chinois annonce un coût d'utilisation sept fois inférieur à celui de Claude Opus 4.7 d'Anthropic, ce qui en fait l'un des modèles les plus compétitifs du marché en termes de rapport performance-prix. Les poids sont accessibles librement, permettant à n'importe quelle entreprise ou développeur de les déployer sans dépendre des API américaines. L'impact est immédiat pour les équipes techniques et les entreprises qui cherchent à réduire leurs coûts d'inférence. Un modèle open weight de ce niveau de performance signifie qu'on peut l'héberger soi-même, adapter les poids, et s'affranchir des conditions d'utilisation imposées par OpenAI, Anthropic ou Google. Pour les marchés émergents et les entreprises européennes soucieuses de souveraineté numérique, c'est une alternative concrète aux géants américains. Ce lancement s'inscrit dans la continuité directe du coup de tonnerre de janvier 2025, lorsque DeepSeek-R1 avait provoqué un effondrement boursier des valeurs tech américaines en démontrant qu'on pouvait former des modèles de pointe à moindre coût. La Maison-Blanche surveille désormais de près les pratiques des laboratoires chinois, notamment sur les questions d'accès aux puces et de transfert technologique. Avec V4, DeepSeek confirme une stratégie délibérée : rendre l'open source suffisamment attractif pour décrocher les utilisateurs mondiaux des écosystèmes américains.

UELes entreprises européennes soucieuses de souveraineté numérique disposent d'une alternative open weight auto-hébergeable aux API américaines, réduisant leur dépendance aux conditions d'utilisation imposées par OpenAI, Anthropic ou Google.

💬 Sept fois moins cher que Claude Opus 4.7, open weight, que tu peux héberger toi-même sans dépendre d'une API américaine : on est loin du coup de com'. DeepSeek ne construit pas juste un modèle compétitif, ils construisent une porte de sortie pour toutes les boîtes qui en ont marre des conditions d'utilisation qui changent et des prix qui grimpent. Reste à tester si ça tient en prod.

LLMsOpinion

1 source

Anthropic lance Claude Opus 5, un modèle IA moins cher pour le code, les agents et les entreprises

50

2VentureBeat AI

Anthropic lance Claude Opus 5, un modèle IA moins cher pour le code, les agents et les entreprises

Anthropic a lancé Claude Opus 5 vendredi, un modèle que l'entreprise présente comme délivrant presque toute l'intelligence de son modèle phare Claude Fable 5, mais à moitié prix. Disponible immédiatement sur toutes les plateformes d'Anthropic, Opus 5 est facturé 5 dollars par million de tokens en entrée et 25 dollars par million en sortie, un tarif inchangé par rapport à son prédécesseur Opus 4.8. Il devient le modèle par défaut sur Claude Max, l'offre premium grand public, et le modèle le plus puissant accessible sur Claude Pro. Sur le plan des performances, Anthropic annonce de nouveaux records sur plusieurs évaluations de codage et de travail de connaissance, dont Frontier-Bench et GDPval-AA. Sur Frontier-Bench v0.1, un benchmark de codage agentique en ligne de commande, Opus 5 obtient un score de 43,3%, plus du double des 18,7% d'Opus 4.8 et nettement devant les 33,7% de Fable 5, tout en coûtant moins cher par tâche. Sur ARC-AGI 3, qui évalue la résolution de problèmes inédits, le score serait trois fois supérieur à celui du meilleur modèle concurrent. Sur OSWorld 2.0, un test d'usage informatique autonome, Opus 5 dépasserait le meilleur résultat de Fable 5 pour un peu plus d'un tiers du coût. Anthropic reconnaît toutefois qu'Opus 5 reste derrière Mythos 5, un modèle concurrent, sur les tâches de cybersécurité et de recherche en biologie, et qu'un modèle de la famille OpenAI garde l'avantage sur un benchmark de codage agentique. Ce lancement traduit un changement de stratégie dans la course à l'IA, qui glisse de la pure performance vers l'économie de l'usage quotidien. Pour Anthropic, l'essentiel du travail professionnel se situe dans une zone intermédiaire de difficulté, où une intelligence proche de la pointe mais délivrée à moindre coût l'emporte sur une intelligence maximale mais coûteuse. L'entreprise positionne désormais sa gamme par usage: Fable 5 pour les projets autonomes de plusieurs jours, Opus 5 comme modèle de référence pour le travail complexe quotidien, Sonnet 5 pour les usages à grande échelle où le coût par appel prime, et Haiku 4.5 pour les sous-agents et réponses instantanées. Un réglage d'effort ajustable permet aussi aux entreprises d'arbitrer entre intelligence, vitesse et consommation de tokens. Cette annonce s'inscrit dans un contexte où les benchmarks classiques atteignent leurs limites, poussant les laboratoires à distinguer les tâches bornées, avec un résultat précis et mesurable, des missions longues et autonomes s'étalant sur plusieurs jours. Anthropic lui-même admet que ses évaluations ne mesurent pas la durée ni la capacité à rester cohérent sur des étapes multiples, un terrain où Fable 5 garde l'avantage. Cette frontière entre tâches ponctuelles et travail agentique prolongé pourrait devenir, en 2026, le principal axe de différenciation entre Anthropic, OpenAI et les autres acteurs du secteur.

💬 Opus 5 au même prix que son prédécesseur mais avec un score qui double sur Frontier-Bench, c'est le vrai signal : la course à l'IA ne se joue plus sur qui a le modèle le plus intelligent, mais sur qui livre le plus d'intelligence par dollar dépensé. Anthropic vient d'admettre à voix haute ce que tout le monde pressentait, l'essentiel du taf pro ne demande pas une IA au sommet absolu, juste une IA solide et pas ruineuse à faire tourner en boucle toute la journée. Reste que sur les tâches longues et autonomes, celles qui s'étalent sur plusieurs jours, Fable 5 garde la main, et c'est là que la vraie bataille de 2026 va se jouer.

LLMsActu

1 source

OpenAI lance GPT-5.4 mini et nano, plus rapides et plus performants mais jusqu'à 4 fois plus chers

45

3The Decoder

OpenAI lance GPT-5.4 mini et nano, plus rapides et plus performants mais jusqu'à 4 fois plus chers

OpenAI vient de dévoiler deux nouveaux modèles compacts, GPT-5.4 mini et GPT-5.4 nano, conçus pour répondre aux besoins des développeurs en matière d'assistants de code, d'agents autonomes et de contrôle informatique. Si ces modèles se distinguent par leurs performances accrues et leur rapidité d'exécution, ils s'accompagnent d'une hausse tarifaire significative pouvant atteindre 4 fois le prix de leurs prédécesseurs. Ces nouvelles versions s'inscrivent dans la stratégie d'OpenAI de démocratiser des modèles plus légers tout en maintenant un niveau de compétence élevé. Le segment des modèles compacts est devenu un champ de bataille crucial dans l'industrie, car les développeurs cherchent des solutions performantes mais économiquement viables pour intégrer l'IA dans des pipelines d'agents ou des environnements à faible latence. GPT-5.4 mini se distingue en approchant les performances du modèle complet GPT-5.4, ce qui représente un saut qualitatif notable pour un modèle de la gamme "mini". Le GPT-5.4 nano, encore plus compact, cible quant à lui les cas d'usage nécessitant une exécution ultra-rapide. La contrepartie reste le coût : cette montée en puissance se traduit par une augmentation tarifaire substantielle par rapport aux générations précédentes (GPT-4o mini et ses variantes), ce qui pourrait freiner l'adoption pour les projets à grand volume de requêtes. La question du rapport performance/coût sera déterminante pour la réception de ces modèles sur le marché. Alors que des concurrents comme Anthropic, Google et Mistral proposent également des modèles compacts compétitifs, OpenAI parie sur la supériorité technique pour justifier cette revalorisation tarifaire, un positionnement qui sera mis à l'épreuve par les premiers retours des développeurs.

UELes développeurs européens utilisant l'API OpenAI devront réévaluer leurs coûts d'infrastructure face à une hausse tarifaire pouvant atteindre 4x.

LLMsActu

1 source

Kimi K3 face à DeepSeek V4 Pro et GLM-5.2 : comparatif des modèles MoE open source à mille milliards de paramètres

42

4MarkTechPost

Kimi K3 face à DeepSeek V4 Pro et GLM-5.2 : comparatif des modèles MoE open source à mille milliards de paramètres

Trois laboratoires chinois dominent désormais le classement des modèles à poids ouverts. Kimi K3, développé par Moonshot AI et lancé le 16 juillet 2026, DeepSeek V4 Pro, sorti le 24 avril 2026, et GLM-5.2 de Zhipu AI, disponible depuis le 13 juin 2026, sont tous des modèles de type Mixture-of-Experts (MoE) dotés d'une fenêtre de contexte d'un million de tokens et pensés pour le codage et les tâches d'agents sur de longues durées. Kimi K3 est le plus massif avec 2,8 billions de paramètres au total, activant 16 experts sur 896 à chaque requête, et intègre nativement la vision ainsi qu'un raisonnement permanent. DeepSeek V4 Pro compte 1,6 billion de paramètres, dont 49 milliards actifs, répartis sur 384 experts routés plus un expert partagé. GLM-5.2, plus modeste avec 744 milliards de paramètres et environ 40 milliards actifs, propose des modes de raisonnement High et Max. Sur l'indice neutre Artificial Analysis Intelligence Index, Kimi K3 obtient un score d'environ 57, se classant troisième mondial derrière Claude Fable 5 et GPT-5.6 Sol, contre 51 pour GLM-5.2 et 44 pour DeepSeek V4 Pro. Sur les benchmarks de codage testés par Moonshot, K3 devance nettement GLM-5.2, notamment sur SWE Marathon (42,0 contre 13,0) et FrontierSWE (81,2 contre 67,3), tandis que DeepSeek V4 Pro Max revendique 80,6% sur SWE-bench Verified, un résultat record pour un modèle ouvert. Ces écarts de performance comptent d'autant plus que les trois modèles ne jouent pas dans la même catégorie sur le plan commercial. DeepSeek V4 Pro et GLM-5.2 sont publiés sous licence MIT, avec leurs poids déjà disponibles sur Hugging Face, ce qui autorise un usage commercial, un fine-tuning et un auto-hébergement sans restriction dès aujourd'hui. Kimi K3, en revanche, reste pour l'instant accessible uniquement via API ou applications Kimi, Moonshot ayant promis la publication des poids pour le 27 juillet 2026 sous une licence MIT modifiée n'imposant une clause d'attribution qu'au-delà de 100 millions d'utilisateurs mensuels actifs. Côté coûts, les tarifs API divergent fortement: Kimi K3 facture 3 dollars par million de tokens en entrée et 15 en sortie, contre seulement 0,435 et 0,87 dollar pour DeepSeek V4 Pro, et 1,40 dollar en entrée pour GLM-5.2, un écart qui pèsera lourd pour les équipes déployant ces modèles à grande échelle. Cette compétition illustre l'accélération de la course chinoise aux modèles ouverts de très grande taille, portée par Moonshot AI, DeepSeek et Zhipu AI qui rivalisent désormais avec les meilleurs modèles propriétaires occidentaux. GLM-5.2 occupait la première place des modèles ouverts avant l'arrivée de K3, signe d'un rythme de sortie très soutenu. Pour les équipes IA qui doivent choisir un modèle à héberger ou interroger via API, l'arbitrage se joue désormais autant sur les performances brutes que sur les conditions de licence et le coût réel de service, avec la publication imminente des poids de K3 comme prochaine étape à surveiller.

UELes équipes IA européennes gagnent de nouvelles options open source à moindre coût pour l'auto-hébergement, mais aucune entreprise ou régulation française/UE n'est directement impliquée.

💬 Kimi K3 décroche la troisième place mondiale, un poids lourd chinois qui rivalise enfin avec les modèles fermés occidentaux. Mais sur le terrain, c'est DeepSeek V4 Pro qui gagne : licence MIT, poids déjà sur Hugging Face, et un tarif API sept fois moins cher que celui de K3. Le classement des benchmarks ne dit rien du coût réel de déploiement, et c'est justement là que se joue la vraie bataille entre ces modèles ouverts chinois.

LLMsActu

1 source

Le modèle open source Kimi K2.7 Code est jusqu'à 12 fois moins cher par token que GPT-5.5 et Claude

À lire aussi

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis

Anthropic lance Claude Opus 5, un modèle IA moins cher pour le code, les agents et les entreprises

OpenAI lance GPT-5.4 mini et nano, plus rapides et plus performants mais jusqu'à 4 fois plus chers

Kimi K3 face à DeepSeek V4 Pro et GLM-5.2 : comparatif des modèles MoE open source à mille milliards de paramètres