Le PDG de Snowflake juge GLM-5.2 aussi compétitif…

L'IA à base d'agents pousse les prix à la hausse, Deepseek sort un modèle compétitif pour presque rien

54

1The Decoder

L'IA à base d'agents pousse les prix à la hausse, Deepseek sort un modèle compétitif pour presque rien

Le laboratoire chinois Deepseek a lancé deux nouveaux modèles, V4-Pro et V4-Flash, dotés d'une architecture pouvant atteindre 1 600 milliards de paramètres et d'une fenêtre de contexte d'un million de tokens. La sortie s'accompagne d'un article technique détaillant les choix d'entraînement, les techniques de distillation et le matériel utilisé. Les tarifs annoncés se situent très nettement en dessous de ceux pratiqués par OpenAI, Google et Anthropic, confirmant la stratégie agressive de Deepseek sur le marché des API. Cette annonce intervient dans un contexte où les grands acteurs occidentaux font l'inverse : face à l'explosion des usages agentiques, OpenAI et Anthropic ont récemment revu leurs prix à la hausse et imposé des plafonds de consommation sur certains modèles. Deepseek propose une alternative performante à une fraction du coût, ce qui représente une pression directe sur les marges et les modèles économiques des leaders du secteur. Pour les développeurs et les entreprises qui cherchent à déployer des agents autonomes à grande échelle, l'équation coût-performance devient difficile à ignorer. Deepseek s'est imposé depuis début 2025 comme l'un des acteurs les plus disruptifs du marché mondial des LLM, en montrant qu'il est possible d'obtenir des résultats compétitifs avec des budgets d'entraînement bien inférieurs à ceux de ses concurrents américains. La publication du papier technique accompagnant V4-Pro et V4-Flash s'inscrit dans cette logique de transparence qui renforce la crédibilité du laboratoire et alimente le débat sur l'avantage réel des géants du cloud face à une concurrence ouverte et low-cost.

UELes développeurs et entreprises européens déployant des agents autonomes peuvent réduire significativement leurs coûts d'API en adoptant DeepSeek V4-Pro/V4-Flash, remettant en question l'équation coût-performance avec leurs fournisseurs actuels.

LLMsOpinion

1 source

GLM-5.2 : meilleur modèle de codage frontend au monde, IndexShare pour le décodage spéculatif

52

2Latent Space

GLM-5.2 : meilleur modèle de codage frontend au monde, IndexShare pour le décodage spéculatif

Z.ai a publié GLM-5.2 le week-end du 14-15 juin 2026, un modèle de langage open-weight sous licence MIT, architecturé en mixture-of-experts avec 744 milliards de paramètres au total et 40 milliards actifs par token. Le modèle intègre une fenêtre de contexte d'un million de tokens, deux modes de raisonnement (high et max), et est disponible au même tarif que son prédécesseur GLM-5.1, soit 1,4 dollar par million de tokens en entrée et 4,4 dollars en sortie. Dès le premier jour, le support a été assuré par une dizaine d'infrastructures et plateformes majeures : vLLM, SGLang, Cloudflare Workers AI, OpenRouter, Ollama, Baseten, DeepInfra, Fireworks et Notion. Sur les benchmarks indépendants, les résultats sont remarquables : troisième place sur FrontierSWE (derrière Fable 5 et Claude Opus 4.8, mais devant GPT-5.5), première place sur le Design Arena avec un Elo de 1360, et premier modèle open-source de loin sur l'Agent Arena, classé dixième toutes catégories confondues. Sur le Code Arena Frontend, GLM-5.2 devance l'ensemble des versions d'Opus, y compris la 4.8. C'est précisément ce dernier point qui rend la sortie significative. Le front-end est considéré comme un terrain d'affrontement décisif entre modèles de code, et le fait qu'un modèle open-weight batte tous les Claude Opus sur ce segment constitue une première. Des praticiens ayant eu accès anticipé, dont le YouTubeur technique Sentdex, ont déclaré que GLM-5.2 est le premier modèle open-source qu'ils pourraient concrètement substituer à Opus ou GPT dans leurs workflows professionnels. Pour les développeurs et les entreprises, cela signifie une alternative crédible, sans frais de licence propriétaire, pour des tâches de génération de code intensives ou des agents autonomes à longue durée d'exécution. GLM-5.2 s'inscrit dans une trajectoire rapide pour Z.ai, qui avait déjà bousculé le classement des laboratoires open-source avec GLM-5 en début d'année, devançant DeepSeek, Mistral, Cohere et Moonshot sur la plupart des évaluations. La version 5.1 n'était qu'une mise à jour mineure ; le 5.2 représente un saut architectural plus substantiel, avec une extension de DeepSeek Sparse Attention baptisée IndexShare, conçue pour améliorer l'efficacité sur les très longs contextes, et une amélioration du mécanisme de prédiction multi-token pour la décoding spéculative. La sortie a été qualifiée d'"opportuniste" par certains observateurs, intervenant dans la foulée de la controverse liée à l'interdiction de Fable 5 dans certains contextes, une affaire toujours non résolue. Z.ai semble avoir profité du vide pour s'imposer comme la référence open-source du moment en matière de code et d'agents.

UELes entreprises et développeurs européens peuvent déployer GLM-5.2 librement sous licence MIT via Ollama ou des plateformes tierces, offrant une alternative crédible aux modèles propriétaires américains pour les projets de code intensif et d'agents autonomes.

💬 Le front-end, c'est l'épreuve reine pour les modèles de code. GLM-5.2 vient de battre tous les Claude Opus sur ce segment, en open-weight MIT, avec un timing qu'on ne peut pas qualifier d'innocent vu la situation autour de Fable 5. Si ça tient en prod, ça va faire réfléchir beaucoup d'équipes sur leurs budgets d'API.

LLMsOpinion

1 source

Fable 5 bloqué : la Chine lance GLM-5.2, une solution open source

51

3Le Big Data

Fable 5 bloqué : la Chine lance GLM-5.2, une solution open source

Le 16 juin 2026, l'entreprise chinoise Zhipu a lancé GLM-5.2, un modèle d'intelligence artificielle en accès libre ciblant directement les tâches de programmation agentique et de raisonnement complexe. Disponible sur Ollama et Hugging Face sous licence MIT, le modèle embarque une fenêtre de contexte d'un million de jetons et propose deux niveaux de raisonnement : un mode "Max" orienté performances maximales et un mode "High" offrant un meilleur équilibre entre puissance et consommation. Sur les benchmarks publiés par Zhipu, GLM-5.2 affiche 81,0 % sur Terminal-Bench, 62,1 % sur SWE-bench Pro et 74,4 % sur Frontier SWE. Sur Design Arena, il décroche la première place avec un score Elo de 1360, devançant Claude Fable 5, et se classe deuxième sur Code Arena Frontend. Le lancement intervient au moment précis où Anthropic a suspendu l'accès à Claude Fable 5, offrant à GLM-5.2 une fenêtre de visibilité rare sur le marché. Pour les développeurs, l'enjeu est concret : la publication des poids sous licence MIT permet d'exécuter le modèle localement, de l'adapter à des cas d'usage spécifiques et de l'intégrer dans des pipelines sans dépendance à une API commerciale. Une fenêtre de contexte à un million de jetons combinée à de solides résultats sur les benchmarks de correction de bugs réels et de génération d'interfaces ouvre des perspectives directes pour l'automatisation du développement logiciel, la recherche assistée et les agents autonomes de longue durée. Il faut toutefois nuancer l'étiquette "open source" : si les poids du modèle sont bien publiés, les données d'entraînement, les pipelines de filtrage et le code complet ayant servi à l'entraîner restent privés. GLM-5.2 est donc plus précisément un modèle "open weight", une distinction qui compte pour les chercheurs et les équipes de sécurité souhaitant auditer ou reproduire le système. Par ailleurs, les chiffres de performance avancés par Zhipu n'ont pas encore été confirmés par des évaluations indépendantes. Ce lancement s'inscrit dans une tendance plus large : les laboratoires chinois, portés par des investissements massifs et l'urgence stratégique de contourner les restrictions américaines sur les semi-conducteurs, enchaînent les sorties de modèles compétitifs à un rythme soutenu. GLM-5.2 vient directement concurrencer les modèles de code occidentaux au moment où le leader de facto du secteur est temporairement indisponible.

UELes développeurs européens peuvent déployer GLM-5.2 localement via Ollama et Hugging Face sous licence MIT, offrant une alternative concrète aux modèles fermés pour les pipelines d'automatisation de code et les agents autonomes.

💬 Timing parfait pour Zhipu. Un modèle MIT avec 1M de contexte qui sort exactement quand Fable 5 est en pause forcée, c'est soit du hasard soit un calendrier très bien travaillé. Les benchmarks sont auto-publiés et "open weight" n'est pas "open source" (les données d'entraînement restent privées), mais pour faire tourner ça en local sans dépendance à une API commerciale, c'est du concret.

LLMsOpinion

1 source

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis

56

4Numerama

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis

DeepSeek vient de publier DeepSeek-V4-Preview, une famille de deux modèles open weight conçus pour rivaliser avec les meilleurs systèmes d'IA propriétaires américains. Le laboratoire chinois annonce un coût d'utilisation sept fois inférieur à celui de Claude Opus 4.7 d'Anthropic, ce qui en fait l'un des modèles les plus compétitifs du marché en termes de rapport performance-prix. Les poids sont accessibles librement, permettant à n'importe quelle entreprise ou développeur de les déployer sans dépendre des API américaines. L'impact est immédiat pour les équipes techniques et les entreprises qui cherchent à réduire leurs coûts d'inférence. Un modèle open weight de ce niveau de performance signifie qu'on peut l'héberger soi-même, adapter les poids, et s'affranchir des conditions d'utilisation imposées par OpenAI, Anthropic ou Google. Pour les marchés émergents et les entreprises européennes soucieuses de souveraineté numérique, c'est une alternative concrète aux géants américains. Ce lancement s'inscrit dans la continuité directe du coup de tonnerre de janvier 2025, lorsque DeepSeek-R1 avait provoqué un effondrement boursier des valeurs tech américaines en démontrant qu'on pouvait former des modèles de pointe à moindre coût. La Maison-Blanche surveille désormais de près les pratiques des laboratoires chinois, notamment sur les questions d'accès aux puces et de transfert technologique. Avec V4, DeepSeek confirme une stratégie délibérée : rendre l'open source suffisamment attractif pour décrocher les utilisateurs mondiaux des écosystèmes américains.

UELes entreprises européennes soucieuses de souveraineté numérique disposent d'une alternative open weight auto-hébergeable aux API américaines, réduisant leur dépendance aux conditions d'utilisation imposées par OpenAI, Anthropic ou Google.

💬 Sept fois moins cher que Claude Opus 4.7, open weight, que tu peux héberger toi-même sans dépendre d'une API américaine : on est loin du coup de com'. DeepSeek ne construit pas juste un modèle compétitif, ils construisent une porte de sortie pour toutes les boîtes qui en ont marre des conditions d'utilisation qui changent et des prix qui grimpent. Reste à tester si ça tient en prod.

LLMsOpinion

1 source

Le PDG de Snowflake juge GLM-5.2 aussi compétitif qu'Opus 4.7, pour une fraction du prix

À lire aussi

L'IA à base d'agents pousse les prix à la hausse, Deepseek sort un modèle compétitif pour presque rien

GLM-5.2 : meilleur modèle de codage frontend au monde, IndexShare pour le décodage spéculatif

Fable 5 bloqué : la Chine lance GLM-5.2, une solution open source

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis