Aller au contenu principal
Analyse hebdomadaireSemaine du 22 juin 2026

GLM-5.2, VibeThinker, DeepSeek : la semaine où la Chine a pris l'open-weight

Fable 5 venait d'être lancé au public ; Mythos 5, sa version réservée à des usages autorisés, était visée aussi. Trois jours plus tard, Anthropic désactivait les deux modèles pour tous, sous la contrainte d'un ordre américain. Au même moment, Z.ai libère GLM-5.2 sous licence MIT. Décryptage d'un basculement.

Mathieu Bocquillon|14 min de lecture|32 articles de 11 sources|2 904 mots

En 30 secondes

Fable 5 coupé sous contrainte américaine, GLM-5.2 libéré sous licence MIT au même moment : la vraie fracture de la semaine n'oppose plus modèles ouverts et fermés, mais ce que vous contrôlez (poids + exécution) à ce qu'on peut vous couper. Avec les chiffres (DeepSeek +7 Md$, OpenAI -3,7 Md$/trim.) et 4 prédictions datées, à échéance.

Fable 5 coupé, GLM-5.2 libéré : à gauche un serveur hébergé éteint et verrouillé, à droite un coffre de poids ouverts qui se libèrent

Il aura suffi de trois jours. Trois jours entre le lancement public de Fable 5 et la désactivation des deux modèles, Fable 5 et Mythos 5, par Anthropic, sous l'effet d'un ordre américain de contrôle des exportations.

Pendant que clients, développeurs et entreprises découvraient qu'un modèle hébergé peut s'éteindre du jour au lendemain par décision politique, la startup chinoise Z.ai publiait GLM-5.2. 753 milliards de paramètres. Licence MIT. Téléchargeable et inarrêtable.

Le télescopage est trop fort pour être ignoré. Même sans coordination, il raconte le basculement de la semaine.

J'ai croisé 32 articles de la semaine pour comprendre ce qui s'est joué. La conclusion tient en une phrase : l'IA vient de devenir une infrastructure géopolitique, et un service hébergé est révocable par décision d'État.

Pourquoi la coupure de Fable 5 a-t-elle fait basculer toute la semaine ?

Reprenons les faits. Fable 5 venait d'être lancé au public ; Mythos 5, sa version plus puissante réservée à des usages autorisés, était visée aussi. L'administration américaine a interdit l'accès des ressortissants étrangers aux deux modèles. Compte tenu du périmètre de l'ordre, Anthropic a choisi de les désactiver pour tous les utilisateurs. Pas une panne. Une décision.

Ce qui s'est passé là dépasse l'incident technique. Un modèle propriétaire hébergé n'est pas un actif que tu possèdes. C'est un service que l'on peut te retirer. Le « kill switch souverain » n'est plus une hypothèse de séminaire sur la souveraineté numérique : c'est arrivé, en direct, sur deux des modèles les plus attendus de l'année.

Et l'onde de choc a été immédiate côté européen. Des milliers d'entreprises ont bâti des produits critiques sur des API hébergées aux États-Unis. Elles ont découvert cette semaine que leur fournisseur stratégique pouvait être débranché par un décret qui ne les concerne même pas directement.

À retenir : le contrôle des exportations (export controls) est le mécanisme par lequel un État restreint l'accès étranger à une technologie jugée stratégique. Appliqué à un modèle hébergé dans le cloud, il permet de couper l'accès à distance, sans préavis. Un fournisseur d'IA devient alors un point de défaillance géopolitique.

Le réveil est brutal parce qu'il est tardif. On parlait de dépendance technologique comme d'un risque abstrait. Cette semaine, ce risque a pris la forme d'un écran qui ne répond plus.

La question n'est donc plus « quel est le meilleur modèle ». Elle est devenue « qui peut me le couper, et quand ».

GLM-5.2 rivalise-t-il vraiment avec GPT-5.5 sur le codage, ou est-ce du marketing de benchmark ?

Posons les chiffres avant l'opinion. GLM-5.2 est une architecture mixture-of-experts (le modèle est découpé en multiples sous-réseaux spécialisés, les « experts », dont une petite fraction seulement s'active à chaque token : on obtient la puissance d'un très gros modèle pour le coût de calcul d'un bien plus petit), avec 744 à 753 milliards de paramètres au total mais environ 40 milliards seulement actifs par token (VentureBeat, Latent Space). Fenêtre de contexte stable d'un million de tokens. Deux niveaux d'effort de raisonnement, « high » et « max ». Licence MIT. Tarif identique à GLM-5.1 : 1,4 dollar le million de tokens en entrée, 4,4 en sortie.

Détail qui compte : Z.ai a d'abord lancé le modèle sans aucun benchmark (MarkTechPost). Puis l'entreprise a revendiqué le dépassement de GPT-5.5 sur le codage de longue durée, et le titre de meilleur modèle au monde pour le frontend (la génération d'interfaces web, le code HTML/CSS/JavaScript que voit l'utilisateur), devant tous les Claude Opus (Latent Space). Sur FrontierSWE, un benchmark conçu pour des tâches de programmation de plusieurs heures, le modèle n'affiche qu'un point de retard sur Claude Opus 4.8 (The Decoder).

À retenir : un modèle « open-weight » diffuse ses paramètres entraînés (téléchargeables, exécutables, modifiables) mais pas forcément ses données ni son code d'entraînement. La licence MIT est ici déterminante : elle autorise l'usage commercial sans restriction, contrairement aux licences « communautaires » plus fermées qu'on voit ailleurs.

Mais les benchmarks auto-publiés, on sait ce que ça vaut. Le signal qui pèse vraiment est ailleurs.

Jeremy Howard, chercheur réputé peu porté sur l'enthousiasme facile, déclare que GLM-5.2 lui semble « au moins aussi bon qu'Opus 4.8 et GPT-5.5 » pour ses usages quotidiens (Latent Space). C'est la première fois qu'un praticien exigeant dit utiliser un modèle open-weight au quotidien, à la place des modèles fermés.

Ça, ça pèse plus qu'un score sur un leaderboard. Le vrai test d'un modèle, c'est la conviction qu'il tient en production, pas sa ligne dans un tableau.

Le point de vue contraire : « open weight » n'est pas « open source ». Les données d'entraînement de GLM-5.2 restent privées, les benchmarks de lancement étaient auto-publiés, et le modèle n'a pas de support visuel. On confond facilement « téléchargeable » et « auditable ». Ce n'en est pas un.

Reste que pour une équipe qui code, l'arbitrage a changé. Un modèle MIT, à 1M de contexte, qui passe devant GPT-5.5 sur le frontend, pour un sixième du coût et auto-hébergeable. La question n'est plus « est-ce crédible », mais « pourquoi je ne testerais pas ».

La Chine gagne-t-elle sur le coût et l'efficacité plutôt que sur l'ouverture ?

Il faut nommer ce qui décide vraiment dans une équipe technique. Ce n'est pas l'idéologie de l'ouverture. C'est le prix.

GLM-5.2 délivre des performances de frontière pour un sixième du coût de GPT-5.5 (VentureBeat). À cette asymétrie-là, le débat philosophique sur l'open source passe au second plan. Un facteur six sur la facture d'inférence, ça se défend tout seul devant un directeur financier.

Et l'efficacité chinoise ne s'arrête pas aux gros modèles. VibeThinker-3B, publié par neuf chercheurs de Sina Weibo, ne compte que 3 milliards de paramètres (VentureBeat). Il est dérivé de Qwen2.5-Coder-3B via un pipeline baptisé Spectrum-to-Signal (MarkTechPost). Sur AIME26, il atteint 94,3, un score comparable à DeepSeek V3.2 (671 milliards de paramètres) et à Kimi K2.5 (1 000 milliards). Sur LiveCodeBench v6, il affiche 80,2 en Pass@1.

Ces chiffres viennent du rapport de lancement et demandent réplication indépendante. Mais s'ils tiennent, c'est un modèle cent fois plus petit qui tient tête sur le raisonnement mathématique. Lis bien : cent fois.

À retenir : VibeThinker rouvre le débat sur la contamination des benchmarks, ces scores gonflés par la présence des questions de test dans les données d'entraînement. Les domaines à réponse vérifiable (maths, code exécutable) résistent mieux à cette contamination. C'est pour ça que leur poids comme preuve réelle de capacité ne cesse de grandir.

La vraie leçon de VibeThinker n'est pas que les benchmarks sont cassés. C'est que le raisonnement vérifiable se compresse bien dans un petit modèle, alors que la connaissance encyclopédique non. Un 3B cartonne sur l'AIME mais s'effondre sur les questions de culture générale. Ça dessine une carte précise de ce qu'on peut faire tourner en local.

Même logique chez Liquid AI, qui bat Alibaba sur 11 langues avec 40 % de paramètres en moins (MarkTechPost). Ses modèles LFM2.5 de 350 millions de paramètres couvrent le français nativement et tournent sur du matériel grand public.

La frontière se déplace. Elle ne se mesure plus en taille brute, mais en rapport performance sur coût. Et sur ce terrain, l'écosystème chinois avance plus vite que les autres.

Pendant que la Chine s'ouvre, l'Occident se ferme et se verticalise ?

Regarde le mouvement inverse, côté américain. Pendant que Pékin distribue, San Francisco consolide.

SpaceX rachète Cursor pour 60 milliards de dollars, intégralement en actions, deux jours après son IPO record au Nasdaq (Ars Technica, Next INpact). Même mouvement ailleurs : OpenAI absorbe Ona, Salesforce avale Fin. Chacun verrouille sa couche applicative.

C'est le premier grand exit de l'IA (Ben's Bites). Et le signal est net : la valeur durable se construit dans les outils du quotidien, pas dans les labos. SpaceX loue ses datacenters à Anthropic et Google, et rachète l'IDE où les devs utilisent ces mêmes modèles tous les jours. Du double jeu assumé, pas de la diversification naïve.

À retenir : l'intégration verticale consiste à posséder toute la chaîne (puces, datacenters, modèle, application, distribution) pour capter la valeur et verrouiller les utilisateurs. Le rachat de Cursor par SpaceX, c'est le pari que la valeur migre du modèle vers l'outil de travail quotidien du développeur.

Mais cette fermeture coûte cher. Très cher.

Les documents financiers d'OpenAI ont fuité avant l'IPO (Ars Technica, Next INpact). Croissance spectaculaire : 13,07 milliards de dollars de revenus en 2025 contre 3,7 milliards en 2024. Mais au premier trimestre 2026, l'entreprise a brûlé 3,7 milliards de dollars de trésorerie, plus de la moitié de ses 5,7 milliards de revenus sur la période (The Information). Sur l'année, on parle de 34 milliards de coûts pour 13 de revenus.

Ce modèle ne tient que tant que tu lèves à vitesse grand V. Ce n'est pas une stratégie, c'est une course contre l'épuisement du capital.

Et le symbole le plus parlant vient d'Apple. Siri, sur iOS 27, ne fonctionne qu'en branchant Gemini de Google par-dessous (Next INpact). Le champion historique de l'intégration verticale, celui qui contrôle tout de la puce à l'app, a dû sous-traiter son intelligence à un concurrent. Aveu de dépendance d'un acteur qui en faisait sa marque de fabrique.

L'argent parie-t-il sur l'ouverture, ou sur l'infrastructure qui la fait tourner ?

Suis l'argent, il dit toujours quelque chose. Et cette semaine, il dit beaucoup.

DeepSeek lève plus de 7 milliards de dollars, pour une valorisation de 52 à 59 milliards (Le Big Data). Détail croustillant : le fondateur Liang Wenfeng a lui-même injecté près de 20 milliards de yuans, devenant le principal investisseur de son propre tour. Mistral viserait 20 milliards d'euros après une levée de 3 milliards (Le Big Data). Temasek, le fonds souverain singapourien, triple son exposition à l'IA pour atteindre 75 milliards de dollars d'ici 2030 (The Information). Nvidia émet 20 milliards de dette (Le Big Data).

Quand Temasek triple sa mise, ce ne sont plus les fous furieux du capital-risque qui alimentent la machine. Ce sont les institutions prudentes. Elles ne suivent pas les modes, elles les valident.

Mais le glissement le plus instructif est ailleurs. Baseten, spécialiste de l'inférence, est en passe de lever 1,5 milliard de dollars, valorisation à 13 milliards, soit +160 % en six mois (Le Big Data). Servir les modèles devient le vrai centre de coût, devant l'entraînement.

À retenir : historiquement, le coût de l'IA était dominé par l'entraînement (créer le modèle). Avec des modèles ouverts et performants disponibles, le centre de gravité économique se déplace vers l'inférence (les faire tourner à grande échelle). C'est ce qui explique l'explosion des valorisations chez les spécialistes du serving comme Baseten.

Et puis il y a l'effet boucle, presque comique. Ineffable Intelligence, fondée par David Silver (le père d'AlphaGo), lève 1,1 milliard de dollars pour réentraîner ses modèles sur... l'infra Google (Le Big Data).

Le serpent qui se mord la queue, version superintelligence. Le capital finance autant l'écosystème que la dépendance qui le sous-tend.

L'open-weight chinois est-il une bouée de sauvetage ou un cadeau empoisonné pour l'Europe ?

C'est là que la semaine devient inconfortable pour nous.

Après la coupure de Fable 5, le choix qui se présente à une entreprise européenne est piégé. D'un côté, un modèle US révocable du jour au lendemain. De l'autre, un modèle chinois open-weight mais d'origine géopolitiquement sensible, avec ses questions de gouvernance des données (FrenchWeb). Ce n'est pas un vrai choix de souveraineté. C'est un arbitrage entre deux dépendances.

La carte que l'Europe a en main s'appelle Mistral. Valorisée près de 20 milliards d'euros, c'est le seul actif crédible pour une troisième voie (Le Big Data). Un modèle non américain, ouvert et propriétaire, avec des contrats gouvernementaux. Mais l'écart de capitalisation avec OpenAI et DeepSeek reste abyssal. 20 milliards d'euros face à des acteurs qui lèvent ça en un seul tour.

Le point de vue contraire : adopter GLM-5.2 ou DeepSeek aujourd'hui parce que c'est ouvert et bon marché, c'est construire une dépendance dont on sortira difficilement dans cinq ans. Les boîtes qui basculent maintenant le font pour le coût. Elles héritent en prime des questions de souveraineté des données, de RGPD et d'AI Act, encore largement sous-estimées.

Le vrai enseignement n'est pas dans le drapeau du fournisseur. Il est dans l'architecture.

La seule garantie de continuité, c'est le contrôle des poids et de l'infrastructure d'exécution. Pas la marque. Un modèle open-weight que tu héberges toi-même, sur une infra que tu contrôles, ne peut pas être coupé par décret de Washington. C'est la leçon froide de Fable 5, et elle vaut quel que soit l'endroit où le modèle a été entraîné.

Une précision tout de même : auto-hébergeable ne veut pas dire léger. GLM-5.2 reste un très gros modèle, qui demande une infrastructure sérieuse. Son intérêt souverain tient au contrôle des poids et du lieu d'exécution, pas à une installation triviale sur un serveur d'entreprise standard. Le « local sur matériel raisonnable », c'est plutôt VibeThinker-3B ou les petits LFM2.5 de Liquid AI.

Ce que ça signifie pour vous

Pour les développeurs et équipes techniques

Téléchargez et testez GLM-5.2 dès maintenant. Un modèle MIT à 1M de contexte qui passe devant GPT-5.5 sur le frontend, à un sixième du coût, ça change votre arbitrage build/buy en profondeur.

Concevez vos pipelines pour être model-agnostic. Une couche d'abstraction sur le fournisseur, pour qu'une coupure comme celle de Fable 5 ne casse pas votre prod du jour au lendemain.

Et regardez sérieusement les petits modèles. VibeThinker-3B, les LFM2.5 de Liquid AI à 350M. Pour les tâches à réponse vérifiable, hébergeables on-premise sur du matériel raisonnable, ils règlent beaucoup de problèmes sans API externe.

Pour les décideurs et dirigeants

Tout SaaS critique reposant sur un modèle hébergé américain est désormais exposé à un risque réglementaire de coupure. Auditez votre exposition. Exigez un plan de continuité de vos fournisseurs.

L'asymétrie de coût (facteur six) rend l'open-weight chinois économiquement irrésistible. Mais arbitrez le risque géopolitique de chaque origine, données comprises. L'économie ne doit pas masquer la gouvernance.

Enfin, lisez les pertes d'OpenAI pour ce qu'elles sont : 3,7 milliards par trimestre ne disent pas seulement quelque chose du prix des API. Elles disent surtout que la course aux modèles propriétaires exige un niveau de capital que seuls quelques acteurs peuvent soutenir. Anticipez les hausses, ou les consolidations.

Pour l'écosystème français et européen

La coupure de Fable 5 est l'argument politique le plus puissant en faveur de Mistral et d'une infra d'inférence souveraine européenne. À saisir maintenant, pas dans deux ans.

La vraie souveraineté n'est pas la marque, c'est le contrôle des poids et du lieu d'exécution. Privilégiez l'open-weight hébergé dans l'UE plutôt que n'importe quel cloud étranger, américain ou chinois.

Le risque à éviter est clair : troquer une dépendance américaine révocable contre une dépendance chinoise tout aussi fragile, sans jamais construire sa propre capacité. Ce serait changer de chaîne, pas s'en libérer.

Le mot de la fin

Le méta-signal de la semaine n'est ni la Chine, ni les benchmarks. C'est que l'IA est devenue une infrastructure géopolitique, et qu'un service hébergé est révocable par décision d'État.

La fracture qui compte désormais n'oppose plus les modèles ouverts aux modèles fermés. Elle oppose ceux que vous contrôlez (poids plus exécution) à ceux qu'on peut vous couper.

La coupure de Fable 5 a transformé une question d'architecture en question de souveraineté. Et l'open-weight, peu importe son drapeau, n'est plus une option militante. C'est une assurance.

Nos prédictions

PrédictionHorizonConfianceStatut
Au moins un grand fournisseur cloud européen (OVHcloud, Scaleway ou équivalent) annoncera une offre d'hébergement managé de GLM-5.2 ou d'un modèle open-weight équivalent, positionnée explicitement sur l'argument de souveraineté/anti-kill-switch3 moishauteEn cours
Z.ai tiendra sa promesse de sortir 'Open Fable' en décembre 2026, confirmant une stratégie chinoise délibérée d'occupation du créneau libéré par la fermeture des modèles US6 moismoyenneEn cours
La Commission européenne ou un État membre intégrera explicitement le risque de 'coupure d'accès par contrôle d'export' dans une recommandation ou un texte sur la souveraineté numérique, citant le précédent Fable 56 moismoyenneEn cours
Au moins une entreprise du CAC 40 ou un grand acteur public français annoncera une migration partielle d'une charge de production depuis une API US propriétaire vers un modèle open-weight auto-hébergé1 anmoyenneEn cours

Questions fréquentes

Pourquoi Fable 5 a-t-il été coupé ?
Trois jours après le lancement public de Fable 5, l'administration américaine a interdit l'accès des ressortissants étrangers à Fable 5 et à Mythos 5 (sa version réservée à des usages autorisés). Vu le périmètre de l'ordre, Anthropic a désactivé les deux modèles pour tous. Comme ils étaient hébergés dans le cloud, l'accès a pu être coupé à distance, sans préavis.
GLM-5.2 est-il vraiment meilleur que GPT-5.5 ?
Sur plusieurs benchmarks de codage long-terme et sur le développement frontend, GLM-5.2 dépasse GPT-5.5 selon Z.ai et des praticiens indépendants, pour environ un sixième du coût. Sur le raisonnement général, l'écart se resserre mais GPT-5.5 reste compétitif.
Qu'est-ce qu'un modèle open-weight et pourquoi est-ce important ?
Un modèle open-weight diffuse ses paramètres entraînés, téléchargeables et exécutables localement. Sous licence MIT comme GLM-5.2, il est utilisable commercialement sans restriction — et surtout impossible à couper à distance, contrairement à une API hébergée.
L'Europe a-t-elle une alternative crédible aux modèles US et chinois ?
Mistral, valorisée près de 20 milliards d'euros, est le principal candidat européen. Mais l'écart de financement avec OpenAI ou DeepSeek reste considérable. La vraie souveraineté passe aussi par le contrôle de l'infrastructure d'inférence, pas seulement par le modèle.
Faut-il utiliser un modèle chinois comme GLM-5.2 en production ?
Techniquement, oui : licence MIT, 1M de contexte, coûts six fois inférieurs et auto-hébergeable. Le vrai arbitrage est le risque géopolitique d'origine et la gouvernance des données ; auto-héberger les poids sur une infra que vous contrôlez neutralise l'essentiel du risque.

Sources

Cette analyse vous a été utile ?

Les chiffres derrière l'analyse

Le Baromètre IA mesure chaque semaine qui domine la couverture médiatique — entités, concepts et tendances.

Suivi en continu

Cette analyse touche les sujets suivants — chaque hub agrège l'actualité quotidienne de l'entité.

Une analyse comme celle-ci chaque semaine

Abonnez-vous pour recevoir l'analyse hebdomadaire directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic