GLM-5.2, VibeThinker, DeepSeek : la semaine où la Chine a pris l'open-weight
Fable 5 venait d'être lancé au public ; Mythos 5, sa version réservée à des usages autorisés, était visée aussi. Trois jours plus tard, Anthropic désactivait les deux modèles pour tous, sous la contrainte d'un ordre américain. Au même moment, Z.ai libère GLM-5.2 sous licence MIT. Décryptage d'un basculement.
En 30 secondes
Fable 5 coupé sous contrainte américaine, GLM-5.2 libéré sous licence MIT au même moment : la vraie fracture de la semaine n'oppose plus modèles ouverts et fermés, mais ce que vous contrôlez (poids + exécution) à ce qu'on peut vous couper. Avec les chiffres (DeepSeek +7 Md$, OpenAI -3,7 Md$/trim.) et 4 prédictions datées, à échéance.

Il aura suffi de trois jours. Trois jours entre le lancement public de Fable 5 et la désactivation des deux modèles, Fable 5 et Mythos 5, par Anthropic, sous l'effet d'un ordre américain de contrôle des exportations.
Pendant que clients, développeurs et entreprises découvraient qu'un modèle hébergé peut s'éteindre du jour au lendemain par décision politique, la startup chinoise Z.ai publiait GLM-5.2. 753 milliards de paramètres. Licence MIT. Téléchargeable et inarrêtable.
Le télescopage est trop fort pour être ignoré. Même sans coordination, il raconte le basculement de la semaine.
J'ai croisé 32 articles de la semaine pour comprendre ce qui s'est joué. La conclusion tient en une phrase : l'IA vient de devenir une infrastructure géopolitique, et un service hébergé est révocable par décision d'État.
Pourquoi la coupure de Fable 5 a-t-elle fait basculer toute la semaine ?
Reprenons les faits. Fable 5 venait d'être lancé au public ; Mythos 5, sa version plus puissante réservée à des usages autorisés, était visée aussi. L'administration américaine a interdit l'accès des ressortissants étrangers aux deux modèles. Compte tenu du périmètre de l'ordre, Anthropic a choisi de les désactiver pour tous les utilisateurs. Pas une panne. Une décision.
Ce qui s'est passé là dépasse l'incident technique. Un modèle propriétaire hébergé n'est pas un actif que tu possèdes. C'est un service que l'on peut te retirer. Le « kill switch souverain » n'est plus une hypothèse de séminaire sur la souveraineté numérique : c'est arrivé, en direct, sur deux des modèles les plus attendus de l'année.
Et l'onde de choc a été immédiate côté européen. Des milliers d'entreprises ont bâti des produits critiques sur des API hébergées aux États-Unis. Elles ont découvert cette semaine que leur fournisseur stratégique pouvait être débranché par un décret qui ne les concerne même pas directement.
À retenir : le contrôle des exportations (export controls) est le mécanisme par lequel un État restreint l'accès étranger à une technologie jugée stratégique. Appliqué à un modèle hébergé dans le cloud, il permet de couper l'accès à distance, sans préavis. Un fournisseur d'IA devient alors un point de défaillance géopolitique.
Le réveil est brutal parce qu'il est tardif. On parlait de dépendance technologique comme d'un risque abstrait. Cette semaine, ce risque a pris la forme d'un écran qui ne répond plus.
La question n'est donc plus « quel est le meilleur modèle ». Elle est devenue « qui peut me le couper, et quand ».
GLM-5.2 rivalise-t-il vraiment avec GPT-5.5 sur le codage, ou est-ce du marketing de benchmark ?
Posons les chiffres avant l'opinion. GLM-5.2 est une architecture mixture-of-experts (le modèle est découpé en multiples sous-réseaux spécialisés, les « experts », dont une petite fraction seulement s'active à chaque token : on obtient la puissance d'un très gros modèle pour le coût de calcul d'un bien plus petit), avec 744 à 753 milliards de paramètres au total mais environ 40 milliards seulement actifs par token (VentureBeat, Latent Space). Fenêtre de contexte stable d'un million de tokens. Deux niveaux d'effort de raisonnement, « high » et « max ». Licence MIT. Tarif identique à GLM-5.1 : 1,4 dollar le million de tokens en entrée, 4,4 en sortie.
Détail qui compte : Z.ai a d'abord lancé le modèle sans aucun benchmark (MarkTechPost). Puis l'entreprise a revendiqué le dépassement de GPT-5.5 sur le codage de longue durée, et le titre de meilleur modèle au monde pour le frontend (la génération d'interfaces web, le code HTML/CSS/JavaScript que voit l'utilisateur), devant tous les Claude Opus (Latent Space). Sur FrontierSWE, un benchmark conçu pour des tâches de programmation de plusieurs heures, le modèle n'affiche qu'un point de retard sur Claude Opus 4.8 (The Decoder).
À retenir : un modèle « open-weight » diffuse ses paramètres entraînés (téléchargeables, exécutables, modifiables) mais pas forcément ses données ni son code d'entraînement. La licence MIT est ici déterminante : elle autorise l'usage commercial sans restriction, contrairement aux licences « communautaires » plus fermées qu'on voit ailleurs.
Mais les benchmarks auto-publiés, on sait ce que ça vaut. Le signal qui pèse vraiment est ailleurs.
Jeremy Howard, chercheur réputé peu porté sur l'enthousiasme facile, déclare que GLM-5.2 lui semble « au moins aussi bon qu'Opus 4.8 et GPT-5.5 » pour ses usages quotidiens (Latent Space). C'est la première fois qu'un praticien exigeant dit utiliser un modèle open-weight au quotidien, à la place des modèles fermés.
Ça, ça pèse plus qu'un score sur un leaderboard. Le vrai test d'un modèle, c'est la conviction qu'il tient en production, pas sa ligne dans un tableau.
Le point de vue contraire : « open weight » n'est pas « open source ». Les données d'entraînement de GLM-5.2 restent privées, les benchmarks de lancement étaient auto-publiés, et le modèle n'a pas de support visuel. On confond facilement « téléchargeable » et « auditable ». Ce n'en est pas un.
Reste que pour une équipe qui code, l'arbitrage a changé. Un modèle MIT, à 1M de contexte, qui passe devant GPT-5.5 sur le frontend, pour un sixième du coût et auto-hébergeable. La question n'est plus « est-ce crédible », mais « pourquoi je ne testerais pas ».
La Chine gagne-t-elle sur le coût et l'efficacité plutôt que sur l'ouverture ?
Il faut nommer ce qui décide vraiment dans une équipe technique. Ce n'est pas l'idéologie de l'ouverture. C'est le prix.
GLM-5.2 délivre des performances de frontière pour un sixième du coût de GPT-5.5 (VentureBeat). À cette asymétrie-là, le débat philosophique sur l'open source passe au second plan. Un facteur six sur la facture d'inférence, ça se défend tout seul devant un directeur financier.
Et l'efficacité chinoise ne s'arrête pas aux gros modèles. VibeThinker-3B, publié par neuf chercheurs de Sina Weibo, ne compte que 3 milliards de paramètres (VentureBeat). Il est dérivé de Qwen2.5-Coder-3B via un pipeline baptisé Spectrum-to-Signal (MarkTechPost). Sur AIME26, il atteint 94,3, un score comparable à DeepSeek V3.2 (671 milliards de paramètres) et à Kimi K2.5 (1 000 milliards). Sur LiveCodeBench v6, il affiche 80,2 en Pass@1.
Ces chiffres viennent du rapport de lancement et demandent réplication indépendante. Mais s'ils tiennent, c'est un modèle cent fois plus petit qui tient tête sur le raisonnement mathématique. Lis bien : cent fois.
À retenir : VibeThinker rouvre le débat sur la contamination des benchmarks, ces scores gonflés par la présence des questions de test dans les données d'entraînement. Les domaines à réponse vérifiable (maths, code exécutable) résistent mieux à cette contamination. C'est pour ça que leur poids comme preuve réelle de capacité ne cesse de grandir.
La vraie leçon de VibeThinker n'est pas que les benchmarks sont cassés. C'est que le raisonnement vérifiable se compresse bien dans un petit modèle, alors que la connaissance encyclopédique non. Un 3B cartonne sur l'AIME mais s'effondre sur les questions de culture générale. Ça dessine une carte précise de ce qu'on peut faire tourner en local.
Même logique chez Liquid AI, qui bat Alibaba sur 11 langues avec 40 % de paramètres en moins (MarkTechPost). Ses modèles LFM2.5 de 350 millions de paramètres couvrent le français nativement et tournent sur du matériel grand public.
La frontière se déplace. Elle ne se mesure plus en taille brute, mais en rapport performance sur coût. Et sur ce terrain, l'écosystème chinois avance plus vite que les autres.
Pendant que la Chine s'ouvre, l'Occident se ferme et se verticalise ?
Regarde le mouvement inverse, côté américain. Pendant que Pékin distribue, San Francisco consolide.
SpaceX rachète Cursor pour 60 milliards de dollars, intégralement en actions, deux jours après son IPO record au Nasdaq (Ars Technica, Next INpact). Même mouvement ailleurs : OpenAI absorbe Ona, Salesforce avale Fin. Chacun verrouille sa couche applicative.
C'est le premier grand exit de l'IA (Ben's Bites). Et le signal est net : la valeur durable se construit dans les outils du quotidien, pas dans les labos. SpaceX loue ses datacenters à Anthropic et Google, et rachète l'IDE où les devs utilisent ces mêmes modèles tous les jours. Du double jeu assumé, pas de la diversification naïve.
À retenir : l'intégration verticale consiste à posséder toute la chaîne (puces, datacenters, modèle, application, distribution) pour capter la valeur et verrouiller les utilisateurs. Le rachat de Cursor par SpaceX, c'est le pari que la valeur migre du modèle vers l'outil de travail quotidien du développeur.
Mais cette fermeture coûte cher. Très cher.
Les documents financiers d'OpenAI ont fuité avant l'IPO (Ars Technica, Next INpact). Croissance spectaculaire : 13,07 milliards de dollars de revenus en 2025 contre 3,7 milliards en 2024. Mais au premier trimestre 2026, l'entreprise a brûlé 3,7 milliards de dollars de trésorerie, plus de la moitié de ses 5,7 milliards de revenus sur la période (The Information). Sur l'année, on parle de 34 milliards de coûts pour 13 de revenus.
Ce modèle ne tient que tant que tu lèves à vitesse grand V. Ce n'est pas une stratégie, c'est une course contre l'épuisement du capital.
Et le symbole le plus parlant vient d'Apple. Siri, sur iOS 27, ne fonctionne qu'en branchant Gemini de Google par-dessous (Next INpact). Le champion historique de l'intégration verticale, celui qui contrôle tout de la puce à l'app, a dû sous-traiter son intelligence à un concurrent. Aveu de dépendance d'un acteur qui en faisait sa marque de fabrique.
L'argent parie-t-il sur l'ouverture, ou sur l'infrastructure qui la fait tourner ?
Suis l'argent, il dit toujours quelque chose. Et cette semaine, il dit beaucoup.
DeepSeek lève plus de 7 milliards de dollars, pour une valorisation de 52 à 59 milliards (Le Big Data). Détail croustillant : le fondateur Liang Wenfeng a lui-même injecté près de 20 milliards de yuans, devenant le principal investisseur de son propre tour. Mistral viserait 20 milliards d'euros après une levée de 3 milliards (Le Big Data). Temasek, le fonds souverain singapourien, triple son exposition à l'IA pour atteindre 75 milliards de dollars d'ici 2030 (The Information). Nvidia émet 20 milliards de dette (Le Big Data).
Quand Temasek triple sa mise, ce ne sont plus les fous furieux du capital-risque qui alimentent la machine. Ce sont les institutions prudentes. Elles ne suivent pas les modes, elles les valident.
Mais le glissement le plus instructif est ailleurs. Baseten, spécialiste de l'inférence, est en passe de lever 1,5 milliard de dollars, valorisation à 13 milliards, soit +160 % en six mois (Le Big Data). Servir les modèles devient le vrai centre de coût, devant l'entraînement.
À retenir : historiquement, le coût de l'IA était dominé par l'entraînement (créer le modèle). Avec des modèles ouverts et performants disponibles, le centre de gravité économique se déplace vers l'inférence (les faire tourner à grande échelle). C'est ce qui explique l'explosion des valorisations chez les spécialistes du serving comme Baseten.
Et puis il y a l'effet boucle, presque comique. Ineffable Intelligence, fondée par David Silver (le père d'AlphaGo), lève 1,1 milliard de dollars pour réentraîner ses modèles sur... l'infra Google (Le Big Data).
Le serpent qui se mord la queue, version superintelligence. Le capital finance autant l'écosystème que la dépendance qui le sous-tend.
L'open-weight chinois est-il une bouée de sauvetage ou un cadeau empoisonné pour l'Europe ?
C'est là que la semaine devient inconfortable pour nous.
Après la coupure de Fable 5, le choix qui se présente à une entreprise européenne est piégé. D'un côté, un modèle US révocable du jour au lendemain. De l'autre, un modèle chinois open-weight mais d'origine géopolitiquement sensible, avec ses questions de gouvernance des données (FrenchWeb). Ce n'est pas un vrai choix de souveraineté. C'est un arbitrage entre deux dépendances.
La carte que l'Europe a en main s'appelle Mistral. Valorisée près de 20 milliards d'euros, c'est le seul actif crédible pour une troisième voie (Le Big Data). Un modèle non américain, ouvert et propriétaire, avec des contrats gouvernementaux. Mais l'écart de capitalisation avec OpenAI et DeepSeek reste abyssal. 20 milliards d'euros face à des acteurs qui lèvent ça en un seul tour.
Le point de vue contraire : adopter GLM-5.2 ou DeepSeek aujourd'hui parce que c'est ouvert et bon marché, c'est construire une dépendance dont on sortira difficilement dans cinq ans. Les boîtes qui basculent maintenant le font pour le coût. Elles héritent en prime des questions de souveraineté des données, de RGPD et d'AI Act, encore largement sous-estimées.
Le vrai enseignement n'est pas dans le drapeau du fournisseur. Il est dans l'architecture.
La seule garantie de continuité, c'est le contrôle des poids et de l'infrastructure d'exécution. Pas la marque. Un modèle open-weight que tu héberges toi-même, sur une infra que tu contrôles, ne peut pas être coupé par décret de Washington. C'est la leçon froide de Fable 5, et elle vaut quel que soit l'endroit où le modèle a été entraîné.
Une précision tout de même : auto-hébergeable ne veut pas dire léger. GLM-5.2 reste un très gros modèle, qui demande une infrastructure sérieuse. Son intérêt souverain tient au contrôle des poids et du lieu d'exécution, pas à une installation triviale sur un serveur d'entreprise standard. Le « local sur matériel raisonnable », c'est plutôt VibeThinker-3B ou les petits LFM2.5 de Liquid AI.
Ce que ça signifie pour vous
Pour les développeurs et équipes techniques
Téléchargez et testez GLM-5.2 dès maintenant. Un modèle MIT à 1M de contexte qui passe devant GPT-5.5 sur le frontend, à un sixième du coût, ça change votre arbitrage build/buy en profondeur.
Concevez vos pipelines pour être model-agnostic. Une couche d'abstraction sur le fournisseur, pour qu'une coupure comme celle de Fable 5 ne casse pas votre prod du jour au lendemain.
Et regardez sérieusement les petits modèles. VibeThinker-3B, les LFM2.5 de Liquid AI à 350M. Pour les tâches à réponse vérifiable, hébergeables on-premise sur du matériel raisonnable, ils règlent beaucoup de problèmes sans API externe.
Pour les décideurs et dirigeants
Tout SaaS critique reposant sur un modèle hébergé américain est désormais exposé à un risque réglementaire de coupure. Auditez votre exposition. Exigez un plan de continuité de vos fournisseurs.
L'asymétrie de coût (facteur six) rend l'open-weight chinois économiquement irrésistible. Mais arbitrez le risque géopolitique de chaque origine, données comprises. L'économie ne doit pas masquer la gouvernance.
Enfin, lisez les pertes d'OpenAI pour ce qu'elles sont : 3,7 milliards par trimestre ne disent pas seulement quelque chose du prix des API. Elles disent surtout que la course aux modèles propriétaires exige un niveau de capital que seuls quelques acteurs peuvent soutenir. Anticipez les hausses, ou les consolidations.
Pour l'écosystème français et européen
La coupure de Fable 5 est l'argument politique le plus puissant en faveur de Mistral et d'une infra d'inférence souveraine européenne. À saisir maintenant, pas dans deux ans.
La vraie souveraineté n'est pas la marque, c'est le contrôle des poids et du lieu d'exécution. Privilégiez l'open-weight hébergé dans l'UE plutôt que n'importe quel cloud étranger, américain ou chinois.
Le risque à éviter est clair : troquer une dépendance américaine révocable contre une dépendance chinoise tout aussi fragile, sans jamais construire sa propre capacité. Ce serait changer de chaîne, pas s'en libérer.
Le mot de la fin
Le méta-signal de la semaine n'est ni la Chine, ni les benchmarks. C'est que l'IA est devenue une infrastructure géopolitique, et qu'un service hébergé est révocable par décision d'État.
La fracture qui compte désormais n'oppose plus les modèles ouverts aux modèles fermés. Elle oppose ceux que vous contrôlez (poids plus exécution) à ceux qu'on peut vous couper.
La coupure de Fable 5 a transformé une question d'architecture en question de souveraineté. Et l'open-weight, peu importe son drapeau, n'est plus une option militante. C'est une assurance.
Nos prédictions
| Prédiction | Horizon | Confiance | Statut |
|---|---|---|---|
| Au moins un grand fournisseur cloud européen (OVHcloud, Scaleway ou équivalent) annoncera une offre d'hébergement managé de GLM-5.2 ou d'un modèle open-weight équivalent, positionnée explicitement sur l'argument de souveraineté/anti-kill-switch | 3 mois | haute | En cours |
| Z.ai tiendra sa promesse de sortir 'Open Fable' en décembre 2026, confirmant une stratégie chinoise délibérée d'occupation du créneau libéré par la fermeture des modèles US | 6 mois | moyenne | En cours |
| La Commission européenne ou un État membre intégrera explicitement le risque de 'coupure d'accès par contrôle d'export' dans une recommandation ou un texte sur la souveraineté numérique, citant le précédent Fable 5 | 6 mois | moyenne | En cours |
| Au moins une entreprise du CAC 40 ou un grand acteur public français annoncera une migration partielle d'une charge de production depuis une API US propriétaire vers un modèle open-weight auto-hébergé | 1 an | moyenne | En cours |
Questions fréquentes
Pourquoi Fable 5 a-t-il été coupé ?▾
GLM-5.2 est-il vraiment meilleur que GPT-5.5 ?▾
Qu'est-ce qu'un modèle open-weight et pourquoi est-ce important ?▾
L'Europe a-t-elle une alternative crédible aux modèles US et chinois ?▾
Faut-il utiliser un modèle chinois comme GLM-5.2 en production ?▾
Sources
- SpaceX va acquérir la plateforme de codage IA Cursor pour 60 milliards de dollars (Ars Technica AI)
- GLM-5.2 à poids ouverts de Z.ai surpasse GPT-5.5 sur plusieurs benchmarks de codage long terme (VentureBeat AI)
- Mistral serait valorisée 20 milliards d'euros après une levée de 3 milliards (Le Big Data)
- GLM-5.2 rivalise avec GPT ; Z.ai prévoit la sortie d'Open Fable en décembre (Latent Space)
- OpenAI : une croissance fulgurante, mais des pertes colossales (Next INpact)
- Le petit modèle VibeThinker-3B de Weibo relance le débat sur les benchmarks (VentureBeat AI)
- Dans la foulée de son IPO, SpaceX rachète Cursor et ses modèles dédiés aux développeurs (Next INpact)
- Google Cloud soutient l'ambition de superintelligence d'Ineffable Intelligence (Le Big Data)
- Derrière OpenAI, la montée silencieuse des modèles chinois (FrenchWeb)
- DeepSeek réalise une levée géante de plus de 7 milliards de dollars (Le Big Data)
- GLM-5.2 : meilleur modèle de codage frontend au monde, IndexShare pour le décodage spéculatif (Latent Space)
- VibeThinker-3B : modèle de raisonnement dense basé sur Qwen2.5-Coder-3B (MarkTechPost)
- Fable 5 bloqué : la Chine lance GLM-5.2, une solution open source (Le Big Data)
- Le premier grand exit dans l'IA (Ben's Bites)
- Salesforce acquiert Fin pour renforcer son offre d'IA d'entreprise (Le Big Data)
- Aperçu de Siri AI sur iOS 27 : Apple a-t-elle sauvé le soldat Siri ? (Next INpact)
- OpenAI perd des milliards de dollars par an, selon des documents financiers divulgués (Ars Technica AI)
- Temasek mise 75 milliards de dollars sur l'IA (The Information AI)
- OpenAI a dépensé 3,7 milliards de dollars au premier trimestre 2026 (The Information AI)
- Nvidia mobilise 20 milliards de dollars de dette pour renforcer son offensive dans l'IA (Le Big Data)
- Startup IA Baseten : une levée de 1,5 milliard de dollars en préparation (Le Big Data)
- Microsoft et Y Combinator nouent un partenariat pour accompagner les startups IA (Le Big Data)
- OpenAI acquiert Ona pour renforcer les agents IA de Codex (Le Big Data)
- Liquid AI lance LFM2.5-Embedding-350M et LFM2.5-ColBERT-350M pour la recherche multilingue (MarkTechPost)
- GLM-5.2 de Zhipu AI rivalise avec les meilleurs modèles propriétaires sur les benchmarks de codage (The Decoder)
- Z.ai lance GLM-5.2 : contexte de 1 million de tokens, deux niveaux d'effort de raisonnement (MarkTechPost)
Les chiffres derrière l'analyse
Le Baromètre IA mesure chaque semaine qui domine la couverture médiatique — entités, concepts et tendances.
Suivi en continu
Cette analyse touche les sujets suivants — chaque hub agrège l'actualité quotidienne de l'entité.
Une analyse comme celle-ci chaque semaine
Abonnez-vous pour recevoir l'analyse hebdomadaire directement dans votre boîte mail.
Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic
