
GLM-5.2 à poids ouverts de Z.ai surpasse GPT-5.5 sur plusieurs benchmarks de codage long terme, pour un sixième du coût
La startup chinoise Z.ai (anciennement Zhipu AI) a annoncé le 17 juin 2026 la disponibilité immédiate de GLM-5.2, un modèle de langage open-weights de 753 milliards de paramètres conçu spécifiquement pour les tâches de développement logiciel autonomes et de longue durée. Le modèle est accessible dès maintenant sur Hugging Face, via l'API Z.ai et dans plus de 20 environnements de développement tiers. Il dispose d'une fenêtre de contexte stable d'un million de tokens et des abonnements entreprise démarrent à 12,60 dollars par mois. Ses poids sont publiés sous licence MIT sans restriction, permettant à quiconque de le télécharger, de le personnaliser et de le déployer localement. Sur les benchmarks industriels, GLM-5.2 surpasse GPT-5.5 d'OpenAI sur plusieurs épreuves clés : SWE-bench Pro (62,1 contre 58,6), FrontierSWE (74,4 % contre 72,6 %), MCP-Atlas (77,0 contre 75,3) et PostTrainBench (34,3 % contre 25,0 %). Il talonne Claude Opus 4.8 d'Anthropic sur la quasi-totalité de ces tests.
La sortie de GLM-5.2 arrive à un moment stratégiquement décisif pour les entreprises qui dépendent de modèles d'IA de pointe. La semaine précédente, l'administration Trump a publié une directive de contrôle des exportations interdisant aux ressortissants étrangers d'utiliser Claude Fable 5 d'Anthropic, ce qui a conduit Anthropic à retirer ce modèle de l'accès global pour tous les utilisateurs. Pour les responsables techniques en dehors des États-Unis, GLM-5.2 offre une alternative concrète : un modèle de niveau frontier hébergeable en interne, hors de portée des restrictions géographiques et des aléas réglementaires américains. Son coût d'exploitation réduit à un sixième de celui des modèles propriétaires équivalents renforce encore son attrait pour les organisations soucieuses de maîtriser leur infrastructure IA.
Sur le plan architectural, GLM-5.2 introduit une optimisation appelée IndexShare, qui réutilise un même indexeur pour quatre couches d'attention sparse consécutives, réduisant de 2,9 fois le nombre de FLOPs par token à longueur de contexte maximale. Le modèle intègre également une couche Multi-Token Prediction améliorée, qui accroît de 20 % la longueur des tokens acceptés lors de l'inférence, ainsi que des modes de raisonnement sélectionnables, "Max" pour la puissance maximale, "High" pour un équilibre performance-latence. Z.ai s'inscrit ainsi dans une tendance de fond portée par des acteurs chinois comme DeepSeek, qui misent sur l'open-source et l'efficacité architecturale pour rivaliser avec les laboratoires occidentaux disposant de budgets bien supérieurs. Avec GLM-5.2, la compétition pour le leadership en IA agentic se déplace clairement au-delà des frontières américaines.
Les entreprises et développeurs français et européens disposent désormais d'une alternative frontier auto-hébergeable sous licence MIT, hors de portée des restrictions d'exportation américaines qui ont récemment limité l'accès aux modèles de pointe d'Anthropic.
Le moment est trop bien choisi pour être un hasard. Z.ai sort un 753 milliards de paramètres open-weights qui passe devant GPT-5.5 sur le code, MIT, hébergeable où tu veux, pile une semaine après qu'Anthropic a dû couper Fable 5 globalement sur pression de Washington. Pour les boîtes européennes qui cherchaient une sortie de la dépendance cloud américaine, bon, la voilà.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




