
GLM-5.2 rivalise avec GPT ; Z.ai prévoit la sortie d'Open Fable en décembre
GLM-5.2, le dernier modèle de langage de Zhipu AI, filiale de Z.ai, s'est imposé cette semaine comme l'événement open source majeur du moment. Plusieurs praticiens indépendants l'ont qualifié de premier modèle en accès libre réellement comparable aux meilleurs systèmes propriétaires. Jeremy Howard, chercheur réputé peu enclin aux effusions, a déclaré qu'il lui semblait « au moins aussi bon qu'Opus 4.8 et GPT-5.5 » pour ses usages quotidiens, soulignant néanmoins l'absence de support visuel comme principale lacune. Le cabinet Artificial Analysis l'a quant à lui classé entre GPT-5.5 et Opus 4.8 sur son nouveau benchmark de travail de connaissance agentique. Côté architecture, GLM-5.2 introduit une innovation appelée IndexShare, qui réutilise les indices d'attention sparse entre groupes de couches pour réduire considérablement le coût de l'inférence sur des contextes de un million de tokens. Sur les tâches internes de Zhipu, il passe de 21 à 48 tâches réussies sur 70 par rapport à son prédécesseur GLM-5.1. Le modèle est disponible gratuitement via les fournisseurs d'inférence Hugging Face pour une durée limitée, et en local via llama.cpp et Unsloth au format GGUF.
Ce résultat est important parce qu'il marque un seuil symbolique : pour la première fois, un modèle open weight franchit ce que la communauté appelle le « vibe check frontier », c'est-à-dire la conviction, confirmée par des utilisateurs exigeants, qu'un modèle open source est utilisable en production comme alternative sérieuse aux systèmes fermés de premier rang. Cela change les calculs pour les entreprises, les développeurs et les chercheurs qui cherchent à s'affranchir des API commerciales et des contraintes de confidentialité qui les accompagnent. Z.ai, la société mère, se positionne désormais comme un laboratoire de recherche frontier à part entière, ce qui était encore contestable il y a quelques mois. La même semaine, Poolside AI a publié les poids de Laguna M.1 sous licence Apache 2.0 : un modèle sparse MoE de 225 milliards de paramètres en total et 23 milliards actifs, 256 experts avec top-k=16, 70 couches, contexte de 256 000 tokens, optimisé pour le codage agentique longue durée.
L'ascension de Z.ai intervient dans un contexte de forte tension autour des modèles ouverts chinois. En février 2026, Anthropic avait publié un rapport dénonçant une « distillation à l'échelle industrielle » par plusieurs laboratoires chinois, mais Z.ai était notamment absent de cette liste, ce qui renforce sa crédibilité auprès de la communauté occidentale. La question qui domine désormais les discussions est celle du calendrier : Z.ai a laissé entendre qu'un modèle open source de classe Fable, soit l'équivalent du modèle le plus puissant d'Anthropic, pourrait être disponible d'ici décembre 2026. Pendant ce temps, l'incertitude plane sur la capacité des quatre grands laboratoires américains à maintenir leur avance, dans un contexte réglementaire tendu autour de ce que la newsletter appelle le « Mythos ban », qui pourrait freiner leurs prochaines publications majeures.
La disponibilité d'un modèle open weight de niveau frontier permet aux entreprises européennes d'auto-héberger une IA compétitive sans dépendre d'API commerciales américaines, facilitant la conformité RGPD.
Ce que Jeremy Howard dit de GLM-5.2, ça m'intéresse plus que les benchmarks : c'est la première fois qu'un praticien exigeant dit qu'il l'utilise au quotidien à la place des modèles fermés. Le vibe check frontier, c'est ça, pas un score sur un leaderboard, la conviction que ça tient en prod. Si t'as des contraintes RGPD et que tu hésitais encore à auto-héberger, les calculs changent là.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




