
Qwen3.7-Max d'Alibaba peut fonctionner de manière autonome pendant 35 heures et prend en charge des frameworks externes comme Claude Code d'Anthropic
Alibaba a publié Qwen3.7-Max, un modèle d'intelligence artificielle conçu pour opérer de façon entièrement autonome pendant des dizaines d'heures d'affilée. La démonstration la plus frappante fournie par l'équipe Qwen : le modèle a été connecté à un serveur isolé équipé d'un processeur T-Head ZW-M890 PPU, une architecture matérielle qu'il n'avait jamais rencontrée lors de son entraînement. Sa mission consistait à optimiser un noyau de calcul d'attention. En 35 heures consécutives, Qwen3.7-Max a exécuté 1 158 appels d'outils distincts, réalisé 432 évaluations du noyau, diagnostiqué des erreurs de compilation et amélioré le code de façon itérative jusqu'à atteindre une accélération de 10x en moyenne géométrique. Ses concurrents chinois directs, GLM-5.1 de z.ai et Kimi K2.6 de Moonshot, n'ont atteint respectivement que 7,3x et 5,0x, avant d'interrompre leurs sessions faute de progression. Autre signe de rupture avec les pratiques antérieures de l'équipe Qwen : ce modèle est propriétaire et accessible uniquement via API payante, contrairement aux versions précédentes publiées en open source.
Ce virage stratégique a des implications concrètes pour l'ensemble du secteur. En choisissant un modèle fermé, Alibaba s'aligne sur OpenAI et Google, qui réservent leurs modèles les plus puissants à leurs offres commerciales. Cela change la donne pour les entreprises et développeurs qui comptaient sur les modèles Qwen ouverts pour des déploiements locaux ou des usages sensibles. Par ailleurs, le fait que le modèle soit uniquement accessible depuis des points d'accès basés en Chine soulève des questions de conformité réglementaire pour les entreprises américaines et européennes soumises à des obligations de souveraineté des données, notamment dans le cadre de contrats gouvernementaux. Le modèle supporte néanmoins des environnements d'exécution externes comme Claude Code d'Anthropic, ce qui lui ouvre un spectre d'utilisation plus large dans les workflows d'ingénierie logicielle.
La performance de Qwen3.7-Max repose sur ce qu'Alibaba appelle l'« environment scaling » : plutôt que d'entraîner le modèle uniquement sur du texte, il a été exposé à un vaste éventail d'environnements agentiques dynamiques, lui permettant de développer un raisonnement à long horizon sans perdre le fil de ses instructions. Le modèle intègre également un mécanisme de détection du reward hacking, qui lui permet d'identifier lorsqu'il tente de contourner ses propres règles d'évaluation et de s'autocorriger. Dans le benchmark YC-Bench, qui simule un an de cycle de vie d'une startup, Qwen3.7-Max a généré l'équivalent de 2,08 millions de dollars de revenus virtuels, soit près du double de son prédécesseur Qwen3.6-Plus. La sortie de ce modèle intervient quelques mois après le départ de plusieurs responsables clés de l'équipe Qwen, une transition qui explique en partie l'abandon de l'open source au profit d'une monétisation directe.
L'accessibilité exclusive via des points d'accès basés en Chine contraint les entreprises et administrations européennes soumises aux obligations de souveraineté des données à exclure ce modèle de leurs workflows malgré ses performances agentiques exceptionnelles.
Le vrai sujet, c'est pas les 35 heures de run autonome (impressionnant, certes, mais on s'y attendait). C'est qu'Alibaba tourne la page de l'open source et passe tout fermé, avec des endpoints uniquement basés en Chine, ce qui met Qwen3.7-Max hors jeu pour toute équipe européenne sous contraintes de souveraineté. Ceux qui avaient construit leurs workflows sur les modèles Qwen ouverts vont devoir se retourner.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.



