Qwen3· sujet

296 articlesmis à jour le 20 juillet 2026

Qwen3, la famille de modèles de langage d'Alibaba : versions, performances, disponibilité open source et cas d'usage suivis au fil de l'actualité IA.

Hub d'actualité sur Qwen3, agrégé en continu depuis 72 sources éditoriales. Pour les analyses long-form, voir /analyses.

Le pouls du sujet · 30 derniers jours

données Le Fil IA

41↓ 9%

articles (vs 30j préc.)

4.9%

de la couverture IA

Souvent associé à

InférenceOpenAIAgenticNVIDIA Alibaba

Mesuré sur notre corpus de 50+ sources, fenêtre glissante de 30 jours. Part de voix = part des articles IA de la période mentionnant Qwen3. Voir le Baromètre IA complet

À retenir · 30 derniers jours

L'équipe Qwen d'Alibaba a publié Qwen-AgentWorld, deux modèles non entraînés comme agents qui progressent sur sept benchmarks.Le modèle d'Alibaba, non entraîné comme…
Anthropic accuse des acteurs liés à Alibaba d'avoir massivement extrait des données de Claude pour entraîner son IA.Alibaba aurait exploité Claude pour entr…
NVIDIA NeMo publie un tutoriel pour fine-tuner Qwen3-0.6B avec LoRA sur un seul GPU via Google Colab.Fine-tuning de Qwen3 avec LoRA via NVIDI…

Qwen3 est la famille de modèles d'intelligence artificielle développée par Alibaba, le géant chinois du cloud. Sa particularité tient à un choix assumé : des modèles ouverts, que n'importe qui peut télécharger, faire tourner sur ses propres serveurs et adapter à ses besoins. Dans un paysage dominé par des systèmes fermés et facturés à l'usage, cette approche a installé Qwen comme une référence pour qui veut garder la main sur ses données et ses coûts.

Sa position durable se joue là. Qwen3 sert de socle à de nombreux projets, du laboratoire de recherche à l'entreprise qui veut héberger son IA en interne sans dépendre d'un fournisseur américain. La déclinaison Max, plus puissante et orientée tâches longues et autonomes, montre par ailleurs l'ambition d'Alibaba de jouer aussi sur le terrain des modèles de pointe, et pas seulement celui de l'ouverture.

Pour un usage professionnel, l'intérêt est concret : maîtrise du déploiement, confidentialité, facture prévisible. Le revers, c'est la dépendance à un acteur chinois, avec les questions de gouvernance et de souveraineté que cela soulève.

Dans ce hub, on suit l'évolution des versions, les performances mesurées face à la concurrence et la place réelle de Qwen dans l'écosystème open source.

Analyses long-form sur Qwen3

Quand un sujet mérite un format long, c'est ici.

La rupture DeepSeek (qui ne disparaît pas le 31 mai)
Qwen et DeepSeek, les deux fers de lance open-weight chinois : le contexte stratégique complet.

OpenAI NVIDIA Alibaba Azure Google Cloud Blackwell CUDA AMD Moonshot AI Anthropic Claude Mythos Claude Fable 5 Tous les dossiers →

Toute l'actualité Qwen3

Flux automatique. Articles classés par pertinence, agrégés en continu.

1MarkTechPost OutilsOutil

Le coworker IA open source et local d'Andrew Ng, OpenWorker, livre des tâches finies plutôt que du chat

Andrew Ng vient de publier OpenWorker, un agent de bureau open source sous licence MIT conçu pour livrer un travail terminé plutôt qu'une conversation. L'utilisateur ne formule pas un prompt mais décrit un résultat attendu, un document finalisé, une réponse Slack contenant les vrais chiffres, un agenda mis à jour ou une boîte mail triée, et l'outil découpe cet objectif en étapes concrètes. Le dépôt compte 119 fichiers Python, soit environ 32 400 lignes, dans le dossier coworker, 149 fichiers TypeScript et TSX pour l'interface graphique, et 78 modules de tests côté serveur. L'architecture repose sur quatre couches qui tournent entièrement en local: une coquille de bureau Tauri 2 avec une interface React 18, un serveur d'agent Python 3.10 sous FastAPI et uvicorn écoutant par défaut sur 127.0.0.1:8765, une couche d'outils et de connecteurs regroupant fichiers, git, recherche via ripgrep, terminal et intégrations MCP, et enfin un routeur de modèles bâti sur aisuite, la bibliothèque multi-fournisseurs déjà développée par Andrew Ng. Il n'existe aucun service d'inférence propre à OpenWorker: l'utilisateur fournit sa propre clé API ou pointe vers un modèle local. La liste homologuée compte exactement trente modèles, dont les gammes GPT d'OpenAI, Claude d'Anthropic, Gemini de Google, ainsi que GLM, DeepSeek, Kimi, MiniMax, Qwen3 Max, Grok, Mistral Large, des modèles ouverts via Together AI et Fireworks, et des modèles totalement locaux via Ollama, sans clé requise. La vraie innovation technique du projet tient dans son moteur de permissions. Chaque appel d'outil est classé selon quatre niveaux de risque, lecture seule, écriture locale limitée au dossier de travail, exécution de commandes, ou action externe affectant d'autres systèmes. Cinq modes déterminent ensuite ce qui est autorisé, allant d'un mode purement consultatif à un mode automatique complet, en passant par un mode interactif par défaut qui demande confirmation avant toute écriture ou commande. Fait notable, le mode sans supervision ne relâche pas le niveau d'autonomie: il redirige simplement les demandes de validation vers une boîte de réception où la session reste suspendue jusqu'à réponse humaine. Les commandes shell, elles, demandent systématiquement confirmation, sans exception possible. Le profil intégré instruit aussi le modèle à traiter tout contenu issu d'outils, du web ou de fichiers comme une donnée non fiable plutôt que comme une instruction, une protection explicite contre les injections de prompt. Sur le plan de la confidentialité, les appels aux modèles partent directement de la machine de l'utilisateur vers le fournisseur choisi, sans passer par un serveur intermédiaire, et les clés ne transitent jamais dans le contexte du modèle. Seul un service cloud optionnel gère l'authentification OAuth des connecteurs via Auth0, sans jamais stocker les jetons. L'application fonctionne intégralement hors connexion à ce service, avec des identifiants saisis manuellement, ce qui illustre une approche local-first assumée dans un secteur où la plupart des agents d'IA restent dépendants d'infrastructures propriétaires.

Qwen3· sujet

À retenir · 30 derniers jours

Analyses long-form sur Qwen3

Toute l'actualité Qwen3

Le coworker IA open source et local d'Andrew Ng, OpenWorker, livre des tâches finies plutôt que du chat

Alibaba dévoile Qwen-Image-3.0, capable de générer grilles d'infographies complètes et texte lisible dès dix pixels en une seule passe

Washington envisage des restrictions sur les modèles IA open-weight chinois comme Kimi

Alibaba lance Qwen-Audio-3.0-TTS, un modèle de synthèse vocale hébergé en versions Flash et Plus dans 16 langues

Les meilleurs LLM locaux exécutables sur un GPU 24 Go en 2026 : comparatif Qwen, Gemma, Mistral et DeepSeek

Alibaba dévoile Qwen3.8-Max, un modèle multimodal de 2 400 milliards de paramètres, quelques jours après le lancement du modèle ouvert Kimi K3 de Moonshot

Fine-tuning de Qwen3 avec LoRA via NVIDIA NeMo AutoModel : tutoriel complet sur Google Colab (GPU unique)

Le consortium Soofi publie Soofi S 30B-A3B, un modèle hybride Mamba-Transformer MoE ouvert pour l'allemand et l'anglais

PrismML lance Bonsai 27B : versions 1-bit et ternaire de Qwen3.6-27B pour ordinateurs portables et smartphones

L'ancien responsable de Qwen explique les erreurs du hybrid thinking et pourquoi il mise desormais sur les agents

Meta dévoile Brain2Qwerty v2 : décoder des phrases entières depuis les signaux cérébraux, sans implant

Liquid AI lance LFM2.5-230M avec support llama.cpp, MLX, vLLM, SGLang et ONNX pour l'inférence sur appareil

Le LFM2.5-230M de Liquid AI surpasse des modèles 4 fois plus grands en extraction de données et tourne partout

Le modèle d'Alibaba, non entraîné comme agent, améliore les performances sur sept benchmarks

Xiaomi HarnessX réécrit sa propre infrastructure IA en cours de tâche, avec des gains plus marqués pour les petits modèles

Qwen-AgentWorld : le simulateur d’Alibaba apprend aux agents IA à mieux réfléchir

NVIDIA présente SpatialClaw : un agent sans entraînement qui utilise le code comme interface pour le raisonnement spatial

VibeThinker-3B : modèle de raisonnement dense basé sur Qwen2.5-Coder-3B via le pipeline Spectrum-to-Signal

Rapport technique Qwen-RobotManip : l'alignement permet le passage à l'échelle des modèles fondation pour la manipulation robotique

Qwen-RobotNav : un modèle de navigation extensible conçu pour un système de navigation à base d'agents

Alibaba dévoile Qwen-Robot : trois modèles fondation pour l'IA incarnée

Qwen-RobotSuite : trois modèles d'IA incarnée pour la manipulation VLA, la modélisation du monde et la navigation

Créer un espace de travail d'agents QwenPaw : compétences personnalisées, fournisseurs de modèles et API en streaming

PixelRAG surpasse les analyseurs de texte en précision et réduit de 10 fois le coût en tokens des agents IA

Un nouveau modèle vocal open source écoute en continu et décide toutes les 0,4 secondes de parler ou de se taire

Avec Qwen3.7-Plus, Alibaba veut transformer l'IA multimodale en agent autonome à part entière

OpenJarvis : un framework local pour agents IA personnels avec outils, mémoire et apprentissage

NVIDIA lance Cosmos 3 : un modèle de fondation à deux tours mêlant raisonnement physique, génération de mondes et d'actions

OpenEAI-Platform : une plateforme open source unifiée matériel-logiciel pour l'IA incarnée

Alibaba lance Qwen3.7-Plus : texte, vidéo et images pour 0,4 $/1,6 $ par million de tokens, mais en source fermée

L'équipe Qwen d'Alibaba lance Qwen3.7-Plus avec vision, raisonnement avancé et agents autonomes sur Bailian

JetBrains lance Mellum2 : un modèle MoE de 12 milliards de paramètres pour les tâches spécialisées dans les pipelines IA multi-modèles

NVIDIA lance Cosmos 3, Nemotron 3 Ultra et RTX Spark

MiniMax-M3 surpasse GPT-5.5 et Gemini 3.1 Pro sur des benchmarks clés, pour 5 à 10 % du coût

Qwen-VLA : un modèle vision-langage-action (VLA) unifié pour les tâches, environnements et morphologies de robots

L'architecture radicale de DeepSeek fracasse l'avantage concurrentiel de Silicon Valley sur les tokens

Cognition lève 1 milliard de dollars lors d'une série D valorisée à 26 milliards

NVIDIA publie Polar, un framework de rollout GRPO fidèle aux tokens pour Codex, Claude Code et Qwen Code

MiniCPM5-1B : cette minuscule IA de 0,5 Go enterre déjà des modèles bien plus gros

Le dernier modèle IA d'Alibaba a optimisé de façon autonome le code de sa puce personnalisée pendant 35 heures

Microsoft lance Fara1.5 (4B/9B/27B), des agents de navigation qui surpassent OpenAI Operator et Gemini 2.5 Computer Use

Qwen3.7-Max d'Alibaba peut fonctionner de manière autonome pendant 35 heures et prend en charge des frameworks externes comme Claude Code d'Anthropic

Qwen lance Qwen3.7-Max : un modèle agent de raisonnement avec une fenêtre de contexte d'un million de tokens

Qwen3.7 Max : l’IA d’Alibaba écrase ses anciens scores sur les benchmarks IA

Amazon SageMaker AI prend en charge l'API compatible OpenAI

NVIDIA AI lance Nemotron-Labs-Diffusion : modèle de langage à trois modes, 6 fois plus de tokens par inférence que Qwen3-8B

L'équipe Qwen d'Alibaba lance Qwen3.5-LiveTranslate-Flash : interprétation multimodale en temps réel dans 60 langues avec une latence de 2,8 secondes

Qwen-Image-2.0 d'Alibaba divise par deux la compression et réduit les étapes de génération de 40 à 4

Dans l’IA, la Chine bouscule son monde avec sa stratégie open source

Mistral AI lance des agents distants dans Vibe et Mistral Medium 3.5 avec un score de 77,6 % sur SWE-Bench Verified