LLMs

50 sur 256 articles

Toute l'actualité des modèles de langage (LLM) : GPT, Claude, Gemini, Mistral, Llama — benchmarks, nouvelles sorties et comparatifs.

Recherche Business Éthique Outils Régulation Robotique Sécurité Société Infrastructure Création Autre

1SCMP Tech LLMsActu

Tencent dévoile son premier grand modèle IA, dirigé par un ancien chercheur d'OpenAI

Tencent Holdings a dévoilé jeudi son nouveau modèle d'intelligence artificielle phare, baptisé HY3-Preview, marquant une étape importante dans la stratégie IA du groupe de Shenzhen. C'est le premier grand modèle lancé depuis que Yao Shunyu, ancien chercheur chez OpenAI, a rejoint l'entreprise pour diriger ses efforts en IA fondamentale. Fermé et non accessible au public en open source, HY3-Preview se distingue par une architecture relativement compacte de 295 milliards de paramètres, une taille modeste pour un modèle de cette ambition. Tencent positionne HY3-Preview comme son modèle le plus puissant à ce jour, comparable aux meilleures solutions chinoises disponibles, mais encore en retrait face aux leaders américains comme OpenAI et Google DeepMind. L'arrivée de Yao Shunyu, figure reconnue de la recherche en IA, signale la volonté du groupe de monter en gamme sur les fondations mêmes de ses systèmes, au-delà de ses applications existantes comme Weixin ou Tencent Cloud. Ce lancement s'inscrit dans une intense course technologique entre les géants technologiques chinois, qui cherchent à réduire l'écart avec les États-Unis dans un contexte de restrictions à l'export de puces Nvidia. Alibaba, Baidu, et ByteDance ont chacun intensifié leurs investissements en modèles fondationnels ces derniers mois. Que Tencent, longtemps perçu comme plus discret sur ce terrain, franchisse ce cap avec un recrutement aussi symbolique qu'un ex-OpenAI, témoigne d'une accélération générale de la compétition IA en Asie.

LLMs

Tencent dévoile son premier grand modèle IA, dirigé par un ancien chercheur d'OpenAI

Xiaomi lance MiMo-V2.5-Pro et MiMo-V2.5 : des performances comparables aux grands modèles pour un coût en tokens bien inférieur

Xiaomi lance la bêta publique de sa série de modèles d'IA MiMo-V2.5

Ant Group lance Ling-2.6-Flash, un modèle axé sur l'efficacité des tokens

Optimisation élégante des tokens

Alibaba publie Qwen3.6-27B, un modèle dense qui surpasse le MoE 397B sur les benchmarks de codage par agents

OpenAI travaille-t-il déjà sur GPT-5.5 ? Une fuite sème le doute

Le pari open source de la Chine

LLMs+

Kimi K2.6 exécute des agents pendant plusieurs jours et révèle les limites de l'orchestration d'entreprise

Moonshot AI publie son modèle phare en open source

DoorDash intègre les LLM dans sa personnalisation avancée

Démonstration Qwen 3.6-35B-A3B : inférence multimodale, raisonnement, appel d'outils, MoE, RAG et persistance de session

Moonshot AI publie Kimi K2.6 : codage longue portée et essaim d'agents à 300 sous-agents et 4 000 étapes coordonnées

[AINews] Moonshot Kimi K2.6 : le meilleur modèle open source du monde se met à jour pour rivaliser avec Opus 4.6 (avant DeepSeek v4 ?)

Phi-4-Mini de Microsoft : implémentation pour l'inférence quantifiée, le RAG et l'affinage LoRA

Google constitue une équipe spécialisée pour améliorer ses modèles de code

OpenAI vient de tuer la concurrence : GPT-5.5 a fuité et c’est un monstre

Premiers tests : Opus 4.7 coûte nettement plus cher que 4.6 malgré les tarifs identiques d'Anthropic

Tutoriel : faire tourner PrismML Bonsai LLM 1-bit sur CUDA avec GGUF, benchmarks, chat, JSON et RAG

Anthropic lance Claude Opus 4.7 : une mise à jour majeure pour le codage par agents, la vision haute résolution et les tâches autonomes longues

Mon approche pour comprendre les architectures de LLM

Les deux visages d'OpenClaw

Guide de programmation complet pour exécuter les modèles open-weight GPT d'OpenAI avec des workflows d'inférence avancés

Série Nova Forge SDK, partie 2 : guide pratique pour affiner les modèles Nova avec le mélange de données

Elephant Alpha : quelle est cette IA qui a pris la 1ère place en quelques jours ?

L'équipe Qwen publie en open source Qwen3.6-35B-A3B, modèle vision-langage MoE à 3 milliards de paramètres actifs

Anthropic Claude Opus 4.7 : une longueur d'avance sur 4.6 dans chaque dimension

OpenAI lance GPT-Rosalind, son premier modèle d'IA pour les sciences du vivant, conçu pour accélérer la découverte de médicaments et la génomique

OpenAI propose un LLM spécialisé en biologie

Anthropic lance Claude Opus 4.7 et reprend de justesse la tête des LLM grand public

Anthropic lance un nouveau modèle Opus dans l'effervescence de la préversion Mythos

Entraînement, alignement et déploiement des LLM : analyse technique approfondie

Claude Opus 4.7 : Le nouveau monstre d’Anthropic arrive (peut-être) cette semaine !

[AINews] Le dernier souffle de l'humanité

[AINews] Classement des meilleurs modèles locaux - avril 2026

NVIDIA et l'Université du Maryland lancent Audio Flamingo Next (AF-Next), un grand modèle audio-langage ouvert et puissant

Kimi de Moonshot AI : l’outil IA de nouvelle génération

Anthropic affaiblit-il Claude ? Les utilisateurs signalent des baisses de performances, les dirigeants démentent

MiniMax publie en open source MiniMax M2.7, un modèle à agents auto-évolutif : 56,22 % sur SWE-Pro et 57 % sur Terminal Bench 2

Liquid AI lance LFM2.5-VL-450M : un modèle vision-langage de 450M paramètres avec détection d'objets, support multilingue et inférence en moins de 250ms sur appareils embarqués

AI Engineer Europe 2026

“Meilleure IA française”… vraiment ? Mistral AI est ridiculement bas dans le classement LMArena

OpenAI aussi a son moment Mythos… et assure sa com’ face à Anthropic

Les LLM excellent en code et en maths mais peinent sur les questions triviales, et ce n'est pas contradictoire

Meta dispose d'un modèle IA compétitif mais perd son identité open source

Meta Superintelligence Lab lance Muse Spark : modèle multimodal avec compression du raisonnement et agents parallèles

Pourquoi Anthropic a fait évaluer Claude par un vrai psychiatre

Bilan IA Mars 2026 : GPT-5.4, Claude Mythos, Gemini 3.1 et la révolution des agents

Meta lance un nouveau modèle d’IA, pour tenter de rattraper Google et OpenAI