Dossier DeepSeek — page 2

75 articles · page 2 sur 2

DeepSeek, le laboratoire chinois qui a secoué les valeurs tech US : modèles open-weight V3, R1, V4, économie du compute et géopolitique de l'IA.

51Pandaily LLMsActu

Xiaomi lance la bêta publique de sa série de modèles d'IA MiMo-V2.5

Xiaomi a lancé la bêta publique de sa nouvelle série de modèles de langage MiMo-V2.5, avec une mise à disposition en open source de MiMo-V2.5 et MiMo-V2.5-Pro annoncée pour très prochainement. La famille MiMo-V2.5 comprend quatre modèles distincts : MiMo-V2.5, V2.5-Pro, V2.5-TTS et V2.5-ASR, chacun conçu pour améliorer le raisonnement, la gestion de contextes longs, le suivi d'instructions complexes ou ambiguës, et la compréhension multimodale. Xiaomi a également annoncé des ajustements tarifaires sur son offre Token Plan. Le fleuron de la gamme, MiMo-V2.5-Pro, est présenté comme le modèle le plus puissant jamais développé par l'entreprise. Les performances revendiquées sont ambitieuses : en tests internes, MiMo-V2.5-Pro se montre compétitif face à Claude Opus 4.6 et GPT-5.4 sur des tâches d'agent général, d'ingénierie logicielle complexe et d'exécution de tâches longues. Associé au bon environnement d'exécution, le modèle peut enchaîner de manière fiable des séquences impliquant près de 1 000 appels d'outils au cours d'une même session. Sa capacité à suivre des instructions implicites tout en maintenant une cohérence logique sur de longues interactions représente une avancée notable par rapport à la génération précédente, et le positionne comme un outil crédible pour des charges de travail professionnelles exigeantes. Cette annonce s'inscrit dans une stratégie d'accélération claire de Xiaomi dans la course mondiale aux grands modèles de langage. Longtemps perçu avant tout comme fabricant de smartphones et d'électronique grand public, le groupe chinois investit massivement dans l'IA depuis plusieurs trimestres, cherchant à s'imposer face à des acteurs comme Alibaba, Baidu ou DeepSeek sur le marché domestique, tout en visant une reconnaissance internationale grâce à l'open source. La publication prochaine des poids du modèle devrait permettre à la communauté de valider les performances annoncées et d'évaluer la place réelle de Xiaomi dans l'écosystème mondial de l'IA.

UELa mise en open source prochaine des poids du modèle pourrait intéresser les développeurs et entreprises européennes cherchant des alternatives open source compétitives, sans impact réglementaire direct sur la France ou l'UE.

Dossier DeepSeek — page 2

Xiaomi lance la bêta publique de sa série de modèles d'IA MiMo-V2.5

Ant Group lance Ling-2.6-Flash, un modèle axé sur l'efficacité des tokens

Tesla Chine intègre le modèle d'IA Doubao dans son système embarqué

Alibaba lance l'avatar "Qwen XiaoJiuWo" pour unifier son écosystème d'assistants IA

L'IA tient-elle ses promesses ? Transformer l'élan vers l'IA en valeur mesurable

Entraînement, alignement et déploiement des LLM : analyse technique approfondie

[AINews] Classement des meilleurs modèles locaux - avril 2026

MIT, NVIDIA et Zhejiang University proposent TriAttention, une compression du cache KV à débit 2,5 fois supérieur

HappyHorse : l’IA vidéo qui domine les réseaux sociaux appartient en fait à Alibaba

Sam Altman fragilisé par une enquête explosive du New Yorker au pire moment pour OpenAI

Guide complet d'utilisation de ModelScope : recherche de modèles, inférence, fine-tuning, évaluation et export

Affinage par renforcement sur Amazon Bedrock : bonnes pratiques

L'ambiance est mauvaise chez OpenAI

L'impact de l'IA sur l'emploi et les centres de données dans l'espace

Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur

Marc Andreessen s'interroge sur la mort du navigateur, Pi + OpenClaw, et pourquoi cette fois c'est différent

Vous pouvez investir dans OpenAI avant son introduction en Bourse : les premiers particuliers ont sauté sur l’occasion d’une méga levée de fonds

NVIDIA AI présente ProRL Agent : une infrastructure d'apprentissage par renforcement pour agents LLM à grande échelle

Les prix des H100 s'envolent

IndexCache accélère l'inférence des modèles IA sur longs contextes de 1,82x grâce à une attention clairsemée

Xiaomi MiMo-V2-Pro : le géant chinois lance son rival de ChatGPT et Gemini

Multiverse Computing propulse ses modèles d'IA compressés vers le grand public

Unsloth AI lance Unsloth Studio : une interface locale sans code pour l'affinage haute performance des LLM avec 70 % de VRAM en moins

Tencent prépare en secret un agent IA pour WeChat, que faut-il savoir ?

Un printemps pour les LLMs open-weight : 10 architectures (jan-fév 2026)