
Liquid AI lance LFM2.5-8B-A1B : la taille ne fait-elle plus vraiment la performance ?
Liquid AI a lancé le 28 mai 2026 son nouveau modèle LFM2.5-8B-A1B, une intelligence artificielle conçue pour fonctionner directement sur des appareils grand public : smartphones, ordinateurs portables, PC, mais aussi des robots et des serveurs légers. Le modèle repose sur une architecture Mixture-of-Experts (MoE) : il dispose de 8 milliards de paramètres au total, mais n'en active qu'1,5 milliard par requête, ce qui réduit drastiquement les besoins en puissance de calcul. Par rapport à son prédécesseur LFM2-8B-A1B, sorti en 2025, il intègre une fenêtre de contexte élargie de 32 768 à 128 000 tokens, un vocabulaire doublé à 128 000 entrées, et un volume d'entraînement multiplié par trois, passant de 12 à 38 billions de tokens. Il introduit également un raisonnement explicite en chaîne de réflexion avant de produire ses réponses, une première pour cette gamme. Il est compatible nativement avec llama.cpp, MLX, vLLM et SGLang.
Cette sortie est significative parce qu'elle cible directement un angle mort de l'IA actuelle : la dépendance au cloud. La quasi-totalité des modèles performants exigent une infrastructure serveur coûteuse, ce qui les rend inaccessibles en usage local ou dans des contextes à faible connectivité. En faisant fonctionner une IA avancée directement sur le matériel de l'utilisateur, Liquid AI ouvre la voie à des applications plus privées, plus réactives et moins onéreuses. L'entreprise revendique les meilleures vitesses de sa catégorie sur CPU comme sur GPU, et des performances comparables à des modèles bien plus lourds sur des benchmarks de suivi d'instructions et de tâches agentiques. Le doublement du vocabulaire améliore aussi concrètement la qualité pour des langues non latines comme l'hindi, le thaï, l'arabe ou l'indonésien, jusqu'ici mal servies par les grands modèles occidentaux.
Liquid AI s'inscrit dans un mouvement plus large d'optimisation des modèles dit "edge-first", qui vise à rapprocher l'IA du matériel plutôt que de la centraliser dans des datacenters. Face à des acteurs comme Google avec Gemma, Microsoft avec Phi ou Meta avec Llama, la startup mise sur une architecture hybride originale combinant MoE, GQA et blocs de convolution courte pour se différencier. L'ajout de phases d'apprentissage par renforcement pour réduire les hallucinations et améliorer le raisonnement suit également la tendance imposée par les modèles o1 d'OpenAI et DeepSeek-R1. La suite logique pour Liquid AI sera de démontrer ces performances dans des cas d'usage réels embarqués, là où la vitesse et la frugalité en ressources comptent autant que les scores sur des benchmarks académiques.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




