
Liquid AI lance LFM2.5-Embedding-350M et LFM2.5-ColBERT-350M pour la recherche multilingue en 11 langues
Liquid AI a lancé cette semaine deux nouveaux modèles de recherche d'information : LFM2.5-Embedding-350M et LFM2.5-ColBERT-350M. Tous deux comptent 350 millions de paramètres et sont disponibles dès maintenant sur Hugging Face sous la licence LFM Open License v1.0. Construits sur la base LFM2.5-350M-Base publiée en mars 2026, ils constituent les premiers membres bidirectionnels de la famille LFM et couvrent 11 langues : arabe, allemand, anglais, espagnol, français, italien, japonais, coréen, norvégien, portugais et suédois. Le modèle Embedding fonctionne comme un bi-encodeur dense, il réduit chaque document à un seul vecteur de 1024 dimensions, ce qui garantit une vitesse maximale et un index compact. Le modèle ColBERT adopte une approche à interaction tardive : il génère un vecteur de 128 dimensions par token, permettant une correspondance mot à mot entre la requête et le document, au prix d'un index plus volumineux. Sur les benchmarks NanoBEIR (recherche multilingue) et MKQA-11 (questions-réponses multilingues), les deux modèles dominent leur catégorie respective, battant notamment le Qwen3-Embedding-0.6B d'Alibaba, pourtant plus grand, avec des scores NDCG@10 de 0,605 pour ColBERT et 0,577 pour Embedding.
L'intérêt concret de ces modèles tient à leur polyvalence et à leur compacité. Légers, ils peuvent tourner sur du matériel modeste, ce qui les rend accessibles hors des grandes infrastructures cloud. Liquid AI les positionne explicitement comme des remplaçants directs dans les pipelines RAG (Retrieval-Augmented Generation) existants, ces architectures qui alimentent les assistants IA en documents pertinents avant de générer une réponse. Les cas d'usage ciblés sont précis : catalogues produits, bases de FAQ, documentation de support. La capacité de recherche croisée entre langues sans entraînement spécifique est particulièrement précieuse pour les entreprises opérant sur plusieurs marchés. Le modèle ColBERT peut également servir à reclasser les résultats d'un premier système de recherche sans nécessiter de construction d'index, ce qui simplifie l'intégration.
Ces deux modèles s'inscrivent dans une stratégie de montée en puissance de Liquid AI face aux acteurs établis que sont Alibaba (avec sa famille GTE et Qwen), BAAI ou encore LightOn. L'architecture LFM2, initialement conçue comme un décodeur causal, a dû être adaptée : le masque d'attention causal a été remplacé par un masque bidirectionnel, et les convolutions locales rendues non-causales, afin que chaque token puisse s'appuyer sur l'ensemble du contexte plutôt que sur les seuls tokens précédents. L'entraînement suit trois étapes : préentraînement contrastif en anglais à grande échelle, distillation multilingue depuis un modèle enseignant, puis affinement sur des négatifs difficiles générés automatiquement. La traduction automatique par LLM a permis d'étendre les paires d'entraînement aux 11 langues cibles. Avec ces sorties, Liquid AI signale clairement son intention de peser sur le marché des modèles d'intégration de texte, segment stratégique pour toute l'industrie de la recherche sémantique.
Ces modèles supportent nativement le français parmi 11 langues et, grâce à leur compacité (350M paramètres), sont accessibles aux entreprises européennes souhaitant déployer une recherche sémantique multilingue dans leurs pipelines RAG sans infrastructure cloud lourde.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.



