Aller au contenu principal
LLMsMarkTechPost3h

Présentation de Mamba-3 : Un nouveau front d'état spatial avec des états deux fois plus petits et une efficacité accrue des circuits de décodage MIMO

1 source couvre ce sujet·Source originale ↗·
Résumé IA

Mamba-3, développé par des chercheurs de CMU, Princeton, Together AI et Cartesia AI, est un modèle innovant qui aborde les contraintes liées à l'efficacité inference dans les Grandes Modèles de Langage (LLM). Il s'appuie sur le cadre des Modèles d'État Espace (SSM) et introduit trois mises à jour méthodologiques clés : la discrétisation exponentielle-trapézoidale, les mises à jour d'état complexes-valeurs et une formulation Multi-Input Multi-Output (MIMO). Ces améliorations permettent à Mamba-3 de fonctionner efficacement avec une taille d'état réduite de moitié par rapport aux précédents modèles, tout en optimisant l'efficacité matérielle pour le décodage.

Impact France/UE

Mamba-3, développé par des entités européennes impliquant des chercheurs de CMU, Princeton, Together AI et Cartesia AI, améliore l'efficacité des Grandes Modèles de Langage (LLM), bénéficiant potentiellement à des entreprises européennes comme SAP ou Airbus en optimisant les ressources matérielles pour le décodage grâce à ses innovations dans les Modèles d'État Espace.

Articles similaires

1The Decoder14h

OpenAI transforme la compression de modèle en chasse aux talents avec son défi « Parameter Golf » à 16 Mo

OpenAI lance le défi "Parameter Golf" : créer le meilleur modèle de langage possible en seulement 16 Mo. La compétition vise à repousser les limites de la compression de modèles, tout en servant de vivier pour recruter des talents parmi les chercheurs participants.

LLMsActu
1 source
2Frandroid17h

La « Personal Intelligence » de Gemini devient gratuite pour des millions d’utilisateurs

Google rend gratuite sa fonction "Personal Intelligence" de Gemini, auparavant réservée aux abonnés à partir de 20 $/mois. Annoncée début 2026, cette fonctionnalité est désormais accessible à des millions d'utilisateurs sans frais.

UECette gratuité accroît la pression concurrentielle sur les assistants IA européens comme Le Chat de Mistral, qui doivent rivaliser sans les ressources d'un géant du cloud américain.

LLMsActu
1 source
301net22h

ChatGPT : la version gratuite passe à GPT-5.4 mini, voici ce que ça change

OpenAI a lancé GPT-5.4 mini et nano, deux nouveaux modèles axés sur la légèreté tout en maintenant de bonnes performances. La version gratuite de ChatGPT passe désormais à GPT-5.4 mini, offrant aux utilisateurs sans abonnement un accès à un modèle plus récent et plus efficace.

UELa mise à niveau gratuite de ChatGPT vers GPT-5.4 mini intensifie la pression concurrentielle sur les acteurs européens comme Mistral, dont les offres accessibles devront rivaliser avec un modèle américain de nouvelle génération désormais disponible sans abonnement pour les millions d'utilisateurs français et européens.

LLMsActu
1 source