Aller au contenu principal
LLMs01net2h

Le mystérieux modèle IA de Xiaomi égale les géants américains pour un prix dérisoire

1 source couvre ce sujet·Source originale ↗·
Résumé IA

Xiaomi a dévoilé un nouveau modèle d'intelligence artificielle qui rivalise avec les grands modèles américains, tout en étant proposé à un prix nettement inférieur. Son apparition anonyme avait préalablement créé la surprise dans la Silicon Valley avant que l'origine soit révélée.

Articles similaires

1The Decoder34min

OpenAI revoit la sélection de modèles de ChatGPT

OpenAI a revu en profondeur le système de sélection de modèles dans ChatGPT, simplifiant la façon dont les utilisateurs choisissent entre les différents modèles disponibles.

LLMsActu
1 source
2MarkTechPost10h

Présentation de Mamba-3 : Un nouveau front d'état spatial avec des états deux fois plus petits et une efficacité accrue des circuits de décodage MIMO

Mamba-3, développé par des chercheurs de CMU, Princeton, Together AI et Cartesia AI, est un modèle innovant qui aborde les contraintes liées à l'efficacité inference dans les Grandes Modèles de Langage (LLM). Il s'appuie sur le cadre des Modèles d'État Espace (SSM) et introduit trois mises à jour méthodologiques clés : la discrétisation exponentielle-trapézoidale, les mises à jour d'état complexes-valeurs et une formulation Multi-Input Multi-Output (MIMO). Ces améliorations permettent à Mamba-3 de fonctionner efficacement avec une taille d'état réduite de moitié par rapport aux précédents modèles, tout en optimisant l'efficacité matérielle pour le décodage.

UEMamba-3, développé par des entités européennes impliquant des chercheurs de CMU, Princeton, Together AI et Cartesia AI, améliore l'efficacité des Grandes Modèles de Langage (LLM), bénéficiant potentiellement à des entreprises européennes comme SAP ou Airbus en optimisant les ressources matérielles pour le décodage grâce à ses innovations dans les Modèles d'État Espace.

LLMsOutil
1 source
3The Decoder22h

OpenAI transforme la compression de modèle en chasse aux talents avec son défi « Parameter Golf » à 16 Mo

OpenAI lance le défi "Parameter Golf" : créer le meilleur modèle de langage possible en seulement 16 Mo. La compétition vise à repousser les limites de la compression de modèles, tout en servant de vivier pour recruter des talents parmi les chercheurs participants.

LLMsActu
1 source