Aller au contenu principal
LLMsThe Decoder2h

OpenAI revoit la sélection de modèles de ChatGPT

1 source couvre ce sujet·Source originale ↗·
Résumé IA

OpenAI a revu en profondeur le système de sélection de modèles dans ChatGPT, simplifiant la façon dont les utilisateurs choisissent entre les différents modèles disponibles.

Articles similaires

101net4h

Le mystérieux modèle IA de Xiaomi égale les géants américains pour un prix dérisoire

Xiaomi a dévoilé un nouveau modèle d'intelligence artificielle qui rivalise avec les grands modèles américains, tout en étant proposé à un prix nettement inférieur. Son apparition anonyme avait préalablement créé la surprise dans la Silicon Valley avant que l'origine soit révélée.

LLMsActu
1 source
2MarkTechPost12h

Présentation de Mamba-3 : Un nouveau front d'état spatial avec des états deux fois plus petits et une efficacité accrue des circuits de décodage MIMO

Mamba-3, développé par des chercheurs de CMU, Princeton, Together AI et Cartesia AI, est un modèle innovant qui aborde les contraintes liées à l'efficacité inference dans les Grandes Modèles de Langage (LLM). Il s'appuie sur le cadre des Modèles d'État Espace (SSM) et introduit trois mises à jour méthodologiques clés : la discrétisation exponentielle-trapézoidale, les mises à jour d'état complexes-valeurs et une formulation Multi-Input Multi-Output (MIMO). Ces améliorations permettent à Mamba-3 de fonctionner efficacement avec une taille d'état réduite de moitié par rapport aux précédents modèles, tout en optimisant l'efficacité matérielle pour le décodage.

UEMamba-3, développé par des entités européennes impliquant des chercheurs de CMU, Princeton, Together AI et Cartesia AI, améliore l'efficacité des Grandes Modèles de Langage (LLM), bénéficiant potentiellement à des entreprises européennes comme SAP ou Airbus en optimisant les ressources matérielles pour le décodage grâce à ses innovations dans les Modèles d'État Espace.

LLMsOutil
1 source
3The Decoder1j

OpenAI transforme la compression de modèle en chasse aux talents avec son défi « Parameter Golf » à 16 Mo

OpenAI lance le défi "Parameter Golf" : créer le meilleur modèle de langage possible en seulement 16 Mo. La compétition vise à repousser les limites de la compression de modèles, tout en servant de vivier pour recruter des talents parmi les chercheurs participants.

LLMsActu
1 source