OpenAI revoit la sélection de modèles de ChatGPT
OpenAI a revu en profondeur le système de sélection de modèles dans ChatGPT, simplifiant la façon dont les utilisateurs choisissent entre les différents modèles disponibles.
OpenAI a revu en profondeur le système de sélection de modèles dans ChatGPT, simplifiant la façon dont les utilisateurs choisissent entre les différents modèles disponibles.
Xiaomi a dévoilé un nouveau modèle d'intelligence artificielle qui rivalise avec les grands modèles américains, tout en étant proposé à un prix nettement inférieur. Son apparition anonyme avait préalablement créé la surprise dans la Silicon Valley avant que l'origine soit révélée.
Mamba-3, développé par des chercheurs de CMU, Princeton, Together AI et Cartesia AI, est un modèle innovant qui aborde les contraintes liées à l'efficacité inference dans les Grandes Modèles de Langage (LLM). Il s'appuie sur le cadre des Modèles d'État Espace (SSM) et introduit trois mises à jour méthodologiques clés : la discrétisation exponentielle-trapézoidale, les mises à jour d'état complexes-valeurs et une formulation Multi-Input Multi-Output (MIMO). Ces améliorations permettent à Mamba-3 de fonctionner efficacement avec une taille d'état réduite de moitié par rapport aux précédents modèles, tout en optimisant l'efficacité matérielle pour le décodage.
UEMamba-3, développé par des entités européennes impliquant des chercheurs de CMU, Princeton, Together AI et Cartesia AI, améliore l'efficacité des Grandes Modèles de Langage (LLM), bénéficiant potentiellement à des entreprises européennes comme SAP ou Airbus en optimisant les ressources matérielles pour le décodage grâce à ses innovations dans les Modèles d'État Espace.
OpenAI lance le défi "Parameter Golf" : créer le meilleur modèle de langage possible en seulement 16 Mo. La compétition vise à repousser les limites de la compression de modèles, tout en servant de vivier pour recruter des talents parmi les chercheurs participants.