Aller au contenu principal
RechercheMarkTechPost18h

Résultats critiques: Moonshot AI dévoile des résultats pour remplacer le mélange résiduel fixe par une attention depth-wise pour une meilleure évolutivité dans les transformateurs

1 source couvre ce sujet·Source originale ↗·
Résumé IA

Moonshot AI a présenté Attention Residuals (AttnRes), un remplacement des connexions résiduelles standard dans les Transformers. Les chercheurs soutiennent que les connexions résiduelles actuelles introduisent un problème structurel, car toutes les sorties précédentes sont accumulées avec des poids unitaires fixes, entraînant une croissance de la magnitude de l'état caché et faiblissant progressivement le contribucion de chaque couche. AttnRes permet à chaque couche d'agréger les représentations antérieures via une attention softmax sur la profondeur, plutôt que sur la position séquentielle. Les principaux problèmes des connexions résiduelles standard incluent l'accès non selectif, la perte irréversible d'informations et la croissance de l'output, qui peuvent entraîner une instabilité de l'entraînement. Full AttnRes calcule les poids d'attention sur toutes les sources de profondeur précédentes, augmentant ainsi le coût mais offrant une meilleure gestion des informations.

Impact France/UE

Moonshot AI's Attention Residuals innovation could enhance the scalability of European AI models deployed by companies like SAP or OVHcloud, potentially improving their performance and efficiency.

Articles similaires

1Frandroid11h

La prochaine puce de Nvidia serait vraiment différente des autres

Nvidia envisagerait de rompre avec son approche "tout-en-un" habituelle pour ses GPU, en développant une puce d'architecture fondamentalement différente. Cette évolution stratégique marquerait un tournant majeur pour le leader des puces IA. L'article ne précise pas le nom ni les caractéristiques techniques de cette future puce.

RechercheActu
1 source
2Numerama15h

Condamné par un cancer, son chien survit grâce à un vaccin conçu avec ChatGPT

Un ingénieur australien, face au diagnostic fatal de cancer avancé de sa chienne, a développé lui-même un traitement expérimental en utilisant ChatGPT et d'autres outils d'IA. Il a contribué à la création d'un vaccin anticancéreux personnalisé à ARN messager pour son animal. Cette initiative illustre l'utilisation de l'IA générative dans la recherche médicale vétérinaire de pointe.

RechercheActu
1 source
3Le Big Data18h

Comment une IA associé à un labo automatisé accélère la recherche biologique

Des chercheurs d'OpenAI et de Ginkgo Bioworks ont combiné une IA (GPT-5) avec un laboratoire automatisé pour accélérer la recherche biologique. En utilisant la technique de synthèse protéique acellulaire (CFPS), l'IA a conçu des expériences, analysé les résultats et ajusté ses approches en environ une heure par itération, démontrant ainsi la capacité de l'IA à formuler des hypothèses et à mener des expériences dans le domaine complexe de la biologie.

UEL'application de cette technologie IA-Ginkgo Bioworks pourrait revolutionner la recherche biomédicale en Europe, notamment grâce à l'engagement d'entreprises comme Sanofi ou Servier, qui pourraient bénéficier des avancées rapides dans le développement de thérapies innovantes.

RechercheOutil
1 source