Aller au contenu principal
📰 Transformers : Utilisez tout modèle Timm avec les Transformers
OutilsHuggingFace Blog74sem· 1 min de lecture

📰 Transformers : Utilisez tout modèle Timm avec les Transformers

Source originale ↗·

Les Transformers, un modèle de traitement du langage naturel, peuvent désormais intégrer tous les modèles Timm via une nouvelle fonctionnalité. Cette mise à jour permet aux utilisateurs d'exploiter les avantages des modèles Timm, connus pour leur efficacité et leur précision, dans le cadre des Transformers, souvent utilisés pour des tâches de compréhension et de génération de langage.

Impact France/UE

Cette mise à jour de la bibliothèque Transformers de Hugging Face, entreprise française, élargit les capacités des développeurs européens en leur permettant d'intégrer directement les modèles Timm dans leurs pipelines IA sans changer d'écosystème.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Alibaba veut transformer le travail en entreprise avec ses agents IA autonomes
1Siècle Digital 

Alibaba veut transformer le travail en entreprise avec ses agents IA autonomes

Alibaba a lancé Wukong, une plateforme d'agents IA autonomes destinée aux entreprises, visant à transformer la productivité professionnelle. Cette initiative s'inscrit dans la tendance des grands acteurs tech à développer des agents capables d'agir de manière indépendante. Alibaba cherche ainsi à s'imposer sur le marché des outils d'entreprise face à la concurrence accélérée dans l'IA.

OutilsOutil
1 source
Accélérer l'entraînement des transformers avec NVIDIA Apex et torch.amp
2MarkTechPost 

Accélérer l'entraînement des transformers avec NVIDIA Apex et torch.amp

Un tutoriel récemment publié propose une approche structurée pour accélérer l'entraînement de modèles Transformer sur GPU en s'appuyant sur NVIDIA Apex, une bibliothèque d'optimisation spécialisée. Le guide couvre en particulier trois composants : FusedAdam, un optimiseur de remplacement pour AdamW, FusedLayerNorm et FusedRMSNorm pour les couches de normalisation, ainsi que l'API de précision mixte torch.amp désormais intégrée nativement dans PyTorch. La démarche commence par la compilation d'Apex depuis les sources avec les extensions CUDA et C++, étape critique car une installation Python seule peut sembler réussie tout en ignorant silencieusement les noyaux haute performance qui font la valeur réelle de la bibliothèque. Le tutoriel inclut ensuite des benchmarks comparant FusedAdam face à PyTorch AdamW, les couches de normalisation fusionnées face aux variantes standard, puis une expérience complète d'entraînement Transformer qui mesure l'écart de débit entre un pipeline FP32 classique et une configuration combinant Apex et AMP. Les gains en jeu sont concrets : les noyaux CUDA fusionnés permettent de réduire le nombre d'opérations mémoire en combinant plusieurs calculs en un seul passage sur le GPU, ce qui se traduit directement en un débit d'entraînement supérieur et en une réduction du temps par itération. Pour les équipes qui entraînent de grands modèles de langage ou des Transformers profonds sur des infrastructures NVIDIA, ces optimisations peuvent représenter une économie significative en heures de calcul et donc en coût de GPU. La précision mixte, qui permet d'effectuer certains calculs en FP16 tout en maintenant la stabilité numérique en FP32 pour les parties sensibles, réduit également la consommation mémoire et autorise des batchs plus grands, accélérant la convergence. NVIDIA Apex est un projet open source maintenu par NVIDIA qui a longtemps servi de référence pour l'entraînement en précision mixte avant que PyTorch n'intègre nativement des fonctionnalités équivalentes via torch.amp. Aujourd'hui, certaines parties d'Apex restent pertinentes, notamment les noyaux CUDA fusionnés pour l'optimiseur et la normalisation, là où PyTorch n'offre pas encore d'alternative directe. Le tutoriel prend soin de distinguer les composants encore utiles des parties obsolètes, un arbitrage important dans un écosystème qui évolue rapidement. Avec l'essor des architectures de type GPT, Llama ou Mistral et la multiplication des entraînements à grande échelle, la demande d'outils d'optimisation bas niveau reste forte, et des bibliothèques comme Apex continuent d'alimenter les pipelines des équipes cherchant à extraire chaque milliseconde de leurs GPU NVIDIA.

OutilsTuto
1 source
Prévisualisation de Transformers.js v4 : Disponible sur NPM !
3HuggingFace Blog 

Prévisualisation de Transformers.js v4 : Disponible sur NPM !

Transformers.js v4, un outil JavaScript pour les transformations de données, est maintenant disponible sur NPM pour prévisualisation. Ce nouveau version offre des améliorations de performance et des fonctionnalités supplémentaires pour une manipulation de données plus efficace. Les utilisateurs peuvent désormais bénéficier de prises en charge accrue pour les schémas de données et une meilleure intégration avec d'autres bibliothèques JavaScript.

UETransformers.js v4, outil JavaScript pour transformations de données, disponible sur NPM, améliore les performances et offre une meilleure prise en charge des schémas de données, bénéficiant potentiellement aux entreprises françaises et européennes utilisant JavaScript pour le traitement de données, tout en respectant les réglementations RGPD grâce à une gestion efficace des informations.

OutilsOutil
1 source
Automatiser les flux de travail financiers complexes avec l'IA multimodale
4AI News 

Automatiser les flux de travail financiers complexes avec l'IA multimodale

Les institutions financières adoptent des pipelines IA multimodaux pour automatiser le traitement de documents complexes comme les relevés de courtage, combinant des outils de parsing (LlamaParse) avec des LLMs pour extraire tableaux et données structurées — avec une amélioration de 13 à 15 % par rapport au traitement brut. L'architecture recommandée repose sur deux modèles en parallèle : Gemini 2.5 Pro pour la compréhension des mises en page complexes, et Gemini 2.0 Flash pour la génération des résumés, réduisant la latence globale du pipeline. Cette approche événementielle et scalable améliore l'efficacité opérationnelle et la gestion des risques, mais nécessite des protocoles de gouvernance stricts car les modèles peuvent produire des erreurs.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic