RechercheHuggingFace Blog11sem

Entraînez des modèles d'IA gratuitement avec Unsloth et Hugging Face Jobs

Résumé IASource uniqueImpact UE

"Apprenez à entraîner des modèles d'IA gratuitement avec Unsloth et Hugging Face Jobs. Utilisez ces outils pour exploiter le pouvoir de l'apprentissage automatique sans dépenser un centime."

Résumé: Exploitez gratuitement le potentiel de l'apprentissage automatique via Unsloth et Hugging Face Jobs pour entraîner des modèles d'IA sans coûts financiers.

Impact France/UE

Offre gratuite d'entraînement de modèles d'IA via Unsloth et Hugging Face Jobs, permettant aux entreprises européennes, y compris en France, de déployer l'apprentissage automatique sans dépenser, en conformité potentielle avec la future AI Act et RGPD.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1HuggingFace Blog

OVHcloud et les Fournisseurs d'Inférence sur Hugging Face, un Mariage Incandescent 🌪️

OVHcloud intègre les fournisseurs d'inférences Hugging Face, offrant un accès direct et optimisé aux modèles de traitement du langage naturel. Cette collaboration permet aux utilisateurs d'accélérer les applications AI, en bénéficiant des infrastructures de pointe d'OVHcloud et de la bibliothèque Hugging Face Models. Les performances sont améliorées grâce à l'utilisation de GPU puissants, facilitant ainsi l'accès aux modèles avancés de traitement du langage naturel.

UEOVHcloud intègre les fournisseurs d'inférences Hugging Face, améliorant l'accès des entreprises françaises aux modèles avancés de traitement du langage naturel via des infrastructures de pointe, conforme au RGPD.

RechercheOutil

1 source

2HuggingFace Blog

CUGA sur Hugging Face : Démocratisation des agents d'IA configurable

CUGA, un projet open-source, est maintenant disponible sur Hugging Face, une plateforme pour le développement et le partage de modèles de langage. Ce projet, mené par l'Institut de Recherche en Informatique de Toulouse (IRIT), vise à démocratiser les agents d'IA configurable. Les utilisateurs peuvent personnaliser ces agents pour diverses tâches, comme la génération de texte ou la traduction, en modifiant simplement des paramètres préconfigurés. Cette initiative permet un accès plus large aux outils d'IA avancés, rendant la personnalisation des agents d'IA plus accessible et intuitif pour les débutants et les experts.

RechercheOutil

1 source

3Ars Technica AI

Grand modèle génomique: IA open source entraînée sur des billions de bases

L'équipe d'Evo a développé Evo 2, un modèle d'IA open source formé sur des milliards de paires de bases de l'ADN provenant des trois domaines de la vie (bactéries, archées, et eucaryotes). Après avoir analysé des quantités massives de génomes, Evo 2 a développé des représentations internes de caractéristiques essentielles dans des génomes complexes, y compris des éléments régulateurs de l'ADN et des sites d'splice, souvent difficiles à identifier pour les humains.

UELes laboratoires et instituts de recherche européens en génomique (comme l'Institut Pasteur ou le CEA) peuvent directement exploiter ce modèle open source pour accélérer leurs travaux sur la compréhension des génomes complexes et le développement de thérapies.

RecherchePaper

1 source

4Apple Machine Learning

Les propriétés de mise à l'échelle des métriques aval dans l'entraînement des grands modèles de langage

Une équipe de chercheurs vient de publier un article remettant en question une idée bien établie dans le domaine des grands modèles de langage (LLM) : la difficulté à prédire les performances réelles des modèles à partir de leur budget d'entraînement. Jusqu'ici, les lois d'échelle (scaling laws) se concentraient principalement sur des métriques intermédiaires comme la perte lors du pré-entraînement (pretraining loss), considérées comme des proxies fiables mais éloignées des usages concrets. Les chercheurs proposent un cadre direct pour modéliser comment les performances sur des benchmarks évoluent en fonction du budget de calcul alloué à l'entraînement. Le résultat central est qu'en maintenant un ratio fixe entre le nombre de tokens et le nombre de paramètres, une simple loi de puissance (power law) suffit à décrire avec précision l'évolution de la précision logarithmique sur plusieurs tâches de référence populaires. Plus significatif encore, cette approche directe extrapole mieux que la procédure en deux étapes proposée précédemment dans la littérature, ce qui ouvre la voie à des prédictions de performances plus fiables avant même d'entraîner un modèle de grande taille. Ce travail s'inscrit dans un effort plus large de l'industrie pour optimiser les coûts d'entraînement, qui atteignent des dizaines à centaines de millions de dollars pour les modèles frontier. Pouvoir anticiper directement les performances sur des tâches concrètes — plutôt que sur des métriques abstraites — permettrait aux laboratoires comme OpenAI, Google DeepMind ou Anthropic de mieux planifier leurs investissements en calcul et d'identifier plus tôt les architectures prometteuses.

RecherchePaper

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour