RechercheThe Decoder6sem

OpenAI transforme la compression de modèle en chasse aux talents avec son défi « Parameter Golf » à 16 Mo

Résumé IASource uniqueImpact UE

OpenAI lance un défi inédit à la communauté des chercheurs en intelligence artificielle : concevoir le meilleur modèle de langage possible dans une limite de 16 mégaoctets seulement. Baptisée « Parameter Golf », cette compétition transforme l'exercice de compression de modèle en véritable vitrine technique — et en outil de recrutement assumé.

L'initiative révèle une tendance de fond dans le secteur : l'efficacité des modèles devient un enjeu stratégique aussi important que leur puissance brute. Alors que la course aux paramètres à l'échelle des centaines de milliards a longtemps dominé la recherche, la capacité à obtenir des performances maximales avec des ressources minimales s'impose désormais comme une compétence différenciante, notamment pour les applications embarquées, mobiles ou à faible latence.

La contrainte de 16 Mo est particulièrement sévère : à titre de comparaison, les modèles de la génération actuelle comme GPT-4 ou Llama pèsent plusieurs dizaines de gigaoctets. Atteindre des performances pertinentes dans cet espace revient à résoudre des problèmes de quantification, de distillation et d'architecture qui se situent à la frontière de la recherche fondamentale. OpenAI utilise explicitement la compétition pour identifier les ingénieurs et chercheurs les plus talentueux dans ce domaine précis.

Ce type de défi-recrutement n'est pas une nouveauté dans la tech — Google, Meta et DeepMind y ont régulièrement recours via des compétitions de code ou de ML. Ce qui distingue l'approche d'OpenAI ici, c'est la précision du signal recherché : maîtriser la compression de modèle est exactement le profil nécessaire pour faire tourner des LLM directement sur des appareils grand public, un axe stratégique sur lequel la compétition avec Apple, Google et Microsoft s'intensifie.

Dans nos dossiers

OpenAI Meta IA

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1OpenAI Blog

Comprendre les injections de prompts : un défi de sécurité aux frontières

Les injections de prompts constituent un défi de sécurité majeur pour les systèmes d'IA. OpenAI travaille à avancer dans la recherche, la formation des modèles et la mise en place de mesures de protection pour les utilisateurs.

RechercheOpinion

1 source

2OpenAI Blog

Développer la maîtrise de l'IA à grande échelle avec ChatGPT Enterprise

Commonwealth Bank of Australia collabore avec OpenAI pour déployer ChatGPT Enterprise auprès de 50 000 employés, visant à développer une compréhension de l'IA à grande échelle pour améliorer le service client et la réponse aux fraudes.

UEAucun impact direct — L'accord entre la Commonwealth Bank of Australia et OpenAI concerne uniquement les 50 000 employés australiens et n'a pas d'implications immédiates pour des entreprises françaises ou européennes spécifiques, ni pour le secteur européen de l'IA, sans référence à des collaborations ou des déploiements similaires dans l'UE.

RechercheOutil

1 source

3MarkTechPost

Meta lance Autodata : un framework à base d'agents qui transforme les modèles IA en data scientists autonomes pour créer des données d'entraînement de haute qualité

L'équipe RAM (Reasoning, Alignment and Memory) de Meta AI a présenté Autodata, un cadre de génération de données d'entraînement reposant sur des agents IA autonomes. Plutôt que de produire des données synthétiques en une seule passe, Autodata confie à un agent le rôle d'un data scientist humain : il crée des exemples, les analyse, en évalue la qualité, puis affine sa méthode de génération en boucle fermée. La première implémentation concrète du système, baptisée Agentic Self-Instruct, s'appuie sur un LLM orchestrateur qui coordonne quatre sous-agents spécialisés : un Challenger LLM qui génère des exemples d'entraînement, un Weak Solver (modèle plus faible censé échouer sur ces exemples), un Strong Solver (modèle plus capable censé réussir), et un Evaluator qui valide la pertinence et la difficulté des exemples produits. Testée sur des problèmes de raisonnement scientifique complexe, cette approche surpasse significativement les méthodes classiques de génération de données synthétiques comme Self-Instruct ou ses variantes Chain-of-Thought. L'enjeu est de taille : la qualité des données d'entraînement a toujours été un goulot d'étranglement dans le développement des grands modèles de langage, autant que la puissance de calcul. Autodata ouvre une voie pour convertir du calcul d'inférence supplémentaire en données de meilleure qualité, plus on alloue de ressources à l'agent, plus les données produites sont pertinentes. Pour les équipes qui développent des modèles IA, c'est une rupture méthodologique : il devient possible de piloter et d'améliorer la qualité des données en cours de génération, et non plus seulement de filtrer ou corriger après coup. Cela réduit également la dépendance à l'annotation humaine, coûteuse et difficile à scaler, tout en maintenant un contrôle itératif sur la distribution et la difficulté des exemples générés. Jusqu'ici, la génération de données synthétiques suivait des pipelines largement statiques : on promptait un LLM avec des exemples zéro-shot ou few-shot, parfois en s'appuyant sur des documents source pour limiter les hallucinations. Les méthodes dites "Self-Challenging" avaient commencé à introduire une dynamique agent-outil, mais sans boucle de feedback réelle sur la qualité globale du jeu de données. Autodata représente l'étape suivante en intégrant cette rétroaction directement dans le processus de création. Meta s'inscrit ici dans une tendance plus large du secteur : utiliser des agents IA pour automatiser des tâches d'ingénierie complexes, y compris la construction des données qui servent à entraîner ces mêmes agents. La publication est portée par l'équipe RAM de Meta AI Research, ce qui signale une ambition de long terme autour de l'autonomie des systèmes d'apprentissage.

UELes laboratoires européens développant des LLMs pourraient indirectement bénéficier de cette méthodologie open research pour réduire leur dépendance à l'annotation humaine coûteuse.

RecherchePaper

1 source

4VentureBeat AI

Le modèle de codage NousCoder-14B de Nous Research fait son entrée dans le moment des assistants Claude pour le code

Nous Research, un startup d'IA open-source soutenu par Paradigm, a dévoilé le 1er janvier un nouveau modèle de programmation compétitif, NousCoder-14B, affirmant qu'il égalise ou surpasse plusieurs systèmes propriétaires plus volumineux, formé en seulement quatre jours avec 48 des derniers GPU Nvidia B200. Ce modèle se distingue par son accessibilité, car Nous Research a publié le modèle, l'environnement d'apprentissage par renforcement, la suite de benchmarks et le support de formation, facilitant la reproduction ou l'extension par des chercheurs disposant de suffisamment de ressources computationnelles. Cela survient alors que Claude Code, un outil agissant de la concurrente Anthropic, suscite beaucoup d'intérêt sur les réseaux sociaux, avec des développeurs témoignant de ses capacités remarquables, illustrant la rapide évolution et la concurrence féroce dans le domaine de l'assistance à la création de logiciels par l'IA.

UENousCoder-14B de Nous Research offre une alternative open-source compétitive aux assistants de codage propriétaires, potentiellement influençant le secteur des outils de développement logiciel en Europe en promouvant l'accessibilité et la transparence, conformément aux principes de l'AI Act.

RechercheOutil

1 source