RechercheMIT Technology Review · 20 mars 2026, 12:57· 2 min de lecture

OpenAI mise tout sur la création d'un chercheur entièrement automatisé

OpenAI réoriente l'ensemble de ses efforts de recherche autour d'un objectif unique et ambitieux : construire un chercheur entièrement automatisé, capable de s'attaquer seul à des problèmes complexes et de grande envergure. Cette nouvelle priorité devient, selon la firme de San Francisco, sa "étoile du nord" pour les prochaines années, fédérant plusieurs axes de travail jusqu'ici distincts : modèles de raisonnement, agents autonomes et interprétabilité.

La feuille de route est précise. D'ici septembre 2025, OpenAI entend déployer un "stagiaire chercheur IA autonome", un système capable de prendre en charge, seul, un nombre restreint de problèmes de recherche spécifiques. Ce premier jalon préfigure un système multi-agents entièrement automatisé prévu pour 2028, qui devrait selon la société pouvoir traiter des problèmes trop vastes ou trop complexes pour l'intelligence humaine seule. Les domaines visés sont larges : mathématiques, physique, biologie, chimie, mais aussi questions de politique publique ou défis stratégiques d'entreprise, en somme, tout ce qui peut s'exprimer en texte, en code ou sur un tableau blanc.

C'est Jakub Pachocki, directeur scientifique d'OpenAI, qui pilote cette ambition aux côtés du directeur de la recherche Mark Chen. Dans un entretien exclusif, Pachocki affirme : "Je pense que nous approchons du moment où nous aurons des modèles capables de travailler indéfiniment de façon cohérente, comme le font les humains." Il cite Codex, l'agent de génération de code lancé en janvier, comme une première incarnation embryonnaire de ce chercheur IA, un outil dont la majorité du personnel technique d'OpenAI ferait déjà usage quotidiennement. L'objectif est d'étendre la durée d'autonomie de ces systèmes : "Ce que nous visons pour un stagiaire chercheur automatisé, c'est un système auquel on peut déléguer des tâches qui prendraient plusieurs jours à un humain", précise-t-il.

Le projet s'inscrit dans un contexte de concurrence accrue, avec Anthropic et Google DeepMind qui talonent désormais OpenAI sur le marché des modèles de pointe. Des voix extérieures, comme celle de Doug Downey de l'Allen Institute for AI, confirment l'enthousiasme du secteur pour ces systèmes de recherche longue durée, portés par le succès des agents de codage. La vraie question reste ouverte : ces systèmes pourront-ils un jour produire des découvertes scientifiques originales, ou se limiteront-ils à accélérer un travail déjà balisé par des chercheurs humains ?

Dans nos dossiers

OpenAI Google DeepMind Anthropic Codex

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1VentureBeat AI

Des chercheurs automatisent la conception de stratégies de raisonnement pour LLM et réduisent l'utilisation de tokens de 69,5 %

Des chercheurs affiliés à Meta, Google et plusieurs universités ont publié AutoTTS, un cadre algorithmique capable de concevoir automatiquement des stratégies d'optimisation pour les grands modèles de langage au moment de l'inférence. Jusqu'ici, les ingénieurs devaient manuellement définir les règles régissant le raisonnement des modèles, quand explorer de nouvelles pistes, quand approfondir une réflexion existante, quand élaguer une branche peu prometteuse. AutoTTS remplace ce travail artisanal par un agent explorateur, typiquement un LLM comme Claude, qui teste et affine des politiques d'allocation de calcul de façon itérative. Dans les expérimentations menées par les chercheurs, cette approche a permis de réduire la consommation de tokens de 69,5 % sans perte de précision. L'enjeu est considérable pour les entreprises qui déploient des modèles de raisonnement en production. Le "test-time scaling" (TTS) consiste à accorder aux modèles des cycles de calcul supplémentaires à l'inférence, générer plusieurs chemins de raisonnement, voter par majorité sur la réponse, ou s'arrêter dès qu'un seuil de confiance est atteint. Ces stratégies sont coûteuses, et les réduire de 69,5 % sans sacrifier la qualité représente une économie opérationnelle directe et substantielle. Pour les organisations déployant ces modèles à grande échelle, c'est la différence entre une technologie économiquement viable et un budget calcul incontrôlable. Le TTS s'est imposé ces dernières années comme l'une des voies principales pour améliorer les performances des LLM sans passer par un réentraînement coûteux. Les méthodes existantes, self-consistency, adaptive-consistency, parallel-probe, partagent toutes le même défaut : elles sont conçues à la main, limitées par l'intuition humaine dans un espace de configurations potentielles immense. AutoTTS redéfinit le rôle de l'ingénieur : plutôt que de coder les règles elles-mêmes, il définit l'environnement de découverte (l'espace d'états, les objectifs d'optimisation, les mécanismes de feedback), et laisse le LLM explorateur trouver la politique optimale. Pour rendre cette recherche économiquement supportable, le cadre s'appuie sur un environnement de simulation hors ligne, évitant d'appeler le modèle cible à chaque itération. La publication ouvre la voie à une nouvelle catégorie d'outils où l'IA conçoit ses propres stratégies d'inférence, potentiellement adaptées dynamiquement selon le type de tâche ou le budget disponible.

UEUne réduction de 69,5% des tokens à l'inférence bénéficierait aux entreprises et institutions européennes déployant des LLMs en production, réduisant significativement leurs coûts opérationnels cloud.

RecherchePaper

1 source

2Import AI

Import AI 454 : automatiser la recherche sur l'alignement, étude de sécurité d'un modèle chinois, HiFloat4

Des chercheurs de Huawei ont publié une étude démontrant la supériorité de HiFloat4, leur format de précision 4 bits propriétaire, face à MXFP4, le standard ouvert développé par l'Open Compute Project. Les tests ont été conduits sur des puces Ascend de Huawei avec trois architectures de modèles : OpenPangu-1B, Llama3-8B et Qwen3-MoE-30B. Les résultats sont clairs : HiFloat4 atteint une erreur relative d'environ 1,0 % par rapport à une baseline BF16 pleine précision, contre 1,5 % pour MXFP4. Fait notable, cet avantage se creuse à mesure que les modèles grossissent. HiFloat4 n'a besoin que d'une seule technique de stabilisation (RHT) pour atteindre ce niveau, là où MXFP4 exige trois mécanismes combinés. Par ailleurs, des chercheurs du programme Anthropic Fellows ont publié une étude montrant que des agents Claude sont capables d'automatiser la recherche en sécurité IA : ces agents proposent des idées, mènent des expériences et itèrent de façon autonome sur un problème ouvert, en l'occurrence la supervision "weak-to-strong", soit la capacité d'un modèle moins puissant à superviser efficacement un modèle plus capable. Résultat : les agents ont surpassé deux chercheurs humains qui avaient pourtant travaillé sept jours sur le même problème. Ces deux avancées ont des implications concrètes et distinctes. Côté Huawei, disposer d'un format de précision réduite plus efficace signifie tirer davantage de performance des puces Ascend sans augmenter la consommation électrique, un enjeu critique pour l'entraînement et l'inférence à grande échelle. Pour l'industrie, cela confirme qu'une alternative sérieuse aux formats occidentaux existe et peut fonctionner sur un écosystème matériel entièrement indépendant. Côté Anthropic, la démonstration que Claude peut conduire de la recherche en alignement de manière autonome est un signal précoce mais significatif : si des agents IA peuvent progresser sur les problèmes de sécurité plus vite que des humains, cela ouvre la voie à une accélération massive de ce champ de recherche, encore largement sous-doté face à la vitesse de développement des capacités. Le format HiFloat4 s'inscrit dans la continuité de HiFloat8, présenté précédemment, et reflète une tendance de fond chez les acteurs chinois du hardware : face aux restrictions américaines d'exportation qui coupent la Chine de l'accès aux puces Nvidia H100 en volume suffisant, Huawei et ses pairs investissent massivement dans l'optimisation logicielle et les formats de données propriétaires pour compenser ce déficit. C'est une réponse structurelle aux sanctions, pas un simple exercice académique. Du côté d'Anthropic, l'automatisation de la recherche en alignement répond à une urgence : le rythme de progression des capacités des LLMs dépasse celui des travaux de sécurité, et si des agents peuvent combler cet écart, ils pourraient devenir un outil central dans la course à rendre l'IA plus fiable avant qu'elle ne devienne incontrôlable.

UEL'émergence de HiFloat4 comme alternative propriétaire aux formats ouverts (MXFP4) illustre la fragmentation des standards matériels IA, un enjeu stratégique pour les entreprises européennes qui devront naviguer entre écosystèmes incompatibles dans leurs choix d'infrastructure.

RecherchePaper

1 source

3The Decoder

OpenAI repousse les limites du raisonnement automatisé avec ce qu'il appelle une avancée majeure en mathématiques

Un modèle de raisonnement d'OpenAI vient de réfuter une conjecture du mathématicien Paul Erdős portant sur la géométrie des distances unitaires, restée ouverte depuis 1946. Pour y parvenir, le modèle a mobilisé des outils issus de la théorie algébrique des nombres, une approche que les spécialistes du domaine n'avaient jamais envisagée dans ce contexte. La médaille Fields Tim Gowers, l'une des plus grandes autorités mondiales en mathématiques, a qualifié le résultat de "jalon dans les mathématiques de l'IA", et la communauté scientifique est désormais en train d'en analyser les détails techniques. L'impact va bien au-delà d'un simple exercice de calcul. En invalidant une conjecture vieille de 80 ans par un chemin conceptuellement inattendu, l'IA démontre une capacité à explorer des espaces de solutions que les chercheurs humains auraient peu de chances d'emprunter spontanément. Tim Gowers lui-même avertit : "Nous sommes probablement entrés dans une ère où il deviendra très difficile pour les humains de rivaliser avec l'IA dans la résolution de problèmes mathématiques." Ce n'est plus une promesse, c'est un constat d'un pair reconnu. Les conjectures d'Erdős forment l'un des corpus de problèmes ouverts les plus célèbres des mathématiques modernes, et beaucoup résistent depuis des décennies. OpenAI s'inscrit dans une course engagée avec Google DeepMind et d'autres, qui cherchent tous à démontrer que leurs modèles peuvent produire de véritables avancées scientifiques, et pas seulement assister les chercheurs. Cette démonstration pourrait accélérer l'intégration de l'IA dans les laboratoires de mathématiques pures, et relancer le débat sur ce que signifie "comprendre" en mathématiques.

UELes chercheurs en mathématiques des universités françaises et européennes pourraient être amenés à reconsidérer le rôle de l'IA comme outil de découverte scientifique dans leurs laboratoires de recherche fondamentale.

💬 Ce n'est pas qu'il a résolu un problème d'Erdős vieux de 80 ans qui m'intéresse, c'est le chemin emprunté. Passer par la théorie algébrique des nombres là où personne ne regardait, c'est exactement le genre de détour qu'un chercheur humain n'aurait pas pris (trop risqué, trop loin des habitudes du domaine). Quand Gowers, médaille Fields, dit qu'on entre dans une ère difficile pour les humains en maths, c'est pas de la provoc, c'est un constat.

RecherchePaper

1 source

4Le Big Data

Comment une IA associé à un labo automatisé accélère la recherche biologique

Des chercheurs d'OpenAI et de Ginkgo Bioworks viennent de franchir un cap inédit dans la recherche biologique : un modèle d'IA a conçu, exécuté et optimisé des expériences scientifiques de manière quasi autonome, en boucle avec un laboratoire entièrement robotisé. En l'espace de deux mois, le système a réalisé plus de 36 000 tests et réduit d'environ 40 % le coût de production d'une protéine cible. L'enjeu dépasse largement la performance technique. La biologie a longtemps résisté à l'automatisation cognitive : contrairement aux mathématiques ou à l'informatique, il n'existe pas de "bonne réponse" unique, et formuler puis valider une hypothèse y reste extraordinairement complexe. Associer un grand modèle de langage à une infrastructure robotisée capable de boucler des expériences en moins d'une heure ouvre la voie à une accélération radicale du développement de nouveaux médicaments, avec à la clé un accès plus rapide aux traitements pour les patients. Le protocole reposait sur la protéine fluorescente verte superfolder (sfGFP), référence classique en biologie, et sur la technique de synthèse protéique acellulaire (CFPS), une méthode qui produit des protéines sans cellules vivantes, évitant les étapes longues d'insertion d'ADN et de culture cellulaire. Le modèle GPT-5 d'OpenAI, depuis San Francisco, envoyait ses protocoles aux robots de Ginkgo Bioworks installés à Boston ; après chaque cycle d'environ une heure, il analysait les résultats et proposait de nouvelles expériences, sans supervision humaine permanente. Joy Jiao, responsable de la recherche en sciences de la vie chez OpenAI, admet avoir doutée que l'IA puisse concevoir une seule expérience fonctionnelle, les premiers résultats l'ont surprise. Pour Michael Jewett, bioingénieur à l'Université de Stanford, ce couplage IA–laboratoire autonome représente un changement de paradigme pour la découverte thérapeutique. Reshma Shetty, directrice des opérations et cofondatrice de Ginkgo Bioworks, souligne quant à elle que les modèles d'IA seuls ne suffisent pas : c'est leur intégration avec des infrastructures physiques automatisées, ce que le PDG Jason Kelly compare au "Waymo de la biologie", qui libère leur plein potentiel scientifique.

RecherchePaper

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic