Aller au contenu principal
RechercheMIT Technology Review6sem

OpenAI mise tout sur la création d'un chercheur entièrement automatisé

Résumé IASource uniqueImpact UE
Source originale ↗·

OpenAI réoriente l'ensemble de ses efforts de recherche autour d'un objectif unique et ambitieux : construire un chercheur entièrement automatisé, capable de s'attaquer seul à des problèmes complexes et de grande envergure. Cette nouvelle priorité devient, selon la firme de San Francisco, sa "étoile du nord" pour les prochaines années, fédérant plusieurs axes de travail jusqu'ici distincts : modèles de raisonnement, agents autonomes et interprétabilité.

La feuille de route est précise. D'ici septembre 2025, OpenAI entend déployer un "stagiaire chercheur IA autonome" — un système capable de prendre en charge, seul, un nombre restreint de problèmes de recherche spécifiques. Ce premier jalon préfigure un système multi-agents entièrement automatisé prévu pour 2028, qui devrait selon la société pouvoir traiter des problèmes trop vastes ou trop complexes pour l'intelligence humaine seule. Les domaines visés sont larges : mathématiques, physique, biologie, chimie, mais aussi questions de politique publique ou défis stratégiques d'entreprise — en somme, tout ce qui peut s'exprimer en texte, en code ou sur un tableau blanc.

C'est Jakub Pachocki, directeur scientifique d'OpenAI, qui pilote cette ambition aux côtés du directeur de la recherche Mark Chen. Dans un entretien exclusif, Pachocki affirme : "Je pense que nous approchons du moment où nous aurons des modèles capables de travailler indéfiniment de façon cohérente, comme le font les humains." Il cite Codex, l'agent de génération de code lancé en janvier, comme une première incarnation embryonnaire de ce chercheur IA — un outil dont la majorité du personnel technique d'OpenAI ferait déjà usage quotidiennement. L'objectif est d'étendre la durée d'autonomie de ces systèmes : "Ce que nous visons pour un stagiaire chercheur automatisé, c'est un système auquel on peut déléguer des tâches qui prendraient plusieurs jours à un humain", précise-t-il.

Le projet s'inscrit dans un contexte de concurrence accrue, avec Anthropic et Google DeepMind qui talonent désormais OpenAI sur le marché des modèles de pointe. Des voix extérieures, comme celle de Doug Downey de l'Allen Institute for AI, confirment l'enthousiasme du secteur pour ces systèmes de recherche longue durée, portés par le succès des agents de codage. La vraie question reste ouverte : ces systèmes pourront-ils un jour produire des découvertes scientifiques originales, ou se limiteront-ils à accélérer un travail déjà balisé par des chercheurs humains ?

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Import AI 

Import AI 454 : automatiser la recherche sur l'alignement, étude de sécurité d'un modèle chinois, HiFloat4

Des chercheurs de Huawei ont publié une étude démontrant la supériorité de HiFloat4, leur format de précision 4 bits propriétaire, face à MXFP4, le standard ouvert développé par l'Open Compute Project. Les tests ont été conduits sur des puces Ascend de Huawei avec trois architectures de modèles : OpenPangu-1B, Llama3-8B et Qwen3-MoE-30B. Les résultats sont clairs : HiFloat4 atteint une erreur relative d'environ 1,0 % par rapport à une baseline BF16 pleine précision, contre 1,5 % pour MXFP4. Fait notable, cet avantage se creuse à mesure que les modèles grossissent. HiFloat4 n'a besoin que d'une seule technique de stabilisation (RHT) pour atteindre ce niveau, là où MXFP4 exige trois mécanismes combinés. Par ailleurs, des chercheurs du programme Anthropic Fellows ont publié une étude montrant que des agents Claude sont capables d'automatiser la recherche en sécurité IA : ces agents proposent des idées, mènent des expériences et itèrent de façon autonome sur un problème ouvert, en l'occurrence la supervision "weak-to-strong", soit la capacité d'un modèle moins puissant à superviser efficacement un modèle plus capable. Résultat : les agents ont surpassé deux chercheurs humains qui avaient pourtant travaillé sept jours sur le même problème. Ces deux avancées ont des implications concrètes et distinctes. Côté Huawei, disposer d'un format de précision réduite plus efficace signifie tirer davantage de performance des puces Ascend sans augmenter la consommation électrique, un enjeu critique pour l'entraînement et l'inférence à grande échelle. Pour l'industrie, cela confirme qu'une alternative sérieuse aux formats occidentaux existe et peut fonctionner sur un écosystème matériel entièrement indépendant. Côté Anthropic, la démonstration que Claude peut conduire de la recherche en alignement de manière autonome est un signal précoce mais significatif : si des agents IA peuvent progresser sur les problèmes de sécurité plus vite que des humains, cela ouvre la voie à une accélération massive de ce champ de recherche, encore largement sous-doté face à la vitesse de développement des capacités. Le format HiFloat4 s'inscrit dans la continuité de HiFloat8, présenté précédemment, et reflète une tendance de fond chez les acteurs chinois du hardware : face aux restrictions américaines d'exportation qui coupent la Chine de l'accès aux puces Nvidia H100 en volume suffisant, Huawei et ses pairs investissent massivement dans l'optimisation logicielle et les formats de données propriétaires pour compenser ce déficit. C'est une réponse structurelle aux sanctions, pas un simple exercice académique. Du côté d'Anthropic, l'automatisation de la recherche en alignement répond à une urgence : le rythme de progression des capacités des LLMs dépasse celui des travaux de sécurité, et si des agents peuvent combler cet écart, ils pourraient devenir un outil central dans la course à rendre l'IA plus fiable avant qu'elle ne devienne incontrôlable.

UEL'émergence de HiFloat4 comme alternative propriétaire aux formats ouverts (MXFP4) illustre la fragmentation des standards matériels IA, un enjeu stratégique pour les entreprises européennes qui devront naviguer entre écosystèmes incompatibles dans leurs choix d'infrastructure.

RecherchePaper
1 source
Comment une IA associé à un labo automatisé accélère la recherche biologique
2Le Big Data 

Comment une IA associé à un labo automatisé accélère la recherche biologique

Des chercheurs d'OpenAI et de Ginkgo Bioworks ont combiné une IA (GPT-5) avec un laboratoire automatisé pour accélérer la recherche biologique. En utilisant la technique de synthèse protéique acellulaire (CFPS), l'IA a conçu des expériences, analysé les résultats et ajusté ses approches en environ une heure par itération, démontrant ainsi la capacité de l'IA à formuler des hypothèses et à mener des expériences dans le domaine complexe de la biologie.

RecherchePaper
1 source
3MIT Technology Review 

The Download : OpenAI développe un chercheur entièrement automatisé, et un angle mort dans les essais aux psychédéliques

OpenAI s'est fixé un nouvel objectif ambitieux : construire un chercheur IA entièrement autonome, avec un "intern" IA prévu pour septembre 2025 et un système multi-agents complet d'ici 2028, selon le directeur scientifique Jakub Pachocki. En parallèle, la société développe une "super app" fusionnant ChatGPT, un navigateur web et un outil de codage, tout en rachetant la startup Astral pour renforcer son modèle Codex. Parmi les autres actualités marquantes : le DoJ a démantelé des botnets responsables de la plus grande attaque DDoS jamais enregistrée (plus de 3 millions d'appareils infectés), et le Pentagone a exprimé des inquiétudes sécuritaires concernant les employés étrangers d'Anthropic.

LLMsActu
1 source
Google AI Research présente PaperOrchestra, un cadre multi-agents pour la rédaction automatisée d'articles de recherche
4MarkTechPost 

Google AI Research présente PaperOrchestra, un cadre multi-agents pour la rédaction automatisée d'articles de recherche

Une équipe de chercheurs de Google Cloud AI Research a présenté PaperOrchestra, un système multi-agents conçu pour automatiser la rédaction complète d'articles scientifiques. À partir de matériaux non structurés, un résumé d'idée brut et des journaux d'expérimentation, le système produit un manuscript LaTeX prêt à soumettre à une conférence, incluant une revue de littérature, des figures générées automatiquement et des citations vérifiées via API. Le pipeline orchestre cinq agents spécialisés travaillant en séquence, dont deux en parallèle : un agent d'organisation produit d'abord un plan JSON structuré, puis un agent de visualisation génère les figures pendant qu'un agent de revue bibliographique identifie et vérifie les références via l'API Semantic Scholar, en calculant la distance de Levenshtein pour détecter les titres approximatifs et en éliminant les citations hallucinations. Un quatrième agent rédige ensuite les sections restantes, et un cinquième assemble le tout en LaTeX final. Ce système comble un vide réel dans l'outillage de la recherche académique. Les solutions existantes souffraient toutes de limitations structurelles : PaperRobot ne gérait que des séquences de texte incrémentales, AI Scientist (v1 et v2, de Sakana AI) automatise la boucle expérimentale entière mais son module de rédaction reste couplé à ses propres pipelines internes et ne peut pas traiter des données extérieures. Les systèmes spécialisés comme AutoSurvey2 ou LiRA produisent de bonnes revues de littérature mais sont incapables de positionner une méthode spécifique face à l'état de l'art. CycleResearcher, lui, exige un fichier BibTeX structuré en entrée, un artefact rarement disponible en début de rédaction. PaperOrchestra est le premier système à accepter les matériaux tels qu'un chercheur les aurait réellement après ses expériences, sans pré-traitement. L'enjeu derrière ce type d'outil dépasse la simple automatisation : la rédaction académique représente souvent plusieurs semaines de travail après la fin des expériences, et c'est précisément là que de nombreux papiers n'aboutissent jamais, notamment pour les chercheurs moins expérimentés. En industrialisant cette étape, Google s'inscrit dans une course plus large à l'automatisation de la recherche scientifique, où Sakana AI, Anthropic et d'autres tentent de réduire le cycle entre idée et publication. La contrainte imposée par PaperOrchestra, au moins 90 % du corpus bibliographique identifié doit être activement cité, et la vérification systématique des références montrent une volonté de ne pas sacrifier la rigueur à la vitesse. La prochaine étape naturelle serait l'intégration avec des pipelines expérimentaux réels, ce qui rapprocherait encore davantage ce système d'une automatisation complète du cycle de recherche.

UELes chercheurs académiques en France et dans l'UE pourraient bénéficier de cet outil pour réduire le temps de rédaction de leurs articles scientifiques, mais aucun déploiement européen spécifique n'est annoncé.

RecherchePaper
1 source