Aller au contenu principal
PaperBench: Évaluer la capacité de l'IA à Répliquer la Recherche en Intelligence Artificielle
RechercheOpenAI Blog63sem· 1 min de lecture

PaperBench: Évaluer la capacité de l'IA à Répliquer la Recherche en Intelligence Artificielle

Source originale ↗·

Nous présentons PaperBench, un benchmark évaluant la capacité des agents d'IA à reproduire la recherche d'IA de pointe. Cet outil permet de mesurer les performances des systèmes d'IA face à la tâche complexe de réplication des études de recherche avancées dans le domaine de l'intelligence artificielle.

Impact France/UE

PaperBench évaluant la capacité de l'IA à reproduire la recherche en IA, pourrait influencer la conformité avec le futur AI Act de l'UE, en particulier pour les entreprises françaises comme Orange ou Capgemini, en les aidant à garantir la transparence et la responsabilité de leurs systèmes d'IA.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Qu’est-ce que l’AGI (intelligence artificielle générale) ? Définition
1Siècle Digital 

Qu’est-ce que l’AGI (intelligence artificielle générale) ? Définition

L'AGI (intelligence artificielle générale) est un concept ambitieux dans la recherche en IA, cherchant à développer une intelligence artificielle capable de comprendre, apprendre et s'adapter à une large gamme de tâches, comme un humain. Bien que des modèles génératifs prospèrent, l'AGI reste une idée discutée parmi les chercheurs et les leaders de la technologie.

RechercheOpinion
1 source
L'intelligence artificielle fête ses 70 ans
2IEEE Spectrum AI 

L'intelligence artificielle fête ses 70 ans

L'intelligence artificielle fête cette année ses 70 ans en tant que discipline scientifique formelle. C'est en août 1955 que John McCarthy, Marvin Minsky, Nathaniel Rochester et Claude Shannon ont déposé la proposition du Dartmouth Summer Research Project on Artificial Intelligence, qui s'est tenu l'été suivant, en 1956. Ce projet a officiellement fondé l'IA comme champ de recherche autonome et introduit le terme même d'intelligence artificielle. Minsky la définissait alors comme la science de faire accomplir aux machines des tâches qui exigeraient de l'intelligence si elles étaient réalisées par des humains, une formulation qui reste d'une précision remarquable. Depuis, l'IA a connu une diffusion sans précédent dans l'histoire des technologies, pénétrant les secteurs de l'éducation, de la finance, de la santé, de l'industrie et de la défense. Ces sept décennies ne se sont pas déroulées en ligne droite. Les racines intellectuelles de l'IA précèdent l'ordinateur moderne : dès 1943, le neurophysiologiste Warren McCulloch et le logicien Walter Pitts avaient modélisé mathématiquement des neurones artificiels, démontrant que des réseaux de neurones pouvaient effectuer des calculs logiques. En 1950, Alan Turing posait la question fondatrice "Les machines peuvent-elles penser ?" et proposait le test de Turing comme critère d'évaluation. La même année, Claude Shannon publiait un programme théorique pour jouer aux échecs. John McCarthy développa en 1958 le langage Lisp, qui devint l'outil dominant de la recherche en IA, et Arthur Samuel introduisit le terme machine learning en 1959. Dans les années 1980, les systèmes experts à base de règles, comme MYCIN pour le diagnostic médical, connurent un essor avant de buter sur leurs limites structurelles. Comprendre ce parcours en dents de scie est aujourd'hui stratégique, car l'IA ne constitue plus un horizon lointain mais une infrastructure critique déjà déployée à grande échelle. Son adoption dépasse en vitesse tous les précédents technologiques, ce qui amplifie autant ses bénéfices potentiels que ses risques. Les questions sur ses limites actuelles, les biais qu'elle reproduit, son impact sur l'emploi et les enjeux éthiques qu'elle soulève restent largement ouvertes. Des organisations comme l'IEEE, dont les contributions à l'avancement de l'IA sont documentées sur l'ensemble de ces 70 ans, jouent un rôle croissant dans l'établissement de standards et de repères pour orienter son développement. L'anniversaire est autant une célébration qu'une invitation à prendre la mesure de ce que cette technologie transforme, de manière souvent imprévisible, dans nos sociétés.

RechercheOpinion
1 source
CuspAI, ou la promesse d’une science accélérée par l’intelligence artificielle
3FrenchWeb 

CuspAI, ou la promesse d’une science accélérée par l’intelligence artificielle

CuspAI, startup britannique fondée en 2024 par Chad Edwards, s'est imposée comme l'un des acteurs les plus prometteurs de l'IA appliquée à la découverte de matériaux. La société développe une plateforme d'intelligence artificielle capable de modéliser et prédire les propriétés de nouveaux matériaux en une fraction du temps qu'exigerait l'expérimentation classique en laboratoire. Après avoir levé plusieurs dizaines de millions de dollars auprès d'investisseurs spécialisés dans les deeptech, CuspAI entend accélérer des cycles de R&D qui s'étendent habituellement sur une décennie. L'enjeu est considérable : la découverte de nouveaux matériaux conditionne des secteurs entiers, des batteries pour véhicules électriques aux semi-conducteurs, en passant par les panneaux solaires et les matériaux de construction à faible empreinte carbone. En réduisant de plusieurs années le délai entre l'idée et le prototype validé, CuspAI pourrait déverrouiller des goulots d'étranglement qui freinent la transition énergétique et l'industrie manufacturière mondiale. Pour les laboratoires et les industriels, il s'agit d'un changement de paradigme comparable à ce que la simulation numérique a représenté dans les années 1980. Cette ambition s'inscrit dans une vague plus large d'IA scientifique, dite « AI for science », portée aussi bien par DeepMind avec AlphaFold que par des startups comme Insilico Medicine dans le médicament ou Orbital Materials dans les matériaux avancés. CuspAI se différencie par sa focalisation sur les matériaux solides et sa volonté de s'intégrer directement dans les flux de travail industriels, visant des partenariats avec de grands groupes chimiques et énergétiques plutôt qu'une approche purement académique.

UELes industriels européens engagés dans la transition énergétique (batteries, panneaux solaires, matériaux bas carbone) pourraient bénéficier directement de la plateforme CuspAI pour accélérer leurs cycles de R&D.

RecherchePaper
1 source
IMITATION LEARNING : définition, fonctionnement et cas d’usage en intelligence artificielle
4FrenchWeb 

IMITATION LEARNING : définition, fonctionnement et cas d’usage en intelligence artificielle

L'apprentissage par imitation — imitation learning en anglais — s'impose comme l'un des paradigmes les plus prometteurs de l'intelligence artificielle appliquée, notamment dans la robotique et les systèmes autonomes. Contrairement au reinforcement learning classique, qui oblige un agent à explorer son environnement par essais-erreurs en accumulant récompenses et pénalités, l'imitation learning repose sur un principe radicalement différent : un modèle apprend en observant des démonstrations réalisées par un expert humain ou un autre système. Deux grandes variantes coexistent — le clonage comportemental, qui imite directement les actions observées, et l'apprentissage inverse par renforcement, qui tente d'inférer la fonction de récompense sous-jacente au comportement de l'expert. L'impact concret est significatif dans les domaines où définir une fonction de récompense explicite reste difficile ou coûteux. En robotique industrielle, des bras manipulateurs apprennent à effectuer des tâches de précision — assemblage, tri, chirurgie assistée — à partir de quelques démonstrations humaines, sans programmer chaque geste manuellement. Dans les véhicules autonomes, des systèmes comme ceux de Waymo ou Tesla intègrent des mécanismes proches pour capturer des comportements de conduite complexes directement depuis des données réelles. Cette approche s'inscrit dans un mouvement plus large vers des IA capables d'acquérir des compétences sans supervision dense. Des laboratoires comme DeepMind, OpenAI ou le CNRS explorent activement ses limites, notamment le problème de distribution shift — le modèle échoue dès qu'il rencontre une situation hors du corpus d'imitation. Des hybrides combinant imitation learning et reinforcement learning, comme DAgger, cherchent à dépasser cette fragilité fondamentale.

UELe CNRS est cité parmi les laboratoires qui explorent activement l'imitation learning, positionnant la recherche française dans ce paradigme émergent.

RecherchePaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic