RechercheOpenAI Blog30sem· 1 min de lecture

GPT-5 et l'avenir des découvertes mathématiques

Titre: GPT-5 et l'avenir des découvertes mathématiques

Le professeur Ernest Ryu de l'UCLA et GPT-5 ont résolu un problème crucial en théorie des mathématiques optimales, démontrant le rôle de l'IA dans l'accélération des découvertes mathématiques.

Impact France/UE

L'avènement de GPT-5 accélère les découvertes mathématiques, illustré par la résolution d'un problème crucial par le professeur Ernest Ryu, ouvrant des opportunités pour les mathématiciens européens mais posant également des défis à la validation des résultats selon le Règlement Général sur la Protection des Données (RGPD).

Dans nos dossiers

GPT-5

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost

Google DeepMind présente Aletheia : L'agent AI passant des compétitions mathématiques aux découvertes de recherche professionnelle entièrement autonomes

Google DeepMind a présenté Aletheia, un agent AI spécialisé pour relier les compétitions mathématiques à la recherche professionnelle. Aletheia, basé sur Gemini Deep Think, utilise une architecture d'agencement (Generator, Verifier, Reviser) pour générer, vérifier et corriger des solutions en langage naturel. Aletheia a atteint 95.1% d'exactitude sur le banc de tests IMO-Proof Advanced et a contribué à plusieurs publications académiques, y compris la résolution autonome de 4 problèmes ouverts. DeepMind propose une classification pour les contributions mathématiques de l'IA, allant de la collaboration humain-IA (niveau 1) à l'autonomie quasi complète (niveau 2).

RechercheOutil

1 source

2OpenAI Blog

GPT-5.2 découvre un nouveau résultat en physique théorique

Un nouveau pré-publication dévoile que GPT-5.2 propose une nouvelle formule pour une amplitude de gluon, ultérieurement prouvée et vérifiée par OpenAI et des collaborateurs académiques.

UEL'avancement AI GPT-5.2 contribue potentiellement à l'innovation en physique théorique, influençant les recherches académiques européennes sans impact direct sur entreprises spécifiques en France ou dans l'UE, en respectant les lois comme le RGPD et l'AI Act, mais favorisant un environnement propice à la recherche et au développement.

RecherchePaper

1 source

3Latent Space

Pourquoi il n'existe pas d'AlphaFold pour les matériaux — l'IA au service de la découverte des matériaux avec Heather Kulik

La professeure Heather Kulik, pionnière de l'IA appliquée aux sciences des matériaux, explique pourquoi un équivalent d'AlphaFold pour les matériaux n'existe pas encore : contrairement à la biologie, le domaine manque de données structurées et nécessite une intégration profonde de l'expertise humaine. Son groupe a récemment utilisé l'IA pour concevoir des polymères quatre fois plus résistants, découvrant un effet purement quantique que les scientifiques n'avaient pas anticipé. Elle souligne cependant les limites actuelles des LLMs en chimie, illustrées par un test simple — concevoir un ligand de exactement 22 atomes lourds — que ni Claude ni ChatGPT ne réussissent de manière fiable, notamment pour les MOFs (Metal-Organic Frameworks).

RecherchePaper

1 source

4The Decoder

Un nouveau test mathématique révèle que les modèles d'IA résolvent avec assurance des problèmes sans solution

Un consortium de 64 mathématiciens a conçu SOOHAK, un nouveau benchmark destiné à évaluer les capacités des modèles d'IA en mathématiques de recherche. L'outil comprend 439 problèmes rédigés à la main, dont 99 délibérément sans solution valide. Sur les problèmes de niveau recherche, Gemini 3 Pro de Google arrive en tête avec un score de 30 %. En revanche, aucun modèle ne dépasse 50 % lorsqu'il s'agit d'identifier les problèmes insolubles, autrement dit, tous les systèmes testés échouent à reconnaître qu'une question n'a pas de réponse. Ce résultat pointe une faille fondamentale : davantage de puissance de calcul améliore la capacité à résoudre des problèmes, mais n'améliore pas la capacité à admettre qu'un problème est sans issue. Pour un outil censé assister des chercheurs, cette lacune est critique. Un modèle qui répond avec assurance à une question mal posée ou insoluble est potentiellement plus dangereux qu'un modèle qui avoue ses limites, il peut induire en erreur des équipes entières. SOOHAK s'inscrit dans un effort plus large pour dépasser les benchmarks saturés ou trop faciles à "tricher", qui donnent une impression trompeuse des capacités réelles des IA. La communauté scientifique cherche à mesurer non seulement la performance brute, mais aussi la métacognition, savoir ce qu'on ne sait pas. Avec des scores plafonnant à 30 % sur des tâches de recherche authentique, SOOHAK confirme que les modèles actuels restent loin d'un niveau de raisonnement mathématique avancé, malgré les annonces régulières de progrès spectaculaires.

💬 La vraie info ici, c'est pas le 30 % de Gemini, c'est le moins de 50 % sur les problèmes sans solution. Aucun modèle ne sait dire "cette question est mal posée", et c'est exactement le genre de bug silencieux qui peut planter un projet de recherche entier. Reste à voir combien d'équipes scientifiques utilisent ces outils sans savoir ça.

RecherchePaper

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic