Claude Mythos résout le problème historique…

GPT-next d'OpenAI réfute le problème des distances unitaires planaires d'Erdős pour moins de 1 000 dollars

50

1Latent Space

GPT-next d'OpenAI réfute le problème des distances unitaires planaires d'Erdős pour moins de 1 000 dollars

OpenAI a annoncé début mai 2026 qu'un modèle interne, vraisemblablement une version intermédiaire de GPT-5, surnommée GPT-5.6, a réfuté une conjecture mathématique vieille de 80 ans : le problème des distances unitaires planes, posé par le mathématicien hongrois Paul Erdős en 1946. Le modèle a produit ce résultat en moins de 32 heures de calcul, pour un coût estimé à moins de 1 000 dollars. Concrètement, il a découvert une nouvelle famille de constructions géométriques qui dépasse les meilleures solutions connues basées sur les grilles carrées. Le raisonnement généré s'étend sur environ 125 pages, avec un passage en page 39 qui a particulièrement attiré l'attention de la communauté mathématique. Il s'agit techniquement d'une réfutation, pas d'une preuve, ce qui, selon les auteurs, rend le résultat légèrement moins spectaculaire qu'il aurait pu être, mais significatif malgré tout. Ce qui frappe les observateurs, c'est que le modèle utilisé n'est pas un système spécialisé comme AlphaProof ou un prouveur formel de type Lean, mais un LLM généraliste. Le mathématicien Timothy Gowers, médaille Fields 1998, a qualifié ce résultat de "premier exemple vraiment clair" où une IA résout un problème mathématique ouvert de renom. Le chercheur d'OpenAI Hongxun Wu y voit une démonstration de capacités de raisonnement sur des "problèmes de la plus haute difficulté". L'implication est importante : si un modèle généraliste peut progresser sur des problèmes ouverts en géométrie discrète, le même type de raisonnement pourrait s'appliquer à d'autres domaines scientifiques, biologie, physique, chimie computationnelle. OpenAI a précisé que le modèle n'a pas été poussé à ses limites et sera mis à disposition du public. Ce résultat s'inscrit dans une dynamique plus large autour du calcul à l'inférence : l'idée que donner plus de temps de réflexion à un modèle, plutôt que d'entraîner un modèle plus grand, est le levier dominant du progrès actuel. La longueur inhabituelle du raisonnement produit (125 pages) illustre précisément cette approche. En parallèle, Cohere a publié cette même semaine Command A+, son premier modèle entièrement open source sous licence Apache 2.0 : 218 milliards de paramètres en architecture MoE avec 25 milliards actifs, multimodal, compatible 48 langues, et capable de tourner sur seulement deux GPU H100 en quantification W4A4. Les benchmarks le placent au niveau de Claude 4.5 Haiku avec de bonnes performances en évitement des hallucinations, mais en retrait sur le raisonnement scientifique et le code par rapport aux modèles de tête. Ces deux annonces confirment une semaine de mai 2026 particulièrement dense pour l'IA de frontière.

RecherchePaper

1 source

OpenAI repousse les limites du raisonnement automatisé avec ce qu'il appelle une avancée majeure en mathématiques

54

2The Decoder

OpenAI repousse les limites du raisonnement automatisé avec ce qu'il appelle une avancée majeure en mathématiques

Un modèle de raisonnement d'OpenAI vient de réfuter une conjecture du mathématicien Paul Erdős portant sur la géométrie des distances unitaires, restée ouverte depuis 1946. Pour y parvenir, le modèle a mobilisé des outils issus de la théorie algébrique des nombres, une approche que les spécialistes du domaine n'avaient jamais envisagée dans ce contexte. La médaille Fields Tim Gowers, l'une des plus grandes autorités mondiales en mathématiques, a qualifié le résultat de "jalon dans les mathématiques de l'IA", et la communauté scientifique est désormais en train d'en analyser les détails techniques. L'impact va bien au-delà d'un simple exercice de calcul. En invalidant une conjecture vieille de 80 ans par un chemin conceptuellement inattendu, l'IA démontre une capacité à explorer des espaces de solutions que les chercheurs humains auraient peu de chances d'emprunter spontanément. Tim Gowers lui-même avertit : "Nous sommes probablement entrés dans une ère où il deviendra très difficile pour les humains de rivaliser avec l'IA dans la résolution de problèmes mathématiques." Ce n'est plus une promesse, c'est un constat d'un pair reconnu. Les conjectures d'Erdős forment l'un des corpus de problèmes ouverts les plus célèbres des mathématiques modernes, et beaucoup résistent depuis des décennies. OpenAI s'inscrit dans une course engagée avec Google DeepMind et d'autres, qui cherchent tous à démontrer que leurs modèles peuvent produire de véritables avancées scientifiques, et pas seulement assister les chercheurs. Cette démonstration pourrait accélérer l'intégration de l'IA dans les laboratoires de mathématiques pures, et relancer le débat sur ce que signifie "comprendre" en mathématiques.

UELes chercheurs en mathématiques des universités françaises et européennes pourraient être amenés à reconsidérer le rôle de l'IA comme outil de découverte scientifique dans leurs laboratoires de recherche fondamentale.

💬 Ce n'est pas qu'il a résolu un problème d'Erdős vieux de 80 ans qui m'intéresse, c'est le chemin emprunté. Passer par la théorie algébrique des nombres là où personne ne regardait, c'est exactement le genre de détour qu'un chercheur humain n'aurait pas pris (trop risqué, trop loin des habitudes du domaine). Quand Gowers, médaille Fields, dit qu'on entre dans une ère difficile pour les humains en maths, c'est pas de la provoc, c'est un constat.

RecherchePaper

1 source

Un nouveau test mathématique révèle que les modèles d'IA résolvent avec assurance des problèmes sans solution

48

3The Decoder

Un nouveau test mathématique révèle que les modèles d'IA résolvent avec assurance des problèmes sans solution

Un consortium de 64 mathématiciens a conçu SOOHAK, un nouveau benchmark destiné à évaluer les capacités des modèles d'IA en mathématiques de recherche. L'outil comprend 439 problèmes rédigés à la main, dont 99 délibérément sans solution valide. Sur les problèmes de niveau recherche, Gemini 3 Pro de Google arrive en tête avec un score de 30 %. En revanche, aucun modèle ne dépasse 50 % lorsqu'il s'agit d'identifier les problèmes insolubles, autrement dit, tous les systèmes testés échouent à reconnaître qu'une question n'a pas de réponse. Ce résultat pointe une faille fondamentale : davantage de puissance de calcul améliore la capacité à résoudre des problèmes, mais n'améliore pas la capacité à admettre qu'un problème est sans issue. Pour un outil censé assister des chercheurs, cette lacune est critique. Un modèle qui répond avec assurance à une question mal posée ou insoluble est potentiellement plus dangereux qu'un modèle qui avoue ses limites, il peut induire en erreur des équipes entières. SOOHAK s'inscrit dans un effort plus large pour dépasser les benchmarks saturés ou trop faciles à "tricher", qui donnent une impression trompeuse des capacités réelles des IA. La communauté scientifique cherche à mesurer non seulement la performance brute, mais aussi la métacognition, savoir ce qu'on ne sait pas. Avec des scores plafonnant à 30 % sur des tâches de recherche authentique, SOOHAK confirme que les modèles actuels restent loin d'un niveau de raisonnement mathématique avancé, malgré les annonces régulières de progrès spectaculaires.

💬 La vraie info ici, c'est pas le 30 % de Gemini, c'est le moins de 50 % sur les problèmes sans solution. Aucun modèle ne sait dire "cette question est mal posée", et c'est exactement le genre de bug silencieux qui peut planter un projet de recherche entier. Reste à voir combien d'équipes scientifiques utilisent ces outils sans savoir ça.

RecherchePaper

1 source

Séisme dans les maths : l’IA résout une énigme insoluble depuis 80 ans

58

4Le Big Data

Séisme dans les maths : l’IA résout une énigme insoluble depuis 80 ans

Le 20 mai 2026, OpenAI a annoncé qu'un de ses modèles de raisonnement avait résolu de manière autonome la conjecture des distances unitaires, un problème de géométrie discrète posé par le mathématicien hongrois Paul Erdős en 1946. La question, d'une formulation apparemment simple, demandait combien de paires de points placés sur un plan pouvaient être séparées exactement par une même distance unitaire. Pendant 80 ans, les mathématiciens avaient convergé vers une intuition commune : les configurations optimales ressemblaient à des grilles carrées ou triangulaires, et la borne maximale ne pouvait dépasser n^(1+o(1)). Le modèle d'OpenAI a infirmé cette conjecture en construisant une nouvelle famille de configurations surpassant radicalement les réseaux classiques, avec une borne de type n^(1+δ), où δ est une constante strictement positive. La plus petite configuration illustrant cette découverte implique un nombre de points de l'ordre de 10^1957, un chiffre tellement astronomique qu'aucune représentation physique n'est envisageable dans notre univers. Ce résultat ne représente pas un exploit de calcul brut, mais un véritable saut conceptuel. Pour dépasser la borne d'Erdős, le modèle n'a pas testé des milliards de configurations à l'aveugle : il a transposé le problème depuis la géométrie discrète vers la théorie algébrique des nombres, mobilisant des structures comme les corps CM et les tours de corps de classes de type Golod-Shafarevich. Ce déplacement conceptuel est précisément ce qu'aucun mathématicien humain n'avait spontanément envisagé. Le résultat a été vérifié à deux niveaux indépendants, par des vérificateurs formels automatisés et par des chercheurs humains spécialisés, ce qui lui confère une légitimité scientifique solide. Timothy Gowers, médaillé Fields, a réagi publiquement en conseillant à ses confrères mathématiciens de s'asseoir avant de lire la preuve. Ce succès s'inscrit dans une accélération spectaculaire des capacités mathématiques des grands modèles de langage. Depuis 2024, les systèmes de raisonnement d'OpenAI, de DeepMind et d'autres acteurs ont multiplié les percées sur des problèmes de compétition, mais s'attaquer à une conjecture ouverte depuis huit décennies constitue un palier qualitatif différent. La question qui se pose désormais pour la communauté scientifique n'est plus de savoir si l'IA peut assister les chercheurs, mais dans quelle mesure elle peut les devancer sur des problèmes où l'intuition humaine s'est révélée structurellement limitée. D'autres conjectures ouvertes, en topologie, en théorie des nombres, en combinatoire, se retrouvent soudainement sous un regard nouveau, celui d'un outil capable de naviguer dans des espaces abstraits inaccessibles à la perception humaine.

UELes laboratoires de mathématiques français et européens (CNRS, IHES, IMJ-PRG) devront réévaluer leur approche des conjectures ouvertes de longue date face à des modèles capables de déplacements conceptuels que l'intuition humaine n'avait pas envisagés.

💬 C'est pas la résolution qui m'épate, c'est le déplacement. Le modèle n'a pas cherché plus fort que les humains sur leur propre terrain, il a changé de terrain (passer de la géométrie discrète à la théorie algébrique des nombres, un angle qu'aucun mathématicien n'avait jugé pertinent en 80 ans). Gowers conseille de s'asseoir avant de lire la preuve, et Gowers, c'est pas quelqu'un qui dit ça pour rien.

RecherchePaper

1 source

Claude Mythos résout le problème historique d'Erdős d'OpenAI avec une preuve simple et élégante

À lire aussi

GPT-next d'OpenAI réfute le problème des distances unitaires planaires d'Erdős pour moins de 1 000 dollars

OpenAI repousse les limites du raisonnement automatisé avec ce qu'il appelle une avancée majeure en mathématiques

Un nouveau test mathématique révèle que les modèles d'IA résolvent avec assurance des problèmes sans solution

Séisme dans les maths : l’IA résout une énigme insoluble depuis 80 ans