Aller au contenu principal
« Je suis sous le choc » : l’IA Claude a résolu un casse-tête mathématique sur lequel butait cette légende de l’informatique
RechercheNumerama13sem

« Je suis sous le choc » : l’IA Claude a résolu un casse-tête mathématique sur lequel butait cette légende de l’informatique

Résumé IASource uniqueImpact UE
Source originale ↗·

L'IA Claude d'Anthropic, développée par Microsoft, a résolu un problème mathématique complexe qui a perdu l'informaticien Donald Knuth, lauréat du prix Turing. Cette avancée montre que les IA peuvent être des outils précieux pour les scientifiques, si on sait les interroger correctement.

Impact France/UE

L'IA Claude d'Anthropic, développée par Microsoft, démontre son potentiel pour résoudre des problèmes complexes, impactant potentiellement les recherches scientifiques en France et en Europe, en appuyant l'application de l'AI Act et en offrant des opportunités dans divers secteurs tout en respectant les normes du RGPD.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Un nouveau test mathématique révèle que les modèles d'IA résolvent avec assurance des problèmes sans solution
1The Decoder 

Un nouveau test mathématique révèle que les modèles d'IA résolvent avec assurance des problèmes sans solution

Un consortium de 64 mathématiciens a conçu SOOHAK, un nouveau benchmark destiné à évaluer les capacités des modèles d'IA en mathématiques de recherche. L'outil comprend 439 problèmes rédigés à la main, dont 99 délibérément sans solution valide. Sur les problèmes de niveau recherche, Gemini 3 Pro de Google arrive en tête avec un score de 30 %. En revanche, aucun modèle ne dépasse 50 % lorsqu'il s'agit d'identifier les problèmes insolubles, autrement dit, tous les systèmes testés échouent à reconnaître qu'une question n'a pas de réponse. Ce résultat pointe une faille fondamentale : davantage de puissance de calcul améliore la capacité à résoudre des problèmes, mais n'améliore pas la capacité à admettre qu'un problème est sans issue. Pour un outil censé assister des chercheurs, cette lacune est critique. Un modèle qui répond avec assurance à une question mal posée ou insoluble est potentiellement plus dangereux qu'un modèle qui avoue ses limites, il peut induire en erreur des équipes entières. SOOHAK s'inscrit dans un effort plus large pour dépasser les benchmarks saturés ou trop faciles à "tricher", qui donnent une impression trompeuse des capacités réelles des IA. La communauté scientifique cherche à mesurer non seulement la performance brute, mais aussi la métacognition, savoir ce qu'on ne sait pas. Avec des scores plafonnant à 30 % sur des tâches de recherche authentique, SOOHAK confirme que les modèles actuels restent loin d'un niveau de raisonnement mathématique avancé, malgré les annonces régulières de progrès spectaculaires.

💬 La vraie info ici, c'est pas le 30 % de Gemini, c'est le moins de 50 % sur les problèmes sans solution. Aucun modèle ne sait dire "cette question est mal posée", et c'est exactement le genre de bug silencieux qui peut planter un projet de recherche entier. Reste à voir combien d'équipes scientifiques utilisent ces outils sans savoir ça.

RecherchePaper
1 source
Séisme dans les maths : l’IA résout une énigme insoluble depuis 80 ans
2Le Big Data 

Séisme dans les maths : l’IA résout une énigme insoluble depuis 80 ans

Le 20 mai 2026, OpenAI a annoncé qu'un de ses modèles de raisonnement avait résolu de manière autonome la conjecture des distances unitaires, un problème de géométrie discrète posé par le mathématicien hongrois Paul Erdős en 1946. La question, d'une formulation apparemment simple, demandait combien de paires de points placés sur un plan pouvaient être séparées exactement par une même distance unitaire. Pendant 80 ans, les mathématiciens avaient convergé vers une intuition commune : les configurations optimales ressemblaient à des grilles carrées ou triangulaires, et la borne maximale ne pouvait dépasser n^(1+o(1)). Le modèle d'OpenAI a infirmé cette conjecture en construisant une nouvelle famille de configurations surpassant radicalement les réseaux classiques, avec une borne de type n^(1+δ), où δ est une constante strictement positive. La plus petite configuration illustrant cette découverte implique un nombre de points de l'ordre de 10^1957, un chiffre tellement astronomique qu'aucune représentation physique n'est envisageable dans notre univers. Ce résultat ne représente pas un exploit de calcul brut, mais un véritable saut conceptuel. Pour dépasser la borne d'Erdős, le modèle n'a pas testé des milliards de configurations à l'aveugle : il a transposé le problème depuis la géométrie discrète vers la théorie algébrique des nombres, mobilisant des structures comme les corps CM et les tours de corps de classes de type Golod-Shafarevich. Ce déplacement conceptuel est précisément ce qu'aucun mathématicien humain n'avait spontanément envisagé. Le résultat a été vérifié à deux niveaux indépendants, par des vérificateurs formels automatisés et par des chercheurs humains spécialisés, ce qui lui confère une légitimité scientifique solide. Timothy Gowers, médaillé Fields, a réagi publiquement en conseillant à ses confrères mathématiciens de s'asseoir avant de lire la preuve. Ce succès s'inscrit dans une accélération spectaculaire des capacités mathématiques des grands modèles de langage. Depuis 2024, les systèmes de raisonnement d'OpenAI, de DeepMind et d'autres acteurs ont multiplié les percées sur des problèmes de compétition, mais s'attaquer à une conjecture ouverte depuis huit décennies constitue un palier qualitatif différent. La question qui se pose désormais pour la communauté scientifique n'est plus de savoir si l'IA peut assister les chercheurs, mais dans quelle mesure elle peut les devancer sur des problèmes où l'intuition humaine s'est révélée structurellement limitée. D'autres conjectures ouvertes, en topologie, en théorie des nombres, en combinatoire, se retrouvent soudainement sous un regard nouveau, celui d'un outil capable de naviguer dans des espaces abstraits inaccessibles à la perception humaine.

UELes laboratoires de mathématiques français et européens (CNRS, IHES, IMJ-PRG) devront réévaluer leur approche des conjectures ouvertes de longue date face à des modèles capables de déplacements conceptuels que l'intuition humaine n'avait pas envisagés.

💬 C'est pas la résolution qui m'épate, c'est le déplacement. Le modèle n'a pas cherché plus fort que les humains sur leur propre terrain, il a changé de terrain (passer de la géométrie discrète à la théorie algébrique des nombres, un angle qu'aucun mathématicien n'avait jugé pertinent en 80 ans). Gowers conseille de s'asseoir avant de lire la preuve, et Gowers, c'est pas quelqu'un qui dit ça pour rien.

RecherchePaper
1 source
Les agents uniques surpassent souvent les systèmes multi-agents : êtes-vous victime de cette complexité inutile ?
3VentureBeat AI 

Les agents uniques surpassent souvent les systèmes multi-agents : êtes-vous victime de cette complexité inutile ?

Des chercheurs de l'université de Stanford ont publié une étude qui remet en cause l'un des dogmes les plus répandus dans le développement IA en entreprise : l'idée que les systèmes multi-agents seraient intrinsèquement supérieurs aux architectures à agent unique pour les tâches complexes. Menée par Dat Tran et Douwe Kiela, la recherche a soumis les deux types d'architectures à des tâches de raisonnement en chaîne ("multi-hop reasoning"), c'est-à-dire des problèmes nécessitant de relier plusieurs informations disparates pour parvenir à une conclusion. Le protocole clé : imposer un budget identique de "tokens de réflexion", les tokens utilisés exclusivement pour le raisonnement intermédiaire, hors prompt initial et réponse finale. Résultat : dans la majorité des cas, un agent unique dispose du même budget surpasse ou égale un système multi-agents. L'enjeu est considérable pour les équipes d'ingénierie qui investissent massivement dans des architectures complexes. Les systèmes multi-agents, qu'il s'agisse d'agents planificateurs, de systèmes en débat ou d'essaims de modèles, génèrent des traces de raisonnement plus longues et multiplient les appels LLM, consommant mécaniquement davantage de ressources. Le problème soulevé par Stanford est que la plupart des comparaisons publiées jusqu'ici n'étaient pas à budget égal : les gains affichés par le multi-agent reflétaient souvent une simple dépense de calcul supplémentaire, et non un avantage architectural réel. Autrement dit, les entreprises pourraient payer une "taxe essaim" sans bénéfice net. La seule situation où le multi-agent conserve un avantage légitime est celle où le contexte d'un agent unique devient trop long ou corrompu, atteignant une limite physique. Pour aller plus loin, les chercheurs ont introduit une technique baptisée SAS-L (single-agent system with longer thinking), conçue pour corriger un comportement fréquent : les agents uniques abandonnent parfois leur raisonnement interne prématurément, laissant du budget de calcul inexploité. La solution proposée est purement structurelle, sans surcoût architectural : reformuler le prompt pour encourager explicitement le modèle à dépenser son budget disponible en analyse pré-réponse, en identifiant les ambiguïtés et les hypothèses intermédiaires avant de conclure. Cette approche s'inscrit dans une tendance de fond qui pousse le domaine à reconsidérer la complexité comme valeur en soi. Alors que les frameworks multi-agents prolifèrent et que les coûts d'inférence restent élevés, Stanford offre un argument empirique solide pour privilégier la simplicité, et ne recourir à l'orchestration multi-agents qu'une fois le plafond de l'agent unique véritablement atteint.

UELes équipes d'ingénierie en France et en Europe qui déploient des systèmes multi-agents peuvent directement réduire leurs coûts d'inférence en simplifiant leurs architectures, en s'appuyant sur les conclusions empiriques de cette étude pour justifier ce choix en interne.

RecherchePaper
1 source
Un modèle OpenAI résout un problème mathématique célèbre resté sans réponse pendant 80 ans
4Ars Technica AI 

Un modèle OpenAI résout un problème mathématique célèbre resté sans réponse pendant 80 ans

En mai 2026, OpenAI a annoncé qu'un de ses modèles d'IA internes avait réfuté la conjecture des distances unitaires d'Erdős, un problème de géométrie discrète resté sans solution depuis quatre-vingt ans. La conjecture, formulée par le mathématicien hongrois Paul Erdős, porte sur le nombre maximal de paires de points situés à distance exactement 1 dans un ensemble de points du plan. Avant de rendre le résultat public, OpenAI a accordé un accès anticipé à plusieurs mathématiciens reconnus, qui ont pu examiner et valider la démonstration. Les réactions de la communauté mathématique témoignent de l'importance du résultat. Tim Gowers, médaillé Fields, la plus haute distinction en mathématiques, a qualifié cette résolution de « jalon dans les mathématiques par l'IA ». Daniel Litt, professeur à l'Université de Toronto, a souligné qu'il s'agissait du « premier exemple d'un résultat produit de manière autonome par une IA qu'il trouve passionnant en lui-même, et non comme simple indicateur précoce ». Cette nuance est cruciale : les précédentes démonstrations assistées par IA étaient surtout perçues comme des signaux de progression future, pas comme des contributions mathématiques réelles. Ce résultat intervient dans un contexte où les grands laboratoires d'IA rivalisent pour démontrer des capacités de raisonnement formel avancé. Google DeepMind, OpenAI et d'autres investissent massivement dans des systèmes capables de produire des preuves mathématiques vérifiables. Résoudre un problème ouvert depuis 1946 franchit un seuil symbolique : l'IA ne se contente plus d'assister le mathématicien humain, elle produit des découvertes originales que la communauté scientifique reconnaît comme telles.

UELes mathématiciens et chercheurs européens devront revoir leur rapport à l'IA comme outil de découverte scientifique autonome, sans impact réglementaire ou institutionnel direct pour la France ou l'UE.

RecherchePaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour