Aller au contenu principal
Cette startup veut changer la façon dont les mathématiciens font des maths
RechercheMIT Technology Review12sem· 1 min de lecture

Cette startup veut changer la façon dont les mathématiciens font des maths

Source originale ↗·

Axiom Math, une startup basée à Palo Alto, vient de lancer Axplorer, un outil d'intelligence artificielle gratuit destiné aux mathématiciens. Conçu pour identifier des motifs mathématiques susceptibles de débloquer des problèmes non résolus depuis des décennies, l'outil est accessible à quiconque dispose d'un Mac Pro — une rupture radicale avec les ressources jusqu'alors nécessaires pour ce type d'approche.

L'enjeu dépasse largement le cercle académique. Comme le souligne François Charton, chercheur chez Axiom, les avancées en mathématiques ont des répercussions directes sur l'ensemble de la technologie : développement de l'IA de nouvelle génération, renforcement de la sécurité sur Internet, optimisation des réseaux complexes. La DARPA américaine a d'ailleurs lancé l'initiative expMath (Exponentiating Mathematics) pour encourager précisément ce type de développement — et Axiom se positionne explicitement dans cette dynamique.

Axplorer est une refonte grand public de PatternBoost, un outil que Charton avait co-développé en 2024 alors qu'il était chez Meta, et qui nécessitait un supercalculateur. PatternBoost avait notamment permis de résoudre le problème des quatre-cycles de Turán, un défi majeur en théorie des graphes. La fondatrice et CEO d'Axiom, Carina Hong, insiste sur une distinction clé : là où les LLMs comme GPT-5 excellent à trouver des solutions à des problèmes déjà balisés, Axplorer vise l'exploration — générer des exemples, identifier des motifs inédits, ouvrir de nouvelles branches mathématiques. Charton est sévère avec l'approche LLM : "Les LLMs sont conservateurs. Ils essaient de réutiliser ce qui existe déjà."

La comparaison la plus directe est AlphaEvolve de Google DeepMind, qui utilise une approche similaire d'amélioration itérative — mais reste fermé, accessible uniquement à quelques chercheurs privilégiés. C'est précisément le pari d'Axiom : démocratiser ces capacités de découverte mathématique assistée par IA, sans passer par de grandes infrastructures GPU ni dépendre d'un accès institutionnel.

Impact France/UE

L'outil gratuit Axplorer est accessible à toute la communauté mathématique européenne, et son co-créateur François Charton est un chercheur français.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Une startup d'un milliard de dollars avec une vision différente de l'IA
1AI News 

Une startup d'un milliard de dollars avec une vision différente de l'IA

Yann LeCun, ancien directeur scientifique de l'intelligence artificielle chez Meta, a fondé AMI Labs (Advanced Machine Intelligence Labs) après avoir quitté son poste fin 2025. La startup vient de lever un milliard de dollars de financement, une somme remarquable pour une équipe de seulement 12 personnes. LeCun prévoit de ne pas commercialiser de produit avant au moins cinq ans, positionnant AMI Labs comme une organisation de recherche pure. Son approche repose sur des architectures d'IA modulaires composées de plusieurs blocs spécialisés : un modèle du monde propre au domaine d'application, un acteur chargé de proposer des actions via l'apprentissage par renforcement, un module critique qui évalue ces options selon des règles fixes, un système de perception adapté au type de données traité (vidéo, texte, audio), une mémoire à court terme, et un configurateur orchestrant l'ensemble. Chaque instance serait entraînée uniquement sur des données pertinentes à son environnement, contrairement aux grands modèles de langage nourris de l'intégralité du web. Cette approche remet fondamentalement en question le paradigme dominant des LLMs comme GPT ou Claude. Là où ces modèles généralistes mobilisent des centaines de milliards de paramètres et nécessitent une infrastructure colossale pour fonctionner, les modules spécialisés d'AMI Labs pourraient se contenter de quelques centaines de millions de paramètres, voire tourner directement sur un appareil local. Le coût d'entraînement et d'inférence serait alors une fraction de celui des modèles actuels, rendant l'IA viable pour des acteurs qui ne disposent pas des ressources d'Anthropic, OpenAI, Google ou Meta. Pour les entreprises, cela ouvrirait la voie à des systèmes IA déployables en interne, sans dépendance aux grandes plateformes cloud. Le contexte donne tout son poids à cette prise de position. Les LLMs ont absorbé des ressources exponentiellement croissantes à chaque génération, et les techniques d'amélioration récentes, comme le prompting récursif des modèles de raisonnement, alourdissent encore la facture. Seuls de très grands groupes peuvent aujourd'hui se permettre de les exploiter à perte. LeCun, l'un des pères fondateurs du deep learning et lauréat du prix Turing 2018, défend depuis plusieurs années l'idée que les LLMs constituent une impasse pour atteindre une intelligence artificielle véritablement générale. Des précédents existent : les systèmes d'apprentissage automatique capables de maîtriser des jeux vidéo ou de plateau illustrent déjà la puissance des approches ciblées. Si AMI Labs parvient à ses fins, l'industrie pourrait connaître un rééquilibrage majeur, fragmentant un marché aujourd'hui dominé par une poignée d'acteurs disposant de budgets quasi illimités.

UESi l'approche modulaire d'AMI Labs aboutit, les entreprises européennes moins capitalisées pourraient déployer des systèmes IA en interne sans dépendance aux grandes plateformes cloud américaines.

RechercheOpinion
1 source
Séisme dans les maths : l’IA résout une énigme insoluble depuis 80 ans
2Le Big Data 

Séisme dans les maths : l’IA résout une énigme insoluble depuis 80 ans

Le 20 mai 2026, OpenAI a annoncé qu'un de ses modèles de raisonnement avait résolu de manière autonome la conjecture des distances unitaires, un problème de géométrie discrète posé par le mathématicien hongrois Paul Erdős en 1946. La question, d'une formulation apparemment simple, demandait combien de paires de points placés sur un plan pouvaient être séparées exactement par une même distance unitaire. Pendant 80 ans, les mathématiciens avaient convergé vers une intuition commune : les configurations optimales ressemblaient à des grilles carrées ou triangulaires, et la borne maximale ne pouvait dépasser n^(1+o(1)). Le modèle d'OpenAI a infirmé cette conjecture en construisant une nouvelle famille de configurations surpassant radicalement les réseaux classiques, avec une borne de type n^(1+δ), où δ est une constante strictement positive. La plus petite configuration illustrant cette découverte implique un nombre de points de l'ordre de 10^1957, un chiffre tellement astronomique qu'aucune représentation physique n'est envisageable dans notre univers. Ce résultat ne représente pas un exploit de calcul brut, mais un véritable saut conceptuel. Pour dépasser la borne d'Erdős, le modèle n'a pas testé des milliards de configurations à l'aveugle : il a transposé le problème depuis la géométrie discrète vers la théorie algébrique des nombres, mobilisant des structures comme les corps CM et les tours de corps de classes de type Golod-Shafarevich. Ce déplacement conceptuel est précisément ce qu'aucun mathématicien humain n'avait spontanément envisagé. Le résultat a été vérifié à deux niveaux indépendants, par des vérificateurs formels automatisés et par des chercheurs humains spécialisés, ce qui lui confère une légitimité scientifique solide. Timothy Gowers, médaillé Fields, a réagi publiquement en conseillant à ses confrères mathématiciens de s'asseoir avant de lire la preuve. Ce succès s'inscrit dans une accélération spectaculaire des capacités mathématiques des grands modèles de langage. Depuis 2024, les systèmes de raisonnement d'OpenAI, de DeepMind et d'autres acteurs ont multiplié les percées sur des problèmes de compétition, mais s'attaquer à une conjecture ouverte depuis huit décennies constitue un palier qualitatif différent. La question qui se pose désormais pour la communauté scientifique n'est plus de savoir si l'IA peut assister les chercheurs, mais dans quelle mesure elle peut les devancer sur des problèmes où l'intuition humaine s'est révélée structurellement limitée. D'autres conjectures ouvertes, en topologie, en théorie des nombres, en combinatoire, se retrouvent soudainement sous un regard nouveau, celui d'un outil capable de naviguer dans des espaces abstraits inaccessibles à la perception humaine.

UELes laboratoires de mathématiques français et européens (CNRS, IHES, IMJ-PRG) devront réévaluer leur approche des conjectures ouvertes de longue date face à des modèles capables de déplacements conceptuels que l'intuition humaine n'avait pas envisagés.

💬 C'est pas la résolution qui m'épate, c'est le déplacement. Le modèle n'a pas cherché plus fort que les humains sur leur propre terrain, il a changé de terrain (passer de la géométrie discrète à la théorie algébrique des nombres, un angle qu'aucun mathématicien n'avait jugé pertinent en 80 ans). Gowers conseille de s'asseoir avant de lire la preuve, et Gowers, c'est pas quelqu'un qui dit ça pour rien.

RecherchePaper
1 source
MeMo permet aux équipes de changer de LLM sans réentraînement, avec des gains de performance de 26%
3VentureBeat AI 

MeMo permet aux équipes de changer de LLM sans réentraînement, avec des gains de performance de 26%

Des chercheurs issus de plusieurs universités ont publié MeMo (Memory as a Model), un cadre modulaire qui résout l'un des problèmes les plus persistants de l'IA en entreprise : mettre à jour les connaissances d'un grand modèle de langage sans le réentraîner. L'architecture repose sur deux composants distincts : un petit modèle dédié à la mémorisation, appelé MEMORY, qui encode les nouvelles informations dans ses propres paramètres ; et un LLM principal, appelé EXECUTIVE, qui reste figé et joue le rôle de moteur de raisonnement. Lorsqu'un utilisateur pose une question, le modèle EXECUTIVE interroge le modèle MEMORY comme un oracle externe, collecte les faits pertinents, puis synthétise une réponse finale. Le système s'appuie sur des paires questions-réponses générées automatiquement à partir des documents sources, ce que les auteurs appellent des "reflections", pour entraîner le modèle MEMORY à répondre sans avoir à récupérer de contexte extérieur. Les expériences montrent une amélioration des performances allant jusqu'à 26 % par rapport aux approches existantes. L'enjeu est considérable pour les entreprises qui déploient des LLMs en production. Les trois méthodes actuellement utilisées, RAG, fine-tuning et compression de contexte, présentent chacune des limites critiques. Le RAG, pourtant très répandu, souffre de la fragilité des bases vectorielles : comme l'explique Armando Solar-Lezama, co-auteur de l'article, encoder la pleine sémantique d'un texte dans un seul vecteur est une tâche fondamentalement difficile, et les passages mal récupérés dégradent directement la qualité des réponses. Le fine-tuning, lui, est prohibitif pour les grands modèles propriétaires et provoque souvent un "oubli catastrophique", le modèle perd ses capacités de raisonnement ou ses garde-fous de sécurité en assimilant de nouvelles données. MeMo contourne ces deux écueils : la mémoire est portée par un modèle léger et interchangeable, sans toucher aux poids du modèle principal. La portée de MeMo tient aussi à sa compatibilité universelle. Contrairement aux méthodes de compression latente qui lient la mémoire compressée à une architecture spécifique, MeMo fonctionne indifféremment avec des modèles open-source et des modèles propriétaires accessibles uniquement via API. Cela ouvre la voie à un scénario inédit en entreprise : changer de LLM principal, passer de GPT-4 à Claude ou à un modèle open-source, sans perdre la base de connaissances accumulée, ni engager un nouveau cycle de réentraînement coûteux. Dans un secteur où la compétition entre fournisseurs de modèles s'intensifie et où les cycles de mise à jour s'accélèrent, cette portabilité de la mémoire pourrait devenir un avantage stratégique déterminant pour les équipes techniques.

UELes entreprises européennes déployant des LLMs en production pourraient réduire leurs coûts de migration lors de changements de fournisseur de modèles, sans cycle de réentraînement.

💬 Le problème du RAG, on le connaît depuis longtemps : les vecteurs sont fragiles, et un passage mal récupéré, c'est une réponse ratée. MeMo prend le problème à l'envers en séparant la mémoire du raisonnement, et ça change beaucoup de choses sur le papier, surtout l'idée qu'on pourrait switcher de modèle sans repartir de zéro sur la base de connaissances. Reste à voir si les 26% de gains tiennent sur des données métier réelles.

RecherchePaper
1 source
La planification par gradient dans les modèles du monde sur des horizons prolongés
4Robohub 

La planification par gradient dans les modèles du monde sur des horizons prolongés

Des chercheurs de Meta AI, de l'Université de Californie Berkeley et du GRASP Lab ont publié un article présentant GRASP, un nouveau planificateur à base de gradients conçu pour les modèles de monde appris. L'équipe comprend Michael Psenka, Mike Rabbat, Aditi Krishnapriyan, Yann LeCun et Amir Bar. GRASP s'attaque à l'un des problèmes les plus persistants de l'IA incarnée : utiliser efficacement un modèle prédictif puissant pour planifier des séquences d'actions sur de longs horizons temporels. L'approche repose sur trois innovations clés : élever la trajectoire dans des états virtuels pour paralléliser l'optimisation dans le temps, introduire de la stochasticité directement dans les itérations d'état pour favoriser l'exploration, et reformuler les gradients afin que les actions reçoivent des signaux d'apprentissage clairs, tout en évitant les gradients instables qui traversent les modèles de vision haute dimension. Ce travail est important parce qu'il résout un goulot d'étranglement concret qui freine le déploiement des modèles de monde modernes dans des systèmes de contrôle réels. Un modèle de monde, dans ce contexte, est un simulateur différentiable appris : donné un état courant et une séquence d'actions futures, il prédit ce qui va se passer. En théorie, cela permettrait à un agent de planifier par optimisation, en faisant rouler le modèle en avant et en rétropropageant les erreurs. En pratique, sur de longs horizons, ce processus dégénère : les graphes de calcul deviennent mal conditionnés (problème d'explosion ou de disparition des gradients, analogue au backpropagation through time), des minima locaux apparaissent à cause de la structure non-greedy de la tâche, et les espaces latents de haute dimension introduisent des instabilités supplémentaires. GRASP contourne ces trois écueils simultanément, rendant la planification par gradient beaucoup plus robuste sans abandonner la différentiabilité du système. Les modèles de monde sont devenus un axe central de la recherche en IA depuis que Yann LeCun, directeur scientifique de Meta AI, a défendu leur rôle fondamental dans la quête d'une IA plus générale. Des systèmes comme DreamerV3 ou les modèles vidéo génératifs récents montrent que ces architectures peuvent désormais prédire de longues séquences d'observations dans des espaces visuels complexes et généraliser entre tâches. Mais posséder un simulateur puissant et s'en servir efficacement pour la prise de décision sont deux choses différentes. GRASP comble ce fossé en rendant la planification à long horizon viable là où elle échouait auparavant, ouvrant la voie à des agents robotiques ou autonomes capables de raisonner sur des séquences d'actions étendues dans des environnements réels.

RecherchePaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic