Recherche — page 4

671 articles · page 4 sur 14

Dernières avancées en recherche IA : papers, découvertes scientifiques, deep learning et nouvelles architectures.

LLMs Business Éthique Outils Régulation Robotique Sécurité Société Infrastructure Création Autre

OpenAI repousse les limites du raisonnement automatisé avec ce qu'il appelle une avancée majeure en mathématiques

Un modèle de raisonnement d'OpenAI vient de réfuter une conjecture du mathématicien Paul Erdős portant sur la géométrie des distances unitaires, restée ouverte depuis 1946. Pour y parvenir, le modèle a mobilisé des outils issus de la théorie algébrique des nombres, une approche que les spécialistes du domaine n'avaient jamais envisagée dans ce contexte. La médaille Fields Tim Gowers, l'une des plus grandes autorités mondiales en mathématiques, a qualifié le résultat de "jalon dans les mathématiques de l'IA", et la communauté scientifique est désormais en train d'en analyser les détails techniques. L'impact va bien au-delà d'un simple exercice de calcul. En invalidant une conjecture vieille de 80 ans par un chemin conceptuellement inattendu, l'IA démontre une capacité à explorer des espaces de solutions que les chercheurs humains auraient peu de chances d'emprunter spontanément. Tim Gowers lui-même avertit : "Nous sommes probablement entrés dans une ère où il deviendra très difficile pour les humains de rivaliser avec l'IA dans la résolution de problèmes mathématiques." Ce n'est plus une promesse, c'est un constat d'un pair reconnu. Les conjectures d'Erdős forment l'un des corpus de problèmes ouverts les plus célèbres des mathématiques modernes, et beaucoup résistent depuis des décennies. OpenAI s'inscrit dans une course engagée avec Google DeepMind et d'autres, qui cherchent tous à démontrer que leurs modèles peuvent produire de véritables avancées scientifiques, et pas seulement assister les chercheurs. Cette démonstration pourrait accélérer l'intégration de l'IA dans les laboratoires de mathématiques pures, et relancer le débat sur ce que signifie "comprendre" en mathématiques.

UELes chercheurs en mathématiques des universités françaises et européennes pourraient être amenés à reconsidérer le rôle de l'IA comme outil de découverte scientifique dans leurs laboratoires de recherche fondamentale.

Recherche — page 4

OpenAI repousse les limites du raisonnement automatisé avec ce qu'il appelle une avancée majeure en mathématiques

Séisme dans les maths : l’IA résout une énigme insoluble depuis 80 ans

GPT-next d'OpenAI réfute le problème des distances unitaires planaires d'Erdős pour moins de 1 000 dollars

Un seul modèle, trois modalités : ByteDance lance Lance pour comprendre, générer et éditer images et vidéos

VLA-REPLICA : un benchmark reproductible et économique pour l'évaluation réelle des modèles vision-langage-action (VLA)

VLANeXt : recettes pour construire des modèles VLA performants

Google associe son modèle Genie à Street View pour créer des mondes IA explorables basés sur des lieux réels

DEFLECT : exécution robuste aux délais par ajustement contrefactuel estimé par flow-matching pour les politiques VLA

ContextFlow : alignement hiérarchique tâche-état pour agents incarnés à long horizon

Deux assistants IA parviennent à accomplir des tâches de repositionnement de médicaments

Agora-1 transforme le classique GoldenEye N64 en simulation IA jouable à quatre

Auto-encodeurs épars ancrés dans les événements pour les politiques VLA

COAST : débloquer les modèles vision-langage-action (VLA) par les états cachés

Amorçage auto-supervisé du raisonnement incarné pour la prédiction d'actions

Apprentissage de la continuation native pour les politiques de flux par découpage d'actions

OxyGen : gestion unifiée du cache KV pour l'inférence de modèles VLA en parallélisme multi-tâches

IA incarnée en chimiste quantique : Qumus automatise la recherche sur les matériaux quantiques

EpiCache : gestion du cache KV épisodique pour les conversations longues sur appareils à ressources limitées

La tendance de la descente de gradient stochastique à privilégier les basses fréquences, et comment Adam y remédie

Starchild-1 : voici l’IA multimodale qui comprend le monde comme jamais auparavant

GAP : pré-entraînement par ancrage géométrique pour un apprentissage visuomoteur économe en données des tâches de manipulation

Sparse ActionGen : accélération de la politique de diffusion par élagage en temps réel

Modèle du monde par retour d'information pour guidage précis des politiques de diffusion

OHP-RL : guidage par préférences humaines en ligne pour l'apprentissage par renforcement en manipulation robotique

Un nouveau test mathématique révèle que les modèles d'IA résolvent avec assurance des problèmes sans solution

ICML 2026 : les nouvelles frontières du machine learning se discutent à Séoul

NeurIPS 2026 : la conférence où se joue l’avenir scientifique, industriel et géopolitique de l’IA

Nous Research propose Lighthouse Attention : une attention hiérarchique par sélection qui accélère le pré-entraînement de 1,4 à 1,7× sur les longs contextes

RecursiveMAS accélère l'inférence multi-agents de 2,4x et réduit l'usage des tokens de 75 %

Notes complémentaires sur la délégation à l'IA et la fiabilité à long terme

Les LLM rendus plus rapides sans sacrifier la précision

VER : Transformer expert en vision pour l'apprentissage robotique par distillation de modèle fondation et routage dynamique

Pelican-Unified 1.0 : un modèle d'IA incarnée unifié pour la compréhension, le raisonnement, l'imagination et l'action

XR-1 : vers des modèles VLA polyvalents par apprentissage de représentations vision-mouvement unifiées

MIMIC-D : imitation multimodale pour la coordination multi-agents par politiques de diffusion décentralisées

Nous Research publie une méthode d'entraînement par superposition de tokens qui accélère le pré-entraînement des LLM jusqu'à 2,5x pour des modèles de 270M à 10B paramètres

Vers des agents incarnés à long horizon avec des modèles vision-langage-action (VLA) alignés sur les outils

Realtime-VLA FLASH : un cadre d'inférence spéculative pour les modèles VLA à base de diffusion

FrameSkip : apprendre à partir de moins de frames mais plus informatifs dans l'entraînement des modèles VLA

AttenA+ : corriger l'inégalité des actions dans les modèles fondation pour la robotique

UniJEPA : amélioration des politiques robotiques via l'apprentissage unifié de représentations continues et discrètes

D-VLA : un cadre d'apprentissage par renforcement distribué et asynchrone à haute concurrence pour les modèles vision-langage-action

NVIDIA et Ineffable Intelligence s'associent pour bâtir l'infrastructure de l'apprentissage par renforcement

Hallucination d'action dans les modèles vision-langage-action (VLA) génératifs

Surmonter l'aveuglement aux dynamiques : correction de vitesse et de trajectoire sans entraînement pour les modèles VLA

Évaluation hors-ligne des politiques de manipulation via une formulation de vivacité actualisée

DreamAvoid : rêverie au moment du test sur les phases critiques pour éviter les échecs des politiques VLA

Voir ce qui compte : élagage différentiable par grille pour un modèle VLA généralisable

GuidedVLA : spécialisation de l'attention pour cibler les facteurs pertinents d'une tâche dans les modèles VLA

ForceFlow : apprendre à ressentir et agir grâce à l'apprentissage par flux guidé par le contact