RechercheInteresting Engineering · 21 avr. 2026, 21:20· 2 min de lecture

Les États-Unis utilisent le premier supercalculateur exascale mondial pour modéliser des supernovae et des réacteurs à fusion

Des scientifiques américains du laboratoire national d'Oak Ridge (ORNL), rattaché au Département de l'Énergie, ont utilisé Frontier, le superordinateur exascale le plus puissant du monde, pour modéliser la turbulence magnétohydrodynamique (MHD) dans les plasmas. Capable d'effectuer plus de deux quintillions de calculs par seconde, Frontier est classé troisième superordinateur le plus rapide au monde, derrière Aurora et El Capitan. L'équipe, dirigée par le doctorant Semih Kacmaz sous la supervision d'Eliu Huerta, scientifique computationnel à l'Argonne National Laboratory, a développé une approche en deux étapes combinant un opérateur neuronal informé par la physique et un modèle de diffusion génératif. Ensemble, ces deux systèmes d'IA produisent des prédictions de turbulences très détaillées en quelques secondes, avec une réduction des erreurs de plus de moitié par rapport aux méthodes conventionnelles.

Ce résultat représente une avancée majeure dans un domaine que les physiciens considèrent comme l'un des plus récalcitrants de leur discipline. La turbulence MHD régit le comportement des gaz ionisés soumis à des champs magnétiques, des phénomènes omniprésents dans l'univers : éruptions solaires, explosions de supernovæ, magnétosphère terrestre. Les méthodes traditionnelles, comme l'approche Reynolds-Averaged Navier-Stokes (RANS), reposent sur des équations simplifiées qui lissent les détails fins et ne capturent pas toute la physique en jeu. Le nouveau cadre IA, lui, reconstruit les petits tourbillons et fluctuations rapides qui définissent les écoulements turbulents, ouvrant la voie à des modèles de supernovæ bien plus précis et à la conception de réacteurs à fusion nucléaire plus efficaces. "C'est la première fois que l'IA parvient à modéliser fidèlement la turbulence magnétisée dans des conditions aussi extrêmes", a déclaré Huerta.

La turbulence dans les plasmas constitue un obstacle de longue date pour deux domaines stratégiques : l'astrophysique, qui cherche à comprendre les explosions stellaires, et la fusion nucléaire, dont la viabilité industrielle dépend en partie de la maîtrise du comportement des plasmas à haute énergie. Des projets comme ITER ou les réacteurs privés de Commonwealth Fusion Systems se heurtent précisément à ces instabilités. En mobilisant l'allocation de temps de calcul sur Frontier pour générer des milliers de simulations haute-fidélité servant à entraîner leurs modèles, les chercheurs ont démontré que les supercalculateurs exascale peuvent débloquer des problèmes jugés hors de portée. L'équipe prévoit désormais d'étendre le modèle à des simulations plasma en 3D complètes et à des environnements astrophysiques plus complexes, ce qui pourrait accélérer à la fois la recherche fondamentale sur la dynamique des étoiles et le développement applicatif de la fusion comme source d'énergie décarbonée.

Impact France/UE

Les avancées dans la modélisation de la turbulence des plasmas bénéficient directement au projet ITER, dont le réacteur expérimental est en construction à Cadarache (France) et qui se heurte précisément aux instabilités plasma décrites dans l'article.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1arXiv cs.RO

DIAL : découpler intention et action par modélisation latente du monde pour les VLA de bout en bout

Des chercheurs ont publié DIAL (Decoupling Intent and Action via Latent World Modeling), un nouveau cadre d'apprentissage pour les modèles Vision-Langage-Action (VLA) dédiés à la robotique. Le principe repose sur une séparation explicite entre l'intention de haut niveau et l'exécution motrice, via un goulot d'étranglement d'intention latente différentiable. Un module System-2, basé sur un grand modèle de langage visuel (VLM), génère une représentation interne de ce que le robot devrait percevoir dans le futur, une prévision visuelle latente qui encode l'intention. Un module léger System-1 traduit ensuite cette intention en actions motrices précises grâce à une dynamique inverse latente. L'entraînement se déroule en deux phases: un échauffement découplé pour stabiliser chaque module séparément, puis une optimisation conjointe de bout en bout. Sur le benchmark RoboCasa GR1 Tabletop, DIAL établit un nouvel état de l'art en nécessitant dix fois moins de démonstrations que les méthodes concurrentes. Ce gain d'efficacité est décisif dans un domaine où la collecte de données de démonstration reste coûteuse et chronophage. Réduire d'un ordre de grandeur le nombre d'exemples nécessaires change l'équation économique du déploiement de robots autonomes en environnements industriels ou domestiques. DIAL démontre également une généralisation zero-shot robuste: lors de déploiements réels sur un robot humanoïde, le système parvient à manipuler des objets et des configurations jamais rencontrés à l'entraînement, sans données supplémentaires. Cette capacité de transfert constitue l'un des verrous les plus difficiles de la robotique moderne. Le développement des VLA s'est accéléré ces deux dernières années avec l'essor des grands modèles multimodaux. La plupart des approches existantes utilisent toutefois le VLM comme simple encodeur, le connectant directement à une couche d'action, ce qui dégrade ses représentations sémantiques et introduit une instabilité à l'entraînement. DIAL corrige cette limite structurelle en exploitant pleinement les capacités de raisonnement du VLM pour la planification, tout en préservant ses connaissances pré-entraînées grâce au découplage. L'approche s'inscrit dans une tendance plus large visant à doter les robots d'une capacité à planifier avant d'agir, et pourrait accélérer l'adoption de systèmes capables de s'adapter à de nouveaux environnements sans réentraînement coûteux.

RecherchePaper

1 source

2Apple Machine Learning

Recherche sur les environnements proactifs d'agents : simuler des utilisateurs actifs pour évaluer les assistants proactifs

Cet article de recherche présente Pare (Proactive Agent Research Environment), un nouveau cadre conçu pour construire et évaluer des agents IA proactifs, capables d'anticiper les besoins d'un utilisateur et d'exécuter des tâches de façon autonome sans attendre d'instruction explicite. Contrairement aux approches existantes, qui modélisent les applications comme de simples API à appel d'outils, Pare représente les applications sous forme de machines à états finis. Cette modélisation permet de capturer la nature séquentielle et dépendante du contexte des interactions numériques, un aspect jusqu'ici mal reproduit par les frameworks de simulation d'utilisateurs. L'enjeu est de taille pour le développement des assistants numériques de nouvelle génération. Un agent proactif efficace doit comprendre non seulement ce qu'un utilisateur demande, mais aussi anticiper ce dont il aura besoin ensuite, en tenant compte de l'état changeant des applications qu'il utilise, e-mail, calendrier, outils de gestion de tâches. En l'absence d'un environnement de simulation réaliste, il était jusqu'à présent difficile de mesurer si un agent proactif se comporte de manière pertinente et sûre, ou s'il agit de façon intempestive et contre-productive. Pare comble ce vide en offrant un banc d'essai standardisé, ce qui pourrait accélérer la comparaison et l'amélioration des futurs assistants IA. Ce travail s'inscrit dans une tendance plus large de la recherche en intelligence artificielle vers des agents capables d'initiative, au-delà des simples chatbots réactifs qui attendent une requête pour répondre. Les grands laboratoires et équipes académiques cherchent depuis plusieurs mois à doter les agents d'une meilleure compréhension du contexte applicatif dans lequel ils évoluent. En simulant des utilisateurs actifs au sein d'environnements numériques dynamiques, Pare ouvre la voie à des méthodes d'évaluation plus rigoureuses, un préalable jugé nécessaire avant un déploiement à grande échelle de ces assistants proactifs dans des usages professionnels ou grand public.

RecherchePaper

1 source

3MarkTechPost

Sakana AI utilise la diffusion d'erreurs pour entraîner des réseaux à double flux conformes à Dale, atteignant 96,7% sur MNIST et 61,7% sur CIFAR-10 sans rétropropagation

Sakana AI a publié une étude intitulée « Diffusing Blame », qui s'attaque à un problème central de l'apprentissage profond biologiquement plausible : la rétropropagation classique exige que le passage arrière utilise les matrices exactement transposées des poids du passage avant, un mécanisme que le cerveau ne peut vraisemblablement pas reproduire, connu sous le nom de problème du transport de poids. L'équipe s'appuie sur une règle d'apprentissage locale baptisée Error Diffusion, proposée dès 2000 par Kaneko, où chaque mise à jour de poids ne dépend que de trois signaux : l'activité présynaptique, la dérivée de l'activation postsynaptique et un simple signe d'erreur global. Pour respecter le principe de Dale, qui impose qu'un neurone soit soit excitateur soit inhibiteur, les chercheurs ont conçu une architecture à double flux dédoublant chaque couche en un canal excitateur et un canal inhibiteur, avec quatre matrices de poids non négatives par couche, soit environ 32 millions de paramètres contre 8 millions pour une architecture DFA classique. Grâce à trois innovations, un routage d'erreur modulo, des largeurs de sigmoïde ajustées par couche et une initialisation asymétrique des poids, cette méthode atteint 96,7% de précision sur MNIST et 61,7% sur CIFAR-10, contre seulement 50,4% et 11,6% sans ces ajustements. Il s'agit de la première fois qu'Error Diffusion entraîne avec succès des réseaux convolutifs, dépassant les 55,2% obtenus par Fujita en 2026 avec un simple perceptron multicouche aplati sur CIFAR-10. Ces résultats comptent parce qu'ils ouvrent une piste concrète vers des algorithmes d'apprentissage compatibles avec les contraintes biologiques et matérielles, sans sacrifier totalement les performances. Un réseau qui respecte le principe de Dale et n'a jamais besoin de transporter des poids transposés est plus facile à implémenter sur du matériel neuromorphique, où les connexions physiques ne peuvent pas changer de signe à la volée. Pour l'industrie des puces spécialisées en intelligence artificielle et pour la recherche en neurosciences computationnelles, cela représente une preuve de concept que des règles locales et biologiquement crédibles peuvent être poussées au-delà de tâches jouets vers des architectures convolutives réalistes, même si l'écart de performance avec la rétropropagation reste important, puisque la méthode DFA non conforme à Dale atteint 97,6% et 69,1% sur les mêmes tâches. Ce travail s'inscrit dans une longue quête de règles d'apprentissage alternatives à la rétropropagation, de la propagation de rétroaction directe à l'alignement de rétroaction aléatoire, motivée par le décalage entre la neuroscience et le deep learning moderne. L'inversion observée lors des tests d'ablation, où retirer certaines innovations change radicalement l'importance relative des autres composants, suggère que ces mécanismes interagissent de façon non triviale, ouvrant la voie à de futurs travaux visant à réduire encore l'écart avec les méthodes à base de gradient tout en conservant la plausibilité biologique.

💬 Cette histoire de double flux qui respecte le principe de Dale, c'est malin mais ça se paie cash : 32 millions de paramètres pour arriver à 61,7% sur CIFAR-10 quand la rétropropagation classique en fait quatre fois moins pour 69,1%. Selon Le Fil IA, ce papier montre surtout qu'on sait maintenant router l'erreur sans transposer les poids, ce qui compte plus pour le matériel neuromorphique que pour la perf brute. Reste à voir si ça tient sur autre chose que MNIST et CIFAR, parce que passer à l'échelle avec quatre matrices non négatives par couche, ça reste un vrai défi d'ingénierie.

RecherchePaper

1 source

4VentureBeat AI

Les entreprises utilisant plusieurs modèles d'IA sous-estiment les taux d'échec d'un facteur 2,25

Une nouvelle étude portant sur 67 modèles de langage de pointe issus de 21 fournisseurs remet en cause une pratique largement répandue chez les entreprises qui combinent plusieurs modèles d'IA pour réduire les erreurs. Selon les travaux de Josef Chen, auteur de l'étude qui s'est confié à VentureBeat, les entreprises sous-estiment leur taux d'échec réel d'un facteur 2,25 en s'appuyant sur une hypothèse mathématiquement erronée : celle voulant que deux modèles qui échouent rarement sur les mêmes requêtes se couvrent mutuellement. Chen introduit le concept de "plafond de co-échec", c'est-à-dire le pourcentage de requêtes où tous les modèles d'un même groupe se trompent simultanément, une donnée bien plus déterminante que la simple divergence entre modèles. Dans les tests menés par l'équipe, le vote majoritaire naïf entre modèles de niveaux inégaux a produit un gain moyen négatif, soit moins 10 points sur leur jeu de requêtes difficiles, les modèles les plus faibles votant en bloc contre le plus performant. Cette découverte a des conséquences financières et opérationnelles concrètes pour les entreprises qui déploient de l'IA à grande échelle. Les architectures habituelles, routeurs qui aiguillent les requêtes selon leur complexité, cascades qui n'escaladent vers un modèle premium qu'en cas de doute, ou systèmes de Mixture-of-Agents qui fusionnent plusieurs réponses, imposent toutes un coût caché : latence supplémentaire, infrastructure complexe à maintenir, et risques de gouvernance accrus du fait de la multiplication des fournisseurs d'API. Or ces coûts sont souvent engagés sur la base d'une "corrélation d'erreurs par paire" jugée faible, sans que cela garantisse une réelle complémentarité entre modèles inégaux en compétence. Pour les équipes techniques, le message est clair : mieux vaut ne combiner que des modèles de niveau comparable, ou, à défaut, concentrer le budget sur le meilleur modèle disponible plutôt que de multiplier les architectures d'orchestration. Cette remise en question intervient alors que les modèles de pointe convergent de plus en plus dans leurs capacités, ce qui réduit mécaniquement les bénéfices attendus de la diversité algorithmique : quand les meilleurs modèles sont d'accord entre eux, et pire, échouent sur les mêmes requêtes, le prompt initial ne dit presque rien sur celui qui aura raison en cas de désaccord. L'étude identifie toutefois une exception notable : à qualité égale, un ensemble de modèles différents mais faiblement corrélés bat un système "Self-MoA", où un même modèle premium est interrogé plusieurs fois. Les chercheurs recommandent désormais aux équipes de mesurer directement leur taux de co-échec avant d'investir dans une infrastructure d'orchestration, un test qui ne coûte rien et qui permettrait d'éviter des dépenses d'ingénierie pour des gains de performance largement illusoires.

RecherchePaper

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic