Aller au contenu principal
Le laboratoire autonome : Joseph Krause (Radical AI)
RechercheLatent Space3h· 2 min de lecture

Le laboratoire autonome : Joseph Krause (Radical AI)

Source originale ↗·

Joseph Krause, chercheur en science des matériaux, a fondé Radical AI avec une conviction simple : les industries attendent depuis trop longtemps de meilleurs matériaux, et ce goulot d'étranglement coûte des décennies de progrès à l'aérospatiale, à l'informatique, à la défense et aux produits grand public. Pour y remédier, son entreprise a construit ce qu'elle appelle un « laboratoire autonome », un système en boucle fermée où un « scientifique IA » génère des hypothèses, des robots synthétisent et caractérisent les matériaux, et les campagnes de recherche s'exécutent en parallèle plutôt que de façon séquentielle. En six mois, ce laboratoire a produit et caractérisé 1 200 alliages, soit près de dix fois la cadence du programme DARPA/GE MACH, qui visait 500 nouveaux alliages en un an. Sur les 300 nouveaux matériaux proposés par le scientifique IA, dix présentent des propriétés inédites et sont déjà en cours de développement pour des applications commerciales. Krause estime qu'il est désormais possible de tester et caractériser une centaine de nouveaux alliages par jour.

Ce rythme change radicalement la logique de la découverte en science des matériaux, un domaine historiquement freiné par la complexité des variables en jeu. Contrairement aux molécules biologiques, représentables sous forme de séquences de tokens, les matériaux dépendent de paramètres macroscopiques enchevêtrés : microstructures, procédés de fabrication, chaînes d'approvisionnement. Comme l'a illustré la polémique LK99 en 2023, où des chercheurs annonçaient un supraconducteur à température ambiante avant que l'absence de documentation sur la fabrication ne rende les résultats impossibles à reproduire , , un matériau ne se réduit pas à sa formule chimique. C'est la raison pour laquelle Radical n'a pas misé sur un modèle unique capable de concevoir un matériau parfait d'un seul coup : la vérité terrain, insiste Krause, c'est le matériau lui-même, testé physiquement dans le monde réel.

La force de Radical repose sur cette boucle expérimentale fermée et les données qu'elle génère. Dans un secteur où la plupart des acteurs publient des résultats ponctuels, accumuler une base de données propriétaire à haute cadence constitue un avantage structurel difficile à copier. L'entreprise explore déjà des familles d'alliages sur lesquelles aucune publication scientifique n'existe encore, ouvrant un territoire vierge à la fois pour la recherche fondamentale et pour des applications industrielles concrètes. Krause résume l'ambition avec une formule lapidaire : une découverte ne compte vraiment que le jour où le matériau se retrouve dans le téléphone que vous tenez en main.

Impact France/UE

Les industries européennes de l'aérospatiale, de la défense et de l'électronique pourraient bénéficier à terme de nouveaux matériaux issus de ce type de laboratoire autonome, sans impact direct immédiat pour la France ou l'UE.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Un laboratoire robotisé mène 50 000 expériences et atteint 27 % d'efficacité pour les cellules solaires
1Interesting Engineering 

Un laboratoire robotisé mène 50 000 expériences et atteint 27 % d'efficacité pour les cellules solaires

Des chercheurs de la Hong Kong Polytechnic University ont mis au point un système robotique autonome capable de mener des recherches scientifiques en boucle fermée, sans intervention humaine, pour le développement de cellules solaires à base de pérovskite. Le dispositif repose sur une architecture d'intelligence artificielle à sept couches qui lit la littérature scientifique existante, génère de nouvelles formules chimiques et les traduit directement en instructions pour les machines. En l'espace d'une campagne expérimentale, le système a réalisé 50 764 expériences, contrôlé plus de 4 300 paramètres et généré 578 millions de tokens de données. Résultat: une efficacité de conversion énergétique record de 27,0%, avec une valeur certifiée indépendamment de 26,5%, plaçant ces cellules parmi les plus performantes jamais fabriquées de manière autonome. L'enjeu est considérable pour la filière photovoltaïque. La pérovskite est un matériau à fort potentiel, mais son développement bute depuis des années sur un processus d'essais et d'erreurs épuisant: plus de 100 000 recettes expérimentales ont déjà été testées dans le monde, avec des cycles de cristallisation extrêmement sensibles aux conditions environnementales et difficiles à reproduire. Les robots existants peuvent collecter des données rapidement, mais sont incapables d'interpréter les résultats ou d'ajuster les recettes en temps réel. Le nouveau système brise ce plafond en intégrant un modèle de langage spécialisé, le Recipe Language Model, qui traite en continu données de littérature et résultats expérimentaux pour affiner les formules chimiques, pendant que 11 modules robotiques interconnectés assurent la fabrication physique: stockage des produits chimiques, dépôt par centrifugation, traitement laser, caractérisation optique en temps réel. Ce travail s'inscrit dans une tendance de fond qui voit l'automatisation gagner les laboratoires de recherche en matériaux, domaine traditionnellement artisanal et fragmenté. La particularité de ce système réside dans sa capacité à transformer des opérations de boîtes à gants isolées en une chaîne de fabrication unifiée, pilotée par un jumeau numérique. Publié dans la revue Engineering, ce projet ouvre la voie à ce que ses auteurs appellent la "materials intelligence": une recherche scientifique pilotée par des agents autonomes capables d'apprendre, de raisonner et d'optimiser sans supervision humaine permanente. À plus long terme, une telle approche pourrait permettre de déployer des capacités de fabrication avancée dans des environnements extrêmes ou des zones isolées, là où la présence humaine est impraticable, de l'espace aux infrastructures offshore.

UECette avancée dans l'automatisation de la recherche sur les matériaux photovoltaïques pourrait à terme accélérer les programmes européens de développement de cellules solaires à pérovskite, dans le cadre des objectifs de souveraineté énergétique de l'UE.

RecherchePaper
1 source
Sakana AI parie qu'une IA capable de s'améliorer elle-même peut mettre fin à la course au calcul des grands laboratoires
2The Decoder 

Sakana AI parie qu'une IA capable de s'améliorer elle-même peut mettre fin à la course au calcul des grands laboratoires

Sakana AI, une startup japonaise co-fondée par Llion Jones, l'un des huit co-auteurs du papier fondateur « Attention is All You Need » (2017), vient de lancer un laboratoire de recherche entièrement dédié à l'auto-amélioration récursive, connue sous le sigle RSI (Recursive Self-Improvement). Cette technologie consiste à concevoir des systèmes d'IA capables de s'optimiser eux-mêmes de façon itérative, sans dépendre d'une augmentation constante de la puissance de calcul disponible. Pour Sakana AI, le RSI constitue une alternative directe à la course aux datacenters et aux puces que se livrent les grands laboratoires américains comme OpenAI, Google DeepMind ou Meta, qui engloutissent des dizaines de milliards de dollars en infrastructure. L'idée centrale est d'obtenir des gains de performance en rendant les modèles capables de retravailler leur propre architecture ou leurs paramètres, plutôt qu'en empilant davantage de GPUs. Si cette piste aboutit, elle pourrait redistribuer les cartes entre acteurs bien dotés en capital et équipes plus agiles. Le RSI est aussi l'une des technologies les plus surveillées par les chercheurs en sécurité de l'IA. Anthropic, qui développe pourtant ses propres modèles frontier, met explicitement en garde contre les risques de contrôle associés à des systèmes capables de se redéfinir eux-mêmes. La tension est révélatrice : l'auto-amélioration récursive est à la fois perçue comme un levier de souveraineté technologique pour les acteurs hors Silicon Valley, et comme l'un des scénarios de risque les plus sérieux pour la sécurité à long terme de l'IA.

UESi le RSI tient ses promesses, les laboratoires européens à ressources limitées pourraient bénéficier d'une voie de compétitivité alternative à la course aux datacenters, réduisant leur dépendance aux infrastructures massives américaines.

💬 Sakana mise sur l'auto-amélioration récursive pour contourner la course au calcul. C'est le seul angle vraiment crédible si tu n'as pas dix milliards à mettre dans des datacenters, et avec Llion Jones à bord (un des auteurs d'"Attention is All You Need"), l'équipe a le niveau pour que ça soit autre chose qu'un pitch deck. Le hic, c'est que le RSI est aussi ce qu'Anthropic cite en tête de liste quand on leur demande ce qui les empêche de dormir.

RecherchePaper
1 source
Les agents autonomes face au défi entre intention et exécution
3Amazon Science 

Les agents autonomes face au défi entre intention et exécution

Des chercheurs en intelligence artificielle ont publié une étude approfondie sur ce qu'ils nomment l'« écart entre intention et exécution » dans les systèmes d'agents IA, le fossé entre ce qu'un modèle de langage entend faire et ce que le logiciel qui l'entoure réalise concrètement. Pour l'illustrer : un modèle peut vouloir corriger une seule instance d'une fonction dans du code, mais le harnais, le logiciel qui orchestre ses actions et gère ses interactions avec les outils, en modifie involontairement plusieurs. Pour combler cet écart sans aucun ajustement spécifique à une tâche, les chercheurs ont développé Simple Strands Agent (SSA), un harnais léger et personnalisable à agent unique. Testé sur plusieurs benchmarks de référence, dont SWE-Pro, SWE-Verified (qui évaluent la correction automatique de dépôts de code réels) et Terminal-Bench2 (environnements de terminal interactifs), SSA obtient des gains de performance constants sur plusieurs familles de modèles. Ce travail pointe un problème structurel souvent ignoré dans l'évaluation des agents IA : les performances publiées sur les benchmarks reflètent autant la qualité de l'infrastructure d'évaluation que la capacité intrinsèque du modèle. Des facteurs apparemment triviaux, délais d'expiration lors des interactions avec l'environnement, stabilité de l'infrastructure, contraintes de ressources, provoquent des variations de performance significatives. Les auteurs baptisent ce phénomène le « benchmaxing » : la tendance à optimiser les scores publiés sans nécessairement améliorer la capacité réelle du système. Pour les équipes qui déploient des agents en production, cela signifie qu'un gain impressionnant sur un benchmark peut disparaître entièrement dans un contexte légèrement différent, rendant les comparaisons entre systèmes peu fiables. L'étude s'inscrit dans un débat plus large sur la conception des agents IA. Pendant des années, la priorité a été donnée aux optimisations spécifiques : prompts ajustés, outils sur mesure, graphes d'exécution spécialisés. Or les chercheurs montrent que ces gains sont souvent fragiles, ce qui fonctionne pour un modèle ou une version donnée se dégrade ou régresse avec les modèles suivants, car ces optimisations surajustent implicitement le comportement d'un modèle particulier. La conclusion est qu'il faut désormais identifier des principes de conception invariants, valables quel que soit le modèle sous-jacent. L'interface entre modèle et harnais devient ainsi un domaine de recherche central, à l'image du rôle d'un système d'exploitation vis-à-vis d'un processeur. Les auteurs soulignent également que cette conception n'est pas entièrement agnostique au modèle : différentes familles de modèles ont des préférences distinctes en matière d'utilisation des outils et d'interprétation du contexte, faisant de la coconception modèle-harnais un levier décisif pour atteindre des performances optimales.

RecherchePaper
1 source
ReSim : une simulation fiable du monde réel pour la conduite autonome
4arXiv cs.RO 

ReSim : une simulation fiable du monde réel pour la conduite autonome

Des chercheurs ont publié sur arXiv un nouveau modèle de simulation du monde pour la conduite autonome, baptisé ReSim, pour Reliable Simulation. L'approche repose sur un générateur vidéo à architecture de transformeur de diffusion, entraîné non plus uniquement sur des données de conduite réelle, mais sur un corpus mixte combinant des trajectoires humaines et des données synthétiques issues du simulateur CARLA. Le modèle est conçu pour prédire de manière fiable comment une scène de conduite va évoluer selon différentes actions du véhicule ego, y compris des comportements dangereux ou non experts, typiquement un freinage brutal, un écart de voie ou une manœuvre imprudente. Pour fermer la boucle entre simulation et apprentissage, les auteurs introduisent également un module Video2Reward capable d'estimer un signal de récompense directement à partir des futures simulées générées par ReSim. Les gains mesurés sont significatifs : ReSim affiche une fidélité visuelle supérieure de 44 %, améliore la contrôlabilité du modèle de plus de 50 % pour les comportements experts comme non experts, et progresse de 2 % en planification et de 25 % en sélection de politique sur le benchmark NAVSIM. Ce dernier point est particulièrement important pour l'industrie : pouvoir évaluer des politiques de conduite dans des scénarios rares ou risqués sans avoir à rouler physiquement avec ces comportements représente un levier majeur pour accélérer la validation des systèmes d'aide à la conduite et des véhicules autonomes. Le problème que ReSim cherche à résoudre est structurel dans le domaine : les modèles du monde entraînés exclusivement sur des données réelles sont biaisés vers la conduite sûre et experte, car c'est ce qui compose l'immense majorité des datasets. Les comportements anormaux, accidentels ou simplement maladroits y sont sous-représentés, ce qui rend ces modèles incapables de simuler fidèlement ce qui se passe quand un véhicule autonome dévie de la norme. En combinant données réelles et données synthétiques contrôlées, ReSim ouvre une voie vers des environnements d'évaluation plus robustes, une priorité pour des acteurs comme Waymo, Tesla ou Mobileye, qui cherchent à réduire leur dépendance aux miles de test sur route ouverte.

RecherchePaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic