Le lauréat du prix Turing Richard Sutton estime…

43

1The Decoder

Rich Sutton, prix Turing, lance Oak Lab pour créer des agents IA capables d'apprendre par eux-mêmes

Richard Sutton, lauréat du prix Turing 2024 et co-fondateur de l'apprentissage par renforcement moderne, a lancé une nouvelle startup baptisée Oak Lab à Toronto. Sutton, connu pour ses travaux fondateurs sur le reinforcement learning aux côtés d'Andrew Barto, qualifie les méthodes actuelles de deep learning de "faibles et inefficaces". Son objectif avec Oak Lab est de développer des agents d'intelligence artificielle capables d'apprendre en continu directement à partir de leur environnement, plutôt que de dépendre d'un entraînement préalable sur des jeux de données statiques. L'entreprise est basée au Canada, pays où Sutton a mené l'essentiel de sa carrière de recherche, notamment à l'Université de l'Alberta. Cette initiative marque une rupture potentielle avec le paradigme dominant de l'IA actuelle, largement fondé sur l'apprentissage supervisé et les grands modèles de langage entraînés une fois puis déployés. Si les agents d'Oak Lab parviennent réellement à apprendre en temps réel, cela pourrait ouvrir la voie à des systèmes plus adaptatifs, capables de s'ajuster à des environnements changeants sans réentraînement complet, un enjeu majeur pour la robotique, les véhicules autonomes ou les assistants personnels évoluant dans des contextes imprévisibles. Cette annonce s'inscrit dans un débat plus large sur les limites des grands modèles de langage, que plusieurs chercheurs de premier plan jugent insuffisants pour atteindre une intelligence artificielle véritablement générale. Sutton défend depuis des années l'idée que l'apprentissage continu et l'expérience directe avec le monde réel sont essentiels, une philosophie qui a notamment inspiré des avancées comme AlphaGo. Reste à voir si Oak Lab parviendra à traduire ces principes théoriques en systèmes concrets et compétitifs face aux géants du secteur.

💬 Bon, un prix Turing qui traite le deep learning actuel de "faible et inefficace", ça fait forcément du bruit. L'idée d'apprendre en continu sur l'environnement plutôt que sur un dataset figé, c'est exactement ce qui manque à nos LLM aujourd'hui, incapables de s'adapter sans réentraînement complet. Reste que Sutton n'a jamais eu à livrer un produit compétitif face à des boîtes qui brûlent des milliards en compute, alors je dirais : la théorie est solide depuis vingt ans, la question c'est si Oak Lab tient en prod.

RechercheActu

1 source

Sam Altman affirme que toute une génération de chercheurs a freiné l'IA en sous-estimant le potentiel du passage à l'échelle

38

2The Decoder

Sam Altman affirme que toute une génération de chercheurs a freiné l'IA en sous-estimant le potentiel du passage à l'échelle

Lors d'une conférence à Stanford, Sam Altman a pris la défense du scaling des grands modèles de langage et s'en est pris directement aux chercheurs sceptiques, affirmant qu'une génération entière de scientifiques a freiné l'avancement de l'IA en sous-estimant ce que l'augmentation de la puissance de calcul et des données pouvait produire. Pour étayer son propos, le PDG d'OpenAI a cité un résultat récent de son entreprise : la réfutation automatisée d'une conjecture mathématique, un type de raisonnement abstrait longtemps considéré hors de portée des systèmes actuels. Cette prise de position tranche dans un débat qui agite le monde de la recherche depuis plusieurs années. De nombreux académiciens et chercheurs avaient soutenu que le scaling seul ne suffirait pas à produire une intelligence générale, et que des approches fondamentalement différentes seraient nécessaires. Si Altman a raison, ces voix critiques n'ont pas seulement eu tort sur le plan technique : elles ont activement ralenti les investissements et les orientations de recherche vers une voie qui s'avère productive. L'enjeu dépasse la fierté intellectuelle, il touche à l'allocation de milliards de dollars en R&D. Le contexte est celui d'une période charnière pour OpenAI, qui multiplie les démonstrations de capacités avancées pour justifier sa valorisation dépassant les 300 milliards de dollars. Les lois de scaling, théorisées notamment par les chercheurs de DeepMind et OpenAI autour de 2020, avaient déjà divisé la communauté. La sortie de modèles comme o3 et GPT-4o relance la question : le scaling est-il un plafond ou une rampe, et qui avait vraiment raison ?

💬 Altman a raison, même si c'est très pratique de le dire quand on vaut 300 milliards. Les paris de recherche se paient cash : sous-estimer le scaling pendant dix ans, c'est des milliards réorientés vers des impasses et des années brûlées pour tout le secteur. La conjecture mathématique réfutée automatiquement, c'est le genre de résultat qui rend le débat difficile à esquiver.

RecherchePaper

1 source

Le programme NAIRR Science redéfinit la recherche scientifique grâce à l'infrastructure IA de NVIDIA

40

3NVIDIA AI Blog

Le programme NAIRR Science redéfinit la recherche scientifique grâce à l'infrastructure IA de NVIDIA

Le programme pilote NAIRR (National Artificial Intelligence Research Resource), lancé par la Fondation nationale des sciences américaine (NSF), a soutenu plus de 700 projets de recherche au cours des deux dernières années, dans des domaines aussi variés que la prédiction de structures protéiques et la gestion des épidémies infectieuses. NVIDIA a contribué au programme en fournissant aux chercheurs un accès dédié à au moins quatre nœuds DGX pendant un minimum d'un mois, accompagné d'un support technique continu. Parmi les projets phares figure le modèle Walrus, développé par le consortium Polymathic AI regroupant le Flatiron Institute, l'Université de Cambridge et le Lawrence Berkeley National Lab : entraîné sur un vaste jeu de données baptisé "the Well", ce modèle de fondation pour les simulations de fluides a été rendu public avec ses données, son code et ses poids. À l'Université du Michigan, le professeur Venkat Viswanathan a dirigé le développement de MIST (Molecular Insight SMILES Transformers), une famille de modèles moléculaires pré-entraînés sur des bases de données non étiquetées, affinés sur plus de 400 relations structure-propriété et capables d'égaler ou de surpasser l'état de l'art en électrochimie, chimie quantique et physiologie. MIST a été développé sur un cluster de 40 GPU NVIDIA DGX, complété par 200 000 heures GPU sur le cluster Polaris de l'ALCF. Ces travaux illustrent une accélération concrète du rythme de la découverte scientifique grâce à l'infrastructure GPU. En fusionnant MIST avec des grands modèles de langage généralistes, les chercheurs du Michigan rendent les calculs de chimie quantique accessibles à un public plus large de scientifiques computationnels, ouvrant la voie à des matériaux de stockage d'énergie de nouvelle génération pour l'électrification des transports lourds et aériens. Walrus, de son côté, vise à devenir le modèle de fondation le plus polyvalent jamais construit pour modéliser les comportements fluides, avec des applications potentielles dans l'industrie, la météorologie et l'ingénierie. Ces outils ne restent pas dans les laboratoires : leur mise à disposition publique accélère leur adoption et leur amélioration collective. Le programme NAIRR s'inscrit dans une stratégie plus large de démocratisation de l'accès à la puissance de calcul pour la recherche académique américaine, face à la concentration croissante des ressources IA dans le secteur privé. En offrant des allocations de GPU à des institutions universitaires, le NSF cherche à rééquilibrer les conditions de la recherche fondamentale à l'heure où les coûts d'entraînement explosent. NVIDIA, en fournissant à la fois du matériel et un accompagnement technique, consolide son positionnement comme infrastructure de référence pour la recherche scientifique. La suite du programme NAIRR, dont la pérennisation fait l'objet de discussions au Congrès, pourrait déterminer si les États-Unis maintiennent un avantage compétitif dans la recherche en IA publique face à des acteurs privés et étrangers de plus en plus puissants.

UEL'Université de Cambridge participe au consortium Polymathic AI (modèle Walrus), mais le programme NAIRR est une initiative fédérale américaine sans incidence directe sur les financements ou politiques de recherche en France ou dans l'UE.

RechercheActu

1 source

L'IA ne deviendra un vrai collègue que lorsqu'elle finira les tâches au lieu de se contenter de répondre

42

4The Decoder

L'IA ne deviendra un vrai collègue que lorsqu'elle finira les tâches au lieu de se contenter de répondre

Une équipe de chercheurs de Tencent et de plusieurs universités chinoises a publié un article de synthèse qui cartographie la trajectoire des systèmes d'intelligence artificielle vers ce qu'ils appellent le "collègue numérique". Leur constat central : les assistants IA actuels restent fondamentalement limités parce qu'ils répondent à des questions plutôt qu'ils ne terminent des tâches. Pour franchir ce seuil, deux conditions sont nécessaires : des environnements de travail persistants, dans lesquels l'agent conserve un état entre deux interactions, et des compétences réutilisables, c'est-à-dire des séquences d'actions que le système peut mobiliser sans les réapprendre à chaque fois. L'enjeu est considérable pour les entreprises qui misent sur l'automatisation. Un agent capable uniquement de générer du texte reste un outil consultatif. Un agent qui peut ouvrir un fichier, modifier une base de données, envoyer un e-mail et vérifier le résultat le lendemain est un exécutant autonome. Cette distinction change radicalement le périmètre de ce que l'IA peut remplacer ou augmenter dans les environnements professionnels réels. Ce travail s'inscrit dans une vague de recherche sur les agents IA dits "long-horizon", capables de maintenir un objectif sur plusieurs étapes et plusieurs sessions. Des laboratoires comme Google DeepMind, Anthropic et OpenAI travaillent sur des architectures similaires, mais la feuille de route proposée ici par Tencent offre un cadre structuré pour évaluer la maturité de ces systèmes. La course au "vrai" agent de travail est désormais l'un des fronts les plus disputés de l'IA appliquée.

UECette feuille de route proposée par Tencent pour évaluer la maturité des agents IA peut servir de référence aux entreprises françaises et européennes qui investissent dans l'automatisation par agents.

💬 Ce qui distingue un outil d'un collègue, c'est la mémoire entre deux sessions et la capacité à finir ce qu'il commence. Tencent le formule enfin clairement, et ça fait du bien d'avoir un cadre structuré pour évaluer ce qu'on appelle un peu trop vite "agent". Reste à voir si ça tient hors conditions de labo.

RecherchePaper

1 source

Le lauréat du prix Turing Richard Sutton estime que l'IA générative pure ne peut pas faire de vraie science

À lire aussi

Rich Sutton, prix Turing, lance Oak Lab pour créer des agents IA capables d'apprendre par eux-mêmes

Sam Altman affirme que toute une génération de chercheurs a freiné l'IA en sous-estimant le potentiel du passage à l'échelle

Le programme NAIRR Science redéfinit la recherche scientifique grâce à l'infrastructure IA de NVIDIA

L'IA ne deviendra un vrai collègue que lorsqu'elle finira les tâches au lieu de se contenter de répondre