Aller au contenu principal
15 millions de paramètres et 1 seul GPU : Yann LeCun fait un premier pas vers l’IA qui comprend le monde réel
RechercheNumerama12sem· 1 min de lecture

15 millions de paramètres et 1 seul GPU : Yann LeCun fait un premier pas vers l’IA qui comprend le monde réel

Source originale ↗·

Yann LeCun franchit une étape concrète vers sa vision d'une IA capable de comprendre le monde physique. Avec un consortium de chercheurs, il présente LeWorldModel, un modèle de monde entraînable directement à partir de pixels bruts — sans les instabilités qui plombent habituellement ce type d'approche. Une première technique significative, rendue accessible avec seulement 15 millions de paramètres et un unique GPU.

L'enjeu dépasse la performance brute : les modèles de monde (world models) sont au cœur de la vision de LeCun pour une IA "à la fois plus capable et plus sûre que les LLMs", capable de raisonner sur la causalité et d'anticiper les conséquences de ses actions dans un environnement réel. Là où les grands modèles de langage opèrent sur du texte, un modèle de monde ambitionne de représenter la réalité physique — prérequis fondamental pour la robotique autonome et les systèmes d'IA incarnés.

La contribution technique centrale de LeWorldModel réside dans sa capacité à s'entraîner sur des flux vidéo bruts sans recourir aux architectures hybrides complexes qui causent d'ordinaire des instabilités d'apprentissage. Le choix d'une empreinte modeste — 15 millions de paramètres contre des centaines de milliards pour les modèles génératifs actuels — est délibéré : il s'agit d'un proof of concept reproductible, pas d'une course au gigantisme. LeCun opère dans ce contexte parallèlement à AMI Labs, sa startup fondée en France, dont les premières recherches n'ont pas encore été publiées.

Cette publication s'inscrit dans la trajectoire intellectuelle que LeCun défend depuis plusieurs années contre le courant dominant des LLMs : construire des systèmes qui modélisent le monde plutôt que de simplement en prédire le texte. LeWorldModel ne résout pas ce défi — mais il pose une brique technique vérifiable sur un chemin que peu de laboratoires empruntent encore sérieusement.

Impact France/UE

La cofondation par LeCun d'AMI Labs, startup basée en France, ancre directement ces travaux dans l'écosystème français de l'IA et pourrait constituer un pôle de recherche européen sur l'IA incarnée.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Une IA capable de comprendre le monde qui l’entoure grâce à un seul GPU : LeWordModel veut révolutionner le secteur
1Frandroid 

Une IA capable de comprendre le monde qui l’entoure grâce à un seul GPU : LeWordModel veut révolutionner le secteur

Yann LeCun, chercheur français et directeur scientifique de Meta AI, reconnu comme l'un des pères fondateurs de l'intelligence artificielle moderne, a dévoilé avec son équipe un nouveau système baptisé LeWorldModel. La particularité revendiquée de ce modèle est sa capacité à fonctionner sur un seul GPU, une contrainte matérielle bien plus accessible que les clusters de milliers de puces utilisés par les grands modèles actuels. Les premiers résultats expérimentaux sont décrits comme très encourageants par les chercheurs. Si la promesse tient, LeWorldModel représenterait une avancée significative dans la démocratisation de l'IA : rendre possible une compréhension contextuelle du monde physique sans infrastructure colossale ouvre la voie à des déploiements embarqués, sur des robots, des véhicules autonomes ou des appareils grand public. Cela réduirait aussi la dépendance aux géants du cloud pour qui souhaite développer des applications d'IA perceptuelle. LeWorldModel s'inscrit dans la vision de long terme de LeCun, qui critique depuis plusieurs années les grands modèles de langage (LLM) pour leur incapacité à raisonner sur le monde réel. Il défend l'approche des "world models" — des systèmes capables de simuler et anticiper les états du monde physique, inspirés du fonctionnement cognitif humain. Cette annonce relance le débat sur la voie vers une IA plus robuste, face aux approches dominantes de type GPT portées par OpenAI et Google.

UEYann LeCun, chercheur français à la tête de Meta AI, porte une vision qui pourrait orienter la recherche européenne en IA vers des approches embarquées moins dépendantes des infrastructures cloud américaines.

RecherchePaper
1 source
Le WorldModel : comment Yann LeCun et son équipe veulent révolutionner l’IA
2Next INpact 

Le WorldModel : comment Yann LeCun et son équipe veulent révolutionner l’IA

Yann LeCun, figure emblématique de l'intelligence artificielle et ancien responsable de la recherche IA chez Meta, a fondé début 2025 AMI Labs (Advanced Machine Intelligence) avec d'autres chercheurs de renom. En mars 2025, la start-up levait 890 millions d'euros, signalant d'emblée des ambitions considérables. Elle vient de présenter son premier modèle : LeWorldModel (LeWM), un système capable d'apprendre à partir d'images et de vidéos, puis d'anticiper ce qui va se passer à partir d'actions données. Techniquement, il repose sur l'architecture JEPA (Joint Embedding Predictive Architecture) et intègre un mécanisme appelé SIGReg — un régulariseur gaussien simple — pour éviter l'effondrement des représentations internes. Le modèle s'entraîne de bout en bout directement depuis les pixels, avec seulement deux termes de perte, et atteint des performances de contrôle comparables aux meilleurs systèmes existants, mais pour une fraction du coût de calcul habituel. Cette approche tranche radicalement avec celle des grands modèles de langage (LLM) comme GPT-4 ou Gemini, qui apprennent le monde à travers du texte. LeWM apprend à partir de la perception visuelle et de l'interaction avec l'environnement — plus proche de la façon dont un animal ou un enfant se construit une représentation du réel. L'enjeu est crucial : les LLM actuels nécessitent des ressources de calcul colossales (une seule requête à ChatGPT mobilise déjà des centaines de milliards d'opérations), et leur taille en paramètres explose à chaque nouvelle génération. Si LeWM tient ses promesses d'efficacité, il pourrait offrir une alternative moins gourmande en énergie et en infrastructure, rendant des systèmes d'IA avancés accessibles à bien plus d'acteurs. LeCun défend cette direction depuis plus de quatre ans : il plaide pour une IA capable de « raisonner comme les animaux et les humains », ancrée dans la perception et l'action plutôt que dans la prédiction de tokens. Son départ de Meta lui a permis de concrétiser cette vision sans les contraintes d'un grand groupe. AMI Labs s'inscrit dans un mouvement plus large de remise en question du paradigme LLM, porté également par des chercheurs comme Yoshua Bengio ou des startups comme World Labs de Fei-Fei Li, qui misent toutes sur des représentations du monde physique. La levée de fonds massive donne à LeCun les moyens de ses ambitions — mais LeWM reste pour l'instant un premier prototype, et la route vers une IA véritablement « embodied » et généraliste reste longue et incertaine.

RecherchePaper
1 source
Une IA qui « voit » le monde : le pari à 1 milliard de dollars de Yann LeCun
301net 

Une IA qui « voit » le monde : le pari à 1 milliard de dollars de Yann LeCun

Yann LeCun, l'un des "parrains" de l'IA moderne et ancien responsable de l'IA chez Meta, a lancé une nouvelle start-up appelée AMI (Advanced Machine Intelligence). Elle a levé 1 milliard de dollars lors de son tour de table initial, avec des investisseurs comme Nvidia, Jeff Bezos, Samsung et Xavier Niel. AMI se distingue des grands modèles de langage en développant une IA capable de "voir" et comprendre le monde différemment.

UELa participation de Xavier Niel comme investisseur et les origines françaises de Yann LeCun positionnent la France comme actrice de ce projet d'IA de rupture doté d'un milliard de dollars.

RechercheActu
1 source
Starchild-1 : voici l’IA multimodale qui comprend le monde comme jamais auparavant
4Le Big Data 

Starchild-1 : voici l’IA multimodale qui comprend le monde comme jamais auparavant

La société Odyssey a présenté le 18 mai 2026 Starchild-1, qu'elle décrit comme le premier "world model" multimodal en temps réel. Contrairement aux générateurs d'images ou de vidéos classiques, ce système produit simultanément du contenu visuel et sonore, en s'adaptant en continu aux actions de l'utilisateur. Là où un outil traditionnel calcule une séquence complète avant de l'afficher, Starchild-1 modifie à la volée les scènes, les sons ambiants et les dialogues au fil des interactions. Pour tenir ce pari techniquement difficile, la vidéo et l'audio ne fonctionnent pas au même rythme et peuvent se désynchroniser, Odyssey affirme avoir conçu une architecture inédite capable de maintenir la cohérence entre les deux flux, même lors de sessions prolongées. L'enjeu dépasse la prouesse technique : si les performances annoncées se confirment, Starchild-1 changerait la nature même de ce qu'on appelle un générateur d'IA. On passerait d'un outil de production de contenu statique à un moteur de simulation interactif, capable de prédire comment un environnement évolue naturellement. Les applications ciblées par Odyssey couvrent des domaines très concrets : le jeu vidéo, où des mondes entiers pourraient être générés à la volée sans assets précalculés ; la robotique, pour permettre à des machines d'interagir dynamiquement avec leur environnement ; l'éducation, avec des simulations qui réagissent en temps réel aux choix de l'élève ; et la santé, sans que des cas d'usage précis n'aient encore été détaillés. Pour les développeurs de ces industries, disposer d'un modèle qui "comprend" la logique physique et sonore du monde représente un saut qualitatif potentiellement significatif. Odyssey s'inscrit dans une tendance plus large qui pousse les labos d'IA au-delà du traitement de texte et de l'image fixe, vers des systèmes qui modélisent la causalité et la dynamique du monde réel, ce que les chercheurs appellent des "world models", un concept popularisé notamment par Yann LeCun chez Meta comme prochaine frontière de l'intelligence artificielle. Plusieurs acteurs, dont Google DeepMind et des startups spécialisées dans la simulation, explorent cette direction. Starchild-1 est pour l'instant présenté sous forme de démonstration, sans accès public ni benchmarks indépendants publiés, ce qui invite à la prudence : l'industrie de l'IA a une longue tradition d'annonces spectaculaires dont les délais de concrétisation s'avèrent bien plus longs que prévu. La prochaine étape sera de voir si Odyssey ouvre l'accès à des testeurs externes et si les performances tiennent à l'échelle, hors conditions de laboratoire.

RechercheOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic