RechercheAI News · 23 avr. 2026, 15:30· 2 min de lecture

Une startup d'un milliard de dollars avec une vision différente de l'IA

Yann LeCun, ancien directeur scientifique de l'intelligence artificielle chez Meta, a fondé AMI Labs (Advanced Machine Intelligence Labs) après avoir quitté son poste fin 2025. La startup vient de lever un milliard de dollars de financement, une somme remarquable pour une équipe de seulement 12 personnes. LeCun prévoit de ne pas commercialiser de produit avant au moins cinq ans, positionnant AMI Labs comme une organisation de recherche pure. Son approche repose sur des architectures d'IA modulaires composées de plusieurs blocs spécialisés : un modèle du monde propre au domaine d'application, un acteur chargé de proposer des actions via l'apprentissage par renforcement, un module critique qui évalue ces options selon des règles fixes, un système de perception adapté au type de données traité (vidéo, texte, audio), une mémoire à court terme, et un configurateur orchestrant l'ensemble. Chaque instance serait entraînée uniquement sur des données pertinentes à son environnement, contrairement aux grands modèles de langage nourris de l'intégralité du web.

Cette approche remet fondamentalement en question le paradigme dominant des LLMs comme GPT ou Claude. Là où ces modèles généralistes mobilisent des centaines de milliards de paramètres et nécessitent une infrastructure colossale pour fonctionner, les modules spécialisés d'AMI Labs pourraient se contenter de quelques centaines de millions de paramètres, voire tourner directement sur un appareil local. Le coût d'entraînement et d'inférence serait alors une fraction de celui des modèles actuels, rendant l'IA viable pour des acteurs qui ne disposent pas des ressources d'Anthropic, OpenAI, Google ou Meta. Pour les entreprises, cela ouvrirait la voie à des systèmes IA déployables en interne, sans dépendance aux grandes plateformes cloud.

Le contexte donne tout son poids à cette prise de position. Les LLMs ont absorbé des ressources exponentiellement croissantes à chaque génération, et les techniques d'amélioration récentes, comme le prompting récursif des modèles de raisonnement, alourdissent encore la facture. Seuls de très grands groupes peuvent aujourd'hui se permettre de les exploiter à perte. LeCun, l'un des pères fondateurs du deep learning et lauréat du prix Turing 2018, défend depuis plusieurs années l'idée que les LLMs constituent une impasse pour atteindre une intelligence artificielle véritablement générale. Des précédents existent : les systèmes d'apprentissage automatique capables de maîtriser des jeux vidéo ou de plateau illustrent déjà la puissance des approches ciblées. Si AMI Labs parvient à ses fins, l'industrie pourrait connaître un rééquilibrage majeur, fragmentant un marché aujourd'hui dominé par une poignée d'acteurs disposant de budgets quasi illimités.

Impact France/UE

Si l'approche modulaire d'AMI Labs aboutit, les entreprises européennes moins capitalisées pourraient déployer des systèmes IA en interne sans dépendance aux grandes plateformes cloud américaines.

Dans nos dossiers

Meta IA OpenAI Anthropic

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

101net

Une IA qui « voit » le monde : le pari à 1 milliard de dollars de Yann LeCun

Yann LeCun, l'un des "parrains" de l'IA moderne et ancien responsable de l'IA chez Meta, a lancé une nouvelle start-up appelée AMI (Advanced Machine Intelligence). Elle a levé 1 milliard de dollars lors de son tour de table initial, avec des investisseurs comme Nvidia, Jeff Bezos, Samsung et Xavier Niel. AMI se distingue des grands modèles de langage en développant une IA capable de "voir" et comprendre le monde différemment.

UELa participation de Xavier Niel comme investisseur et les origines françaises de Yann LeCun positionnent la France comme actrice de ce projet d'IA de rupture doté d'un milliard de dollars.

RechercheActu

1 source

2Le Big Data

Startup IA Baseten : une levée de 1,5 milliard de dollars en préparation

Baseten, startup américaine spécialisée dans l'inférence IA et fondée en 2019 à San Francisco par Tuhin Srivastava, Amir Haghighat et Pankaj Gupta, serait sur le point de finaliser une levée de fonds de 1,5 milliard de dollars qui valoriserait l'entreprise à 13 milliards de dollars. L'opération, révélée par le Wall Street Journal, impliquerait un consortium d'investisseurs de premier plan comprenant Spark Capital, Sands Capital, Altimeter Capital et Wellington Management. Ce qui rend cette transaction particulièrement frappante, c'est sa rapidité : en janvier 2026, Baseten bouclait déjà une série E de 300 millions de dollars à 5 milliards de valorisation, elle-même précédée d'une série D de 150 millions quelques mois plus tôt. En moins de six mois, la valorisation de la startup aurait ainsi progressé de 160 %. À noter toutefois que cette nouvelle opération reposerait sur une structure de "valorisation fractionnée" : certains investisseurs se seraient positionnés à 13 milliards, d'autres autour de 11 milliards, une pratique de plus en plus courante dans l'écosystème IA pour attirer des capitaux tout en affichant des chiffres ambitieux. Cette trajectoire fulgurante illustre un basculement structurel dans la chaîne de valeur de l'intelligence artificielle. L'entraînement des grands modèles a longtemps concentré l'essentiel des investissements et de l'attention médiatique, mais c'est désormais l'inférence, c'est-à-dire l'exécution concrète des modèles à chaque requête utilisateur, qui devient le nerf de la guerre économique. À mesure que les entreprises déploient des applications génératives à grande échelle, les coûts d'inférence deviennent un facteur déterminant de rentabilité. Baseten propose d'optimiser cet acheminement en orientant les requêtes vers les modèles les plus adaptés selon le rapport performance-coût, favorisant parfois des alternatives open source face aux modèles propriétaires dominants. Pour les entreprises dont les usages IA se généralisent, cette optimisation peut représenter des économies considérables. Baseten s'inscrit dans un segment d'infrastructure IA en pleine consolidation, aux côtés d'acteurs comme Together AI, Fireworks AI ou Modal, tous en compétition pour capter la demande croissante d'exécution de modèles à moindre coût. La startup avait su se distinguer en attirant des clients entreprises cherchant à maîtriser leurs dépenses opérationnelles liées à l'IA, un positionnement qui prend de la valeur à mesure que la phase d'expérimentation laisse place au déploiement industriel. Si cette levée se concrétise, Baseten disposerait des ressources pour accélérer son développement commercial et renforcer ses capacités techniques à un moment où la demande d'inférence optimisée ne montre aucun signe de ralentissement. La prochaine étape logique pour une startup à cette valorisation serait une introduction en bourse, mais dans un marché aussi volatile, les fondateurs pourraient préférer consolider leur position avant de franchir ce cap.

💬 160% de valorisation en six mois, ça ressemble à de la fièvre, mais le fond est solide : l'inférence est en train de dépasser l'entraînement comme centre de gravité économique de l'IA. Quand tu déploies à grande échelle, c'est là que la facture explose, et les entreprises commencent à vraiment le sentir passer. La "valorisation fractionnée" à 11 ou 13 milliards selon les investisseurs, c'est un détail qui dit beaucoup sur comment ces deals se fabriquent.

BusinessOpinion

1 source

3The Information AI

Anciens chercheurs d'Anthropic en discussion pour lever des fonds pour une nouvelle startup évaluée à 1 milliard de dollars

Des anciens chercheurs d'Anthropic discutent de levées de fonds de 175 millions de dollars à une valorisation de 1 milliard de dollars pour une nouvelle startup, Mirendil, visant la recherche et le développement AI dans des domaines scientifiques comme la biologie et les sciences des matériaux. Firmes de capital-risque Andreessen Horowitz et Kleiner Perkins envisagent de co-diriger cette ronde. Malgré les départs de chercheurs d'OpenAI, Google et Meta, Anthropic a vu relativement peu de départs de son équipe de recherche.

RechercheOutil

1 source

4MarkTechPost

Comment la distillation de connaissances condense l'intelligence d'ensemble en un seul modèle IA

La distillation de connaissances est une technique de compression de modèles d'intelligence artificielle qui permet de transférer le savoir acquis par un grand modèle, ou un ensemble de modèles, vers un modèle plus petit et plus rapide. Dans l'expérience présentée, les chercheurs ont entraîné un ensemble de 12 modèles distincts jouant le rôle d'enseignant collectif, puis ont distillé leur intelligence combinée dans un seul modèle étudiant, plus léger. Le pipeline complet est construit en Python avec PyTorch sur un jeu de données synthétique de classification binaire (5 000 exemples, 20 variables), représentatif de problèmes concrets comme la prédiction de clics publicitaires. La clé du processus réside dans l'utilisation des sorties probabilistes "soft" de l'ensemble enseignant, avec une mise à l'échelle par température, plutôt que les simples étiquettes binaires du jeu de données. Résultat : le modèle étudiant récupère 53,8 % de l'avantage de précision de l'ensemble, avec une compression de facteur 160. Pour l'industrie, cette approche répond à un problème fondamental du déploiement en production : les ensembles de modèles sont précis mais trop lents et trop coûteux pour répondre à des contraintes de latence réelles. Un modèle seul, distillé depuis un ensemble de 12 réseaux, peut être servi en temps réel là où l'ensemble original serait inutilisable. La valeur ne vient pas seulement de la réduction de taille, mais de la qualité du signal transmis : les distributions de probabilité de l'enseignant portent une information bien plus riche que les étiquettes brutes, permettant à l'étudiant d'apprendre des nuances que l'entraînement standard ne capturerait pas. Cette technique est aujourd'hui centrale dans la mise en production des grands modèles de langage et des systèmes de vision par ordinateur, où des modèles comme DistilBERT ou les versions compressées de LLaMA sont directement issus de cette logique. La distillation de connaissances a émergé des travaux pionniers de Geoffrey Hinton et ses collègues chez Google en 2015, initialement pour compresser des ensembles en réseaux uniques. Depuis, elle est devenue un pilier de l'ingénierie ML à l'échelle : chaque fois qu'un modèle de recherche trop lourd doit être rendu opérationnel, la distillation est l'une des premières pistes explorées. L'enjeu est stratégique, les entreprises qui maîtrisent cette compression peuvent déployer des capacités de niveau "grand modèle" sur des infrastructures standard, réduisant drastiquement les coûts de calcul. Avec la prolifération des LLM de plusieurs centaines de milliards de paramètres, la distillation est devenue incontournable pour rendre l'IA générative accessible sur des appareils embarqués, des API à faible latence, ou des environnements edge où la puissance de calcul est limitée.

💬 La distillation de connaissances, c'est pas nouveau, Hinton 2015, DistilBERT, tout ça. Ce qui est bien expliqué ici, c'est pourquoi les soft labels avec la mise à l'échelle par température font toute la différence par rapport à un entraînement classique : l'élève apprend les nuances de l'enseignant, pas juste ses réponses binaires. Facteur 160 de compression avec 53% de l'avantage récupéré, c'est le genre de ratio qui explique pourquoi chaque labo qui sort un gros modèle sort aussi une version distillée dans les semaines qui suivent.

RecherchePaper

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic