Aller au contenu principal
OPINION. « Quand le chat avalera le perroquet »
RechercheLa Tribune12sem· 1 min de lecture

OPINION. « Quand le chat avalera le perroquet »

Source originale ↗·

Les grands modèles de langage actuels, souvent comparés à des perroquets stochastiques capables de reproduire du texte sans le comprendre, pourraient bientôt être supplantés par une nouvelle génération d'intelligences artificielles. Cette tribune d'opinion, publiée dans la rubrique Homo Numericus, avance que la prochaine rupture technologique ne portera pas sur la maîtrise du langage — déjà largement acquise — mais sur la capacité des IA à modéliser le monde physique et causal, à en comprendre les mécanismes profonds plutôt que d'en imiter la surface.

L'enjeu est considérable : une IA capable de construire des représentations internes du monde réel, et non plus seulement de ses descriptions textuelles, ouvrirait la voie à des systèmes autonomes fiables dans des domaines critiques — robotique, sciences, médecine, ingénierie. Ce saut qualitatif marquerait le passage d'un outil de génération à un véritable agent de raisonnement.

Cette perspective s'inscrit dans un débat de fond qui traverse la recherche en IA depuis des années : les architectures transformer actuelles ont-elles les capacités structurelles pour atteindre une compréhension causale du monde, ou faut-il des paradigmes radicalement nouveaux ? Des chercheurs comme Yann LeCun défendent depuis longtemps cette limite fondamentale des LLMs, et l'article semble s'inscrire dans ce courant critique qui anticipe un changement de paradigme majeur.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Les tables rondes : l'IA peut-elle apprendre à comprendre le monde ?
1MIT Technology Review 

Les tables rondes : l'IA peut-elle apprendre à comprendre le monde ?

Le 21 mai 2026, MIT Technology Review a réuni trois de ses journalistes spécialisés, le rédacteur en chef Mat Honan, le senior editor IA Will Douglas Heaven et la reporter Grace Huckins, pour une table ronde enregistrée consacrée à une question centrale du moment : les IA peuvent-elles apprendre à véritablement comprendre le monde physique ? La discussion s'inscrit dans un mouvement de fond où les grands laboratoires misent sur les "world models", des systèmes capables de se représenter l'environnement réel plutôt que de simplement traiter du texte. L'enjeu est de taille : les grands modèles de langage (LLM) actuels montrent des limites structurelles dès qu'il s'agit d'interagir avec le monde physique, de planifier des actions ou d'anticiper les conséquences de décisions dans des environnements dynamiques. Les world models visent à combler ce fossé, en permettant à des robots, véhicules autonomes ou agents IA d'opérer avec une compréhension spatiale et causale du réel, une capacité que les LLM seuls ne possèdent pas. Le sujet mobilise des figures majeures de la recherche en IA, à commencer par Yann LeCun, directeur scientifique de Meta AI, qui défend depuis plusieurs années une architecture alternative aux transformers pour atteindre cette intelligence "du monde réel". Des applications concrètes émergent déjà, comme l'utilisation des données de Pokémon Go pour offrir aux robots livreurs une cartographie centimètre par centimètre de l'environnement urbain. Le débat sur les world models est désormais au coeur des stratégies des grands acteurs de l'industrie.

UELe chercheur français Yann LeCun est l'une des figures centrales du débat sur les world models, un paradigme qui intéresse les laboratoires européens travaillant sur la robotique et les agents autonomes.

RecherchePaper
1 source
L’architecture Subquadratic SubQ est-elle le chaînon manquant de l’ère post-Transformer ?
2Le Big Data 

L’architecture Subquadratic SubQ est-elle le chaînon manquant de l’ère post-Transformer ?

L'explosion des volumes de données confronte l'informatique moderne à une limite fondamentale : la complexité quadratique O(n²), où le temps de calcul croît au carré du nombre de données traitées. Concrètement, si le volume d'information double, la puissance de calcul nécessaire quadruple. C'est dans ce contexte que l'approche Subquadratic, ou SubQ, s'impose comme une alternative mathématique structurée, désignant tout algorithme dont la complexité croît moins vite que O(n²), selon des notations comme O(n log n) ou O(n^1.5). Les ingénieurs y recourent via des stratégies éprouvées : la méthode "diviser pour régner", qui fragmente un problème en sous-unités indépendantes traitées en parallèle, ou les tables de hachage, qui permettent de cibler directement une adresse mémoire sans parcourir l'ensemble du système. Un exemple concret illustre l'enjeu : là où le tri à bulles s'effondre face aux grands volumes, le tri fusion en complexité subquadratique réduit des traitements de plusieurs heures à quelques secondes. L'enjeu devient particulièrement critique pour les architectures Transformer, introduites en 2017 par l'article fondateur "Attention Is All You Need" et qui alimentent aujourd'hui la quasi-totalité des grands modèles de langage. Leur mécanisme central, le Self-Attention, compare chaque élément d'une séquence à tous les autres, générant une matrice de taille n×n nativement quadratique. Cette contrainte sature rapidement la mémoire graphique (VRAM) dès que les séquences s'allongent, forçant les premières générations d'IA à travailler dans des fenêtres de contexte sévèrement limitées. Le coût d'inférence qui en résulte pèse lourdement sur les budgets cloud et freine l'adoption à grande échelle, notamment dans les entreprises qui traitent des milliards de transactions quotidiennes. La saturation des centres de données et l'essoufflement de la loi de Moore, qui garantissait jusqu'ici une progression régulière de la puissance des processeurs, ont rendu cette rupture algorithmique inévitable. Attendre la prochaine génération de puces ne suffit plus face à l'accélération des volumes de données. Les publications scientifiques récentes confirment une mobilisation croissante des chercheurs autour d'architectures post-Transformer capables de réduire structurellement ce coût quadratique. L'approche SubQ représente moins une innovation isolée qu'un changement de paradigme mathématique : non plus optimiser le matériel pour absorber des algorithmes inefficaces, mais repenser les fondements computationnels pour que la croissance des données ne dicte plus la croissance des coûts. Les acteurs qui parviendront à intégrer ces architectures dans leurs modèles de production pourraient disposer d'un avantage décisif en termes d'efficacité énergétique et d'accessibilité économique.

RecherchePaper
1 source
ADeLe : prédire et expliquer les performances de l'IA selon les tâches
3Microsoft Research 

ADeLe : prédire et expliquer les performances de l'IA selon les tâches

Des chercheurs de Microsoft, en collaboration avec l'Université de Princeton et l'Universitat Politècnica de València, ont publié dans la revue Nature une méthode inédite d'évaluation des modèles d'IA baptisée ADeLe — pour AI Evaluation with Demand Levels. Présentée dans l'article « General Scales Unlock AI Evaluation with Explanatory and Predictive Power », cette approche évalue simultanément les tâches et les modèles selon 18 capacités fondamentales — attention, raisonnement, connaissances de domaine, métacognition, entre autres — en leur attribuant un score de 0 à 5. Appliquée à 15 grands modèles de langage dont GPT-4o et Llama-3.1, la méthode permet de prédire les performances sur des tâches inédites avec une précision d'environ 88 %. Les travaux ont bénéficié du programme de financement AFMR (Accelerating Foundation Models Research) de Microsoft. L'apport concret d'ADeLe réside dans sa capacité à dépasser les scores agrégés des benchmarks classiques, qui mesurent ce qu'un modèle réussit sans expliquer pourquoi il échoue ni anticiper ses comportements sur de nouvelles tâches. En construisant un profil de capacités pour chaque modèle — une cartographie structurée de ses forces et faiblesses — et en le confrontant aux exigences précises d'une tâche donnée, ADeLe identifie les lacunes spécifiques à l'origine des erreurs. La méthode révèle également que de nombreux benchmarks largement utilisés donnent une image incomplète, voire trompeuse : un test censé mesurer le raisonnement logique peut en réalité dépendre fortement de connaissances spécialisées ou de métacognition, faussant ainsi l'interprétation des résultats. Pour les équipes qui développent ou déploient des LLMs, cette granularité change radicalement la façon d'interpréter une évaluation. L'évaluation des LLMs souffre depuis plusieurs années d'un problème structurel : les benchmarks standard comme MMLU ou HumanEval mesurent des performances globales sur des jeux de tests fixes, sans permettre de généraliser ni de diagnostiquer. ADeLe s'inscrit dans une tendance plus large de la communauté de recherche à vouloir rendre l'évaluation plus explicable et plus prédictive, à mesure que les modèles deviennent des composants critiques dans des systèmes professionnels. La publication dans Nature — une revue généraliste de premier rang, inhabituelle pour ce type de travaux en IA — signale l'ambition scientifique du projet. Les prochaines étapes pourraient inclure l'extension du cadre à des modalités au-delà du texte, et son adoption par des organismes d'évaluation indépendants cherchant des alternatives aux classements simplistes.

UELa co-participation de l'Universitat Politècnica de València positionne ADeLe comme candidat naturel pour les organismes d'évaluation européens chargés de mettre en œuvre les exigences de l'AI Act sur la transparence et la robustesse des modèles.

💬 Les benchmarks classiques te donnent un score global, mais zéro explication sur ce qui foire et pourquoi. ADeLe décompose ça en 18 capacités mesurables, confronte le profil du modèle aux exigences précises de la tâche, et prédit les perfs à 88% sur des cas inédits, ce qui est franchement solide pour de la recherche académique. Publication dans Nature en plus, c'est le genre de signal qui dit que l'évaluation des LLMs commence enfin à être traitée comme un vrai problème scientifique.

RecherchePaper
1 source
Le lauréat du prix Turing Richard Sutton estime que l'IA générative pure ne peut pas faire de vraie science
4The Decoder 

Le lauréat du prix Turing Richard Sutton estime que l'IA générative pure ne peut pas faire de vraie science

Richard Sutton, lauréat du prix Turing 2024 pour ses travaux fondateurs sur l'apprentissage par renforcement, a pris une position tranchée sur les limites des systèmes d'IA générative actuels : ils sont structurellement incapables de faire de la vraie science. Sa critique centrale porte sur l'absence de boucle d'évaluation interne. Sans mécanisme pour juger la validité ou la nouveauté de ses propres résultats, un système génératif ne peut que produire du contenu vraisemblable, pas découvrir quelque chose de réellement nouveau. Toute nouveauté émergente reste fugace, non reconnue, aussitôt perdue. L'enjeu est considérable pour le débat autour de l'IA scientifique. De nombreux acteurs présentent les grands modèles de langage comme des outils de découverte, capables d'accélérer la recherche en biologie, en chimie ou en mathématiques. Sutton conteste cette vision : sans capacité d'autoévaluation, ces systèmes restent des moteurs de reformulation, non d'exploration. Pour les chercheurs qui misent sur l'IA pour générer des hypothèses originales, la distinction est fondamentale. Sutton pointe en contraste des systèmes comme AlphaGo ou AlphaProof, développés par Google DeepMind, qui intègrent une boucle d'évaluation explicite, le score d'une partie, la validité d'une preuve, permettant à l'IA de tester et valider ses propres productions. C'est précisément ce mécanisme qui rend ces systèmes capables d'une forme de créativité authentique, selon lui. Sa prise de position s'inscrit dans un débat plus large sur la trajectoire de l'IA : faut-il poursuivre la voie des modèles génératifs à grande échelle, ou revenir vers des architectures hybrides combinant génération et vérification formelle ?

RecherchePaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic