Hassabis voit l'humanité « au pied de la…

L'IA comme prolongement de l'intelligence humaine

36

1Microsoft Research

L'IA comme prolongement de l'intelligence humaine

Une nouvelle approche théorique publiée dans le cadre d'une collaboration interdisciplinaire propose de revoir fondamentalement la façon dont on comprend les systèmes d'intelligence artificielle. Intitulée "The Origins of Artificial Intelligence in Natural Intelligence", cette recherche soutient que les grands modèles de langage ne sont ni des esprits humains en devenir, ni de simples outils statistiques sophistiqués, mais des extensions des structures cognitives propres à l'être humain. S'appuyant sur la phénoménologie du philosophe Edmund Husserl, les auteurs avancent que le langage humain contient déjà des structures sédimentées de compréhension du monde, et que les modèles d'IA apprennent précisément à modéliser et prolonger ces structures. Ce cadre théorique rejoint des travaux récents comme "The Blind Spot" d'Adam Frank, Marcelo Gleiser et Evan Thompson, ou encore "The Abstraction Fallacy" du chercheur de DeepMind Alexander Lerchner, qui posent tous la même question de fond : et si l'IA fonctionnait parce qu'elle s'appuie sur ce que les humains ont déjà construit ? Cette perspective permet d'expliquer à la fois les performances remarquables des modèles actuels et leurs limites récurrentes. Les LLM peuvent produire des textes cohérents dans des domaines très variés parce qu'ils ont appris les relations statistiques entre concepts à travers des milliards de textes humains. Mais ils hallucinent parce qu'ils étendent des patterns à l'intérieur du langage, sans être ancrés dans un rapport direct au monde. Là où un humain est constamment corrigé par l'expérience, un modèle prolonge des configurations linguistiques sans pouvoir vérifier leur rapport à la réalité. Cela explique aussi le "compositionality gap" documenté par la recherche : les modèles progressent beaucoup plus vite en fluidité et en rappel factuel qu'en raisonnement compositionnel véritable, c'est-à-dire la capacité à combiner des concepts de façon réellement nouvelle. Ce n'est pas simplement une limite d'ingénierie, disent les auteurs, mais une frontière structurelle. Sur le plan des implications, cette théorie déplace le débat sur la sécurité de l'IA : plutôt que de s'inquiéter d'une "IA renégate" qui surpasserait l'intelligence humaine, elle invite à traiter la sécurité comme un défi de système, relevant à la fois de l'ingénierie et de la gouvernance. Concevoir l'IA comme une extension de l'intelligence humaine, et non comme son remplacement, offre un cadre plus opérationnel pour construire des systèmes fiables. Dans un contexte où les investissements dans les LLM atteignent des niveaux records et où les débats sur l'alignement et les risques existentiels monopolisent l'attention, cette approche phénoménologique propose une voie plus sobre : comprendre ce que l'IA est vraiment avant de décider ce qu'elle pourrait devenir.

RecherchePaper

1 source

39

2MarkTechPost

Comment la distillation de connaissances condense l'intelligence d'ensemble en un seul modèle IA

La distillation de connaissances est une technique de compression de modèles d'intelligence artificielle qui permet de transférer le savoir acquis par un grand modèle, ou un ensemble de modèles, vers un modèle plus petit et plus rapide. Dans l'expérience présentée, les chercheurs ont entraîné un ensemble de 12 modèles distincts jouant le rôle d'enseignant collectif, puis ont distillé leur intelligence combinée dans un seul modèle étudiant, plus léger. Le pipeline complet est construit en Python avec PyTorch sur un jeu de données synthétique de classification binaire (5 000 exemples, 20 variables), représentatif de problèmes concrets comme la prédiction de clics publicitaires. La clé du processus réside dans l'utilisation des sorties probabilistes "soft" de l'ensemble enseignant, avec une mise à l'échelle par température, plutôt que les simples étiquettes binaires du jeu de données. Résultat : le modèle étudiant récupère 53,8 % de l'avantage de précision de l'ensemble, avec une compression de facteur 160. Pour l'industrie, cette approche répond à un problème fondamental du déploiement en production : les ensembles de modèles sont précis mais trop lents et trop coûteux pour répondre à des contraintes de latence réelles. Un modèle seul, distillé depuis un ensemble de 12 réseaux, peut être servi en temps réel là où l'ensemble original serait inutilisable. La valeur ne vient pas seulement de la réduction de taille, mais de la qualité du signal transmis : les distributions de probabilité de l'enseignant portent une information bien plus riche que les étiquettes brutes, permettant à l'étudiant d'apprendre des nuances que l'entraînement standard ne capturerait pas. Cette technique est aujourd'hui centrale dans la mise en production des grands modèles de langage et des systèmes de vision par ordinateur, où des modèles comme DistilBERT ou les versions compressées de LLaMA sont directement issus de cette logique. La distillation de connaissances a émergé des travaux pionniers de Geoffrey Hinton et ses collègues chez Google en 2015, initialement pour compresser des ensembles en réseaux uniques. Depuis, elle est devenue un pilier de l'ingénierie ML à l'échelle : chaque fois qu'un modèle de recherche trop lourd doit être rendu opérationnel, la distillation est l'une des premières pistes explorées. L'enjeu est stratégique, les entreprises qui maîtrisent cette compression peuvent déployer des capacités de niveau "grand modèle" sur des infrastructures standard, réduisant drastiquement les coûts de calcul. Avec la prolifération des LLM de plusieurs centaines de milliards de paramètres, la distillation est devenue incontournable pour rendre l'IA générative accessible sur des appareils embarqués, des API à faible latence, ou des environnements edge où la puissance de calcul est limitée.

💬 La distillation de connaissances, c'est pas nouveau, Hinton 2015, DistilBERT, tout ça. Ce qui est bien expliqué ici, c'est pourquoi les soft labels avec la mise à l'échelle par température font toute la différence par rapport à un entraînement classique : l'élève apprend les nuances de l'enseignant, pas juste ses réponses binaires. Facteur 160 de compression avec 53% de l'avantage récupéré, c'est le genre de ratio qui explique pourquoi chaque labo qui sort un gros modèle sort aussi une version distillée dans les semaines qui suivent.

RecherchePaper

1 source

Toutes les IA échouent à ce test d’humanité

49

3Numerama

Toutes les IA échouent à ce test d’humanité

Le 27 mars 2026, l'organisation ARC Prize a publié ARC-AGI-3, la troisième itération de son benchmark conçu pour mesurer la progression des systèmes d'IA vers une intelligence artificielle générale. Contrairement aux versions précédentes, ce nouveau test cible spécifiquement les IA dites « agentiques » — capables d'agir en séquences, d'explorer un environnement et d'apprendre en cours de tâche. Les meilleurs modèles actuels, y compris les systèmes de raisonnement d'OpenAI et de Google DeepMind, obtiennent des scores encore très inférieurs aux capacités humaines moyennes. Ce résultat révèle une limite fondamentale des architectures actuelles : les grands modèles de langage excellent à reproduire des patterns vus en entraînement, mais peinent à généraliser dans des contextes inédits et interactifs. ARC-AGI-3 est conçu précisément pour être trivial pour un humain — quelques minutes suffisent — mais résistant aux techniques d'optimisation brute que l'industrie utilise pour doper ses benchmarks. Il mesure ce que Chollet appelle « l'efficience de généralisation », une capacité que les LLMs actuels ne possèdent pas structurellement. ARC-AGI a été créé par François Chollet, ingénieur chez Google et auteur de Keras, qui défend depuis des années l'idée que les benchmarks standards sont saturés et trompeurs. La première version date de 2019 ; ARC-AGI-2, publié en 2025, avait déjà mis en difficulté les meilleurs modèles. ARC Prize, l'organisation derrière le projet, offre des récompenses financières pour inciter la communauté à trouver de nouvelles approches algorithmiques. Ce troisième volet marque une accélération du défi : tant que les IA échouent ici, les proclamations d'AGI restent prématurées.

UELe benchmark est l'œuvre de François Chollet, ingénieur français chez Google, dont les conclusions sur les limites structurelles des LLMs pourraient peser dans les débats européens sur la définition réglementaire de l'AGI dans le cadre de l'AI Act.

💬 Je l'attendais, celle-là. Les meilleurs modèles du monde battus par n'importe quel humain en quelques minutes sur un truc conçu pour être trivial, ça remet les pieds sur terre quand tu lis les annonces AGI de la semaine. Chollet a raison depuis le début : on optimise des benchmarks, pas de l'intelligence.

RecherchePaper

1 source

La science casse les codes : l’IA crée ses premiers vaccins humains

48

4Le Big Data

La science casse les codes : l’IA crée ses premiers vaccins humains

Des chercheurs de l'Université de Cambridge ont franchi une étape inédite dans l'histoire de la vaccination : un candidat vaccin contre les coronavirus, baptisé pEVAC-PS, conçu entièrement à l'aide de modèles d'intelligence artificielle, a été testé avec succès chez l'humain pour la première fois. L'essai de phase I a impliqué 39 volontaires sains qui ont reçu le vaccin par voie intradermique, sans aiguille. Aucun effet indésirable grave n'a été observé, et des signaux immunitaires ont été détectés contre plusieurs coronavirus distincts. Le vaccin a été développé en collaboration avec la société britannique DIOSynVax, qui ambitionne d'étendre la plateforme à d'autres agents pathogènes comme la grippe ou Ebola. Ce qui rend cette avancée significative, c'est l'approche adoptée pour contourner l'un des problèmes fondamentaux de la vaccinologie moderne : la dérive virale. Les coronavirus, comme les virus grippaux, mutent en permanence, rendant les vaccins existants progressivement moins efficaces. L'IA a permis ici d'identifier des zones structurellement stables, communes à plusieurs sarbecovirus, dont le SARS-CoV-2, le virus du SRAS de 2003 et des souches de coronavirus de chauve-souris à potentiel zoonotique. En ciblant ces régions conservées plutôt que des épitopes variables, le vaccin vise à entraîner le système immunitaire à reconnaître une famille entière de virus plutôt qu'un seul variant. C'est une stratégie qui pourrait transformer la manière dont l'humanité anticipe les pandémies, en passant d'une réponse réactive à une préparation proactive. Ce premier essai clinique s'inscrit dans un contexte de course mondiale à la prévention des prochaines crises sanitaires, accélérée par les leçons du Covid-19. Les gouvernements et institutions scientifiques cherchent des outils capables de réduire le délai entre l'émergence d'un nouveau pathogène et la mise à disposition d'un vaccin efficace. L'utilisation de l'IA pour la conception moléculaire représente une piste sérieuse : elle peut théoriquement compresser des années de tâtonnements expérimentaux en quelques mois de simulation computationnelle. Cela dit, les résultats immunitaires observés restent préliminaires et difficiles à interpréter, notamment parce que les volontaires avaient déjà été exposés au SARS-CoV-2 ou vaccinés contre le Covid-19. La prochaine étape, un essai de phase II avec un panel plus large de participants naïfs, sera déterminante pour évaluer l'efficacité réelle du pEVAC-PS. Cambridge et DIOSynVax ont encore plusieurs années de travail devant eux avant toute mise sur le marché, mais la preuve de concept est désormais posée.

UECette avancée de l'Université de Cambridge pourrait accélérer la préparation pandémique en Europe et nourrir les réflexions de l'EMA sur l'intégration de l'IA dans le développement de vaccins à large spectre contre les futures pandémies.

💬 C'est l'approche qui m'intéresse, pas le titre. Cibler les zones conservées plutôt que courir après chaque variant, c'est exactement le bon problème à résoudre, et l'IA est bien placée pour l'identifier parce qu'elle peut comparer des milliers de structures en un temps qu'aucun labo ne pourrait tenir manuellement. Phase I, 39 personnes, résultats préliminaires sur des gens déjà immunisés, bon, on reste loin d'une mise sur le marché. Mais la preuve que ça peut marcher en humain, c'était le verrou qui bloquait tout.

RecherchePaper

1 source

Hassabis voit l'humanité « au pied de la singularité », LeCun conteste l'intelligence des IA actuelles

À lire aussi

L'IA comme prolongement de l'intelligence humaine

Comment la distillation de connaissances condense l'intelligence d'ensemble en un seul modèle IA

Toutes les IA échouent à ce test d’humanité

La science casse les codes : l’IA crée ses premiers vaccins humains