RechercheLatent Space · 20 avr. 2026, 19:17· 2 min de lecture

Entraîner des Transformers pour résoudre le taux d'échec de 95 % des essais cliniques contre le cancer : Ron Alfa et Daniel Bear, Noetik

Résumé IASource uniqueImpact UE Take éditorial

La startup Noetik, cofondée par Ron Alfa et Daniel Bear, vient de signer un accord de 50 millions de dollars avec le géant pharmaceutique GSK pour sa technologie d'intelligence artificielle appliquée à l'oncologie. Au cœur de cet accord se trouve TARIO-2, un transformer autorégressif entraîné sur l'un des plus grands ensembles de données de transcriptomique spatiale tumorale au monde. Ce modèle est capable de prédire une carte génomique d'environ 19 000 gènes à partir d'une simple biopsie H&E colorée, l'examen histologique standard que reçoit déjà chaque patient atteint de cancer. L'accord avec GSK comprend également un contrat de licence à long terme aux termes non divulgués, ce qui représente un engagement envers la plateforme logicielle de Noetik plutôt que vers un médicament spécifique, un modèle rare dans le secteur biotech.

Le problème que Noetik tente de résoudre est brutal : 95 % des traitements contre le cancer échouent lors des essais cliniques, engloutissant entre 20 et 30 milliards de dollars par an en dépenses mondiales de recherche. L'hypothèse centrale de Ron Alfa est que beaucoup de ces traitements fonctionnent réellement, mais qu'ils sont testés sur les mauvais patients. Le cancer n'est pas une seule maladie mais potentiellement des milliers de pathologies distinctes, chacune avec sa propre biologie tumorale. Si l'on pouvait identifier avec précision quels patients portent quelles tumeurs et lesquelles répondront à quels traitements, les taux de succès pourraient augmenter radicalement, avec des thérapies qui existent déjà, comme les inhibiteurs de points de contrôle immunitaires Keytruda et Opdivo, les thérapies CAR-T ou les conjugués anticorps-médicament comme le Trastuzumab. La transcriptomique spatiale complète est la méthode la plus précise pour lire une tumeur, mais elle est quasiment inexistante en soins standards : TARIO-2 permet désormais d'en simuler les résultats à partir d'examens déjà réalisés.

Noetik a passé près de deux ans à constituer une base de données massive, acquérant des milliers de tumeurs humaines réelles avec des ensembles de données multimodaux. Cette approche tranche avec la majorité des initiatives IA en biotechnologie, qui se concentrent sur la découverte de nouvelles molécules et finissent généralement par transformer les éditeurs d'outils en laboratoires pharmaceutiques. L'accord GSK, lui, est un contrat de licence logicielle pur, signalant un changement de posture de la part des grands groupes pharma, de plus en plus prêts à payer pour des plateformes d'analyse plutôt que pour des candidats médicaments. Dans un contexte où des acteurs comme Boltz ou Isomorphic Labs gagnent également en visibilité, l'appétit de l'industrie pour les outils IA en développement thérapeutique semble enfin atteindre un point de bascule.

Impact France/UE

Le groupe pharmaceutique britannique GSK, acteur majeur en Europe, adopte une plateforme IA pour affiner la sélection des patients en oncologie, ce qui pourrait accélérer et améliorer les essais cliniques menés sur le continent.

💬 L'analyse de Mathieu

95 % d'échec en essais cliniques, pas parce que les traitements sont nuls, mais parce qu'on les teste sur les mauvais patients, c'est le genre de problème qu'on sait depuis longtemps et qu'on fait semblant de ne pas voir. Ce qui m'intéresse chez Noetik, c'est que le deal avec GSK est un contrat de licence logicielle, pas un rachat de molécule : les pharmas commencent vraiment à payer pour des outils d'analyse, c'est un vrai signal. Reste à voir si ça tient à l'échelle des essais multi-sites, mais sur le papier, c'est l'une des applications IA en bio les plus solides que j'ai vues depuis un moment.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost

Le NeuroVFM, un nouveau modèle de fondation pour la neuro-imagerie entraîné avec Vol-JEPA sur des IRM et scanners cliniques non filtrés

Une équipe de recherche de l'Université du Michigan a développé NeuroVFM, un modèle de fondation visuel généraliste pour la neuroimagerie, présenté dans une publication de la revue Nature Medicine. Le système a été entraîné sur 5,24 millions de volumes IRM et scanner cliniques, issus de 566 915 études rassemblées dans la base UM-NeuroImages, qui couvre plus de deux décennies de soins courants dispensés par Michigan Medicine. Les chercheurs qualifient leur méthode d'apprentissage à l'échelle du système de santé : plutôt que de s'appuyer sur des rapports radiologiques appariés ou une curation spécifique à chaque pathologie, comme le font les classificateurs médicaux classiques, le modèle apprend directement à partir de données non annotées produites lors de l'activité clinique normale. Son socle technique, baptisé Vol-JEPA, étend les méthodes I-JEPA et V-JEPA à l'imagerie médicale volumétrique en trois dimensions. Concrètement, Vol-JEPA est un algorithme auto-supervisé qui ne reconstruit pas les pixels des images mais prédit des représentations dans un espace latent appris, ce qui lui évite tout besoin d'étiquettes, de comptes-rendus radiologiques ou de décodeur voxel. Chaque volume 3D est découpé en portions non chevauchantes de 4x16x16 voxels, réparties entre un petit contexte visible et une plus large zone masquée à prédire. Un encodeur étudiant traite le contexte, un module prédicteur en déduit les représentations latentes de la zone masquée, et un encodeur enseignant, mis à jour par moyenne mobile exponentielle du modèle étudiant, fournit la cible de référence ; l'écart entre les deux est mesuré par une perte L1 lissée. Le masquage cible en priorité les zones anatomiques utiles grâce à des masques de tête précalculés, avec des ratios de contexte de 25% pour l'IRM et 20% pour le scanner, complétés par un abandon de patchs de 20%. L'intérêt pratique est majeur pour les hôpitaux et les équipes de recherche en radiologie : un même modèle généraliste, entraîné sans supervision humaine coûteuse, pourrait ensuite être adapté à de multiples tâches cliniques de neuroimagerie sans nécessiter de nouvelles données annotées. Cette approche répond à un problème structurel bien connu du secteur : les modèles de fondation les plus performants apprennent surtout à partir de données publiques d'internet, où les IRM et scanners cliniques sont quasiment absents, car ils contiennent des traits faciaux identifiables et posent des problèmes de confidentialité des patients. Les modèles génériques sous-performent donc historiquement sur les tâches d'imagerie cérébrale, faute d'exposition à des volumes médicaux réels et diversifiés. NeuroVFM s'inscrit dans une tendance plus large de diffusion des méthodes de type JEPA, initialement conçues pour les images et vidéos naturelles, vers l'imagerie médicale spécialisée. Reste à voir si d'autres établissements hospitaliers suivront cette voie de l'apprentissage à l'échelle du système de santé pour constituer, à partir de leurs propres archives cliniques, des modèles de fondation comparables dans d'autres spécialités que la neuroimagerie.

💬 Ce qui compte ici, c'est pas le modèle en lui-même, c'est la méthode : Michigan a montré qu'un hôpital peut entraîner un foundation model direct sur ses archives IRM et scanner, sans rapport radiologique ni annotation. Tu le sais si tu suis le sujet, le vrai verrou en imagerie médicale c'était pas la puissance de calcul mais l'absence de données labellisées à grande échelle, et JEPA contourne ça en prédisant dans un espace latent plutôt que sur les pixels bruts. Reste à voir si d'autres CHU ont l'infrastructure pour rejouer le coup, parce que 5 millions de volumes cliniques, ça se trouve pas dans toutes les boîtes mail.

RecherchePaper

1 source

2MarkTechPost

Stanford présente TRACE, un système d'entraînement d'agents ciblé sur les compétences qui transforme leurs échecs récurrents en environnement RL synthétique

Des chercheurs de Stanford ont développé TRACE (Turning Recurrent Agent failures into Capability-targeted training Environments), un système publié en open source sous licence MIT qui transforme les échecs récurrents des agents fondés sur des LLM en environnements d'entraînement ciblés. Le constat de départ est simple: un agent ne rate pas ses tâches au hasard, mais parce qu'il lui manque des capacités précises et réutilisables, comme retrouver la bonne information ou vérifier une condition préalable. Face à ce problème, les approches classiques, apprentissage par renforcement direct, réglage fin supervisé ou génération de données synthétiques non ciblée, gaspillent une grande partie du budget de calcul sur des compétences que le modèle maîtrise déjà, sans jamais signaler précisément quelle capacité fait défaut. TRACE fonctionne en quatre étapes automatisées, chacune pilotée par un agent LLM suivant un prompt structuré. D'abord, une analyse contrastive compare les trajectoires réussies et échouées pour identifier les capacités absentes, en ne retenant que celles dont l'écart entre succès et échec dépasse un seuil de 0,20 et dont la couverture dépasse 0,10. Ensuite, un agent générateur construit un environnement synthétique dédié à chaque capacité retenue, avec des instances de tâches produites automatiquement à partir de graines aléatoires, ce qui permet une vérification purement algorithmique sans recours à un juge humain ou à un LLM évaluateur. Chaque capacité reçoit alors son propre adaptateur LoRA, entraîné via l'algorithme GRPO (Group Relative Policy Optimization) pendant que le modèle de base reste figé. Enfin, ces adaptateurs sont combinés dans une architecture de mélange d'experts (Mixture-of-Experts), où seules de légères portes de routage sont entraînées, permettant au modèle d'orienter chaque token vers l'expert le plus pertinent en cours de raisonnement. Cette approche change la manière dont les équipes peuvent corriger les faiblesses d'un agent en production: plutôt que de réentraîner l'ensemble du modèle ou de multiplier les tentatives de prompt engineering, il devient possible de diagnostiquer précisément quelles compétences manquent et d'y répondre par un entraînement chirurgical, moins coûteux en calcul et plus facile à faire évoluer au fil du temps. Pour les entreprises qui déploient des agents autonomes dans des tâches complexes comme la gestion de réservations ou le support client, cela ouvre la voie à une amélioration continue ciblée, où chaque nouvel échec récurrent peut être transformé en module d'entraînement supplémentaire sans perturber les capacités déjà acquises. Sur le benchmark τ²-Bench, testé avec le modèle Qwen3-30B-A3B, TRACE a surpassé à la fois les méthodes d'optimisation de prompts et les approches à adaptateur unique en matière de taux de réussite global. Ce travail s'inscrit dans une tendance plus large de recherche sur les agents fondés sur des LLM, où la difficulté ne vient plus seulement de la puissance brute des modèles mais de leur capacité à combler des lacunes spécifiques de façon vérifiable. Les auteurs ont publié leur code et leur article, référencé sous l'identifiant arXiv:2604.05336, ce qui devrait permettre à d'autres équipes de reproduire et d'étendre cette méthode à d'autres environnements agentiques.

RecherchePaper

1 source

3MarkTechPost

Sakana AI utilise la diffusion d'erreurs pour entraîner des réseaux à double flux conformes à Dale, atteignant 96,7% sur MNIST et 61,7% sur CIFAR-10 sans rétropropagation

Sakana AI a publié une étude intitulée « Diffusing Blame », qui s'attaque à un problème central de l'apprentissage profond biologiquement plausible : la rétropropagation classique exige que le passage arrière utilise les matrices exactement transposées des poids du passage avant, un mécanisme que le cerveau ne peut vraisemblablement pas reproduire, connu sous le nom de problème du transport de poids. L'équipe s'appuie sur une règle d'apprentissage locale baptisée Error Diffusion, proposée dès 2000 par Kaneko, où chaque mise à jour de poids ne dépend que de trois signaux : l'activité présynaptique, la dérivée de l'activation postsynaptique et un simple signe d'erreur global. Pour respecter le principe de Dale, qui impose qu'un neurone soit soit excitateur soit inhibiteur, les chercheurs ont conçu une architecture à double flux dédoublant chaque couche en un canal excitateur et un canal inhibiteur, avec quatre matrices de poids non négatives par couche, soit environ 32 millions de paramètres contre 8 millions pour une architecture DFA classique. Grâce à trois innovations, un routage d'erreur modulo, des largeurs de sigmoïde ajustées par couche et une initialisation asymétrique des poids, cette méthode atteint 96,7% de précision sur MNIST et 61,7% sur CIFAR-10, contre seulement 50,4% et 11,6% sans ces ajustements. Il s'agit de la première fois qu'Error Diffusion entraîne avec succès des réseaux convolutifs, dépassant les 55,2% obtenus par Fujita en 2026 avec un simple perceptron multicouche aplati sur CIFAR-10. Ces résultats comptent parce qu'ils ouvrent une piste concrète vers des algorithmes d'apprentissage compatibles avec les contraintes biologiques et matérielles, sans sacrifier totalement les performances. Un réseau qui respecte le principe de Dale et n'a jamais besoin de transporter des poids transposés est plus facile à implémenter sur du matériel neuromorphique, où les connexions physiques ne peuvent pas changer de signe à la volée. Pour l'industrie des puces spécialisées en intelligence artificielle et pour la recherche en neurosciences computationnelles, cela représente une preuve de concept que des règles locales et biologiquement crédibles peuvent être poussées au-delà de tâches jouets vers des architectures convolutives réalistes, même si l'écart de performance avec la rétropropagation reste important, puisque la méthode DFA non conforme à Dale atteint 97,6% et 69,1% sur les mêmes tâches. Ce travail s'inscrit dans une longue quête de règles d'apprentissage alternatives à la rétropropagation, de la propagation de rétroaction directe à l'alignement de rétroaction aléatoire, motivée par le décalage entre la neuroscience et le deep learning moderne. L'inversion observée lors des tests d'ablation, où retirer certaines innovations change radicalement l'importance relative des autres composants, suggère que ces mécanismes interagissent de façon non triviale, ouvrant la voie à de futurs travaux visant à réduire encore l'écart avec les méthodes à base de gradient tout en conservant la plausibilité biologique.

💬 Cette histoire de double flux qui respecte le principe de Dale, c'est malin mais ça se paie cash : 32 millions de paramètres pour arriver à 61,7% sur CIFAR-10 quand la rétropropagation classique en fait quatre fois moins pour 69,1%. Selon Le Fil IA, ce papier montre surtout qu'on sait maintenant router l'erreur sans transposer les poids, ce qui compte plus pour le matériel neuromorphique que pour la perf brute. Reste à voir si ça tient sur autre chose que MNIST et CIFAR, parce que passer à l'échelle avec quatre matrices non négatives par couche, ça reste un vrai défi d'ingénierie.

RecherchePaper

1 source

4MarkTechPost

États quantiques neuronaux à base de transformeurs pour systèmes de spins frustrés avec NetKet

Des chercheurs en physique computationnelle explorent une approche inédite pour simuler les systèmes quantiques frustrés : l'utilisation d'architectures Transformer, les mêmes qui propulsent les grands modèles de langage, comme ansatz variationnel pour représenter des fonctions d'onde quantiques. Concrètement, l'implémentation s'appuie sur NetKet et JAX pour résoudre la chaîne de spins de Heisenberg J1-J2, un système dit "frustré" où les interactions magnétiques concurrentes entre premiers voisins (J1) et seconds voisins (J2) génèrent des corrélations quantiques extraordinairement complexes. Le modèle Transformer utilisé comporte 6 couches d'attention, 4 têtes d'attention et une dimension cachée de 96, entraîné par Monte Carlo variationnel (VMC) avec reconfiguration stochastique, un analogue du gradient naturel adapté à l'optimisation de fonctions d'onde. L'enjeu est fondamental pour la physique de la matière condensée. Les méthodes classiques d'exacte diagonalisation atteignent rapidement leurs limites face à la croissance exponentielle de l'espace de Hilbert : un système de N spins 1/2 requiert 2^N états de base. Les États Quantiques Neuronaux (NQS) introduits par cette approche permettent de représenter des fonctions d'onde hautement expressives en paramétrant leur amplitude complexe log-Ψ via un réseau de neurones, contournant cette explosion combinatoire. Les Transformers sont particulièrement adaptés : leur mécanisme d'attention globale capture naturellement les corrélations à longue portée entre spins, là où les réseaux convolutifs classiques peinent à dépasser quelques voisins. Les résultats sont benchmarkés contre la diagonalisation exacte de Lanczos, permettant de quantifier la précision de l'approximation variationnelle. Cette convergence entre apprentissage profond et physique quantique s'inscrit dans un mouvement plus large amorcé en 2017 avec les travaux pionniers de Carleo et Troyer, qui ont démontré pour la première fois qu'un réseau de neurones pouvait rivaliser avec les meilleures méthodes numériques en physique quantique. Depuis, les architectures se sont sophistiquées : réseaux récurrents, machines de Boltzmann restreintes, et désormais Transformers. L'écosystème logiciel autour de NetKet, développé principalement par des groupes européens, et de JAX/Flax de Google DeepMind, démocratise ces techniques auparavant réservées à quelques laboratoires spécialisés. Les perspectives sont considérables : simuler des matériaux quantiques réels comme les supraconducteurs à haute température ou les isolants topologiques, là où les méthodes traditionnelles restent bloquées par la "malédiction de la dimensionnalité".

UEL'écosystème NetKet, développé principalement par des groupes européens, renforce la compétitivité de la recherche quantique européenne dans la simulation de matériaux complexes comme les supraconducteurs à haute température.

RecherchePaper

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic