
L'« AI co-clinician » de Google DeepMind devance GPT-5.4 aux tests en aveugle, mais reste derrière les médecins expérimentés
Google DeepMind développe un système d'intelligence artificielle baptisé "AI co-clinician", conçu pour assister les médecins dans la prise en charge des patients. Selon une étude publiée par le laboratoire de recherche d'Alphabet, ce modèle surpasse GPT-5.4 d'OpenAI lors de tests en aveugle réalisés par des médecins, où les évaluateurs ne savaient pas quelle IA produisait quelle réponse. Malgré ces résultats encourageants obtenus dans des environnements simulés, le système reste en deçà des performances des médecins expérimentés en exercice.
Cette recherche illustre à la fois les progrès réels de l'IA médicale et ses limites persistantes. Qu'un modèle de Google surpasse GPT-5.4 dans un contexte clinique simulé est significatif : cela montre que des architectures spécialisées, entraînées sur des données médicales, peuvent dépasser des modèles généralistes de dernière génération. Mais l'écart qui subsiste avec les cliniciens humains rappelle que la médecine exige un niveau de fiabilité et de nuance que les systèmes actuels n'atteignent pas encore. L'étude souligne également que le mode vocal de ChatGPT n'est pas adapté à des tâches sérieuses, et certainement pas aux consultations médicales.
La course à l'IA médicale implique désormais les plus grands acteurs technologiques mondiaux, avec Google, Microsoft et plusieurs startups spécialisées en compétition directe. L'idée d'un "co-clinicien" artificiel, qui seconderait le médecin sans le remplacer, représente une approche volontairement prudente, cherchant à contourner les résistances réglementaires et éthiques. Ces travaux de DeepMind s'inscrivent dans une trajectoire où l'IA pourrait d'abord s'imposer comme outil d'aide à la décision avant toute autonomie clinique.
Les systèmes d'aide à la décision clinique étant classés à haut risque par l'AI Act européen, ces résultats accélèrent la pression réglementaire sur les éditeurs de logiciels médicaux et les hôpitaux en France et en Europe.
DeepMind bat GPT-5.4 en aveugle sur des cas cliniques, et c'est là que c'est intéressant : un modèle spécialisé qui dépasse le généraliste de dernière génération, ça prouve que la spécialisation a encore de l'avenir. Rester derrière les médecins expérimentés, c'est pas une surprise, c'est même rassurant que personne ne le cache. "Co-clinicien" plutôt que "diagnostic AI", c'est le choix de vocabulaire qui permet de déployer sans déclencher l'AI Act.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




