Dossier GPT-5 — page 5

299 articles · page 5 sur 6

GPT-5 et ses variantes (5.4, 5.5), la famille frontier d'OpenAI : capacités agentiques, coûts d'inférence, comparaisons avec Claude et Gemini.

201The Decoder LLMsActu

La mise à jour santé de ChatGPT surpasse les réponses de médecins, selon OpenAI

OpenAI a annoncé une mise à niveau significative des capacités médicales de ChatGPT, propulsée par son nouveau modèle GPT-5.5 Instant. Selon les tests comparatifs conduits par l'entreprise elle-même, le chatbot surpasse désormais les réponses rédigées par des médecins en termes de précision, de clarté et d'exhaustivité. Plus concrètement, le taux d'erreur sur les questions de santé aurait chuté de 71 % par rapport aux versions précédentes. Cette avancée représente un tournant potentiel dans l'usage de l'IA comme outil de santé grand public. Si ces performances se confirment en conditions réelles, des millions d'utilisateurs pourraient obtenir des informations médicales fiables sans passer par un professionnel de santé, ce qui soulève autant d'espoirs que d'interrogations sur la responsabilité en cas d'erreur. Pour l'industrie de la santé numérique, c'est un signal fort : les modèles de langage commencent à rivaliser sérieusement avec l'expertise clinique sur certains types de requêtes informatives. Cette annonce s'inscrit dans une compétition acharnée entre les grands laboratoires d'IA pour s'imposer dans le secteur médical, jugé stratégique et lucratif. Google, Microsoft et plusieurs startups spécialisées investissent massivement dans des modèles entraînés sur des données cliniques. OpenAI, en misant sur GPT-5.5 Instant pour le grand public, adopte une approche différente : intégrer la santé directement dans un outil généraliste déjà utilisé par des centaines de millions de personnes, sans nécessiter de plateforme dédiée.

UELes systèmes d'IA médicaux sont classés à haut risque par l'AI Act européen, ce qui imposera à OpenAI des exigences strictes de validation clinique et de transparence avant tout déploiement élargi de ces fonctionnalités santé dans l'UE.

Dossier GPT-5 — page 5

La mise à jour santé de ChatGPT surpasse les réponses de médecins, selon OpenAI

Moonshot AI publie Kimi K2.7-Code : un modèle de code avec +21,8 % sur Kimi Code Bench v2 par rapport à K2.6

SkillOpt de Microsoft améliore automatiquement les compétences des agents IA sans modifier les poids du modèle

Minerva mise sur OpenAI et lève 20 millions de dollars pour sa plateforme de marketing IA

Harness-1 : sous-agent de récupération 20B entraîné par renforcement dans un cadre de recherche à état sur gpt-oss-20b

Les modèles OpenAI et Codex sont désormais disponibles sur Amazon Bedrock

MiniMax publie M3 : architecture MSA, contexte d'un million de tokens, multimodalité native et codage par agents autonomes

Les agents de recherche IA ont tendance à confirmer leurs connaissances existantes plutôt qu'à explorer le web

Si Grok gérait le monde : l'effondrement en 4 jours

GPT-next d'OpenAI réfute le problème des distances unitaires planaires d'Erdős pour moins de 1 000 dollars

Les agents IA sont-ils joignables par téléphone ?

Laisser ChatGPT fouiller votre compte en banque : génial ou dangereux ?

ChatGPT veut accéder à votre compte bancaire pour analyser vos dépenses

Les meilleurs agents IA pour le développement logiciel : classement par benchmarks

[AINews] Codex monte en puissance, Claude encadre l'utilisation par API

La fin du finetuning

Perceptron Mk1 présente un modèle d'analyse vidéo très performant, 80 à 90 % moins cher qu'Anthropic, OpenAI et Google

OpenAI lance Daybreak, une initiative de cybersécurité qui place Codex au cœur de la détection de vulnérabilités et de la validation de correctifs

OpenClaw vs Hermes Agent : Nous Research domine le classement mondial d'OpenRouter avec son agent auto-améliorant

Anthropic affiche une croissance de 10x par an pendant que ses concurrents licencient plus de 10 % de leurs effectifs

GPT-Realtime-2, -Translate et -Whisper : de nouvelles API vocales en temps réel de pointe

OpenAI publie trois nouveaux modèles audio en temps réel dans son API : GPT-Realtime-2, GPT-Realtime-Translate et GPT-Realtime-Whisper

ZAYA1-8B : modèle de raisonnement open source très efficace, entraîné sur GPU AMD Instinct MI300

Zyphra lance ZAYA1-8B : un modèle de raisonnement MoE entraîné sur matériel AMD aux performances bien supérieures à sa taille

La physique au feeling : Alex Lupsasca, OpenAI

L'Autre face à l'Utilitaire

[AINews] Des agents pour tout le reste : Codex pour le travail intellectuel, Claude pour la création

MiMo-V2.5 et V2.5-Pro de Xiaomi parmi les modèles open source les plus efficaces et abordables pour les tâches 'claw' à base d'agents

ChatGPT Phone : tout ce qu’on sait du smartphone IA agentique qui veut tuer l’iPhone

500 banquiers d'investissement ont évalué les résultats de l'IA : aucun n'est prêt pour les clients

The Download : arnaques dopées et IA dans la santé à l'étude

Le Nano Banana de ChatGPT

Xiaomi lance MiMo-V2.5-Pro et MiMo-V2.5 : des performances comparables aux grands modèles pour un coût en tokens bien inférieur

OpenAI lance GPT-Rosalind, son premier modèle d'IA pour les sciences du vivant, conçu pour accélérer la découverte de médicaments et la génomique

Claude Opus 4.7 : Le nouveau monstre d’Anthropic arrive (peut-être) cette semaine !

MiniMax publie en open source MiniMax M2.7, un modèle à agents auto-évolutif : 56,22 % sur SWE-Pro et 57 % sur Terminal Bench 2

AI Engineer Europe 2026

Z.AI lance GLM-5.1 : un modèle open-weight de 754 milliards de paramètres, leader sur SWE-Bench Pro avec 8 heures d'exécution autonome

Pas de Claude pour Claws

AutoAgent : la bibliothèque open source qui permet à une IA d'optimiser son propre système d'agents

« L’humanité va se scinder en deux » : interview choc et confessions explosives d’OpenAI

Chroma lance Context-1 : un modèle de recherche à base d'agents de 20 milliards de paramètres pour la récupération multi-saut et la gestion du contexte

Actualité : “Un seuil a été franchi” : le nouveau modèle de Claude a fuité par erreur, Anthropic évoque des capacités sans précédent

Xiaomi MiMo-V2-Pro : le géant chinois lance son rival de ChatGPT et Gemini

Ce métier ne sert plus à rien selon OpenAI : « ils ont fait leur temps »

ChatGPT 5.4 Mini : les utilisateurs ont enfin accès à la nouvelle IA OpenAI

[AINews] Bulletin Claude Cowork : la réponse d'Anthropic à OpenClaw

Voici un nouveau format que j'aimerais essayer

Import AI 449 : des LLMs entraînent d'autres LLMs ; entraînement distribué 72B ; la vision par ordinateur est plus difficile que le texte génératif

Comment une IA associé à un labo automatisé accélère la recherche biologique