Dossier GPT-5 — page 2

155 articles · page 2 sur 4

GPT-5 et ses variantes (5.4, 5.5), la famille frontier d'OpenAI : capacités agentiques, coûts d'inférence, comparaisons avec Claude et Gemini.

51The Decoder LLMsPaper

500 banquiers d'investissement ont évalué les résultats de l'IA : aucun n'est prêt pour les clients

Un nouveau benchmark a soumis les modèles d'IA les plus puissants du marché, dont GPT-5.4 et Claude Opus 4.6, à des tâches quotidiennes d'analystes juniors en banque d'investissement. Le verdict de 500 professionnels du secteur est sans appel : aucun résultat produit par ces modèles n'a été jugé prêt à être transmis à un client. Les sorties étaient systématiquement trop imprécises, voire franchement incorrectes. Malgré tout, plus de la moitié des banquiers interrogés ont indiqué qu'ils exploiteraient ces productions comme base de travail. Ce constat illustre l'écart persistant entre les promesses marketing des grands modèles de langage et les exigences concrètes des métiers à hauts enjeux. En banque d'investissement, une erreur dans une note d'analyse ou un modèle financier peut engager la responsabilité juridique de l'établissement et nuire à des transactions portant sur des centaines de millions d'euros. L'IA peut donc accélérer certaines tâches de débroussaillage, mais elle ne remplace pas encore le jugement et la rigueur d'un analyste humain pour la livraison finale. Ce test s'inscrit dans une vague d'évaluations sectorielles cherchant à dépasser les benchmarks académiques génériques, souvent décorrélés des usages professionnels réels. La finance, comme le droit ou la médecine, soumet l'IA à des critères de précision et de fiabilité que les tableaux de classement habituels ne mesurent pas. Les éditeurs de modèles, OpenAI et Anthropic en tête, devront probablement affiner leurs offres pour les environnements réglementés si ils veulent s'imposer au-delà du rôle d'assistant de brouillon.

UELes grandes banques françaises et européennes, soumises aux exigences de conformité MiFID II et aux contrôles des régulateurs financiers, sont directement concernées par ces limitations qui conditionnent toute adoption de l'IA dans la production de documents transmissibles aux clients.

Dossier GPT-5 — page 2

500 banquiers d'investissement ont évalué les résultats de l'IA : aucun n'est prêt pour les clients

RAG sans vecteurs : PageIndex récupère l'information par raisonnement

Le nouveau modèle V4 de DeepSeek : trois raisons pour lesquelles il compte

The Download : arnaques dopées et IA dans la santé à l'étude

OpenAI lance ChatGPT pour les cliniciens : la médecine change-t-elle ère ?

Le Nano Banana de ChatGPT

OpenAI affirme que ChatGPT for Clinicians surpasse les médecins sur les tâches cliniques, même avec temps illimité et accès au web

OpenAI lance Privacy Filter, un modèle open source de suppression des données personnelles dans les jeux de données d'entreprise

Des scientifiques artificiels

Trois agents de codage IA ont laissé fuiter des secrets via une injection de prompt, un éditeur l'avait prédit

GPT-Image-2 lâché dans la nature : Le nouveau bond d’OpenAI va vous exploser la rétine.

Moonshot AI publie Kimi K2.6 : codage longue portée et essaim d'agents à 300 sous-agents et 4 000 étapes coordonnées

Les deux visages d'OpenClaw

Salesforce lance Headless 360 pour transformer sa plateforme en infrastructure pour agents autonomes

Anthropic lance Claude Opus 4.7 et reprend de justesse la tête des LLM grand public

Les modèles de pointe échouent une fois sur trois en production et deviennent plus difficiles à auditer

« L’IA va nous détruire » : le manifeste du premier terroriste anti-ChatGPT

L'écart entre les États-Unis et la Chine en IA s'est réduit, mais pas sur l'IA responsable

[AINews] Le dernier souffle de l'humanité

Meta dispose d'un modèle IA compétitif mais perd son identité open source

Meta lance Muse Spark, son premier modèle IA propriétaire depuis la création des Superintelligence Labs

Claude Mythos : l’IA qu’Anthropic refuse de sortir (et pourquoi ça fait peur)

L'IA passe à la journée de 8 heures : GLM lance son LLM 5.1 open source et bat Opus 4.6 et GPT 5.4 sur SWE-Bench Pro

Import AI 452 : lois d'échelle pour la cyberguerre, automatisation par IA en hausse et énigme autour des prévisions de PIB

Les capacités offensives de l'IA en cybersécurité doublent tous les six mois, selon des chercheurs

Les modèles d'IA décrivent avec assurance des images qu'ils n'ont pas vues, et les benchmarks ne le détectent pas

Cette startup veut changer la façon dont les mathématiciens font des maths

Mistral Small 4, GPT‑5.4 mini et nano : deux approches pour les « petits » modèles

Sam Altman adore GPT-5.4… pourtant, cette IA a 3 gros défauts

Présentation de GPT-5.3-Codex

Comment Tolan développe une IA de premier-plan avec GPT-5.1

Présentation de GPT-5.2-Codex

Complément au carton du système GPT-5.2 : GPT-5.2-Codex

Présentation de GPT-5.2-Codex

Présentation de GPT-5.2

Mise à jour de la carte du système GPT-5 : GPT-5.2

Construire encore plus avec GPT-5.1-Codex-Max" se traduit en français par "Construire encore plus avec GPT-5.1-Codex-Max".

Fiche Système GPT-5.1-Codex-Max

Présentation de GPT-5.1 pour les développeurs

GPT-5.1: Une version améliorée et conversatielle de ChatGPT

La refonte de Notion pour une IA agentique : comment GPT-5 a débloqué des workflows autonomes

Consensus accélère la recherche avec GPT-5 et l'API de réponses

Avec GPT-5, Wrtn crée une intelligence artificielle pour le mode de vie pour des millions de personnes en Corée

GPT-5 lance un bug bounty biosécurité

Présentation de GPT-5 pour les développeurs

Critiques de règles : Codage et création avec GPT-5

L'écriture créative avec GPT-5

La recherche médicale avec GPT-5

Première approche de GPT-5

Présentation de GPT-5