Aller au contenu principal
OpenAI déploie GPT-5.5 Instant : moins d’erreurs, plus de puissance
LLMsLe Big Data6sem· 2 min de lecture

OpenAI déploie GPT-5.5 Instant : moins d’erreurs, plus de puissance

Résumé IASources croisées · 3Impact UE
Source originale ↗·
Egalement couvert par :Les Numériques IANumerama

OpenAI a lancé GPT-5.5 Instant le 5 mai 2026, un nouveau modèle qui remplace progressivement GPT-5.3 Instant sur l'ensemble des offres ChatGPT. Le déploiement, annoncé par Sam Altman sur X, devrait être finalisé en deux jours. La mise à jour apporte trois améliorations majeures : une réduction de 52,5 % des hallucinations sur des sujets sensibles comme la médecine et le droit, des scores en hausse sur des questions scientifiques de niveau avancé ainsi qu'en mathématiques, et des réponses jusqu'à 30 % plus courtes. Le ton devient également plus naturel et plus chaleureux, selon la communication officielle d'OpenAI.

Ces changements ont des conséquences concrètes pour les millions d'utilisateurs qui s'appuient quotidiennement sur ChatGPT dans des contextes professionnels ou académiques. La baisse des hallucinations est particulièrement significative dans des domaines où une réponse erronée peut avoir des conséquences réelles : un médecin qui vérifie un protocole, un juriste qui cherche une référence, un étudiant qui prépare un exposé. La concision accrue réduit le temps de lecture et améliore l'efficacité des échanges, une demande explicite de nombreux utilisateurs que l'entreprise dit avoir entendue. La personnalisation renforcée, qui exploite plus intelligemment les conversations passées, les fichiers et les données connectées, rapproche le modèle d'un assistant véritablement adaptatif plutôt que d'un outil générique.

OpenAI évolue dans un contexte de concurrence intense, face à Google Gemini, Anthropic Claude et les modèles open source qui gagnent rapidement en maturité. La course ne porte plus seulement sur la puissance brute des modèles, mais aussi sur leur fiabilité et leur utilisabilité au quotidien, deux dimensions où les critiques contre ChatGPT s'étaient accumulées ces derniers mois. Sur la question de la mémoire et de la vie privée, OpenAI a ajouté une fonctionnalité permettant aux utilisateurs de consulter, modifier ou supprimer les informations utilisées pour personnaliser les réponses, une concession notable aux préoccupations croissantes autour de la confidentialité des données. Les performances annoncées restent à confirmer dans des usages réels prolongés, loin des benchmarks contrôlés, mais la direction prise par GPT-5.5 Instant témoigne d'un repositionnement stratégique clair : moins de puissance spectaculaire sur le papier, plus de crédibilité et de praticité dans l'usage réel.

Impact France/UE

Les professionnels européens des secteurs médical et juridique utilisant ChatGPT bénéficieront de la réduction annoncée des hallucinations, sans impact réglementaire ou institutionnel spécifique pour la France ou l'UE.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

GPT-5.5 : le modèle à base d'agents le plus puissant d'OpenAI, à deux fois le prix de l'API
1AI News 

GPT-5.5 : le modèle à base d'agents le plus puissant d'OpenAI, à deux fois le prix de l'API

OpenAI a lancé GPT-5.5 le 23 avril 2026, présenté comme son modèle d'intelligence artificielle agentique le plus capable à ce jour. Conçu dès la base pour planifier, utiliser des outils, vérifier ses propres résultats et exécuter des tâches de façon autonome, il s'agit du premier modèle de base ré-entraîné depuis GPT-4.5, développé en coopération avec les systèmes rack NVIDIA GB200 et GB300 NVL72. Le déploiement a commencé pour les abonnés Plus, Pro, Business et Enterprise dans ChatGPT et Codex, avec un accès API ouvert dès le 24 avril. Sur Terminal-Bench 2.0, un benchmark mesurant les workflows en ligne de commande, GPT-5.5 atteint 82,7 % contre 75,1 % pour GPT-5.4 et 69,4 % pour Claude Opus 4.7. Sur SWE-Bench Pro, qui évalue la résolution de tickets GitHub, il plafonne à 58,6 %, et sur MRCR v2 à un million de tokens, il grimpe à 74,0 % contre seulement 36,6 % pour son prédécesseur. L'API est facturée 5 dollars par million de tokens en entrée et 30 dollars en sortie, soit exactement le double de GPT-5.4. La version Pro, réservée aux abonnements payants, monte à 30 dollars en entrée et 180 dollars en sortie. Ce doublement tarifaire est le principal point de friction, mais OpenAI avance un argument concret : GPT-5.5 accomplit les mêmes tâches Codex avec moins de tokens que son prédécesseur, ce qui ramène le surcoût réel à environ 20 % selon le laboratoire indépendant Artificial Analysis. Pour les entreprises qui déploient des agents automatisés traitant des volumes importants, la différence n'est donc pas nécessairement linéaire avec le prix affiché. En interne, OpenAI affirme que plus de 85 % de ses employés utilisent Codex chaque semaine, y compris les équipes marketing, qui ont notamment utilisé GPT-5.5 pour analyser six mois de demandes de prises de parole et construire un cadre de scoring automatisant les approbations à faible risque. GPT-5.5 s'inscrit dans une course à l'agentique qui structure désormais toute la compétition entre les grands labos d'IA. Le co-fondateur Greg Brockman y voit "un vrai pas vers le type de calcul qu'on attend pour le futur", tandis que le chief scientist Jakub Pachocki concède que les deux dernières années de progrès avaient semblé "étonnamment lentes". Un point reste ouvert : sur MCP Atlas, le benchmark de Scale AI mesurant l'utilisation d'outils via le Model Context Protocol, Claude Opus 4.7 d'Anthropic mène avec 79,1 % et GPT-5.5 n'affiche aucun score, ce qu'OpenAI a néanmoins inclus dans son propre tableau comparatif. Pour les équipes qui construisent des pipelines agentiques en production, les prochaines semaines permettront de déterminer si les performances en benchmark se traduisent en gains réels, notamment pour les agents terminaux non supervisés et l'automatisation DevOps.

UELes développeurs et entreprises européens utilisant l'API OpenAI devront arbitrer entre le gain de performance agentique de GPT-5.5 et son coût doublé (5 $/M tokens en entrée, 30 $ en sortie) pour leurs pipelines en production.

💬 Le doublement affiché fait frémir, mais si le coût réel en prod tourne à +20% grâce à l'efficience sur les tokens, l'arbitrage change du tout au tout. Ce qui accroche plus, c'est que GPT-5.5 n'a aucun score sur MCP Atlas et qu'OpenAI l'a quand même glissé dans son tableau comparatif avec une case vide. Avant de migrer des pipelines agentiques vers GPT-5.5, c'est ce trou-là qu'il faut creuser, pas les benchmarks terminal.

LLMsOpinion
1 source
ChatGPT intègre GPT-5.5 Instant : moins d'hallucinations et des réponses plus personnalisées
2The Decoder 

ChatGPT intègre GPT-5.5 Instant : moins d'hallucinations et des réponses plus personnalisées

OpenAI a commencé à déployer GPT-5.5 Instant comme modèle par défaut de ChatGPT, remplaçant ainsi le modèle précédemment utilisé par des centaines de millions d'utilisateurs. Selon les tests internes de l'entreprise, cette mise à jour produit 52,5 % d'hallucinations en moins sur des sujets à enjeux élevés comme la médecine et le droit. Le déploiement est immédiat pour l'ensemble des utilisateurs, bien que certaines fonctionnalités avancées de personnalisation soient réservées, dans un premier temps, aux abonnés Plus et Pro sur la version web. La réduction des hallucinations sur des domaines sensibles représente un progrès concret pour les professionnels de santé, les juristes et tous ceux qui utilisent ChatGPT comme outil de travail. Une nouvelle fonctionnalité baptisée "memory sources" permet désormais aux utilisateurs de voir précisément quels éléments de contexte mémorisé ont influencé une réponse donnée, apportant une transparence inédite sur le fonctionnement de la personnalisation. La personnalisation basée sur les conversations passées, les fichiers et Gmail marque une intégration plus profonde dans l'écosystème quotidien des utilisateurs. Ce déploiement s'inscrit dans une course effrénée entre les grandes plateformes d'IA générative à améliorer la fiabilité de leurs modèles, point noir persistant depuis l'émergence des LLMs. OpenAI, sous pression concurrentielle d'Anthropic, Google et des acteurs open source, mise sur la personnalisation contextuelle et la réduction des erreurs factuelles pour fidéliser sa base d'utilisateurs. L'intégration Gmail, en particulier, soulève des questions sur la confidentialité des données qui devraient alimenter le débat dans les mois à venir.

UEL'intégration Gmail soulève des questions de conformité GDPR pour les utilisateurs européens, tandis que la réduction des hallucinations dans des domaines sensibles bénéficie aux professionnels français en santé et droit utilisant ChatGPT.

LLMsActu
1 source
OpenAI améliore la lisibilité de GPT-5.5 Instant et retire deux anciens modèles
3The Decoder 

OpenAI améliore la lisibilité de GPT-5.5 Instant et retire deux anciens modèles

OpenAI vient d'annoncer une mise à jour de GPT-5.5 Instant destinée à produire des réponses plus naturelles et plus lisibles. En parallèle, la société retire la fonctionnalité Canvas de ses modèles les plus récents : les tâches de rédaction et de programmation s'effectueront désormais directement dans l'interface de chat, sans environnement séparé. OpenAI annonce également la fin de deux modèles plus anciens, o3 et GPT-4.5, qui seront définitivement retirés de ChatGPT d'ici août 2026 au plus tard. Ces changements reflètent une stratégie de rationalisation du portefeuille de modèles d'OpenAI. Supprimer Canvas au profit d'une expérience intégrée au chat simplifie l'interface pour les utilisateurs tout en concentrant les efforts de développement sur les modèles de nouvelle génération. La retraite d'o3 et de GPT-4.5 signale que la société entend éviter la fragmentation de son offre, qui multipliait les options aux performances et aux coûts variables pour les développeurs comme pour les abonnés. Cette consolidation intervient dans un contexte de forte compétition, où Anthropic, Google et Meta poussent leurs propres familles de modèles à un rythme soutenu. OpenAI cherche à clarifier sa gamme après une période marquée par une prolifération rapide de variantes, o1, o3, GPT-4o, GPT-4.5, GPT-5, parfois difficile à suivre même pour les professionnels. La suppression progressive des modèles anciens laisse présager une architecture plus lisible autour de GPT-5 et de ses déclinaisons directes dans les mois à venir.

UELes développeurs et entreprises européens utilisant l'API OpenAI devront planifier la migration de leurs intégrations basées sur o3 ou GPT-4.5 avant août 2026.

💬 Enfin du ménage. Le catalogue OpenAI était devenu franchement illisible, avec o1, o3, GPT-4o, GPT-4.5 qui se marchaient dessus en termes de positionnement et de coût, sans qu'on comprenne vraiment quoi choisir pour quel usage. La date d'août 2026 pour retirer o3 et GPT-4.5 laisse le temps de planifier les migrations, c'est au moins ça.

LLMsOpinion
1 source
MiniMax lance M3 : le modèle Open Weight le plus puissant jamais créé ?
4Le Big Data 

MiniMax lance M3 : le modèle Open Weight le plus puissant jamais créé ?

Le 1er juin 2026, la société chinoise MiniMax a lancé M3, son nouveau modèle d'intelligence artificielle à poids ouverts. Il s'agit du premier modèle open weight à combiner trois capacités jusqu'ici réservées aux systèmes propriétaires : une fenêtre contextuelle d'un million de jetons, des performances de pointe en programmation et en agents autonomes, ainsi qu'une prise en charge native du texte et des images. Sur SWE-Bench Pro, le benchmark de référence pour la résolution de problèmes logiciels réels, M3 obtient 59 %, dépassant GPT-5.5 et Gemini 3.1 Pro selon MiniMax. Il atteint également 66 % sur Terminal-Bench 2.1, 74,2 % sur Atlas MCP et 83,5 sur BrowseComp, score qui surpasserait Claude Opus 4.7. Le modèle est déjà accessible via l'API officielle de MiniMax et son agent de développement MiniMax Code, tandis que les poids ouverts seront publiés sur Hugging Face et GitHub dans une dizaine de jours. Ce lancement est significatif parce qu'il réduit concrètement la barrière entre modèles open source et systèmes propriétaires de premier rang. L'architecture repose sur une technologie maison appelée MiniMax Sparse Attention (MSA), qui identifie les informations pertinentes avant de concentrer les calculs sur elles : résultat, le coût de calcul par jeton est divisé par vingt sur un contexte d'un million de jetons, le traitement des entrées est neuf fois plus rapide que sur la génération précédente, et la génération de réponses gagne un facteur supérieur à quinze. La vitesse de production avoisine 100 jetons par seconde, environ trois fois celle de Claude Opus. Pour les développeurs et les entreprises qui cherchent à déployer des agents autonomes sans dépendre d'APIs propriétaires à coût élevé, M3 représente une option crédible et, surtout, inspecTable. MiniMax est une startup fondée à Shanghai qui opère depuis plusieurs années dans l'ombre des géants américains et de ses concurrents chinois comme Baidu ou Zhipu AI. Avec M3, elle entre directement en compétition avec Anthropic, Google et OpenAI sur le segment haut de gamme, mais avec la carte distinctive de l'ouverture des poids. Le contexte réglementaire et géopolitique autour de l'IA chinoise reste tendu, ce qui rend d'autant plus remarquable qu'une entreprise de ce pays publie un modèle en open weight à ce niveau de performance. Des validations indépendantes seront nécessaires : une partie des benchmarks ont été conduits sur l'infrastructure de MiniMax elle-même. La publication imminente des poids permettra à la communauté de vérifier ces affirmations, et les semaines qui suivent diront si M3 tient ses promesses dans des conditions réelles d'utilisation.

UEL'arrivée d'un modèle open weight performant réduit la dépendance des entreprises et développeurs européens aux APIs propriétaires américaines à coût élevé.

💬 Un million de jetons, des scores d'agent au niveau des meilleurs modèles fermés, et les poids open source dans dix jours : si tout ça se confirme, c'est une vraie gifle pour les APIs propriétaires. Le calcul change pour ceux qui veulent déployer des agents sans facturer à chaque appel. Les benchmarks sont en partie auto-déclarés, donc on attend les poids sur HuggingFace, mais là MiniMax joue dans la cour des grands pour de bon.

LLMsOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic