LLMsLe Big Data · 23 avr. 2026, 21:54· 2 min de lecture

Les rumeurs disaient vrai : OpenAI lâche GPT-5.5, et ça change pas mal de choses

OpenAI a officiellement lancé GPT-5.5 le 23 avril 2026, confirmant ainsi les rumeurs qui circulaient depuis plusieurs jours. Sam Altman a annoncé le modèle directement sur X, déclarant simplement qu'il "l'apprécie beaucoup", une formulation sobre pour un lancement que l'entreprise présente comme un véritable saut technologique. Le modèle est immédiatement disponible dans ChatGPT pour les abonnés Plus, Pro et Business sous la dénomination GPT-5.5 Thinking, avec une version GPT-5.5 Pro réservée aux traitements de données massifs exigeant une précision maximale. Les développeurs accédant via Codex bénéficient quant à eux d'une fenêtre de contexte de 400 000 tokens, suffisante pour ingérer des projets entiers en une seule passe.

Ce qui distingue fondamentalement GPT-5.5 de ses prédécesseurs, c'est son autonomie opérationnelle. Là où les modèles précédents attendaient une instruction à chaque étape, celui-ci est conçu pour piloter des tâches complexes de bout en bout, en analysant, planifiant et utilisant les logiciels disponibles sans intervention humaine continue. En développement logiciel, cela se traduit concrètement par une capacité à résoudre des projets GitHub entiers en une seule passe, à déboguer de manière autonome en identifiant l'origine d'une faille là où un développeur passerait plusieurs heures, et à anticiper les effets de bord sur le reste du système. L'enthousiasme dans l'industrie est tel qu'un ingénieur chez NVIDIA a comparé l'idée de perdre l'accès au modèle à une amputation physique. Parallèlement, GPT-5.5 maintient une latence comparable à GPT-5.4 tout en consommant moins de tokens pour produire des résultats de meilleure qualité, ce qui améliore directement l'équation coût-performance pour les usages intensifs.

Ce lancement s'inscrit dans une course à l'IA générative où chaque acteur cherche à franchir le palier de l'agent autonome, capable d'agir sur un ordinateur plutôt que de simplement répondre à des questions. OpenAI positionnne GPT-5.5 explicitement comme une "nouvelle classe d'intelligence pour le travail réel", ce qui signale un pivot stratégique vers les cas d'usage professionnels et les pipelines agentiques, au détriment du chatbot conversationnel grand public. Google, Anthropic et Meta s'engagent sur le même terrain avec leurs propres modèles capables d'utiliser des outils et d'exécuter des tâches multi-étapes. La disponibilité immédiate dans Codex suggère qu'OpenAI mise sur les développeurs comme vecteur d'adoption prioritaire, une population qui teste vite, publie ses benchmarks et influence ensuite les décisions d'achat des entreprises. La prochaine étape logique sera l'intégration plus profonde dans des environnements d'entreprise, avec des questions de sécurité, de traçabilité et de gouvernance que GPT-5.5 n'adresse pas encore publiquement.

Impact France/UE

Les développeurs et entreprises européens utilisant l'API OpenAI via Codex peuvent immédiatement tester les capacités agentiques de GPT-5.5, ce qui soulève des questions de gouvernance et de traçabilité directement pertinentes dans le contexte du règlement européen sur l'IA.

Dans nos dossiers

GPT-5.5 OpenAI Codex Anthropic

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Le Big Data

Google I/O 2026 : Les rumeurs disaient vrai, Gemini 3.5 débarque et va tout balayer

Lors de la conférence Google I/O du 19 mai 2026, le géant de Mountain View a officiellement lancé la série Gemini 3.5, avec en tête de cortège le modèle Flash 3.5, disponible immédiatement dans le monde entier. Présenté par le PDG Sundar Pichai comme le modèle le plus puissant jamais développé par Google, Gemini 3.5 Flash est désormais le modèle par défaut dans l'application Gemini, dans le mode IA de Google Search, ainsi que dans Google AI Studio et Android Studio via l'API Gemini. Sur les benchmarks publiés par l'entreprise, il atteint 76,2 % sur Terminal-Bench 2.1 contre 70,3 % pour Gemini 3.1 Pro, et 1656 points sur GDPval-AA Elo en tâches agentiques contre 1314 pour son prédécesseur. Google affirme également qu'il génère jusqu'à quatre fois plus de tokens par seconde que des modèles concurrents comparables, tout en coûtant deux à trois fois moins cher dans certains scénarios. Ce lancement redistribue les cartes dans la course aux modèles de langage. Un modèle dit "Flash", habituellement positionné sur la vitesse et l'économie plutôt que la performance brute, surpasse ici le modèle Pro de la génération précédente sur presque tous les tests significatifs, y compris le codage et les tâches agentiques. Google revendique même des performances proches de Claude Opus 4.7 Max d'Anthropic sur l'Artificial Analysis Intelligence Index, tout en étant environ douze fois plus rapide. Pour les développeurs et les entreprises qui construisent des applications sur des API LLM, ce rapport performance-coût représente un argument commercial direct : des capacités de niveau frontier sans la facture associée. Google a par ailleurs annoncé que Gemini 3.5 a été conçu dans le respect de son Frontier Safety Framework, avec des outils d'analyse interprétative capables d'examiner les mécanismes de raisonnement internes du modèle avant chaque réponse. Ce lancement s'inscrit dans une dynamique d'accélération tous azimuts, après que Google a progressivement regagné du terrain sur OpenAI et Anthropic depuis fin 2024. L'autre annonce majeure de l'I/O 2026 est Gemini Spark, un agent IA personnel conçu pour fonctionner en continu sur Google Cloud, natif dans l'écosystème Workspace, Gmail, Docs, Sheets, Slides, et activable simplement par e-mail. Sur mobile, la fonction Android Halo permettra de suivre en temps réel les actions de l'agent. Selon Josh Woodward, vice-président de Google Labs, Spark peut déjà rédiger automatiquement rapports et brouillons d'e-mails à partir de données issues de documents et feuilles de calcul, et certaines PME l'utiliseraient déjà en production. La convergence entre un modèle frontier accessible, une infrastructure cloud intégrée et un agent personnel persistant dessine la stratégie Google pour 2026 : verrouiller l'utilisateur dans un écosystème IA complet avant que la concurrence ne se consolide.

UEGemini 3.5 Flash est immédiatement disponible via l'API Gemini et Google AI Studio, offrant aux développeurs et entreprises européennes un modèle frontier moins cher et plus rapide susceptible d'accélérer l'adoption IA dans les PME qui s'appuient sur l'écosystème Google Workspace.

💬 Quand le Flash dépasse le Pro de la génération d'avant sur presque tous les benchmarks, c'est que la taxonomie des modèles est en train d'exploser, et c'est une bonne nouvelle pour les devs. Quatre fois plus rapide, deux à trois fois moins cher, performances frontier : difficile d'ignorer ça si tu construis quelque chose sur API. Mais l'annonce qui m'intéresse vraiment, c'est Spark : Google ne vend pas un modèle, il vend une serrure.

LLMsOpinion

1 source

2Le Big Data

OpenAI met à jour GPT-5.5 Instant : voici qu’est-ce que ça change

OpenAI a déployé le 24 juin 2026 une nouvelle mise à jour de GPT-5.5 Instant, le modèle par défaut de ChatGPT. Il s'agit de la troisième évolution majeure depuis le lancement du modèle le 5 mai 2026, après des versions précédentes axées sur la réduction des erreurs et la clarté des réponses. Cette fois, l'entreprise vise explicitement à rendre les échanges "plus fun" et plus naturels. La mise à jour est d'abord accessible aux abonnés payants, avant un déploiement progressif vers les utilisateurs de la version gratuite. Concrètement, le modèle améliore sa capacité à identifier l'intention derrière une question, à maintenir la continuité d'une conversation sur plusieurs échanges, à gérer des requêtes contenant plusieurs contraintes simultanées, et à intégrer les corrections apportées par l'utilisateur sans simplement répéter la même réponse. Ces ajustements ciblent les usages les plus fréquents de ChatGPT, qui ne sont pas les démonstrations techniques mais les besoins du quotidien : planifier un voyage, comparer des produits, rédiger un message délicat ou clarifier ses idées. Pour des dizaines de millions d'utilisateurs qui interagissent avec ChatGPT plusieurs fois par semaine, une meilleure compréhension du contexte et des contraintes change directement la qualité de l'expérience. Le fait que le modèle réagisse mieux aux corrections est particulièrement significatif : cela réduit les allers-retours frustrants où l'IA ignore les précisions apportées et répète son raisonnement initial, un défaut régulièrement reproché aux assistants conversationnels. Derrière ces améliorations se profile une architecture nouvelle baptisée "Dreaming", qui permettrait au modèle de construire progressivement un profil de l'utilisateur au fil des conversations pour mieux adapter ses réponses. OpenAI s'engage depuis le début 2026 dans une cadence de mises à jour soutenue sur GPT-5.5 Instant, son modèle le plus utilisé, ce qui reflète une stratégie claire : maintenir ChatGPT comme standard de référence face à la concurrence directe de Google Gemini, Anthropic Claude et des assistants intégrés dans les systèmes d'exploitation comme Copilot de Microsoft. La bataille ne se joue plus uniquement sur les benchmarks de raisonnement, mais sur la fluidité perçue au quotidien, un terrain où la différence entre modèles devient de plus en plus difficile à mesurer objectivement pour l'utilisateur final.

LLMsOpinion

1 source

3Latent Space

OpenAI réinitialise plusieurs fois les quotas après un lancement mouvementé de GPT-5.6

OpenAI a déployé cette semaine sa nouvelle famille de modèles GPT-5.6, remplaçant l'ancien sélecteur unique par une architecture à trois niveaux baptisés Luna, Terra et Sol, chacun décliné en plusieurs niveaux d'effort de calcul. Résultat pour les utilisateurs de l'API : jusqu'à 36 variantes différentes du modèle, même si la plupart des usages courants peuvent se limiter à trois configurations de base. Selon des ingénieurs d'OpenAI, le mode Max fait passer un seul modèle plus de temps sur un problème complexe, tandis que le mode Ultra répartit le travail entre plusieurs sous-agents en parallèle ; les réglages d'effort de la version 5.5 ne sont d'ailleurs pas directement comparables à ceux de la 5.6. Le lancement s'est toutefois révélé plus chaotique que prévu : la nouvelle séparation entre ChatGPT Work et Codex a dérouté de nombreux utilisateurs, rendant l'accès aux conversations et projets plus difficile, avec une consommation de quota bien plus rapide qu'anticipé. Face aux critiques, OpenAI a réinitialisé plusieurs fois les limites d'usage et reconnu publiquement que les réglages par défaut poussaient vers des configurations trop coûteuses, promettant de restaurer une navigation plus familière. Cette refonte a des conséquences concrètes pour les développeurs et les entreprises qui budgétisent leurs usages d'IA. Les premiers résultats de benchmarks montrent un GPT-5.6 particulièrement performant en codage agentique, en présentation et sur certaines tâches scientifiques : il obtient par exemple la première place ex aequo sur Code Arena Frontend, à un coût environ deux fois inférieur à Claude Fable 5, ainsi qu'un bond d'environ 500 points sur l'indice de présentation AA-Briefcase par rapport à GPT-5.5. Mais le modèle n'est pas dominant partout, avec des problèmes signalés de suivi d'instructions, d'efficacité inégale en tokens et des inquiétudes sur sa vulnérabilité au jailbreak. Un point opérationnel préoccupant a également émergé : les sous-agents générés automatiquement héritent des réglages premium du modèle parent, ce qui peut vider un quota beaucoup plus vite que prévu, sans que l'utilisateur puisse choisir le modèle ou le niveau d'effort de ces agents. Au-delà des chiffres, ce lancement illustre un tournant stratégique chez OpenAI : la version Sol s'illustre surtout comme planificateur et orchestrateur capable de mobiliser des sous-agents pour des tâches complexes, notamment dans l'automatisation d'interfaces graphiques ou des logiciels comme Blender. OpenAI mise sur ChatGPT Work pour amener ces capacités d'agents jusqu'aux usages mobiles grand public. Cette évolution s'inscrit dans une tendance plus large du secteur où la qualité brute du modèle compte de moins en moins face à la sophistication du système d'orchestration qui l'entoure, un terrain où la concurrence avec Anthropic et d'autres acteurs va continuer de s'intensifier dans les prochains mois.

💬 36 variantes d'un même modèle, avec un quota qui fond sur les sous-agents sans que tu puisses rien régler, c'est le signe qu'OpenAI a sacrifié la lisibilité sur l'autel de la puissance. Sur le papier les scores sont costauds, première place ex aequo sur Code Arena Frontend à moitié prix de Claude Fable 5, mais ce lancement chaotique confirme surtout un basculement plus large du secteur : la qualité brute du modèle compte de moins en moins face à la sophistication de l'orchestration qui l'entoure. Reste à voir si Sol tient la promesse d'agent capable de piloter tes logiciels, parce que pour l'instant c'est surtout le portefeuille des devs qui pilote tout seul.

LLMsActu

1 source

4Le Big Data

GPT-5.5 : OpenAI révèle comment l’IA Spud va tout changer dans ChatGPT

OpenAI s'apprête à lancer GPT-5.5, propulsé par un nouveau modèle de fondation baptisé en interne "Spud". L'annonce a été faite par Greg Brockman, président d'OpenAI, lors d'une intervention dans le podcast Big Technology début avril 2026. Spud n'est pas une mise à jour incrémentale : il s'agit d'une architecture de pré-entraînement entièrement repensée, fruit de deux ans de recherche intensive dans les laboratoires d'OpenAI. Ce modèle de base servira de fondation à toutes les futures déclinaisons de ChatGPT, remplaçant les socles précédents par une infrastructure centralisée pensée pour des capacités de calcul et de raisonnement significativement supérieures. Brockman décrit ce saut comme un "big model smell" — une sensation perceptible que le modèle est notablement plus intelligent et s'adapte mieux aux intentions de l'utilisateur dès la première requête. L'impact concret se situe d'abord dans la qualité des interactions quotidiennes. Là où les utilisateurs actuels de ChatGPT doivent parfois reformuler plusieurs fois une demande pour obtenir la réponse souhaitée, Spud vise à saisir l'intention sans friction. Pour les professionnels qui utilisent l'IA pour de la rédaction, de la programmation ou de la prise de décision, cette réduction du "coût cognitif" de l'interaction représente un gain de productivité direct. Les entreprises intégrant ChatGPT dans leurs workflows pourront s'appuyer sur un modèle plus fiable et moins imprévisible. Au-delà des usages courants, c'est aussi la porte d'entrée vers des applications d'automatisation plus complexes, où la précision de compréhension du langage naturel est critique. Ce lancement s'inscrit dans une course technologique qui s'accélère. OpenAI fait face à une concurrence intense de Google avec Gemini, d'Anthropic avec Claude, et d'acteurs émergents comme xAI. Dans ce contexte, Spud est présenté par Brockman non pas seulement comme un produit commercial, mais comme une étape sur la trajectoire vers l'intelligence artificielle générale — une IA capable d'opérer sur des domaines variés avec la flexibilité d'un raisonnement humain. Si cette vision reste ambitieuse, la centralisation de la recherche dans un seul modèle de fondation robuste est une stratégie délibérée pour accélérer le rythme des itérations futures. Les concurrents devront désormais répondre non seulement à GPT-5.5, mais à toute une lignée de modèles qui en découleront, rendant la fenêtre de rattrapage plus étroite que jamais.

UELes développeurs et entreprises européens intégrant ChatGPT dans leurs workflows bénéficieront d'un modèle potentiellement plus précis, mais aucun impact réglementaire ou institutionnel direct sur la France ou l'UE n'est mentionné.

LLMsOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic