Le GPT-5.5 d'OpenAI propulse Codex sur…

GPT-5.5 : OpenAI et NVIDIA scellent un partenariat pour la prochaine vague d’IA

44

1Le Big Data

GPT-5.5 : OpenAI et NVIDIA scellent un partenariat pour la prochaine vague d’IA

OpenAI et NVIDIA ont officialisé en avril 2026 un partenariat approfondi autour de GPT-5.5, le dernier grand modèle d'OpenAI déployé sur les infrastructures GB200 NVL72 de NVIDIA. Dès le lancement, plus de 10 000 employés de NVIDIA utilisent GPT-5.5 au quotidien, notamment via Codex, l'agent de développement logiciel d'OpenAI capable de transformer des instructions en langage naturel en actions concrètes sur des bases de code complexes. Les chiffres avancés sont frappants : un gain de débit multiplié par 50 et une réduction des coûts par jeton de l'ordre de 35 fois par rapport aux configurations précédentes. Chez NVIDIA, les cycles de débogage qui prenaient plusieurs jours se ramènent désormais à quelques heures, et des expérimentations autrefois longues de plusieurs semaines aboutissent maintenant en une seule nuit. Ces résultats illustrent un tournant dans l'adoption de l'IA générative en entreprise : la question n'est plus uniquement celle des capacités du modèle, mais de sa viabilité économique et opérationnelle à grande échelle. La réduction drastique des coûts d'inférence rend envisageable le déploiement d'agents IA sur l'ensemble des équipes techniques, et non plus seulement dans des projets pilotes isolés. L'impact dépasse le seul développement logiciel : les agents pilotés par GPT-5.5 interviennent désormais dans l'analyse, la résolution de problèmes et la génération d'idées, touchant le travail intellectuel dans sa globalité. Pour les directions techniques comme pour les décideurs métiers, c'est le signe que ces outils ont franchi le seuil de la maturité industrielle. Ce partenariat s'inscrit dans une relation qui remonte à 2016, lorsque NVIDIA avait livré à OpenAI l'un de ses premiers supercalculateurs DGX-1. Depuis dix ans, les deux entreprises co-construisent une partie essentielle de la chaîne de valeur de l'IA, OpenAI apportant les modèles et NVIDIA l'infrastructure d'inférence. Sur la question de la sécurité, longtemps présentée comme le principal frein à l'adoption en entreprise, le déploiement de Codex intègre des réponses architecturales concrètes : chaque agent opère dans un environnement isolé via des machines virtuelles sécurisées, les accès aux systèmes critiques sont limités en lecture seule, et une politique stricte de non-rétention des données est appliquée. Jensen Huang, PDG de NVIDIA, résume l'ambition commune en affirmant qu'on entre « pleinement dans l'ère de l'IA », une formulation qui traduit moins un effet d'annonce qu'un constat opérationnel : pour des milliers d'ingénieurs, l'IA agentique est déjà une réalité quotidienne.

UELa réduction des coûts d'inférence liée aux nouvelles générations de hardware IA pourrait faciliter l'adoption d'agents IA à grande échelle dans les entreprises européennes, sans impact réglementaire ou institutionnel direct.

LLMsActu

1 source

OpenAI travaille-t-il déjà sur GPT-5.5 ? Une fuite sème le doute

46

2Le Big Data

OpenAI travaille-t-il déjà sur GPT-5.5 ? Une fuite sème le doute

Le 22 avril 2026, des utilisateurs de Codex, l'environnement de développement assisté d'OpenAI, ont brièvement aperçu dans un sélecteur de modèles interne des noms inconnus : GPT-5.5, oai-2.1, et plusieurs variantes expérimentales non annoncées. L'accès a disparu en quelques minutes, mais les captures d'écran avaient déjà circulé sur X et dans les forums de développeurs. La fuite s'est produite dans un contexte particulier : OpenAI menait simultanément un test élargi dans Codex, confirmé par Rohan Varma, ingénieur de l'entreprise, touchant environ 100 % des utilisateurs, tous abonnements confondus, gratuits et payants. Sam Altman, PDG d'OpenAI, n'a pas démenti les spéculations autour d'un lancement imminent. Interrogé par un utilisateur évoquant une sortie possible dès le jeudi suivant, il a répondu par un simple emoji, sans démentir ni confirmer. Au-delà de l'anecdote, les retours techniques des développeurs ayant eu accès au modèle pendant ce court intervalle sont frappants. Plusieurs signalent une résolution de bugs front-end en quelques minutes là où GPT-4o nécessitait plusieurs heures. D'autres notent une meilleure cohérence dans la génération de code HTML et Tailwind CSS. Si ces observations restent parcellaires et non vérifiables à grande échelle, elles alimentent l'idée qu'OpenAI prépare un saut qualitatif significatif, pas seulement une mise à jour incrémentale. Pour l'industrie du développement logiciel assisté par IA, un modèle nettement plus rapide et fiable sur les tâches de code changerait concrètement les flux de travail quotidiens de millions de développeurs. La mise à disposition sur tous les plans tarifaires, si elle se confirme, représenterait également un changement de stratégie commerciale notable par rapport à la segmentation actuelle. Cette fuite s'inscrit dans une séquence d'annonces très dense côté OpenAI : ChatGPT Images 2.0 venait tout juste d'être déployé, renforçant la génération d'images précises directement dans le chat. Le rythme de publication soutenu d'OpenAI répond à une pression concurrentielle extrême. Anthropic a simultanément modifié son offre Claude Code en limitant l'accès pour certains abonnés Pro, tandis que Google, Meta et Mistral multiplient eux aussi les sorties. Dans ce contexte de course aux annonces, la communication ambiguë d'Altman, entre silence et émoji, est devenue une méthode rodée pour entretenir l'attention sans s'engager officiellement. GPT-5.5 pourrait être un modèle intermédiaire entre GPT-5 et une future version majeure, ou simplement un nom de test interne jamais destiné au public. La réponse pourrait venir dans les jours suivants, si OpenAI tient le calendrier informel que son PDG semble avoir laissé entrevoir.

UELa cadence de sorties accélérée d'OpenAI accentue la pression concurrentielle sur les acteurs européens, en particulier Mistral, cité dans l'article comme rival direct dans la course aux annonces de modèles.

LLMsOpinion

1 source

GPT-5.5 et la super-application OpenAI Codex

52

3Latent Space

GPT-5.5 et la super-application OpenAI Codex

OpenAI a lancé GPT-5.5 le 22 avril 2026, une semaine après la sortie de Claude Opus 4.7 par Anthropic. Le modèle est présenté comme "une nouvelle classe d'intelligence pour le travail réel" et déployé progressivement sur ChatGPT et Codex, l'accès API étant temporairement limité en attendant des vérifications de sécurité supplémentaires. Les benchmarks publiés sont impressionnants : 82,7% sur Terminal-Bench 2.0, 58,6% sur SWE-Bench Pro, 84,9% sur GDPval, 78,7% sur OSWorld-Verified et 84,4% sur BrowseComp. Le tarif API est fixé à 5$/30$ par million de tokens en entrée/sortie pour la version standard, et 30$/180$ pour la version Pro. Selon Artificial Analysis, GPT-5.5 en configuration medium atteint le même niveau que Claude Opus 4.7 au maximum sur leur Intelligence Index, mais à un quart du coût : environ 1 200 dollars contre 4 800. La fenêtre de contexte atteint 1 million de tokens en API, et Sam Altman souligne que le modèle consomme moins de tokens par tâche que son prédécesseur GPT-5.4. Ce lancement ne se résume pas à une simple mise à jour de modèle. GPT-5.5 marque un pivot stratégique d'OpenAI vers l'inférence agentique longue durée et l'efficacité économique, deux dimensions qui comptent davantage pour les entreprises que les scores bruts sur benchmarks académiques. La capacité à exécuter des tâches complexes avec moins d'interventions humaines change concrètement la proposition de valeur pour les développeurs et les équipes techniques. En parallèle, OpenAI a profondément étendu Codex : contrôle du navigateur, intégration avec Google Sheets, Slides, Docs et PDFs, dictée à l'échelle du système d'exploitation, et un mode de revue automatique reposant sur un agent secondaire dit "gardien" qui réduit le nombre de validations nécessaires sur les tâches longues. Codex n'est plus un outil de coding assisté : il devient un agent capable de naviguer dans des interfaces web, capturer des captures d'écran, itérer jusqu'à complétion, et traiter des flux de travail qui couvrent l'assurance qualité, la bureautique et la construction d'applications. Ce lancement s'inscrit dans une course frontale entre OpenAI, Anthropic et Google, dont Gemini 3.1 Pro Preview atteint un niveau comparable à GPT-5.5 à environ 900 dollars selon Artificial Analysis. OpenAI a co-conçu le modèle avec les systèmes NVIDIA GB200/300, et affirme que GPT-5.5 a contribué à améliorer sa propre infrastructure d'inférence, une affirmation qui illustre la direction que prend la compagnie. Sam Altman positionne désormais explicitement OpenAI comme une "entreprise d'inférence IA", signalant que la compétition ne se joue plus seulement sur la qualité des modèles mais sur leur coût d'exploitation à l'échelle. La décision d'absorber Prism et de faire de Codex la base d'une stratégie de superapp unifiée suggère qu'OpenAI cherche à verrouiller les workflows professionnels dans son écosystème, bien au-delà du simple chat.

UELes développeurs et entreprises européens bénéficient d'un modèle agentique de niveau SOTA à coût sensiblement réduit, ce qui modifie concrètement les arbitrages de déploiement IA à grande échelle sur le marché européen.

💬 Le ratio coût/perf, c'est là que ça se joue. GPT-5.5 medium au niveau d'Opus 4.7 max pour un quart du prix, les équipes qui hésitaient vont trancher vite. Et ce pivot vers une superapp avec Codex en moteur, c'est plus ambitieux qu'il n'y paraît : si l'agent gardien tient vraiment sur des tâches longues, OpenAI verrouille les workflows pro bien plus efficacement qu'avec n'importe quel score sur un benchmark.

LLMsOpinion

1 source

51

4Latent Space

GPT-5.6 Sol/Terra/Luna d'OpenAI arrive, Codex devient une superapp ChatGPT

OpenAI a dévoilé le 9 juillet 2026 une nouvelle famille de modèles baptisée GPT-5.6, déclinée en trois tailles : Sol, Terra et Luna, du nom du Soleil, de la Terre et de la Lune. L'entreprise introduit aussi un nouveau niveau d'effort de raisonnement appelé "ultra", qui coordonne par défaut quatre agents en parallèle pour accélérer la résolution de tâches complexes, en plus du niveau "max" déjà existant qui laisse au modèle plus de temps que le niveau "xhigh" pour explorer des solutions et vérifier son travail. Selon OpenAI, Terra se situe juste au-dessus de Claude Fable 5 et Luna dépasse Claude Opus 4.8, tout en tournant environ trois fois plus vite, avec deux fois moins de tokens de sortie et un coût quatre fois inférieur. Les nouveaux modèles établissent aussi des records sur les benchmarks Terminal-Bench 2.1 et DeepSWE, qui évaluent respectivement les tâches en ligne de commande et l'ingénierie logicielle sur le long terme. Sol atteint un score inédit de 53,6 sur l'évaluation Agents' Last Exam, devançant Claude Fable 5 adaptive de 13,1 points. Côté tarifs, l'accès via l'API coûte 5 et 30 dollars par million de tokens en entrée et sortie pour Sol, 2,5 et 15 dollars pour Terra, 1 et 6 dollars pour Luna, avec pour la première fois une tarification pour l'écriture en cache et une réduction de 90% conservée pour la lecture en cache. Les abonnés Plus, Pro, Business et Enterprise de ChatGPT accèdent à Sol dès le niveau d'effort moyen, tandis que Pro et Enterprise peuvent choisir GPT-5.6 Pro pour les tâches les plus exigeantes. Ce lancement s'accompagne d'un remaniement de toute la gamme de produits d'OpenAI. L'entreprise a introduit ChatGPT Work, une nouvelle application de bureau fusionnant Codex et ChatGPT, une version bêta de Sites, l'appel programmatique d'outils, ainsi qu'une fonctionnalité multi-agents en bêta dans l'API Responses. Pour le PDG Sam Altman, GPT-5.6 est "sans doute le meilleur modèle que nous ayons jamais produit", et Sol représente selon lui "une avancée majeure en matière de coût par tâche" pour les entreprises. Le président Greg Brockman a de son côté résumé l'objectif de la maison comme la recherche du "meilleur prix pour chaque niveau de performance visé", combiné à un plafond de capacité toujours plus élevé. Ces gains d'efficacité comptent particulièrement pour les entreprises qui déploient l'IA à grande échelle sur des tâches d'agents, de codage ou de génération de documents, où le rapport coût-performance détermine directement la rentabilité des projets. La fusion de Codex et ChatGPT dans une seule application confirme aussi une stratégie de "superapp" évoquée par les observateurs dès avril, dernière étape avant que la question du navigateur agentique ne soit tranchée. Cette annonce intervient après une prévisualisation de GPT-5.6 quelques semaines plus tôt, dans l'attente d'une validation réglementaire mentionnée par OpenAI. Elle survient aussi le même jour que le lancement, par les Meta Superintelligence Labs, du modèle Muse Spark 1.1, jugé étonnamment compétitif et intégré pour la première fois à l'API Meta Model, un signe de confiance de Meta envers ses propres modèles. La compétition entre laboratoires d'IA générative s'intensifie ainsi sur deux fronts simultanés : la performance brute sur des benchmarks d'agents et de programmation, et l'efficacité économique par tâche accomplie, un critère de plus en plus déterminant pour les entreprises clientes. OpenAI mise sur cette structure à trois modèles pour couvrir tout le spectre des besoins, de l'usage ponctuel à très haute exigence avec Sol jusqu'au traitement massif et rapide avec Luna, en passant par Terra comme compromis intermédiaire. Les mois à venir devraient montrer si ces gains de performance et de coût se traduisent en adoption réelle chez les développeurs et les entreprises, et si Anthropic ou Google répondent avec leurs propres annonces face à cette offensive tarifaire et technique d'OpenAI.

💬 Le vrai chiffre à retenir, c'est pas le score sur Agents' Last Exam, c'est le coût quatre fois inférieur pour une vitesse trois fois supérieure. Pour les boîtes qui font tourner des agents à grande échelle, c'est ce ratio-là qui décide si le projet est rentable, pas la médaille du benchmark du mois. Et la fusion de Codex dans ChatGPT confirme ce que tout le monde sentait venir depuis avril : OpenAI construit sa superapp avant que la guerre du navigateur agentique n'éclate pour de bon.

LLMsActu

1 source

Le GPT-5.5 d'OpenAI propulse Codex sur l'infrastructure NVIDIA, déjà utilisée en interne

À lire aussi

GPT-5.5 : OpenAI et NVIDIA scellent un partenariat pour la prochaine vague d’IA

OpenAI travaille-t-il déjà sur GPT-5.5 ? Une fuite sème le doute

GPT-5.5 et la super-application OpenAI Codex

GPT-5.6 Sol/Terra/Luna d'OpenAI arrive, Codex devient une superapp ChatGPT