OutilsLatent Space6sem

1 milliard de tokens par jour, 1M lignes de code, 0% de code humain : l'ingénierie extrême d'OpenAI

Résumé IASource uniqueImpact UE

Ryan Lopopolo, ingénieur chez OpenAI au sein de l'équipe Frontier, a publié un essai remarqué sur ce qu'il appelle le "harness engineering", une approche radicale du développement logiciel entièrement délégué à des agents IA. Sur une période de cinq mois, son équipe a construit et livré un produit interne en bêta sans écrire une seule ligne de code manuellement : plus d'un million de lignes dans le dépôt, des milliers de pull requests générées par Codex, zéro code écrit par un humain, et surtout zéro relecture humaine avant les merges. Le projet a également abouti à Symphony, une bibliothèque de référence en Elixir conçue par Alex Kotliarskyi, qui orchestre un réseau massif d'agents Codex travaillant en parallèle avec des spécifications détaillées mais sans implémentation prédéfinie. Lopopolo affirme qu'il serait presque "négligent" de ne pas consommer plus d'un milliard de tokens par jour, ce qui représente environ 2 000 à 3 000 dollars de dépenses quotidiennes aux tarifs actuels.

Ce qui rend cette expérience significative, c'est le changement de paradigme qu'elle illustre : le vrai goulot d'étranglement dans le développement logiciel piloté par l'IA n'est plus la puissance de calcul ni la qualité du modèle, mais l'attention humaine. Quand un agent échouait, l'équipe ne l'encourageait pas à "réessayer", elle se demandait quelle capacité, quel contexte ou quelle structure manquait au système. Résultat : les humains ont progressivement cessé de relire du code pour se concentrer sur la construction de l'infrastructure d'observabilité, des specs, des tests et des scores de qualité qui permettent aux agents de réviser, corriger et fusionner leur propre travail. La boucle de compilation a été optimisée pour rester sous la minute, condition indispensable pour maintenir les agents productifs.

OpenAI positionne Codex comme bien plus qu'un simple assistant de code : la messagerie interne de l'entreprise, illustrée par leur campagne Super Bowl ("you can just build things"), signale une ambition claire de faire des agents de vrais coéquipiers autonomes plutôt que des copilotes. Lopopolo vient d'une trajectoire entre Snowflake, Brex, Stripe et Citadel, et travaille désormais sur le déploiement sûr d'agents à l'échelle entreprise. L'équipe Frontier représente un laboratoire vivant pour tester ce futur : un modèle d'organisation où le code est écrit pour le modèle autant que pour l'ingénieur, où les compétences, la documentation et les trackers Markdown deviennent des vecteurs pour encoder le "goût" technique directement dans le contexte de l'agent. Le harness engineering pourrait bien redéfinir ce que signifie être ingénieur logiciel dans les années à venir.

Impact France/UE

Les équipes d'ingénierie européennes pourraient être amenées à repenser leurs pratiques de développement logiciel si l'approche 'harness engineering' se démocratise au-delà d'OpenAI.

Dans nos dossiers

OpenAI Agents IA Codex

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Next INpact

La mise à jour de Codex pose les bases de la « superapp » d’OpenAI

OpenAI a livré hier une mise à jour majeure de Codex, son application dédiée au développement logiciel, disponible sur macOS depuis février 2026 et sur Windows depuis mars. Ce logiciel, qui permet aux développeurs d'utiliser un agent IA spécialisé dans la programmation via une interface graphique ou en ligne de commande, s'enrichit de capacités inédites : intégration avec n'importe quelle application Mac, déploiement de plusieurs agents en tâche de fond, navigateur web embarqué avec annotations directes sur les pages, génération de visuels d'interface via le modèle gpt-image-1.5, gestion de multiples terminaux en simultané, connexion à des environnements distants par SSH (encore en alpha), et une bibliothèque élargie à plus de 90 modules d'extension connectant Codex à des services comme Slack, Notion, GitLab ou CodeRabbit. L'application gère désormais la planification de tâches longues et conserve le contexte des conversations pour reprendre un travail sans que l'utilisateur ait à tout réexpliquer. Ce qui rend cette mise à jour stratégiquement significative dépasse la simple liste de fonctionnalités : Thibault Sottiaux, responsable de Codex chez OpenAI, a confirmé à Ars Technica que Codex est la brique fondatrice de la future « superapp » qu'OpenAI construit depuis plusieurs mois. L'objectif est de créer un point d'entrée universel capable de répondre aux besoins de tous les profils d'utilisateurs, développeurs, professionnels et grand public, en servant d'intermédiaire entre l'utilisateur et l'ensemble de son environnement numérique. Concrètement, cela signifie qu'un agent pourrait détecter une décision prise dans Slack, récupérer les détails dans Notion, vérifier l'état du code existant et proposer automatiquement une liste d'actions, sans intervention humaine pour reconstituer le contexte. Cette ambition s'inscrit dans une course intense entre les grandes plateformes d'IA à la captation de l'interface quotidienne des utilisateurs. OpenAI affronte ici directement Anthropic avec Claude Code, mais aussi Microsoft, Google et les acteurs spécialisés du développement assisté. La stratégie choisie, construire la superapp « au grand jour » en faisant évoluer un outil déjà adopté par les développeurs, présente l'avantage de valider chaque brique en conditions réelles avant d'élargir le public cible. Le navigateur intégré, par exemple, laisse entrevoir une possible mise en retrait d'Atlas, le propre navigateur qu'OpenAI développait en parallèle. L'enjeu à terme est considérable : celui qui parvient à s'imposer comme couche d'orchestration entre l'utilisateur, ses outils et ses données détient un levier d'influence considérable sur l'ensemble du flux de travail numérique.

UELes développeurs français et européens peuvent adopter dès maintenant les nouvelles fonctionnalités de Codex, mais l'impact reste indirect, sans implications réglementaires ou institutionnelles propres à l'UE.

OutilsOutil

1 source

2Le Big Data

OpenAI sort (enfin) l’extension Codex pour Chrome (mais il y a un hic)

OpenAI a lancé le 7 mai 2026 une extension Chrome pour son agent de développement Codex, compatible avec macOS et Windows. L'outil permet à Codex d'opérer directement depuis le navigateur : effectuer des recherches, remplir des formulaires, consulter des tableaux de bord, ou gérer plusieurs tâches en parallèle sur différents onglets, sans mobiliser l'interface principale. L'extension s'intègre notamment avec des plateformes comme LinkedIn, Salesforce ou Gmail, ainsi qu'avec des outils internes d'entreprise qui nécessitent une session déjà authentifiée. Les premiers retours des développeurs sont enthousiastes : l'un d'eux rapporte que Codex a automatiquement détecté et fermé des doublons pour faire passer son nombre d'onglets ouverts de 77 à 42. L'équipe d'OpenAI elle-même a qualifié l'intégration de "miracle". Un bémol notable : l'extension n'est pas encore disponible pour les utilisateurs européens et britanniques, et la version Firefox n'a pas encore été annoncée. Cette extension représente un saut qualitatif dans la manière dont les agents IA s'intègrent au travail quotidien des développeurs et des professionnels. Jusqu'ici, les agents devaient souvent contourner les limitations liées à l'authentification, incapables d'accéder aux plateformes protégées sans sessions actives. En opérant directement dans Chrome, Codex peut désormais agir là où se trouve réellement le travail, c'est-à-dire dans les interfaces web des outils métier. L'agent sélectionne automatiquement le bon mode d'action selon la tâche : il utilise un plugin dédié quand une intégration existe, bascule sur Chrome quand un accès authentifié est requis, et recourt à son navigateur interne pour les environnements locaux. Ce niveau d'autonomie contextuelle réduit considérablement la friction entre l'intention de l'utilisateur et l'exécution réelle, ce qui change la proposition de valeur des agents IA pour les usages professionnels intensifs. Codex est le pari d'OpenAI sur les agents de développement autonomes, un segment en forte compétition avec GitHub Copilot Workspace, Cursor ou encore Devin de Cognition. L'extension Chrome s'inscrit dans une stratégie plus large visant à ancrer Codex dans les workflows réels plutôt que dans des environnements sandbox isolés. Sur le plan de la confidentialité, OpenAI précise ne pas conserver l'historique complet des actions dans Chrome : seuls les éléments utilisés dans le contexte de la conversation sont enregistrés, captures d'écran, textes consultés, appels d'outils. L'entreprise recommande d'éviter de transmettre des informations très sensibles, sauf nécessité vérifiée. Le comportement de l'agent est également conditionné par le paramètre "Mémoires Codex" : activé, il peut s'appuyer sur ses souvenirs enregistrés ; désactivé, il opère sans cet historique. L'absence de disponibilité en Europe reste la principale contrainte à court terme, dans un contexte réglementaire où le RGPD complique le déploiement rapide de ce type d'outil.

UEL'extension n'est pas disponible pour les utilisateurs européens et britanniques, le RGPD compliquant son déploiement rapide dans la région.

💬 L'anecdote des 77 onglets ramenés à 42 fait sourire, mais elle dit quelque chose de vrai : pour la première fois, un agent peut opérer dans les interfaces web avec session active, sans contourner les logins. C'est le verrou qui bloquait tous les agents depuis deux ans. On attendra la disponibilité en Europe, donc.

OutilsOutil

1 source

3VentureBeat AI

OpenAI met à jour Codex pour contrôler d'autres applications, générer des images et prévisualiser des pages web

OpenAI a annoncé une mise à jour majeure de son application desktop Codex, disponible sur Mac et Windows, confirmant au passage que la plateforme compte désormais 3 millions de développeurs actifs chaque semaine. La nouveauté centrale s'appelle "Computer Use" : Codex peut désormais voir, cliquer et taper dans n'importe quelle application installée sur l'ordinateur de l'utilisateur. Andrew Ambrosino, responsable du développement de l'application Codex chez OpenAI, l'a formulé sans détour : "Codex peut réellement cliquer sur des applications, lancer des applications et saisir du texte dans des applications. Cela fonctionne avec n'importe quelle application sur votre machine." Sur macOS, cette interaction se déroule en arrière-plan pendant que l'utilisateur continue de travailler normalement, ce qui permet à plusieurs agents d'opérer simultanément. L'application intègre également un navigateur web natif pour prévisualiser les interfaces frontend, ainsi qu'un accès direct au modèle de génération d'images gpt-image-1.5, utilisable pour produire des visuels cohérents destinés à des sites web, des présentations ou même des jeux vidéo complets avec des centaines d'assets graphiques. L'enjeu est considérable pour les développeurs professionnels : Codex devient un environnement de développement logiciel unifié, couvrant l'intégralité du cycle de vie d'un projet, de la revue de pull requests GitHub à la gestion d'infrastructure distante. Concrètement, un agent peut trier des tickets JIRA ou tester une modification frontend pendant que le développeur travaille en parallèle sur autre chose. Thibault Sottiaux, directeur de Codex chez OpenAI, résume l'ambition : "Il s'agit de placer un agent très capable entre les mains des développeurs, et nous voyons maintenant que nous sommes en mesure d'étendre son action à l'ensemble de l'ordinateur." Sur Windows, la fonctionnalité de contrôle du curseur en arrière-plan n'est pas encore disponible au lancement, bien que l'application puisse déjà extraire des informations des autres applications pour les afficher à l'utilisateur. Cette évolution s'inscrit dans une course directe avec Anthropic, qui a récemment repositionné Claude avec ses vues Claude Cowork et une application desktop remaniée pour Mac et Windows. Mais Claude ne propose pas encore d'interaction simultanée avec le curseur en arrière-plan sur l'ensemble des applications système comme le fait Codex. OpenAI assume pleinement ce choix de développer ces capacités dans Codex plutôt que dans ChatGPT, son application phare grand public : Sottiaux explique que Codex est "l'agent le plus puissant" de la société, déjà ancré dans l'environnement de travail des développeurs, ce qui en fait le terrain naturel pour ces expérimentations. L'entreprise a confirmé vouloir faire de Codex une "Super App" pour les développeurs, une orientation qui, si elle tient ses promesses, pourrait redéfinir la manière dont les ingénieurs logiciels interagissent avec leurs outils au quotidien.

UELes développeurs européens peuvent adopter un environnement de développement unifié avec contrôle système natif, accélérant potentiellement l'intégration de l'IA dans leurs workflows professionnels.

OutilsOutil

1 source

4AI News

Siemens lance un système d'IA pour l'ingénierie d'automatisation

Siemens a dévoilé l'Eigen Engineering Agent, un système d'intelligence artificielle conçu pour planifier et valider des tâches d'ingénierie en automatisation industrielle. Intégré directement dans la plateforme TIA Portal (Totally Integrated Automation Engineering), qui compte plus de 600 000 utilisateurs dans le monde, cet agent autonome est capable d'interpréter des cahiers des charges, de générer du code pour automates programmables (PLC), de configurer des interfaces homme-machine (HMI) et d'affiner ses résultats jusqu'à ce qu'ils atteignent les critères de performance définis. Le système décompose les problèmes d'ingénierie en étapes séquentielles, évalue chaque résultat en boucle fermée, puis soumet la version finale à la validation d'un ingénieur humain. Selon Siemens, il exécute ces tâches deux à cinq fois plus vite que les workflows manuels équivalents. Des pilotes ont été menés auprès de plus de 100 entreprises dans 19 pays, impliquant notamment ANDRITZ Metals, CASMT et Prism Systems. Prism Systems a utilisé l'outil pour générer et importer du code SCL (Structured Control Language), tandis que CASMT l'a appliqué à la configuration de dispositifs, la génération de code et la visualisation HMI dans des lignes de production, réduisant ainsi les transferts entre spécialistes et les délais de livraison. L'Eigen Engineering Agent est disponible au sein du portfolio Xcelerator de Siemens. L'enjeu est considérable pour un secteur industriel sous pression. Les estimations du marché prévoient un déficit mondial pouvant atteindre sept millions de travailleurs dans la fabrication d'ici 2030, avec environ un poste d'ingénieur sur cinq actuellement non pourvu dans certains secteurs. Un outil capable d'automatiser des tâches d'ingénierie complexes et répétitives sans sacrifier la précision représente donc une réponse directe à cette pénurie structurelle. Pour les industriels, cela signifie concrètement des cycles de développement raccourcis, moins de dépendance à des spécialistes rares, et la possibilité d'intégrer des environnements hérités ou non documentés grâce à la capacité du système à lire les hiérarchies de contrôle et les dépendances de composants existants. Cette annonce s'inscrit dans une stratégie d'investissement massive de Siemens dans l'IA industrielle, matérialisée par un engagement d'un milliard d'euros annoncé précédemment. Le groupe allemand mobilise aujourd'hui plus de 1 500 spécialistes en IA et détient plus de 2 000 familles de brevets liés à l'IA à l'échelle mondiale. Le lancement de l'Eigen Engineering Agent illustre la transition du secteur industriel vers des systèmes d'IA agentiques, capables non plus seulement d'assister, mais d'exécuter des workflows complets de bout en bout. Les déploiements initiaux se concentrent sur l'ingénierie d'automatisation, mais Siemens indique que l'architecture est conçue pour s'étendre à d'autres segments de la chaîne de valeur industrielle, ouvrant la voie à une automatisation plus large des processus d'ingénierie dans les usines connectées.

UESiemens, groupe industriel allemand de référence en Europe, déploie cet agent directement dans les usines manufacturières européennes confrontées à une pénurie structurelle d'ingénieurs en automatisation, avec un potentiel de réduction des délais de livraison et de la dépendance aux spécialistes rares dans le tissu industriel français et européen.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour