
1 milliard de tokens par jour, 1M lignes de code, 0% de code humain : l'ingénierie extrême d'OpenAI

Ryan Lopopolo, ingénieur chez OpenAI au sein de l'équipe Frontier, a publié un essai remarqué sur ce qu'il appelle le "harness engineering", une approche radicale du développement logiciel entièrement délégué à des agents IA. Sur une période de cinq mois, son équipe a construit et livré un produit interne en bêta sans écrire une seule ligne de code manuellement : plus d'un million de lignes dans le dépôt, des milliers de pull requests générées par Codex, zéro code écrit par un humain, et surtout zéro relecture humaine avant les merges. Le projet a également abouti à Symphony, une bibliothèque de référence en Elixir conçue par Alex Kotliarskyi, qui orchestre un réseau massif d'agents Codex travaillant en parallèle avec des spécifications détaillées mais sans implémentation prédéfinie. Lopopolo affirme qu'il serait presque "négligent" de ne pas consommer plus d'un milliard de tokens par jour, ce qui représente environ 2 000 à 3 000 dollars de dépenses quotidiennes aux tarifs actuels.
Ce qui rend cette expérience significative, c'est le changement de paradigme qu'elle illustre : le vrai goulot d'étranglement dans le développement logiciel piloté par l'IA n'est plus la puissance de calcul ni la qualité du modèle, mais l'attention humaine. Quand un agent échouait, l'équipe ne l'encourageait pas à "réessayer", elle se demandait quelle capacité, quel contexte ou quelle structure manquait au système. Résultat : les humains ont progressivement cessé de relire du code pour se concentrer sur la construction de l'infrastructure d'observabilité, des specs, des tests et des scores de qualité qui permettent aux agents de réviser, corriger et fusionner leur propre travail. La boucle de compilation a été optimisée pour rester sous la minute, condition indispensable pour maintenir les agents productifs.
OpenAI positionne Codex comme bien plus qu'un simple assistant de code : la messagerie interne de l'entreprise, illustrée par leur campagne Super Bowl ("you can just build things"), signale une ambition claire de faire des agents de vrais coéquipiers autonomes plutôt que des copilotes. Lopopolo vient d'une trajectoire entre Snowflake, Brex, Stripe et Citadel, et travaille désormais sur le déploiement sûr d'agents à l'échelle entreprise. L'équipe Frontier représente un laboratoire vivant pour tester ce futur : un modèle d'organisation où le code est écrit pour le modèle autant que pour l'ingénieur, où les compétences, la documentation et les trackers Markdown deviennent des vecteurs pour encoder le "goût" technique directement dans le contexte de l'agent. Le harness engineering pourrait bien redéfinir ce que signifie être ingénieur logiciel dans les années à venir.
Les équipes d'ingénierie européennes pourraient être amenées à repenser leurs pratiques de développement logiciel si l'approche 'harness engineering' se démocratise au-delà d'OpenAI.



