Les calculs derrière la puce Jalapeño d'OpenAI
OpenAI a officiellement présenté le Jalapeño, son premier processeur maison baptisé "Intelligence Processor", développé en collaboration avec Broadcom. Conçu spécifiquement pour l'inférence de grands modèles de langage (LLM) plutôt que pour des charges de travail IA généralistes, ce circuit intégré (ASIC) est fabriqué par TSMC à Taïwan, tandis que Celestica assemble les cartes et systèmes de racks. OpenAI a fourni l'architecture de base, Broadcom s'est chargé de l'ingénierie silicium et de l'intégration réseau haute performance, notamment via le switch Tomahawk. Selon la société, des échantillons préliminaires font déjà tourner des charges de production, dont un modèle inédit GPT-5.3-Codex-Spark, à la fréquence et la consommation électrique cibles.
La motivation est avant tout financière. Faire fonctionner ChatGPT a coûté 8,4 milliards de dollars en 2025 ; avec 900 millions d'utilisateurs hebdomadaires, la facture devrait atteindre 14 milliards cette année. Sur les huit prochaines années, OpenAI s'est engagé à dépenser environ 1 400 milliards de dollars en puissance de calcul, pour une entreprise qui génère actuellement 25 milliards de revenus annuels. Nvidia empoche environ 75 % de marge sur ses GPU haut de gamme, là où OpenAI ne conserve que 33 cents par dollar de chiffre d'affaires après charges opérationnelles. Concevoir son propre silicium, optimisé pour minimiser les mouvements de données et maximiser l'utilisation réelle des processeurs, est le levier le plus direct pour desserrer cet étau. En couvrant toute la chaîne, de l'architecture puce aux noyaux logiciels en passant par la gestion mémoire et le routage réseau, OpenAI se transforme d'une couche logicielle pure en une entreprise d'infrastructure verticalement intégrée, sur le modèle d'Apple avec ses puces M et iOS.
OpenAI entre néanmoins sur un terrain où ses concurrents ont une avance considérable. Google déploie ses TPU depuis 2015 et contrôle environ un quart de la capacité mondiale de calcul IA hors Nvidia. Amazon a déjà livré plus d'un million de ses puces maison, Meta et Microsoft poursuivent leur propre montée en puissance. Pour combler ce retard, OpenAI a compressé son calendrier de développement. Greg Brockman, cofondateur et président, résume l'ambition ainsi : "En concevant davantage de la pile nous-mêmes, nous pouvons servir plus d'intelligence avec une plus grande efficacité." L'enjeu à long terme est un cercle vertueux : une infrastructure moins coûteuse réduit le prix de l'entraînement et de l'inférence, ce qui améliore les produits, attire plus d'utilisateurs, et génère les revenus nécessaires pour financer la prochaine génération de puces maison.
Si OpenAI parvient à réduire ses coûts d'inférence grâce à ses puces maison, les entreprises européennes clientes d'OpenAI pourraient à terme bénéficier de tarifs plus compétitifs, mais l'impact reste indirect et lointain.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




