Aller au contenu principal
InfrastructureAI News2h· 2 min de lecture

Les calculs derrière la puce Jalapeño d'OpenAI

Source originale ↗·

OpenAI a officiellement présenté le Jalapeño, son premier processeur maison baptisé "Intelligence Processor", développé en collaboration avec Broadcom. Conçu spécifiquement pour l'inférence de grands modèles de langage (LLM) plutôt que pour des charges de travail IA généralistes, ce circuit intégré (ASIC) est fabriqué par TSMC à Taïwan, tandis que Celestica assemble les cartes et systèmes de racks. OpenAI a fourni l'architecture de base, Broadcom s'est chargé de l'ingénierie silicium et de l'intégration réseau haute performance, notamment via le switch Tomahawk. Selon la société, des échantillons préliminaires font déjà tourner des charges de production, dont un modèle inédit GPT-5.3-Codex-Spark, à la fréquence et la consommation électrique cibles.

La motivation est avant tout financière. Faire fonctionner ChatGPT a coûté 8,4 milliards de dollars en 2025 ; avec 900 millions d'utilisateurs hebdomadaires, la facture devrait atteindre 14 milliards cette année. Sur les huit prochaines années, OpenAI s'est engagé à dépenser environ 1 400 milliards de dollars en puissance de calcul, pour une entreprise qui génère actuellement 25 milliards de revenus annuels. Nvidia empoche environ 75 % de marge sur ses GPU haut de gamme, là où OpenAI ne conserve que 33 cents par dollar de chiffre d'affaires après charges opérationnelles. Concevoir son propre silicium, optimisé pour minimiser les mouvements de données et maximiser l'utilisation réelle des processeurs, est le levier le plus direct pour desserrer cet étau. En couvrant toute la chaîne, de l'architecture puce aux noyaux logiciels en passant par la gestion mémoire et le routage réseau, OpenAI se transforme d'une couche logicielle pure en une entreprise d'infrastructure verticalement intégrée, sur le modèle d'Apple avec ses puces M et iOS.

OpenAI entre néanmoins sur un terrain où ses concurrents ont une avance considérable. Google déploie ses TPU depuis 2015 et contrôle environ un quart de la capacité mondiale de calcul IA hors Nvidia. Amazon a déjà livré plus d'un million de ses puces maison, Meta et Microsoft poursuivent leur propre montée en puissance. Pour combler ce retard, OpenAI a compressé son calendrier de développement. Greg Brockman, cofondateur et président, résume l'ambition ainsi : "En concevant davantage de la pile nous-mêmes, nous pouvons servir plus d'intelligence avec une plus grande efficacité." L'enjeu à long terme est un cercle vertueux : une infrastructure moins coûteuse réduit le prix de l'entraînement et de l'inférence, ce qui améliore les produits, attire plus d'utilisateurs, et génère les revenus nécessaires pour financer la prochaine génération de puces maison.

Impact France/UE

Si OpenAI parvient à réduire ses coûts d'inférence grâce à ses puces maison, les entreprises européennes clientes d'OpenAI pourraient à terme bénéficier de tarifs plus compétitifs, mais l'impact reste indirect et lointain.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

OpenAI dévoile sa première puce d'inférence IA maison, Jalapeño, développée avec Broadcom grâce à ses propres modèles
1VentureBeat AI 

OpenAI dévoile sa première puce d'inférence IA maison, Jalapeño, développée avec Broadcom grâce à ses propres modèles

OpenAI et Broadcom ont dévoilé ce matin leur premier processeur d'inférence IA sur mesure, baptisé "Jalapeño". Contrairement aux GPU grand public d'Nvidia ou AMD, ce circuit intégré à application spécifique (ASIC) est conçu exclusivement pour faire tourner des grands modèles de langage en production, notamment derrière ChatGPT, Codex et l'API OpenAI. Ce qui frappe d'emblée, c'est la vitesse de développement : de la conception initiale à la fabrication, seulement neuf mois se sont écoulés, là où un cycle habituel de développement de processeur se compte en années. Le partenariat entre OpenAI et Broadcom n'avait d'ailleurs été annoncé publiquement qu'en octobre 2025. Greg Brockman, président et cofondateur d'OpenAI, ainsi que Hock Tan, PDG de Broadcom, ont présenté la puce ce matin sur CNBC. Brockman a précisé que le processus de conception a lui-même été accéléré grâce aux propres modèles d'OpenAI, des versions antérieures au GPT-5.5. OpenAI indique avoir déjà testé GPT-5.3-Codex-Spark sur ces puces dans un environnement de production simulé, et prévoit de déployer Jalapeño dans ses centres de données actifs d'ici fin 2026. Les performances initiales sont décrites comme "remarquables", Brockman écrivant sur X que le ratio performance par watt est "incroyable". L'enjeu dépasse largement la performance technique : il s'agit de survie économique. Des documents financiers audités récemment révélés montrent qu'OpenAI a généré 13,07 milliards de dollars de revenus en 2025, mais a engagé 34 milliards de dépenses opérationnelles, accusant une perte d'exploitation de près de 20,92 milliards de dollars. La principale cause : le coût titanesque de la puissance de calcul, essentiellement louée auprès de Microsoft Azure sur des GPU Nvidia. Concevoir ses propres puces optimisées pour l'inférence LLM permettrait à OpenAI de drastiquement réduire ce coût marginal par requête et d'atteindre enfin une rentabilité opérationnelle. Broadcom apporte la conception silicium et son réseau Tomahawk, tandis que Celestica gère l'intégration au niveau carte, rack et système. Cette annonce s'inscrit dans une stratégie plus large de verticalisation de la filière IA, un mouvement déjà emprunté par Google avec ses TPU et Amazon avec ses puces Trainium et Inferentia. OpenAI, longtemps dépendant des infrastructures de ses partenaires et investisseurs, cherche à contrôler toute sa pile technologique. Fait notable : les deux entreprises positionnent explicitement Jalapeño comme une puce "construite de zéro pour les LLMs actuels et futurs de toute l'industrie", ouvrant la voie à une commercialisation auprès d'autres acteurs de l'IA. De nombreuses questions restent ouvertes, notamment les performances comparatives face aux solutions Nvidia, les coûts de fabrication et la viabilité à grande échelle. Mais si le pari réussit, OpenAI ne sera plus seulement un éditeur de modèles : il deviendra un fournisseur d'infrastructure à part entière.

UEUne réduction future des coûts d'inférence pourrait bénéficier indirectement aux entreprises et développeurs européens utilisant l'API OpenAI, sans impact réglementaire ou industriel direct sur la France/UE.

💬 Quand tu perds 21 milliards par an, tu te construis tes propres puces. Ce que Jalapeño change vraiment, c'est pas la performance par watt, c'est qu'OpenAI sort enfin d'une dépendance à Nvidia qui les saignait à blanc requête après requête. Neuf mois de conception accélérée par leurs propres modèles, c'est la vraie rupture.

InfrastructureOpinion
1 source
OpenAI et Broadcom annoncent une puce dédiée à l'inférence de grands modèles de langage
2Ars Technica AI 

OpenAI et Broadcom annoncent une puce dédiée à l'inférence de grands modèles de langage

OpenAI et Broadcom ont annoncé conjointement une nouvelle puce baptisée Jalapeño, conçue spécifiquement pour l'inférence de grands modèles de langage (LLM) dans les centres de données à grande échelle. Les deux entreprises présentent ce composant comme la première génération d'un partenariat à long terme, avec l'ambition d'affiner et d'améliorer le design des puces au fil des générations successives. Cette annonce marque une étape significative dans la stratégie d'OpenAI pour maîtriser sa propre chaîne d'approvisionnement en silicium. L'inférence, soit le processus par lequel un modèle génère des réponses en temps réel, représente la charge computationnelle la plus coûteuse et la plus constante pour une entreprise comme OpenAI, qui sert des centaines de millions d'utilisateurs via ChatGPT et ses API. Disposer d'une puce dédiée, optimisée pour ce cas d'usage précis, pourrait réduire drastiquement les coûts opérationnels et diminuer la dépendance d'OpenAI envers Nvidia, dont les GPU dominent aujourd'hui le marché de l'IA. Cette démarche s'inscrit dans une tendance de fond : les géants du numérique cherchent tous à s'affranchir de Nvidia en développant leurs propres accélérateurs. Google a ses TPU, Amazon son Trainium, Microsoft son Maia, Apple son Neural Engine. Broadcom, qui fabrique déjà des puces personnalisées pour Google et Meta, s'affirme comme le partenaire industriel privilégié de cette nouvelle vague. Le fait qu'OpenAI rejoigne ce mouvement avec un chip nominalement dédié à l'inférence signale que la société considère désormais le contrôle du matériel comme un avantage concurrentiel structurel, et non plus une simple option.

InfrastructureOpinion
1 source
Anthropic débauche le deuxième ingénieur en puces d'OpenAI alors que les deux sociétés visent la bourse
3The Decoder 

Anthropic débauche le deuxième ingénieur en puces d'OpenAI alors que les deux sociétés visent la bourse

Anthropic a recruté Clive Chan, qu'il décrit lui-même comme le deuxième ingénieur hardware à avoir rejoint le programme de puces personnalisées d'OpenAI. Chan apporte avec lui une expérience rare : il a travaillé sur l'ASIC Autopilot de Tesla avant de contribuer au partenariat stratégique entre OpenAI et Broadcom, le géant des semi-conducteurs, pour développer des puces d'inférence sur mesure. Le recrutement intervient alors que les deux entreprises se préparent activement à entrer en bourse. Ce débauchage ciblé signale qu'Anthropic envisage sérieusement de concevoir ses propres puces d'intelligence artificielle, une étape que la société n'a pas encore franchie publiquement. Pour une startup valorisée à plusieurs dizaines de milliards de dollars, disposer d'une infrastructure silicium propriétaire représente un levier majeur de réduction des coûts et d'indépendance vis-à-vis de Nvidia, dont les GPU H100 et H200 dominent encore massivement le marché de l'entraînement et de l'inférence. Attirer un ingénieur ayant déjà traversé ce processus chez un concurrent direct accélère considérablement la courbe d'apprentissage. La course aux puces maison s'est intensifiée dans tout le secteur : Google dispose de ses TPU, Amazon de ses Trainium et Inferentia, Meta de ses MTIA. OpenAI avait annoncé début 2024 son intention de développer ses propres accélérateurs en collaboration avec Broadcom, avant de signer un accord massif avec SoftBank pour sécuriser des capacités de calcul. Le départ de l'un de ses pionniers hardware vers Anthropic, à quelques mois d'une potentielle introduction en bourse pour les deux acteurs, illustre la bataille de talents qui se joue en coulisses autant que la compétition technologique.

UELa course aux puces IA propriétaires entre géants américains renforce la dépendance technologique européenne vis-à-vis des fournisseurs US, sans impact direct immédiat sur la France ou l'UE.

💬 Le recrutement du deuxième ingénieur puces d'OpenAI, c'est pas anodin. Quand tu cibles quelqu'un qui a déjà fait le chemin chez un concurrent direct, tu brûles les étapes, et Anthropic le sait. Reste à voir si l'IPO va accélérer les investissements silicium ou si c'est encore du positionnement pour les roadshows.

InfrastructureOpinion
1 source
L'accord OpenAI-Broadcom sur les puces IA bute sur 18 milliards de financement
4The Information AI 

L'accord OpenAI-Broadcom sur les puces IA bute sur 18 milliards de financement

OpenAI et le fabricant de semi-conducteurs Broadcom avaient annoncé l'automne dernier un accord pour développer ensemble des puces d'intelligence artificielle sur mesure. L'ambition affichée était de taille : mettre en ligne suffisamment de composants avant 2030 pour consommer 10 gigawatts d'électricité, soit l'équivalent de cinq fois la production du barrage Hoover. L'objectif déclaré était de réduire la dépendance coûteuse d'OpenAI à l'égard des processeurs Nvidia. Ce que les deux entreprises n'avaient pas précisé, c'est qu'elles n'avaient pas encore trouvé comment financer le projet, dont le montant atteint 18 milliards de dollars. Ce blocage financier expose une contradiction au coeur de la stratégie d'OpenAI : l'entreprise affiche des ambitions d'infrastructure colossales tout en restant tributaire d'un partenaire unique, Nvidia, dont les GPU sont à la fois indispensables et extrêmement onéreux. Sans financement sécurisé, le calendrier du projet risque de glisser, laissant OpenAI dans une position de dépendance prolongée qui pèse directement sur ses marges et sa capacité à scaler ses modèles. Cette situation s'inscrit dans une course plus large à l'indépendance chipière. Google, Meta et Amazon ont chacun développé leurs propres accélérateurs maison pour s'affranchir de Nvidia. OpenAI, longtemps focalisé sur la recherche et les produits, arrive plus tardivement dans cette logique d'intégration verticale. L'accord avec Broadcom est une tentative de rattrapage, mais sa concrétisation dépend désormais de la capacité d'OpenAI à lever des fonds dans un contexte où ses dépenses opérationnelles restent très élevées.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic