Aller au contenu principal
Analyse hebdomadaireSemaine du 18 mai 2026

OpenAI et Anthropic ne vendent plus seulement des modèles : ils verrouillent la chaîne IA tout entière

En une semaine, les deux laboratoires ont révélé leur vrai jeu : verrouiller toute la chaîne, des outils développeurs au déploiement et à la facturation, pendant que la Chine attaque par le prix avec des modèles à poids ouverts six fois moins chers en génération

Mathieu Bocquillon|14 min de lecture|117 articles de 16 sources|2 964 mots

En 30 secondes

En une semaine, les deux laboratoires ont révélé leur vrai jeu : verrouiller toute la chaîne, des outils développeurs au déploiement et à la facturation, pendant que la Chine attaque par le prix avec des modèles à poids ouverts six fois moins chers en génération

Anthropic et OpenAI captent 89% des revenus des startups IA — la masse immergée du duopole : SDK, déploiement, tarification, abonnements

89% des revenus des 34 principales startups IA pour deux acteurs. Ce chiffre, publié par The Information cette semaine, dit moins ce qu'est aujourd'hui le marché de l'IA que ce qu'il sera dans dix-huit mois. Car Anthropic et OpenAI n'ont pas passé la semaine à savourer leur domination : ils ont passé la semaine à la verrouiller.

Termes convenus pour 30 milliards supplémentaires à 900 milliards de valorisation chez Anthropic, après une série G à 380 milliards close il y a trois mois. Entité déploiement à 4 milliards pour OpenAI. Acquisition officielle de Stainless pour contrôler l'infrastructure des kits de développement. Refonte brutale de la facturation API. Pendant ce temps, la Chine attaque par le prix avec des modèles à poids ouverts six fois moins chers en génération, et Cerebras ouvre à 350 dollars — capitalisation implicite touchant brièvement 100 milliards.

Cinq signaux. Une seule direction : le marché bascule simultanément vers la consolidation en haut et la banalisation en bas.


89% pour deux acteurs, et alors?

Anthropic et OpenAI concentrent 89% des revenus des 34 principales startups IA, sur un total de 80 milliards de dollars annualisés. Soit 6,6 milliards par mois. En hausse de 112% en six mois.

Le ratio 89/11 n'est pas un accident de marché. Les effets de réseau des modèles de pointe créent des barrières à l'entrée quasi insurmontables pour les concurrents de second rang. Les 11% restants, c'est Mistral, Cohere, et une poignée d'acteurs qui survivent sur des niches : souveraineté, conformité réglementaire, déploiement hébergé chez le client. Pas parce qu'ils sont meilleurs. Parce qu'Anthropic et OpenAI ne veulent pas de ces marchés-là, ou ne peuvent pas les servir.

Anthropic aurait convenu des termes d'un nouveau tour de 30 milliards de dollars à 900 milliards de valorisation post-money, moins de trois mois après son tour de série G officiellement clos à 380 milliards. Si la clôture est confirmée, ce serait la première fois que la valorisation d'Anthropic dépasse celle d'OpenAI. Le moteur : un chiffre d'affaires annualisé multiplié par cinq depuis fin 2024, tiré en partie par Claude Code dans les environnements développeurs. Ce n'est pas de la croissance normale, c'est un effet de bascule. Les entreprises migrent leurs preuves de concept vers la production, et ça se voit dans les chiffres.

La corrélation entre cette croissance et les tensions sur les coûts est le signal qu'on regarde moins : PagerDuty et ServiceNow signalent publiquement une imprévisibilité tarifaire chez Anthropic, ServiceNow ayant déjà consommé l'intégralité de son budget IA annuel. La demande précède la stabilisation des marges. C'est inconfortable pour les clients, structurellement favorable pour le fournisseur.

À retenir : ARR dans le contexte IA. L'Annual Recurring Revenue IA ne fonctionne pas comme le SaaS classique. L'ARR SaaS repose sur des sièges : il est stable, prévisible, contractuel. L'ARR IA fluctue avec l'usage. Un multiplicateur par cinq en quinze mois peut signifier une adoption réelle ancrée dans des workflows de production, ou une période de tests intensifs non reconduits. La distinction est cruciale pour évaluer la solidité des valorisations actuelles. Les investisseurs qui misent sur 900 milliards parient sur le premier scénario.


Anthropic monte dans la chaîne technique, OpenAI descend vers les clients : deux réponses au même problème

Les tests de référence ne suffisent plus à différencier durablement les modèles de pointe. Alors comment verrouiller la position? Les deux réponses divergent radicalement.

Anthropic a officialisé l'acquisition de Stainless le 18 mai 2026. Les termes financiers n'ont pas été publiés, mais les discussions évoquées par The Information dépassaient les 300 millions de dollars. Stainless génère les kits de développement (SDK) officiels d'OpenAI, d'Anthropic et de Google, en plus de Cloudflare et d'une grande partie de l'écosystème. En une acquisition, Anthropic retire du marché un fournisseur d'infrastructure développeur utilisé par ses deux principaux concurrents. Stainless annonce dans la foulée l'arrêt de ses produits hébergés, dont son générateur de kits. Les clients existants conservent les kits déjà générés et peuvent les modifier, mais les nouveaux projets devront migrer vers d'autres options ou maintenir eux-mêmes leurs couches d'intégration. Ce n'est pas une acquisition technique. C'est un levier de distribution qui force les concurrents à investir dans des alternatives qu'ils avaient externalisées.

À retenir : pourquoi le SDK, c'est la porte d'entrée. Quand une startup construit son produit sur le SDK Stainless d'Anthropic, migrer vers OpenAI devient une réécriture complète, pas un simple changement de clé API. Les abstractions sont différentes, les conventions divergent, les intégrations existantes cassent. C'est le même levier que Microsoft a utilisé pendant vingt ans avec Visual Studio : tu peux techniquement passer à Eclipse ou Xcode, mais le coût est réel, et la plupart ne le font jamais.

Simultanément, Anthropic change la facturation API au 15 juin. Les abonnements Pro couvraient jusqu'ici les appels SDK dans un quota global subventionné. Cette zone grise se referme : les usages programmatiques disposent désormais d'un crédit mensuel dédié, au-delà duquel chaque requête est facturée au tarif standard. Double mouvement, double sécurisation du revenu : contrôle SDK plus fin des remises implicites.

OpenAI fait l'inverse. La Deployment Company lancée le 11 mai avec 4 milliards de dollars ne vend plus des modèles : elle vend des déploiements clés en main. Des ingénieurs en immersion chez le client qui comprennent les données internes, font le travail sale de mise en production. TPG, Bain Capital, Goldman Sachs, Capgemini, McKinsey participent au tour. C'est un virage d'éditeur de produit vers prestataire de services.

Pourquoi ce pivot? Parce que l'accord Apple s'est effondré. OpenAI avait misé sur une intégration à potentiellement 5 milliards d'utilisateurs iOS. Apple a utilisé le partenariat comme couverture pour développer ses propres modèles en interne, sans tenir ses promesses commerciales. Résultat : OpenAI envisage des recours juridiques et cherche un nouveau canal vers les budgets IT, par le déploiement direct en entreprise.

La renégociation Microsoft économise 97 milliards d'ici 2030. OpenAI reversait 20% de ses revenus à Redmond en vertu de l'accord signé en 2019, quand il avait besoin d'eux. À 300 milliards de valorisation, cette clause était une anomalie. Elle se referme. OpenAI récupère ses marges sur le compute, ce qui finance précisément les ambitions de la Deployment Company.

Le point de vue contraire. La Deployment Company ressemble à une belle annonce, mais vendre du conseil d'implémentation est un métier que ni OpenAI ni ses partenaires n'ont jamais exercé à grande échelle. McKinsey et Capgemini savent faire de l'intégration. OpenAI sait faire des modèles. La question est qui contrôle la relation client quand les deux sont dans la même pièce, et qui absorbe les surcoûts quand un déploiement dérape.


Cerebras introduit en bourse : 56 milliards officiels, 100 milliards en pic intraday — le marché parie sur quoi?

Cerebras a pricé son introduction en bourse à 185 dollars le 14 mai — soit plus de 56 milliards de valorisation officielle et 5,55 milliards levés — avant d'ouvrir à 350 dollars, niveau qui portait brièvement la capitalisation implicite autour de 100 milliards. Revenus projetés : 800 millions. Ratio : entre 70 et 125 fois les revenus selon le moment de cotation.

Le calendrier n'est pas anodin. Le 24 décembre 2025, Nvidia signait avec Groq un accord de licence technologique non exclusif accompagné d'un transfert de dirigeants et d'ingénieurs — pas un rachat complet au sens classique, malgré les premières rumeurs à 20 milliards. La même semaine, OpenAI signait contractuellement pour des milliards de dollars de puces chez Cerebras, le concurrent direct. Ce n'est pas une coïncidence : c'est la recomposition du marché des puces d'inférence qui s'accélère, en temps réel.

Le pari Cerebras est architectural. Une puce wafer-scale élimine les latences inter-puces qui pénalisent les clusters GPU Nvidia enchaînés en rack. Pour l'inférence streaming à faible latence (agents autonomes, assistants temps réel), c'est un avantage structurel mesurable.

À retenir : wafer-scale. Les GPU Nvidia découpent une plaquette silicium en centaines de petites puces interconnectées par des câbles. Chaque transfert de données inter-puce introduit une latence. Cerebras utilise toute la plaquette comme une seule puce géante : zéro latence inter-puce. Contreparties réelles : un défaut de fabrication détruit toute la plaquette (rendement réduit), et le refroidissement d'une puce de cette taille est un défi d'ingénierie non trivial. L'avantage existe. Le coût de production aussi.

Fractile lève 187 millions d'euros la même semaine avec la même thèse : l'inférence locale et efficace, pas l'entraînement massif, est le prochain terrain d'optimisation de coût. Les investisseurs des grandes gagnantes Cerebras, Foundation et Benchmark, ainsi qu'OpenAI lui-même, ont maintenu leurs positions sur une décennie de développement. Le marché vient de valider que l'architecture alternative à Nvidia, ce n'est pas un luxe de chercheurs.

La relation OpenAI-Cerebras est pourtant une arme à double tranchant. OpenAI est à la fois client principal et investisseur bénéficiaire de l'IPO. Si OpenAI représente plus de 60% des revenus Cerebras, l'indépendance de la société face aux hyperscalers est fragilisée dès son premier jour de cotation.


La Chine attaque par le prix : les modèles à poids ouverts comme arme géopolitique

Depuis fin avril 2026, deux modèles chinois à poids ouverts occupent le sommet du classement des LLM sur OpenRouter : Hy3 de Tencent (295 milliards de paramètres) et Kimi K2.6 de Moonshot AI. Claude Sonnet 4.6 et Claude Opus 4.7 arrivent troisième et quatrième.

L'écart de prix est documenté et asymétrique. Sur OpenRouter, Kimi K2.6 tourne à 0,73 dollar par million de tokens en entrée et 3,49 dollars en sortie ; Claude Opus 4.7 est facturé 5 dollars en entrée et 25 dollars en sortie. C'est un facteur 6 à 7 sur le coût de génération, là où réside la majorité de la facture pour les agents autonomes et les chaînes de traitement à fort volume. Les directions informatiques ont sorti leurs calculettes.

11 milliards de financement en quelques jours fin avril pour trois startups chinoises. DeepSeek envisage un tour qui pourrait atteindre 7 milliards. Moonshot et StepFun ne vendent plus des scores de tests de référence : ils déploient des agents qui opèrent sur des millions de terminaux. Ce n'est plus un signal de rattrapage. C'est une offensive coordonnée visant l'expansion internationale.

La stratégie est précise : les modèles à poids ouverts chinois ciblent les couches où les entreprises occidentales ont construit des barrières tarifaires, pas là où elles détiennent des avantages techniques irréductibles. Ce n'est pas de l'idéologie d'ouverture du code. C'est de la géopolitique commerciale.

Les 470 séries générées par IA quotidiennement sur les plateformes chinoises sont la démonstration industrielle de ce que des modèles économiques font à l'échelle. Ce qui coûtait 200 000 dollars et trois mois de production tourne désormais en continu à coût marginal.

Le point de vue contraire. Les modèles chinois ouverts ne sont pas directement substituables pour une entreprise européenne soumise au RGPD ou opérant dans un secteur réglementé. La souveraineté des données, la conformité AI Act, et l'absence de support local ne sont pas des arguments commerciaux : ce sont des contraintes contractuelles. Le vrai risque pour Anthropic et OpenAI n'est pas une migration de masse, c'est que les modèles chinois ouverts capturent les usages à marge faible qu'ils ont délibérément abandonnés au profit du segment entreprise haut de gamme.


Coda : le verdict Musk-Altman, ou ce que la verticalisation n'efface pas

Le 18 mai, un jury fédéral d'Oakland a tranché en faveur d'Altman, Brockman et OpenAI dans le procès intenté par Elon Musk. La juge a entériné l'avis consultatif et rejeté les demandes de Musk ; ce dernier annonce déjà faire appel. Le procès n'a pas freiné OpenAI. Il a fait pire pour Musk : il a livré à OpenAI une victoire procédurale au moment exact où l'entreprise enclenche sa montée en puissance commerciale — Deployment Company à 4 milliards, renégociation Microsoft à 97 milliards d'économies, fin de la zone grise tarifaire.

Mais le procès aura aussi déposé sur la place publique des courriers internes 2017-2019 que personne n'avait jamais vus, et des témoignages sous serment d'anciens collègues d'Altman parlant de mensonges. Ces archives restent. Elles ne réécrivent pas le droit des structures hybrides à but lucratif limité — Anthropic en Public Benefit Corporation, Mistral, et tout acteur qui a utilisé un habillage éthique pour lever des fonds en amorçage. Mais elles documentent publiquement leur fragilité d'image dès qu'arrive la transformation commerciale.

C'est ce qui referme la semaine : le verrouillage des couches techniques par les fondations (Stainless, Deployment Company, Cerebras) se fait pendant que leur récit fondateur s'effrite en salle d'audience. Les valorisations à 900 milliards et la consolidation à 89% ne dépendent plus de la mission. C'est précisément le vrai sujet.

À retenir : Public Benefit Corporation. Statut juridique américain intermédiaire entre association à but non lucratif et société commerciale classique. Oblige légalement l'entreprise à considérer l'intérêt public dans ses décisions, mais n'interdit ni la profitabilité ni les levées de fonds privées. Anthropic utilise ce statut. OpenAI a abandonné sa structure non lucrative originelle lors de sa transformation en 2019, ce qui était précisément au cœur du litige.


Ce que ça signifie pour vous

Pour les développeurs et équipes techniques

La fermeture de la zone grise de facturation Anthropic au 15 juin est urgente. Audite maintenant toutes les chaînes de traitement qui appellent l'API via un abonnement Pro : calcule ton coût réel par jeton avant la date limite. La surprise peut être significative si tu faisais tourner des scripts en douce sur un abonnement Claude Pro.

Maintenant qu'Anthropic a officialisé le rachat de Stainless, les projets qui dépendent du kit développeur de cette société pour appeler OpenAI ou Google devraient planifier une couche d'abstraction. Pas en urgence, mais dans les six prochains mois. Migrer en catastrophe sous pression tarifaire est toujours plus coûteux qu'anticiper.

Les modèles chinois à poids ouverts sont une option légitime pour les chaînes de traitement à volume élevé sans contraintes de souveraineté — facteur 6 à 7 sur le coût de génération par rapport à Claude Opus. Pas pour remplacer Claude sur les tâches critiques. Pour réduire la facture sur le traitement par lots et les usages non sensibles.

Pour les décideurs et dirigeants

La création de la Deployment Company OpenAI signale que le marché entre dans une phase où les modèles seuls ne suffisent plus à créer de la valeur différenciée. Les entreprises qui ont attendu des solutions clés en main peuvent commencer à accélérer : les intégrateurs sont maintenant dans la boucle avec des financements sérieux.

La concentration à 89% impose un choix stratégique binaire : s'aligner sur l'un des deux gagnants et accepter leur pouvoir de tarification croissant, ou construire sur des couches ouvertes et assumer les risques géopolitiques et de support associés. Les deux ont des coûts. Celui de l'abstention aussi.

L'imprévisibilité tarifaire signalée par PagerDuty et ServiceNow n'est pas un problème de leur seule taille. Intègre une provision de 20 à 30% au-dessus de tes projections IA pour 2026, et exige une clause de tarification contractuelle dans tes prochains renouvellements.

Pour l'écosystème français et européen

Mistral est dans les 11% restants, et c'est à la fois son problème de croissance et sa protection contre la consolidation : trop petit pour être la cible principale, suffisamment visible pour exister comme alternative de souveraineté. Mais l'argument souveraineté devient difficile à tenir quand les deux entreprises qui captent 89% du marché ont Microsoft et Google à leur tour de table.

Le rachat Stainless par Anthropic et la Deployment Company d'OpenAI accélèrent la nécessité d'une réponse européenne sur la couche d'infrastructure (kits de développement, outils pour développeurs), pas seulement sur les modèles. SAP l'a compris : la semaine où n8n voit sa valorisation doubler à 4,42 milliards grâce à une entrée au capital de SAP, c'est une chaîne IA verticale européenne qui s'assemble, morceau par morceau.

L'attaque chinoise par le prix crée une fenêtre tactique. Le marché des modèles économiques va se fragmenter avant de se reconsolider. Cette fenêtre ne durera pas.


Nos prédictions

PrédictionHorizonConfianceStatut
Le rachat Stainless étant officialisé, Anthropic annonce une hausse tarifaire SDK d'au moins 15% dans les 60 jours suivants3 moishauteEn cours
Au moins un acteur tech majeur (Stripe, Shopify ou équivalent) annonce un partenariat avec un modèle chinois pour ses pipelines internes, en citant explicitement le rapport coût/performance6 moismoyenneEn cours
L'action Cerebras perd 35% ou plus par rapport à son pic d'IPO quand le marché intègre que le contrat OpenAI représente plus de 60% des revenus6 moismoyenneEn cours
Mistral lève un tour d'au moins 500 millions d'euros avec un composant souveraineté européenne (BPI, BEI, fonds gouvernemental) pour tenir face à la pression du duopole1 anhauteEn cours
Le changement de facturation Anthropic du 15 juin provoque une migration mesurable de développeurs indépendants vers des alternatives à poids ouverts, visible dans les statistiques HuggingFace et les discussions communautaires3 moismoyenneEn cours

Questions fréquentes

Anthropic dépasse-t-il vraiment OpenAI en valorisation ?
Anthropic a officiellement clos son tour de série G à 30 milliards levés et 380 milliards de valorisation post-money. Selon le Financial Times, l'entreprise aurait ensuite convenu des termes d'un nouveau tour de 30 milliards à 900 milliards moins de trois mois plus tard ; la clôture de ce second tour n'est pas confirmée. Si elle l'est, ce serait la première fois qu'Anthropic dépasse OpenAI en valorisation. Le moteur revendiqué : un chiffre d'affaires annualisé multiplié par cinq depuis fin 2024, tiré notamment par Claude Code dans les environnements développeurs.
Qu'est-ce que la OpenAI Deployment Company et pourquoi est-ce un pivot stratégique ?
Lancée le 11 mai 2026 avec 4 milliards de dollars et 19 partenaires (dont Capgemini et McKinsey), cette entité se concentre sur le déploiement IA en entreprise : implémentation, intégration, support. Concrètement, environ 150 ingénieurs en immersion chez le client pilotent l'installation et la mise en production. Contrairement à la maison mère qui développe des modèles, elle vend de la mise en production. C'est un virage de l'éditeur de produit vers le prestataire de services, rendu urgent par l'échec commercial de l'accord Apple.
Les modèles IA chinois sont-ils vraiment 6 fois moins chers que Claude ?
Sur les tokens de sortie, oui — c'est précisément là que se concentre la majorité de la facture pour les agents et les chaînes de traitement à fort volume. OpenRouter affiche Kimi K2.6 à 3,49 dollars par million de tokens en sortie ; Claude Opus 4.7 est à 25 dollars. Sur les tokens d'entrée, l'écart est moindre (0,73 contre 5 dollars). Pour les applications soumises au RGPD ou avec exigences de souveraineté des données, la comparaison devient plus complexe qu'un simple ratio de prix.
Que change concrètement le rachat de Stainless par Anthropic pour les développeurs ?
Anthropic a officialisé l'acquisition de Stainless le 18 mai 2026. Les termes financiers n'ont pas été publiés, mais The Information évoquait des discussions au-dessus de 300 millions de dollars. Stainless indique désormais arrêter ses produits hébergés, dont son générateur de kits de développement utilisé par OpenAI, Google et Cloudflare. Les clients existants conservent les kits déjà générés et peuvent les modifier, mais les nouveaux projets devront chercher des alternatives ou maintenir eux-mêmes leurs couches d'intégration. Anticipez une couche d'abstraction si vous êtes en dépendance forte.
Que révèle l'IPO Cerebras sur la guerre des puces IA en 2026 ?
Cerebras a pricé son introduction en bourse à 185 dollars le 14 mai 2026 — soit plus de 56 milliards de valorisation officielle et 5,55 milliards levés — avant d'ouvrir à 350 dollars, niveau qui portait brièvement sa capitalisation pleinement diluée au-dessus de 100 milliards. Sa puce de la taille d'une plaquette de silicium est conçue pour l'inférence rapide, alternative architecturale aux GPU Nvidia. L'euphorie du premier jour reflète la conviction que la phase d'inférence — faire tourner les modèles en temps réel — deviendra le goulot d'étranglement dominant de l'IA générative. La relation client-investisseur avec OpenAI est à la fois la force et la principale fragilité à surveiller dans les prochains trimestres.

Sources

Suivi en continu

Cette analyse touche les sujets suivants — chaque hub agrège l'actualité quotidienne de l'entité.

Une analyse comme celle-ci chaque semaine

Abonnez-vous pour recevoir le dossier hebdomadaire directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour