BusinessThe Information AI2h· 2 min de lecture

Together AI et Hugging Face profitent de l'essor de l'open source

Together AI, la néo-infrastructure cloud spécialisée dans les modèles d'IA open source, a relevé ses projections de revenus annuels au moins trois fois au cours des derniers mois. Son PDG Vipul Ved Prakash a révélé que la plateforme générait environ un milliard de dollars de revenus annualisés en mars 2026, portée par une explosion du volume de calcul : le nombre de tokens traités via son cloud est passé de 30 milliards par mois il y a un an à 400 000 milliards ce mois-ci, une grande partie de cette croissance s'étant produite au cours des six derniers mois. Chez Hugging Face, dépôt de référence pour les modèles open source, le nombre d'abonnés payants a doublé entre janvier et juin, a indiqué le cofondateur et PDG Clem Delangue, sans préciser les chiffres absolus. Dans le même élan, Not Diamond, startup spécialisée dans les "model routers", des logiciels permettant aux entreprises de basculer facilement entre différents modèles selon la tâche, a connu "une forte hausse de la demande ces six derniers mois", selon son PDG Tomás Hernando Kofman. Ces routeurs, utilisés notamment par Cisco et Adobe, permettraient d'économiser entre 20 % et 40 % sur les coûts d'utilisation des modèles Anthropic les plus onéreux.

Cette dynamique illustre un basculement stratégique dans l'industrie : les entreprises cherchent activement à reprendre le contrôle de leurs coûts d'IA et à réduire leur dépendance à un fournisseur unique. Thomas Wolf, cofondateur de Hugging Face, parle d'un "grand réveil sobre" chez ses clients professionnels, préoccupés par les prix en hausse des modèles propriétaires et les risques d'enfermement technologique. Si l'on rapporte la croissance de Together AI aux tarifs actuels, par exemple 18 centimes par million de tokens pour DeepSeek v4 Pro, l'écart entre 30 milliards et 400 000 milliards de tokens représenterait environ 70 millions de dollars de dépenses mensuelles supplémentaires. Vipul Ved Prakash estime que les modèles open source représenteront à terme la grande majorité des usages d'IA dans le monde.

Ce mouvement s'inscrit dans un contexte plus large de maturité du marché de l'IA en entreprise. OpenAI et Anthropic continuent de défendre leurs modèles premium en arguant que leurs performances justifient les prix pratiqués, mais la concurrence ouverte s'intensifie. Parallèlement, Amazon Web Services accélère sur un autre front : le géant du cloud forme actuellement ses "solution architects" pour qu'ils deviennent des ingénieurs déployés directement chez les clients, à l'image du modèle dit FDE (forward-deployed engineer) popularisé par Palantir et désormais adopté par OpenAI, Anthropic, Salesforce et Snowflake. AWS s'appuie sur des équipes pluridisciplinaires, incluant ingénieurs, scientifiques appliqués et stratèges en IA, comme au siège d'Atlanta de Cox Automotive début 2025. Ces consultants hybrides, à mi-chemin entre développeur, chef de produit et conseiller stratégique, répondent à une demande croissante des grandes entreprises qui ne disposent pas encore des compétences internes pour déployer l'IA de manière autonome.

Impact France/UE

Hugging Face, cofondée par les Français Thomas Wolf et Clem Delangue, est au cœur de cette dynamique avec un doublement de ses abonnés payants, renforçant son rôle de référence mondiale pour l'IA open source et offrant aux entreprises européennes une alternative crédible aux modèles propriétaires américains pour réduire leur dépendance technologique.

Dans nos dossiers

AWS Hugging Face OpenAI Anthropic

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Verge AI

Le secteur de l'IA face à une course aux profits devenue existentielle

Anthropic et OpenAI se trouvent à un tournant critique en 2026 : après avoir absorbé des centaines de milliards de dollars d'investissements en capital, en centres de données, en puces et en infrastructure, ces deux géants de l'IA doivent désormais prouver qu'ils peuvent devenir des entreprises véritablement rentables. Les projections financières des deux sociétés, révélées cette semaine par le Wall Street Journal, évoquent une croissance vertigineuse, avec des revenus se chiffrant en centaines de milliards de dollars d'ici la fin de la décennie. Cette semaine encore, OpenAI a levé 122 milliards de dollars supplémentaires, signalant que les marchés continuent de parier sur leur succès, mais la pression pour transformer cet argent en bénéfices n'a jamais été aussi intense, notamment à l'approche de deux des plus grandes introductions en bourse de l'histoire. Ce qui précipite la crise, c'est l'essor des agents IA comme Claude Code, Cowork ou Codex d'OpenAI, qui consomment des ressources de calcul à une cadence bien supérieure à ce que ces entreprises avaient anticipé. Pour gérer cette pression sur leurs infrastructures, les deux sociétés prennent des décisions douloureuses. OpenAI a brutalement supprimé son application de génération vidéo Sora le mois dernier, abandonnant au passage un contrat de licence d'un milliard de dollars avec Disney, au motif que le service coûtait trop cher à faire tourner et que la capacité de calcul était nécessaire pour Codex. Anthropic a de son côté décidé la semaine dernière d'interdire aux utilisateurs de Claude de consommer librement des ressources via le framework open source OpenClaw dans le cadre d'un abonnement standard, les forçant à basculer vers des plans à la consommation, nettement plus onéreux. Ces arbitrages révèlent une tension structurelle qui traverse toute l'industrie de l'IA : les modèles économiques construits sur l'abonnement mensuel ne tiennent plus face à l'appétit en calcul des agents. La plupart des dirigeants du secteur, interrogés ces derniers mois, anticipent d'ailleurs une vague de faillites spectaculaires parmi les acteurs les moins bien capitalisés, estimant que le marché ne pourra pas soutenir indéfiniment toutes les entreprises actuellement en course. Pour Anthropic et OpenAI, dont les introductions en bourse se profilent comme des événements majeurs, la question n'est plus simplement de savoir si l'IA générative est utile, mais si elle peut générer suffisamment de revenus pour justifier les valorisations colossales promises aux investisseurs. Les compromis opérationnels observés ces dernières semaines ne sont probablement que les premiers signes visibles d'un rééquilibrage profond qui va redéfinir quels produits survivent, et à quel prix.

UELe basculement vers une facturation à la consommation pour les agents IA va renchérir les coûts d'usage pour les développeurs et entreprises européens dépendant des APIs d'OpenAI et d'Anthropic.

BusinessOpinion

1 source

2VentureBeat AI

Anthropic dépasse enfin OpenAI en adoption professionnelle de l'IA, mais trois menaces pèsent sur son avance

Pour la première fois depuis le début de la course à l'IA, davantage d'entreprises américaines paient pour Claude d'Anthropic que pour ChatGPT d'OpenAI. Selon l'édition de mai 2026 du Ramp AI Index, publié mardi par la plateforme de cartes corporate Ramp qui agrège les données de dépenses de plus de 50 000 entreprises américaines, Anthropic a atteint 34,4% d'adoption professionnelle en avril 2026, contre 32,3% pour OpenAI. En un an, Anthropic a quadruplé sa pénétration en entreprise, passant de moins de 8% en avril 2025, tandis qu'OpenAI n'a progressé que de 0,3% sur la même période. Le moteur principal de cette ascension est Claude Code, l'outil de programmation agentique d'Anthropic, devenu le produit à la croissance la plus rapide de l'histoire de la société: une analyse récente estime que 4% de l'ensemble des commits publics sur GitHub dans le monde sont désormais rédigés par Claude Code, un chiffre qui a doublé en un mois seulement. Ce renversement de leadership est significatif pour l'ensemble de l'industrie. Anthropic a conquis 70% des face-à-face commerciaux contre OpenAI au cours du premier trimestre 2026, notamment auprès des entreprises du secteur logiciel, de la finance et des services professionnels. Parallèlement, une enquête Gallup menée en février 2026 auprès de 23 717 salariés américains révèle que 50% des actifs utilisent désormais l'IA dans leur travail, contre 46% le trimestre précédent, et que 13% l'utilisent quotidiennement. Malgré cette diffusion massive, la révolution de la productivité reste partielle: seul un employé sur dix dans les organisations ayant adopté l'IA déclare que celle-ci a véritablement transformé sa façon de travailler. La trajectoire d'Anthropic suit une logique précise: la société a d'abord séduit les ingénieurs et les premiers adoptants techniques, avant de capitaliser sur cette base pour conquérir le marché grand public des entreprises, un mouvement que l'économiste en chef de Ramp, Ara Kharazian, avait décrit dès mars 2026. Mais le rapport qui consacre ce nouveau leader souligne aussi la fragilité de cette position. Anthropic fait face à trois risques structurels: la hausse continue des coûts opérationnels, des contraintes sur la disponibilité des ressources de calcul, et les risques inhérents à un modèle de tarification à la consommation de tokens qui, s'il alimente une croissance spectaculaire des revenus, reste vulnérable à la concurrence tarifaire. OpenAI, qui culminait à environ 36,5% d'adoption mi-2025, est en recul progressif mais conserve une présence massive et les ressources nécessaires pour contre-attaquer.

UELes entreprises françaises et européennes qui évaluent leurs fournisseurs d'IA suivront ce basculement de leadership, mais les données restent limitées au marché américain.

BusinessOpinion

1 source

3Next INpact

☕️ OpenAI et Anthropic envisageraient de casser les prix des tokens

OpenAI et Anthropic étudient sérieusement une réduction du prix des tokens, selon des informations rapportées par le Wall Street Journal. Sam Altman a lui-même reconnu lors d'un événement public que le coût du token constituait un « gros problème », affirmant qu'OpenAI cherchait des moyens de permettre à ses clients « d'en faire plus tout en dépensant moins ». Le patron d'OpenAI anticiperait notamment une baisse des prix chez son rival Anthropic, dont l'outil Claude Code est devenu un incontournable dans de nombreuses équipes de développement. Pour les entreprises, chaque requête adressée à GPT ou Claude génère une consommation de tokens qui s'accumule rapidement sur les factures : selon l'analyste Ed Zitron, les utilisateurs peuvent actuellement dépenser entre 8 et 13,50 dollars pour chaque dollar de revenus d'abonnement encaissés par les labos. Le directeur technique d'Uber a d'ailleurs témoigné avoir épuisé son budget IA annuel en seulement quatre mois. Une baisse des prix serait une excellente nouvelle pour les entreprises dont les coûts d'infrastructure IA explosent au rythme de l'adoption, mais elle soulève une contradiction majeure : ni OpenAI ni Anthropic ne sont encore rentables. Les revenus générés par chaque token facturé peinent à couvrir les coûts colossaux des centres de données, des puces Nvidia et du développement continu de nouveaux modèles. Lancer une guerre tarifaire dans ce contexte repousserait encore l'horizon de la rentabilité pour les deux entreprises qui se préparent à entrer en Bourse. Les clients bénéficieraient immédiatement de marges réduites, mais les investisseurs, eux, attendraient encore. La bataille se joue également sur le terrain des outils de développement : Claude Code a pris de l'avance dans les usages professionnels, forçant OpenAI à riposter avec Codex, en position de retard. C'est précisément parce que ces outils sont devenus des postes de dépense significatifs dans les budgets tech que la question du prix du token est devenue stratégique. La baisse des prix de l'inférence suit une tendance de fond depuis 2023, tirée par la concurrence avec des acteurs comme Google et les fournisseurs open source. Mais si OpenAI et Anthropic s'alignent mutuellement à la baisse sans se différencier sur d'autres critères, ils risquent de transformer leurs modèles en commodités interchangeables, où seul le tarif compte. La prochaine étape sera de voir si l'un des deux franchit le premier le pas, entraînant l'autre dans une spirale baissière difficile à arrêter.

UEUne baisse des prix des tokens réduirait directement les coûts d'infrastructure IA des entreprises et startups européennes dépendantes des APIs OpenAI et Anthropic.

💬 Que ça baisse enfin, personne va s'en plaindre, et le CTO d'Uber qui a épuisé son budget IA en quatre mois dit tout sur l'urgence. Le vrai risque, c'est qu'ils s'alignent l'un sur l'autre sans rien d'autre à offrir, et que leurs modèles finissent par ne se distinguer que par le tarif. C'est là que Google et l'open source attendent.

BusinessOpinion

1 source

4Le Big Data

OpenAI tue Sora : comment l’IA de vidéo tant attendue a fait un flop ?

Le mardi 24 mars 2026, l'équipe officielle de Sora a publié un message d'adieu sur X, confirmant la fermeture définitive du générateur de vidéos par IA d'OpenAI. Six mois seulement après son lancement grand public en septembre 2025, l'application est débranchée. Pourtant, les débuts avaient été spectaculaires : Sora avait franchi le million de téléchargements plus vite que ChatGPT en son temps. Mais l'euphorie a été de courte durée. Dès janvier 2026, les téléchargements chutaient de 45 % en un mois, le taux de rétention à 30 jours s'effondrait sous les 8 %, et sur le dernier mois, l'outil ne réunissait plus que 600 000 utilisateurs actifs, relégué à la 172e place de l'App Store. Pendant ce temps, faire tourner l'infrastructure coûtait à OpenAI 15 millions de dollars par jour — une hémorragie financière impossible à tenir. L'accord avec Disney, qui avait investi un milliard de dollars en décembre pour permettre l'intégration de plus de 200 personnages franchisés (Marvel, Star Wars, Pixar) dans les vidéos générées, est lui aussi annulé, l'investissement ne s'étant finalement jamais concrétisé. La fermeture de Sora est avant tout un signal stratégique fort : OpenAI prépare son introduction en bourse pour le quatrième trimestre 2026 et doit convaincre Wall Street de sa rentabilité. Fidji Simo, nouvelle responsable de la division AGI Deployment, a été explicite en interne : l'entreprise ne peut plus se disperser dans des « quêtes secondaires ». Sam Altman a réorganisé ses priorités autour de la levée de capitaux et de la construction de centres de données. Toute la puissance de calcul libérée par l'arrêt de Sora est redirigée vers les clients B2B, jugés bien plus lucratifs. La semaine précédant l'annonce, OpenAI confirmait aussi la fusion de ChatGPT desktop, de son outil de code Codex et de son navigateur web en une seule « super-app » — une consolidation qui illustre cette nouvelle discipline budgétaire. L'entraînement d'un nouveau modèle, nom de code « Spud », vient par ailleurs de s'achever, confirmant que les priorités technologiques ont changé de camp. Sora était apparu en février 2024 comme une promesse de révolution pour Hollywood, capable de générer des vidéos photoréalistes à partir d'un simple texte. Son lancement public avait suscité un engouement mondial, mais le fossé entre la démonstration technique et l'usage quotidien s'est révélé impossible à combler face à la brutalité des chiffres économiques.

UELes créateurs de contenu et studios européens utilisant Sora perdent l'accès à l'outil et doivent se tourner vers des alternatives concurrentes pour leurs productions vidéo générées par IA.

BusinessOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic