BusinessLatent Space6sem· 2 min de lecture

Nouvelles licornes à 10 milliards dans l'infra IA : Fireworks, Baseten (et OpenRouter en chemin)

Résumé IASource uniqueImpact UE Take éditorial

Trois acteurs de l'infrastructure d'inférence IA ont fait parler d'eux cette semaine avec des levées de fonds aux valorisations vertigineuses. Fireworks AI serait en discussions pour une levée qui valoriserait la startup à 15 milliards de dollars, soit 3,75 fois sa valorisation précédente en seulement sept mois. Baseten, de son côté, serait en train de finaliser un tour qui l'amènerait à 11 milliards de dollars, multipliant par 2,2 sa valeur en trois mois à peine. Plus discret mais tout aussi significatif, OpenRouter a bouclé une Série C de 113 millions de dollars, après avoir multiplié ses volumes par cinq en six mois. Ces trois sociétés ont en commun de se positionner sur la même couche critique : permettre aux entreprises d'appeler, de router et d'orchestrer des modèles de langage à grande échelle, sans se lier à un seul fournisseur.

Ces valorisations illustrent un basculement structurel dans la manière dont l'industrie évalue la valeur dans l'IA. La compétition ne se joue plus uniquement autour du modèle de base, mais autour de ce que les ingénieurs appellent le "harness" : l'ensemble formé par le modèle, l'environnement d'exécution, la boucle d'évaluation et les mécanismes de correction. DeepSeek constituerait explicitement une équipe dédiée à cette couche, Google a formalisé son infrastructure d'agents Gemini comme une API unique intégrant sandbox, persistance et gestion du contexte, et LangChain a mis à jour ses outils dans la même direction. Le benchmark DeepSWE, salué par des praticiens comme le premier à vraiment refléter l'expérience quotidienne des développeurs, a montré que les modèles se distinguent davantage sur ces tâches réelles que sur les classements publics traditionnels. Qwen3.7 Max d'Alibaba s'est par exemple classé quatrième sur Code Arena Frontend, au niveau de Claude Opus 4.6 sur les tâches de développement web agentique.

Ce mouvement s'inscrit dans une tendance plus large qui s'accélère depuis le début de l'année, baptisée "Inference Inflection" par les observateurs du secteur. Après des années où les investissements se concentraient sur l'entraînement des modèles, l'argent afflue désormais vers les couches d'inférence et d'orchestration, jugées indispensables à toute mise en production sérieuse. En parallèle, la recherche explore de nouvelles pistes pour répondre aux limites de mémoire des modèles : le papier "Language Models Need Sleep", remarqué cette semaine, propose un mécanisme de consolidation inspiré du sommeil humain, qui convertit le contexte récent en poids permanents avant de vider le cache, préservant la latence à l'exécution tout en étendant la mémoire long terme. Les prochains mois diront si ces valorisations tiennent, mais la direction est claire : l'infrastructure d'inférence est devenue le terrain où se joue la prochaine phase de l'IA.

Impact France/UE

La concentration des investissements dans la couche d'inférence IA autour d'acteurs américains renforce la dépendance potentielle des entreprises et startups européennes vis-à-vis de fournisseurs extra-européens pour leurs déploiements en production.

💬 L'analyse de Mathieu

x3,75 en sept mois pour Fireworks, c'est pas une levée, c'est un signal. Le modèle devient une commodité, et l'argent coule maintenant vers la couche qui permet d'en changer à volonté sans se retrouver piégé avec un seul fournisseur. Bon, reste à voir si ça tient quand AWS ou Google décident de proposer ça en bundle.

Dans nos dossiers

Alibaba Qwen3 Claude Opus DeepSeek

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Le Big Data

Startup IA Baseten : une levée de 1,5 milliard de dollars en préparation

Baseten, startup américaine spécialisée dans l'inférence IA et fondée en 2019 à San Francisco par Tuhin Srivastava, Amir Haghighat et Pankaj Gupta, serait sur le point de finaliser une levée de fonds de 1,5 milliard de dollars qui valoriserait l'entreprise à 13 milliards de dollars. L'opération, révélée par le Wall Street Journal, impliquerait un consortium d'investisseurs de premier plan comprenant Spark Capital, Sands Capital, Altimeter Capital et Wellington Management. Ce qui rend cette transaction particulièrement frappante, c'est sa rapidité : en janvier 2026, Baseten bouclait déjà une série E de 300 millions de dollars à 5 milliards de valorisation, elle-même précédée d'une série D de 150 millions quelques mois plus tôt. En moins de six mois, la valorisation de la startup aurait ainsi progressé de 160 %. À noter toutefois que cette nouvelle opération reposerait sur une structure de "valorisation fractionnée" : certains investisseurs se seraient positionnés à 13 milliards, d'autres autour de 11 milliards, une pratique de plus en plus courante dans l'écosystème IA pour attirer des capitaux tout en affichant des chiffres ambitieux. Cette trajectoire fulgurante illustre un basculement structurel dans la chaîne de valeur de l'intelligence artificielle. L'entraînement des grands modèles a longtemps concentré l'essentiel des investissements et de l'attention médiatique, mais c'est désormais l'inférence, c'est-à-dire l'exécution concrète des modèles à chaque requête utilisateur, qui devient le nerf de la guerre économique. À mesure que les entreprises déploient des applications génératives à grande échelle, les coûts d'inférence deviennent un facteur déterminant de rentabilité. Baseten propose d'optimiser cet acheminement en orientant les requêtes vers les modèles les plus adaptés selon le rapport performance-coût, favorisant parfois des alternatives open source face aux modèles propriétaires dominants. Pour les entreprises dont les usages IA se généralisent, cette optimisation peut représenter des économies considérables. Baseten s'inscrit dans un segment d'infrastructure IA en pleine consolidation, aux côtés d'acteurs comme Together AI, Fireworks AI ou Modal, tous en compétition pour capter la demande croissante d'exécution de modèles à moindre coût. La startup avait su se distinguer en attirant des clients entreprises cherchant à maîtriser leurs dépenses opérationnelles liées à l'IA, un positionnement qui prend de la valeur à mesure que la phase d'expérimentation laisse place au déploiement industriel. Si cette levée se concrétise, Baseten disposerait des ressources pour accélérer son développement commercial et renforcer ses capacités techniques à un moment où la demande d'inférence optimisée ne montre aucun signe de ralentissement. La prochaine étape logique pour une startup à cette valorisation serait une introduction en bourse, mais dans un marché aussi volatile, les fondateurs pourraient préférer consolider leur position avant de franchir ce cap.

💬 160% de valorisation en six mois, ça ressemble à de la fièvre, mais le fond est solide : l'inférence est en train de dépasser l'entraînement comme centre de gravité économique de l'IA. Quand tu déploies à grande échelle, c'est là que la facture explose, et les entreprises commencent à vraiment le sentir passer. La "valorisation fractionnée" à 11 ou 13 milliards selon les investisseurs, c'est un détail qui dit beaucoup sur comment ces deals se fabriquent.

BusinessOpinion

1 source

2The Information AI

Baseten, fournisseur d'inférence IA, en discussion pour lever 1 milliard de dollars à une valorisation de 11 milliards

Baseten, une startup américaine spécialisée dans l'inférence IA, serait en négociations avancées pour lever 1 milliard de dollars auprès d'investisseurs, selon une source proche du dossier. La transaction valoriserait l'entreprise à 11 milliards de dollars, soit plus du double de sa valorisation précédente de 5 milliards de dollars, annoncée il y a seulement trois mois. Cette accélération s'appuie sur une croissance rapide des revenus de la startup, qui loue des serveurs Nvidia équipés de GPU aux développeurs d'applications et les accompagne dans l'entraînement, la personnalisation et le déploiement de modèles d'IA principalement open source. Une telle levée placerait Baseten parmi les startups d'infrastructure IA les mieux financées au monde. Son positionnement sur la couche d'inférence, c'est-à-dire l'étape où les modèles répondent aux requêtes en production, répond à une demande explosive des entreprises qui souhaitent déployer leurs propres modèles sans gérer eux-mêmes la complexité matérielle et logicielle. Le recours croissant aux modèles open source comme LLaMA ou Mistral renforce cette dynamique, car ces modèles nécessitent une infrastructure dédiée que peu d'équipes peuvent construire en interne. Baseten s'inscrit dans une vague plus large de consolidation autour des fournisseurs d'inférence, un segment qui attire des capitaux massifs alors que la course au déploiement IA s'intensifie. Des concurrents comme Together AI, Fireworks AI ou Modal se disputent le même marché. La capacité de Baseten à doubler sa valorisation en un trimestre témoigne de l'appétit des investisseurs pour les acteurs qui contrôlent la plomberie des systèmes IA en production, indépendamment des laboratoires de recherche.

UEImpact indirect : les entreprises françaises et européennes qui déploient des modèles open source comme Mistral dépendent de fournisseurs d'inférence dont la consolidation peut influencer les prix et l'offre de services, mais aucun impact direct sur la France ou l'UE.

BusinessActu

1 source

3AI Business

OpenAI valorisée à 852 milliards de dollars après une nouvelle levée de fonds

OpenAI vient de boucler un nouveau tour de financement qui porte sa valorisation à 852 milliards de dollars, consolidant ainsi sa position parmi les entreprises privées les plus valorisées au monde. La société, fondatrice de ChatGPT et des modèles GPT-4, franchit ce cap au terme d'une levée de fonds dont le montant exact n'a pas été précisé, mais qui reflète l'appétit persistant des investisseurs pour les acteurs dominants de l'IA générative. Cette valorisation place OpenAI dans une catégorie rarissime, aux côtés de géants technologiques non cotés comme SpaceX. Pour l'industrie, le signal est clair : les capitaux continuent de se concentrer massivement sur un nombre restreint d'acteurs capables de déployer des modèles à grande échelle, creusant l'écart avec les concurrents moins bien dotés. Les partenaires commerciaux et développeurs qui s'appuient sur l'API OpenAI y liront une garantie supplémentaire de pérennité. Cette levée intervient dans un contexte de compétition intense entre OpenAI, Google DeepMind, Anthropic et Meta sur le front des grands modèles de langage. Après avoir converti son statut en entreprise à but lucratif début 2025, OpenAI cherche à financer le développement de ses prochaines générations de modèles et l'expansion de son infrastructure de calcul. Une introduction en bourse reste évoquée à moyen terme, et cette valorisation en constituerait le plancher de référence.

UELes entreprises et développeurs européens qui s'appuient sur l'API OpenAI peuvent interpréter cette valorisation comme un signal de pérennité, sans impact réglementaire ou économique direct sur la France ou l'UE.

BusinessActu

1 source

4Le Big Data

Tesla scelle un accord IA à 2 milliards dans le plus grand secret

Tesla a discrètement révélé, dans son rapport trimestriel 10-Q déposé en avril 2026 auprès de la Securities and Exchange Commission, avoir conclu un accord d'acquisition d'une entreprise spécialisée dans le matériel d'intelligence artificielle. Le montant maximal atteint 2 milliards de dollars, réglés principalement en actions Tesla. Particularité notable : environ 1,8 milliard de ces dollars sont conditionnés à des objectifs de performance et à la réussite du déploiement technologique de la cible. Aucun nom d'entreprise, aucun secteur précis ne sont mentionnés dans le document, une discrétion inhabituelle, même dans une industrie pourtant peu avare de confidentialité. C'est le site spécialisé Electrek qui a repéré cette unique ligne enfouie dans le rapport réglementaire. Cette acquisition s'inscrit dans une accélération brutale des investissements de Tesla dans l'IA. L'entreprise prévoit de porter ses dépenses d'investissement à environ 25 milliards de dollars en 2026, contre 8,5 milliards l'année précédente, une part significative étant fléchée vers l'intelligence artificielle et les infrastructures matérielles. La structure du deal, majoritairement soumise à des conditions de performance, suggère que la cible est une société encore en phase de maturation, dont le potentiel n'est pas totalement validé, mais dont les compétences sont jugées stratégiques. Ce type de montage sert également à fidéliser les talents clés via des attributions d'actions. En réduisant sa dépendance à des fournisseurs externes dans la chaîne du hardware IA, Tesla cherche à maîtriser un maillon devenu critique pour ses ambitions dans la conduite autonome et la robotique. Plusieurs indices permettent de cerner la nature probable de la cible. Elon Musk a récemment confirmé que Tesla avait finalisé la conception de sa puce propriétaire AI5, destinée à ses futurs systèmes de conduite autonome, dont la production devrait être confiée à un fondeur externe. Dans le même temps, Intel a rejoint Terafab, une coentreprise de fabrication de semi-conducteurs soutenue par Tesla, SpaceX et xAI, le timing n'étant vraisemblablement pas fortuit. Par ailleurs, Tesla a annoncé l'arrêt programmé des Model S et Model X pour libérer des capacités de production sur son site de Fremont, au profit des technologies autonomes et de la robotique. Du côté de SpaceX, Reuters rapporte que l'entreprise évalue à 28 500 milliards de dollars le marché potentiel lié à ses activités, dont 26 500 milliards pour la seule IA. Ces chiffres spectaculaires illustrent l'ampleur d'un pari industriel qui dépasse largement le secteur automobile : pour l'écosystème Musk, le hardware IA est désormais le véritable terrain de la compétition.

BusinessOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic