Aller au contenu principal

Business — page 3

942 articles · page 3 sur 19

Actualités business de l'IA : levées de fonds, acquisitions, startups, valorisations et tendances du marché.

Anthropic envisage une introduction en bourse, signe de la maturité de l'IA en entreprise
101AI News BusinessOpinion

Anthropic envisage une introduction en bourse, signe de la maturité de l'IA en entreprise

Anthropic prépare une introduction en bourse qui constitue un tournant symbolique pour l'industrie de l'intelligence artificielle générative. L'entreprise fondée par Dario et Daniela Amodei, valorisée à plusieurs dizaines de milliards de dollars, franchit ainsi le seuil qui sépare la phase de recherche à capital-risque d'un statut de fournisseur d'infrastructure d'entreprise à part entière. William Samengo-Turner, responsable du secteur technologique chez le cabinet juridique A&O Shearman, résume l'enjeu : "La vraie question n'est pas de savoir si les marchés publics sont prêts pour l'IA, mais si l'IA est prête pour les marchés publics." Karthik Hariharan, ingénieur senior chez DoorDash, observe pour sa part qu'Anthropic et OpenAI se livrent une course à l'IPO, et que le premier à franchir la ligne "fixera probablement le plancher et le plafond des valorisations pour les 12 à 18 mois suivants." Cette cotation en bourse redéfinit concrètement la relation entre Anthropic et ses clients professionnels. Les entreprises qui intègrent Claude dans leurs workflows internes pourront désormais planifier sur plusieurs années autour de grilles tarifaires, de limites d'API et de contrats de service formalisés. Mais l'équation est contrainte : entraîner chaque nouvelle génération de modèles nécessite des dizaines de milliers de GPU et des dépenses d'investissement massives, que la structure des marchés publics oblige à répercuter de façon prévisible sur les clients. Si Wall Street exige une expansion agressive des marges post-IPO, les entreprises devront anticiper des conditions de licence plus strictes et l'abandon progressif des versions de modèles les moins rentables, créant des cycles de migration forcée pour les équipes de développement. Le modèle économique sous-jacent révèle une dépendance structurelle au marché B2B. Suvrankar Datta, chercheur au CRASH Lab, le chiffre sans détour : sur huit milliards d'êtres humains, seulement 100 millions peuvent se permettre de payer Claude au tarif actuel, et les 20 dollars mensuels de l'abonnement grand public ne financent pas des clusters de serveurs à plusieurs milliards de dollars. La survie financière d'Anthropic repose donc sur son ancrage dans les budgets des grandes organisations, à travers des usages comme la gestion des ressources humaines, la revue de documents juridiques ou le tri du support client. Nate Elliott, analyste IA chez Emarketer, pointe la tension centrale : "Claude a construit une base d'utilisateurs enterprise solide, mais il n'est pas compétitif en tant que plateforme IA grand public." La cotation d'Anthropic sera ainsi le premier test grandeur nature pour savoir si Wall Street considère l'IA comme une histoire de consommateurs ou comme une infrastructure industrielle.

UELes entreprises européennes intégrant Claude dans leurs workflows devront anticiper des révisions tarifaires et des conditions contractuelles plus strictes imposées par les exigences de rentabilité des marchés publics.

1 source
5 stratégies pour maîtriser les coûts liés à l'IA en entreprise
102The Information AI 

5 stratégies pour maîtriser les coûts liés à l'IA en entreprise

Le PDG de Snowflake, Sridhar Ramaswamy, a reconnu publiquement lundi, lors de la conférence annuelle de son entreprise à San Francisco, que les dépenses en intelligence artificielle représentent une source d'inquiétude croissante, même pour les plus grands acteurs du secteur. Snowflake, cliente d'Anthropic, d'OpenAI et d'autres fournisseurs, fait partie des entreprises qui ont développé des stratégies concrètes pour maîtriser ces coûts. Parmi les méthodes les plus répandues, les routeurs de modèles permettent d'orienter automatiquement chaque tâche vers le modèle le moins cher adapté à la situation : Snowflake et Palo Alto Networks ont conçu leurs propres routeurs, et une startup du BTP a utilisé Claude d'Anthropic pour construire le sien, sans que l'outil ne favorise les modèles Anthropic pour autant. L'éditeur de logiciels UiPath a quant à lui réduit de plus de 90 % les coûts de certaines tâches grâce au prompt engineering, en limitant simplement la phase de "réflexion" du modèle avant exécution, selon son directeur de la sécurité Scott Roberts. D'autres entreprises fixent des plafonds de tokens par employé ou réservent les modèles avancés aux profils techniques : chez Zscaler, les ingénieurs logiciels accèdent à OpenAI Codex, mais pas les équipes commerciales ou juridiques. Ces arbitrages traduisent une prise de conscience généralisée : l'accès illimité aux modèles les plus puissants peut générer des factures incontrôlables sans garantir un retour sur investissement proportionnel. Le vice-président de Zscaler Dhawal Sharma résume la philosophie émergente : "utiliser un très grand modèle pour résoudre un problème simple est un mauvais usage des ressources." Chez Novo Nordisk, l'analyse de données issues d'essais cliniques via Claude d'Anthropic a conduit les équipes à réaliser que la version standard du modèle suffisait dans de nombreux cas, ouvrant la voie à des économies substantielles. Plus largement, certaines entreprises choisissent de revenir à des logiciels traditionnels, plus adaptés aux tâches structurées et répétitives, plutôt que de systématiser le recours à l'IA. Cette rationalisation intervient alors que les fournisseurs de modèles continuent d'augmenter leurs tarifs, alimentant un débat intense sur la rentabilité réelle de l'IA en entreprise. Les directions informatiques se retrouvent à arbitrer entre la demande des équipes métiers, désireuses d'accéder aux outils les plus performants, et la nécessité de contenir les budgets. Des solutions tierces comme OpenRouter, qui proposent du routage à la demande, commencent à structurer un marché naissant de l'optimisation des coûts IA. À mesure que la concurrence s'intensifie entre fournisseurs, une baisse mécanique des prix est attendue, mais d'ici là, les entreprises qui maîtrisent l'ingénierie des coûts IA pourraient transformer cette contrainte en avantage compétitif durable.

UENovo Nordisk (Danemark) est cité comme exemple d'entreprise européenne rationalisant ses coûts IA pour l'analyse de données d'essais cliniques, une tendance directement pertinente pour les DSI européens confrontés aux mêmes pressions budgétaires.

BusinessActu
1 source
NP COMPANY lève 6 millions d’euros avec le soutien des cofondateurs de Mistral AI et du fondateur de Dataiku
103FrenchWeb 

NP COMPANY lève 6 millions d’euros avec le soutien des cofondateurs de Mistral AI et du fondateur de Dataiku

NP Company, une startup parisienne issue des laboratoires de l'Inria, a annoncé une levée de fonds de 6 millions d'euros. Le tour de table réunit des investisseurs de premier plan, dont les cofondateurs de Mistral AI et le fondateur de Dataiku, Florian Douetteau. La jeune pousse développe des logiciels d'intelligence artificielle destinés à la conception d'objets physiques complexes : avions, réacteurs nucléaires, composants électroniques et centres de données. Ce financement signe la montée en puissance d'un segment encore peu médiatisé de l'IA : les outils de simulation et d'ingénierie assistée par intelligence artificielle. Les secteurs industriels concernés, aéronautique, énergie et semiconducteurs, sont réputés pour leurs cycles de développement longs et leurs coûts de prototypage massifs. En accélérant la phase de conception, NP Company promet des gains de temps et d'argent significatifs pour des industries où une erreur de calcul peut coûter des centaines de millions d'euros. L'émergence de NP Company s'inscrit dans une tendance plus large où la France ambitionne de transformer sa recherche fondamentale en champions industriels de l'IA. L'Inria, incubateur d'où est sortie la startup, a déjà contribué à former plusieurs équipes qui ont rejoint Mistral AI. La présence des cofondateurs de Mistral au capital n'est pas anodine : elle signale que l'IA générative commence à irriguer des domaines d'ingénierie complexes, traditionnellement dominés par des logiciels lourds comme ceux d'Ansys ou Siemens. Cette levée devrait permettre à NP Company de recruter et d'accélérer ses déploiements chez des industriels.

UEStartup française issue de l'Inria, NP Company cible des secteurs industriels stratégiques pour l'Europe (aéronautique, nucléaire, semiconducteurs) et bénéficie du soutien des cofondateurs de Mistral AI et du fondateur de Dataiku, signalant la montée en puissance de l'IA d'ingénierie dans l'écosystème français.

BusinessActu
1 source
Alphabet prépare un financement géant de 80 milliards de dollars pour l’IA
104Le Big Data 

Alphabet prépare un financement géant de 80 milliards de dollars pour l’IA

Alphabet, la maison mère de Google, a annoncé son intention de lever jusqu'à 80 milliards de dollars pour financer l'expansion de ses infrastructures d'intelligence artificielle. L'opération passe notamment par une émission d'actions en bourse, ainsi qu'une vente privée de 10 milliards de dollars d'actions à Berkshire Hathaway, le conglomérat de Warren Buffett. Cette levée vise à financer la construction et l'extension de centres de données, l'acquisition de processeurs spécialisés et le renforcement des réseaux cloud à l'échelle mondiale. Sundar Pichai, PDG d'Alphabet, avait déjà signalé lors de la conférence Google I/O 2026 que le groupe prévoyait d'investir entre 180 et 190 milliards de dollars d'ici la fin de l'année pour soutenir l'ensemble de ses infrastructures technologiques et ses services IA. L'entreprise justifie cette opération par une demande qui dépasse ses capacités actuelles, aussi bien auprès des entreprises que du grand public. L'entrée de Berkshire Hathaway dans ce tour de table n'est pas anodine : elle signale que des investisseurs historiquement très prudents considèrent désormais les infrastructures IA comme un placement stratégique de premier ordre. Pour les entreprises clientes, les conséquences sont directes : les fournisseurs cloud capables de financer ces infrastructures massives disposeront d'un avantage concurrentiel déterminant sur les prix, les performances et la disponibilité des services. Alphabet doit à la fois soutenir l'intégration de l'IA dans ses produits existants, Search, Workspace, Android, Gemini, et répondre à la montée en puissance de concurrents comme OpenAI, Microsoft et Amazon, qui investissent eux aussi à des niveaux sans précédent dans la puissance de calcul. Cette opération s'inscrit dans une course industrielle mondiale dont l'ampleur était encore impensable il y a trois ans. Selon Bloomberg, les grands groupes technologiques pourraient investir collectivement jusqu'à 700 milliards de dollars cette année dans l'IA. L'entraînement et l'inférence des grands modèles de langage exigent des infrastructures toujours plus coûteuses, transformant la puissance de calcul en principal facteur de différenciation entre acteurs. Pendant des années, les dépenses cloud des hyperscalers se comptaient en dizaines de milliards ; l'IA générative a changé d'échelle. Alphabet présente cette levée comme une approche équilibrée pour financer sa croissance sans fragiliser son bilan, mais le message de fond est clair : dans la bataille pour l'IA, les capacités d'investissement détermineront qui fixe les règles du jeu pour la décennie à venir.

UELes entreprises européennes clientes du cloud Google pourraient bénéficier d'une meilleure disponibilité et de tarifs plus compétitifs, mais cette concentration des investissements accentue la dépendance technologique de l'Europe envers les hyperscalers américains.

💬 Buffett qui entre dans le tour de table, c'est le truc que tu peux montrer à n'importe quel CFO sceptique. Pas de la spéculation, un vrai calcul de rentabilité sur des datacenters à 20 ans, et ça, ça veut dire que l'argent conservateur considère l'infra IA comme de l'immobilier. À 700 milliards d'investissement collectif cette année, la bataille n'est plus sur les modèles, c'est une guerre de silicium et d'électricité.

BusinessOpinion
1 source
L'IA peut désormais gérer votre administration
105MIT Technology Review 

L'IA peut désormais gérer votre administration

L'actualité de l'IA cette semaine illustre à la fois son essor commercial et les tensions qu'il suscite. Anthropic, la startup fondée par d'anciens membres d'OpenAI, a déposé confidentiellement un dossier d'introduction en bourse et vise une entrée sur les marchés dès cet automne, possiblement avant OpenAI elle-même, sans dévoiler de valorisation cible. En parallèle, la Floride est devenue le premier État américain à poursuivre OpenAI en justice, accusant ChatGPT de mettre en danger la sécurité des enfants et de faire primer le profit sur la sûreté publique, selon le procureur général James Uthmeier. Du côté de la cybersécurité, des hackers ont pris le contrôle de comptes Instagram de célébrités en exploitant Meta AI : en demandant simplement des informations d'accès à l'assistant, ils ont contourné les protections habituelles. Enfin, l'Union européenne envisage d'exclure les géants américains du cloud, notamment Amazon, Microsoft et Google, des contrats liés aux infrastructures critiques, dans le cadre d'un effort de souveraineté numérique accéléré par les tensions commerciales avec Washington. Ces événements convergent pour dessiner un secteur à un tournant décisif. L'IPO d'Anthropic s'inscrit dans une course au capital où être premier en bourse pourrait donner un avantage symbolique et financier considérable face à OpenAI, attendue juste après la cotation de SpaceX, valorisée à mille milliards de dollars. La poursuite floridienne signale que la patience des régulateurs américains s'amenuise face aux risques supposés des chatbots grand public, une préoccupation qui pousse déjà plusieurs plateformes à intégrer des vérifications d'âge. La faille Meta AI révèle un risque systémique croissant : déléguer le support client à des intelligences artificielles crée de nouveaux vecteurs d'attaque que les équipes de sécurité n'ont pas encore pleinement anticipés. Pour les petites entreprises, en revanche, l'IA représente une opportunité concrète : les modèles actuels peuvent déjà gérer la comptabilité de base, la facturation, la prise de notes ou la planification des réseaux sociaux, des tâches autrefois réservées aux structures capables d'embaucher des spécialistes. Ces développements s'inscrivent dans un contexte où l'IA s'est imposée en moins de quatre ans comme un enjeu géopolitique, économique et social de premier ordre. La décision européenne d'écarter les fournisseurs américains reflète une défiance croissante vis-à-vis de la dépendance technologique envers les États-Unis, renforcée par les politiques commerciales de l'administration Trump. Pendant ce temps, des universités chinoises affiliées à l'armée cherchent à se procurer des puces Nvidia en dépit des restrictions américaines à l'exportation, et Pékin développerait des outils capables de prédire la dissidence politique. Sur le front scientifique, Meta, Anthropic et DeepMind auraient intensifié leurs recherches sur la conscience des machines, ouvrant un débat philosophique que la communauté scientifique commence à prendre au sérieux. L'ensemble du secteur avance à une vitesse que les cadres réglementaires, les protocoles de sécurité et les normes éthiques peinent encore à suivre.

UEL'UE envisage d'exclure Amazon, Microsoft et Google des contrats d'infrastructures critiques, une décision qui pourrait remodeler le marché du cloud souverain européen et accélérer l'adoption de solutions locales.

💬 L'IA qui gère ton administration, c'est pas du flan, les modèles actuels font vraiment le boulot sur la compta de base ou la facturation. Mais la faille Meta AI cette semaine rappelle un truc simple : brancher un assistant sur des processus sensibles sans repenser la sécurité, c'est offrir un boulevard aux attaquants. Bon, on le savait, mais là c'est plus théorique.

BusinessReglementation
1 source
☕️ Alphabet veut lever 80 milliards : l’IA se finance à crédit même quand on s’appelle Google
106Next INpact 

☕️ Alphabet veut lever 80 milliards : l’IA se finance à crédit même quand on s’appelle Google

Alphabet, la maison mère de Google, a annoncé lundi 1er juin une levée de fonds de 80 milliards de dollars structurée en trois tranches distinctes. La première porte sur 30 milliards de dollars sous forme d'obligations convertibles en actions, la deuxième sur 40 milliards d'actions émises au prix du marché à partir du troisième trimestre 2026, et la troisième sur un placement privé de 10 milliards de dollars souscrit par Berkshire Hathaway, le conglomérat financier longtemps dirigé par Warren Buffett. Cette opération vise à financer l'expansion des infrastructures d'intelligence artificielle générative du groupe, dont le budget d'investissement est estimé entre 180 et 190 milliards de dollars pour la seule année 2026. Google précise par ailleurs avoir déjà contracté 85 milliards de dollars de dette bancaire en 2025, portant son encours total à plus de 100 milliards de dollars. Ce choix de recourir aux marchés financiers interpelle pour une entreprise valorisée 4 500 milliards de dollars en bourse et ayant généré 174 milliards de dollars de cash flow opérationnel en 2025. Mais la logique est industrielle : déployer un tel volume de capitaux sur ses seuls fonds propres fragiliserait la flexibilité financière du groupe et pèserait sur son bilan. En maintenant un endettement maîtrisé et en diluant légèrement ses actionnaires, Alphabet préserve sa capacité de manœuvre pour d'éventuelles acquisitions ou retournements de conjoncture. L'opération témoigne surtout de l'ampleur des investissements que requiert la course aux datacenters : même les géants les mieux capitalisés du secteur ne peuvent plus financer leur transformation IA sur leurs seules liquidités. Cette levée de fonds s'inscrit dans une dynamique sectorielle qui dépasse largement Google. Microsoft, Amazon et Meta multiplient eux aussi les montages financiers complexes pour accélérer leurs infrastructures, tandis qu'OpenAI, xAI et Anthropic lèvent des dizaines de milliards auprès d'investisseurs institutionnels et souverains. L'entrée de Berkshire Hathaway au capital d'Alphabet, même symbolique, marque une validation forte de la thèse IA par les investisseurs traditionnels les plus conservateurs. Côté fondamentaux, Google affiche une croissance de son chiffre d'affaires de 63 % en glissement annuel au premier trimestre 2026, avec un carnet de commandes ayant quasiment doublé en un trimestre pour dépasser 460 milliards de dollars, dont la moitié devrait être convertie en revenus dans les 24 prochains mois. L'IA est désormais moins un pari qu'une machine à commandes, mais une machine dont le coût d'alimentation oblige même les plus riches à emprunter.

UEL'écart croissant entre les capacités d'investissement dans les infrastructures IA américaines et européennes fragilise durablement la compétitivité du secteur technologique européen.

💬 Quand la boîte la mieux capitalisée du monde doit quand même aller sur les marchés, ça remet les chiffres à l'échelle : même 174 milliards de cash flow annuel ne tiennent plus le rythme des datacenters IA. L'entrée de Berkshire dans la danse, c'est la signature des derniers sceptiques institutionnels. Pour les acteurs européens qui regardent ça de loin, c'est le genre de chiffres qui fait mal à lire.

Google lève des fonds en IA ; Anthropic envisage une introduction en Bourse
107The Information AI 

Google lève des fonds en IA ; Anthropic envisage une introduction en Bourse

Google a annoncé lundi qu'il prévoit de lever 80 milliards de dollars en capital via des actions, dans le cadre de son plan de financement pour l'intelligence artificielle. Cette levée de fonds s'ajoute aux 85 milliards de dollars déjà empruntés au cours de la seule année passée. Au total, ce sont donc près de 165 milliards de dollars que le géant de Mountain View cherche à mobiliser pour alimenter sa stratégie IA, un montant colossal même à l'échelle des grandes manœuvres financières qui secouent régulièrement le secteur technologique. Ce qui rend cette annonce particulièrement frappante, c'est que Google n'est pas une startup en quête de survie. Ses activités ont généré 164,7 milliards de dollars de trésorerie avant dépenses d'investissement en 2025, ce qui en fait l'une des machines à cash les plus puissantes de la planète. Pourtant, même cette capacité bénéficiaire hors norme ne suffit pas à financer seule la course à l'IA. Cela envoie un signal fort à l'ensemble de l'industrie : les exigences en capital de l'IA sont si massives qu'elles dépassent la capacité d'autofinancement même des entreprises les plus rentables au monde. La situation de Google illustre une réalité structurelle du secteur : développer des systèmes d'IA frontière est autant un défi financier qu'un défi technologique. Des entreprises comme OpenAI ou Anthropic, qui ne dégagent pas encore de bénéfices, multiplient elles aussi les levées de fonds géantes depuis plusieurs années. La différence, c'est que Google avait jusqu'ici la réputation de pouvoir financer ses ambitions sur ses propres flux de trésorerie. Ce changement de stratégie suggère que l'accélération des investissements en infrastructure IA, centres de données, puces et modèles, entre dans une nouvelle phase d'intensité, où même les géants les plus solides doivent réinventer leur ingénierie financière pour rester dans la course.

UEL'ampleur des capitaux mobilisés par les géants américains pour l'IA creuse davantage le fossé avec les capacités d'investissement européennes, renforçant les inquiétudes sur la compétitivité des acteurs européens dans la course à l'IA frontière.

BusinessOpinion
1 source
Les modèles OpenAI et Codex sont désormais disponibles sur Amazon Bedrock
108AWS ML Blog 

Les modèles OpenAI et Codex sont désormais disponibles sur Amazon Bedrock

OpenAI et Amazon Web Services ont rendu officiellement disponibles, début juin 2026, GPT-5.5, GPT-5.4 et l'agent de code Codex sur Amazon Bedrock, un mois après l'annonce de leur partenariat élargi. Les trois modèles sont désormais accessibles en production via le catalogue Bedrock, avec une tarification identique à celle pratiquée directement par OpenAI, sans frais supplémentaires. GPT-5.5, le modèle le plus avancé de la gamme, excelle dans les tâches agentiques complexes : rédaction et débogage de code sur de grandes bases, analyse de données, génération de documents, et exécution autonome de séquences multi-étapes. Codex, l'agent de développement logiciel d'OpenAI, comptabilise plus de 5 millions d'utilisateurs hebdomadaires et est désormais accessible via l'application Codex, le CLI, ainsi que les intégrations IDE pour Visual Studio Code, JetBrains et Xcode, avec toute l'inférence routée par Bedrock. Pour les entreprises, cette disponibilité générale représente un changement opérationnel concret : les appels aux modèles OpenAI s'intègrent désormais dans les engagements AWS existants, comptent dans les crédits contractuels, et bénéficient des mécanismes de gouvernance déjà en place, notamment les permissions IAM, l'isolation réseau via VPC et PrivateLink, le chiffrement KMS et les journaux d'audit CloudTrail. Bedrock garantit par ailleurs une file d'attente isolée par client avec gestion automatique de la capacité, ce qui assure une performance prévisible même sous forte charge. Fait notable pour les secteurs réglementés : les prompts et réponses ne sont pas utilisés pour entraîner les modèles, et ne sont pas partagés avec OpenAI. Amgen, le géant pharmaceutique, a déjà exprimé son intérêt, son directeur technique Sean Bruich soulignant la qualité et la consistance de GPT-5.5 pour des contextes où la précision scientifique est critique. Ce déploiement s'inscrit dans une dynamique de consolidation entre les grands fournisseurs de cloud et les développeurs de modèles frontière. OpenAI cherche à multiplier les canaux de distribution pour ses modèles, en s'appuyant sur les infrastructures cloud existantes pour atteindre des clients enterprise déjà engagés avec AWS, plutôt que de les forcer à migrer vers une API directe. Pour Amazon, intégrer GPT-5.5 aux côtés de ses propres modèles Titan et des offres Anthropic et Mistral déjà disponibles sur Bedrock renforce le positionnement de la plateforme comme guichet unique du marché des modèles. L'enjeu sous-jacent est la rétention des dépenses cloud enterprise : en faisant compter l'usage d'OpenAI dans les engagements AWS, les deux sociétés créent une friction supplémentaire contre la migration vers Azure ou Google Cloud, où GPT-5.5 est également accessible.

UELes entreprises européennes sous contrat AWS peuvent désormais accéder aux modèles GPT-5.5 et Codex via Bedrock avec des garanties de conformité adaptées au RGPD (données non utilisées pour l'entraînement, isolation réseau VPC, chiffrement KMS), facilitant l'adoption dans les secteurs réglementés.

Pendant qu’OpenAI réfléchit encore, Anthropic fonce vers la Bourse
109Le Big Data 

Pendant qu’OpenAI réfléchit encore, Anthropic fonce vers la Bourse

Anthropic a déposé le 1er juin 2026 un formulaire S-1 confidentiel auprès de la Securities and Exchange Commission (SEC), franchissant ainsi l'étape réglementaire incontournable pour préparer une introduction en bourse aux États-Unis. L'entreprise fondatrice de Claude précise que l'opération dépendra des conditions de marché et d'autres facteurs, mais le dépôt confidentiel lui donne désormais l'option de procéder rapidement si les conditions sont réunies. La nouvelle intervient dans un contexte financier vertigineux pour la société : Anthropic affirme avoir levé 65 milliards de dollars lors de son dernier tour de financement, portant sa valorisation à 965 milliards de dollars, soit nettement au-dessus des 730 milliards estimés pour OpenAI. Ce mouvement place Anthropic en position de devenir la première grande entreprise d'IA générative à accéder aux marchés publics, devançant OpenAI dont le projet d'IPO reste enveloppé d'incertitudes. Pour l'industrie, l'enjeu est considérable : une introduction en bourse réussie constituerait un test grandeur nature de l'appétit réel des marchés pour des valorisations aussi astronomiques. Les investisseurs institutionnels, qui ont injecté des sommes records dans les acteurs de l'IA depuis 2023, attendent depuis plusieurs années un signal concret sur la capacité de ces entreprises à justifier leurs multiples en tant que sociétés cotées. Un succès d'Anthropic en Bourse validerait un modèle économique encore contesté par certains analystes, et ouvrirait la porte à des levées de fonds encore plus importantes via les marchés. La trajectoire d'Anthropic est aussi une histoire personnelle. Fondée en 2021 par Dario Amodei, Daniela Amodei et plusieurs anciens cadres d'OpenAI ayant quitté l'entreprise après des divergences stratégiques sur la sécurité de l'IA, la société s'est construite dans l'ombre de son rival historique. Quelques années après sa création, alors que ChatGPT dominait le paysage médiatique, peu auraient parié qu'Anthropic accéderait aux marchés avant OpenAI. Ce dépôt confidentiel pourrait désormais déclencher une vague d'IPO dans le secteur : OpenAI est régulièrement cité comme prochain candidat, et xAI d'Elon Musk figure également parmi les entreprises observées de près par les analystes. Le marché des grandes sociétés d'IA non cotées est en train d'arriver à maturité, et Anthropic a choisi d'être la première à franchir le pas.

UELe succès ou l'échec de cette introduction en bourse influencera les valorisations des start-ups IA européennes et l'appétit des fonds d'investissement pour le secteur en Europe.

Anthropic, créateur de Claude, dépose une demande d'introduction en bourse auprès de la SEC
110The Decoder 

Anthropic, créateur de Claude, dépose une demande d'introduction en bourse auprès de la SEC

Anthropic, la société américaine à l'origine du chatbot Claude, a déposé confidentiellement auprès de la Securities and Exchange Commission (SEC) une demande d'enregistrement en vue d'une introduction en Bourse. Cette démarche, révélée récemment, intervient alors que l'entreprise est valorisée à près de mille milliards de dollars à la suite de son dernier tour de financement, un seuil qui la place parmi les sociétés privées les plus valorisées au monde. Une entrée en Bourse à cette valorisation représenterait l'une des plus grandes IPO de l'histoire de la tech. Elle permettrait à Anthropic de lever des capitaux frais pour financer l'entraînement de ses prochains modèles, une activité dont les coûts se comptent en milliards de dollars, tout en offrant une sortie à ses investisseurs actuels, parmi lesquels Amazon et Google, qui ont injecté des sommes considérables ces dernières années. Pour les marchés, l'arrivée d'Anthropic en Bourse constituerait un test grandeur nature de l'appétit des investisseurs pour les pure players de l'IA générative. La démarche s'inscrit dans une dynamique plus large : son rival OpenAI prépare lui aussi une introduction en Bourse, et la compétition pour attirer les capitaux institutionnels s'intensifie dans tout le secteur. Fondée en 2021 par d'anciens cadres d'OpenAI, dont Dario et Daniela Amodei, Anthropic s'est positionnée sur la sécurité de l'IA comme avantage différenciant. Le dépôt confidentiel signifie que les détails financiers resteront non publics jusqu'à la phase finale du processus, dont le calendrier précis n'a pas encore été annoncé.

UELa montée en puissance des IPO IA aux États-Unis accentue la pression sur l'Europe pour accélérer l'émergence de champions continentaux capables de rivaliser avec des acteurs désormais ancrés dans les marchés publics américains.

BusinessActu
1 source
Avec Anthropic, OpenAI et SpaceX, Wall Street s’apprête à vivre son plus grand cycle technologique depuis Internet
111FrenchWeb 

Avec Anthropic, OpenAI et SpaceX, Wall Street s’apprête à vivre son plus grand cycle technologique depuis Internet

Wall Street se prépare à entrer dans ce qui pourrait être le plus grand cycle d'introductions en Bourse depuis la bulle Internet des années 2000, porté par trois géants technologiques encore privés : Anthropic, OpenAI et SpaceX. Ces entreprises, valorisées chacune à des centaines de milliards de dollars, concentrent une attention inédite de la part des investisseurs institutionnels et des marchés publics, qui n'ont jusqu'ici pu y accéder qu'indirectement. Aucune date officielle n'a été annoncée, mais les signaux se multiplient indiquant que la fenêtre d'introduction se rapproche. L'enjeu est considérable pour les marchés financiers : une cotation d'OpenAI ou d'Anthropic représenterait une occasion rare pour les investisseurs particuliers et les fonds classiques d'entrer au capital des acteurs centraux de la révolution IA. Cela redistribuerait les flux de capitaux aujourd'hui concentrés chez quelques fonds de capital-risque et fonds souverains, tout en offrant une liquidité aux premiers actionnaires et employés de ces sociétés. Pendant plus d'une décennie, les entreprises technologiques les plus prometteuses ont délibérément évité la Bourse, préférant lever des dizaines de milliards en privé auprès de SoftBank, des fonds du Golfe ou de Microsoft, qui a investi plus de 13 milliards de dollars dans OpenAI. Cette stratégie a permis de croître sans la pression des marchés trimestriels, mais les valorisations atteignent désormais des niveaux qui rendent une sortie en Bourse quasi inévitable pour offrir de la liquidité aux investisseurs historiques et financer la prochaine phase d'expansion.

UELes fonds institutionnels et investisseurs particuliers européens pourraient pour la première fois accéder directement aux principaux acteurs de l'IA via les marchés publics, redistribuant des flux de capitaux aujourd'hui monopolisés par quelques fonds américains et fonds souverains du Golfe.

BusinessOpinion
1 source
Asana rachète Stack AI pour renforcer ses agents IA no-code
112Le Big Data 

Asana rachète Stack AI pour renforcer ses agents IA no-code

Asana a annoncé l'acquisition de Stack AI, une startup spécialisée dans la création d'agents IA no-code et l'orchestration de workflows entre systèmes d'entreprise. L'opération, dont le montant n'a pas été divulgué, vise à doter la plateforme de gestion de projets d'une couche d'automatisation opérationnelle capable de connecter des environnements aussi divers que Salesforce, Oracle, AWS ou DocuSign. Stack AI s'est bâti une réputation solide dans les secteurs réglementés, santé, services financiers, services professionnels, précisément grâce à ses engagements en matière de gouvernance, de sécurité et de fiabilité des flux automatisés. L'intégration prévue associera les capacités d'exécution de Stack AI au "Work Graph" d'Asana, la couche de données organisationnelles qui structure projets, responsabilités et historiques de collaboration au sein des équipes. Cette acquisition répond à un problème concret que rencontre l'industrie : la plupart des solutions IA actuelles restent cantonnées à des usages individuels, résumer un document, répondre à une question, assister un employé dans une tâche isolée. Elles peinent à orchestrer des processus complets qui traversent plusieurs équipes et plusieurs logiciels. Avec Stack AI, Asana vise à passer du copilote personnel à l'automatisation opérationnelle à grande échelle. Les entreprises pourront concevoir des workflows qui traitent des demandes IT, des processus de conformité, du support client ou des opérations financières sans recourir à du développement logiciel complexe. L'enjeu devient ainsi opérationnel plutôt que conversationnel, ce qui représente un changement de paradigme significatif pour l'ensemble du marché des plateformes de collaboration. Asana se positionne depuis plusieurs mois sur la notion de "human-agent teams", des environnements où des agents IA travaillent collectivement avec des humains, avec validations, transferts de tâches, approbations et mémoire partagée, plutôt que d'opérer comme des outils parallèles déconnectés des opérations réelles. Le PDG Dan Rogers a formulé clairement l'ambition : selon lui, la valeur durable ne résidera pas dans les modèles IA eux-mêmes, mais dans la capacité des plateformes à coordonner outils, données, gouvernance et exécution métier dans un flux cohérent. Cette vision distingue Asana des acteurs focalisés sur les assistants conversationnels généralistes, et la place en concurrence directe avec des plateformes comme ServiceNow ou Microsoft 365 Copilot, qui cherchent eux aussi à devenir le système nerveux central de l'entreprise automatisée. L'intégration de Stack AI dans les produits AI Studio et AI Teammates d'Asana devrait être précisée dans les prochains mois.

UELes entreprises européennes en quête d'automatisation de workflows métier sans développement logiciel pourront à terme bénéficier de nouvelles capacités no-code, sans impact réglementaire direct sur la France ou l'UE.

BusinessOpinion
1 source
☕️ Brûler des tokens n’est pas travailler : Amazon ferme son classement IA interne
113Next INpact 

☕️ Brûler des tokens n’est pas travailler : Amazon ferme son classement IA interne

Amazon a mis fin à Kirorank, un classement interne qui mesurait la quantité de tokens consommés par ses employés sur Kiro, sa plateforme de développement assisté par intelligence artificielle. Conçu pour encourager l'adoption de l'IA, ce tableau de bord attribuait des scores en fonction du volume d'utilisation de l'outil, poussant les mieux classés vers le haut au fur et à mesure qu'ils généraient davantage d'interactions avec le modèle. Dave Treadwell, vice-président d'Amazon, a reconnu dans un mémo interne relayé par le Financial Times que le classement avait été créé avec de « bonnes intentions », avant d'inviter ses équipes à ne pas « utiliser l'IA simplement pour utiliser l'IA ». L'outil, décrit par Amazon comme un tableau de bord bêta non officiel, a depuis été abandonné. L'entreprise indique vouloir désormais suivre des indicateurs plus qualitatifs, comme les « déploiements normalisés », qui mesurent si le code produit grâce à l'IA est réellement utile et mis en production. Le problème est apparu rapidement : pour grimper dans le classement, certains employés avaient commencé à lancer des agents IA en boucle sur des tâches sans valeur ajoutée, une pratique baptisée « tokenmaxxing ». Cette optimisation artificielle des scores génère une consommation de ressources de calcul réelle, donc des coûts réels. À l'échelle d'une entreprise de la taille d'Amazon, où des milliers de développeurs sont concernés, la facture peut devenir significative. Le phénomène illustre un problème classique de management par les métriques : dès qu'un indicateur devient un objectif, il cesse de mesurer ce qu'il était censé mesurer. En l'occurrence, le volume de tokens ne dit rien de la qualité du travail produit, et peut même devenir contra-productif s'il incite à générer de l'activité artificielle plutôt qu'à résoudre de vrais problèmes. Amazon reste néanmoins sous pression pour accélérer l'intégration de l'IA dans ses processus internes. L'entreprise s'est fixé un objectif ambitieux : que 80 % de ses développeurs utilisent ces outils chaque semaine. Ce contexte d'adoption forcée, combiné à des investissements colossaux, dont 200 milliards de dollars consacrés aux infrastructures pour la seule année 2026, crée une tension entre la volonté d'afficher des chiffres d'adoption élevés et la nécessité de s'assurer que ces usages créent de la valeur concrète. L'épisode Kirorank rappelle que déployer l'IA en entreprise ne se résume pas à compter des tokens ou des utilisateurs actifs, mais exige de repenser entièrement la façon dont on mesure la productivité à l'ère des modèles de langage.

BusinessOpinion
1 source
Le jour d'indépendance de Microsoft dans l'IA
114The Information AI 

Le jour d'indépendance de Microsoft dans l'IA

Microsoft a ouvert mardi sa conférence annuelle Build 2026 à San Francisco, devant quelque 2 500 développeurs d'applications. L'événement prend cette année une coloration particulière : il survient deux mois après ce que la presse américaine a qualifié de "découplage conscient" entre Microsoft et OpenAI, et sert de vitrine officielle aux modèles d'intelligence artificielle que Microsoft développe désormais en propre, sans s'appuyer sur la technologie du créateur de ChatGPT ni sur celle d'Anthropic. Pour Microsoft, l'enjeu est de taille : prouver que sa division IA peut rivaliser de façon autonome sur un marché où OpenAI et Anthropic s'imposent comme références. Proposer ses propres modèles aux développeurs signifie réduire sa dépendance structurelle vis-à-vis d'un partenaire avec lequel les tensions se sont accumulées, tout en reprenant la main sur la chaîne de valeur. Pour les milliers d'équipes qui bâtissent des applications sur l'écosystème Microsoft, le signal est clair : une alternative interne existe désormais. Cette émancipation s'inscrit dans une reconfiguration profonde des alliances dans l'industrie de l'IA. Microsoft a investi des milliards de dollars dans OpenAI depuis 2019, intégrant ses modèles dans Azure, Copilot et Office. Mais la multiplication des acteurs, la montée en puissance des modèles open source et les frictions stratégiques entre les deux entreprises ont accéléré l'ambition de Redmond de contrôler sa propre pile technologique. Build 2026 marque symboliquement ce tournant.

UELes entreprises et développeurs européens qui s'appuient sur l'écosystème Microsoft (Azure, Copilot, Office 365) doivent anticiper une transition vers des modèles maison, avec des implications potentielles sur les contrats, les performances et la roadmap de leurs intégrations IA.

💬 Ça faisait longtemps que ça devait arriver. Mettre des milliards dans OpenAI tout en leur confiant toute la chaîne de valeur, c'est le genre de pari qui finit par se retourner contre toi. Bon, sur le papier c'est la bonne décision, mais leurs modèles maison vont devoir tenir la route face à Claude et GPT, pas juste sur les benchmarks.

BusinessOpinion
1 source
Pourquoi les ingénieurs déployés chez les clients font fureur
115The Information AI 

Pourquoi les ingénieurs déployés chez les clients font fureur

Les ingénieurs de déploiement terrain, désignés sous l'acronyme FDE pour « forward-deployed engineers », s'imposent comme l'un des profils les plus recherchés de l'industrie technologique. Meta a récemment créé une nouvelle organisation intégrant des FDE avec pour mission de convaincre davantage d'annonceurs d'adopter ses outils d'intelligence artificielle. Dans la foulée, Google Cloud a annoncé son intention de recruter plusieurs centaines de ces profils pour accompagner ses clients dans l'utilisation des outils Gemini AI. Ces ingénieurs occupent une position charnière entre le développement produit et le terrain : là où les chercheurs en IA conçoivent les modèles, les FDE s'assurent que ces technologies sont réellement intégrées et exploitées par les entreprises clientes. Leur valeur réside dans leur capacité à transformer un outil puissant mais abstrait en solution concrète et opérationnelle, ce qui accélère directement le retour sur investissement pour les entreprises adoptant l'IA. Le terme lui-même est emprunté au vocabulaire militaire et a été popularisé dans le monde du logiciel d'entreprise par Palantir il y a plus d'une décennie. Face à la généralisation de l'IA générative, le modèle s'est diffusé à l'ensemble du secteur tech : les éditeurs ne se contentent plus de vendre des licences, ils déploient des équipes humaines pour garantir l'adoption effective de leurs plateformes. Cette tendance reflète une réalité bien connue, les technologies les plus avancées échouent souvent non pas par manque de puissance, mais par manque d'accompagnement.

💬 C'est le modèle Palantir qui gagne, 10 ans après. L'IA ne s'adopte pas seule, et Meta et Google viennent de l'admettre en recrutant des centaines de FDE. Le vrai problème n'a jamais été la puissance des modèles, c'est le fossé entre la démo et ce qui tourne chez le client.

BusinessOpinion
1 source
Une entreprise aurait dépensé 500 millions de dollars en Claude en un mois, faute de limites d'utilisation
116The Decoder 

Une entreprise aurait dépensé 500 millions de dollars en Claude en un mois, faute de limites d'utilisation

Une entreprise dont l'identité n'a pas été divulguée aurait dépensé 500 millions de dollars en licences Claude en l'espace d'un seul mois, selon des informations rapportées par The Decoder. La cause serait aussi simple que coûteuse : aucun plafond d'utilisation n'avait été configuré. Le déploiement de l'IA d'Anthropic s'est ainsi propagé sans contrôle au sein de l'organisation, accumulant des appels au modèle à un rythme que personne n'avait anticipé ni encadré. Ce cas illustre une réalité que les directions informatiques commencent à découvrir à leurs dépens : l'adoption rapide de l'IA générative, sans gouvernance technique, peut transformer une promesse de productivité en gouffre financier. Sans expertise en sélection de modèles, en ingénierie du contexte ou en optimisation des requêtes, chaque usage superflu s'additionne silencieusement. Les coûts d'inférence, souvent perçus comme marginaux à l'échelle individuelle, deviennent massifs à l'échelle d'une grande organisation sans garde-fous. L'incident s'inscrit dans une période où les entreprises signent des contrats pluriannuels avec Anthropic, OpenAI ou Google pour intégrer leurs modèles en profondeur dans leurs flux de travail. Anthropic, valorisée à plus de 60 milliards de dollars, compte parmi ses clients des géants de la tech et de la finance qui déploient Claude à grande échelle. Cette anecdote, quelle que soit son exactitude, pointe vers un enjeu structurel : la maîtrise des coûts liés à l'IA est désormais une compétence critique, au même titre que la cybersécurité ou la gestion de l'infrastructure cloud.

UELes entreprises françaises et européennes déployant des LLMs à grande échelle s'exposent au même risque de dérive budgétaire en l'absence de gouvernance technique et de plafonds d'utilisation.

💬 500 millions en un mois parce que personne n'a pensé à mettre un plafond, c'est presque admirable comme négligence. Ce qui me frappe, c'est que ça va arriver à beaucoup d'autres, et pas seulement aux géants : dès qu'on déploie un modèle en interne sans rate limiting ni monitoring des coûts, la facture monte en silence. La gouvernance des APIs LLM, c'est devenu aussi critique que la gestion des droits IAM, et la plupart des équipes ne l'ont pas encore intégré.

Arthur Mensch : itinéraire d’un architecte de l’IA européenne
117Le Big Data 

Arthur Mensch : itinéraire d’un architecte de l’IA européenne

Arthur Mensch, 33 ans, a cofondé Mistral AI en mai 2023 à Paris aux côtés de Guillaume Lample et Timothée Lacroix, deux anciens de Meta AI et camarades de l'École Polytechnique. Dès le mois suivant, la jeune pousse lève 105 millions de dollars en amorçage auprès de Lightspeed Venture Partners, un record européen pour une entreprise sans produit visible, fondé uniquement sur la réputation scientifique des trois associés. Le parcours de Mensch lui-même est celui d'un chercheur de fond formé à Polytechnique, Télécom Paris et au Master MVA de l'ENS Paris-Saclay, avant une thèse à l'Inria et au CEA NeuroSpin sur l'optimisation stochastique appliquée à l'imagerie cérébrale. Il rejoint ensuite Google DeepMind Paris fin 2020, où il travaille pendant près de trois ans sur des architectures multimodales et du traitement du langage à grande échelle. Ce que représente Mistral AI dépasse le simple succès commercial d'une startup : c'est la première fois qu'une entreprise européenne s'installe durablement dans la compétition frontale avec OpenAI, Google et Meta sur les grands modèles de langage. En optant pour des modèles ouverts et publiés librement, Mistral bouscule un secteur où la fermeture est la norme, séduisant à la fois les développeurs indépendants, les entreprises soucieuses de souveraineté des données et les gouvernements européens en quête d'alternatives crédibles aux fournisseurs américains. Cette approche technique traduit aussi un pari stratégique : la transparence comme levier de confiance et d'adoption rapide. Le déclic entrepreneurial de Mensch est né d'un constat précis observé de l'intérieur de DeepMind : l'Europe produit des chercheurs en IA parmi les meilleurs au monde, mais la Silicon Valley en capte systématiquement la valeur économique et la propriété intellectuelle. Plutôt que de tenter d'infléchir cette dynamique depuis un grand groupe américain, il choisit de fonder une structure indépendante sur le continent, capable de retenir les talents locaux et de garantir que les données des utilisateurs européens ne transitent pas par des serveurs étrangers. Depuis ses auditions parlementaires à Bruxelles et Paris, Mensch porte désormais ce discours au niveau politique, plaidant pour une régulation de l'IA qui ne pénalise pas les acteurs européens face à des concurrents qui opèrent hors de toute contrainte comparable. En trois ans, Mistral est passé de feuille blanche à symbole d'une souveraineté technologique possible.

UEMistral AI, entreprise purement française, incarne la souveraineté technologique européenne en offrant aux entreprises et gouvernements du continent une alternative crédible aux modèles américains pour héberger leurs données sans dépendance extra-européenne.

💬 105 millions levés sans produit, juste sur la réputation de trois chercheurs : ça te dit tout sur ce que vaut la crédibilité scientifique quand elle est bien emballée. Ce que Mensch a compris (et que DeepMind n'a pas su retenir), c'est que garder les talents ici passe par leur donner la propriété de ce qu'ils construisent. L'open source comme levier d'adoption, c'est le pari qui a marché jusqu'ici.

BusinessOpinion
1 source
Airbus s’allie à Mistral AI pour développer une IA souveraine dans l’aéronautique
118Le Big Data 

Airbus s’allie à Mistral AI pour développer une IA souveraine dans l’aéronautique

Airbus et Mistral AI ont officialisé un partenariat stratégique le 28 mai 2026, lors du sommet "The AI Now Summit" organisé au Louvre à Paris. L'accord prévoit que le géant aéronautique européen déploie l'ensemble de la suite logicielle de la startup française au sein de ses opérations industrielles, de ses activités de défense et de ses futurs systèmes embarqués. Concrètement, Airbus utilisera des modèles d'IA installés sur site ou dans des clouds privés, contournant ainsi toute dépendance aux infrastructures cloud américaines. Le groupe bénéficiera également d'un accès direct aux équipes de recherche de Mistral AI et pourra influencer la feuille de route produit de la startup. Parmi les cas d'usage déjà identifiés : l'automatisation de la documentation technique pour avions commerciaux et hélicoptères, l'assistance à la conception et aux phases de certification, ainsi que l'intégration de modèles directement dans des aéronefs ou des systèmes spatiaux pour la reconnaissance d'objets et l'amélioration de la sécurité des vols. L'enjeu dépasse largement la productivité interne d'Airbus. Dans le secteur aéronautique et de la défense, chaque donnée traitée par un tiers représente un risque réglementaire et sécuritaire. En s'appuyant sur Mistral AI, Airbus s'assure que ses modèles d'IA respectent les contraintes strictes de confidentialité, de cybersécurité et de contrôle des données imposées notamment par les contrats militaires et les certifications aéronautiques. Pour les ingénieurs du groupe, cela signifie des outils réellement adaptés à leurs workflows, et non des solutions génériques taillées pour le marché grand public. Pour Mistral AI, le contrat valide sa capacité à adresser des environnements industriels à très forte contrainte, bien au-delà des usages bureautiques ou des administrations publiques qu'elle cible habituellement. Ce partenariat s'inscrit dans un mouvement plus large qui agite l'industrie européenne depuis deux ans. Face à la domination d'OpenAI, Microsoft, Google et Amazon dans le domaine de l'IA, les grands industriels du continent cherchent des alternatives capables de fonctionner hors des clouds américains, notamment pour leurs activités sensibles. Mistral AI, fondée en 2023 à Paris, a levé plusieurs centaines de millions d'euros et s'est imposée comme le principal champion européen de l'IA générative. Son annonce simultanée de partenariats avec BMW et EDF lors du même sommet confirme une stratégie d'ancrage dans les filières industrielles stratégiques. Pour Airbus, qui opère dans 50 pays et emploie 130 000 personnes, la prochaine étape sera de déployer ces solutions en production tout en naviguant entre les exigences des régulateurs européens, les certifications aéronautiques et les impératifs de souveraineté numérique que Bruxelles pousse activement depuis l'entrée en vigueur de l'AI Act.

UELe partenariat Airbus-Mistral AI renforce concrètement la souveraineté numérique européenne dans l'aéronautique et la défense, en déployant une IA on-premise française qui contourne les infrastructures cloud américaines, dans un contexte où l'AI Act pousse Bruxelles à exiger un contrôle strict des données industrielles sensibles.

💬 Airbus, BMW et EDF dans la même semaine, c'est la démonstration de force qu'on attendait de Mistral. L'aéro et la défense, c'est leur terrain de chasse parfait : des clients qui ne peuvent pas toucher aux clouds américains, des budgets solides, et des cas d'usage où une IA générique n'a aucune chance de passer les certifications. Reste à voir si ça tient quand les équipes terrain s'en emparent en prod.

BusinessOpinion
1 source
À peine le contrat signé, Elon Musk compte déjà virer Anthropic du data center de SpaceX
119Le Big Data 

À peine le contrat signé, Elon Musk compte déjà virer Anthropic du data center de SpaceX

Quelques semaines après l'annonce d'un accord entre Anthropic et Colossus, le data center de SpaceX et xAI situé à Memphis, Elon Musk a précisé publiquement que le contrat ne couvrait que 180 jours de location, résiliable avec un préavis de 90 jours. Cette clarification contraste nettement avec le formulaire S-1 déposé par SpaceX auprès de la Securities and Exchange Commission (SEC), qui décrit un engagement financier considérable : Anthropic devrait verser jusqu'à 1,25 milliard de dollars par mois jusqu'en mai 2029. Le document officiel mentionnait même une montée progressive des capacités prévue en mai et juin 2026, à tarif réduit. C'est donc Musk lui-même qui a précisé que la durée limitée était une exigence de SpaceX, et non d'Anthropic. Cet écart entre le contenu du document réglementaire et la communication de Musk soulève des questions sur les intentions réelles derrière cet accord. Si les termes du S-1 donnaient l'image d'un partenariat structuré sur plusieurs années, les déclarations publiques du patron de SpaceX suggèrent une logique bien différente : une démonstration de la valeur commerciale de Colossus auprès des investisseurs, plutôt qu'une alliance durable avec le créateur de Claude. Musk a également précisé que SpaceX proposerait une solution alternative à Anthropic en cas de résiliation, mais que l'entreprise pourrait récupérer les ressources si la capacité venait à manquer, laissant entendre que ses propres besoins auraient la priorité. L'accord s'inscrit dans un contexte de concurrence frontale entre xAI, la division IA de Musk, et Anthropic, deux acteurs qui se disputent à la fois les investisseurs, les talents et les marchés enterprise. Colossus est présenté comme l'un des clusters de GPU les plus puissants au monde, et sa capacité à générer des revenus locatifs stables représente un argument de poids pour la valorisation de SpaceX. Certains analystes voient dans ce contrat à durée limitée une stratégie délibérée : en gardant la main sur la résiliation à court terme, Musk préserve la possibilité de consacrer toute cette puissance de calcul à ses propres projets IA, notamment si xAI venait à accélérer le développement de Grok ou d'applications industrielles. La question de savoir si Anthropic cherchera à prolonger l'accord, ou s'orientera vers d'autres infrastructures comme AWS ou Google Cloud, reste entière.

💬 1,25 milliard par mois dans le S-1, 90 jours de préavis dans les faits, c'est pas un partenariat, c'est une location Airbnb. Musk a besoin que Colossus paraisse rentable pour valoriser SpaceX auprès des investisseurs, et un client du calibre d'Anthropic sur le papier, ça en jette. Reste qu'Anthropic loue sa puissance de calcul chez son concurrent direct, avec une clause expulsion à portée de tweet.

Anthropic dépasse 965 milliards de dollars grâce à sa Série H
120Le Big Data 

Anthropic dépasse 965 milliards de dollars grâce à sa Série H

Anthropic a annoncé le 28 mai 2026 une levée de fonds de 65 milliards de dollars dans le cadre d'une série H, portant sa valorisation à 965 milliards de dollars. L'opération est menée par Altimeter Capital, Dragoneer, Greenoaks et Sequoia Capital, auxquels s'ajoutent Coatue, GIC, ICONIQ et Fidelity parmi les autres participants. Ce tour de table intervient peu de mois après une précédente levée réalisée en février, signe d'une demande qui ne faiblit pas. L'entreprise affirme désormais dépasser 47 milliards de dollars de revenus annualisés, portés par l'adoption accélérée de Claude dans les grandes entreprises internationales. Krishna Rao, directeur financier d'Anthropic, déclare que Claude est devenu « indispensable » pour une part croissante de ses clients professionnels. Cette opération confirme une transformation de fond dans la manière dont les entreprises envisagent l'IA générative : elles ne la traitent plus comme un outil de productivité ponctuel, mais l'intègrent au cœur de leurs opérations pour automatiser des flux complexes, accélérer l'analyse documentaire ou assister le développement logiciel. Pour Anthropic, les fonds serviront à répondre à l'explosion des coûts d'infrastructure, centres de données, GPU, puces mémoire, qui conditionne désormais la capacité à tenir face à des concurrents comme OpenAI ou Google DeepMind. Dans une industrie où la puissance de calcul disponible détermine directement la qualité des modèles déployables, sécuriser du capital à cette échelle constitue un avantage stratégique difficile à combler pour les acteurs moins bien financés. Anthropic ne mise pas uniquement sur les dollars levés : la société construit simultanément un réseau infrastructurel mondial destiné à absorber une demande en forte hausse. Elle a sécurisé jusqu'à cinq gigawatts de capacité supplémentaire auprès d'Amazon, cinq gigawatts de TPU nouvelle génération avec Google et Broadcom, et un accès aux supercalculateurs Colossus 1 et Colossus 2 de SpaceX pour renforcer ses capacités GPU. Cette stratégie multipartenaires, Amazon, Google, Broadcom, SpaceX, illustre que la compétition dans l'IA se joue désormais sur l'ensemble de la chaîne : cloud, semi-conducteurs, stockage et accès énergétique. À 965 milliards de valorisation, Anthropic frôle le statut de premier acteur IA à atteindre la capitalisation des plus grandes entreprises technologiques mondiales, une trajectoire qui semblait improbable il y a encore deux ans pour une société fondée en 2021.

UEL'adoption croissante de Claude dans les grandes entreprises internationales touche également le marché européen, renforçant la dépendance structurelle du secteur privé européen à une infrastructure IA contrôlée par des acteurs américains.

💬 47 milliards de revenus annualisés en 5 ans d'existence, bon, sur le papier c'est spectaculaire. La manoeuvre infra c'est ce qui me saute aux yeux : 5 gigawatts chez Amazon, 5 de TPU chez Google avec Broadcom, les Colossus de SpaceX, ils construisent une muraille de calcul que personne (en dehors d'OpenAI et Google) ne peut approcher. C'est plus une levée de fonds, c'est une déclaration sur qui va encore être dans la course dans 3 ans.

ANTHROPIC ne lève plus du capital, elle achète désormais des gigawatts
121FrenchWeb 

ANTHROPIC ne lève plus du capital, elle achète désormais des gigawatts

Anthropic a annoncé une levée de fonds de 65 milliards de dollars, portant sa valorisation à 965 milliards de dollars, ce qui en fait l'une des entreprises privées les mieux valorisées au monde. L'opération, bouclée hier, dépasse de loin les précédents tours de table de la startup fondée par Dario et Daniela Amodei en 2021. Les marchés maintiennent donc leur appétit pour les grands acteurs de l'intelligence artificielle générative, malgré des incertitudes persistantes sur les modèles économiques à grande échelle. Mais le vrai message de ce financement record n'est pas financier : il est énergétique. Anthropic signale que le principal goulot d'étranglement pour les modèles frontière n'est plus l'accès aux capitaux, mais l'accès à la puissance électrique. Entraîner et faire tourner des modèles comme Claude exige désormais des gigawatts de capacité, un niveau de consommation qui transforme les datacenters en infrastructures critiques comparables à des usines ou des centrales. Pour les utilisateurs et les entreprises clientes, cela signifie que la disponibilité et le coût des services IA dépendent autant de la politique énergétique que de l'ingénierie logicielle. Cette dynamique s'inscrit dans une course engagée par l'ensemble du secteur : OpenAI, Google et Microsoft investissent massivement dans des infrastructures de calcul propriétaires et des partenariats énergétiques directs avec des producteurs nucléaires ou renouvelables. Anthropic, longtemps positionnée sur la sécurité et la recherche fondamentale, entre désormais dans cette compétition industrielle à part entière, où la puissance disponible en kilowattheures pourrait bientôt déterminer qui domine l'IA autant que la qualité des modèles.

UEL'explosion des besoins en électricité pour les modèles frontier renforce l'urgence pour l'Europe de développer ses propres infrastructures de calcul souveraines, sous peine d'une dépendance accrue envers des acteurs extra-européens pour l'accès à l'IA de pointe.

💬 965 milliards de valorisation, c'est presque anecdotique à côté du vrai sujet : Anthropic te dit que le prochain avantage concurrentiel en IA, c'est l'accès aux mégawatts, pas aux meilleurs ingénieurs. Le modèle économique de l'IA frontier ressemble de plus en plus à celui d'un électricien industriel. Pour l'Europe, ça devrait faire froid dans le dos.

BusinessOpinion
1 source
Les grands cabinets d'avocats, menace pour Harvey et Legora sur le terrain de l'IA
122The Information AI 

Les grands cabinets d'avocats, menace pour Harvey et Legora sur le terrain de l'IA

Kirkland & Ellis, le plus grand cabinet d'avocats américain par chiffre d'affaires en 2025, a annoncé cette semaine son intention d'investir 500 millions de dollars pour développer ses propres applications d'intelligence artificielle couvrant un large éventail de tâches juridiques. Le cabinet continuera parallèlement à acheter des licences d'outils tiers, selon le Financial Times. Cette décision illustre une tendance émergente : certains grands cabinets préfèrent désormais collaborer directement avec des fournisseurs de modèles de pointe comme Anthropic ou OpenAI, plutôt que de passer par des startups juridiques spécialisées comme Harvey ou Legora. Pour ces jeunes pousses, le risque est réel. Si les cabinets les plus puissants choisissent de construire leurs propres outils en s'appuyant sur les mêmes modèles fondateurs, la proposition de valeur des intermédiaires s'érode. Harvey et Legora affichent pourtant des indicateurs de revenus récents encourageants, ce qui suggère que leur position n'est pas encore fragilisée. Mais la menace ne vient plus uniquement des grands modèles généralistes, elle vient désormais de leurs propres clients. Ce mouvement s'inscrit dans une dynamique plus large où les entreprises bien capitalisées cherchent à internaliser l'IA plutôt qu'à en sous-traiter le développement. Pour les cabinets juridiques, dont les données clients sont sensibles et les workflows très spécifiques, la maîtrise des outils représente aussi un enjeu de confidentialité et de différenciation concurrentielle. L'irruption des modèles GPT-4 et Claude avait déjà bousculé l'écosystème des legaltech ; la prochaine vague pourrait venir de l'intérieur même du secteur.

UELes grands cabinets juridiques européens pourraient adopter la même stratégie d'internalisation, réduisant les débouchés commerciaux des startups legaltech opérant sur le marché continental.

BusinessOpinion
1 source
Mistral AI lance Vibe, s'étend dans l'IA industrielle et annonce un grand centre de données pour concurrencer OpenAI
123VentureBeat AI 

Mistral AI lance Vibe, s'étend dans l'IA industrielle et annonce un grand centre de données pour concurrencer OpenAI

Mistral AI a tenu mercredi son tout premier sommet, l'AI NOW Summit, dans le centre de Paris, pour annoncer une expansion stratégique majeure sur trois fronts simultanément. Le cofondateur et PDG Arthur Mensch, accompagné du CTO Timothée Lacroix et du Chief Scientist Guillaume Lample, a présenté une plateforme baptisée Mistral for Industrial Engineering, fruit de l'acquisition d'Emmi AI finalisée plus tôt en mai 2026, qui intègre des capacités de simulation physique aux grands modèles de langage de la startup. La société a également annoncé la construction d'un nouveau datacenter au sud de Paris, financé en partie par une dette de 830 millions de dollars levée en mars 2026 auprès d'un consortium de sept banques. Mistral a par ailleurs rebaptisé son assistant grand public sous le nom Vibe. L'entreprise, fondée il y a trois ans avec quinze employés et BNP Paribas comme premier client, compte aujourd'hui 1 000 collaborateurs et vise un milliard d'euros de chiffre d'affaires pour 2026, valorisée à 11,7 milliards d'euros après une Série C de 1,7 milliard d'euros menée par ASML en septembre 2025. La plateforme industrielle cible les secteurs aérospatial, automobile et des semi-conducteurs, avec des outils pour accélérer la conception de produits, valider des simulations et optimiser la production. Airbus a rejoint le programme sur l'ensemble de ses divisions, avions commerciaux, hélicoptères, défense et espace, tandis que BMW Group fait de Mistral son partenaire central pour son initiative dite de "Large Industry Model", axée sur la simulation de crash et d'autres tâches d'ingénierie complexes. ASML, déjà premier actionnaire de Mistral, en est aussi l'un des premiers clients industriels. L'argument central de Mensch est que les ingénieurs physiques, aéronautiques, mécaniciens, électronique, restent aujourd'hui largement ignorés par l'IA, contrairement aux travailleurs du savoir et aux développeurs logiciels. Les simulations physiques classiques peuvent prendre des heures, voire des semaines par variante de conception, rendant l'itération assistée par IA impraticable. La réponse de Mistral est ce qu'elle appelle la "physics AI" : des modèles entraînés sur les sorties de solveurs physiques capables de prédire le comportement d'une aile ou d'un process de fabrication en une fraction du temps. Mistral se retrouve dans une position concurrentielle singulière dans l'écosystème mondial de l'IA. Avec 3,9 milliards de dollars levés au total sur neuf tours de table, la startup française est désormais trop importante pour être perçue comme un simple laboratoire de recherche, mais reste nettement plus petite qu'OpenAI, Google DeepMind ou Anthropic. Sa réponse à cet écart est une stratégie de profondeur verticale : aller industrie par industrie, flux de travail par flux de travail, tout en construisant l'infrastructure pour maintenir les données sensibles sur site, loin des hyperscalers américains. "Pour déployer l'IA en entreprise, il faut, en tant que fournisseur d'IA, maîtriser toute la chaîne", a résumé Mensch devant l'audience. Ce positionnement souverain et sectoriel pourrait devenir l'atout différenciant de Mistral face à des géants dont les offres généralisées peinent à répondre aux contraintes réglementaires et industrielles européennes.

UEMistral AI, entreprise française valorisée à 11,7 milliards d'euros, construit un datacenter au sud de Paris et déploie une plateforme d'IA industrielle souveraine avec Airbus, BMW et ASML, renforçant l'autonomie technologique européenne face aux hyperscalers américains.

💬 Le datacenter et Vibe, c'est pour les journaux. Le truc qui m'intéresse vraiment, c'est la physics AI : prédire le comportement d'une aile en secondes là où un solveur classique prend des heures, c'est exactement là où les LLM peuvent être utiles pour de vrai, pas juste dans des démos. Reste à tenir ça à l'échelle d'Airbus.

BusinessActu
1 source
L'architecture radicale de DeepSeek fracasse l'avantage concurrentiel de Silicon Valley sur les tokens
124VentureBeat AI 

L'architecture radicale de DeepSeek fracasse l'avantage concurrentiel de Silicon Valley sur les tokens

DeepSeek a officialisé cette semaine la pérennisation de sa réduction de prix de 75 % sur son modèle phare V4 Pro, transformant ce qui ressemblait à une offensive temporaire en une rupture structurelle du marché. Concrètement, V4 Pro est désormais sept fois moins cher en entrées et dix-sept fois moins cher en sorties que Claude Sonnet d'Anthropic ou le GPT-5.5-Med d'OpenAI. La version allégée DeepSeek V4 Flash, optimisée pour la vitesse, est quant à elle dix à vingt-cinq fois moins chère que Claude Haiku. En Chine, le prix de lecture du cache atteint un niveau quatre-vingt-sept fois inférieur à celui des grandes plateformes cloud occidentales, un écart si brutal que Xiaomi vient d'aligner sa propre architecture MiMo sur ce même barème tarifaire. Ces deux modèles sont distribués en open-weight sous licence MIT, offrant aux entreprises une liberté totale de déploiement. Malgré ce positionnement prix, V4 Pro affiche 80,6 % sur le benchmark SWE-bench Verified pour les tâches d'agents de code, et 87,5 sur l'indice MMLU-Pro, des scores proches des meilleurs modèles occidentaux. L'impact sur les entreprises utilisatrices est déjà tangible. Uber a révélé avoir épuisé l'intégralité de son budget 2026 alloué à Claude Code et Cursor en seulement quatre mois, son directeur des opérations jugeant les coûts liés à l'usage intensif de tokens de plus en plus difficiles à justifier. Airbnb préfère depuis longtemps des alternatives plus rapides et moins chères comme Qwen d'Alibaba plutôt que de déployer massivement les modèles d'OpenAI en production. Pinterest est allé encore plus loin : son directeur technique Matt Madrigal a confirmé que l'entreprise a intégralement misé sur l'open source, en affinant Qwen sur son graphe de préférences propriétaire pour réduire ses coûts de 90 %. La baisse de prix de DeepSeek rend de tels arbitrages encore plus attractifs, accélérant la commoditisation de la couche API à fort volume. Cette dynamique s'inscrit dans un contexte de pression croissante sur les grands laboratoires occidentaux, dont les investissements en infrastructure se chiffrent en dizaines de milliards de dollars. OpenAI, dont le modèle économique repose largement sur des flux API génériques, apparaît plus exposée qu'Anthropic, dont l'offre est davantage intégrée dans des workflows logiciels différenciés. Du côté de l'adoption en entreprise, les freins demeurent importants : pour les secteurs réglementés américains, finance, santé, défense, l'utilisation de modèles chinois soulève des questions de conformité, de risques liés à la chaîne d'approvisionnement logicielle et de potentielles sanctions fédérales. L'architecture open-weight permet certes un hébergement local sans transfert de données vers des serveurs étrangers, mais les comités de conformité restent prudents. Le marché semble donc se scinder en deux : un segment premium pour les workflows critiques, et une couche agentique de fond entièrement commoditisée par les poids ouverts.

UELa réduction tarifaire permanente de DeepSeek pourrait réduire de 75 à 90 % les coûts d'infrastructure LLM pour les entreprises européennes, mais les secteurs réglementés devront évaluer les risques de conformité liés à l'utilisation de modèles chinois en open-weight.

💬 Ce qui me frappe, c'est pas les benchmarks, c'est Uber qui a cramé son budget Claude Code annuel en quatre mois. La baisse de 75 % de DeepSeek est permanente maintenant, ce qui veut dire que les arbitrages qu'Airbnb ou Pinterest font depuis un moment vont s'accélérer partout. Le marché API générique est commoditisé, la différence se jouera ailleurs.

BusinessOpinion
1 source
Data center, AGI, industrie : Mistral AI sur tous les fronts
125Next INpact 

Data center, AGI, industrie : Mistral AI sur tous les fronts

Lors de l'AI Now Summit du 28 mai 2026, Mistral AI a enchaîné les annonces majeures. La startup parisienne rebaptise d'abord son chatbot LeChat en « Vibe », désormais capable de se connecter à Outlook, SharePoint, GitHub et Slack pour générer rapports, synthèses et graphiques, avec un mode Code intégré à VS Code et une interface CLI. L'offre s'étage d'une version gratuite à 14,99 dollars par mois pour les usages avancés. Sur le plan infrastructurel, Mistral annonce un nouveau centre de données aux Ulis (Essonne), déployant 10 MW dès le troisième trimestre 2026, qui vient s'ajouter aux sites de Bruyères-le-Châtel (40 MW) et de Borlänge en Suède (23 MW). L'entreprise prévoit 200 MW de capacité en 2027 et 1 GW d'ici 2030, pour un investissement actuel de 4 milliards d'euros. Mistral lance par ailleurs une plateforme industrielle combinant modèles d'IA, ingénierie et capacités robotiques, avec pour premiers partenaires Airbus, BMW, ASML et EDF, ce dernier dans le cadre d'un accord de cinq ans autour de la maintenance et de la construction des réacteurs EPR2. Ces annonces révèlent un pivot stratégique décisif pour Mistral : la startup ne se positionne plus seulement comme un fournisseur de modèles de langage, mais comme un opérateur d'infrastructure et un intégrateur industriel à part entière. En louant sa puissance de calcul à d'autres laboratoires d'IA, Arthur Mensch confirme à CNBC que « certains demandent déjà énormément de capacité », Mistral se dote d'un modèle économique hybride, moins dépendant des seuls abonnements grand public. Les partenariats avec des géants comme ASML, pour l'optimisation de composants semiconducteurs, ou BMW, pour des simulations d'accident multimodales, valident la crédibilité technique de la startup dans des secteurs à très haute exigence. Le contrat EDF, sur cinq ans, ancre Mistral dans les infrastructures critiques françaises. Fondée en 2023, Mistral AI s'est imposée comme le principal champion européen face aux géants américains OpenAI, Google et Anthropic. Le contexte politique et industriel lui est aujourd'hui favorable : l'Europe commence à traiter l'IA comme un actif stratégique comparable au gaz, selon Mensch lui-même, ce qui facilite les investissements publics et privés dans les infrastructures. Le retard continental en matière de datacenters devient un argument commercial pour Mistral, qui se présente comme le moyen de combler cet écart sans dépendre des hyperscalers américains. La prochaine échéance sera l'ouverture du site des Ulis au troisième trimestre, premier test concret de la capacité de Mistral à honorer ses ambitions d'opérateur à l'échelle du gigawatt.

UEMistral AI investit 4 milliards d'euros dans des data centers souverains en France (Les Ulis, Bruyères-le-Châtel) et signe des contrats pluriannuels avec EDF, Airbus et ASML, offrant à l'Europe une alternative concrète aux hyperscalers américains pour ses infrastructures critiques industrielles et énergétiques.

💬 Le rebaptême en "Vibe" je m'en fous un peu, mais le reste, c'est du sérieux. Mistral qui loue de la puissance de calcul à d'autres labos, qui signe cinq ans avec EDF sur les EPR2, qui rentre chez BMW et ASML, c'est plus une startup de modèles, c'est un opérateur d'infrastructure qui joue dans la cour des grands. Reste à voir si les Ulis livrent bien au T3, parce que 1 GW d'ici 2030 c'est une promesse qui va coûter cher à tenir.

BusinessOpinion
1 source
De l’IA générative à l’ingénierie industrielle : le nouveau pari de MISTRAL AI
126FrenchWeb 

De l’IA générative à l’ingénierie industrielle : le nouveau pari de MISTRAL AI

Mistral AI a choisi le cadre du Carrousel du Louvre, à Paris, pour tenir son événement « AI Now Summit » et annoncer un tournant stratégique majeur : la startup française se repositionne activement vers l'ingénierie industrielle. Plutôt que de rester cantonnée aux assistants conversationnels et aux outils de bureautique, l'entreprise fondée en 2023 affiche désormais l'ambition de pénétrer les secteurs manufacturiers, énergétiques et d'infrastructure, là où les besoins en automatisation complexe sont les plus pressants. Ce pivot représente un changement de cible commercial significatif. L'industrie offre des contrats pluriannuels à forte valeur, des données propriétaires difficiles à répliquer et une dépendance technologique bien plus forte que dans le grand public. Pour Mistral, s'imposer dans des processus critiques, maintenance prédictive, optimisation de chaînes de production, aide à la conception d'équipements, ouvre un marché estimé à plusieurs centaines de milliards d'euros à l'échelle mondiale, largement sous-adressé par les acteurs américains. Mistral AI s'inscrit ainsi dans une logique de différenciation face à OpenAI et Google, qui dominent le segment grand public et les outils de productivité. La startup lève depuis 2023 des montants considérables, plus d'un milliard d'euros au total, et bénéficie du soutien politique français pour incarner une alternative européenne souveraine à l'IA américaine. Le virage industriel, plus exigeant techniquement mais potentiellement plus défensible commercialement, pourrait être la clé de sa pérennité à long terme dans un marché en consolidation rapide.

UEMistral AI, fleuron français soutenu politiquement, cible les secteurs industriels européens (énergie, manufacture, infrastructure) en se positionnant comme alternative souveraine aux solutions américaines d'OpenAI et Google.

💬 Sortir du grand public face à OpenAI, c'est pas fuir, c'est choisir le terrain. L'industrie paie en contrats pluriannuels, ses données sont propriétaires, et personne ne change de fournisseur critique sur un coup de tête. La vraie question, c'est pas le marché, c'est si Mistral a les équipes pour tenir quand ça bug en prod à 3h du mat.

Cognition lève 1 milliard de dollars lors d'une série D valorisée à 26 milliards
127Latent Space 

Cognition lève 1 milliard de dollars lors d'une série D valorisée à 26 milliards

Cognition, le laboratoire spécialisé dans les agents IA, vient de lever 1 milliard de dollars lors d'un tour de table en Série D qui valorise la société à 26 milliards de dollars. Ce financement, annoncé fin mai 2026, représente une valorisation 2,5 fois supérieure à celle obtenue lors de sa Série C en septembre 2025, qui s'élevait à 10 milliards de dollars. Cognition devient ainsi officiellement le plus grand laboratoire d'agents IA indépendant encore en activité. La société projette un chiffre d'affaires annuel récurrent dépassant 1 milliard de dollars d'ici la fin de l'année 2026, une trajectoire alimentée par une clientèle déjà constituée d'acteurs exigeants de l'écosystème startup et entreprise, parmi lesquels Exa et Modal. Cette levée illustre l'appétit persistant des investisseurs pour les agents IA autonomes, segment en train de redéfinir le marché des logiciels d'entreprise. Dans le SaaS, l'ARR est un indicateur retardé de l'utilisation réelle : si Cognition projette ce seuil du milliard, c'est que des déploiements significatifs sont déjà actifs chez ses clients. La dynamique s'inscrit dans une logique de concentration du financement autour de quelques laboratoires indépendants capables de tenir tête aux grandes plateformes que sont OpenAI, Anthropic ou Google DeepMind. Cognition, positionné sur les agents codeurs autonomes, s'impose comme un acteur de référence dans une catégorie dont la valeur potentielle continue d'attirer des capitaux massifs. Cette annonce intervient dans un contexte d'effervescence technique autour de l'inférence et de l'architecture des agents. Sur le front de l'efficacité, plusieurs avancées ont marqué la semaine : EAGLE 3.1 améliore le décodage spéculatif pour les longues séquences, Perplexity a publié en open source un tokeniseur réduisant de 5 à 6 fois la charge CPU, et Qwen3.5 atteindrait 580 tokens par seconde pour des charges de travail agentiques grâce à une collaboration entre Alibaba, NVIDIA et les contributeurs de FlashAttention-4. Parallèlement, LangChain a livré Deep Agents v0.6 avec les Delta Channels, réduisant le stockage des points de contrôle pour une session de codage de 200 tours de 5,3 Go à seulement 129 Mo. La plateforme Trajectory a également été lancée pour permettre aux équipes d'utiliser les traces d'agents et les signaux d'usage produit dans une logique d'apprentissage continu. Ces évolutions techniques signalent un glissement de paradigme : ce n'est plus seulement la qualité du modèle qui fait la différence, mais l'adéquation entre le modèle, son environnement d'exécution et sa mémoire.

💬 26 milliards pour Cognition, ça fait un choc. Mais le chiffre qui compte c'est le milliard d'ARR projeté d'ici décembre : des déploiements déjà actifs chez des clients exigeants, et une valorisation multipliée par 2,5 en six mois pour un labo qui n'existait quasiment pas il y a trois ans. Et l'Europe dans tout ça, elle regarde.

BusinessOpinion
1 source
Meta AI devient payant : la fin de la gratuité pour l’IA de Zuckerberg ?
128Le Big Data 

Meta AI devient payant : la fin de la gratuité pour l’IA de Zuckerberg ?

Meta s'apprête à introduire des abonnements payants pour son assistant Meta AI, disponible sur Facebook, Instagram, WhatsApp et Messenger. Deux formules sont prévues : Meta One Plus à 7,99 dollars par mois, et Meta One Premium à 19,99 dollars mensuels, cette dernière offrant davantage de puissance de calcul, des réponses plus détaillées et des fonctions avancées supplémentaires. Naomi Gleit, directrice produit de Meta, a confirmé que ces offres permettront d'accéder à des outils améliorés pour optimiser du contenu, automatiser certaines tâches et aider les marques à gérer leur présence en ligne. Les premiers tests débuteront dès le mois prochain dans trois marchés pilotes : Singapour, le Guatemala et la Bolivie. La version gratuite de Meta AI restera néanmoins accessible sur toutes les plateformes du groupe, de sorte qu'aucun utilisateur ne sera contraint de passer à la caisse pour utiliser l'assistant. L'annonce a immédiatement séduit les marchés financiers : l'action Meta a bondi de 3,74 % le 27 mai pour atteindre 635,26 dollars. Ce mouvement reflète un soulagement des investisseurs, qui attendaient que Meta trouve enfin un levier de monétisation directe pour son IA, après des années d'intégration dans ses plateformes sans retour financier explicite. Pour les utilisateurs professionnels et les marques, les formules premium représentent une porte d'entrée vers des capacités d'automatisation plus poussées, ce qui positionne Meta AI en concurrence directe avec des outils comme ChatGPT Plus ou Gemini Advanced. Pour Meta elle-même, c'est une tentative de transformer ses 3 milliards d'utilisateurs actifs en source de revenus récurrents, au-delà de la seule publicité. Ce pivot vers la monétisation intervient dans un contexte de dépenses colossales. Meta a revu à la hausse ses prévisions d'investissement pour 2026, désormais estimées entre 125 et 145 milliards de dollars. Le groupe a déjà engagé 14,3 milliards dans Scale AI et près de 2 milliards dans la start-up chinoise Manus, et prévoit de consacrer environ 600 milliards de dollars sur plusieurs années à la construction de nouveaux centres de données, infrastructure indispensable pour entraîner et opérer ses modèles d'IA à grande échelle. Pour absorber une partie de ces charges, l'entreprise continue parallèlement de comprimer ses coûts opérationnels, avec des suppressions de postes pouvant atteindre 20 % des effectifs mondiaux, soit environ 15 000 emplois. La monétisation de Meta AI s'inscrit donc dans une logique de rentabilité urgente, à l'heure où la course aux infrastructures IA impose des investissements que même les revenus publicitaires records du groupe peinent à justifier seuls.

UELes centaines de millions d'utilisateurs européens de Facebook, Instagram et WhatsApp seront concernés lors du déploiement de ce modèle payant, qui devra se conformer au RGPD et au DSA, notamment pour les fonctionnalités d'automatisation proposées aux marques.

💬 3 milliards d'utilisateurs et zéro euro de revenus directs sur l'IA, ça ne pouvait pas durer. L'abonnement à 8 ou 20 dollars par mois, c'est pas foufou comme produit, mais ça leur permet de commencer à amortir les 600 milliards qu'ils comptent balancer sur des data centers dans les prochaines années. La vraie question, c'est pourquoi quelqu'un paierait Meta AI plutôt que ChatGPT.

BusinessOpinion
1 source
Meta lance une offensive commerciale pour accélérer l'adoption de ses outils IA en entreprise
129The Information AI 

Meta lance une offensive commerciale pour accélérer l'adoption de ses outils IA en entreprise

Meta Platforms a annoncé le lancement d'une nouvelle unité interne baptisée Enterprise Solutions, destinée à accélérer l'adoption de ses outils d'intelligence artificielle auprès des grandes entreprises. Selon un mémo interne signé par la directrice générale senior Naomi Gleit, cette organisation regroupera trois types de profils : des chefs de produit chargés de piloter les engagements clients, des ingénieurs data qui préparent les données des clients pour les intégrer dans les systèmes d'IA de Meta, et des ingénieurs logiciels qui connectent directement les outils Meta aux infrastructures opérationnelles des entreprises. Ce positionnement marque un tournant stratégique pour Meta, qui cherche à monétiser ses technologies d'IA au-delà de ses plateformes publicitaires. En plaçant ses propres ingénieurs et chefs de produit directement au sein des équipes de ses clients, l'entreprise mise sur une personnalisation poussée pour convaincre les directions informatiques et les grands comptes de faire confiance à ses solutions. C'est un modèle de vente à haute valeur ajoutée, qui cible clairement les budgets technologiques des entreprises du Fortune 500. Meta suit ainsi une tendance déjà bien établie dans le secteur : Google, Palantir et d'autres acteurs ont popularisé le concept d'ingénieurs déployés en avant-poste, ou "forward-deployed engineers", directement intégrés chez les clients pour adapter les solutions IA à leurs besoins spécifiques. Dans un marché de l'IA d'entreprise de plus en plus disputé, cette approche permet de créer des dépendances techniques profondes et de verrouiller la relation client sur le long terme, au moment où Microsoft, Google et Amazon s'affrontent également pour capter ces contrats.

UELes entreprises européennes pourraient être ciblées par cette offensive commerciale, mais les contraintes du RGPD et les exigences de souveraineté numérique freinent l'adoption d'infrastructures Meta dans les systèmes d'information européens.

BusinessOpinion
1 source
Cognition, créateur de l'agent de code Devin, plus que double sa valorisation à 26 milliards de dollars en moins de neuf mois
130The Decoder 

Cognition, créateur de l'agent de code Devin, plus que double sa valorisation à 26 milliards de dollars en moins de neuf mois

Cognition, la startup américaine à l'origine de Devin, l'agent de développement logiciel piloté par intelligence artificielle, a finalisé une levée de fonds dépassant le milliard de dollars, portant sa valorisation à plus de 26 milliards de dollars. Cette opération, bouclée en moins de neuf mois après un précédent tour de table, plus que double la valorisation de l'entreprise et s'impose comme l'une des plus importantes jamais réalisées dans le secteur des agents IA spécialisés dans le code. Devin avait été présenté en mars 2024 comme le premier "ingénieur logiciel autonome" capable de planifier, coder, tester et déployer des applications sans intervention humaine. Ce financement illustre l'appétit spectaculaire des investisseurs pour les outils capables d'automatiser le développement logiciel, un marché estimé à plusieurs centaines de milliards de dollars. Pour les entreprises tech, l'enjeu est concret : réduire les coûts de développement, accélérer les cycles de production et potentiellement redéfinir le rôle des ingénieurs humains. Pourtant, la valeur opérationnelle réelle de Devin reste vivement discutée dans la communauté des développeurs, certains benchmarks indépendants ayant remis en question ses performances annoncées. Cognition évolue dans un secteur de plus en plus disputé, face à GitHub Copilot d'OpenAI et Microsoft, Cursor, ou encore des agents comme Claude Code d'Anthropic. La course aux agents de codage s'intensifie alors que les grands modèles de langage atteignent un niveau de compétence technique suffisant pour traiter des tâches de programmation complexes. Cette méga-levée signale que, malgré les débats sur les performances actuelles, les investisseurs parient sur un basculement prochain vers une automatisation large du génie logiciel.

BusinessActu
1 source
Mistral rejoint Harvey pour les usages IA en entreprise
131Le Big Data 

Mistral rejoint Harvey pour les usages IA en entreprise

Harvey, la plateforme d'intelligence artificielle dédiée au secteur juridique, a officialisé le 26 mai 2026 un partenariat avec Mistral AI pour intégrer les modèles de la startup française à son environnement multi-modèles. Ce lancement cible en priorité les clients européens de Harvey, dont la plateforme permet déjà aux cabinets d'avocats et directions juridiques d'automatiser des tâches complexes : analyse contractuelle, recherche documentaire, synthèse de dossiers, assistance à la rédaction. L'ajout de Mistral enrichit ce dispositif en proposant une couche supplémentaire de personnalisation, notamment grâce aux capacités multilingues de la startup française, sa gestion des contextes longs et son efficacité d'exécution sur de grands volumes de documents multi-juridictions. Harvey précise que ce déploiement accompagne l'ouverture récente de son bureau parisien et le renforcement de ses investissements en France et dans l'Union européenne. Ce partenariat répond à une évolution profonde des attentes des grandes entreprises vis-à-vis de l'IA générative. Transparence des modèles, localisation des données, conformité réglementaire et gouvernance ne sont plus des options mais des critères décisifs, en particulier dans des secteurs sensibles comme le droit. Les modèles Mistral sont reconnus pour leur approche "open-weight", qui offre une visibilité accrue sur le fonctionnement et l'évaluation des systèmes, un atout de poids pour des organisations soumises à des obligations strictes en matière de sécurité et de conformité. Harvey ne cherche pas à remplacer un fournisseur d'IA par un autre : sa plateforme est conçue pour sélectionner automatiquement le modèle le plus adapté à chaque tâche, construisant ainsi une architecture résiliente et performante pour ses clients entreprises. Ce mouvement s'inscrit dans un contexte plus large de souveraineté technologique en Europe, où les acteurs locaux comme Mistral gagnent rapidement en crédibilité face aux géants américains. Les entreprises européennes ne se contentent plus de chercher les modèles les plus puissants : elles veulent savoir où transitent leurs données, quels modèles les traitent et dans quelles conditions ces systèmes sont déployés. Harvey, dont la plateforme multi-modèles inclut déjà des solutions de plusieurs grands fournisseurs, positionne Mistral comme la réponse naturelle aux exigences du marché européen. Le partenariat marque ainsi une étape dans la stratégie d'expansion européenne de l'éditeur américain, tout en consolidant la place de Mistral comme acteur incontournable de l'IA d'entreprise sur le Vieux Continent.

UELe déploiement de Mistral chez Harvey cible directement les clients européens du secteur juridique, renforçant la souveraineté technologique de l'UE en offrant aux cabinets d'avocats et directions juridiques européens un modèle français conforme RGPD et AI Act pour traiter leurs données sensibles.

💬 Mistral dans le juridique, c'était couru d'avance. Un cabinet d'avocats qui traite des dossiers clients via GPT-4 sur des serveurs américains, ça fait frémir les RSSI, donc là l'argument souveraineté pèse vraiment. Harvey a pigé que pour exister en Europe, il fallait jouer cette carte.

BusinessOpinion
1 source
Fujitsu intègre OpenAI à sa stratégie IA pour les entreprises japonaises
132Le Big Data 

Fujitsu intègre OpenAI à sa stratégie IA pour les entreprises japonaises

Le 27 mai 2026, Fujitsu a officialisé un partenariat stratégique avec OpenAI pour intégrer ChatGPT Enterprise et Codex à ses services destinés aux entreprises japonaises. Le géant technologique, qui compte parmi les plus grands groupes IT du pays, prévoit de déployer ces outils aussi bien en interne que dans ses offres clients. Les équipes de développement logiciel, de gestion de projets, d'opérations et de livraison de services seront les premières concernées. Fujitsu cible en priorité trois secteurs : l'industrie manufacturière, la santé et la pharmacie, des domaines soumis à une pression croissante sur l'efficacité opérationnelle et l'automatisation des processus. Ce partenariat répond à une question devenue centrale pour les grandes entreprises : comment faire de l'IA une véritable infrastructure métier plutôt qu'une vitrine technologique ? Pour y répondre, Fujitsu s'appuie sur son modèle FDE (Forward Deployed Engineer), une méthode de travail qui associe étroitement experts sectoriels, ingénieurs et clients pour identifier rapidement des cas d'usage exploitables. En combinant cette approche terrain avec les modèles d'OpenAI, le groupe vise à réduire le fossé persistant entre démonstrations technologiques et création réelle de valeur. L'objectif affiché est de construire un modèle de collaboration entre employés et agents IA capable de standardiser des tâches complexes et d'accélérer les cycles de décision. La cybersécurité constitue un second axe prioritaire : face à la multiplication des menaces et à la complexité des infrastructures critiques, Fujitsu entend développer des dispositifs de cyberdéfense hybrides où humains et IA travaillent conjointement pour améliorer la détection et la vitesse de réponse aux incidents. Ce rapprochement s'inscrit dans un contexte japonais particulier : le vieillissement démographique accéléré et la pénurie structurelle de talents techniques font de l'automatisation intelligente un enjeu économique de premier ordre pour les industriels du pays. Fujitsu dispose d'une implantation historique profonde dans le tissu industriel japonais, ce qui lui confère un avantage réel pour déployer des solutions à grande échelle. Du côté d'OpenAI, ce partenariat confirme une stratégie d'expansion agressive vers les marchés enterprise en Asie, après des accords similaires avec des acteurs majeurs en Europe et aux États-Unis. L'alliance illustre aussi une tendance de fond : les éditeurs d'IA générative ne cherchent plus à vendre des modèles bruts, mais à s'ancrer dans des écosystèmes sectoriels via des partenaires locaux disposant de la légitimité et de la connaissance métier que les modèles seuls ne peuvent pas apporter.

💬 Le contexte japonais, ça change la lecture. Pénurie structurelle de talents, démographie qui s'effondre : les industriels là-bas n'ont pas cinq ans devant eux pour tâtonner avec l'IA. Ce qui m'intéresse dans ce deal, c'est le modèle FDE, cette méthode d'embarquer des ingénieurs directement chez les clients pour trouver les cas d'usage qui tiennent en prod, pas ceux qui brillent en démo.

BusinessOpinion
1 source
OpenRouter franchit 1,3 milliard de dollars de valorisation un an après son lancement
133Le Big Data 

OpenRouter franchit 1,3 milliard de dollars de valorisation un an après son lancement

OpenRouter, une startup américaine spécialisée dans les passerelles d'accès aux modèles d'intelligence artificielle, vient de boucler un tour de table de série B de 113 millions de dollars mené par CapitalG, le fonds de capital-risque d'Alphabet. Cette levée propulse sa valorisation à 1,3 milliard de dollars, soit plus du double des 547 millions estimés lors de son tour de série A de juin 2025, où Andreessen Horowitz, Menlo Ventures et Sequoia avaient déjà investi 40 millions de dollars. En douze mois d'existence, la société affiche désormais 8 millions d'utilisateurs dans le monde et traite environ 100 000 milliards de tokens par mois. Sur les six derniers mois, son volume hebdomadaire est passé de 5 000 milliards à 25 000 milliards de tokens, soit une multiplication par cinq. La plateforme donne accès à plus de 400 modèles d'IA, parmi lesquels ceux d'Anthropic, OpenAI, Google, xAI et DeepSeek. Cette progression illustre un basculement structurel du marché de l'IA générative : après des années centrées sur l'entraînement des modèles, l'industrie se concentre désormais sur l'inférence, c'est-à-dire l'exécution concrète des modèles dans des applications réelles. Les entreprises cherchent à optimiser leurs coûts et leur flexibilité opérationnelle, en pouvant sélectionner dynamiquement le modèle le mieux adapté à chaque tâche, qu'il s'agisse d'un traitement simple ou d'un raisonnement complexe. La montée en puissance des agents IA, ces systèmes autonomes qui enchaînent plusieurs actions et requêtes, renforce encore ce besoin : orchestrer plusieurs modèles spécialisés depuis une interface unique est devenu une nécessité opérationnelle pour de nombreuses équipes techniques. Pendant plusieurs années, l'industrie semblait s'orienter vers une concentration autour de quelques fournisseurs dominants, avec le risque d'un verrouillage technologique comparable à celui qu'ont connu les entreprises avec certains éditeurs cloud ou logiciels d'entreprise. Le succès d'OpenRouter révèle une réalité plus nuancée : les organisations souhaitent conserver leur pouvoir de négociation, limiter les risques de dépendance et s'adapter rapidement aux évolutions rapides du marché. Dans ce contexte, les intermédiaires capables d'agréger et d'orchestrer plusieurs fournisseurs deviennent des infrastructures stratégiques à part entière. La valorisation d'OpenRouter, atteinte en un an seulement, confirme que l'avenir du déploiement de l'IA en entreprise sera résolument multi-modèles.

UELes équipes techniques européennes peuvent adopter OpenRouter pour orchestrer plusieurs modèles IA sans dépendance à un fournisseur unique, mais l'impact direct sur la France ou l'UE reste limité à cet avantage opérationnel indirect.

💬 1,3 milliard en un an, je m'y attendais pas à cette vitesse. OpenRouter a compris avant tout le monde que la vraie bataille, c'est pas qui entraîne les meilleurs modèles, mais qui te permet de tous les orchestrer sans te faire enfermer chez un seul provider. Reste à voir comment les grands fournisseurs vont réagir quand ils réaliseront que leur API est en train de devenir une commodité.

BusinessOpinion
1 source
Nouvelles licornes à 10 milliards dans l'infra IA : Fireworks, Baseten (et OpenRouter en chemin)
134Latent Space 

Nouvelles licornes à 10 milliards dans l'infra IA : Fireworks, Baseten (et OpenRouter en chemin)

Trois acteurs de l'infrastructure d'inférence IA ont fait parler d'eux cette semaine avec des levées de fonds aux valorisations vertigineuses. Fireworks AI serait en discussions pour une levée qui valoriserait la startup à 15 milliards de dollars, soit 3,75 fois sa valorisation précédente en seulement sept mois. Baseten, de son côté, serait en train de finaliser un tour qui l'amènerait à 11 milliards de dollars, multipliant par 2,2 sa valeur en trois mois à peine. Plus discret mais tout aussi significatif, OpenRouter a bouclé une Série C de 113 millions de dollars, après avoir multiplié ses volumes par cinq en six mois. Ces trois sociétés ont en commun de se positionner sur la même couche critique : permettre aux entreprises d'appeler, de router et d'orchestrer des modèles de langage à grande échelle, sans se lier à un seul fournisseur. Ces valorisations illustrent un basculement structurel dans la manière dont l'industrie évalue la valeur dans l'IA. La compétition ne se joue plus uniquement autour du modèle de base, mais autour de ce que les ingénieurs appellent le "harness" : l'ensemble formé par le modèle, l'environnement d'exécution, la boucle d'évaluation et les mécanismes de correction. DeepSeek constituerait explicitement une équipe dédiée à cette couche, Google a formalisé son infrastructure d'agents Gemini comme une API unique intégrant sandbox, persistance et gestion du contexte, et LangChain a mis à jour ses outils dans la même direction. Le benchmark DeepSWE, salué par des praticiens comme le premier à vraiment refléter l'expérience quotidienne des développeurs, a montré que les modèles se distinguent davantage sur ces tâches réelles que sur les classements publics traditionnels. Qwen3.7 Max d'Alibaba s'est par exemple classé quatrième sur Code Arena Frontend, au niveau de Claude Opus 4.6 sur les tâches de développement web agentique. Ce mouvement s'inscrit dans une tendance plus large qui s'accélère depuis le début de l'année, baptisée "Inference Inflection" par les observateurs du secteur. Après des années où les investissements se concentraient sur l'entraînement des modèles, l'argent afflue désormais vers les couches d'inférence et d'orchestration, jugées indispensables à toute mise en production sérieuse. En parallèle, la recherche explore de nouvelles pistes pour répondre aux limites de mémoire des modèles : le papier "Language Models Need Sleep", remarqué cette semaine, propose un mécanisme de consolidation inspiré du sommeil humain, qui convertit le contexte récent en poids permanents avant de vider le cache, préservant la latence à l'exécution tout en étendant la mémoire long terme. Les prochains mois diront si ces valorisations tiennent, mais la direction est claire : l'infrastructure d'inférence est devenue le terrain où se joue la prochaine phase de l'IA.

UELa concentration des investissements dans la couche d'inférence IA autour d'acteurs américains renforce la dépendance potentielle des entreprises et startups européennes vis-à-vis de fournisseurs extra-européens pour leurs déploiements en production.

💬 x3,75 en sept mois pour Fireworks, c'est pas une levée, c'est un signal. Le modèle devient une commodité, et l'argent coule maintenant vers la couche qui permet d'en changer à volonté sans se retrouver piégé avec un seul fournisseur. Bon, reste à voir si ça tient quand AWS ou Google décident de proposer ça en bundle.

BusinessOpinion
1 source
Anthropic génère probablement au moins 35 % de revenus de plus qu'OpenAI
135The Information AI 

Anthropic génère probablement au moins 35 % de revenus de plus qu'OpenAI

Anthropic génère désormais des revenus annualisés proches de 45 milliards de dollars, dépassant ceux d'OpenAI, dont le rythme actuel est estimé à environ 33 milliards. Sur les cinq premiers mois de 2026, la croissance d'Anthropic a été cinq fois supérieure à celle de son concurrent, selon des sources proches des chiffres. OpenAI avait pourtant affiché une progression solide, avec une hausse de ses revenus mensuels de plus de 50 % sur la période, conforme aux projections communiquées à ses investisseurs, mais cette performance paraît modeste face à l'ascension fulgurante d'Anthropic. L'écart entre les deux entreprises atteint désormais environ 35 % en faveur d'Anthropic, et rien n'indique que la tendance s'inversera si OpenAI n'accélère pas sensiblement sa croissance. Ce renversement de hiérarchie constitue une surprise de taille dans l'industrie de l'IA générative. Pendant des années, OpenAI a été considérée comme le leader incontesté du secteur, portée par le succès mondial de ChatGPT et les investissements colossaux de Microsoft. Qu'Anthropic, fondée en 2021 par d'anciens dirigeants d'OpenAI dont Dario et Daniela Amodei, ait réussi à surpasser son rival en termes de revenus illustre à quel point le marché des API et des solutions B2B est devenu le principal moteur de croissance du secteur. Claude, le modèle phare d'Anthropic, s'est imposé comme un choix privilégié dans les environnements professionnels, notamment pour ses capacités de traitement de contextes longs et sa fiabilité perçue. Anthropic a levé des milliards de dollars ces dernières années, notamment auprès d'Amazon, qui a investi environ 4 milliards de dollars en 2023-2024, et de Google, qui a engagé plus de 2 milliards. Ces partenariats stratégiques lui ont fourni les ressources nécessaires pour scaler son infrastructure et conquérir des clients entreprise à grande échelle. OpenAI, de son côté, traverse une restructuration juridique complexe, passant d'une structure à but non lucratif vers un modèle capitalistique, tout en faisant face à une concurrence accrue sur le marché des assistants grand public. Cette bataille de revenus entre les deux géants reflète un enjeu plus large: quelle plateforme deviendra le socle de l'IA dans les entreprises mondiales au cours des prochaines années.

💬 Personne n'a vu venir ça, ou presque. Pendant que tout le monde regardait ChatGPT et le grand public, Anthropic a silencieusement verrouillé les contrats enterprise, ceux où Claude tourne dans des pipelines de prod et pas juste dans un onglet de navigateur. 45 milliards annualisés contre 33 pour OpenAI, c'est pas un détail.

BusinessOpinion
1 source
Baseten, fournisseur d'inférence IA, en discussion pour lever 1 milliard de dollars à une valorisation de 11 milliards
136The Information AI 

Baseten, fournisseur d'inférence IA, en discussion pour lever 1 milliard de dollars à une valorisation de 11 milliards

Baseten, une startup américaine spécialisée dans l'inférence IA, serait en négociations avancées pour lever 1 milliard de dollars auprès d'investisseurs, selon une source proche du dossier. La transaction valoriserait l'entreprise à 11 milliards de dollars, soit plus du double de sa valorisation précédente de 5 milliards de dollars, annoncée il y a seulement trois mois. Cette accélération s'appuie sur une croissance rapide des revenus de la startup, qui loue des serveurs Nvidia équipés de GPU aux développeurs d'applications et les accompagne dans l'entraînement, la personnalisation et le déploiement de modèles d'IA principalement open source. Une telle levée placerait Baseten parmi les startups d'infrastructure IA les mieux financées au monde. Son positionnement sur la couche d'inférence, c'est-à-dire l'étape où les modèles répondent aux requêtes en production, répond à une demande explosive des entreprises qui souhaitent déployer leurs propres modèles sans gérer eux-mêmes la complexité matérielle et logicielle. Le recours croissant aux modèles open source comme LLaMA ou Mistral renforce cette dynamique, car ces modèles nécessitent une infrastructure dédiée que peu d'équipes peuvent construire en interne. Baseten s'inscrit dans une vague plus large de consolidation autour des fournisseurs d'inférence, un segment qui attire des capitaux massifs alors que la course au déploiement IA s'intensifie. Des concurrents comme Together AI, Fireworks AI ou Modal se disputent le même marché. La capacité de Baseten à doubler sa valorisation en un trimestre témoigne de l'appétit des investisseurs pour les acteurs qui contrôlent la plomberie des systèmes IA en production, indépendamment des laboratoires de recherche.

UEImpact indirect : les entreprises françaises et européennes qui déploient des modèles open source comme Mistral dépendent de fournisseurs d'inférence dont la consolidation peut influencer les prix et l'offre de services, mais aucun impact direct sur la France ou l'UE.

BusinessActu
1 source
Le directeur des opérations d'Uber juge que l'IA ne rentabilise pas ses investissements
137The Information AI 

Le directeur des opérations d'Uber juge que l'IA ne rentabilise pas ses investissements

Le directeur des opérations d'Uber, Andrew Macdonald, a déclaré ce week-end lors d'un podcast que l'entreprise ne constate pas d'augmentation claire de la productivité malgré l'utilisation généralisée d'outils d'aide à la programmation basés sur l'IA par ses équipes d'ingénieurs. Cette admission intervient après que le directeur technique d'Uber, Praveen Neppalli Naga, avait révélé le mois dernier que la consommation explosive d'outils comme Claude Code avait conduit l'entreprise à épuiser l'intégralité de son budget IA en quelques mois seulement, bien avant la fin de l'année. Macdonald a précisé que la situation a forcé les dirigeants à réfléchir à la manière de maîtriser les coûts liés à la consommation de tokens. "Si vous n'êtes pas capable de tracer une ligne directe entre les dépenses et les fonctionnalités utiles livrées à vos utilisateurs, les coûts deviennent difficiles à justifier", a-t-il affirmé. Ce constat illustre une tension croissante dans l'industrie tech : les dépenses en IA s'envolent sans que le retour sur investissement soit clairement mesurable. Pour Uber, dont l'activité repose sur des milliers d'ingénieurs développant en permanence des fonctionnalités critiques, l'incapacité à relier directement les coûts IA aux gains de productivité pose un problème de gouvernance budgétaire concret. D'autres projets IA en dehors du domaine du développement logiciel ont simplement échoué ou généré des effets indésirables, renforçant le sentiment que l'enthousiasme autour de l'IA devance largement les résultats tangibles. Uber n'est pas un cas isolé. De nombreuses entreprises peinent à absorber la transition d'Anthropic vers une facturation basée sur la consommation de tokens, un modèle qui complique fortement la prévision des coûts. Malgré tout, la plupart continuent d'absorber ces dépenses élevées, faute d'alternatives crédibles à court terme. Ce phénomène révèle une fracture naissante entre les discours optimistes des PDG sur la valeur de l'IA et la réalité opérationnelle vécue par les équipes qui l'utilisent au quotidien. La prochaine étape pour des groupes comme Uber sera d'imposer des métriques précises de ROI avant d'autoriser tout accroissement supplémentaire des budgets alloués aux outils d'IA générative.

UELa transition d'Anthropic vers une facturation à la consommation de tokens affecte également les entreprises européennes utilisant ses outils, compliquant la prévision et la maîtrise des budgets IA.

BusinessOpinion
1 source
Le défi de communication d'OpenAI
138The Information AI 

Le défi de communication d'OpenAI

OpenAI traverse une période délicate sur le plan de la communication publique, alors que la compagnie se prépare à une introduction en bourse dans un climat politique de plus en plus hostile à l'industrie de l'IA. Depuis le départ de Hannah Wong, responsable des relations publiques, en décembre dernier, le poste est vacant et la recherche d'un remplaçant s'étire. La société a contacté plusieurs profils de haut niveau : Jill Hazelbaker, présidente et directrice des affaires corporate chez Uber ; Sarah O'Brien, qui gère les communications de l'ancien directeur design d'Apple Jony Ive ; et Aaron Zamost, ancien responsable communication chez Square. Aucun accord n'a été conclu à ce jour. Le problème n'est pas seulement de trouver le bon candidat : plusieurs d'entre eux auraient explicitement signalé aux représentants d'OpenAI que le poste est structurellement difficile à tenir. La raison principale est que le PDG Sam Altman et d'autres dirigeants disposent d'une grande liberté de parole publique, multipliant les apparitions médiatiques en suivant leur propre agenda. Dans un secteur où chaque déclaration d'un dirigeant peut déclencher une controverse majeure, l'absence d'un responsable communication expérimenté pour cadrer ces interventions représente un risque réel, d'autant qu'OpenAI a enchaîné plusieurs épisodes embarrassants ces derniers mois. La bataille que se livrent OpenAI, Anthropic et Google dépasse largement les modèles et les revenus : elle intègre désormais la perception publique comme variable stratégique à part entière. Alors qu'Anthropic et OpenAI avancent toutes deux vers une cotation en bourse, la confiance des investisseurs et du grand public devient un actif aussi précieux que la puissance de calcul. OpenAI, en particulier, semble plus exposée que ses concurrentes aux turbulences de communication, ce qui rend le recrutement d'un directeur des affaires publiques de premier plan d'autant plus urgent. Le défi sera de trouver quelqu'un capable de naviguer entre la culture de la liberté de parole qui caractérise la maison et les exigences d'un environnement réglementaire et politique de plus en plus scrutateur.

BusinessOpinion
1 source
☕️ Uber commence à trouver l’addition de l’IA un peu salée
139Next INpact 

☕️ Uber commence à trouver l’addition de l’IA un peu salée

Uber commence à remettre en question la rentabilité de ses investissements en intelligence artificielle. Andrew Macdonald, directeur des opérations du géant américain du transport, a exprimé ses doutes publiquement lors du podcast Rapid Response : une consommation élevée de tokens ne se traduit pas nécessairement par davantage de fonctionnalités utiles pour les utilisateurs finaux. Ce constat rejoint celui de Praveen Neppalli Naga, directeur technique d'Uber, qui avait révélé en avril avoir épuisé en seulement quatre mois le budget IA annuel de l'entreprise. Concrètement, 70 % environ du code validé chez Uber provient désormais d'outils IA, pour un coût oscillant entre 500 et 2 000 dollars par mois et par développeur. Depuis 2024, les dépenses liées à l'IA ont été multipliées par six. Le problème soulevé par Uber est celui du retour sur investissement : les coûts explosent, mais les bénéfices mesurables peinent à suivre. Macdonald admet qu'il est "très difficile d'établir un lien clair" entre les tokens consommés et une augmentation réelle de 25 % des fonctionnalités utiles livrées aux consommateurs. Pour les entreprises qui déploient l'IA à grande échelle, la technologie est loin d'être gratuite, même si elle peut paraître ainsi pour un utilisateur lambda. Ce décalage entre promesses de productivité et coûts réels commence à préoccuper sérieusement les directions financières et techniques des grandes plateformes numériques. Ce malaise chez Uber illustre une tendance plus large dans l'industrie tech. La ruée vers l'intégration systématique de l'IA générative dans tous les workflows, parfois surnommée "tokenmaxxing", montre ses premières limites économiques. Plusieurs entreprises découvrent que les gains de productivité espérés ne compensent pas toujours la facture des API et des infrastructures LLM. La question de la soutenabilité financière des modèles agentiques, où l'IA remplace ou assiste des employés humains sur des tâches complexes, se pose avec une acuité croissante, d'autant que les fournisseurs de modèles n'ont pas encore convergé vers des tarifications stables à long terme.

UELe questionnement sur le ROI de l'IA par les grandes plateformes mondiales incite les entreprises et investisseurs européens à évaluer plus rigoureusement leurs dépenses en outils d'IA générative avant de scaler leurs déploiements.

💬 Brûler son budget annuel en quatre mois, ça oblige à se poser des questions qu'on repoussait. Uber dit ce que beaucoup pensent tout bas : plus de tokens ne veut pas dire plus de valeur livrée à l'utilisateur final. Reste à voir combien de directeurs techniques vont l'admettre publiquement avant de revoir leur copie.

BusinessOpinion
1 source
Dust lève 40 M$ pour accélérer les assistants IA collaboratifs en entreprise
140Le Big Data 

Dust lève 40 M$ pour accélérer les assistants IA collaboratifs en entreprise

La startup française Dust vient d'annoncer une levée de fonds de 40 millions de dollars en série B, menée par Sequoia et Abstract, avec la participation de Snowflake Ventures et Datadog. Cette opération porte son financement total à plus de 60 millions de dollars. L'entreprise, fondée en France, revendique déjà plus de 3 000 organisations clientes, un taux d'utilisation hebdomadaire supérieur à 70 %, un taux de rétention nette des revenus de 240 % en 2025, et plus de 300 000 agents déployés sur sa plateforme. Des clients comme Vanta et Persona illustrent l'adoption concrète : chez Persona, plus de 300 agents ont été créés dans 11 départements pour automatiser des workflows transverses ; chez Vanta, les équipes ventes et support s'appuient sur ces agents pour préparer les business reviews et les prévisions commerciales. Ce financement valide une thèse que Dust pousse contre le courant dominant : l'IA en entreprise échoue à créer de la valeur collective parce que chaque employé travaille avec son propre assistant, son propre historique, sans mémoire partagée. Résultat, différentes équipes reproduisent les mêmes analyses, les mêmes recherches, les mêmes documents, sans capitaliser sur ce qui a déjà été produit. Dust propose un modèle dit "multijoueur", où agents IA et collaborateurs humains évoluent dans un environnement commun, mêmes données, mêmes outils, mêmes objectifs opérationnels. La plateforme se connecte à plus de 100 sources de données et outils métiers, permettant aux agents de générer des documents, analyser des tableurs, produire des présentations et agir directement dans les systèmes connectés. L'enjeu : transformer l'IA d'un outil d'assistance personnelle en infrastructure organisationnelle réutilisable à grande échelle. Dust s'inscrit dans une compétition qui s'accélère entre les plateformes cherchant à capter la couche d'orchestration de l'IA en entreprise, un marché aujourd'hui saturé de copilotes individuels mais encore peu structuré côté collaboration. La participation de Sequoia, l'un des fonds les plus sélectifs de la Silicon Valley, et de fonds liés à des acteurs de la data comme Snowflake et Datadog, signale que l'infrastructure d'IA collaborative est perçue comme la prochaine bataille stratégique. Face aux préoccupations croissantes des entreprises en matière de gouvernance, Dust met également en avant des contrôles de permissions avancés et des journaux d'audit, des arguments de poids pour les grandes organisations hésitant encore à industrialiser leurs usages IA. Avec 40 millions supplémentaires, Dust a désormais les ressources pour accélérer son développement commercial et s'imposer comme standard avant que les géants technologiques ne structurent définitivement ce marché.

UELa startup française Dust lève 40 M$ en série B, renforçant l'écosystème IA européen et offrant aux entreprises françaises et européennes une plateforme d'agents collaboratifs conçue en France avec des garanties de gouvernance adaptées aux exigences réglementaires du marché européen.

💬 Le NRR à 240 %, c'est pas du storytelling, ça veut dire que les clients qui restent dépensent de plus en plus, et c'est le seul chiffre qui compte vraiment pour juger une boîte SaaS. La thèse "IA collaborative vs. copilote solo" est bonne, elle colle à un vrai problème que tu vois partout : chacun a son ChatGPT dans son coin et personne ne capitalise sur rien. Reste à voir si Dust tient sa position quand Microsoft décide de pousser Copilot dans cette direction.

BusinessActu
1 source
La startup IA sans employés Polsia boucle une levée de fonds de 30 M$
141Le Big Data 

La startup IA sans employés Polsia boucle une levée de fonds de 30 M$

Polsia, une startup américaine fondée par un unique fondateur, Ben Sera, vient de boucler une levée de fonds de 30 millions de dollars à une valorisation de 250 millions de dollars. L'annonce a été faite le 22 mai 2026, avec un chiffre d'affaires annuel qui approche les 10 millions de dollars. Particulièrement remarquable : la société ne compte aucun employé. Sera, ancien cofondateur de Future Foods chez Cloud Kitchens aux côtés de Travis Kalanick, a construit Polsia autour d'une orchestration d'agents IA capables de prendre en charge le développement logiciel, la prospection commerciale, la publicité en ligne, le support client et la gestion de workflows métier. Le tour de table réunit des fonds de capital-risque comme Sound Ventures, True Ventures, Offline Ventures, Adjacent, Tekton Ventures et Vaynerfund. Fait notable : Polsia affirme que son propre système d'IA a piloté une grande partie du processus de levée de fonds, notamment la création de la data room, les présentations aux investisseurs et certaines étapes de due diligence. Ben Sera n'est intervenu que lors des échanges finaux et pour signer les documents. L'impact potentiel de ce modèle dépasse largement le cas de Polsia. Si la démonstration est concluante, elle redéfinit ce qu'il est possible de construire avec un capital humain minimal : une seule personne pourrait piloter une entreprise générant des millions de dollars en déléguant la quasi-totalité des opérations à des agents spécialisés. Pour les investisseurs, la promesse est claire : réduction drastique des coûts opérationnels, accélération des cycles de production et capacité à lancer de nouveaux produits sans friction de recrutement. True Ventures va jusqu'à estimer que les outils IA pourraient transformer la création d'entreprise en faisant sauter les barrières liées au capital humain initial, rendant le modèle du fondateur solitaire structurellement viable pour la première fois. Ce positionnement s'inscrit dans un débat plus large sur ce qu'on appelle l'entreprise augmentée par l'IA, où des systèmes automatisés prennent en charge des fonctions autrefois réservées à des équipes entières. Jusqu'ici, la majorité des outils IA imposaient encore une supervision humaine constante ; Polsia cherche à franchir un palier supplémentaire en coordonnant des agents spécialisés sur des tâches complexes et stratégiques. Mais l'enthousiasme des investisseurs ne fait pas l'unanimité. Sur Reddit et d'autres plateformes, de nombreux observateurs remettent en question la crédibilité du modèle, notamment la capacité réelle d'une structure sans équipe à maintenir une croissance à 10 millions de dollars annuels sur le long terme, à gérer des crises imprévues ou à répondre à des clients exigeants. La question reste ouverte : Polsia est-elle un vrai changement de paradigme ou une démonstration de levée de fonds habilement orchestrée par ses propres outils ?

BusinessActu
1 source
La dette de prompts, de récupération et d'évaluation redéfinit discrètement le risque de l'IA en entreprise
142VentureBeat AI 

La dette de prompts, de récupération et d'évaluation redéfinit discrètement le risque de l'IA en entreprise

Une étude du MIT publiée en 2025 révèle que 95 % des projets d'IA n'atteignent jamais la production ou ne génèrent aucune valeur concrète. Dans le même temps, une enquête de S&P Global Market Intelligence indique que 42 % des entreprises ont abandonné plusieurs initiatives d'IA en 2025, contre seulement 17 % l'année précédente. Derrière ces chiffres alarmants se cache un phénomène encore mal nommé : la dette technique liée à l'IA, qui se manifeste sous quatre formes distinctes. La première, la dette de prompts, est la plus visible : des ajustements non documentés, des corrections rapides empilées, l'absence de versionnage, et le "prompt stuffing", l'injection excessive de contexte dans les requêtes, transforment les prompts en code non typé, non testé et fragile. La deuxième forme, la dette de dépendance aux modèles, découle du fait que la logique applicative repose désormais sur des modèles externes (OpenAI, Anthropic, Google...) que l'entreprise ne contrôle pas : une mise à jour du fournisseur peut dégrader silencieusement les performances sans que personne ne le détecte immédiatement. La dette de récupération (retrieval debt) affecte les systèmes RAG, qui puisent dans des bases documentaires d'entreprise souvent désordonnées, dupliquées ou obsolètes, générant des réponses techniquement exactes mais périmées, difficiles à détecter précisément parce qu'elles semblent plausibles. Enfin, la dette d'évaluation reflète l'absence de standards de test continus, de jeux de données de référence et de monitoring en temps réel des déploiements. Ces nouvelles formes de dette ont des conséquences concrètes pour les directions techniques. Contrairement à la dette logicielle classique, localisée dans une base de code et reproductible, la dette IA est distribuée sur des couches hétérogènes, prompts, modèles, pipelines de données, infrastructure, et se manifeste de façon intermittente, en raison de la nature probabiliste des systèmes d'IA. Un bug traditionnel se reproduit et se corrige ; une dérive de modèle ou un prompt dégradé peut passer inaperçu pendant des semaines, s'aggraver progressivement et ne se révéler qu'en production. CTO et CIO perdent ainsi la visibilité sur les performances réelles de leurs systèmes, sans équivalent à l'intégration continue (CI/CD) pour les prompts et les modèles. Ce constat s'inscrit dans une transformation plus profonde de la définition même du risque technique. Pendant vingt ans, la dette technique désignait une architecture vieillissante ou du code mal maintenu, des problèmes circonscrits et relativement maîtrisables. L'IA introduit des dépendances externes non contrôlées, des comportements non déterministes et des pipelines de données vivants, rendant les points de défaillance à la fois plus nombreux et plus difficiles à anticiper. Les entreprises qui déploient des agents et des applications fondées sur des API de modèles fondamentaux s'exposent à des risques systémiques si elles ne mettent pas en place dès maintenant des pratiques de gouvernance adaptées : versionnage des prompts, tests de régression sur les sorties de modèles, et monitoring continu post-déploiement. La prochaine vague d'échecs d'IA ne viendra probablement pas d'hallucinations spectaculaires, mais d'une accumulation silencieuse de dettes invisibles.

BusinessOpinion
1 source
L'essor de l'IA chez Twilio est à double tranchant
143The Information AI 

L'essor de l'IA chez Twilio est à double tranchant

Le titre de Twilio a bondi de 36 % depuis le début de l'année 2026, une performance remarquable alors que la plupart des valeurs logicielles du secteur SaaS accusent des reculs de 30 % en moyenne. Cette hausse tranche avec ce que certains analystes appellent l'« apocalypse SaaS », une vague de dépréciation qui touche les éditeurs de logiciels d'entreprise confrontés à la compression des budgets tech. La croissance du chiffre d'affaires de Twilio a doublé l'an dernier pour atteindre 14 %, portée en grande partie par son activité d'agents vocaux alimentés par l'IA. Ce moteur de croissance repose sur des outils permettant aux entreprises de concevoir et de déployer des agents IA capables de converser avec leurs clients par téléphone. Dans un contexte où les entreprises cherchent à automatiser leur service client sans perdre en qualité d'interaction, cette offre répond à une demande concrète et croissante. Pour les investisseurs, c'est une promesse de revenus récurrents dans un segment à forte valeur ajoutée, ce qui explique l'enthousiasme boursier. Twilio reste pourtant une société dont le cœur historique est la messagerie, les appels et les emails d'entreprise. Sa capacité à pivoter vers l'IA vocale la distingue temporairement de ses concurrents, mais les analystes avertissent que les marchés pourraient négliger les risques structurels du modèle : dépendance à quelques grands clients, pression sur les marges, et concurrence croissante d'acteurs comme Amazon Connect ou les nouvelles plateformes d'agents IA natives.

BusinessOpinion
1 source
☕️ Quand l’IA agentique coûte plus cher que de payer ses employés humains
144Next INpact 

☕️ Quand l’IA agentique coûte plus cher que de payer ses employés humains

Les grandes entreprises technologiques font face à une équation économique qui commence à gripper sérieusement leurs ambitions d'IA : la facturation à l'usage des agents IA, calculée en tokens et non plus en abonnements forfaitaires, rend ces systèmes plus onéreux que les employés humains qu'ils sont censés remplacer ou assister. Le CTO d'Uber, Praveen Neppalli Naga, a reconnu avoir épuisé la totalité de son budget IA 2026 en seulement quatre mois. Bryan Catanzaro, vice-président en charge de l'apprentissage profond appliqué chez Nvidia, est encore plus direct : pour son équipe, le coût de la puissance de calcul dépasse désormais celui des salaires. Microsoft, après avoir encouragé en décembre dernier des milliers de ses développeurs à utiliser Claude Code d'Anthropic, vient d'annuler ces licences et les contraint à migrer vers GitHub Copilot CLI. Ce même GitHub Copilot, qui avait limité fin avril les nouveaux abonnements individuels, basculera en juin vers une facturation indexée sur la consommation réelle de tokens. Cette pression économique a engendré un phénomène pervers baptisé « tokenmaxxing » : des employés génèrent artificiellement de l'activité IA pour gonfler leurs statistiques de consommation, moins pour produire du code utile que pour paraître surproductifs aux yeux de leur hiérarchie. Amazon a fixé comme objectif que 80 % de ses développeurs utilisent l'IA chaque semaine et suit leur consommation de tokens. Meta est allé plus loin encore, avec un tableau de bord interne attribuant le statut de « Token Legend » aux plus grands consommateurs. Ce que ces pratiques révèlent, c'est que les métriques de tokens sont devenues des indicateurs de performance managériale avant d'être des mesures de valeur créée. La question de fond est structurelle : les modèles agentiques consomment beaucoup plus de tokens par tâche que les modèles classiques, et cette intensité ne sera pas compensée par la baisse des coûts unitaires. Un rapport Gartner estime que le coût d'inférence sur un LLM sophistiqué pourrait chuter de 90 % d'ici 2030, mais prévoit néanmoins que le coût total de l'IA continuera d'augmenter si la consommation progresse plus vite que la déflation tarifaire. Jensen Huang, PDG de Nvidia, imaginait récemment un futur où 100 agents IA travailleraient aux côtés de chaque employé humain de son entreprise, une vision qui semble économiquement intenable dans le modèle de facturation actuel. L'industrie se retrouve donc devant un choix structurant : soit les prix s'effondrent suffisamment vite, soit les entreprises doivent revoir radicalement leur usage de l'IA agentique, sous peine de financer des dépenses dont le retour reste difficile à démontrer.

UELes entreprises européennes qui adoptent des agents IA à grande échelle sont exposées aux mêmes pressions économiques liées à la facturation à l'usage, remettant en question la viabilité budgétaire de leurs projets d'IA agentique.

💬 Uber qui épuise son budget IA en quatre mois, Nvidia qui dit que le compute dépasse les salaires : c'est pas un bug, c'est le modèle. Les agents consomment structurellement 10 à 100 fois plus de tokens qu'un chat classique, et aucune baisse de prix unitaire ne rattrapera ça avant 2-3 ans. Le tokenmaxxing chez Amazon et Meta, des gens qui gonflent leur conso pour paraître productifs sur un dashboard, c'est juste le signe qu'on a mis la mauvaise métrique au centre.

BusinessOpinion
1 source
Deepseek rend permanente sa réduction de 75 %, avec des tokens de sortie jusqu'à 34 fois moins chers que GPT-5.5
145The Decoder 

Deepseek rend permanente sa réduction de 75 %, avec des tokens de sortie jusqu'à 34 fois moins chers que GPT-5.5

Deepseek vient de rendre permanent son rabais de 75 % sur son modèle phare V3-Pro, ramenant le prix à 0,435 dollar par million de tokens en entrée. Sur les tokens de sortie, l'écart est encore plus frappant : le modèle chinois est au moins 34 fois moins cher que GPT-5.5 d'OpenAI, et plus de 11,5 fois moins cher sur les tokens d'entrée. Ce qui était présenté comme une promotion temporaire devient désormais la tarification de référence du laboratoire de Shenzhen. Pour les développeurs qui construisent des systèmes agentiques, ces chiffres changent radicalement les calculs économiques. Ces architectures, où un modèle enchaîne des dizaines voire des centaines d'appels successifs, consomment des volumes massifs de tokens de sortie. À parité de performance, un écart de 34x sur ce poste de coût peut transformer un projet non rentable en produit viable, ou simplement rendre un concurrent beaucoup plus compétitif. Les providers occidentaux comme OpenAI, Anthropic et Google se retrouvent sous pression directe sur leur modèle économique. Deepseek avait déjà bousculé le marché en janvier 2025 avec la sortie de son modèle R1, qui avait démontré qu'il était possible d'atteindre des performances comparables aux meilleurs modèles américains pour une fraction du coût de développement. La pérennisation de ce niveau de prix s'inscrit dans une stratégie de conquête de parts de marché à l'échelle mondiale, en pariant que le volume compensera les marges réduites. La question qui se pose désormais aux grands laboratoires américains est de savoir jusqu'où ils peuvent baisser leurs propres tarifs sans menacer leur modèle de financement.

UELes startups et développeurs européens qui construisent des systèmes agentiques peuvent réduire drastiquement leurs coûts en adoptant Deepseek V3-Pro, rendant viables des projets d'IA auparavant non rentables face aux tarifs des providers américains.

💬 34 fois moins cher sur les tokens de sortie, c'est pas une promo, c'est une déclaration de guerre. Pour les architectures agentiques qui enchaînent des centaines d'appels, cet écart transforme des projets impossibles en projets viables du jour au lendemain, sans changer une ligne de code. OpenAI et Anthropic ont un vrai problème.

BusinessOpinion
1 source
Les grands labos d'IA sont désormais des labos d'agents
146Latent Space 

Les grands labos d'IA sont désormais des labos d'agents

Greg Brockman, cofondateur d'OpenAI, a déclaré publiquement début mai 2026 que "le modèle seul n'est plus le produit", une phrase qui résume le tournant stratégique en cours dans toute l'industrie de l'IA. Cette déclaration intervient alors qu'OpenAI prépare son introduction en bourse, attendue dans les prochains jours. Dans le même mouvement, AI21 Labs a annoncé la fermeture de son équipe modèle pour se reconvertir entièrement aux agents. DeepSeek, le laboratoire chinois, constitue pour la première fois une équipe dédiée aux "harnesses", les architectures logicielles qui encapsulent les modèles dans des workflows produits. Parallèlement, DeepSeek a rendu permanente la réduction de 75 % sur son modèle V4-Pro, avec des tarifs désormais fixés à 0,435 dollar par million de tokens en entrée, 0,87 dollar en sortie, et seulement 0,0036 dollar pour le cache, soit un coût moyen estimé à environ 0,18 dollar par million de tokens. Ce niveau de prix place DeepSeek-V4-Pro à trois fois moins cher que Gemini 3.1 Pro Preview, douze fois moins que GPT-5.5, et dix-neuf fois moins que Claude Opus 4.7 selon les estimations d'ArtificialAnlys. Ce mouvement collectif vers les agents signale une recomposition profonde de la chaîne de valeur en IA. Le vrai avantage concurrentiel ne réside plus dans la capacité brute du modèle, mais dans l'ensemble formé par le modèle, le harness, les workflows, l'interface utilisateur, la mémoire et les économies d'échelle. OpenAI a livré une mise à jour substantielle de Codex ("codex thursday n°6") avec des améliorations sur les appshots, le mode annotation, le partage de plugins et les analytics. Anthropic a étendu le mode auto à son offre Pro et ajouté le support de Sonnet 4.6. Pour les développeurs et les entreprises, la conséquence directe est que le choix d'un fournisseur d'IA devient aussi un choix d'écosystème : quitter une plateforme revient à abandonner des workflows entiers, pas seulement un modèle. Ce pivot s'inscrit dans une tension structurelle entre ouverture et contrôle. Si un laboratoire entraîne un modèle en symbiose étroite avec son propre harness propriétaire, le modèle perd une part de son utilité en dehors de cet écosystème, ce qui réduit de fait l'intérêt de l'API ouverte et pousse les utilisateurs vers l'offre packagée du fournisseur. La stratégie de prix agressive de DeepSeek complique encore le tableau : en rendant l'intelligence "trop bon marché pour être mesurée", selon l'expression qui circule dans la communauté, le laboratoire chinois force ses concurrents à justifier leurs marges autrement que par la performance brute. Les prochains mois diront si cette convergence vers les agents accélère la fermeture des modèles frontière ou, au contraire, redonne de la valeur aux modèles open source capables de s'intégrer dans n'importe quel harness.

UELa bascule vers les écosystèmes agents et la guerre des prix initiée par DeepSeek contraignent les entreprises et développeurs européens à réévaluer leur choix de fournisseur d'IA en intégrant le risque de dépendance aux workflows propriétaires, au-delà de la simple performance des modèles.

💬 Le vrai lock-in de demain, c'est pas le modèle, c'est le harness qui s'accumule autour. Brockman le dit officiellement, mais ça se voyait dans les usages depuis un moment, là où les équipes galèrent à migrer sans tout reconstruire. DeepSeek à 19 fois moins cher qu'Opus 4.7, c'est une vraie pression, mais elle joue sur la marge, pas sur l'enfermement.

BusinessOpinion
1 source
Microsoft ouvre un nouveau front dans le débat sur les données pour les agents IA
147The Information AI 

Microsoft ouvre un nouveau front dans le débat sur les données pour les agents IA

Microsoft a durci sa position face à Databricks en bloquant l'accès de ce partenaire de longue date à Power BI, son outil phare d'analyse et de visualisation de données. Début mars, Databricks avait commencé à tester une nouvelle fonctionnalité permettant à ses clients de connecter facilement leurs données hébergées sur sa plateforme à des outils de visualisation tiers, dont Power BI. Microsoft a réagi en fermant cette intégration, protégeant ainsi un produit utilisé par la quasi-totalité des entreprises du Fortune 500 pour piloter leurs opérations via tableaux de bord et graphiques. Cette décision illustre une tension croissante autour du contrôle des flux de données dans l'écosystème des agents IA. Power BI n'est plus seulement un outil de reporting : il devient une porte d'entrée stratégique vers les données d'entreprise que les agents IA exploitent pour automatiser des décisions. En bloquant Databricks, Microsoft cherche à s'assurer que ces flux restent dans son propre écosystème, renforçant l'attrait de ses solutions Fabric et Azure pour les entreprises qui déploient des agents. Ce bras de fer s'inscrit dans une recomposition plus large du marché des données d'entreprise, où Databricks, valorisé à plus de 62 milliards de dollars, concurrence directement Microsoft sur le terrain du traitement analytique et de l'IA. La relation entre les deux entreprises, autrefois complémentaire, se transforme en rivalité frontale à mesure que l'IA agentique redéfinit la valeur des couches données. D'autres partenaires de Microsoft pourraient se trouver dans la même situation si leurs outils empiètent sur des territoires que Redmond considère comme stratégiques.

UELes entreprises européennes utilisant conjointement Power BI et Databricks devront évaluer les risques de verrouillage dans l'écosystème Microsoft pour leurs déploiements d'agents IA.

💬 C'est le jeu classique de la plateforme qui ferme ses portes dès que les enjeux deviennent vraiment sérieux. Microsoft ne bloque pas Databricks parce que ça les gêne aujourd'hui, il bloque parce que Power BI est en train de devenir le point de passage obligatoire pour tout agent IA qui veut lire les données de ton entreprise. À 62 milliards de valorisation, Databricks n'est plus un partenaire à ménager.

BusinessOpinion
1 source
Microsoft et EY investissent 1 milliard de dollars pour accélérer l’industrialisation de l’IA
148Le Big Data 

Microsoft et EY investissent 1 milliard de dollars pour accélérer l’industrialisation de l’IA

Microsoft et EY ont annoncé le 21 mai 2026 un partenariat stratégique d'un milliard de dollars sur cinq ans pour accélérer le déploiement industriel de l'intelligence artificielle dans les grandes entreprises. L'initiative prévoit la constitution d'équipes mixtes, composées d'ingénieurs Microsoft et de consultants sectoriels EY, chargées d'accompagner les organisations dans l'intégration de l'IA au coeur de leurs opérations critiques. Les secteurs ciblés en priorité sont les services financiers, l'industrie, l'énergie, la santé, le secteur public, la distribution et les biens de consommation. EY a déjà généralisé Microsoft 365 E7 à plus de 400 000 collaborateurs dans le monde, après avoir déployé Copilot auprès de 150 000 employés avec un gain de productivité estimé à 15 %. Dans la finance, l'usage de Microsoft Power Platform et Copilot Studio aurait réduit certains délais opérationnels de 95 % et les coûts de plus de 37 %. EY a par ailleurs intégré un système multi-agents basé sur Azure, Microsoft Foundry et Microsoft Fabric dans sa plateforme d'audit EY Canvas, couvrant déjà 130 000 professionnels sur 160 000 missions. Ce partenariat répond à un blocage structurel que rencontrent aujourd'hui la plupart des grands groupes : passer des expérimentations isolées à un déploiement IA à l'échelle de l'entreprise. La majorité des organisations accumulent des pilotes sans parvenir à les industrialiser, faute de gouvernance adaptée, de formation des collaborateurs et de processus internes reconfigurés. En ciblant précisément les secteurs où l'automatisation et l'analyse de données produisent des impacts financiers rapides et mesurables, Microsoft et EY cherchent à répondre à l'exigence croissante de retour sur investissement concret que posent les directions générales avant tout nouvel engagement budgétaire dans l'IA. EY joue dans cette alliance la carte du "Client Zéro" : le cabinet teste les technologies Microsoft sur ses propres opérations avant de les proposer à ses clients, ce qui lui confère un avantage crédible dans un marché saturé de promesses non vérifiées. Ce positionnement intervient dans un contexte de compétition intense entre les grands cabinets de conseil et les éditeurs technologiques pour capter les budgets de transformation IA des entreprises du Fortune 500. Microsoft, de son côté, consolide son écosystème Azure et Copilot comme infrastructure de référence pour l'entreprise, face à la concurrence de Google Cloud et AWS. La suite dépendra de la capacité des deux groupes à démontrer des résultats reproductibles et auditables, condition sine qua non pour convaincre les directions financières d'accélérer leurs investissements au-delà des phases pilotes.

UELes grandes entreprises françaises et européennes des secteurs financier, énergétique, de la santé et du secteur public sont directement ciblées par ce programme d'industrialisation IA, susceptible d'accélérer les transformations numériques dans l'UE.

💬 Le problème qu'ils attaquent, l'industrialisation après les pilotes, c'est le vrai blocage de l'IA en entreprise depuis deux ans. EY qui joue le Client Zéro sur 400 000 collaborateurs, c'est l'argument le plus solide qu'un cabinet peut sortir face aux DG qui ont avalé trop de PowerPoints. Les 95% de réduction de délais affichés, bon, sur le papier ça claque, mais ça va être une autre histoire à reproduire sans EY dans la boucle.

BusinessOpinion
1 source
OpenAI inaugure un laboratoire à Singapour tandis que l'IMDA met à jour son cadre IA
149AI News 

OpenAI inaugure un laboratoire à Singapour tandis que l'IMDA met à jour son cadre IA

OpenAI va ouvrir son premier laboratoire d'IA appliquée hors des États-Unis à Singapour. Baptisée "OpenAI for Singapore", cette initiative a été annoncée lors de l'ATx Summit en partenariat avec le ministère du Développement Numérique et de l'Information, adossée à un engagement de plus de 300 millions de dollars singapouriens. Le laboratoire créera plus de 200 postes techniques locaux sur plusieurs années, et Singapour deviendra l'un des hubs mondiaux pour les ingénieurs d'OpenAI chargés du déploiement auprès des organisations. Les travaux se concentreront sur les priorités de l'AI Mission singapourienne, notamment les services publics, la finance et l'infrastructure numérique. Simultanément, l'Infocomm Media Development Authority (IMDA) a publié une version actualisée de son cadre de gouvernance pour l'IA agentique, lancé lors du Forum Économique Mondial en janvier 2026, révisé après consultation de plus de 60 organisations dont AWS, DBS, Google et Salesforce. L'implantation d'OpenAI à Singapour dépasse l'ouverture d'un bureau commercial : il s'agit d'un centre technique capable de développer des solutions adaptées aux besoins locaux, avec des programmes d'accompagnement concrets tels qu'un chapitre singapourien de l'OpenAI Academy, des hackathons Codex for Teachers et des ateliers destinés aux micro-entrepreneurs et PME pour intégrer l'IA dans leurs opérations. Pour les systèmes agentiques, la mise à jour du cadre IMDA apporte des réponses précises aux risques émergents : systèmes multi-agents, agents tiers, biais d'automatisation et responsabilité humaine sont désormais traités explicitement, avec plus de dix études de cas issues d'organisations comme Tencent, OCBC, PwC et GovTech Singapore. Ces deux annonces s'inscrivent dans la stratégie de Singapour pour s'imposer comme une référence mondiale en gouvernance de l'IA, un effort qui remonte au Model AI Governance Framework de 2020 et qui s'est progressivement densifié à mesure que les technologies évoluaient. Les études de cas du nouveau cadre IMDA illustrent comment des entreprises ont mis en oeuvre des mécanismes concrets de supervision humaine : Dayos, une société d'automatisation IA basée à Singapour, a déployé un agent de ticketing IT avec des niveaux de risque gradués, automatisant les actions réversibles comme les réinitialisations de mots de passe et exigeant une approbation humaine pour les modifications à risque élevé. Tencent, de son côté, a contribué avec CodeBuddy, son système de codage agentique qui requiert une validation explicite pour toute action sensible. L'enjeu dépasse largement Singapour : à mesure que les agents IA gagnent en autonomie dans les entreprises, ces cadres de gouvernance pourraient servir de modèle aux pays encore en quête de référentiels opérationnels.

UELe cadre de gouvernance singapourien pour les agents IA, co-construit avec plus de 60 organisations mondiales, pourrait servir de référentiel opérationnel aux régulateurs européens pour l'application de l'AI Act aux systèmes agentiques.

💬 Singapour joue un jeu long depuis 2020, et là ça commence à prendre forme. OpenAI ne pose pas juste un drapeau commercial : 200 postes techniques, des programmes pour les PME locales, un labo capable de développer des solutions sur-mesure, c'est une vraie infrastructure. Ce qui m'intéresse surtout, c'est le cadre IMDA sur les agents : 60 organisations, des études de cas réelles, une gouvernance graduée par niveau de risque. Les Européens devraient regarder ça de près avant de finir l'AI Act en salle de réunion.

BusinessActu
1 source
Hark obtient 700 millions de dollars pour son projet d’assistant IA universel
150Le Big Data 

Hark obtient 700 millions de dollars pour son projet d’assistant IA universel

La startup Hark a annoncé le 21 mai 2026 une levée de fonds de 700 millions de dollars, portant sa valorisation à 6 milliards de dollars à peine quelques mois après sa fondation fin 2025. Fondée par Brett Adcock, déjà connu pour avoir lancé le fabricant de robots humanoïdes Figure AI et la compagnie d'aviation électrique Archer Aviation, Hark développe un assistant IA universel destiné au grand public. Le tour de table a été mené par Parkway Venture Capital avec la participation de Nvidia, AMD Ventures, Intel Capital, Qualcomm Ventures, Salesforce Ventures et ARK Invest. L'entreprise prévoit de lancer ses premiers modèles multimodaux dès l'été 2026, avant de déployer sa propre gamme de matériel dédié. Malgré cette levée exceptionnelle, Hark reste très discrète sur les détails techniques de son produit. La vision portée par Hark tranche avec la majorité des acteurs actuels de l'IA générative, concentrés sur les copilotes professionnels, les outils de développement ou l'automatisation d'entreprise. La startup vise l'expérience quotidienne de l'utilisateur ordinaire : un assistant capable d'écouter et de parler naturellement, de comprendre des images, de conserver une mémoire persistante et de s'adapter profondément au contexte personnel de chaque utilisateur. Selon Abidur Chowdhury, ancien designer chez Apple et désormais directeur du design chez Hark, les outils IA actuels restent encore trop orientés développeurs ou usages professionnels avancés, laissant un vide béant pour le grand public. L'ambition déclarée est de créer une interface centrale entre l'utilisateur, ses services numériques et ses appareils connectés, combinant logiciel, matériel et IA agentive dans une expérience unifiée. Cette levée de fonds massive reflète une conviction qui s'impose de plus en plus dans la Silicon Valley : la prochaine grande plateforme technologique ne sera pas un simple logiciel, mais une interface IA native capable de remplacer progressivement les couches applicatives existantes. Le fait que des fabricants de semi-conducteurs concurrents comme Nvidia, AMD et Intel Capital investissent simultanément dans le même projet illustre l'enjeu stratégique que représente le contrôle de la couche applicative IA de nouvelle génération. Brett Adcock lui-même a publiquement critiqué les modèles IA actuels qu'il juge trop basiques, insuffisamment personnalisés et incapables d'interagir naturellement. Hark entre ainsi en compétition indirecte avec des projets similaires portés par des acteurs établis comme Apple Intelligence, Google Gemini ou OpenAI, mais parie sur une approche matériel-logiciel intégrée, comparable à ce qu'Apple a réalisé avec l'iPhone, pour s'imposer comme la prochaine interface dominante de l'ère IA.

💬 Adcock lève 700 millions sur une conviction simple : les assistants IA actuels sont encore des outils pour geeks, et le grand public n'a rien de vraiment utilisable. C'est pas faux, et ça explique pourquoi Nvidia, AMD et Intel ont tous mis au même pot malgré leur rivalité, chacun veut être dans la prochaine plateforme dominante. Reste à voir ce que ça vaut cet été quand les premiers modèles sortent.

BusinessActu
1 source