Aller au contenu principal
[AINews] Silicon Valley prend les services au sérieux
BusinessLatent Space6sem· 2 min de lecture

[AINews] Silicon Valley prend les services au sérieux

Source originale ↗·

Anthropic et OpenAI ont simultanément annoncé le lancement de sociétés de services dédiées au déploiement de l'IA en entreprise. Anthropic s'associe à trois géants financiers, Blackstone, Hellman & Friedman et Goldman Sachs, dans une coentreprise non encore nommée, capitalisée à hauteur de 1,5 milliard de dollars (300 millions chacun des principaux participants). Le modèle opérationnel repose sur des petites équipes qui travaillent directement avec les clients pour identifier les usages à fort impact, puis construisent des systèmes sur mesure basés sur Claude en collaboration avec les ingénieurs d'Anthropic. OpenAI, de son côté, lance "The Deployment Company", soutenue par 19 investisseurs dont TPG, Brookfield Asset Management, Advent et Bain Capital, ayant déjà levé environ 4 milliards de dollars pour une valorisation pré-money de 10 milliards. Brad Lightcap, directeur des opérations d'OpenAI, quitte son poste pour diriger cette nouvelle entité, sous l'autorité directe de Sam Altman. En parallèle, OpenAI a déployé GPT-5.5 Instant comme nouveau modèle par défaut de ChatGPT, avec des améliorations en factualité, compréhension d'images et personnalisation, incluant l'accès aux souvenirs, historiques de conversations et Gmail des utilisateurs.

Ce pivot vers les services marque une inflexion majeure dans le modèle économique des grands laboratoires d'IA. Vendre des modèles via API ne suffit plus, la vraie valeur, et le vrai chiffre d'affaires, se trouvent dans l'intégration effective de l'IA dans les processus métiers. Aaron Levie, PDG de Box, le résume clairement : faire fonctionner des agents en dehors du code implique de moderniser les systèmes informatiques, de fournir le bon contexte aux agents, de repenser les workflows, de gérer la relation humain-agent et de piloter l'adoption en interne. Il n'existe pas de raccourci pour ancrer l'intelligence artificielle dans un processus industriel de manière stable. Ces nouvelles entités ouvrent un marché considérable pour de nouveaux emplois et de nouvelles entreprises de services.

Cette évolution traduit une tension structurelle que les laboratoires d'IA avaient jusqu'ici évitée : devenir des sociétés de conseil et d'intégration, ce qui les expose à une concurrence directe avec des acteurs comme Accenture, McKinsey ou les grandes ESN. La finance représente déjà le deuxième segment de revenus d'Anthropic, comme en témoigne l'événement "Financial Services" organisé à New York début mai avec un parterre de dirigeants du secteur. OpenAI et Anthropic font le pari que la complexité du déploiement de l'IA en entreprise est suffisamment grande pour justifier une présence directe sur le terrain, et que les marges d'un contrat d'intégration à 1,5 milliard valent bien le risque de brouiller leur positionnement de laboratoire de recherche.

Impact France/UE

Les ESN et cabinets de conseil européens (Capgemini, Sopra Steria) se retrouvent en concurrence directe avec OpenAI et Anthropic sur le marché de l'intégration IA en entreprise, un segment jusqu'ici préservé.

💬 L'analyse de Mathieu

C'est le mouvement que tout le monde voyait venir, mais pas si tôt. La vraie marge, ce n'est pas les tokens via API, c'est l'intégration sur mesure chez le client, les mains dans le cambouis avec les équipes IT, et OpenAI et Anthropic ont décidé de ne pas laisser ça aux ESN. Capgemini et Sopra ont un problème.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

AWS Professional Services : une équipe de pointe IA construite de l'intérieur
1AWS ML Blog 

AWS Professional Services : une équipe de pointe IA construite de l'intérieur

AWS Professional Services a fondamentalement reconfiguré sa manière de travailler en passant d'un modèle de consulting traditionnel à ce que l'entreprise appelle une "frontier team", une équipe dont l'IA n'est plus un outil parmi d'autres, mais le socle opérationnel de chaque engagement. Le résultat le plus visible : des projets qui prenaient plusieurs mois se déroulent désormais en quelques jours. Pour y parvenir, AWS ProServe a créé une équipe dédiée baptisée APEX (Agentic AI ProServe Experiences), dont la mission unique était de repenser entièrement le modèle de livraison. APEX a conçu le "ProServe Delivery Agent", un système multi-agents couvrant l'ensemble du cycle de vie : analyse des besoins, validation architecturale, implémentation, revue de sécurité, tests et déploiement. Un agent superviseur orchestre des sous-agents spécialisés à chaque phase. Ce système fonctionne aujourd'hui aux côtés des consultants humains sur des projets réels, dans le monde entier, et n'est plus un pilote : c'est le mode de livraison standard à l'échelle de ProServe. L'enjeu central de cette transformation n'était pas d'accélérer pour le plaisir de la vitesse, mais de libérer les consultants de tout ce qui n'est pas du jugement à haute valeur ajoutée, documentation, coordination, reporting de statut, mise en place répétitive de structures de code. En remettant l'attention humaine là où elle change vraiment les résultats, l'organisation a pu maintenir un niveau de qualité élevé même lorsque le rythme d'exécution s'est accéléré drastiquement. Concrètement, les exigences projet ne sont plus rédigées en prose pour être lues par des humains, mais formalisées en spécifications structurées lisibles à la fois par les équipes et par les agents. Les tests et les revues de sécurité ne se font plus en fin de phase, mais en continu dans la boucle de construction, les agents se corrigeant eux-mêmes avant toute revue humaine. Cette initiative s'inscrit dans une réflexion plus large conduite par AWS sur ce que signifie construire des logiciels à l'ère de l'IA. Le cadre méthodologique sous-jacent, appelé AI-DLC (AI-Driven Development Lifecycle), a été développé et affiné lors de centaines d'ateliers clients menés par les équipes terrain d'AWS. La démarche d'AWS ProServe suit l'une des trois voies que l'entreprise a identifiées pour intégrer le développement AI-natif : le "pathfinder", une initiative pionnière qui expérimente en conditions réelles avant d'en généraliser les acquis. Ce modèle de transformation de l'intérieur vers l'extérieur, où le prestataire absorbe lui-même les pratiques qu'il vend avant de les proposer à ses clients, constitue le message central qu'AWS cherche à transmettre : la productivité réelle ne vient pas de l'ajout d'outils IA par-dessus des processus existants, mais d'une refonte complète de la façon dont le travail est conçu, distribué et exécuté.

BusinessActu
1 source
L'architecture radicale de DeepSeek fracasse l'avantage concurrentiel de Silicon Valley sur les tokens
2VentureBeat AI 

L'architecture radicale de DeepSeek fracasse l'avantage concurrentiel de Silicon Valley sur les tokens

DeepSeek a officialisé cette semaine la pérennisation de sa réduction de prix de 75 % sur son modèle phare V4 Pro, transformant ce qui ressemblait à une offensive temporaire en une rupture structurelle du marché. Concrètement, V4 Pro est désormais sept fois moins cher en entrées et dix-sept fois moins cher en sorties que Claude Sonnet d'Anthropic ou le GPT-5.5-Med d'OpenAI. La version allégée DeepSeek V4 Flash, optimisée pour la vitesse, est quant à elle dix à vingt-cinq fois moins chère que Claude Haiku. En Chine, le prix de lecture du cache atteint un niveau quatre-vingt-sept fois inférieur à celui des grandes plateformes cloud occidentales, un écart si brutal que Xiaomi vient d'aligner sa propre architecture MiMo sur ce même barème tarifaire. Ces deux modèles sont distribués en open-weight sous licence MIT, offrant aux entreprises une liberté totale de déploiement. Malgré ce positionnement prix, V4 Pro affiche 80,6 % sur le benchmark SWE-bench Verified pour les tâches d'agents de code, et 87,5 sur l'indice MMLU-Pro, des scores proches des meilleurs modèles occidentaux. L'impact sur les entreprises utilisatrices est déjà tangible. Uber a révélé avoir épuisé l'intégralité de son budget 2026 alloué à Claude Code et Cursor en seulement quatre mois, son directeur des opérations jugeant les coûts liés à l'usage intensif de tokens de plus en plus difficiles à justifier. Airbnb préfère depuis longtemps des alternatives plus rapides et moins chères comme Qwen d'Alibaba plutôt que de déployer massivement les modèles d'OpenAI en production. Pinterest est allé encore plus loin : son directeur technique Matt Madrigal a confirmé que l'entreprise a intégralement misé sur l'open source, en affinant Qwen sur son graphe de préférences propriétaire pour réduire ses coûts de 90 %. La baisse de prix de DeepSeek rend de tels arbitrages encore plus attractifs, accélérant la commoditisation de la couche API à fort volume. Cette dynamique s'inscrit dans un contexte de pression croissante sur les grands laboratoires occidentaux, dont les investissements en infrastructure se chiffrent en dizaines de milliards de dollars. OpenAI, dont le modèle économique repose largement sur des flux API génériques, apparaît plus exposée qu'Anthropic, dont l'offre est davantage intégrée dans des workflows logiciels différenciés. Du côté de l'adoption en entreprise, les freins demeurent importants : pour les secteurs réglementés américains, finance, santé, défense, l'utilisation de modèles chinois soulève des questions de conformité, de risques liés à la chaîne d'approvisionnement logicielle et de potentielles sanctions fédérales. L'architecture open-weight permet certes un hébergement local sans transfert de données vers des serveurs étrangers, mais les comités de conformité restent prudents. Le marché semble donc se scinder en deux : un segment premium pour les workflows critiques, et une couche agentique de fond entièrement commoditisée par les poids ouverts.

UELa réduction tarifaire permanente de DeepSeek pourrait réduire de 75 à 90 % les coûts d'infrastructure LLM pour les entreprises européennes, mais les secteurs réglementés devront évaluer les risques de conformité liés à l'utilisation de modèles chinois en open-weight.

💬 Ce qui me frappe, c'est pas les benchmarks, c'est Uber qui a cramé son budget Claude Code annuel en quatre mois. La baisse de 75 % de DeepSeek est permanente maintenant, ce qui veut dire que les arbitrages qu'Airbnb ou Pinterest font depuis un moment vont s'accélérer partout. Le marché API générique est commoditisé, la différence se jouera ailleurs.

BusinessOpinion
1 source
OpenAI veut se « recentrer », mais s’offre le podcast préféré de la Silicon Valley
301net 

OpenAI veut se « recentrer », mais s’offre le podcast préféré de la Silicon Valley

OpenAI a annoncé le rachat du podcast "All-In", l'émission tech la plus écoutée de la Silicon Valley, dans un mouvement qui surprend au moment même où l'entreprise affiche des ambitions de recentrage stratégique. Cette acquisition intervient après une série de revers coûteux : l'arrêt de Sora, son générateur vidéo phare, l'échec d'un partenariat avec Disney, et près d'un milliard de dollars de pertes enregistrées sur des projets abandonnés en 2025. Cette décision illustre une tension croissante au sein d'OpenAI entre la rhétorique de la rigueur et une réalité d'expansion tous azimuts. Posséder le media de référence de l'élite tech américaine offre à Sam Altman un levier d'influence considérable sur les narratives qui façonnent l'industrie, les investisseurs et les régulateurs. Pour les utilisateurs et les concurrents, cela signale qu'OpenAI joue désormais sur le terrain de la communication autant que sur celui de la recherche. Ce rachat s'inscrit dans une période charnière pour OpenAI, qui doit à la fois justifier sa valorisation de plusieurs centaines de milliards de dollars, résister à la montée en puissance de Gemini et de Claude, et gérer les critiques sur sa transformation en entité à but lucratif. Acquérir une voix influente dans l'écosystème tech pourrait être une manière de consolider son image au moment où son leadership est le plus contesté.

BusinessOpinion
1 source
L'ingénierie centrée client au service de l'innovation en IA
4MIT Technology Review 

L'ingénierie centrée client au service de l'innovation en IA

Malgré des années d'investissements massifs dans la digitalisation, les grandes entreprises ne capturent en moyenne moins d'un tiers de la valeur attendue, selon une étude McKinsey. Ashish Agrawal, vice-président responsable des technologies de paiement et cartes business chez Capital One, identifie une cause structurelle : la plupart des organisations construisent leurs outils technologiques d'abord, puis cherchent ensuite à les appliquer aux besoins clients. Son équipe a inversé cette logique en adoptant ce qu'il appelle le "customer-back engineering" : partir des attentes, frictions et besoins concrets des utilisateurs, puis remonter vers les solutions techniques. Concrètement, Capital One impose à chaque ingénieur plusieurs points de contact annuels avec les clients : sessions d'empathie digitale pour observer les parcours utilisateurs, immersions au sein du support client, accompagnements terrain aux côtés des équipes commerciales, et hackathons centrés sur de vrais problèmes clients. Cette approche produit un effet multiplicateur sur l'innovation. Quand les ingénieurs sont exposés directement aux difficultés vécues par les utilisateurs, ils développent des solutions que ni les équipes produit ni les équipes commerciales n'auraient imaginées seules, car ils restent naturellement proches des systèmes et des données. L'impact est aussi motivationnel : voir concrètement comment une modification de code améliore la vie d'un client transforme l'engagement des développeurs. Avec l'IA, cet effet est amplifié. Dans le service client de Capital One, des agents conversationnels basés sur l'IA générative peuvent désormais résumer instantanément l'historique d'un échange, fournir au conseiller humain le contexte complet d'une demande et poser automatiquement des questions de suivi ciblées, des tâches qui demandaient auparavant plusieurs minutes de lecture manuelle. Le constat d'Agrawal s'inscrit dans un débat plus large sur la manière dont les grandes entreprises tirent parti de l'IA. Beaucoup ont construit des pipelines de données riches au fil des années sans en exploiter pleinement le potentiel. L'émergence des outils agentiques change la donne : combinés à un écosystème de données de qualité, ils permettent de passer des correctifs incrémentaux à une transformation à haute vélocité. Le véritable frein n'est plus technologique mais organisationnel : rapprocher les ingénieurs des clients demande une discipline managériale forte et une culture délibérément entretenue. Capital One parie que les entreprises qui réussiront à ancrer cette proximité dans leurs pratiques d'ingénierie seront celles capables d'itérer le plus vite, d'identifier les bons problèmes avant leurs concurrents, et donc de transformer l'IA en avantage compétitif durable plutôt qu'en coût technologique supplémentaire.

BusinessOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic