Aller au contenu principal
Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI
InfrastructureLe Big Data6sem· 2 min de lecture

Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI

Source originale ↗·

Anthropic s'apprête à verser jusqu'à 1,25 milliard de dollars par mois à xAI, la société d'intelligence artificielle d'Elon Musk, pour accéder à sa puissance de calcul. L'accord, révélé dans un dépôt S-1 de SpaceX auprès de la SEC, porte sur l'achat de la totalité de la production du centre de données Colossus 1, situé près de Memphis, dans le Tennessee. Le contrat court jusqu'en mai 2029 et pourrait représenter jusqu'à 45 milliards de dollars de revenus cumulés pour xAI, les deux parties conservant toutefois une option de résiliation avec un préavis de 90 jours. L'accord fait suite à une première annonce, quelques semaines plus tôt, selon laquelle Anthropic avait sécurisé 300 mégawatts de capacité de calcul auprès de xAI, une décision déjà jugée surprenante par le marché.

Pour Anthropic, l'accès garanti à des milliers de GPU sur plusieurs années répond à une contrainte structurelle : les modèles génératifs de nouvelle génération exigent des volumes de calcul massifs, aussi bien pour l'entraînement que pour l'inférence et les usages professionnels en temps réel. Alors que la demande des entreprises s'emballe plus vite que l'offre mondiale en puces avancées, verrouiller plusieurs années de capacité permet au créateur de Claude de réduire sa dépendance aux grands fournisseurs cloud traditionnels, Amazon Web Services, Microsoft Azure et Google Cloud. L'accord réduit également le risque de goulots d'étranglement à mesure qu'Anthropic étend ses déploiements dans les produits et workflows d'entreprises.

Pour xAI, en revanche, ce contrat s'inscrit dans une stratégie de monétisation agressive de sa capacité excédentaire. Selon les documents de SpaceX, l'accord permet de rentabiliser des serveurs sous-utilisés, une situation qui coïncide avec un ralentissement rapporté de l'usage de Grok, l'assistant IA de xAI, ces derniers mois. Ce modèle positionne xAI dans la catégorie des "néoclouds" : des acteurs qui construisent d'abord une infrastructure pour leurs propres modèles, puis revendent la capacité disponible à d'autres entreprises du secteur, accélérant ainsi l'amortissement des coûts colossaux liés aux GPU Nvidia et aux centres de données énergivores. Paradoxalement, la transaction illustre aussi une évolution du marché : deux concurrents directs sur le segment des modèles génératifs coopèrent désormais sur l'infrastructure, signe que les investissements nécessaires à la course à l'IA dépassent ce que même les leaders du secteur peuvent absorber seuls.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Micron et Anthropic s’allient pour renforcer l’infrastructure IA de nouvelle génération
1Le Big Data 

Micron et Anthropic s’allient pour renforcer l’infrastructure IA de nouvelle génération

Micron Technology et Anthropic ont annoncé le 22 juin 2026 un accord stratégique multidimensionnel qui couvre quatre axes : la co-conception d'architectures de mémoire et de stockage optimisées pour l'IA, un contrat d'approvisionnement à long terme portant sur l'ensemble du portefeuille de solutions pour centres de données de Micron, le déploiement interne de Claude dans les équipes de Micron, et une participation financière du fabricant de semi-conducteurs au tour de financement Série H d'Anthropic. Les deux entreprises travailleront conjointement sur les technologies de mémoire HBM (High Bandwidth Memory), les modules DRAM haute performance et les SSD destinés aux data centers, ces composants étant au cœur des infrastructures utilisées pour entraîner et faire tourner les modèles Claude. Tom Brown, cofondateur d'Anthropic et responsable des ressources de calcul, a souligné que la mémoire et le stockage jouent désormais un rôle central dans l'efficacité des systèmes d'entraînement et d'inférence de l'entreprise. L'accord illustre un changement de paradigme dans l'industrie de l'IA : les performances d'un modèle dépendent autant de l'infrastructure matérielle sous-jacente que des avancées algorithmiques. Si les GPU concentrent souvent l'attention, la capacité à les alimenter en données à très haute vitesse est devenue un facteur déterminant pour les coûts, les performances et la consommation énergétique des infrastructures à grande échelle. En optimisant directement les sous-systèmes mémoire utilisés par Anthropic, les deux partenaires cherchent à réduire le coût unitaire de chaque requête traitée par Claude, un levier concurrentiel décisif à mesure que le marché de l'IA générative se masse-marketise. L'accord d'approvisionnement sécurise par ailleurs la croissance d'Anthropic sur plusieurs années, limitant les risques de pénurie de composants critiques dans un marché en tension. Ce partenariat s'inscrit dans une stratégie plus large d'Anthropic visant à consolider ses fondations matérielles face à l'accélération de la demande autour de Claude. Reuters relevait récemment qu'Anthropic a multiplié les accords destinés à renforcer ses capacités de calcul, au moment même où le laboratoire enchaîne les levées de fonds record pour rivaliser avec OpenAI et Google DeepMind. Pour Micron, l'opération représente une opportunité de positionner ses technologies HBM comme composants de référence dans les futures générations d'infrastructure IA, un marché en croissance explosive. La collaboration technique directe avec un laboratoire de premier plan lui permet d'anticiper les besoins des prochains modèles et d'adapter son offre bien en amont, transformant un client potentiel en co-développeur.

InfrastructureOpinion
1 source
2The Decoder 

OpenAI affirme à ses investisseurs que son infrastructure lui donne un avantage sur Anthropic

OpenAI a présenté à ses investisseurs un argument central : l'avance prise dans la construction de ses infrastructures de calcul lui confère un avantage décisif sur Anthropic. Selon le discours tenu aux financeurs, les années d'investissement massif dans les datacenters et les systèmes d'entraînement auraient créé une position difficile à rattraper pour ses concurrents. Parallèlement, la société a annoncé la mise en pause de son projet de datacenter au Royaume-Uni, une décision qui contraste avec l'ambition d'expansion mondiale affichée par OpenAI ces derniers mois. Cet argumentaire intervient dans un contexte de compétition intense pour le financement et la crédibilité commerciale. Pour les investisseurs, l'infrastructure représente une barrière à l'entrée concrète : elle conditionne la capacité à entraîner des modèles plus puissants, à tenir les délais de mise sur le marché, et à absorber des volumes d'utilisation croissants. Qu'OpenAI choisisse d'en faire un argument de différenciation signale que la bataille ne se joue plus uniquement sur la qualité des modèles, mais sur la profondeur des capacités opérationnelles. De son côté, Anthropic ne reste pas sans réponse : la startup explore la conception de puces IA personnalisées, une stratégie adoptée également par Google et Amazon pour réduire leur dépendance aux fournisseurs de semi-conducteurs comme Nvidia. Cette course aux ressources matérielles reflète une tendance de fond dans l'industrie, où la maîtrise de la chaîne de calcul devient aussi stratégique que les algorithmes eux-mêmes. La pause britannique d'OpenAI, quant à elle, soulève des questions sur les arbitrages géopolitiques et réglementaires qui pèsent sur les décisions d'implantation des grands acteurs de l'IA.

UELa mise en pause du projet de datacenter d'OpenAI au Royaume-Uni pourrait ralentir l'expansion des capacités d'infrastructure IA en Europe.

InfrastructureOpinion
1 source
Nvidia s’allie à IREN pour déployer 5 GW d’infrastructures IA
3Le Big Data 

Nvidia s’allie à IREN pour déployer 5 GW d’infrastructures IA

Nvidia et IREN ont annoncé le 7 mai 2026 un partenariat stratégique visant à déployer jusqu'à 5 gigawatts d'infrastructures IA à travers le réseau mondial de centres de données d'IREN. L'accord s'appuie sur l'architecture DSX de Nvidia, conçue pour industrialiser le déploiement de clusters GPU à très grande échelle. Un contrat de 3,4 milliards de dollars a également été signé dans ce cadre, par lequel IREN fournira des services cloud d'infrastructure IA pour les besoins internes de Nvidia. Le campus texan de Sweetwater, site de 2 gigawatts présenté comme le futur projet phare de ce déploiement, concentrera une grande partie des investissements initiaux. Dans cette architecture, Nvidia apporte la puissance de calcul accélérée et l'expertise en infrastructure, tandis qu'IREN prend en charge l'énergie, le foncier, l'exploitation des data centers et le déploiement physique des clusters GPU. Ce partenariat illustre un basculement profond dans la façon dont se joue la compétition dans l'IA. Pendant des années, l'avantage concurrentiel reposait avant tout sur les performances des modèles et l'accès aux puces. Désormais, la capacité à construire rapidement des infrastructures capables d'alimenter en continu l'entraînement et l'inférence de modèles devient tout aussi décisive. Les cibles prioritaires de ce projet sont les entreprises natives de l'IA, les startups spécialisées et les grands groupes à fort besoin de calcul. Jensen Huang, fondateur et PDG de Nvidia, résume cette vision en affirmant que les "AI factories deviennent une infrastructure fondamentale comparable aux réseaux électriques ou aux télécommunications". Cette déclaration marque le repositionnement explicite de Nvidia : l'entreprise ne vend plus uniquement des GPU, mais une offre complète d'infrastructure IA à l'échelle industrielle. Ce mouvement s'inscrit dans une dynamique plus large où la question énergétique devient aussi stratégique que l'accès aux semi-conducteurs. Le Texas attire une part croissante des investissements dans l'IA et les data centers grâce à son accès à l'énergie, ses disponibilités foncières et ses infrastructures industrielles. IREN occupe une position particulière sur ce marché avec un modèle verticalement intégré qui combine centres de données, accès aux réseaux électriques et clusters GPU, le tout implanté dans des régions riches en énergies renouvelables en Amérique du Nord. Le partenariat avec Nvidia lui confère une crédibilité et une visibilité sans précédent pour capter les besoins colossaux en infrastructure que génère la généralisation de l'IA générative dans les entreprises. Les 5 GW annoncés seront déployés progressivement, ce qui laisse entendre que d'autres sites viendront compléter Sweetwater dans les prochaines années.

💬 5 GW, c'est un chiffre qui donne le vertige. Ce qui m'intéresse là-dedans, c'est pas tellement le partenariat Nvidia-IREN en lui-même, mais ce que ça confirme : l'accès à l'énergie et au foncier est en train de devenir le vrai goulot d'étranglement de l'IA, pas les GPU. Et pendant qu'on débat de réglementation en Europe, le Texas construit.

InfrastructureOpinion
1 source
L'infrastructure GenAI pour préparer l'avenir
4InfoQ AI 

L'infrastructure GenAI pour préparer l'avenir

Merrin Kurian, ingénieure chez Intuit, a présenté l'architecture et les processus organisationnels qui sous-tendent la transformation IA de l'entreprise, connue pour ses logiciels fiscaux et financiers comme TurboTax et QuickBooks. Au cœur de cette transformation se trouve GenOS, la plateforme d'IA générative interne d'Intuit, déployée auprès de 8 000 développeurs et ayant permis la mise en production de plus de 3 500 expérimentations. Pour piloter ce déploiement à grande échelle, Intuit a adopté un cadre en trois niveaux baptisé "fixed, flexible, free", distinguant ce qui est imposé à tous, ce qui est configurable selon les équipes, et ce qui est laissé à la libre initiative des développeurs. Cette approche structurée répond à un défi concret pour toute grande entreprise qui industrialise l'IA : comment donner de l'autonomie aux équipes sans perdre le contrôle de la qualité, de la sécurité et de la cohérence des systèmes. Kurian a notamment détaillé les modes de défaillance propres aux agents IA, ces systèmes autonomes qui enchaînent des actions, et présenté une stratégie d'évaluation dite "LLM-as-a-judge", où un modèle de langage est utilisé pour noter automatiquement les sorties d'un autre modèle. Intuit travaille également à rendre ses API "tool-ready", c'est-à-dire nativement compatibles avec des agents IA capables de les appeler sans intervention humaine. Cette présentation s'inscrit dans un mouvement plus large de structuration des infrastructures GenAI dans les grandes entreprises technologiques. Après une phase d'expérimentation, les acteurs comme Intuit cherchent désormais à industrialiser leurs pratiques, en construisant des plateformes internes capables de supporter des milliers de cas d'usage simultanément. Le passage à l'échelle exige des choix d'architecture rigoureux, une gouvernance claire et des outils d'évaluation automatisés pour maintenir la fiabilité dans des environnements de production complexes.

InfrastructureActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic