Infrastructure

50 sur 189 articles

Infrastructure IA : data centers, puces GPU/TPU, cloud computing, énergie et hardware.

LLMs Recherche Business Éthique Outils Régulation Robotique Sécurité Société Création Autre

1The Information AI InfrastructureOpinion

Le capital, et non la puissance de calcul, est le vrai goulet d'étranglement de l'IA

L'explosion de la demande en infrastructure IA a déclenché l'un des cycles d'investissement les plus colossaux de l'histoire moderne. Jensen Huang, PDG de Nvidia, estime qu'un gigawatt de capacité de calcul peut coûter jusqu'à 50 milliards de dollars. McKinsey projette que la demande mondiale en centres de données pourrait atteindre 156 gigawatts d'ici 2030, ce qui porterait l'investissement total nécessaire à près de 7 000 milliards de dollars. Lors d'un récent panel organisé par The Information, trois dirigeants du secteur ont dressé un constat convergent : ce n'est pas le manque de GPU qui freine le déploiement de l'IA, mais bien le capital. Charles Fisher, directeur financier de Lambda, Marc Boroditsky, directeur commercial de Nebius, et Nick Robbins, vice-président développement chez CoreWeave, ont tous pointé la même tension : les GPU sont disponibles aujourd'hui, mais les infrastructures nécessaires pour les déployer à grande échelle prennent des années à financer et à construire. Ce goulot d'étranglement financier tient en partie à des idées reçues persistantes dans le monde bancaire. Les prêteurs rechignent à financer des actifs dont la durée de vie estimée est de six ans seulement, contre plusieurs décennies pour les réseaux câblés. Ils supposent également que la demande se concentre sur une poignée de géants du cloud, ignorant la réalité du marché. Lambda compte plus de 10 000 clients sur son cloud public, représentant environ un tiers de ses revenus, avec des comportements d'abonnement très fidèles. Chez CoreWeave, Robbins souligne que les anciens GPU Nvidia V100 et A100 continuent de générer des rendements solides bien au-delà de leur durée de vie théorique. Les contrats fermes avec des clients solvables restent le principal levier pour débloquer des financements : Nebius a ainsi conclu un accord plurimilliardaire avec Meta Platforms qui garantit l'absorption des GPU non vendus, permettant à Nebius d'utiliser la solidité financière de Meta comme caution implicite. Le vrai défi n'est donc pas tant financier que logistique. Fisher parle d'un problème de "chorégraphie" : la demande des clients se matérialise bien plus vite que la construction des centres de données ne peut suivre. Nebius répond à cette contrainte en menant tous les chantiers simultanément, sécurisant les terrains, générant la demande et levant le capital en parallèle. Au-delà des hyperscalers comme Microsoft, Google ou Amazon, qui captent l'essentiel de l'attention médiatique, la prochaine vague de croissance proviendrait de startups IA en forte croissance et de l'adoption enterprise. Des entreprises comme Cursor ou Harvey sont citées comme signaux avant-coureurs d'un marché qui dépasse largement les seuls géants technologiques, et dont le financement structuré reste encore à inventer.

Infrastructure

Le capital, et non la puissance de calcul, est le vrai goulet d'étranglement de l'IA

☕️ SoftBank investirait jusqu’à 100 milliards de dollars dans des infrastructures IA en France

L'eau : pas un problème de centres de données, mais un problème d'IA

Le startup qui aide OpenAI à optimiser son IA pour les puces Cerebras

Intel pourrait fabriquer les futures puces IA d’Apple

NVIDIA a déjà investi 40 milliards de dollars dans des accords IA en 2026

8 ans, 100 dollars, et plus rapide qu’une RTX 3060 pour faire tourner un LLM en local

Les meilleures bases de données vectorielles en 2026 : prix, limites et compromis architecturaux des neuf principaux systèmes

NVIDIA publie cuda-oxide : un compilateur expérimental Rust vers CUDA générant des noyaux GPU directement en PTX

Broadcom refuserait de fabriquer la puce personnalisée d'OpenAI si Microsoft n'en achète pas 40 %

5 % d'utilisation GPU : le problème d'infrastructure IA à 401 milliards de dollars que les entreprises ne peuvent plus ignorer

Nvidia s’allie à IREN pour déployer 5 GW d’infrastructures IA

LightSeek Foundation publie TokenSpeed, moteur d'inférence LLM open source visant TensorRT-LLM pour agents autonomes

Propulser le siècle américain : Chris Wright et Ian Buck de NVIDIA sur la mission Genesis

L'accord OpenAI-Broadcom sur les puces IA bute sur 18 milliards de financement

Réservez de la capacité GPU à court terme pour vos workloads ML avec EC2 Capacity Blocks et SageMaker

☕️ AMD lance sa Radeon Instinct MI350P : un demi-GPU de MI350X en PCIe 5.0

Pourquoi Musk cède les serveurs de xAI à Anthropic ; Reka rachète une startup de génération vidéo

OpenAI présente MRC (Multipath Reliable Connection) : un nouveau protocole réseau ouvert pour les clusters de superordinateurs IA à grande échelle

Anthropic relève les plafonds d'utilisation de Claude Code grâce à un accord avec SpaceX

OpenAI crée un protocole réseau avec AMD, Broadcom, Intel, Microsoft et NVIDIA pour résoudre les goulets d'étranglement des supercalculateurs IA

Anthropic utilise le datacenter Colossus-1 de SpaceX et ses 220 000 GPU pour alimenter Claude

Déploiement rentable de modèles vision-langage pour la détection du comportement animal sur AWS Inferentia2

HP et l'art de l'IA et des données pour les entreprises

NVIDIA Spectrum-X, le réseau Ethernet ouvert conçu pour l'IA, s'impose comme référence à grande échelle, avec MRC

La mise en production de l'IA à grande échelle oblige les entreprises à repenser leur infrastructure

Des data centers IA flottants alimentés par les vagues de l'océan : la Silicon Valley mise sur cette piste

Ruben BRYON, construire une alternative européenne au cloud américain

Zyphra présente TSP : stratégie d'entraînement adaptée au matériel offrant un débit 2,6 fois supérieur au TP+SP

Groq 3 LPX : un rack d’inférence qui fait fondre la latence des LLM

Intel prépare sa riposte : un ex de Qualcomm aux commandes de l’IA et des PC

Nebius, Lambda et CoreWeave refusent les TPUs malgré la pression de Google

Du data lake à l'analyse compatible IA : nouvelle source de données avec S3 Tables dans Amazon QuickSight

Inférence adaptée à la capacité : basculement automatique entre instances pour les endpoints SageMaker AI

Google TPU v8 : la puce IA qui défie NVIDIA Blackwell

Nvidia mise sur l’IA physique : pourquoi les marchés d’Asie s’emballent déjà ?

Anthropic en négociation pour acheter des puces IA à une startup britannique

Moonshot AI open-source FlashKDA : noyaux CUTLASS pour Kimi Delta Attention et benchmarks H20

Configurer Amazon Bedrock AgentCore Gateway pour un accès sécurisé aux ressources privées

Terafab : le pari fou d’Elon Musk pour dominer le silicium mondial

Sans crier gare, la Chine sort un supercalculateur de 2,47 ExaFLOPS… sans GPU

Des tokens moins chers, des factures plus élevées : la nouvelle économie de l'infrastructure IA

Le tournant de l'inférence

FlashQLA : Alibaba dévoile une arme secrète qui accélère l’IA jusqu’à 3 fois

Le FOMO pousse les entreprises à payer des GPU inutilisés et fait grimper les prix

xAI montre les difficultés d'exploiter de nombreux GPU en parallèle

Definity intègre des agents dans les pipelines Spark pour détecter les erreurs en amont des systèmes d'IA autonomes

Exécuter des proxies MCP personnalisés en serverless sur Amazon Bedrock AgentCore Runtime

Le VPS piloté par l’IA : De la gestion technique au pilotage de l’infrastructure

Un meilleur matériel peut transformer les outsiders de l'IA en acteurs majeurs