Infrastructure — page 3

346 articles · page 3 sur 7

Infrastructure IA : data centers, puces GPU/TPU, cloud computing, énergie et hardware.

LLMs Recherche Business Éthique Outils Régulation Robotique Sécurité Société Création Autre

72 GPU dans un seul rack : Dell livre le premier Vera Rubin NVL72 à CoreWeave

Dell a livré à CoreWeave le premier système NVIDIA Vera Rubin NVL72 opérationnel, un rack unique intégrant 72 GPU Rubin et 36 processeurs Vera personnalisés. Cette machine atteint une puissance de calcul de 3,6 exaFLOPS, soit une capacité suffisante pour entraîner et faire tourner des modèles d'intelligence artificielle comptant des milliers de milliards de paramètres. Le système adopte un refroidissement liquide intégral, désormais indispensable pour absorber la chaleur et la consommation énergétique générées par une telle densité de composants. CoreWeave, spécialiste américain du cloud GPU qui alimente déjà de nombreux acteurs de l'IA générative, devient ainsi l'un des premiers opérateurs au monde à déployer cette génération d'infrastructure dans un environnement de production réel. Ce déploiement illustre une tendance de fond qui redessine l'économie du calcul pour l'IA : la densification. Regrouper 72 GPU dans un seul rack ne relève pas de l'exploit pour la galerie, mais répond à une contrainte très concrète. Plus les modèles grossissent, plus les échanges de données entre composants deviennent un goulot d'étranglement. En rapprochant physiquement les GPU, on réduit les latences de communication et on améliore le débit global du système, ce qui se traduit directement par des temps d'inférence plus courts et une capacité d'entraînement plus élevée. Pour les opérateurs cloud qui facturent leurs clients à l'heure de GPU, cette efficacité accrue est un avantage compétitif direct. Pour les laboratoires qui entraînent les prochaines générations de modèles, c'est la condition nécessaire pour rester dans la course. Cette livraison s'inscrit dans un cycle d'escalade technologique qui s'accélère depuis le lancement de ChatGPT fin 2022. NVIDIA enchaîne les générations de puces à un rythme inédit : après les H100, les H200 et les Blackwell, la famille Vera Rubin représente la prochaine marche. Dell, longtemps perçu comme un constructeur de serveurs classiques, a clairement choisi de se repositionner comme intégrateur de référence pour les infrastructures d'IA à très grande échelle. CoreWeave, de son côté, a levé plusieurs milliards de dollars ces dernières années pour construire une alternative aux clouds hyperscalers comme AWS ou Google Cloud, spécifiquement taillée pour les charges de travail GPU intensives. La combinaison des deux acteurs sur ce premier déploiement Vera Rubin n'est pas anodine : elle signale que l'infrastructure d'IA de prochaine génération est prête à sortir des laboratoires pour entrer dans les centres de données commerciaux. À ce rythme, les 72 GPU d'aujourd'hui pourraient paraître modestes dès 2027.

UELa disponibilité commerciale de cette infrastructure GPU de prochaine génération conditionnera indirectement la compétitivité des acteurs européens de l'IA dans la course à l'entraînement de très grands modèles.

Infrastructure — page 3

72 GPU dans un seul rack : Dell livre le premier Vera Rubin NVL72 à CoreWeave

L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA

Les géants industriels de Taiwan accélèrent le déploiement mondial de l'infrastructure IA avec NVIDIA

NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark

Microsoft et Nvidia s'associent pour des PC IA capables d'exécuter de vrais agents autonomes

Le code : outil de raisonnement et d'action des agents IA, pas seulement leur production

ByteDance conçoit ses puces IA façon Groq

Bye-bye Nvidia : le coup de poker de BYD avec sa puce autonome Xuanji A3 en 4 nm

Faciliter l'accès externe à Amazon SageMaker MLflow via un proxy REST API

Apple relance son offensive pour une IA locale, sans passer par le cloud

META découvre à son tour l’économie du compute

Nvidia mise 150 milliards de dollars sur Taiwan, contrecarrant le plan de Trump pour faire des États-Unis un hub de l'IA

Merck et Mastercard obtiennent des résultats concrets avec les agents IA : l'infrastructure d'abord

Micron dépasse les 1 000 milliards de dollars grâce à la demande en IA

Les fournisseurs d'inférence connaissent-ils un essor ?

Le CPU Vera de NVIDIA s'affirme comme un concurrent redoutable

Construire des systèmes multi-agents LangGraph serverless et scalables sur AWS avec Amazon Bedrock AgentCore

Comment les agentic databases redéfinissent l’IA en entreprise ?

☕️ Les agences de renseignement américaines à court de puissance de calcul pour leurs IA

Together AI publie OSCAR en open source : un système de quantification KV cache 2 bits adaptatif pour les LLM à long contexte

Test du Nvidia DGX Spark : le mini PC IA 128 Go

D&B a reconstruit sa base de 642 millions d'entreprises pour les agents IA

L'IA chinoise cartographie l'intégralité de son réseau d'énergies renouvelables : pourquoi le reste du monde devrait s'en inspirer

De nouvelles licornes dans l'infrastructure IA : Exa, Modal, TurboPuffer

CopilotKit redéfinit l'architecture IA à base d'agents en 2026

Doter les agents d'ordinateurs : Ivan Burazin, Daytona

NVIDIA GTC Taipei au COMPUTEX : les dernières annonces IA en direct

Anthropic en négociations pour utiliser les puces IA de Microsoft

Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI

Free, Orange et EDF s’allient pour créer une AI Gigafactory en France

La puce Vera de Nvidia, le pari à 200 milliards de dollars que Jensen Huang veut mettre en avant

IA et performance : le verdict de l’indice mondial Fivetran

Cerebras affirme que ses puces exécutent un modèle IA d'un billion de paramètres près de 7 fois plus vite que les clouds GPU

La passerelle IA : centraliser l'inférence à l'échelle d'équipes décentralisées

AION : la gigafactory IA d'Orange, EDF et Capgemini

Alibaba conçoit des puces IA pour les agents autonomes, ce qui redéfinit les enjeux de la course aux semi-conducteurs

Les puces IA d'Amazon commencent à séduire les développeurs face à Nvidia

L'infrastructure GenAI pour préparer l'avenir

L'accord Nvidia H200 avec la Chine a survécu au sommet Trump-Xi, mais pas comme prévu

Blackstone et Google investissent dans un nouveau cloud TPU pour accélérer l’IA

L'IA est une question de puissance, d'infrastructure et de sécurité, selon TechEx North America

L'architecture de contexte remplace le RAG à mesure que les agents IA poussent la récupération d'information en entreprise à ses limites

Jensen Huang (NVIDIA) chez Dell Technologies World : la demande explose de façon exponentielle

SiMa.ai lève des fonds à une valorisation de 1,4 milliard de dollars

Derrière la rencontre entre Trump et Xi, l’ombre de l’IA

NVIDIA introduit une méthode de pré-entraînement en 4 bits avec NVFP4, validée sur un modèle hybride Mamba-Transformer de 12 milliards de paramètres

71 % des Américains sont opposés aux datacenters IA, 53 % aux centrales nucléaires

Cerebras : une IPO à 60 milliards de dollars, lente puis soudaine

L'action Cerebras double presque le premier jour, valorisant le fabricant de puces IA à 100 milliards de dollars

Dix entreprises chinoises dont ByteDance auraient obtenu un accord américain pour des puces IA qui leur sont interdites