META découvre à son tour l’économie du compute

Broadcom et Meta : un partenariat à l’échelle du Gigawatt pour le futur de l’IA

49

1Le Big Data

Broadcom et Meta : un partenariat à l’échelle du Gigawatt pour le futur de l’IA

Meta et Broadcom ont officialisé le 14 avril 2026 un partenariat stratégique pluriannuel pour bâtir l'une des infrastructures de calcul IA les plus massives jamais conçues. Dès la première phase, la capacité déployée dépasse 1 gigawatt, avec une trajectoire assumée vers plusieurs gigawatts dans les années à venir. Au cœur du dispositif : les puces propriétaires MTIA (Meta Training and Inference Accelerator), conçues pour optimiser à la fois l'entraînement et l'inférence des modèles d'IA. Broadcom fournit l'ensemble de la chaîne matérielle, de la conception des accélérateurs via sa plateforme XPU à leur interconnexion réseau haut débit. La collaboration est prévue pour durer jusqu'en 2029 au moins, avec des générations successives de puces MTIA adaptées aux besoins évolutifs de Meta. Ce partenariat représente un changement d'échelle radical dans la façon dont les grandes plateformes numériques abordent leurs besoins en calcul. Meta ne se contente plus d'acheter des GPU sur étagère : l'entreprise co-conçoit avec Broadcom des accélérateurs taillés sur mesure pour ses propres charges de travail, ce qui permet d'optimiser conjointement la logique de calcul, la gestion mémoire et les transferts de données à haute vitesse. L'enjeu est concret : alimenter des services utilisés quotidiennement par des milliards de personnes, de WhatsApp à Instagram en passant par Threads, tout en réduisant le coût total de possession. Mark Zuckerberg a affiché publiquement l'ambition d'apporter des capacités d'IA avancées à chaque utilisateur, jusqu'à ce qu'il décrit comme une forme de "superintelligence personnelle". À cette échelle, chaque point d'efficacité matérielle se traduit directement en milliards de dollars d'économies ou de capacités supplémentaires. Ce mouvement s'inscrit dans une tendance de fond qui redessine l'industrie du semi-conducteur et des infrastructures cloud. Face à la domination de Nvidia sur le marché des GPU d'IA, les hyperscalers comme Meta, Google ou Amazon investissent massivement dans des puces personnalisées pour réduire leur dépendance à un seul fournisseur et reprendre le contrôle de leur stack matériel. Broadcom, qui accompagne déjà Google avec ses TPU, se positionne comme le partenaire de référence pour ces projets de co-conception à grande échelle. Le choix d'une architecture réseau basée sur Ethernet ouvert plutôt que sur des protocoles propriétaires facilite l'évolutivité et l'intégration dans des data centers existants. Avec des investissements qui se chiffrent désormais en gigawatts plutôt qu'en mégawatts, la course à l'infrastructure IA prend une dimension comparable à celle de l'industrie énergétique, et les prochains trimestres diront si cette stratégie d'hyper-scalabilité donne à Meta l'avantage compétitif recherché face à OpenAI, Google et Microsoft.

InfrastructureOpinion

1 source

L’IA gratuite, c’est terminé : les prix du compute s’envolent

49

2FrenchWeb

L’IA gratuite, c’est terminé : les prix du compute s’envolent

Pendant deux ans, l'intelligence artificielle a été proposée à des tarifs quasi symboliques : APIs accessibles, chatbots gratuits, génération de contenu à la demande. Cette période d'abondance artificielle touche désormais à sa fin. Les coûts du compute, longtemps subventionnés par les levées de fonds massives des grands acteurs, remontent à la surface, et les hausses de prix se multiplient chez les principaux fournisseurs de services IA. Ce retournement a des conséquences directes pour les entreprises et développeurs qui ont bâti leurs produits sur des hypothèses de coût très basses. Les marges se réduisent, les modèles économiques sont à revoir, et les startups les plus dépendantes des APIs tierces se retrouvent sous pression. Pour les utilisateurs finaux, la fin des offres gratuites ou très généreuses signifie une recomposition du marché : les acteurs capables de maîtriser leur infrastructure prendront l'avantage sur ceux qui sous-traitent entièrement leur compute. Ce tournant s'explique par la conjonction de plusieurs facteurs : la demande mondiale en puissance GPU explose tandis que l'offre reste contrainte, les datacenters saturent, et les investisseurs commencent à exiger de la rentabilité après des années de croissance à perte. OpenAI, Anthropic, Google et Microsoft ont tous signalé des tensions sur leurs infrastructures. La prochaine phase de l'IA sera celle de la sélection économique : seuls survivront les usages dont la valeur justifie réellement le coût de calcul.

UELes startups et développeurs européens qui ont bâti leurs produits sur des APIs IA bon marché doivent revoir en urgence leurs modèles économiques face à la remontée des coûts de compute.

💬 On y est. J'avais mis un an à convaincre des clients que les APIs IA à 0,002$ du token, c'était pas un modèle viable sur le long terme, et là ça se confirme brutalement. Les startups qui ont bâti leur MRR sur du compute subventionné par la VC money vont avoir quelques trimestres difficiles. Reste à voir qui a les reins assez solides pour absorber la hausse, ou qui va simplement disparaître.

InfrastructureOpinion

1 source

De la simulation des matériaux à l'astronomie : NVIDIA lance un logiciel d'IA pour la découverte scientifique

47

3NVIDIA AI Blog

De la simulation des matériaux à l'astronomie : NVIDIA lance un logiciel d'IA pour la découverte scientifique

Lors de la conférence ISC qui se tient cette semaine à Hambourg, NVIDIA a annoncé plusieurs nouvelles bibliothèques logicielles destinées à accélérer la recherche scientifique grâce à l'IA et au calcul GPU. Parmi elles : la bibliothèque DAQIRI (Data Acquisition for Integrated Real-time Instruments), les microservices ALCHEMI NIM, et le code de référence cuPhoton, bientôt disponible. Ces outils font partie de l'écosystème CUDA-X de NVIDIA. Les gains de performance sont spectaculaires : cuPhoton, testé sur des systèmes GB200 NVL72, accélère le chargement et l'analyse des images astronomiques au format FITS par un facteur 14 900 pour les données du Rubin Observatory, et offre un traitement du signal jusqu'à 8 400 fois plus rapide avec 32 superchips Grace Blackwell. DAQIRI, de son côté, a été utilisé dans le cadre du projet A-GHOST, développé par le CERN, l'Université de Chicago et l'University College London, pour analyser en temps réel les données de collisions de l'expérience ATLAS, données qui étaient auparavant rejetées à plus de 99 % faute de capacité de stockage. ALCHEMI, quant à lui, propose déjà deux microservices pour la simulation moléculaire (relaxation de géométrie et dynamique moléculaire par lots), avec un support du logiciel VASP prévu prochainement. Ces outils changent fondamentalement l'échelle à laquelle la science peut opérer. Le Rubin Observatory et son instrument LSST, la plus grande caméra numérique jamais construite, génèrent des pétaoctets de données sur des milliards de galaxies et d'objets faiblement lumineux. Transformer ces flux massifs en résultats analysables en temps quasi réel ouvre des possibilités inédites pour la recherche sur la matière noire et l'énergie sombre. De même, A-GHOST permettra au CERN de récupérer des signaux potentiellement cruciaux qui disparaissaient jusqu'ici dans les filtres de sélection. Pour la chimie computationnelle, ALCHEMI permet de simuler des millions de molécules simultanément, ce qui accélère la découverte de nouveaux matériaux pour les batteries, les catalyseurs, les écrans OLED ou encore les formulations cosmétiques. Ces annonces s'inscrivent dans une tendance de fond : depuis plusieurs années, le calcul GPU migre des centres de données commerciaux vers les laboratoires scientifiques, portés par des projets comme AlphaFold ou les grands modèles de fondation pour la physique. NVIDIA positionne CUDA-X comme l'infrastructure transversale de cette transformation, en couvrant aussi bien l'astrophysique que la chimie ou la physique des particules. Les partenariats avec Princeton, Harvard et le CERN donnent une légitimité institutionnelle forte à ces outils. La prochaine intégration de VASP dans ALCHEMI, logiciel de référence mondial pour les simulations de matériaux ab initio, est particulièrement significative : elle signale que NVIDIA vise désormais le cœur des workflows scientifiques établis, et pas seulement leurs marges computationnelles.

UELe CERN, institution de recherche pan-européenne, intègre déjà DAQIRI dans le projet A-GHOST pour analyser en temps réel les données de l'expérience ATLAS, récupérant des signaux jusqu'ici perdus faute de capacité de traitement.

💬 99 % des données de collision de l'expérience ATLAS au CERN finissaient à la poubelle faute de capacité de traitement en temps réel. DAQIRI change ça, et c'est la stat la plus vertigineuse dans un article qui en compte pourtant beaucoup. L'intégration de VASP dans ALCHEMI dit le reste : NVIDIA ne vend plus des GPUs aux labos scientifiques, il en devient le système nerveux.

InfrastructureOpinion

1 source

Des tokens moins chers, des factures plus élevées : la nouvelle économie de l'infrastructure IA

40

4VentureBeat AI

Des tokens moins chers, des factures plus élevées : la nouvelle économie de l'infrastructure IA

Le coût d'une inférence IA a chuté d'environ un facteur dix en deux ans, porté par des gains d'efficacité sur les modèles et la concurrence acharnée entre fournisseurs cloud. Pourtant, les factures d'infrastructure des entreprises ne baissent pas : elles augmentent. C'est le paradoxe que décrit Anindo Sengupta, vice-président produits chez Nutanix : si le coût par token diminue d'un ordre de grandeur, la consommation, elle, a bondi de plus de 100 fois sur la même période. Résultat, les équipes IT se retrouvent à gérer des volumes d'inférence que rien ne laissait prévoir il y a deux ans, et des budgets GPU qui s'envolent malgré des prix unitaires en chute libre. Ce que les économistes appellent le paradoxe de Jevons se matérialise ici très concrètement : une ressource moins chère incite à en consommer davantage, jusqu'à dépasser les économies réalisées. L'essor de l'IA agentique amplifie le phénomène. Chaque assistant IA déployé en entreprise, chaque workflow automatisé, chaque pipeline d'agents génère en continu des milliers de requêtes d'inférence courtes et imprévisibles, très éloignées des gros jobs de training planifiés à l'avance. Ces flux bombardent les GPU, saturent les interconnexions réseau et sollicitent des systèmes de stockage conçus pour des charges stables. Le coût par token et le taux d'utilisation GPU deviennent ainsi des métriques opérationnelles de premier plan, au même titre que la disponibilité ou le débit. Les optimiser reste complexe : les variables sont trop nombreuses pour être gérées intuitivement, modèles, localisation des workloads, structure des prompts. Cette rupture expose les limites structurelles des datacenters traditionnels, pensés pour des charges prévisibles et des cycles d'approvisionnement longs. L'infrastructure agentique exige une topologie GPU spécifique, des interconnexions haute vitesse, un stockage parallèle pour les caches KV et la mémoire des agents. Quand GPU, réseau et stockage sont gérés en silos distincts, les inefficacités s'accumulent : les assets GPU coûteux se retrouvent sous-utilisés pendant que le réseau ou le stockage constituent les goulets d'étranglement. Face à cette réalité, les grands acteurs de l'infrastructure, Nutanix en tête, poussent vers des plateformes full-stack intégrées et validées de bout en bout, capables d'optimiser simultanément le calcul, le réseau et le stockage pour les workloads IA en production. L'enjeu n'est plus simplement de déployer de l'IA, mais de la faire tourner à l'échelle sans que les coûts d'infrastructure ne neutralisent les gains de productivité.

UELes DSI européens déployant de l'IA agentique subissent le même effet Jevons : la baisse du coût par token est annulée par l'explosion des volumes d'inférence, rendant l'optimisation de l'infrastructure GPU une priorité budgétaire immédiate.

InfrastructureActu

1 source

META découvre à son tour l’économie du compute

À lire aussi

Broadcom et Meta : un partenariat à l’échelle du Gigawatt pour le futur de l’IA

L’IA gratuite, c’est terminé : les prix du compute s’envolent

De la simulation des matériaux à l'astronomie : NVIDIA lance un logiciel d'IA pour la découverte scientifique

Des tokens moins chers, des factures plus élevées : la nouvelle économie de l'infrastructure IA