OpenAI crée un protocole réseau avec AMD,…

57

1NVIDIA AI Blog

NVIDIA Spectrum-X, le réseau Ethernet ouvert conçu pour l'IA, s'impose comme référence à grande échelle, avec MRC

NVIDIA a annoncé que son infrastructure réseau Spectrum-X Ethernet intègre désormais le protocole MRC (Multipath Reliable Connection), une innovation développée conjointement avec OpenAI et Microsoft, et désormais publiée en spécification ouverte via l'Open Compute Project. MRC est un protocole de transport RDMA qui permet à une seule connexion réseau de distribuer le trafic sur plusieurs chemins simultanément, améliorant le débit, l'équilibrage de charge et la disponibilité des infrastructures d'entraînement IA à grande échelle. Parmi les premiers déploiements en production figurent le datacenter Fairwater de Microsoft et le datacenter Abilene d'Oracle Cloud Infrastructure, deux des plus grandes usines IA au monde dédiées à l'entraînement de modèles de pointe. OpenAI a notamment intégré MRC dans sa génération Blackwell : Sachin Katti, responsable du calcul industriel chez OpenAI, a confirmé que le protocole a permis d'éviter la majorité des ralentissements réseau habituels lors des runs d'entraînement frontier à grande échelle. L'enjeu est directement économique et computationnel : dans un cluster d'entraînement réunissant des milliers de GPU, la moindre interruption réseau peut bloquer l'intégralité d'un job d'entraînement, laissant des GPU à l'arrêt et brûlant des millions de dollars en temps de calcul inutilisé. MRC répond à ce problème en détectant les pannes réseau en quelques microsecondes et en reroutant automatiquement le trafic dans le matériel lui-même, sans intervention logicielle. Le protocole maintient également une bande passante élevée sous congestion en évitant dynamiquement les chemins surchargés en temps réel, et minimise l'impact des pertes de paquets grâce à une retransmission intelligente et ciblée. Les administrateurs gagnent par ailleurs une visibilité granulaire sur les chemins de trafic, ce qui simplifie considérablement les opérations à très grande échelle. Cette annonce s'inscrit dans une course mondiale à la construction d'infrastructures réseau capables de suivre l'explosion des besoins en calcul IA. Jusqu'ici, InfiniBand de Mellanox, aussi propriété de NVIDIA, dominait les clusters HPC et IA haute performance, tandis qu'Ethernet était perçu comme moins adapté aux charges de travail intensives. Spectrum-X représente la tentative de NVIDIA de rendre Ethernet compétitif sur ce terrain en y ajoutant une couche matérielle et protocolaire dédiée à l'IA. La publication de MRC comme spécification ouverte via l'Open Compute Project est un signal stratégique fort : en permettant à d'autres acteurs d'implémenter le protocole, NVIDIA cherche à imposer Spectrum-X comme standard de facto du réseau Ethernet pour l'IA, face aux alternatives comme Ultra Ethernet Consortium poussé par AMD, Intel et d'autres. La prochaine étape sera de voir si d'autres fournisseurs cloud et constructeurs de clusters adoptent MRC à leur tour.

UELa publication de MRC comme spécification ouverte via l'Open Compute Project pourrait à terme bénéficier aux centres de données européens qui développent des infrastructures d'entraînement IA, mais aucune entreprise ou institution européenne n'est directement impliquée dans cette annonce.

InfrastructureOpinion

1 source

Microsoft et les fournisseurs cloud resserrent leur emprise sur les GPU, au détriment des clients IA

51

2The Information AI

Microsoft et les fournisseurs cloud resserrent leur emprise sur les GPU, au détriment des clients IA

Microsoft et d'autres grands fournisseurs de cloud redirigent leurs stocks de GPU Nvidia vers leurs équipes internes ou leurs clients enterprise les plus importants, privant les startups d'IA d'un accès fiable aux serveurs dont elles ont besoin. Cette pénurie touche des entreprises pourtant solidement financées, soutenues par des fonds majeurs comme Sequoia Capital, Founders Fund, General Catalyst et Andreessen Horowitz. La situation est suffisamment préoccupante pour qu'Hemant Taneja, directeur général de General Catalyst, ait envoyé un sondage à ses fondateurs en portefeuille pour évaluer leur capacité à accéder aux ressources de calcul. Cette tension sur l'offre a des conséquences directes et immédiates : les startups qui ne parviennent pas à obtenir des GPU auprès des fournisseurs cloud traditionnels se retrouvent contraintes de se tourner vers des alternatives plus coûteuses ou moins stables. Pour des entreprises dont le modèle repose entièrement sur la puissance de calcul, entraînement de modèles, inférence, recherche, une rupture d'approvisionnement peut ralentir le développement de produits et éroder l'avantage concurrentiel acquis grâce aux levées de fonds. Cette situation reflète une tension structurelle dans l'écosystème de l'IA : les hyperscalers comme Microsoft, Google ou Amazon ont massivement investi dans leurs propres capacités d'IA et traitent désormais leurs besoins internes en priorité. Face à une demande mondiale de GPU Nvidia qui dépasse largement l'offre disponible, les petits acteurs se retrouvent en bas de la liste d'attente, dans un marché où l'accès au calcul est devenu aussi stratégique que le capital lui-même.

UELes startups IA européennes, également dépendantes des hyperscalers américains pour l'accès aux GPU Nvidia, sont exposées à la même tension structurelle qui freine leur développement face aux priorités internes des fournisseurs cloud.

InfrastructureOpinion

1 source

Lightelligence bondit de 400% en bourse, pari sur l'interconnexion optique comme prochain goulot d'étranglement de l'IA

45

3AI News

Lightelligence bondit de 400% en bourse, pari sur l'interconnexion optique comme prochain goulot d'étranglement de l'IA

Lightelligence, fabricant chinois de puces photoniques basé à Shanghai, a fait une entrée fracassante à la Bourse de Hong Kong mardi, avec un cours qui a bondi de près de 400% dès le premier jour de cotation. L'action a ouvert à 882 HK$ contre un prix d'introduction de 183,2 HK$, le haut de la fourchette initiale. L'entreprise a levé 2,4 milliards HK$ (environ 310 millions de dollars) lors de son IPO, dont la tranche grand public a été sursouscrite près de 5 785 fois. Première entreprise de photonique continentale à s'introduire à Hong Kong, Lightelligence affiche 106 millions de RMB (15,5 millions de dollars) de chiffre d'affaires annuel en 2025, pour une capitalisation boursière qui a brièvement atteint 10 milliards de dollars. Son produit phare, LightSphere X, est présenté comme la première solution de commutation optique distribuée pour les interconnexions de supernœuds GPU, capable d'augmenter l'utilisation des FLOPS de plus de 50% tout en réduisant le coût total d'exploitation. Au 31 mars 2026, la société détenait 410 brevets et revendiquait 88,3% de parts de marché parmi les fournisseurs indépendants en Chine pour les interconnexions optiques à l'échelle des nœuds de calcul haute performance. L'engouement des investisseurs repose sur une conviction croissante : le câblage en cuivre entre les puces d'intelligence artificielle est en train de devenir le prochain goulet d'étranglement des infrastructures d'IA. Les grands clusters de GPU, nécessaires pour entraîner et faire tourner les grands modèles de langage, transfèrent des volumes de données colossaux entre les puces. Le cuivre génère de la chaleur, consomme beaucoup d'énergie et atteint ses limites en termes de débit sur de courtes distances. L'interconnexion optique, qui remplace les signaux électriques par de la lumière, offre une latence réduite, une bande passante plus élevée et une meilleure efficacité énergétique. Pour les opérateurs de datacenters et les fournisseurs cloud qui cherchent à optimiser leurs coûts à mesure que les clusters d'IA grossissent, cette technologie représente une rupture potentiellement structurelle. Lightelligence évolue néanmoins dans un contexte financier tendu. Ses pertes nettes ont atteint 1,34 milliard de RMB en 2025, et son ratio actif-passif s'établit à 473%, ce qui signifie que ses dettes dépassent largement ses actifs. Un seul client représente 40,6% de son chiffre d'affaires. Dans le marché global chinois, Huawei reste dominant avec 98,4% de parts, Lightelligence n'en détenant que 8,3% en tant que premier fournisseur tiers indépendant. Malgré ces signaux d'alerte, le tour de table des investisseurs cornerstone est impressionnant : Alibaba, GIC, Temasek, BlackRock, Fidelity, Schroders, Hillhouse Capital, Lenovo et ZTE ont tous participé. La croissance annuelle composée du chiffre d'affaires atteint 66,9% sur deux ans, et le secteur de l'informatique photonique, encore largement peuplé de startups pré-revenus, laisse une fenêtre d'opportunité à qui peut prouver une commercialisation à grande échelle.

InfrastructureActu

1 source

Nvidia bat des records MLPerf avec 288 GPU pendant qu'AMD et Intel se concentrent sur d'autres fronts

43

4The Decoder

Nvidia bat des records MLPerf avec 288 GPU pendant qu'AMD et Intel se concentrent sur d'autres fronts

Nvidia a établi de nouveaux records lors du dernier cycle de MLPerf Inference, le benchmark de référence de l'industrie pour mesurer les performances des systèmes d'inférence IA. L'entreprise a mobilisé jusqu'à 288 GPU pour atteindre ces résultats, se positionnant en tête des classements généraux. Cette édition marque une première : l'introduction de modèles multimodaux et vidéo dans les catégories évaluées, élargissant ainsi le périmètre d'un benchmark jusqu'ici centré sur les modèles texte et image. AMD et Intel ont également participé à ce cycle, mais en mettant en avant des métriques différentes de celles privilégiées par Nvidia, ce qui rend les comparaisons directes particulièrement difficiles. Chaque acteur choisit les indicateurs qui valorisent le mieux ses propres architectures matérielles, une stratégie qui brouille la lecture des résultats pour les entreprises cherchant à choisir leur infrastructure d'inférence. Pour les équipes IA en production, cette divergence méthodologique complique les décisions d'achat et soulève des questions sur la neutralité du benchmark lui-même. MLPerf, géré par MLCommons, est devenu l'étalon industriel incontournable pour comparer les performances des puces et systèmes IA en conditions réelles d'inférence. L'ajout de modèles multimodaux et vidéo reflète l'évolution rapide des cas d'usage en entreprise, où les assistants IA traitent désormais images, vidéos et texte simultanément. La domination persistante de Nvidia sur ces classements renforce sa position sur le marché des infrastructures IA, tandis qu'AMD et Intel cherchent à se différencier sur des segments où leurs architectures offrent un meilleur rapport performance-coût.

UELes équipes IA européennes en charge d'achats d'infrastructure d'inférence doivent composer avec des benchmarks MLPerf dont la lecture est brouillée par des métriques divergentes entre Nvidia, AMD et Intel, rendant les comparaisons objectives difficiles.

InfrastructureActu

1 source

OpenAI crée un protocole réseau avec AMD, Broadcom, Intel, Microsoft et NVIDIA pour résoudre les goulets d'étranglement des supercalculateurs IA

À lire aussi

NVIDIA Spectrum-X, le réseau Ethernet ouvert conçu pour l'IA, s'impose comme référence à grande échelle, avec MRC

Microsoft et les fournisseurs cloud resserrent leur emprise sur les GPU, au détriment des clients IA

Lightelligence bondit de 400% en bourse, pari sur l'interconnexion optique comme prochain goulot d'étranglement de l'IA

Nvidia bat des records MLPerf avec 288 GPU pendant qu'AMD et Intel se concentrent sur d'autres fronts