Aller au contenu principal
Sans crier gare, la Chine sort un supercalculateur de 2,47 ExaFLOPS… sans GPU
InfrastructureNext INpact6sem· 2 min de lecture

Sans crier gare, la Chine sort un supercalculateur de 2,47 ExaFLOPS… sans GPU

Source originale ↗·

La Chine vient de révéler, sans aucune communication officielle, l'existence d'un supercalculateur exascale baptisé LineShine, hébergé au Centre National de Supercalcul de Shenzhen (NSCC-SZ). La machine atteint une puissance théorique de 2,47 ExaFLOPS, dont 1,2 ExaFLOPS ont été effectivement mesurés lors de son utilisation pour entraîner un modèle de type MLIP (Machine Learning Interatomic Potentials), soit à peine un quart de sa capacité maximale. LineShine embarque 12,4 millions de cœurs de calcul et 1 310 téraoctets de mémoire HBM. Ce qui frappe immédiatement les observateurs : cette architecture est entièrement scalaire, sans aucun GPU. L'information n'est pas venue d'un communiqué de presse mais d'une publication scientifique parue il y a deux semaines, repérée et relayée par Stéphane Requena, directeur technique du Genci (Grand Équipement National de Calcul Intensif), sur LinkedIn.

Si LineShine était soumis au classement Top500, référence mondiale des supercalculateurs, il se retrouverait au coude à coude avec El Capitan, le numéro un mondial actuellement en service aux États-Unis. L'enjeu dépasse la performance brute : ce supercalculateur démontre que la Chine est capable de construire des infrastructures de calcul de premier rang mondial sans dépendre des GPU haute performance de NVIDIA, dont l'exportation vers la Chine est soumise à embargo américain. L'absence de GPU dans une machine de cette envergure représente un choix architectural délibéré et une réponse technologique directe aux restrictions imposées par Washington. Pour les acteurs de l'IA et de la simulation scientifique, c'est la preuve que les restrictions d'exportation n'ont pas bloqué la montée en puissance chinoise, mais l'ont orientée vers des solutions souveraines.

La Chine ne participe plus au Top500 depuis plusieurs années, dans un contexte de tensions croissantes avec les États-Unis autour des technologies stratégiques. Depuis les premières vagues de sanctions, Pékin a systématiquement développé ses propres alternatives matérielles et logicielles, tout en maintenant le silence sur ses capacités réelles. LineShine s'inscrit dans cette logique d'autonomie technologique assumée : les avancées chinoises en supercalcul se découvrent désormais à travers des publications académiques, non par des annonces officielles. Les prochains mois pourraient révéler d'autres systèmes de cette génération, alors que la course au calcul exascale s'accélère aussi bien pour la simulation climatique, la recherche pharmaceutique que pour l'entraînement de modèles d'intelligence artificielle de grande taille.

Impact France/UE

La découverte a été relayée par Stéphane Requena, directeur technique du GENCI (institution française de calcul intensif), signalant que les sanctions américaines n'ont pas freiné la montée en puissance chinoise, un avertissement stratégique pour la souveraineté technologique européenne en matière d'infrastructure HPC.

💬 L'analyse de Mathieu

2,47 ExaFLOPS sans un seul GPU, et on l'apprend par une publication académique, pas un communiqué de presse. L'embargo américain n'a pas freiné la Chine, il l'a juste orientée vers ses propres solutions, et visiblement ça tient la route. Ce qui devrait vraiment inquiéter l'Europe, c'est qu'on ne sait pas combien d'autres machines comme ça existent déjà.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Nvidia AI PC : quand la puissance des supercalculateurs s’invite dans votre ordinateur
1Le Big Data 

Nvidia AI PC : quand la puissance des supercalculateurs s’invite dans votre ordinateur

Nvidia accélère l'intégration de l'intelligence artificielle directement dans les ordinateurs personnels avec sa gamme AI PC, des machines construites autour des puces graphiques GeForce RTX et de leurs Tensor Cores, des circuits spécialisés dans les calculs matriciels qui constituent le socle mathématique de tout réseau de neurones. Là où les PC certifiés "Copilot+" du marché affichent des performances comprises entre 40 et 50 TOPS (trillions d'opérations par seconde), suffisantes pour flouter un fond de visioconférence ou traduire du texte, les machines Nvidia visent des centaines de TOPS, voire plusieurs Petaflops, permettant d'exécuter de grands modèles de langage en local, de manière fluide et sans connexion. Cette architecture déporte l'intégralité des charges d'IA sur le GPU, préservant le processeur central pour le reste des tâches et maintenant la réactivité globale du système. L'enjeu dépasse la simple course aux performances : le traitement local supprime les trois principaux obstacles du cloud. La latence liée au transfert des données disparaît, l'IA reste disponible sans connexion internet, et les fichiers sensibles ne quittent jamais la machine, ce qui répond à une préoccupation critique des entreprises confrontées à l'envoi de documents stratégiques vers des serveurs tiers. Pour les professionnels comme pour les créateurs, cela signifie des outils d'IA réactifs, privés par défaut, et utilisables dans n'importe quel contexte, y compris hors ligne. L'ordinateur cesse d'être un terminal dépendant du cloud pour devenir un système autonome capable de raisonner localement. Ce repositionnement de Nvidia intervient dans un contexte de bataille industrielle intense entre les grands concepteurs de puces, Intel, AMD, Qualcomm et Apple ayant chacun intégré des accélérateurs IA dans leurs architectures récentes. Nvidia, historiquement associé au marché du jeu vidéo, capitalise sur sa domination dans le calcul GPU pour s'imposer comme architecte de la prochaine génération d'ordinateurs personnels, redessinant la hiérarchie des constructeurs de composants. La décennie de supériorité du CPU comme unité centrale de traitement s'efface au profit d'architectures hybrides où le GPU devient le moteur principal de l'IA locale. La prochaine étape sera probablement une standardisation de ces capacités à mesure que les modèles ouverts s'optimisent pour fonctionner sur des puces grand public, rendant le traitement local accessible à une fraction du coût actuel.

UELe traitement local de l'IA répond aux exigences RGPD des entreprises européennes en évitant l'envoi de documents stratégiques vers des serveurs tiers américains.

InfrastructureOpinion
1 source
L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA
2NVIDIA AI Blog 

L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA

NVIDIA accélère la construction d'une infrastructure mondiale d'« usines à IA », en s'appuyant sur un écosystème croissant de partenaires cloud. Jensen Huang, fondateur et PDG de NVIDIA, a annoncé lors d'une communication officielle que cet écosystème couvre désormais six continents, avec l'arrivée de deux nouveaux partenaires : Cassava en Afrique et Claro en Amérique du Sud. Des acteurs comme CoreWeave, Firmus, IREN et Nscale élargissent leurs capacités pour répondre à la demande des laboratoires d'IA, des entreprises et des gouvernements. En Australie, Firmus Technologies déploie son « Project Southgate », un programme de data centers en Tasmanie, Melbourne, Australie-du-Sud et Nouvelle-Galles du Sud, en privilégiant les énergies renouvelables et les infrastructures modulaires. La société a également ouvert des installations à Singapour en partenariat avec ST Telemedia Global Data Centres. Cet élargissement répond à une explosion de la demande en tokens, l'unité de traitement des modèles de langage, portée par les applications d'IA agentique, les copilotes d'entreprise et les modèles frontières. Pour les nations et industries réglementées, ces clouds régionaux permettent de respecter des exigences de souveraineté numérique et de conformité locale, sans dépendre d'infrastructures centralisées aux États-Unis. Pour les développeurs et startups, ils réduisent la latence et simplifient l'accès aux GPU NVIDIA, combinés aux logiciels d'IA et aux réseaux haute performance de la marque. L'argument économique mis en avant par NVIDIA est le coût par token et le débit par watt, deux métriques déterminantes pour qui exploite des modèles d'IA en production à grande échelle. Cette expansion s'inscrit dans une stratégie plus large de NVIDIA pour s'imposer non plus seulement comme fabricant de puces, mais comme architecte de l'ensemble de la chaîne d'infrastructure IA, du silicium aux logiciels en passant par le cloud. Face à la montée en puissance de concurrents comme AMD et aux investissements massifs des hyperscalers (Google, Microsoft, Amazon) dans leurs propres puces, NVIDIA cherche à verrouiller l'écosystème via des partenariats cloud qui intègrent sa pile technologique complète. Des partenaires comme GMI Cloud, Naver Cloud, Indosat Ooredoo Hutchison ou YTL ancrent cette stratégie dans des marchés à forte croissance : Asie du Sud-Est, Moyen-Orient, Afrique. La prochaine étape sera d'observer si ces capacités régionales parviennent à absorber la demande des grands modèles frontières, dont les coûts d'entraînement continuent de croître exponentiellement.

UELes clouds régionaux NVIDIA permettent aux entreprises et industries réglementées européennes de répondre aux exigences de souveraineté numérique sans dépendre d'infrastructures centralisées aux États-Unis.

InfrastructureActu
1 source
72 GPU dans un seul rack : Dell livre le premier Vera Rubin NVL72 à CoreWeave
3Le Big Data 

72 GPU dans un seul rack : Dell livre le premier Vera Rubin NVL72 à CoreWeave

Dell a livré à CoreWeave le premier système NVIDIA Vera Rubin NVL72 opérationnel, un rack unique intégrant 72 GPU Rubin et 36 processeurs Vera personnalisés. Cette machine atteint une puissance de calcul de 3,6 exaFLOPS, soit une capacité suffisante pour entraîner et faire tourner des modèles d'intelligence artificielle comptant des milliers de milliards de paramètres. Le système adopte un refroidissement liquide intégral, désormais indispensable pour absorber la chaleur et la consommation énergétique générées par une telle densité de composants. CoreWeave, spécialiste américain du cloud GPU qui alimente déjà de nombreux acteurs de l'IA générative, devient ainsi l'un des premiers opérateurs au monde à déployer cette génération d'infrastructure dans un environnement de production réel. Ce déploiement illustre une tendance de fond qui redessine l'économie du calcul pour l'IA : la densification. Regrouper 72 GPU dans un seul rack ne relève pas de l'exploit pour la galerie, mais répond à une contrainte très concrète. Plus les modèles grossissent, plus les échanges de données entre composants deviennent un goulot d'étranglement. En rapprochant physiquement les GPU, on réduit les latences de communication et on améliore le débit global du système, ce qui se traduit directement par des temps d'inférence plus courts et une capacité d'entraînement plus élevée. Pour les opérateurs cloud qui facturent leurs clients à l'heure de GPU, cette efficacité accrue est un avantage compétitif direct. Pour les laboratoires qui entraînent les prochaines générations de modèles, c'est la condition nécessaire pour rester dans la course. Cette livraison s'inscrit dans un cycle d'escalade technologique qui s'accélère depuis le lancement de ChatGPT fin 2022. NVIDIA enchaîne les générations de puces à un rythme inédit : après les H100, les H200 et les Blackwell, la famille Vera Rubin représente la prochaine marche. Dell, longtemps perçu comme un constructeur de serveurs classiques, a clairement choisi de se repositionner comme intégrateur de référence pour les infrastructures d'IA à très grande échelle. CoreWeave, de son côté, a levé plusieurs milliards de dollars ces dernières années pour construire une alternative aux clouds hyperscalers comme AWS ou Google Cloud, spécifiquement taillée pour les charges de travail GPU intensives. La combinaison des deux acteurs sur ce premier déploiement Vera Rubin n'est pas anodine : elle signale que l'infrastructure d'IA de prochaine génération est prête à sortir des laboratoires pour entrer dans les centres de données commerciaux. À ce rythme, les 72 GPU d'aujourd'hui pourraient paraître modestes dès 2027.

UELa disponibilité commerciale de cette infrastructure GPU de prochaine génération conditionnera indirectement la compétitivité des acteurs européens de l'IA dans la course à l'entraînement de très grands modèles.

InfrastructureOpinion
1 source
L'IA a besoin d'une infrastructure de données solide pour créer de la valeur
4MIT Technology Review 

L'IA a besoin d'une infrastructure de données solide pour créer de la valeur

L'intelligence artificielle s'installe durablement dans les entreprises : selon une enquête récente, la moitié des organisations utilisaient déjà l'IA dans au moins trois fonctions métier d'ici fin 2025, que ce soit en finance, dans les chaînes d'approvisionnement, les ressources humaines ou le service client. Mais à mesure que ces systèmes deviennent centraux dans les opérations quotidiennes, un obstacle inattendu émerge. Ce n'est ni la puissance de calcul ni les performances des modèles qui freinent le déploiement, mais la qualité et surtout le contexte des données sur lesquelles reposent ces systèmes. Irfan Khan, président et directeur produit de SAP Data & Analytics, résume le problème : "L'IA produit des résultats très rapidement, mais sans contexte elle ne peut pas exercer un bon jugement -- et c'est le jugement qui crée de la valeur pour l'entreprise. La vitesse sans jugement ne sert à rien, elle peut même nuire." L'enjeu est concret et mesurable. Deux entreprises qui utilisent l'IA pour gérer des ruptures dans leur chaîne d'approvisionnement peuvent traiter les mêmes données -- niveaux de stock, délais, scores fournisseurs -- mais arriver à des décisions radicalement différentes. Celle qui enrichit ses données avec du contexte métier (quels clients sont stratégiques, quels compromis sont acceptables en cas de pénurie, quelles obligations contractuelles s'appliquent) prendra des décisions alignées sur ses priorités réelles. L'autre produira des réponses techniquement correctes mais opérationnellement défaillantes. Les systèmes d'IA n'affichent pas seulement de l'information, ils agissent dessus -- ce qui rend toute erreur de contexte potentiellement coûteuse. Historiquement, des experts humains compensaient ce manque de contexte en interprétant les données brutes. Avec l'automatisation croissante, ce filet de sécurité disparaît. La réponse architecturale qui s'impose est celle du "data fabric", une couche d'infrastructure qui ne se contente pas d'intégrer les données mais préserve leur signification à travers les systèmes, les applications et les environnements cloud. Pendant deux décennies, les entreprises ont massivement investi dans des entrepôts de données centralisés -- utiles pour les rapports et les tableaux de bord, mais appauvrissants pour le sens métier des données. Le mouvement actuel est inverse : il s'agit de connecter les informations là où elles se trouvent tout en conservant les métadonnées, les politiques et les relations qui décrivent comment l'entreprise fonctionne réellement. SAP, qui positionne ses solutions d'analytique autour de cette vision, n'est pas seul sur ce terrain : toute l'industrie des données se repositionne pour répondre à une exigence nouvelle -- celle d'une IA qui ne se contente pas d'aller vite, mais qui va dans la bonne direction.

UESAP étant une entreprise allemande leader du logiciel d'entreprise, son positionnement sur le 'data fabric' influence directement les choix d'infrastructure des grandes organisations européennes qui déploient l'IA.

InfrastructureActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic