Aller au contenu principal
L’IA Slop n’est pas seul responsable de la pénurie de RAM : Apple y prend sa part
InfrastructureFrandroid13sem· 1 min de lecture

L’IA Slop n’est pas seul responsable de la pénurie de RAM : Apple y prend sa part

Source originale ↗·

La pénurie mondiale de mémoire vive qui frappe le marché des composants informatiques depuis plusieurs mois trouve deux coupables de poids : la frénésie de l'IA générative d'un côté, et Apple de l'autre. Si les modèles de langage et les infrastructures d'entraînement aspirent des quantités massives de DRAM et de HBM, le géant de Cupertino contribue lui aussi significativement à la tension sur les approvisionnements, au point d'aggraver une situation déjà tendue pour les fabricants de PC et les constructeurs de serveurs.

La demande d'Apple s'explique par la montée en gamme systématique de ses appareils : les Mac équipés de puces M-series intègrent désormais des configurations mémoire unifiée de plus en plus généreuses, tandis que les iPhone et iPad embarquent davantage de RAM pour supporter les fonctionnalités d'Apple Intelligence. Cette stratégie, combinée aux volumes colossaux produits par Apple chaque trimestre, mobilise une part non négligeable de la capacité mondiale des fondeurs comme SK Hynix, Samsung ou Micron.

Le contexte est celui d'un marché DRAM sous pression depuis fin 2024, où l'explosion des besoins en mémoire pour les puces IA HBM a détourné les capacités de production vers ce segment plus rentable. Résultat : les prix de la RAM grand public et serveur remontent, et les délais d'approvisionnement s'allongent. La convergence de ces deux forces — IA et Apple — laisse peu de marge aux autres acteurs du marché pour absorber le choc.

Impact France/UE

Les fabricants et acheteurs européens de PC et de serveurs subissent des hausses de prix et des délais d'approvisionnement allongés sur la mémoire vive.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

L’IA assèche le marché de la mémoire : APPLE anticipe déjà les prochaines pénuries
1FrenchWeb 

L’IA assèche le marché de la mémoire : APPLE anticipe déjà les prochaines pénuries

Après deux ans dominés par la pénurie de GPU NVIDIA, une nouvelle tension s'installe dans la chaîne d'approvisionnement technologique : la mémoire. Les puces HBM (High Bandwidth Memory) et la DRAM de haute performance, indispensables aux systèmes d'IA, sont en train de devenir le nouveau goulot d'étranglement de l'industrie. Apple aurait d'ores et déjà pris des mesures anticipatoires en sécurisant des volumes importants auprès de ses fournisseurs, notamment Samsung et SK Hynix, pour prévenir toute rupture sur ses prochaines générations de produits intégrant des fonctionnalités d'IA avancées. La demande explosive en mémoire est directement portée par les centres de données IA : chaque cluster de GPU H100 ou Blackwell consomme des quantités massives de HBM, réduisant d'autant la disponibilité pour les constructeurs d'appareils grand public. Pour Apple, dont les puces M et A series embarquent de la mémoire unifiée à haute vitesse, une pénurie signifierait des retards de production ou une hausse des coûts sur les iPhone, Mac et iPad, avec des répercussions directes sur les marges et les délais de livraison. Cette dynamique s'inscrit dans un mouvement plus large de reconfiguration des priorités industrielles autour de l'IA. Les fabricants de mémoire comme Micron, SK Hynix et Samsung investissent massivement dans la capacité HBM, mais les cycles de production sont longs, 18 à 24 mois pour de nouvelles lignes. Les géants de la tech qui sécurisent leurs approvisionnements dès maintenant, comme Apple, prennent une longueur d'avance décisive sur ceux qui attendront que la pénurie soit déjà installée.

UEUne pénurie de mémoire HBM pourrait entraîner une hausse des prix et des retards de livraison sur les appareils grand public en Europe.

💬 Après deux ans de pénurie GPU, la mémoire HBM devient le prochain goulot. Les cycles de production tournent à 18-24 mois, donc les engagements pris aujourd'hui vont dicter qui aura des produits disponibles, et à quel prix, en 2027. Apple a signé avant que la pénurie soit officielle, les autres vont payer pour avoir attendu.

InfrastructureOpinion
1 source
ASML : la seule entreprise capable de ralentir l’IA
2FrenchWeb 

ASML : la seule entreprise capable de ralentir l’IA

ASML, le fabricant néerlandais de machines de lithographie ultraviolette extrême (EUV), a publié ses résultats trimestriels début 2026, révélant un carnet de commandes en deçà des attentes du marché malgré une demande mondiale de puces en apparente explosion. L'entreprise basée à Eindhoven est la seule au monde capable de produire les machines EUV indispensables à la fabrication des puces les plus avancées, celles que TSMC, Samsung et Intel utilisent pour graver les processeurs alimentant les data centers d'IA. Sans ses équipements, aucun chip de dernière génération ne peut être fabriqué. Ce goulet d'étranglement technologique place ASML dans une position unique : celle d'un frein potentiel à la croissance de l'IA, non par choix stratégique, mais par réalité industrielle. Une machine EUV coûte environ 200 millions d'euros, prend des mois à assembler et requiert plus de 100 000 composants provenant de fournisseurs spécialisés à travers le monde. ASML ne peut en produire qu'une centaine par an, une capacité qui ne peut pas simplement être doublée sur décision. Quand les commandes ralentissent ou que les délais s'allongent, c'est l'ensemble de la chaîne d'approvisionnement en semi-conducteurs qui se grippe. Le contexte est celui d'une tension géopolitique persistante : les restrictions américaines sur les exportations de machines ASML vers la Chine, appliquées depuis 2023 avec la complicité des Pays-Bas, ont déjà réduit un marché majeur. Pendant ce temps, les grandes fonderies investissent des centaines de milliards pour étendre leurs capacités, mais restent tributaires du rythme de livraison d'ASML. L'entreprise incarne ainsi le paradoxe de l'ère de l'IA : une croissance présentée comme illimitée, mais contrainte par des réalités physiques et industrielles bien tangibles.

UEASML, fleuron néerlandais et actif stratégique européen, est au cœur des restrictions d'exportation vers la Chine imposées sous pression américaine, exposant la dépendance de l'UE à un seul fournisseur critique pour toute sa chaîne semi-conducteurs.

InfrastructureOpinion
1 source
3NVIDIA AI Blog 

Repenser le coût total de l'IA : pourquoi le coût par token est la seule métrique qui compte

Les centres de données d'entreprise sont en train de vivre une mutation profonde : autrefois dédiés au stockage et au traitement de données, ils deviennent des usines à tokens, dont la production principale est l'intelligence artificielle générée à la demande. Cette transformation oblige les entreprises à repenser entièrement leur manière d'évaluer le coût total de possession (TCO) de leur infrastructure IA. Or, selon NVIDIA, la majorité des décideurs continuent de se focaliser sur des métriques obsolètes : le coût par GPU par heure ou les FLOPS par dollar, c'est-à-dire la puissance brute de calcul obtenue pour chaque dollar investi. Ces indicateurs mesurent des intrants, alors que les entreprises, elles, font tourner leur activité sur des extrants. La seule métrique qui compte réellement est le coût par million de tokens produits, soit le coût tout compris pour générer chaque unité d'intelligence délivrée à l'utilisateur final. Optimiser ce coût par token change fondamentalement l'équation économique de l'IA. Le numérateur de cette équation, le coût horaire du GPU, est visible et facile à comparer entre fournisseurs cloud ou solutions on-premise. Mais c'est le dénominateur, soit le volume de tokens effectivement délivrés par seconde, qui détermine la rentabilité réelle. Augmenter ce débit produit deux effets simultanés : il réduit le coût unitaire de chaque interaction servie, améliorant ainsi les marges, et il augmente le nombre de tokens par mégawatt consommé, ce qui permet de générer davantage de revenus à partir du même investissement infrastructurel. NVIDIA affirme proposer le coût par token le plus bas du secteur, notamment sur les modèles de raisonnement de type mixture-of-experts (MoE), qui représentent aujourd'hui la catégorie de modèles la plus largement déployée en production. Cette réévaluation des critères de choix s'inscrit dans un contexte de montée en puissance de l'IA agentique, où les systèmes autonomes enchaînent des séquences longues d'inférences, rendant le débit et la latence encore plus critiques. Des technologies comme le décodage spéculatif, la prédiction multi-token, le routage KV-aware ou encore le déchargement du cache KV permettent d'augmenter substantiellement le débit réel sans changer le matériel. La prise en charge de la précision FP4, la capacité de l'interconnexion à gérer le trafic all-to-all des modèles MoE, ou encore les optimisations de la couche de serving deviennent des critères de sélection déterminants. Pour les déploiements on-premise notamment, où l'engagement en capital sur le foncier, l'énergie et l'infrastructure est massif, maximiser l'intelligence produite par mégawatt n'est plus une option technique mais un impératif économique.

InfrastructureActu
1 source
L'IA est insatiable
4IEEE Spectrum AI 

L'IA est insatiable

L'intelligence artificielle provoque une pénurie mondiale de mémoire informatique, et plus précisément de mémoire à haute bande passante (HBM), un composant spécialement conçu pour alimenter les processeurs d'IA. Les fabricants de puces comme Nvidia et AMD exigent des quantités croissantes de HBM pour chacun de leurs processeurs, sous la pression de géants comme Google, Microsoft, OpenAI et Anthropic, qui financent une expansion sans précédent de leurs centres de données. Le site Hyperion de Meta en Louisiane, prévu à 5 gigawatts, illustre l'ampleur pharaonique de ces infrastructures. La pénurie ne se limite pas à la mémoire : la consommation électrique de l'IA pourrait atteindre 12 % de l'ensemble de la production américaine d'électricité d'ici 2028, tandis que les requêtes d'IA générative, qui ont consommé 15 térawattheures en 2025, devraient grimper à 347 TWh d'ici 2030. Les conséquences de cette tension sur les approvisionnements se répercutent bien au-delà des data centers. La pression des hyperscalers sur la demande en mémoire fait monter les prix de tous les appareils électroniques grand public, y compris des ordinateurs à bas coût comme le Raspberry Pi. Cette inflation technologique est amplifiée par la hausse générale des prix et l'instabilité du régime des droits de douane américains, rendant difficile pour les consommateurs et les entreprises d'évaluer le vrai coût de la pénurie. Pour les industriels de la tech, la contrainte d'approvisionnement oblige à repenser l'architecture des systèmes, potentiellement au détriment des performances. Les trois grands fabricants de HBM sont Micron, Samsung et SK Hynix, et tout ajustement de leur calendrier de production constituerait un signal fort d'un éventuel retour à l'équilibre. Du côté de la demande, les data centers pourraient se tourner vers des équipements sacrifiant une partie des performances pour réduire leur consommation de mémoire, tandis que les startups pourraient être contraintes de repenser leurs produits pour limiter leurs besoins en RAM. Cette pénurie, bien que pénalisante à court terme, pourrait aussi stimuler des innovations inattendues dans la conception de systèmes plus sobres en ressources, une dynamique que les observateurs de l'industrie suivront de près dans les prochains trimestres.

UELa pénurie de mémoire HBM fait monter les prix des composants électroniques en Europe, affectant les consommateurs et les entreprises tech européennes qui dépendent de ces approvisionnements.

💬 Le Raspberry Pi qui augmente à cause des data centers d'OpenAI, c'est le genre d'effet domino qu'on n'anticipe pas. La pression des hyperscalers sur le HBM, ça se répercute sur toute la chaîne, du GPU H100 jusqu'au tinkerer qui commande une carte à 35 euros. Reste à voir si la contrainte d'approvisionnement pousse vraiment vers des architectures plus sobres, ou si c'est juste un argument de comm' le temps que Micron et SK Hynix rattrapent la demande.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic