InfrastructureThe Information AI4h· 1 min de lecture

Anthropic en discussion avec Samsung pour produire une puce IA sur mesure

Anthropic a entamé des travaux préliminaires sur son propre processeur d'intelligence artificielle et a mené des discussions avec Samsung Electronics en vue d'un partenariat de fabrication, selon trois sources proches du dossier. L'entreprise, créatrice du modèle Claude, suit ainsi la voie tracée par son rival OpenAI, qui cherche également à reprendre la main sur les infrastructures de calcul coûteuses nécessaires à l'entraînement et au fonctionnement de ses modèles. Si Anthropic concrétise ce projet, elle rejoindrait un cercle encore restreint d'acteurs développant leurs propres puces IA, un domaine où elle reste une arrivante relativement tardive comparée aux géants du secteur.

Cette démarche s'inscrit dans une tendance de fond chez les grands noms de l'IA générative, qui cherchent à réduire leur dépendance aux fabricants de puces traditionnels comme Nvidia, dont les processeurs dominent le marché mais restent onéreux et parfois difficiles à obtenir en quantité suffisante. Concevoir sa propre puce permettrait à Anthropic de mieux maîtriser ses coûts d'infrastructure, d'optimiser les performances pour ses propres modèles Claude, et de sécuriser son approvisionnement en capacité de calcul à mesure que la demande explose. Pour l'industrie, ce mouvement confirme que le contrôle du matériel devient un enjeu stratégique aussi important que les avancées algorithmiques elles-mêmes.

Google et Amazon Web Services développent depuis plusieurs années leurs propres puces avec succès, tandis que Meta Platforms et Microsoft ont eux aussi construit leurs propres processeurs internes. OpenAI, de son côté, a fait appel à Broadcom en 2024 pour concevoir sa puce maison et a dévoilé le mois dernier le premier fruit de ce partenariat, baptisé Jalapeño, un processeur d'inférence conçu pour exécuter les grands modèles de langage avec une meilleure efficacité. En se tournant vers Samsung, Anthropic pourrait s'appuyer sur l'expertise du géant coréen en gravure de semi-conducteurs, dans un contexte où la course aux puces IA sur mesure redessine les rapports de force entre laboratoires d'intelligence artificielle et fondeurs.

Dans nos dossiers

Anthropic OpenAI Microsoft AWS

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Information AI

Anthropic en négociation pour acheter des puces IA à une startup britannique

Anthropic est en discussions avec la startup londonienne Fractile pour acquérir des puces d'inférence destinées à faire tourner ses modèles d'IA. Selon deux sources proches des dirigeants de Fractile, les pourparlers portent sur un approvisionnement qui deviendrait effectif l'année prochaine, une fois les puces disponibles. Anthropic, qui commercialise les modèles Claude, s'appuie aujourd'hui sur trois fournisseurs principaux : Google, Amazon et Nvidia. Ce potentiel contrat avec Fractile constituerait donc une quatrième source d'approvisionnement en matériel. L'enjeu est stratégique : les ventes d'Anthropic connaissent une croissance explosive qui met sous pression les serveurs existants, et les dépenses de la société en infrastructure sont projetées à plusieurs dizaines de milliards de dollars par an. En diversifiant ses fournisseurs, Anthropic se dote d'un levier de négociation face à des géants comme Nvidia, dont les puces restent en forte demande. Les puces d'inférence de Fractile sont conçues pour faire tourner des modèles d'IA de manière plus efficiente, ce qui peut réduire les coûts opérationnels à grande échelle. Cette démarche s'inscrit dans une tendance de fond : les grands laboratoires d'IA cherchent à réduire leur dépendance à Nvidia, dont les GPU H100 et Blackwell sont devenus un goulot d'étranglement mondial. Des acteurs comme Google avec ses TPU, ou Amazon avec ses puces Trainium, développent déjà leurs alternatives en interne. Fractile, startup britannique encore confidentielle, tente de s'imposer sur ce marché émergent des puces d'inférence spécialisées, où la compétition s'intensifie rapidement.

UEL'émergence de Fractile, startup londonienne, comme fournisseur potentiel d'Anthropic illustre la capacité des entreprises européennes à s'imposer dans le marché stratégique des puces d'inférence IA, même si l'impact direct sur la France et l'UE reste indirect à ce stade.

💬 Anthropic n'achète pas des puces, il achète du pouvoir de négociation face à Nvidia. Avoir un quatrième fournisseur dans la poche, c'est surtout une façon de ne plus être otage des GPU H100 qui manquent à tout le monde. Reste à voir si Fractile peut vraiment tenir la cadence quand Anthropic va en avoir besoin.

InfrastructureActu

1 source

2The Information AI

Anthropic en négociations pour utiliser les puces IA de Microsoft

Anthropic serait en discussions avec Microsoft pour louer des serveurs équipés de puces d'intelligence artificielle conçues en interne par le géant de Redmond. Selon deux personnes ayant eu des échanges directs avec des dirigeants impliqués dans les négociations, la startup fondatrice de Claude cherche à augmenter sa capacité de calcul pour répondre à une demande croissante pour ses modèles d'IA. Aucun accord n'a encore été officialisé, mais les tractations sont en cours. Pour Microsoft, convaincre Anthropic d'adopter ses propres puces constituerait une victoire symbolique et commerciale majeure. L'effort de design de puces maison de l'entreprise a accusé des retards en 2024, compliquant sa stratégie d'indépendance vis-à-vis des fournisseurs externes. Séduire un acteur aussi visible qu'Anthropic permettrait à Microsoft de valider publiquement ses capacités matérielles et de diversifier les revenus issus de son infrastructure cloud Azure. La démarche s'inscrit dans une tendance de fond : les grands fournisseurs de cloud cherchent à réduire leur dépendance aux puces Nvidia, qui dominent aujourd'hui presque l'intégralité du marché des accélérateurs IA et dont la disponibilité reste contrainte. Google dispose déjà de ses TPU, Amazon de ses puces Trainium et Inferentia. Microsoft, en retard sur ce front, tente de combler l'écart. Anthropic, de son côté, bénéficie déjà d'investissements massifs d'Amazon et de Google, ce qui rend un partenariat avec Microsoft d'autant plus significatif sur le plan stratégique.

InfrastructureActu

1 source

3The Information AI

Google en discussions avec Marvell pour développer de nouveaux puces IA dédiées à l'inférence

Google mène des discussions avec Marvell Technology pour développer deux nouveaux puces dédiées à l'inférence d'intelligence artificielle, selon deux sources proches du dossier. La première est une unité de traitement mémoire conçue pour fonctionner en complément des TPU (Tensor Processing Units) déjà fabriqués par Google. La seconde est un nouveau TPU entièrement conçu pour exécuter des modèles d'IA en production. Aucune date officielle n'a été communiquée pour l'instant. Cette démarche illustre la demande explosive pour des puces d'inférence performantes, celles qui font tourner les applications d'IA en temps réel, des agents autonomes aux assistants commerciaux. Contrairement à l'entraînement des modèles, l'inférence mobilise des ressources en continu, à grande échelle, ce qui en fait un enjeu économique majeur pour les grandes plateformes cloud. Optimiser ces puces se traduit directement en réduction de coûts et en amélioration des performances pour des millions d'utilisateurs finaux. La course à la puce d'inférence s'intensifie sur tous les fronts. En mars dernier, Nvidia a présenté à sa conférence GTC un nouveau composant baptisé LPU (Language Processing Unit), construit sur une technologie rachetée à la startup Groq pour 20 milliards de dollars. Google, de son côté, développe ses propres TPU depuis des années pour réduire sa dépendance à Nvidia, et ce partenariat potentiel avec Marvell s'inscrit dans cette stratégie d'autonomie technologique. La bataille pour dominer l'infrastructure d'inférence promet d'être l'un des grands enjeux industriels des prochaines années.

💬 Google qui externalise une partie de sa conception de puces à Marvell, c'est un signal fort : même eux n'ont pas les ressources pour tout faire en interne à ce rythme. L'inférence, c'est le vrai coût caché de l'IA en prod, celui qui explose à mesure qu'on déploie des agents partout. Reste à voir si ce partenariat débouche sur quelque chose de concret, ou si c'est juste une piste parmi dix autres.

InfrastructureActu

1 source

4The Decoder

Anthropic et Micron veulent co-concevoir l'architecture mémoire pour l'IA

Micron Technology rejoint le tour de table Series H d'Anthropic en tant qu'investisseur stratégique, et signe dans la foulée un accord pluriannuel pour fournir des composants mémoire destinés à l'infrastructure qui fait tourner Claude. L'opération témoigne d'une intégration croissante entre fabricants de puces et laboratoires d'IA : plutôt qu'une simple relation client-fournisseur, les deux entreprises entendent co-concevoir l'architecture mémoire adaptée aux exigences spécifiques de l'entraînement et de l'inférence des grands modèles de langage. Tom Brown, co-fondateur d'Anthropic, souligne que la mémoire constitue un élément critique aussi bien pour entraîner Claude que pour le faire fonctionner à l'échelle. Ce partenariat garantit à Anthropic un approvisionnement prioritaire et une feuille de route matérielle alignée sur ses besoins, au moment où la compétition pour les ressources de calcul s'intensifie entre OpenAI, Google DeepMind et Meta. Pour Micron, c'est l'occasion de s'imposer comme fournisseur incontournable dans la chaîne d'approvisionnement de l'IA générative, un marché en croissance rapide dominé jusqu'ici par SK Hynix et Samsung. Ce type d'accord croisé, où un fournisseur investit dans son propre client, suscite des critiques de la part d'analystes qui voient dans ces montages financiers un mécanisme d'inflation artificielle des valorisations dans le secteur. L'action Micron a bondi de plus de dix fois en l'espace d'un an, portée par l'engouement pour l'IA. La question de savoir si ces partenariats traduisent une création de valeur réelle ou alimentent une bulle spéculative reste ouverte, alors que les investissements dans l'infrastructure IA continuent d'atteindre des sommets historiques.

InfrastructureOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic