Aller au contenu principal
InfrastructureLe Big Data10h· 2 min de lecture

Anthropic et Samsung préparent une puce IA pour Claude : quels impacts pour les entreprises ?

Source originale ↗·

Anthropic explore la possibilité de faire fabriquer une puce IA sur mesure par Samsung pour faire tourner son modèle Claude, selon des informations rapportées début juillet 2026 par The Information. Les discussions entre les deux groupes portent notamment sur le recours au procédé de gravure en 2 nanomètres de Samsung ainsi qu'à ses techniques avancées de packaging. Le projet en est toutefois à un stade très préliminaire : Anthropic n'a pas encore arrêté l'usage précis de cette puce, son mode d'intégration dans les serveurs, ni le niveau de puissance de calcul visé. L'entreprise, fondée par d'anciens dirigeants d'OpenAI, s'appuie actuellement sur une infrastructure diversifiée mêlant des accélérateurs de Google, d'Amazon et de Nvidia, et Anthropic a précisé que cette diversification resterait au cœur de sa stratégie matérielle, ce qui suggère qu'une éventuelle puce Samsung viendrait compléter cet écosystème plutôt que le remplacer.

Pour les entreprises clientes de Claude, l'enjeu dépasse la simple prouesse technique. À mesure que des milliers d'agents et d'applications sollicitent le modèle en continu, le coût d'inférence devient un poste de dépense déterminant, bien plus que lorsque quelques assistants internes suffisaient à couvrir les besoins. Une puce conçue spécifiquement pour les calculs de Claude, plutôt qu'un accélérateur généraliste partagé entre plusieurs usages, pourrait permettre d'optimiser plus finement le lien entre le modèle, les serveurs et le matériel, avec à la clé des gains potentiels sur trois fronts : le coût d'exploitation, la latence de réponse et la consommation énergétique. Ces bénéfices restent pour l'instant des objectifs, non des résultats mesurés, mais ils dessinent une trajectoire vers une IA plus facile à déployer à grande échelle pour les usages professionnels.

Cette démarche s'inscrit dans un mouvement plus large de reprise en main du matériel par les grands acteurs de l'IA générative, qui cherchent à réduire leur dépendance à Nvidia, actuel leader incontesté du marché des puces IA. OpenAI a emprunté une voie similaire en s'associant à Broadcom pour développer Jalapeño, son propre processeur d'inférence sur mesure, tandis qu'Amazon et Google disposent depuis plus longtemps de leurs accélérateurs maison intégrés à leurs infrastructures cloud respectives. Pour Anthropic, s'allier à Samsung présenterait l'avantage de s'appuyer sur un partenaire déjà expérimenté dans la fabrication de composants pour l'IA, notamment via sa collaboration étroite avec Nvidia sur des puces d'entraînement et d'exécution de modèles. Reste que tant que l'architecture définitive et les fonctions exactes de cette puce ne seront pas officiellement dévoilées, son impact concret sur les performances et les coûts de Claude demeurera spéculatif.

Impact France/UE

Les entreprises européennes clientes de Claude pourraient bénéficier indirectement d'une baisse des coûts d'inférence si le projet aboutit, mais cet impact reste hypothétique tant qu'aucune puce n'est officiellement confirmée.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Anthropic en discussion avec Samsung pour produire une puce IA sur mesure
1The Information AI 

Anthropic en discussion avec Samsung pour produire une puce IA sur mesure

Anthropic a entamé des travaux préliminaires sur son propre processeur d'intelligence artificielle et a mené des discussions avec Samsung Electronics en vue d'un partenariat de fabrication, selon trois sources proches du dossier. L'entreprise, créatrice du modèle Claude, suit ainsi la voie tracée par son rival OpenAI, qui cherche également à reprendre la main sur les infrastructures de calcul coûteuses nécessaires à l'entraînement et au fonctionnement de ses modèles. Si Anthropic concrétise ce projet, elle rejoindrait un cercle encore restreint d'acteurs développant leurs propres puces IA, un domaine où elle reste une arrivante relativement tardive comparée aux géants du secteur. Cette démarche s'inscrit dans une tendance de fond chez les grands noms de l'IA générative, qui cherchent à réduire leur dépendance aux fabricants de puces traditionnels comme Nvidia, dont les processeurs dominent le marché mais restent onéreux et parfois difficiles à obtenir en quantité suffisante. Concevoir sa propre puce permettrait à Anthropic de mieux maîtriser ses coûts d'infrastructure, d'optimiser les performances pour ses propres modèles Claude, et de sécuriser son approvisionnement en capacité de calcul à mesure que la demande explose. Pour l'industrie, ce mouvement confirme que le contrôle du matériel devient un enjeu stratégique aussi important que les avancées algorithmiques elles-mêmes. Google et Amazon Web Services développent depuis plusieurs années leurs propres puces avec succès, tandis que Meta Platforms et Microsoft ont eux aussi construit leurs propres processeurs internes. OpenAI, de son côté, a fait appel à Broadcom en 2024 pour concevoir sa puce maison et a dévoilé le mois dernier le premier fruit de ce partenariat, baptisé Jalapeño, un processeur d'inférence conçu pour exécuter les grands modèles de langage avec une meilleure efficacité. En se tournant vers Samsung, Anthropic pourrait s'appuyer sur l'expertise du géant coréen en gravure de semi-conducteurs, dans un contexte où la course aux puces IA sur mesure redessine les rapports de force entre laboratoires d'intelligence artificielle et fondeurs.

💬 Anthropic qui va frapper à la porte de Samsung, ça confirme un truc simple : la vraie bataille de l'IA se joue maintenant sur le silicium, pas sur les modèles. Tout le monde a fini par comprendre que dépendre de Nvidia coûte une fortune et limite les stocks, alors chacun se fabrique sa puce, Google, Amazon, Meta, OpenAI avec Broadcom, et maintenant Anthropic. Sauf qu'ils arrivent bons derniers sur ce terrain, et une puce maison ça se construit en années, pas en un cycle de release de Claude.

InfrastructureActu
1 source
HP et l'art de l'IA et des données pour les entreprises
2AI News 

HP et l'art de l'IA et des données pour les entreprises

À quelques jours du salon AI & Big Data Expo, prévu les 18 et 19 mai au McEnery Convention Center de San Jose, Jérôme Gabryszewski, responsable du développement commercial IA et Data Science chez HP, a accordé une interview à Artificial Intelligence News pour évoquer les défis concrets que rencontrent les grandes entreprises dans leur adoption de l'intelligence artificielle. Le constat est sans appel : malgré un accès abondant à leurs propres données, la plupart des organisations peinent à en tirer parti. La première embûche n'est pas technique : c'est la dette organisationnelle et architecturale. Avant d'automatiser quoi que ce soit, les entreprises doivent réconcilier des données éparpillées entre départements, des schémas incohérents et des systèmes legacy jamais conçus pour l'interopérabilité. Le travail de gouvernance précède toujours le déploiement technique. Sur la question des modèles en apprentissage continu, Gabryszewski recommande d'appliquer les mêmes exigences qu'un déploiement logiciel classique : aucune mise à jour en production sans validation formelle. La dérive conceptuelle est surveillée via des pipelines MLOps avec détection automatique, et la contamination des données d'entraînement est traitée comme un problème de traçabilité autant que de sécurité. Les entreprises qui maîtrisent ces risques ne sont pas forcément les plus avancées techniquement, mais celles qui ont intégré la gouvernance IA dans leur cadre de gestion des risques avant de passer à l'échelle. Ce positionnement a des implications concrètes pour des milliers d'équipes data qui cherchent à réduire leur dépendance au cloud sans sacrifier la puissance de calcul. La question du local versus cloud est au cœur des arbitrages actuels : chaque inférence envoyée dans le cloud représente un coût, une latence et une exposition potentielle de données sensibles. Disposer d'une infrastructure locale capable de faire tourner des modèles de grande taille change fondamentalement l'équation économique et réglementaire, notamment pour les secteurs soumis à des contraintes strictes comme la finance, la santé ou la défense. HP s'appuie sur quinze ans de développement de sa gamme professionnelle Z pour positionner son matériel comme épine dorsale de ce cycle IA autonome. Le ZBook Ultra et le Z2 Mini couvrent les usages mobiles et compacts, mais c'est le ZGX Nano qui attire l'attention : un supercalculateur IA de 15x15 cm, équipé du superpuce NVIDIA GB10 Grace Blackwell, 128 Go de mémoire unifiée et 1 000 TOPS de performance FP4, capable de faire tourner localement des modèles jusqu'à 200 milliards de paramètres. En interconnectant deux unités, on atteint 405 milliards de paramètres, sans cloud, sans datacenter, sans file d'attente. L'appareil est livré préconfiguré avec la pile logicielle NVIDIA DGX et le HP ZGX Toolkit, permettant aux équipes d'être opérationnelles en quelques minutes. HP vise ainsi le segment des équipes IA qui ont besoin de puissance souveraine et immédiate, à l'heure où la course aux modèles toujours plus grands redistribue les cartes du marché des workstations professionnelles.

InfrastructureActu
1 source
Anthropic en négociations pour utiliser les puces IA de Microsoft
3The Information AI 

Anthropic en négociations pour utiliser les puces IA de Microsoft

Anthropic serait en discussions avec Microsoft pour louer des serveurs équipés de puces d'intelligence artificielle conçues en interne par le géant de Redmond. Selon deux personnes ayant eu des échanges directs avec des dirigeants impliqués dans les négociations, la startup fondatrice de Claude cherche à augmenter sa capacité de calcul pour répondre à une demande croissante pour ses modèles d'IA. Aucun accord n'a encore été officialisé, mais les tractations sont en cours. Pour Microsoft, convaincre Anthropic d'adopter ses propres puces constituerait une victoire symbolique et commerciale majeure. L'effort de design de puces maison de l'entreprise a accusé des retards en 2024, compliquant sa stratégie d'indépendance vis-à-vis des fournisseurs externes. Séduire un acteur aussi visible qu'Anthropic permettrait à Microsoft de valider publiquement ses capacités matérielles et de diversifier les revenus issus de son infrastructure cloud Azure. La démarche s'inscrit dans une tendance de fond : les grands fournisseurs de cloud cherchent à réduire leur dépendance aux puces Nvidia, qui dominent aujourd'hui presque l'intégralité du marché des accélérateurs IA et dont la disponibilité reste contrainte. Google dispose déjà de ses TPU, Amazon de ses puces Trainium et Inferentia. Microsoft, en retard sur ce front, tente de combler l'écart. Anthropic, de son côté, bénéficie déjà d'investissements massifs d'Amazon et de Google, ce qui rend un partenariat avec Microsoft d'autant plus significatif sur le plan stratégique.

InfrastructureActu
1 source
Anthropic explorerait la fabrication de puces sur mesure avec Samsung, tout en maintenant l'importance de Nvidia
4The Decoder 

Anthropic explorerait la fabrication de puces sur mesure avec Samsung, tout en maintenant l'importance de Nvidia

Anthropic, la startup d'intelligence artificielle fondée par d'anciens ingénieurs d'OpenAI, serait engagée dans des discussions avec le géant sud-coréen Samsung Electronics en vue de la fabrication d'une puce IA sur mesure. Le projet en serait encore à un stade précoce, mais l'entreprise a déjà recruté des ingénieurs spécialisés dans la conception de semi-conducteurs pour le piloter. Cette démarche intervient peu après l'annonce par OpenAI de son propre projet de puce interne, baptisée "Jalapeño", confirmant une tendance de fond chez les grands acteurs de l'IA générative : développer leurs propres composants plutôt que de dépendre exclusivement des fournisseurs traditionnels. Malgré cette diversification vers le silicium propriétaire, Anthropic aurait tenu à préciser que Nvidia demeure un partenaire essentiel et que ses puces continueront de jouer un rôle central dans son infrastructure. Cette initiative illustre la pression croissante que subissent les entreprises d'IA face à l'explosion des coûts d'entraînement et d'exécution de leurs modèles. En s'associant à Samsung, l'un des rares fondeurs capables de produire des puces avancées à grande échelle, Anthropic chercherait à réduire sa dépendance aux GPU Nvidia, dont la demande mondiale dépasse largement l'offre et dont les prix restent élevés. Pour l'industrie, ce mouvement confirme que même les entreprises les mieux financées jugent nécessaire de maîtriser une partie de leur chaîne d'approvisionnement en calcul, un enjeu à la fois stratégique et économique. À terme, des puces sur mesure pourraient permettre à Anthropic d'optimiser ses coûts d'inférence tout en gagnant en indépendance vis-à-vis des cycles de production de Nvidia. Ce virage s'inscrit dans une dynamique plus large où plusieurs géants de la tech, dont Google avec ses puces TPU et Amazon avec ses processeurs Trainium, ont déjà investi massivement dans le silicium propriétaire pour l'IA. OpenAI a ouvert la voie avec Jalapeño, et Anthropic semble vouloir lui emboîter le pas, signe que la course à l'infrastructure devient un facteur de différenciation aussi important que la qualité des modèles eux-mêmes. Le choix de Samsung comme partenaire pourrait aussi refléter une volonté de diversifier les fournisseurs face à la position dominante de TSMC dans la fonderie avancée. Reste à savoir si ce projet aboutira à une puce déployée à grande échelle, et selon quel calendrier, dans un secteur où la demande en puissance de calcul continue de croître à un rythme vertigineux.

InfrastructureActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic