Aller au contenu principal
ByteDance conçoit ses puces IA façon Groq
InfrastructureThe Information AI1sem

ByteDance conçoit ses puces IA façon Groq

Résumé IASource uniqueImpact UETake éditorial
Source originale ↗·

ByteDance, la maison mère de TikTok, développe une nouvelle puce destinée à faire tourner des modèles d'intelligence artificielle. Selon trois sources proches du dossier, cette puce s'inspirerait de l'architecture des "language processing units" (LPU) conçus par Groq, une entreprise américaine partenaire de Nvidia, réputée pour exécuter les modèles d'IA à moindre coût. ByteDance travaille également en étroite collaboration avec InnoStar Semiconductor, une startup chinoise spécialisée dans la mémoire, pour intégrer sa technologie dans cette nouvelle puce.

Ce développement illustre la volonté de ByteDance de bâtir une infrastructure IA entièrement maîtrisée en interne, en s'affranchissant progressivement de la dépendance aux fournisseurs étrangers. Alors que les restrictions américaines à l'exportation de puces Nvidia vers la Chine se durcissent, cette initiative stratégique permettrait à l'entreprise de sécuriser ses capacités de calcul pour ses produits d'IA, notamment son assistant Doubao, qui compte des centaines de millions d'utilisateurs. Pour l'industrie technologique chinoise, c'est un signal fort : les géants locaux accélèrent leur montée en puissance dans le semi-conducteur.

Ce projet s'inscrit dans une course plus large engagée par les entreprises technologiques chinoises pour développer des alternatives nationales aux puces américaines, dans un contexte de tensions géopolitiques croissantes entre Washington et Pékin. Huawei, avec ses puces Ascend, et Alibaba figurent parmi les acteurs déjà engagés sur cette voie. ByteDance, classé parmi les leaders de l'IA en Chine, cherche ainsi à consolider sa position tout en anticipant d'éventuelles nouvelles restrictions qui pourraient menacer son accès aux technologies occidentales.

Impact France/UE

L'accélération de l'autonomie technologique chinoise dans les semi-conducteurs accentue la fragmentation géopolitique des chaînes d'approvisionnement en puces IA, renforçant indirectement la pression sur l'Europe pour développer sa propre filière.

💬 Le point de vue du dev

S'inspirer de l'archi LPU de Groq, c'est pas anodin. Groq a bâti toute sa réputation sur l'inférence rapide et pas chère, exactement ce dont ByteDance a besoin pour faire tourner Doubao à des centaines de millions d'utilisateurs sans exploser les coûts. Les restrictions Nvidia accélèrent clairement cette montée en puissance, et je suis pas convaincu que c'était le résultat que Washington espérait.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Dix entreprises chinoises dont ByteDance auraient obtenu un accord américain pour des puces IA qui leur sont interdites
1The Decoder 

Dix entreprises chinoises dont ByteDance auraient obtenu un accord américain pour des puces IA qui leur sont interdites

Une dizaine d'entreprises chinoises, dont Alibaba, Tencent et ByteDance, ont reçu l'autorisation du gouvernement américain d'acquérir jusqu'à 75 000 puces Nvidia H200 chacune. Ces autorisations, révélées par le secrétaire au Commerce Howard Lutnick, représentent un assouplissement notable des restrictions américaines sur les exportations de semi-conducteurs avancés vers la Chine. Pourtant, pas une seule puce n'a encore été livrée. La raison de ce blocage ne vient pas de Washington, mais de Pékin. Selon Lutnick, c'est le gouvernement chinois lui-même qui empêche ces achats, dans le but de protéger son industrie nationale de semi-conducteurs. Cette situation crée un paradoxe inédit : des entreprises chinoises de premier plan se voient refuser par leur propre gouvernement l'accès à des composants que les États-Unis ont accepté de leur vendre. Pour ces géants technologiques, l'impossibilité d'acquérir du matériel de pointe freine directement le développement de leurs modèles d'IA. Cet épisode s'inscrit dans une guerre technologique plus large entre les deux premières puissances mondiales. Depuis 2022, Washington a progressivement renforcé ses contrôles à l'exportation de puces avancées vers la Chine, poussant Pékin à accélérer ses investissements dans des acteurs comme Huawei et SMIC pour atteindre l'autonomie technologique. En bloquant ces achats, la Chine envoie un signal fort : elle préfère consolider sa filière domestique plutôt que de rester dépendante de fournisseurs américains, même lorsque la porte est temporairement ouverte.

UECe bras de fer sino-américain renforce la prise de conscience européenne sur la nécessité d'une souveraineté dans les semi-conducteurs avancés, thème central de l'European Chips Act, sans impact opérationnel direct immédiat sur les entreprises ou institutions françaises.

InfrastructureOpinion
1 source
Google lance ses TPU v8 et spécialise ses puces pour l’IA : enjeux et comparatif maison
2Next INpact 

Google lance ses TPU v8 et spécialise ses puces pour l’IA : enjeux et comparatif maison

Google a annoncé sa huitième génération de Tensor Processing Units (TPU), ses puces spécialisées dans les calculs d'intelligence artificielle. Pour la première fois dans l'histoire de la gamme, la firme de Mountain View propose deux variantes distinctes basées non plus sur le niveau de performance, mais sur le type d'usage : le TPU v8t, orienté vers l'entraînement des modèles, et le TPU v8i, dédié à l'inférence. C'est une rupture notable avec les générations précédentes, comme les v5e et v5p, qui se différenciaient uniquement par l'efficacité énergétique contre la puissance brute. Cette spécialisation par usage représente un changement de stratégie significatif pour Google. Selon la firme elle-même, "les deux puces peuvent gérer différentes charges de travail, mais la spécialisation permet d'obtenir des gains significatifs". En séparant l'entraînement de l'inférence au niveau matériel, Google cherche à optimiser le rapport performances/coût pour chaque étape du cycle de vie d'un modèle d'IA. Pour les entreprises clientes de Google Cloud, cela se traduit potentiellement par des coûts d'exploitation réduits et une meilleure efficacité dans le déploiement de modèles génératifs à grande échelle. Cette annonce s'inscrit dans une course aux puces IA qui s'est considérablement intensifiée depuis 2018, date des TPU v3. En huit générations, Google a construit une alternative crédible aux GPU de Nvidia, qui dominent encore largement le marché de l'accélération IA. La firme utilise ses TPU en interne pour entraîner ses propres modèles Gemini, ce qui lui confère un avantage compétitif double : maîtrise du hardware et du software. Face à la montée en puissance de concurrents comme les puces Trainium d'Amazon ou les Gaudi d'Intel, la spécialisation des TPU v8 pourrait devenir un argument commercial décisif pour attirer les grandes entreprises vers Google Cloud plutôt que vers AWS ou Azure.

UELes entreprises européennes qui s'appuient sur Google Cloud pour entraîner ou déployer des modèles d'IA pourraient bénéficier d'une réduction des coûts d'exploitation grâce à la spécialisation matérielle des TPU v8.

InfrastructureOpinion
1 source
Les puces IA d'Amazon commencent à séduire les développeurs face à Nvidia
3The Information AI 

Les puces IA d'Amazon commencent à séduire les développeurs face à Nvidia

Les puces Trainium d'Amazon commencent à séduire les développeurs d'intelligence artificielle, marquant une étape importante dans la stratégie du géant du cloud pour concurrencer Nvidia. Anthropic et OpenAI, qui ont conclu des accords d'investissement et d'infrastructure de plusieurs milliards de dollars avec Amazon, se sont déjà engagés à louer de grandes quantités de capacité Trainium, aussi bien les générations actuelles que futures. Des améliorations logicielles récentes ont en outre convaincu une demi-douzaine de développeurs plus modestes, selon des personnes qui utilisent ou travaillent avec ces puces, d'envisager de transférer davantage de leurs charges de travail vers cette architecture propriétaire d'AWS. Ce changement de perception est significatif pour l'industrie. Nvidia contrôle aujourd'hui plus de 80 % du marché des puces d'entraînement d'IA, ce qui lui confère un pouvoir de fixation des prix considérable. Si Amazon parvient à convaincre même une fraction des développeurs de basculer vers Trainium, cela pourrait réduire la dépendance structurelle de l'écosystème IA envers un seul fournisseur et faire pression sur les marges exceptionnelles de Nvidia. Amazon développe ses propres siliciums depuis plusieurs années, après le rachat d'Annapurna Labs en 2015. La stratégie repose sur l'intégration verticale : proposer des puces optimisées pour les services AWS, avec des prix potentiellement inférieurs à ceux des GPU H100 et H200 de Nvidia. L'adhésion d'acteurs aussi stratégiques qu'Anthropic, dans lequel Amazon a investi plus de 4 milliards de dollars, constitue à la fois une validation technique et un levier commercial pour attirer d'autres clients vers l'écosystème Trainium.

UELes développeurs et entreprises européennes hébergés sur AWS pourraient bénéficier d'une alternative moins coûteuse aux GPU Nvidia si l'adoption de Trainium se généralise, réduisant la dépendance structurelle de l'écosystème IA à un unique fournisseur de silicium.

💬 Quand Anthropic et OpenAI "adoptent" Trainium, faut garder en tête qu'Amazon leur a mis des milliards sur la table, donc c'est une validation arrangée autant que technique. Ce qui compte vraiment, c'est la demi-douzaine de développeurs indépendants qui commencent à y basculer des workloads pour des raisons de coût, sans deal en arrière-plan. C'est ce signal-là qui a du poids.

InfrastructureOpinion
1 source
La Corée du Sud investit dans la startup locale qui défie Nvidia avec ses puces IA
4Le Big Data 

La Corée du Sud investit dans la startup locale qui défie Nvidia avec ses puces IA

Le gouvernement sud-coréen a annoncé mardi un investissement de 166 millions de dollars (250 milliards de wons) dans Rebellions, une startup spécialisée dans les puces d'intelligence artificielle fondée en 2020. Cet investissement, validé par la Commission des services financiers et le conseil consultatif des technologies stratégiques, est le premier déblocage concret du « Fonds national de croissance » dans le cadre du programme « K-Nvidia », co-piloté avec le ministère des Sciences et des TIC. Rebellions conçoit des unités de traitement neuronal (NPU) dédiées à l'inférence IA — la phase où les modèles répondent aux requêtes en temps réel. Son architecture, notamment la puce ATOM, se distingue par une consommation énergétique nettement inférieure aux solutions concurrentes. Fonctionnant sur un modèle « fabless », la société sous-traite la fabrication à des fonderies spécialisées. Depuis six mois, elle a levé 650 millions de dollars, portant son total à 850 millions et sa valorisation à plus de 2 milliards de dollars. Cet investissement public s'inscrit dans une stratégie de réduction de la dépendance aux infrastructures américaines, et plus précisément à Nvidia, qui domine aujourd'hui le marché des puces IA avec une emprise quasi monopolistique sur les data centers mondiaux. Cette concentration donne à un seul acteur un pouvoir considérable sur les prix, les délais de livraison et l'accès aux technologies critiques — une vulnérabilité que les États commencent à prendre très au sérieux. Rebellions cible déjà des clients cloud, des opérateurs télécoms et des gouvernements, et s'implante aux États-Unis, au Japon, au Moyen-Orient et à Taïwan, signalant des ambitions clairement internationales. Pour la Corée du Sud, soutenir ce type d'acteur, c'est aussi consolider une filière industrielle cohérente : le pays maîtrise déjà la mémoire vive avec Samsung et SK Hynix, mais reste exposé sur le segment des puces de calcul IA. La décision de Séoul intervient dans un contexte de course mondiale aux semi-conducteurs qui s'emballe. Les géants technologiques américains devraient investir collectivement entre 630 et 700 milliards de dollars en infrastructure IA cette année selon Reuters, tandis que la Chine, malgré les restrictions américaines à l'export, accélère le développement de ses propres filières. Les tensions géopolitiques entre Washington et Pékin ont transformé les semi-conducteurs en outil de pression diplomatique, rendant les chaînes d'approvisionnement imprévisibles. Dans ce contexte, le programme K-Nvidia représente le pari de Séoul de ne pas rater la fenêtre d'opportunité : construire un champion national de la puce IA avant que le marché soit structurellement verrouillé par les acteurs déjà en place.

UELa dépendance européenne aux puces Nvidia étant structurellement similaire à celle de la Corée du Sud, l'émergence de concurrents asiatiques comme Rebellions pourrait à terme diversifier les options d'approvisionnement pour les acteurs européens du cloud et de l'IA.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour