AMD· sujet

93 articlesmis à jour le 20 juillet 2026

Les puces et GPU d'AMD pour l'IA, ses lancements Instinct, ses résultats et sa concurrence avec Nvidia dans le calcul accéléré.

Hub d'actualité sur AMD, agrégé en continu depuis 72 sources éditoriales. Pour les analyses long-form, voir /analyses.

Le pouls du sujet · 30 derniers jours

données Le Fil IA

10↓ 50%

articles (vs 30j préc.)

1.2%

de la couverture IA

Souvent associé à

NVIDIAInférenceAgenticGPT-5 Azure

Mesuré sur notre corpus de 50+ sources, fenêtre glissante de 30 jours. Part de voix = part des articles IA de la période mentionnant AMD. Voir le Baromètre IA complet

À retenir · 30 derniers jours

MoonMath AI publie en open source un kernel d'attention HIP pour MI300X qui dépasse AITER v3 sur toutes les configurations testées.MoonMath AI publie en open source un ker…
Un mode de génération d'images caché dans les pilotes Radeon pourrait multiplier les FPS par huit via FSR.Multiplier vos FPS par 8 ? Le projet sec…
Une configuration locale à 15 274 euros équipée de deux GPU AMD a été testée pour faire tourner l'IA sans cloud.Une tour à 15 274 €, deux GPU AMD et auc…

AMD occupe une place particulière dans l'IA : celle du concurrent crédible mais minoritaire face à Nvidia. Ses processeurs graphiques Instinct (la série MI300, puis MI350 et au-delà) visent l'entraînement et l'inférence des grands modèles, le terrain où Nvidia capte aujourd'hui l'essentiel des marges. La vraie bataille ne se joue pas que sur la puissance brute des puces, mais sur le logiciel : l'écosystème CUDA de Nvidia reste la référence des développeurs, et la réponse open source d'AMD, ROCm, doit encore convaincre à grande échelle.

Sa position durable tient à un besoin du marché : les géants du cloud et les laboratoires d'IA veulent une alternative pour ne pas dépendre d'un seul fournisseur et faire pression sur les prix. AMD est le mieux placé pour jouer ce rôle de second souffle, sans pour autant menacer le leader à court terme. À cela s'ajoute son CPU EPYC, solide dans les serveurs, qui lui donne un pied dans chaque centre de données.

Dans ce hub, on suit ce qui compte sur la durée : l'adoption réelle des puces Instinct chez les grands clients, la maturité de ROCm face à CUDA, et la capacité d'AMD à transformer la demande d'alternative en parts de marché concrètes.

Analyses long-form sur AMD

Quand un sujet mérite un format long, c'est ici.

Souveraineté IA : l'Europe veut construire, la France risque de freiner Mistral
« IA et souveraineté : la France choisit AMD » — le contexte complet de l'arbitrage infrastructure européen.

NVIDIA GPT-5 Azure Hugging Face Perplexity AI Alibaba Qwen3 Google Cloud Blackwell CUDA Moonshot AI OpenAI Tous les dossiers →

Toute l'actualité AMD

Flux automatique. Articles classés par pertinence, agrégés en continu.

1MarkTechPost OutilsOutil

Gigatoken : un tokeniseur BPE en Rust qui encode le texte à 24,53 Go/s, jusqu'à 989 fois plus vite que HuggingFace Tokenizers

Marcel Rød, doctorant à Stanford, a publié Gigatoken, un tokenizer BPE (byte-pair encoding) écrit en Rust sous licence MIT, capable d'encoder du texte à 24,53 Go/s sur une seule machine. Le benchmark de référence, réalisé avec le tokenizer GPT-2 sur le corpus owt_train.txt de 11,9 Go et une machine bi-socket AMD EPYC 9565 à 144 cœurs, place Gigatoken loin devant ses concurrents : tiktoken d'OpenAI atteint 36,0 Mo/s et HuggingFace Tokenizers 24,8 Mo/s sur le même matériel, soit des écarts de 681 fois et 989 fois. Sur un Apple M4 Max à 16 cœurs, Gigatoken traite le même corpus à 8,79 Go/s (1268 fois plus vite que HuggingFace, 140 fois plus vite que tiktoken), et sur un AMD Ryzen 7 9800X3D grand public, 6,27 Go/s, soit 106 et 68 fois plus rapide. La bibliothèque, disponible sur PyPI en version 0.9.0 depuis le 21 juillet 2026 via pip install gigatoken, couvre 23 familles de tokenizers dont GPT-2, GPT-OSS, Llama 3 à 4, Qwen 2 à 3.6, DeepSeek V3/R1/V4, GLM 4 et 5, Kimi K2, Nemotron 3, Phi-4, OLMo 2/3, ModernBERT, Gemma et Mistral. Cette performance change la donne pour un maillon de la chaîne d'entraînement des modèles de langage rarement optimisé, alors même qu'il conditionne la vitesse de préparation des jeux de données massifs utilisés pour l'entraînement des LLM. Un tokenizer 989 fois plus rapide réduit drastiquement le temps et le coût de calcul nécessaires pour préparer des corpus de plusieurs téraoctets, une étape jusqu'ici considérée comme un goulot d'étranglement secondaire face à l'entraînement lui-même. Gigatoken propose deux modes d'utilisation : un mode de compatibilité qui encapsule un tokenizer HuggingFace ou tiktoken existant en préservant une parité exacte des résultats, mais avec un gain plus modeste de 200 à 300 fois selon Marcel Rød en raison du surcoût lié à Python, et une API native en Rust qui lit directement les fichiers et produit les chiffres records annoncés. Les gains ne proviennent pas d'une amélioration de la boucle de fusion BPE elle-même, mais de deux optimisations généralement négligées. La première concerne la prétokenisation : la plupart des implémentations délèguent cette étape à un moteur d'expressions régulières, quand Gigatoken utilise une machine à états écrite à la main. Le journal d'optimisation du projet détaille une progression méthodique, d'une base en fancy-regex à environ 47 Mio/s jusqu'à 1049 Mio/s en mono-thread, en passant par une table de correspondance de 256 octets pour un dispatch en temps constant, la technique SWAR (SIMD Within A Register) traitant huit octets à la fois sans intrinsèques spécifiques à une architecture, puis une exploitation du parallélisme d'instructions via deux curseurs indépendants qui exploite les ports d'exécution inactifs du processeur. Au total, cette seule optimisation de la prétokenisation représente un gain de 22,3 fois par rapport à l'implémentation par expressions régulières. La seconde optimisation repose sur la mise en cache des pré-tokens déjà rencontrés, une technique que Marcel Rød décrit comme délicate à implémenter en pratique en raison de la croissance rapide du cache et de la distribution à longue traîne des mots, le tout combiné à une minimisation des interactions entre Python et les threads.

AMD· sujet

À retenir · 30 derniers jours

Analyses long-form sur AMD

Toute l'actualité AMD

Gigatoken : un tokeniseur BPE en Rust qui encode le texte à 24,53 Go/s, jusqu'à 989 fois plus vite que HuggingFace Tokenizers

Anthropic va déployer 2 gigawatts de GPU AMD pour Claude, dans un accord pouvant atteindre 5 milliards de dollars

AMD s’engage à investir 5 milliards de dollars dans Anthropic via un nouvel accord croisé

Pourquoi Microsoft mise davantage sur AMD pour développer Azure AI ?

Nvidia perd du terrain sur les puces IA : Microsoft se tourne vers AMD, et Anthropic pourrait suivre

Cette police d’écriture met l’IA en échec… tandis que les humains la lisent sans effort

Multiplier vos FPS par 8 ? Le projet secret d’AMD avec son FSR pour distancer Nvidia

Wall Street débat de l'expansion massive de l'IA. Les entreprises répondent : 86 % disent que leurs GPU tournent à moitié capacité ou moins

Une tour à 15 274 €, deux GPU AMD et aucun abonnement cloud : on a testé l’IA locale à son maximum [Sponso]

OpenAI dévoile sa première puce d'inférence IA maison, Jalapeño, développée avec Broadcom grâce à ses propres modèles

Runpod lève 100 millions de dollars et refuse des offres de rachat

MoonMath AI publie en open source un kernel d'attention HIP pour AMD MI300X surpassant AITER v3 sur toutes les configurations

Odyssey obtient 310 millions de dollars pour son IA de simulation du monde

Nvidia mobilise 20 milliards de dollars de dette pour renforcer son offensive dans l’IA

AMD : ce mini PC fait tourner des IA géantes… sans cloud ni abonnement

Semi-conducteurs : l'IA propulse les revenus des fonderies à un niveau record au premier trimestre 2026

IA autonome et perte de données DevOps : construire des défenses efficaces

NVIDIA et Microsoft s'associent pour un environnement unifié de déploiement d'agents IA, des appareils Windows au cloud

OpenAI envisage de publier un outil interne qui affaiblirait l'avantage logiciel de Nvidia

Le prochain chip IA d'Intel sera moins cher et moins énergivore que ceux de Nvidia et AMD

Comment Nvidia veut s’emparer du « cerveau » de nos ordinateurs personnels

Microsoft et Nvidia s'associent pour des PC IA capables d'exécuter de vrais agents autonomes

Micron dépasse les 1 000 milliards de dollars grâce à la demande en IA

Le CPU Vera de NVIDIA s'affirme comme un concurrent redoutable

La puce Vera de Nvidia, le pari à 200 milliards de dollars que Jensen Huang veut mettre en avant

Blackstone et Google investissent dans un nouveau cloud TPU pour accélérer l’IA

La semaine 3 du duel Musk-Altman, et les tractations technologiques de Trump

Cerebras : une IPO à 60 milliards de dollars, lente puis soudaine

Nvidia franchit les 5 500 milliards en Bourse, du jamais-vu dans l’histoire

☕️ Les tentatives de chantage de Claude seraient dûes à des fictions sur l’IA

NVIDIA a déjà investi 40 milliards de dollars dans des accords IA en 2026

ZAYA1-8B : modèle de raisonnement open source très efficace, entraîné sur GPU AMD Instinct MI300

☕️ AMD lance sa Radeon Instinct MI350P : un demi-GPU de MI350X en PCIe 5.0

Zyphra lance ZAYA1-8B : un modèle de raisonnement MoE entraîné sur matériel AMD aux performances bien supérieures à sa taille

OpenAI crée un protocole réseau avec AMD, Broadcom, Intel, Microsoft et NVIDIA pour résoudre les goulets d'étranglement des supercalculateurs IA

Vidéo : le robot Atlas bouge déjà mieux que certains gymnastes

Zyphra présente TSP : stratégie d'entraînement adaptée au matériel offrant un débit 2,6 fois supérieur au TP+SP

Le FOMO pousse les entreprises à payer des GPU inutilisés et fait grimper les prix

Des piétons jouent à faire peur à un véhicule autonome

Mystère résolu : Anthropic révèle que des changements de configuration et d'instructions ont causé la dégradation de Claude

Les robots peuvent désormais éplucher, trancher et manipuler des objets de forme irrégulière

Nvidia Rubin Ultra : le GPU qui transformera les AI Factories en 2027

Les 10 principales entreprises chinoises de conception de puces

NVIDIA Vera : quand le CPU devient le cerveau de l’IA autonome

IA et souveraineté numérique : la France choisit AMD pour son infrastructure ?

OpenAI va dépenser plus de 20 milliards de dollars en puces Cerebras et obtenir une participation au capital

Les bons résultats de TSMC confirment l'élan de l'IA

Boston Dynamics et Google DeepMind apprennent à Spot à raisonner

Anthropic affaiblit-il Claude ? Les utilisateurs signalent des baisses de performances, les dirigeants démentent

Nvidia vs Meta : qui contrôle vraiment l’IA en 2026 ?