CUDA· sujet

70 articlesmis à jour le 20 juillet 2026

Suivi de CUDA : versions, compatibilité GPU NVIDIA, intégration aux frameworks IA et usages pour l'entraînement et l'inférence des modèles.

Hub d'actualité sur CUDA, agrégé en continu depuis 72 sources éditoriales. Pour les analyses long-form, voir /analyses.

Le pouls du sujet · 30 derniers jours

données Le Fil IA

19↓ 54%

articles (vs 30j préc.)

2.3%

de la couverture IA

Souvent associé à

NVIDIAInférenceAgenticHugging FaceH100

Mesuré sur notre corpus de 50+ sources, fenêtre glissante de 30 jours. Part de voix = part des articles IA de la période mentionnant CUDA. Voir le Baromètre IA complet

À retenir · 30 derniers jours

Qualcomm négocie le rachat de Modular, éditeur d'une pile logicielle (Mojo, MAX) positionnée comme alternative à CUDA.Pourquoi Qualcomm veut acquérir Modular,…
Fable, modèle d'Anthropic, a écrit des noyaux GPU jugés de haut niveau sur le benchmark KernelBench-Mega.Import AI 464 : Fables écrit des noyaux…
NVIDIA détaille comment sa pile logicielle d'inférence baisse le coût par token, consolidant l'écosystème CUDA face aux rivaux.Les logiciels d'inférence NVIDIA permett…Le marché des puces pour l'IA incarnée s…

CUDA est l'interface de programmation que NVIDIA a publiée en 2007 pour faire tourner du calcul généraliste sur ses cartes graphiques. Quinze ans plus tard, c'est le socle quasi obligatoire de l'IA moderne : les bibliothèques qui entraînent et font tourner les modèles (cuDNN, cuBLAS, et les frameworks PyTorch ou TensorFlow au-dessus) sont écrites pour CUDA. Acheter un GPU NVIDIA, ce n'est pas seulement acheter du silicium, c'est entrer dans cet écosystème logiciel.

Sa position durable tient à cet effet de verrou. Des années de code, de tutoriels et d'optimisations existent en CUDA et nulle part ailleurs, ce qui rend la migration vers une autre marque coûteuse même quand le matériel concurrent est compétitif. C'est ce « fossé » logiciel, autant que les puces, qui explique la domination de NVIDIA sur l'infrastructure IA. Les alternatives existent (ROCm chez AMD, des couches d'abstraction comme Triton ou des compilateurs maison chez les grands acteurs du cloud), mais aucune n'a encore brisé l'habitude.

Pour un professionnel, comprendre CUDA, c'est comprendre où se situe le vrai pouvoir de marché dans l'IA, en amont des modèles.

Dans ce hub, on suit l'évolution de l'écosystème CUDA, les efforts pour s'en émanciper, et ce que ce verrou implique pour les coûts et la souveraineté.

Analyses long-form sur CUDA

Quand un sujet mérite un format long, c'est ici.

Souveraineté IA : l'Europe veut construire, la France risque de freiner Mistral
La France choisit AMD pour diversifier son infrastructure : le verrou CUDA au cœur de l'arbitrage souverain.

NVIDIA Hugging Face Alibaba Qwen3 Azure Google Cloud Blackwell AMD Moonshot AI OpenAI Anthropic Claude Mythos Tous les dossiers →

Toute l'actualité CUDA

Flux automatique. Articles classés par pertinence, agrégés en continu.

1Next INpact BusinessActu

AMD s’engage à investir 5 milliards de dollars dans Anthropic via un nouvel accord croisé

AMD s'engage à investir jusqu'à 5 milliards de dollars dans Anthropic, l'éditeur des modèles Claude, dans le cadre d'un accord croisé annoncé cette semaine. En contrepartie, Anthropic promet de déployer l'équivalent de 2 gigawatts de puces AMD au sein de ses infrastructures de calcul, avec un premier gigawatt attendu au premier semestre 2027. Ces déploiements reposeront sur Helios, la nouvelle gamme de racks dédiés à l'IA d'AMD, dévoilée en octobre dernier et mise en avant lors du dernier CES. Le système combine des GPU Instinct MI450, des processeurs EPYC de classe Venice et une couche réseau maison baptisée Pensando, le tout piloté par ROCm, la pile logicielle open source qu'AMD développe comme alternative à CUDA de Nvidia. Anthropic, qui exploite déjà des GPU Instinct MI355X sur une partie de son infrastructure, va donc étendre significativement son usage du matériel AMD. Les deux entreprises ont également formalisé un accord de collaboration logicielle : les équipes d'AMD utiliseront Claude pour optimiser les charges de travail sur GPU Instinct et accélérer le développement de ROCm, et déploieront le modèle à grande échelle dans leurs équipes d'ingénierie. Cet accord pèse lourd pour les deux parties. Pour AMD, il s'agit d'une validation commerciale majeure face à la domination de Nvidia sur le marché des puces IA, avec un client de premier plan qui s'engage sur des volumes massifs et pluriannuels. Pour Anthropic, diversifier ses fournisseurs de calcul au-delà de Nvidia réduit sa dépendance à un seul acteur et lui donne un levier de négociation sur les prix, un enjeu crucial à mesure que l'entraînement et l'inférence de ses modèles Claude deviennent plus gourmands en ressources. L'investissement de 5 milliards de dollars, versé par paliers selon les volumes réellement commandés, sécurise aussi le développement futur d'Anthropic sans dilution immédiate au capital. Mais ce type d'accord réciproque, où le fournisseur de puces investit dans son propre client, alimente aussi les inquiétudes sur une possible bulle spéculative autour des investissements dans l'IA générative. Ce partenariat s'inscrit dans une série d'accords similaires signés par Anthropic ces derniers mois : un engagement avec Amazon en avril dernier autour des puces Trainium, également assorti d'un investissement de 5 milliards de dollars, puis un accord avec Google en octobre 2025 pour un approvisionnement garanti en TPU. OpenAI multiplie de son côté les engagements croisés avec Nvidia pour les puces et Oracle pour la construction de datacenters. AMD, de son côté, enchaîne les contrats : l'entreprise avait déjà annoncé lundi 20 juillet un accord de grande envergure avec Microsoft, portant lui aussi sur des systèmes Helios destinés aux services d'inférence d'Azure, avec une livraison prévue au second semestre 2026, sans que le montant du contrat soit communiqué.

UECet accord entre acteurs americains n'implique aucune entreprise europeenne, mais la concurrence accrue face a Nvidia sur le marche des puces IA pourrait indirectement influencer les couts de calcul des entreprises europeennes dependantes de ces infrastructures.

Aussi sur Frandroid,Siècle Digital

2Le Big Data

Infinity : comment d’anciens chercheurs d’OpenAI et d’Anthropic veulent transformer l’inférence IA ?

Infinity, une startup fondée il y a moins d'un an par Jeremy Nixon, ancien chercheur chez Google Brain et cofondateur de la communauté AGI House, vient de boucler une levée de fonds de 15 millions de dollars qui porte sa valorisation à 100 millions de dollars. Le tour de table réunit Touring Capital, Principal VC, plusieurs dirigeants de l'industrie des semi-conducteurs ainsi que des chercheurs issus d'OpenAI et d'Anthropic. Plutôt que de développer un nouveau modèle de langage, l'entreprise se concentre sur les logiciels d'inférence, la couche technique qui permet aux puces d'IA d'exploiter pleinement leurs performances. Son produit phare, Ignition, est un agent d'IA capable d'écrire, tester et optimiser automatiquement les noyaux logiciels nécessaires au fonctionnement des modèles sur une nouvelle architecture matérielle. Premier partenariat industriel de la jeune pousse, la collaboration avec le fabricant de puces d-Matrix a permis d'atteindre jusqu'à 92 % des performances théoriques maximales de sa puce Corsair, et ce en seulement dix heures de tests, avant un déploiement de plusieurs modèles récents en une dizaine de jours. Cette avancée s'attaque à un problème central du secteur des semi-conducteurs pour l'IA : de nombreux fabricants conçoivent aujourd'hui des accélérateurs performants, mais peinent à rivaliser avec NVIDIA, dont l'avantage repose autant sur ses GPU que sur son écosystème logiciel CUDA, mûri depuis près de vingt ans. En automatisant un travail d'optimisation qui mobilisait auparavant des équipes d'ingénieurs pendant plusieurs mois voire plusieurs années, Ignition promet de réduire ce délai à quelques jours, les experts conservant la supervision de l'architecture globale pendant que l'agent traite les tâches répétitives. Pour les fabricants de puces alternatives, cela change la donne économique de l'adoption : un environnement logiciel mature devient accessible sans qu'il faille reconstituer, puce par puce, l'écosystème que NVIDIA a mis des années à bâtir. Le modèle économique d'Infinity accompagne cette ambition puisque l'entreprise partage les gains de performance et les économies générées avec ses partenaires, plutôt que de vendre une licence logicielle classique. Cette trajectoire illustre un déplacement plus large dans l'écosystème de l'IA. Après plusieurs années où l'essentiel de l'attention et des capitaux allait au développement des modèles de fondation chez OpenAI, Anthropic ou Google, une nouvelle génération d'entrepreneurs issus de ces mêmes laboratoires se tourne vers les infrastructures qui feront tourner l'IA de demain, plus rapides, moins coûteuses et compatibles avec un plus grand nombre de matériels. Infinity ambitionne ainsi de bâtir une bibliothèque d'inférence universelle, capable de fonctionner sur GPU, puces spécialisées ou autres accélérateurs, avec l'objectif de fragiliser la position dominante de NVIDIA sur le marché des semi-conducteurs pour l'IA.

CUDA· sujet

À retenir · 30 derniers jours

Analyses long-form sur CUDA

Toute l'actualité CUDA

AMD s’engage à investir 5 milliards de dollars dans Anthropic via un nouvel accord croisé

Infinity : comment d’anciens chercheurs d’OpenAI et d’Anthropic veulent transformer l’inférence IA ?

Import AI 464 : Fables écrit des noyaux GPU, l'automatisation de l'IA et le calcul analogique

L'été des meta-harnesses

Pourquoi Qualcomm veut acquérir Modular, la startup spécialisée dans les puces IA ?

De la simulation des matériaux à l'astronomie : NVIDIA lance un logiciel d'IA pour la découverte scientifique

Avec sa puce Napier, Tensordyne veut faire 13x à 17x mieux que les GPU NVIDIA

Databricks et Nvidia préparent ensemble l’avenir de l’IA agentique

Paralléliser le décodage spéculatif avec P-EAGLE sur Amazon SageMaker AI

Les parts de marché de Nvidia dans les puces d'inférence IA semblent progresser

AMD : ce mini PC fait tourner des IA géantes… sans cloud ni abonnement

NVIDIA Blackwell domine le premier benchmark d'infrastructure pour agents autonomes d'IA

#Nextquick Pourquoi tout le monde se jette encore sur les GPU NVIDIA pour l’IA

Les robotaxis doivent intégrer la sécurité dès la conception, pas l'ajouter après coup

Fini le réglage manuel des kernels : Neuron Agentic Development accélère les optimisations AWS Trainium

SK hynix et NVIDIA étendent leur partenariat autour des AI Factories

NVIDIA lance Dynamo Snapshot : démarrage rapide pour l'inférence IA sur Kubernetes via CRIU

Miso Labs publie MisoTTS : un modèle de synthèse vocale expressif de 8 milliards de paramètres en open weights

Les recherches de NVIDIA ouvrent la voie à la préhension avancée, la conduite autonome et l'entraînement d'agents à grande échelle

Cosmos 3 : des modèles du monde omnimodaux pour l'IA physique

Les leaders du logiciel industriel créent des ingénieurs IA autonomes et sécurisés avec NVIDIA NIM

Perplexity AI présente son système d'inférence hybride local-cloud au Computex 2026

NVIDIA et Microsoft s'associent pour un environnement unifié de déploiement d'agents IA, des appareils Windows au cloud

Cosmos 3 : Nvidia lance l’IA qui comprend (enfin) la vraie vie

NVIDIA dévoile une plateforme complète pour robots humanoïdes, robotaxis et usines intelligentes

OpenAI envisage de publier un outil interne qui affaiblirait l'avantage logiciel de Nvidia

mKernel : une bibliothèque de noyaux fusionnés multi-GPU et multi-nœuds pour les communications pilotées par GPU

Hexo Labs publie SIA en open source : un agent capable d'améliorer son propre cadre et ses poids de modèle

OmniVoice Studio : une alternative locale et open source à ElevenLabs

Créez des applications vocales en temps réel avec Amazon SageMaker AI et vLLM

Nous Research publie une méthode d'entraînement par superposition de tokens qui accélère le pré-entraînement des LLM jusqu'à 2,5x pour des modèles de 270M à 10B paramètres

Nvidia franchit les 5 500 milliards en Bourse, du jamais-vu dans l’histoire

NVIDIA publie cuda-oxide : un compilateur expérimental Rust vers CUDA générant des noyaux GPU directement en PTX

Google TPU v8 : la puce IA qui défie NVIDIA Blackwell

Moonshot AI open-source FlashKDA : noyaux CUTLASS pour Kimi Delta Attention et benchmarks H20

[AINews] Rien de notable aujourd'hui

Nvidia Rubin Ultra : le GPU qui transformera les AI Factories en 2027

NVIDIA et ses partenaires présentent l'avenir de la fabrication pilotée par l'IA à Hannover Messe 2026

Tutoriel : faire tourner PrismML Bonsai LLM 1-bit sur CUDA avec GGUF, benchmarks, chat, JSON et RAG

Cadence étend ses partenariats en IA et robotique avec Nvidia et Google Cloud

[AINews] Le dernier souffle de l'humanité

CPUs, GPUs, TPUs, NPUs et LPUs : cinq architectures de calcul IA que tout ingénieur doit connaître

Nvidia vs Meta : qui contrôle vraiment l’IA en 2026 ?

TensorWave peut-il dépasser l'avantage concurrentiel de Nvidia ?

RightNow AI publie AutoKernel : un framework open source qui applique une boucle d'agents autonomes à l'optimisation des kernels GPU pour les modèles PyTorch

Meta lance KernelEvolve, un agent IA pour optimiser les infrastructures d'entraînement

NVIDIA optimise Gemma 4 pour les agents autonomes locaux, des GPU RTX aux serveurs Spark

« Sans GeForce il n’y aurait pas de CUDA et sans CUDA il n’y aurait pas d’IA » : Nvidia rend hommage aux joueurs PC qui ont financé l’IA

Import AI 448 : R&D en IA ; l'agent CUDA de ByteDance ; IA satellite embarquée

Nous avons fait venir Claude pour créer des noyaux CUDA et enseigner les modèles ouverts !