Aller au contenu principal
Arm entre dans l'arène du silicium : le CPU AGI prêt à propulser l'IA agentique, mais au milieu d'une forte concurrence
InfrastructureZDNET FR12sem· 1 min de lecture

Arm entre dans l'arène du silicium : le CPU AGI prêt à propulser l'IA agentique, mais au milieu d'une forte concurrence

Source originale ↗·

Arm, le concepteur britannique de puces dont l'architecture équipe la quasi-totalité des smartphones mondiaux, a annoncé le lancement de son propre processeur destiné aux data centers : l'Arm AGI CPU. Contrairement à son modèle historique de simple vente de licences d'architecture, Arm entre cette fois directement sur le marché du silicium, ciblant spécifiquement les charges de travail liées à l'IA agentique — ces systèmes autonomes capables d'enchaîner des tâches complexes sans intervention humaine.

Cette annonce marque un tournant stratégique majeur pour l'industrie. L'IA agentique exige des processeurs capables de gérer des flux de raisonnement continus et intensifs, un segment jusqu'ici dominé par les GPU de Nvidia et les puces custom de Google (TPU) ou Amazon (Trainium). En proposant un CPU optimisé pour ces usages, Arm s'attaque à un marché en croissance explosive, tout en challengeant ses propres clients comme Qualcomm et Apple qui s'appuient sur ses licences.

Le mouvement s'inscrit dans un contexte de consolidation verticale accélérée : Meta, Microsoft et Amazon développent leurs propres puces, tandis que SoftBank — propriétaire d'Arm depuis 2016 et reintroduit en bourse en 2023 — pousse à une montée en valeur ajoutée. La concurrence sera néanmoins rude face à des acteurs comme AMD, Intel et surtout Nvidia, dont l'emprise sur l'infrastructure IA reste considérable. Les prochains mois révéleront si Arm peut transformer son omniprésence architecturale en avantage commercial direct sur ce segment stratégique.

Impact France/UE

Arm étant une entreprise britannique stratégique soutenue par SoftBank, son entrée sur le marché des processeurs pour data centers pourrait renforcer l'écosystème européen des semi-conducteurs et influencer les choix d'infrastructure IA des acteurs cloud opérant en Europe.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

La puce quantique Majorana 2 de Microsoft illustre le rôle des agents IA dans la R&D
1AI News 

La puce quantique Majorana 2 de Microsoft illustre le rôle des agents IA dans la R&D

Microsoft a dévoilé cette semaine le processeur quantique Majorana 2, accompagné de chiffres qui redéfinissent les standards du secteur : des qubits mille fois plus fiables que ceux de la première génération, une durée de vie moyenne de 20 secondes contre quelques microsecondes pour les puces concurrentes, et un objectif de calculateur quantique commercialement utilisable d'ici 2029. Le changement clé à l'origine de ce bond : le remplacement du matériau supraconducteur, passant de l'aluminium au plomb, une décision issue d'années de recherche conventionnelle en science des matériaux. En parallèle, Microsoft a annoncé la disponibilité générale de Microsoft Discovery, sa plateforme d'IA agentique dédiée à la R&D scientifique, dont le développement de Majorana 2 constitue la première démonstration publique d'efficacité. Ce qui rend cette annonce structurellement importante, ce n'est pas que l'IA ait conçu la puce, mais ce qu'elle a rendu possible autour de la recherche humaine. Microsoft Discovery n'a pas choisi le plomb comme matériau, mais ses agents ont pris en charge la gestion des flux de fabrication, l'automatisation de mesures qui prenaient auparavant plusieurs semaines chacune, et surtout la synthèse de près de vingt ans de données de recherche cloisonnées. Zulfi Alam, vice-président corporate de Microsoft pour le quantum, résume : "Les agents IA peuvent recréer des corrélations que nous, en tant qu'humains, ne pouvons pas voir, parce qu'aucun individu n'a cette vision sur autant de données." Concrètement, la détection des états quantiques sur des fils semi-conducteurs, un processus manuel qui s'étalait sur des semaines, est désormais automatisée en continu par un agent spécialisé capable d'ajuster simultanément des centaines de paramètres de tension, là où un chercheur raisonne nécessairement de façon linéaire. La course à l'informatique quantique fiable oppose depuis des années Microsoft, Google, IBM et quelques startups comme IonQ ou PsiQuantum, chacun misant sur des architectures radicalement différentes. Microsoft a longtemps été en retrait sur les résultats concrets, pariant sur les qubits topologiques basés sur les fermions de Majorana, une approche théoriquement plus robuste mais expérimentalement très difficile à réaliser. Majorana 2 marque un tournant crédible dans cette stratégie. Mais l'enjeu dépasse le quantum : avec la mise en disponibilité générale de Microsoft Discovery pour les entreprises, incluant des agents spécialisés, un moteur de raisonnement et une gouvernance de niveau entreprise, Microsoft positionne l'IA agentique comme infrastructure centrale de la R&D industrielle. Si la preuve par la puce quantique tient ses promesses, d'autres secteurs, pharmaceutique, matériaux, énergie, pourraient rapidement adopter ce modèle où l'IA compresse les cycles expérimentaux et libère les chercheurs des tâches de mesure et de synthèse de données.

UELes entreprises européennes des secteurs pharmaceutique, des matériaux et de l'énergie peuvent désormais accéder à Microsoft Discovery en disponibilité générale pour accélérer leurs cycles de R&D.

💬 Ce qui m'intéresse dans cette annonce, c'est pas la puce, c'est ce que Discovery a rendu possible autour : 20 ans de données de recherche cloisonnées synthétisées, des mesures qui prenaient des semaines automatisées en continu par des agents. L'IA n'a pas choisi le plomb comme matériau, c'est des années de science des matériaux classique qui ont mené là. Reste à voir si ça tient hors labo, mais le pharma et l'énergie ont de bonnes raisons de regarder ça de très près.

InfrastructureOpinion
1 source
Semi-conducteurs : l'IA propulse les revenus des fonderies à un niveau record au premier trimestre 2026
2ZDNET FR 

Semi-conducteurs : l'IA propulse les revenus des fonderies à un niveau record au premier trimestre 2026

Les revenus des fonderies de semi-conducteurs ont atteint un niveau historique au premier trimestre 2026, portés par une demande en accélérateurs IA sans précédent. TSMC, le géant taïwanais qui fabrique les puces d'Apple, NVIDIA et AMD, a enregistré une hausse de ses revenus trimestriels dépassant 30 % sur un an, consolidant sa position de premier fondeur mondial. Samsung Foundry et d'autres acteurs de rang deux ont également bénéficié de cette dynamique, même si l'écart avec TSMC s'est creusé sur les noeuds les plus avancés (3 nm et 2 nm). Cette progression traduit une ruée des géants du cloud -- Microsoft, Google, Amazon, Meta -- vers les puces dédiées à l'inférence et à l'entraînement de modèles d'IA. Chaque centre de données construit pour faire tourner des LLMs représente des commandes massives de GPU et d'ASIC propriétaires, tous gravés en fonderie. Pour l'industrie, c'est une rupture de cycle : les fonderies sortent de la logique saisonnière liée aux smartphones pour entrer dans un régime de commandes structurellement plus stables et plus rentables. Ce record arrive après deux années difficiles marquées par la correction post-COVID et la chute de la demande grand public. La montée en puissance des ASIC maison chez les hyperscalers -- Google TPU, Amazon Trainium, Microsoft Maia -- diversifie les carnets de commandes au-delà de NVIDIA. La course aux capacités de production avancée s'intensifie : TSMC accélère ses usines en Arizona et au Japon, tandis que l'Europe et les Etats-Unis cherchent a reduire leur dependance a l'Asie via le CHIPS Act et son equivalent europeen.

UEL'Europe accélère son programme équivalent au CHIPS Act américain pour réduire sa dépendance aux fonderies asiatiques, mais reste très en retard sur TSMC pour la production de puces avancées à 3 nm et 2 nm.

InfrastructureOpinion
1 source
Databricks et Nvidia préparent ensemble l’avenir de l’IA agentique
3Le Big Data 

Databricks et Nvidia préparent ensemble l’avenir de l’IA agentique

Databricks et Nvidia ont annoncé lors du Data + AI Summit un renforcement significatif de leur partenariat, centré sur le déploiement industriel de l'IA agentique en entreprise. Les deux groupes intègrent désormais plus profondément leurs infrastructures matérielles et logicielles, avec un accès serverless aux GPU Nvidia A10 et H100 directement dans la plateforme Databricks via un environnement baptisé AI Runtime (AIR). Les GPU Hopper, couplés au réseau Quantum InfiniBand, prennent en charge les entraînements distribués à grande échelle, tandis que la compatibilité avec l'architecture Blackwell prépare l'accès aux prochaines générations de puissance de calcul. Databricks a également annoncé la prise en charge des GPU Nvidia dans son édition gratuite, ainsi que le support prochain des conteneurs NGC et des environnements CUDA personnalisés, permettant aux équipes d'exécuter leurs stacks spécialisées sans multiplier les couches d'infrastructure externes. Ce tournant est stratégique pour les entreprises qui ne se contentent plus d'expérimenter l'IA générative : elles cherchent à industrialiser des agents capables de raisonner, d'agir et d'interagir avec leurs données métier dans des environnements sécurisés et gouvernés. L'accès GPU dans l'édition gratuite de Databricks abaisse concrètement la barrière d'entrée pour les startups, développeurs indépendants et équipes de recherche à budgets limités, ce qui pourrait accélérer significativement l'adoption de l'IA avancée hors des grandes entreprises. La réduction de la complexité opérationnelle, en rapprochant entraînement et déploiement des données gouvernées, répond à l'un des freins majeurs identifiés dans les projets d'IA en production. Le partenariat entre Databricks et Nvidia s'inscrit dans une mutation plus profonde des architectures d'IA. Les grands modèles de langage ont jusqu'ici concentré l'attention sur les GPU pour l'inférence, mais les agents autonomes de nouvelle génération exigent bien davantage : exécution d'appels d'outils, interrogation de bases de données, coordination de plusieurs étapes de raisonnement en temps réel, interaction avec des systèmes métiers hétérogènes. C'est dans ce contexte que Nvidia met en avant Vera, son futur processeur conçu pour ces charges de travail agentiques hybrides, combinant CPU et GPU dans une même puce. Databricks, valorisé 62 milliards de dollars lors de sa dernière levée de fonds en 2024, positionne ainsi sa plateforme comme la couche d'orchestration centrale pour les entreprises qui construisent la prochaine vague d'IA, au moment où la concurrence avec Snowflake, Google et Microsoft s'intensifie sur ce segment précis du marché.

UELes entreprises européennes utilisant Databricks pour leurs projets d'IA peuvent désormais accéder directement aux GPU Nvidia au sein de la plateforme sans couches d'infrastructure supplémentaires, réduisant la complexité opérationnelle de l'industrialisation de l'IA agentique.

InfrastructureOpinion
1 source
NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents
4NVIDIA AI Blog 

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents

NVIDIA et Google Cloud ont annoncé cette semaine, lors de la conférence Google Cloud Next à Las Vegas, une nouvelle étape majeure dans leur partenariat vieux de plus de dix ans. Au cœur de l'annonce : le lancement des instances bare-metal A5X, alimentées par les systèmes rack NVIDIA Vera Rubin NVL72, qui promettent un coût d'inférence jusqu'à dix fois inférieur et un débit de tokens dix fois plus élevé par mégawatt par rapport à la génération précédente. Ces infrastructures s'appuient sur les interconnexions NVIDIA ConnectX-9 SuperNICs couplées au réseau Google Virgo de nouvelle génération, permettant de déployer des clusters allant jusqu'à 80 000 GPU Rubin sur un site unique, et jusqu'à 960 000 GPU dans une configuration multisite. Par ailleurs, Google Cloud met en préversion les modèles Gemini sur Google Distributed Cloud avec les GPU NVIDIA Blackwell et Blackwell Ultra, ainsi que des machines virtuelles confidentielles garantissant le chiffrement des données en cours d'utilisation. Des acteurs comme OpenAI et Thinking Machines Lab utilisent déjà ces infrastructures pour des charges d'inférence massives, notamment pour faire tourner ChatGPT. Ces annonces représentent un saut qualitatif significatif pour les entreprises qui cherchent à industrialiser l'IA agentique et l'IA physique, c'est-à-dire les systèmes capables d'agir de manière autonome dans des environnements réels, comme les robots ou les jumeaux numériques en usine. La réduction drastique des coûts d'inférence change concrètement l'équation économique pour les développeurs d'applications IA à grande échelle. La possibilité de déployer les modèles Gemini en environnement souverain, sur des données sensibles restant chiffrées y compris pendant leur traitement, répond à une exigence croissante des entreprises et des gouvernements en matière de conformité et de confidentialité. L'intégration de modèles ouverts NVIDIA Nemotron dans la plateforme Gemini Enterprise Agent Platform élargit également les options des équipes techniques qui souhaitent combiner modèles propriétaires et open source. Ce partenariat s'inscrit dans une compétition intense entre les grands fournisseurs de cloud pour capter les budgets d'infrastructure IA, qui se chiffrent désormais en dizaines de milliards de dollars annuellement. Google Cloud cherche à rattraper son retard sur AWS et Microsoft Azure, qui ont pris de l'avance sur l'hébergement des charges d'entraînement et d'inférence des grands modèles de langage. En s'associant étroitement à NVIDIA, dont les GPU dominent encore largement le marché de l'accélération IA, Google se positionne comme une plateforme de référence pour la prochaine vague, celle des agents autonomes et de la robotique industrielle. La feuille de route annoncée, avec la transition de Blackwell vers Vera Rubin, suggère que la cadence d'innovation s'accélère et que les entreprises devront adapter leur infrastructure régulièrement pour rester compétitives.

UELe déploiement souverain de Gemini sur Google Distributed Cloud avec chiffrement des données en cours d'utilisation répond aux exigences RGPD des entreprises européennes traitant des données sensibles.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic