Comment Intel compte utiliser l’IA pour diviser…

Intel prépare sa riposte : un ex de Qualcomm aux commandes de l’IA et des PC

44

1Le Big Data

Intel prépare sa riposte : un ex de Qualcomm aux commandes de l’IA et des PC

Intel a annoncé le 4 mai 2026 deux nominations importantes à sa direction. Alex Katouzian, ancien vice-président exécutif de Qualcomm où il dirigeait depuis des années les activités mobiles, informatiques et de réalité étendue, rejoint Intel comme vice-président exécutif et directeur général du nouveau groupe Client Computing & Physical AI. Il rapportera directement au PDG Lip-Bu Tan. Simultaneously, Pushkar Ranade est confirmé au poste de directeur technique permanent, avec autorité sur des chantiers prospectifs aussi variés que l'informatique quantique, les technologies neuromorphiques et la photonique. Les deux hommes prennent leurs fonctions immédiatement, selon l'annonce officielle d'Intel publiée sur X le jour même. Ces nominations traduisent un repositionnement stratégique majeur pour Intel, qui cherche à redéfinir son activité PC autour de l'intelligence artificielle embarquée. Le périmètre du groupe que dirigera Katouzian va bien au-delà du PC traditionnel : il englobe la robotique, les machines autonomes et les systèmes embarqués, des marchés en forte croissance où l'IA locale devient un avantage décisif. L'objectif affiché est de transformer le PC en plateforme intelligente capable de traiter l'IA sans dépendre du cloud. Pour les fabricants de matériel, les développeurs et les entreprises industrielles, cela pourrait accélérer l'intégration de capacités IA directement dans les appareils, avec Intel comme fournisseur de puces central face à des concurrents de plus en plus agressifs. Intel traverse depuis plusieurs années une période difficile, pris en étau entre Nvidia qui domine le marché des GPU pour l'entraînement et l'inférence IA, et Qualcomm qui grignote sa part historique sur les PC avec ses puces Snapdragon X Elite. Recruter Katouzian, figure reconnue de l'écosystème Qualcomm qui a contribué à structurer le marché des smartphones et des PC connectés, est un signal offensif : Intel ne se contente plus de défendre ses positions, il vise à attaquer sur le terrain même de son ancien rival. Lip-Bu Tan, arrivé à la tête du groupe en 2025 avec un mandat de redressement, construit ainsi une équipe de direction capable de relier les produits d'aujourd'hui aux ruptures technologiques de demain. La prochaine échéance concrète sera la gamme de puces PC prévue pour 2026-2027, sur laquelle ces deux nominations auront une influence directe.

InfrastructureOpinion

1 source

30

2NVIDIA AI Blog

Repenser le coût total de l'IA : pourquoi le coût par token est la seule métrique qui compte

Les centres de données d'entreprise sont en train de vivre une mutation profonde : autrefois dédiés au stockage et au traitement de données, ils deviennent des usines à tokens, dont la production principale est l'intelligence artificielle générée à la demande. Cette transformation oblige les entreprises à repenser entièrement leur manière d'évaluer le coût total de possession (TCO) de leur infrastructure IA. Or, selon NVIDIA, la majorité des décideurs continuent de se focaliser sur des métriques obsolètes : le coût par GPU par heure ou les FLOPS par dollar, c'est-à-dire la puissance brute de calcul obtenue pour chaque dollar investi. Ces indicateurs mesurent des intrants, alors que les entreprises, elles, font tourner leur activité sur des extrants. La seule métrique qui compte réellement est le coût par million de tokens produits, soit le coût tout compris pour générer chaque unité d'intelligence délivrée à l'utilisateur final. Optimiser ce coût par token change fondamentalement l'équation économique de l'IA. Le numérateur de cette équation, le coût horaire du GPU, est visible et facile à comparer entre fournisseurs cloud ou solutions on-premise. Mais c'est le dénominateur, soit le volume de tokens effectivement délivrés par seconde, qui détermine la rentabilité réelle. Augmenter ce débit produit deux effets simultanés : il réduit le coût unitaire de chaque interaction servie, améliorant ainsi les marges, et il augmente le nombre de tokens par mégawatt consommé, ce qui permet de générer davantage de revenus à partir du même investissement infrastructurel. NVIDIA affirme proposer le coût par token le plus bas du secteur, notamment sur les modèles de raisonnement de type mixture-of-experts (MoE), qui représentent aujourd'hui la catégorie de modèles la plus largement déployée en production. Cette réévaluation des critères de choix s'inscrit dans un contexte de montée en puissance de l'IA agentique, où les systèmes autonomes enchaînent des séquences longues d'inférences, rendant le débit et la latence encore plus critiques. Des technologies comme le décodage spéculatif, la prédiction multi-token, le routage KV-aware ou encore le déchargement du cache KV permettent d'augmenter substantiellement le débit réel sans changer le matériel. La prise en charge de la précision FP4, la capacité de l'interconnexion à gérer le trafic all-to-all des modèles MoE, ou encore les optimisations de la couche de serving deviennent des critères de sélection déterminants. Pour les déploiements on-premise notamment, où l'engagement en capital sur le foncier, l'énergie et l'infrastructure est massif, maximiser l'intelligence produite par mégawatt n'est plus une option technique mais un impératif économique.

InfrastructureActu

1 source

Intel TSNC : l’incroyable IA qui va réduire le poids de vos jeux vidéo par 18

44

3Le Big Data

Intel TSNC : l’incroyable IA qui va réduire le poids de vos jeux vidéo par 18

Intel a dévoilé une nouvelle technologie baptisée TSNC, pour Texture Set Neural Compression, capable de réduire la taille des textures de jeux vidéo jusqu'à 18 fois par rapport aux formats non compressés. Concrètement, l'outil propose deux profils : une Variante A qui offre une compression jusqu'à 9x avec une perte de qualité visuelle d'environ 5 %, à peine perceptible à l'œil nu, et une Variante B qui pousse la compression à 18x au prix d'une légère dégradation entre 6 et 7 %. Plutôt que d'imposer un format propriétaire incompatible avec les outils existants, Intel a conçu TSNC pour s'intégrer naturellement dans les pipelines de production actuels, en s'appuyant sur la compression par blocs BC1 déjà standard dans l'industrie. Un réseau de neurones est entraîné sur des ensembles de textures similaires, regroupées dans un espace commun, puis un MLP à trois couches se charge de reconstruire les données au moment voulu. Cette décompression peut intervenir à l'installation, lors des temps de chargement, ou en cours de session selon les priorités du développeur. Sur l'architecture Panther Lake avec GPU intégré Arc B390, les cœurs XMX dédiés à l'IA génèrent le premier pixel en 0,194 nanoseconde, une latence pratiquement invisible pour un joueur. L'enjeu est considérable pour l'ensemble de la chaîne, des studios aux joueurs. Les jeux modernes atteignent régulièrement plusieurs dizaines de gigaoctets, une tendance directement liée à l'accumulation de textures haute résolution. Quand la VRAM sature, les performances s'effondrent brutalement. Une compression aussi agressive, sans perte visuelle notable, permettrait de réduire significativement la taille des téléchargements, d'alléger la pression sur la mémoire vidéo et d'améliorer l'expérience sur des machines d'entrée et de milieu de gamme. Intel a d'ailleurs prévu une solution de repli basée sur des instructions classiques pour les GPU plus anciens ou ceux de la concurrence, ce qui ouvre la technologie bien au-delà de son propre écosystème matériel. Cette annonce s'inscrit dans une compétition qui s'intensifie autour de la compression neuronale des textures. Nvidia travaille déjà sur sa propre technologie, baptisée NTC, tandis que Sony serait engagé sur des projets analogues en vue d'une future PlayStation 6. La pression exercée par l'explosion des tailles de jeux pousse toute l'industrie à chercher des solutions alternatives à la simple augmentation de la VRAM ou de la capacité de stockage. Intel, en adoptant une stratégie compatible avec les standards existants, cherche à faciliter l'adoption par les studios sans les forcer à revoir entièrement leurs workflows. La vraie question désormais est celle de l'intégration dans les moteurs de jeu comme Unreal ou Unity, et du calendrier auquel les premiers titres l'exploiteront concrètement.

UELes studios de jeux européens pourraient intégrer TSNC dans leurs pipelines de production pour réduire la taille des jeux et alléger la pression sur la mémoire vidéo, sous réserve d'une adoption par les moteurs Unreal et Unity.

OutilsOutil

1 source

Anthropic utilise le datacenter Colossus-1 de SpaceX et ses 220 000 GPU pour alimenter Claude

52

4The Decoder

Anthropic utilise le datacenter Colossus-1 de SpaceX et ses 220 000 GPU pour alimenter Claude

Anthropic va s'emparer de la totalité de la capacité de calcul du centre de données Colossus-1 de SpaceX, soit plus de 300 mégawatts d'électricité et plus de 220 000 GPU NVIDIA. Cette infrastructure colossale, attendue en ligne d'ici un mois, sera entièrement dédiée à alimenter les modèles Claude de la startup californienne. En parallèle, Anthropic annonce le doublement des limites de débit pour Claude Code et une augmentation significative des quotas d'API pour ses modèles Opus. Cette prise de contrôle représente un bond considérable en termes de puissance de calcul disponible pour Anthropic, directement répercuté sur les développeurs et entreprises qui utilisent ses API. Doubler les limites de Claude Code signifie concrètement que les équipes de développement pourront automatiser davantage de tâches sans se heurter aux restrictions actuelles, tandis que la hausse des quotas Opus ouvre la voie à des déploiements en production plus intensifs. C'est un signal fort envoyé aux clients enterprise qui hésitaient à migrer vers Claude en raison des contraintes de capacité. Colossus-1 a été initialement construit par xAI, la société d'intelligence artificielle d'Elon Musk, pour entraîner ses propres modèles Grok. Le fait qu'Anthropic en récupère la pleine capacité illustre la guerre d'infrastructure qui se joue en coulisse entre les grands laboratoires d'IA : disposer de suffisamment de GPU est désormais aussi stratégique que la qualité des modèles eux-mêmes. Avec ce partenariat, Anthropic consolide sa position face à OpenAI et Google DeepMind dans la course aux ressources de calcul à grande échelle.

UELes développeurs et entreprises européennes utilisant l'API Claude bénéficieront directement du doublement des quotas Claude Code et de la hausse des limites Opus, facilitant les déploiements en production à grande échelle.

💬 220 000 GPU construits par xAI pour Grok, qui finissent chez Anthropic. C'est un peu la blague de l'année, mais ça dit surtout que l'infrastructure est devenue aussi stratégique que les modèles eux-mêmes. Ce qui m'intéresse directement, c'est le doublement des limites Claude Code: les pipelines qui plafonnaient vont enfin pouvoir tourner sans jongler avec les quotas.

InfrastructureOpinion

1 source

Comment Intel compte utiliser l’IA pour diviser le poids de vos jeux PC par 18

À lire aussi

Intel prépare sa riposte : un ex de Qualcomm aux commandes de l’IA et des PC

Repenser le coût total de l'IA : pourquoi le coût par token est la seule métrique qui compte

Intel TSNC : l’incroyable IA qui va réduire le poids de vos jeux vidéo par 18

Anthropic utilise le datacenter Colossus-1 de SpaceX et ses 220 000 GPU pour alimenter Claude