Aller au contenu principal
GTC : ce qu'il faut attendre de la puce Groq de Nvidia
OutilsThe Information AI12sem· 1 min de lecture

GTC : ce qu'il faut attendre de la puce Groq de Nvidia

Source originale ↗·

La conférence annuelle GTC de Nvidia ouvre ses portes ce lundi à San Jose, en Californie, avec en point d'orgue une keynote très attendue du PDG Jensen Huang. L'annonce la plus anticipée : un nouveau système de puces combinant la technologie de Nvidia avec celle de Groq, la société indépendante de semi-conducteurs dont Nvidia a acquis la licence technologique fin 2024.

L'enjeu est considérable pour l'industrie. Il s'agit de la première fois que Nvidia intègre le processeur IA d'une autre entreprise directement dans ses racks de serveurs — une rupture nette avec la philosophie maison, qui reposait jusqu'ici quasi exclusivement sur ses propres composants et interconnexions haute vitesse.

Le deal sous-jacent à cette intégration a été conclu fin 2024 pour environ 20 milliards de $, faisant de l'accord Nvidia-Groq l'une des transactions les plus significatives du secteur des semi-conducteurs dédiés à l'IA. Les systèmes phares actuels de Nvidia s'appuient entièrement sur leurs propres puces, ce qui rend cette ouverture architecturale d'autant plus remarquable.

Cette évolution pourrait signaler un tournant stratégique pour Nvidia : plutôt que de tout concevoir en interne, le géant des GPU semble prêt à orchestrer un écosystème de partenaires matériels. La keynote de Jensen Huang demain matin sera scrutée de près pour les détails techniques et les implications commerciales de cette nouvelle architecture hybride.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Nvidia dévoile un système de puces basé sur Groq pour accélérer les tâches d'IA comme le codage
1The Information AI 

Nvidia dévoile un système de puces basé sur Groq pour accélérer les tâches d'IA comme le codage

Nvidia a dévoilé un nouveau système de serveurs IA intégrant la technologie du fabricant de puces Groq, dont la licence a été acquise l'an dernier. Annoncé par le PDG Jensen Huang, ce système vise à rendre les serveurs IA plus économes en énergie et moins coûteux pour des tâches comme la génération de code. Il s'agit de la première fois que Nvidia intègre la technologie d'une autre entreprise dans ses puces.

OutilsActu
1 source
Microsoft Build 2026 : ce qu’il faut attendre — et ce qu’il ne faut pas espérer
2Le Big Data 

Microsoft Build 2026 : ce qu’il faut attendre — et ce qu’il ne faut pas espérer

Microsoft Build 2026 ouvre ses portes les 2 et 3 juin au Fort Mason Center de San Francisco, avec un accès en ligne gratuit pour les développeurs du monde entier. Satya Nadella prendra la parole en keynote dès 9h30 heure du Pacifique. L'édition 2026 tourne résolument autour de l'IA agentique : des systèmes capables non plus seulement de répondre à des questions, mais d'agir de manière autonome sur des tâches complexes, en coordonnant plusieurs agents entre eux. Azure AI Foundry est présenté comme le socle technique de ces architectures multi-agents. GitHub Copilot devrait lui aussi franchir un cap, avec des capacités renforcées de débogage, de tests et de correction de code. Reuters signale en parallèle que Microsoft prépare de nouveaux modèles maison, dont un orienté code, pour alimenter Copilot. Côté Windows, Windows AI Foundry permettrait aux applications d'exécuter certains modèles directement sur les PC, via NPU, GPU ou CPU, sans passer par le cloud. Ces annonces dépassent largement le cercle des développeurs. Si les briques agentiques déployées sur Azure finissent intégrées dans Excel, Teams ou Outlook, elles modifieront concrètement les flux de travail de millions d'utilisateurs en entreprise. L'exécution locale des modèles via Windows AI Foundry présente des avantages tangibles : latence réduite, confidentialité améliorée et fonctionnement hors ligne. Microsoft devrait aussi détailler comment réduire les coûts et les délais du passage des prototypes IA à la production, un point de friction majeur pour les équipes qui cherchent à industrialiser ces outils. L'enjeu est de rendre ces technologies utilisables à grande échelle, pas seulement impressionnantes en démonstration. Microsoft Build 2026 s'inscrit dans une course effrénée entre les grands acteurs technologiques pour imposer leurs plateformes comme infrastructure de référence de la prochaine génération d'applications IA. Google, Amazon et Meta jouent la même partition, et chaque Build est aussi une occasion pour Microsoft de montrer que son investissement massif dans OpenAI et dans Azure se traduit en outils concrets pour les développeurs. Le Windows Agent Framework, pressenti pour transformer les agents IA en fonctionnalités système à part entière, et un Windows Agent Store avec un partage de revenus à 85% pour les éditeurs, témoignent d'une ambition claire : faire de Windows une plateforme agentique native. Ce que Build ne montrera probablement pas : du nouveau matériel Surface, un Windows 12 ou des surprises Xbox. L'événement est avant tout une vitrine pour les outils que Microsoft veut mettre dans les mains des développeurs afin de construire la prochaine vague d'applications IA, dont les effets réels se feront sentir sur les mois qui suivent.

UELes développeurs et entreprises européens utilisant Azure et GitHub Copilot seront directement impactés par les nouvelles capacités agentiques, tandis que l'exécution locale de modèles via Windows AI Foundry pourrait faciliter la conformité RGPD en réduisant les transferts de données vers le cloud.

OutilsOutil
1 source
Faut-il dire adieu à la souris ? Windows lance l’IA qui clique et tape à votre place depuis la barre des tâches grâce à Nvidia
3Frandroid 

Faut-il dire adieu à la souris ? Windows lance l’IA qui clique et tape à votre place depuis la barre des tâches grâce à Nvidia

Microsoft et NVIDIA ont annoncé conjointement OpenShell, un runtime conçu pour transformer la barre des tâches de Windows en point de lancement d'agents IA autonomes. Ces agents sont capables d'interagir directement avec les applications installées sur le PC, en cliquant, en tapant et en naviguant à la place de l'utilisateur, sans intervention humaine. Les démonstrations présentées montrent des scénarios concrets où l'IA effectue des tâches complexes dans des logiciels tiers, du traitement de fichiers à la navigation dans des interfaces graphiques. L'impact potentiel est considérable, tant pour le grand public que pour les professionnels. Un utilisateur pourrait déléguer des tâches répétitives, comme remplir des formulaires, réorganiser des fichiers ou compiler des données, en donnant simplement une instruction en langage naturel. Pour les entreprises, cela ouvre la voie à une automatisation de bureau sans code, directement intégrée au système d'exploitation, sans passer par des outils tiers comme AutoHotkey ou des plateformes RPA spécialisées. Cette annonce s'inscrit dans la course que se livrent les géants technologiques pour intégrer l'IA agentique au coeur des systèmes d'exploitation. Microsoft pousse depuis plusieurs mois sa vision Copilot+ PC, tandis que NVIDIA apporte sa puissance de traitement GPU locale pour faire tourner ces modèles sans dépendre du cloud. OpenShell représente un pas vers un PC véritablement "piloté" par l'IA, une évolution qui soulève aussi des questions sur la sécurité des accès applicatifs et le contrôle laissé à l'utilisateur.

UELes entreprises françaises et européennes pourraient accéder à une automatisation de bureau sans code directement intégrée à Windows, mais les accès applicatifs autonomes soulèvent des questions de conformité RGPD pour les données manipulées par ces agents.

OutilsOutil
1 source
GTC 2026 : avec le Groq 3 LPX, Nvidia ajoute pour la première fois du matériel d'inférence dédié à sa plateforme
4The Decoder 

GTC 2026 : avec le Groq 3 LPX, Nvidia ajoute pour la première fois du matériel d'inférence dédié à sa plateforme

Lors de la GTC 2026, Nvidia a élargi sa plateforme Vera Rubin — présentée au CES — en y ajoutant pour la première fois des puces dédiées à l'inférence (Groq 3 LPX), des racks CPU personnalisés et une nouvelle architecture de stockage. La société a également annoncé un système d'exploitation dédié à l'inférence, des alliances autour de modèles ouverts et un logiciel de sécurité pour agents IA.

UELes entreprises européennes exploitant des infrastructures Nvidia pour l'inférence IA pourront bénéficier de puces dédiées plus performantes, réduisant potentiellement les coûts et la latence des déploiements de modèles à grande échelle.

OutilsActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic