Microsoft lance Project Solara, un OS Android…

La puce quantique Majorana 2 de Microsoft illustre le rôle des agents IA dans la R&D

53

1AI News

La puce quantique Majorana 2 de Microsoft illustre le rôle des agents IA dans la R&D

Microsoft a dévoilé cette semaine le processeur quantique Majorana 2, accompagné de chiffres qui redéfinissent les standards du secteur : des qubits mille fois plus fiables que ceux de la première génération, une durée de vie moyenne de 20 secondes contre quelques microsecondes pour les puces concurrentes, et un objectif de calculateur quantique commercialement utilisable d'ici 2029. Le changement clé à l'origine de ce bond : le remplacement du matériau supraconducteur, passant de l'aluminium au plomb, une décision issue d'années de recherche conventionnelle en science des matériaux. En parallèle, Microsoft a annoncé la disponibilité générale de Microsoft Discovery, sa plateforme d'IA agentique dédiée à la R&D scientifique, dont le développement de Majorana 2 constitue la première démonstration publique d'efficacité. Ce qui rend cette annonce structurellement importante, ce n'est pas que l'IA ait conçu la puce, mais ce qu'elle a rendu possible autour de la recherche humaine. Microsoft Discovery n'a pas choisi le plomb comme matériau, mais ses agents ont pris en charge la gestion des flux de fabrication, l'automatisation de mesures qui prenaient auparavant plusieurs semaines chacune, et surtout la synthèse de près de vingt ans de données de recherche cloisonnées. Zulfi Alam, vice-président corporate de Microsoft pour le quantum, résume : "Les agents IA peuvent recréer des corrélations que nous, en tant qu'humains, ne pouvons pas voir, parce qu'aucun individu n'a cette vision sur autant de données." Concrètement, la détection des états quantiques sur des fils semi-conducteurs, un processus manuel qui s'étalait sur des semaines, est désormais automatisée en continu par un agent spécialisé capable d'ajuster simultanément des centaines de paramètres de tension, là où un chercheur raisonne nécessairement de façon linéaire. La course à l'informatique quantique fiable oppose depuis des années Microsoft, Google, IBM et quelques startups comme IonQ ou PsiQuantum, chacun misant sur des architectures radicalement différentes. Microsoft a longtemps été en retrait sur les résultats concrets, pariant sur les qubits topologiques basés sur les fermions de Majorana, une approche théoriquement plus robuste mais expérimentalement très difficile à réaliser. Majorana 2 marque un tournant crédible dans cette stratégie. Mais l'enjeu dépasse le quantum : avec la mise en disponibilité générale de Microsoft Discovery pour les entreprises, incluant des agents spécialisés, un moteur de raisonnement et une gouvernance de niveau entreprise, Microsoft positionne l'IA agentique comme infrastructure centrale de la R&D industrielle. Si la preuve par la puce quantique tient ses promesses, d'autres secteurs, pharmaceutique, matériaux, énergie, pourraient rapidement adopter ce modèle où l'IA compresse les cycles expérimentaux et libère les chercheurs des tâches de mesure et de synthèse de données.

UELes entreprises européennes des secteurs pharmaceutique, des matériaux et de l'énergie peuvent désormais accéder à Microsoft Discovery en disponibilité générale pour accélérer leurs cycles de R&D.

💬 Ce qui m'intéresse dans cette annonce, c'est pas la puce, c'est ce que Discovery a rendu possible autour : 20 ans de données de recherche cloisonnées synthétisées, des mesures qui prenaient des semaines automatisées en continu par des agents. L'IA n'a pas choisi le plomb comme matériau, c'est des années de science des matériaux classique qui ont mené là. Reste à voir si ça tient hors labo, mais le pharma et l'énergie ont de bonnes raisons de regarder ça de très près.

InfrastructureOpinion

1 source

Anthropic en négociations pour utiliser les puces IA de Microsoft

43

2The Information AI

Anthropic en négociations pour utiliser les puces IA de Microsoft

Anthropic serait en discussions avec Microsoft pour louer des serveurs équipés de puces d'intelligence artificielle conçues en interne par le géant de Redmond. Selon deux personnes ayant eu des échanges directs avec des dirigeants impliqués dans les négociations, la startup fondatrice de Claude cherche à augmenter sa capacité de calcul pour répondre à une demande croissante pour ses modèles d'IA. Aucun accord n'a encore été officialisé, mais les tractations sont en cours. Pour Microsoft, convaincre Anthropic d'adopter ses propres puces constituerait une victoire symbolique et commerciale majeure. L'effort de design de puces maison de l'entreprise a accusé des retards en 2024, compliquant sa stratégie d'indépendance vis-à-vis des fournisseurs externes. Séduire un acteur aussi visible qu'Anthropic permettrait à Microsoft de valider publiquement ses capacités matérielles et de diversifier les revenus issus de son infrastructure cloud Azure. La démarche s'inscrit dans une tendance de fond : les grands fournisseurs de cloud cherchent à réduire leur dépendance aux puces Nvidia, qui dominent aujourd'hui presque l'intégralité du marché des accélérateurs IA et dont la disponibilité reste contrainte. Google dispose déjà de ses TPU, Amazon de ses puces Trainium et Inferentia. Microsoft, en retard sur ce front, tente de combler l'écart. Anthropic, de son côté, bénéficie déjà d'investissements massifs d'Amazon et de Google, ce qui rend un partenariat avec Microsoft d'autant plus significatif sur le plan stratégique.

InfrastructureActu

1 source

Les applications d'IA à base d'agents sur AWS avec une stratégie moderne de maillage de données

43

3AWS ML Blog

Les applications d'IA à base d'agents sur AWS avec une stratégie moderne de maillage de données

Amazon Web Services a publié un guide architectural détaillé pour construire des applications d'IA agentique sur un maillage de données distribué, en réponse aux lacunes de gouvernance que les systèmes actuels de type RAG (Retrieval Augmented Generation) ne permettent pas de combler. L'architecture proposée repose sur trois composants clés : Amazon S3 Vectors pour les bases de connaissances vectorielles, qui réduit les coûts de stockage et de requête jusqu'à 90 % par rapport aux bases de données vectorielles spécialisées dans des charges de travail à fréquence modérée ; Amazon S3 Tables avec support natif d'Apache Iceberg, qui offre jusqu'à dix fois plus de transactions par seconde que les tables Iceberg auto-gérées, avec sécurité au niveau des lignes, colonnes et cellules individuelles via AWS Lake Formation ; et enfin, une exposition du maillage de données sous forme d'outils MCP (Model Context Protocol) via AgentCore Gateway, avec des intercepteurs Lambda pour un contrôle d'accès déterministe à chaque invocation. L'enjeu est considérable pour les entreprises qui déploient des agents IA en production. Contrairement aux pipelines RAG classiques, où l'agent se contente de récupérer des extraits d'un index vectoriel préexistant, les agents autonomes modernes découvrent dynamiquement des schémas de bases de données, construisent des requêtes SQL et synthétisent des données issues de sources multiples. Ce comportement expose des failles de gouvernance que le modèle à point de contrôle unique ne peut pas gérer : un agent de service client qui interroge simultanément des bases de commandes, des politiques de retour et des données clients peut contourner des restrictions d'accès si le contrôle n'est pas appliqué à chaque étape de la chaîne. L'architecture décrite impose des autorisations distinctes au niveau de la couche agent, de la passerelle, des outils et du maillage de données lui-même, sans point de défaillance unique. Ce travail s'inscrit dans une évolution plus large de l'écosystème AWS vers l'IA agentique d'entreprise. Un article précédent d'AWS avait déjà abordé le contrôle d'accès fin pour les applications RAG sur des lacs de données serverless. La nouvelle architecture l'étend en intégrant Amazon Bedrock AgentCore Runtime, un environnement d'hébergement serverless qui déploie les agents dans des microVM isolés avec isolation de session, et le framework LangGraph pour orchestrer les appels aux outils MCP. Les intercepteurs de requêtes valident les jetons JWT et appliquent les périmètres d'autorisation, tandis que les intercepteurs de réponses gèrent la rédaction des données sensibles et la journalisation d'audit. AWS Bedrock Guardrails surveille en temps réel les injections de prompts et les contenus dangereux à chaque invocation d'outil. Cette architecture cible directement les équipes data et les architectes cloud qui doivent mettre en production des agents IA tout en respectant des contraintes de conformité et de sécurité strictes.

UELes contrôles d'accès granulaires au niveau ligne/colonne/cellule et la journalisation d'audit intégrés facilitent la mise en conformité RGPD pour les entreprises européennes déployant des agents IA sur AWS.

InfrastructureActu

1 source

NVIDIA et Microsoft s'associent pour un environnement unifié de déploiement d'agents IA, des appareils Windows au cloud

52

4NVIDIA AI Blog

NVIDIA et Microsoft s'associent pour un environnement unifié de déploiement d'agents IA, des appareils Windows au cloud

NVIDIA et Microsoft ont dévoilé lors de Microsoft Build un partenariat élargi pour déployer une pile technologique unifiée dédiée à l'IA agentique, couvrant les PC Windows, le cloud Azure et les environnements locaux. Jensen Huang, fondateur et PDG de NVIDIA, est intervenu en direct depuis Taipei aux côtés de Satya Nadella pour présenter les nouvelles initiatives. Au programme : les PC RTX Spark et les stations DGX Station for Windows, l'accélération GPU de Microsoft Fabric, les modèles ouverts NVIDIA sur Microsoft Foundry, et le runtime sécurisé NVIDIA OpenShell intégré à GitHub Copilot. RTX Spark cible les laptops et petits ordinateurs de bureau avec 1 pétaflop de performance IA, jusqu'à 128 Go de mémoire unifiée et une autonomie toute la journée, avec des systèmes attendus cet automne chez Microsoft Surface, ASUS, Dell, HP, Lenovo et MSI. La DGX Station for Windows, propulsée par le superchip NVIDIA GB300 Grace Blackwell Ultra, offre jusqu'à 748 Go de mémoire cohérente et 20 pétaflops en FP4, capable de faire tourner des modèles jusqu'à 1 billion de paramètres, avec des livraisons prévues au quatrième trimestre 2026 chez ASUS, Dell, GIGABYTE, HP, MSI et Supermicro. Ce partenariat marque un tournant dans la course à l'IA agentique d'entreprise en proposant, pour la première fois, une chaîne complète allant du matériel personnel à l'infrastructure cloud. Pour les développeurs et les entreprises, cela signifie pouvoir construire, affiner et déployer des agents IA directement sur Windows sans dépendre exclusivement du cloud. Les modèles Claude d'Anthropic tournent désormais nativement sur les systèmes Blackwell Ultra dans Azure, avec une disponibilité annoncée dans les prochaines semaines. Sur Microsoft Foundry, le nouveau NVIDIA Nemotron 3 Ultra, conçu pour le raisonnement de longue durée dans des tâches de codage, de recherche et de workflows d'entreprise, est disponible dès ce mois-ci, accompagné de Nemotron 3.5 ASR pour la reconnaissance vocale et Nemotron 3.5 Content Safety pour la modération de contenu. Ce rapprochement intervient alors que l'ensemble de l'industrie cherche à concrétiser la promesse des agents IA autonomes capables d'exécuter des tâches complexes sur la durée. NVIDIA, dont les GPU sont devenus incontournables dans les data centers, étend son influence jusqu'au bureau et au PC personnel, concurrençant indirectement Apple Silicon et AMD sur le terrain de l'inférence locale. Le runtime OpenShell, sécurisé nativement, répond aux exigences de gouvernance des grandes entreprises qui hésitent encore à confier des tâches autonomes à des agents. L'intégration des bibliothèques CUDA-X comme cuDF, cuOpt et NeMo directement accessibles aux agents ouvre la voie à des workflows scientifiques plus complexes, notamment avec le modèle Cosmos 3 pour la simulation du monde physique et les modèles météo Earth-2 disponibles via Microsoft Planetary Computer Pro.

UELes entreprises européennes utilisant Azure et Windows bénéficieront d'une chaîne de déploiement IA unifiée du PC personnel au cloud, réduisant la dépendance exclusive à l'infrastructure cloud pour les workflows agentiques.

💬 Jensen Huang qui s'invite en hologramme depuis Taipei pendant le keynote de Satya, c'est le genre de mise en scène qui cache souvent un partenariat creux. Là, non : la DGX Station sous Windows avec 748 Go de mémoire cohérente et 20 pétaflops, c'est du concret pour les boîtes qui refusent de tout mettre dans Azure. Reste à voir si les prix seront accessibles à autre chose qu'aux grands comptes, mais l'idée d'une chaîne complète du laptop au datacenter sans changer de stack, ça change vraiment quelque chose pour les équipes qui font tourner des agents en prod.

InfrastructureActu

1 source

Microsoft lance Project Solara, un OS Android conçu pour les agents plutôt que les applications

À lire aussi

La puce quantique Majorana 2 de Microsoft illustre le rôle des agents IA dans la R&D

Anthropic en négociations pour utiliser les puces IA de Microsoft

Les applications d'IA à base d'agents sur AWS avec une stratégie moderne de maillage de données

NVIDIA et Microsoft s'associent pour un environnement unifié de déploiement d'agents IA, des appareils Windows au cloud