Aller au contenu principal

Dossier Azure — page 2

139 articles · page 2 sur 3

Suivi des annonces IA d'Azure : services cloud, intégration des modèles OpenAI, outils pour développeurs et déploiements en entreprise.

Microsoft lance le Surface RTX Spark Dev Box pour faire tourner de grands modèles IA sans recourir au cloud
51VentureBeat AI InfrastructureOpinion

Microsoft lance le Surface RTX Spark Dev Box pour faire tourner de grands modèles IA sans recourir au cloud

Microsoft a dévoilé lundi le Surface RTX Spark Dev Box lors de la conférence Build 2026, un ordinateur de bureau compact destiné aux développeurs de logiciels qui souhaitent faire tourner de grands modèles d'intelligence artificielle en local, sans passer par le cloud. La machine embarque le nouveau processeur RTX Spark d'Nvidia, basé sur l'architecture Blackwell, et dispose de 128 gigaoctets de mémoire unifiée partagée dynamiquement entre le CPU et le GPU. Cette configuration permet d'atteindre un pétaflop de puissance de calcul IA, ce qui autorise l'exécution de modèles dépassant 120 milliards de paramètres sans envoyer la moindre requête vers un serveur distant. Pavan Davuluri, vice-président exécutif de Windows et Devices chez Microsoft, a précisé que la mémoire joue un rôle critique : à 100 000 tokens de contexte, le cache clé-valeur d'un grand modèle peut à lui seul consommer entre 40 et 50 gigaoctets, ce qui explique le choix de ce pool mémoire de 128 Go. L'appareil sera commercialisé exclusivement sur Microsoft.com aux États-Unis d'ici la fin de l'année, sans prix annoncé à ce stade. L'enjeu est directement économique. Les entreprises de toutes tailles font face à des factures cloud GPU qui s'accumulent de façon imprévisible : chaque appel d'inférence, chaque cycle de fine-tuning, chaque workflow agentique qui itère sur un modèle frontier génère des coûts qui s'emballent pour un développeur testant son prototype des dizaines de fois par jour. Andrew Hill, vice-président de Surface, a résumé la promesse dans le billet d'annonce : le Dev Box "change l'équation" en permettant aux équipes de "réserver les appels aux modèles frontier aux vrais problèmes frontier, et de traiter le reste sur leur propre matériel." La proposition n'est pas que le cloud soit dépassé, mais qu'une large partie des tâches actuellement envoyées à des datacenters distants ne justifie pas des modèles de pointe et serait mieux servie par du matériel local à coût fixe et prévisible. Ce lancement marque un tournant stratégique notable pour Microsoft, dont Azure génère plusieurs dizaines de milliards de dollars de revenus annuels. En commercialisant explicitement un appareil qui réduit la dépendance au cloud de ses propres clients, l'entreprise reconnaît une tension structurelle qui monte dans l'industrie depuis l'explosion des coûts d'inférence. Le pari de Redmond est que les développeurs qui prototypent en local déploieront ensuite sur Azure lorsqu'ils auront besoin de passer à l'échelle, et que contrôler les deux extrémités de ce cycle de développement est plus rentable que de n'en posséder qu'une. L'architecture RTX Spark, qui fusionne CPU ARM et GPU Blackwell en un seul chip avec mémoire unifiée, remplace quatre composants distincts d'un PC classique et ouvre la voie à une nouvelle génération de postes de travail IA autonomes.

1 source
Nouveaux modèles d’IA, Windows repensé… Microsoft prépare du lourd pour Build 2026
52Le Big Data 

Nouveaux modèles d’IA, Windows repensé… Microsoft prépare du lourd pour Build 2026

Microsoft tiendra sa conférence annuelle Build 2026 dans les prochaines semaines, et les premières fuites dessinent un programme particulièrement dense. L'entreprise préparerait le lancement d'un nouveau modèle de raisonnement développé en interne par Microsoft AI, distinct des modèles génératifs classiques : conçu pour analyser les problèmes complexes, il produirait des réponses plus structurées et plus fiables sur des tâches de logique ou de planification. Copilot, l'assistant omnipresent de Microsoft, devrait lui aussi évoluer vers une version plus ambitieuse, décrite en interne comme une "super application" consolidant l'ensemble des services de l'écosystème Microsoft dans une interface unique. Côté Windows 11, plusieurs nouveautés sont attendues : amélioration des performances, réécriture de composants système pour gagner en réactivité, et une expérience dédiée aux développeurs avec des outils préinstallés, des scripts prêts à l'emploi et un environnement simplifié dès le démarrage. Ces annonces interviennent à un moment charnière pour Microsoft. La firme de Redmond a massivement investi dans l'IA depuis son partenariat avec OpenAI, mais doit maintenant prouver que ces investissements se traduisent en produits concrets et différenciants. Le nouveau modèle de raisonnement signalerait une volonté de ne plus dépendre uniquement des modèles OpenAI, en développant ses propres capacités maison. L'évolution de Copilot en point d'entrée universel de l'écosystème Microsoft représente un enjeu commercial majeur : si l'assistant devient la porte d'accès à Microsoft 365, Azure, Teams et Windows, c'est toute la fidélisation client qui se joue à travers lui. Pour les développeurs, une expérience Windows rationalisée peut réduire les frictions d'installation et de configuration, un argument de poids face à la popularité persistante de Linux et macOS dans ce segment. Build est historiquement la conférence où Microsoft trace sa feuille de route technique pour les douze mois suivants, et cette édition 2026 s'inscrit dans une compétition exacerbée avec Google, Apple et les acteurs purement IA comme Anthropic ou xAI. Microsoft doit également préparer Windows à la nouvelle génération de puces spécialisées pour l'IA, les NPU intégrés aux processeurs ARM et x86 récents, qui permettent d'exécuter des modèles localement sans passer par le cloud. La capacité du système à tirer parti de ce matériel sera déterminante pour les usages IA embarqués. Si les annonces tiennent leurs promesses, Build 2026 pourrait marquer un tournant réel pour Windows, qui n'a pas connu de refonte en profondeur depuis le passage à Windows 11 en 2021, les développeurs, eux, attendent des démonstrations avant de se laisser convaincre.

UELes entreprises européennes sous Microsoft 365 et Windows seraient directement concernées par l'intégration de capacités IA locales via NPU et l'évolution de Copilot en point d'entrée universel de l'écosystème.

LLMsOpinion
1 source
Microsoft Build 2026 : ce qu’il faut attendre — et ce qu’il ne faut pas espérer
53Le Big Data 

Microsoft Build 2026 : ce qu’il faut attendre — et ce qu’il ne faut pas espérer

Microsoft Build 2026 ouvre ses portes les 2 et 3 juin au Fort Mason Center de San Francisco, avec un accès en ligne gratuit pour les développeurs du monde entier. Satya Nadella prendra la parole en keynote dès 9h30 heure du Pacifique. L'édition 2026 tourne résolument autour de l'IA agentique : des systèmes capables non plus seulement de répondre à des questions, mais d'agir de manière autonome sur des tâches complexes, en coordonnant plusieurs agents entre eux. Azure AI Foundry est présenté comme le socle technique de ces architectures multi-agents. GitHub Copilot devrait lui aussi franchir un cap, avec des capacités renforcées de débogage, de tests et de correction de code. Reuters signale en parallèle que Microsoft prépare de nouveaux modèles maison, dont un orienté code, pour alimenter Copilot. Côté Windows, Windows AI Foundry permettrait aux applications d'exécuter certains modèles directement sur les PC, via NPU, GPU ou CPU, sans passer par le cloud. Ces annonces dépassent largement le cercle des développeurs. Si les briques agentiques déployées sur Azure finissent intégrées dans Excel, Teams ou Outlook, elles modifieront concrètement les flux de travail de millions d'utilisateurs en entreprise. L'exécution locale des modèles via Windows AI Foundry présente des avantages tangibles : latence réduite, confidentialité améliorée et fonctionnement hors ligne. Microsoft devrait aussi détailler comment réduire les coûts et les délais du passage des prototypes IA à la production, un point de friction majeur pour les équipes qui cherchent à industrialiser ces outils. L'enjeu est de rendre ces technologies utilisables à grande échelle, pas seulement impressionnantes en démonstration. Microsoft Build 2026 s'inscrit dans une course effrénée entre les grands acteurs technologiques pour imposer leurs plateformes comme infrastructure de référence de la prochaine génération d'applications IA. Google, Amazon et Meta jouent la même partition, et chaque Build est aussi une occasion pour Microsoft de montrer que son investissement massif dans OpenAI et dans Azure se traduit en outils concrets pour les développeurs. Le Windows Agent Framework, pressenti pour transformer les agents IA en fonctionnalités système à part entière, et un Windows Agent Store avec un partage de revenus à 85% pour les éditeurs, témoignent d'une ambition claire : faire de Windows une plateforme agentique native. Ce que Build ne montrera probablement pas : du nouveau matériel Surface, un Windows 12 ou des surprises Xbox. L'événement est avant tout une vitrine pour les outils que Microsoft veut mettre dans les mains des développeurs afin de construire la prochaine vague d'applications IA, dont les effets réels se feront sentir sur les mois qui suivent.

UELes développeurs et entreprises européens utilisant Azure et GitHub Copilot seront directement impactés par les nouvelles capacités agentiques, tandis que l'exécution locale de modèles via Windows AI Foundry pourrait faciliter la conformité RGPD en réduisant les transferts de données vers le cloud.

OutilsOutil
1 source
Une implémentation du Microsoft Agent Governance Toolkit pour un usage sécurisé des outils d'agents IA : politiques, validations, journaux d'audit et contrôles des risques
54MarkTechPost 

Une implémentation du Microsoft Agent Governance Toolkit pour un usage sécurisé des outils d'agents IA : politiques, validations, journaux d'audit et contrôles des risques

Microsoft a publié le Agent Governance Toolkit, un cadre de référence permettant de contrôler et d'auditer les actions des agents IA avant leur exécution. Un tutoriel d'implémentation, conçu pour fonctionner directement dans Google Colab, illustre concrètement son fonctionnement : les agents ne peuvent pas exécuter directement leurs outils. Chaque action est d'abord soumise à une couche de gouvernance qui vérifie l'identité de l'agent, son score de confiance, le niveau de risque de l'opération, la sensibilité des données concernées et les règles de politique applicables. Le système repose sur des fichiers de configuration YAML définissant des règles précises : blocage des opérations destructrices en base de données (suppression ou vidage de tables), approbation humaine obligatoire pour l'envoi d'e-mails vers des destinataires externes, exécution en bac à sable des commandes shell avec filtrage de termes dangereux comme rm -rf ou chmod 777, et refus d'accès aux données sensibles pour les agents dont le score de confiance est inférieur à 0,65. Le toolkit génère également des journaux d'audit infalsifiables, permet d'activer un coupe-circuit global et offre une visualisation graphique des relations entre agents, outils, règles et résultats. Cette architecture répond à un problème croissant dans le déploiement des agents IA : l'agentivité excessive. À mesure que ces systèmes deviennent capables d'enchaîner des actions autonomes, qu'il s'agisse d'écrire dans des bases de données, d'envoyer des e-mails ou d'exécuter du code, le risque qu'ils accomplissent des opérations non souhaitées ou dommageables augmente considérablement. Le toolkit propose un modèle où chaque action peut être autorisée, refusée, mise en sandbox ou redirigée vers un processus d'approbation humaine, selon des critères déterministes et traçables. Les règles s'appuient sur la taxonomie de risques de l'OWASP pour les agents IA, notamment les catégories « Tool misuse », « Goal hijacking » et « Unauthorized action », apportant un cadre de conformité reconnu aux équipes de sécurité. La publication de ce toolkit s'inscrit dans un mouvement plus large de l'industrie pour encadrer les agents autonomes, dont la prolifération s'est accélérée depuis 2024 avec l'essor de frameworks comme LangChain, AutoGen (lui aussi développé par Microsoft) et les API d'agents d'OpenAI et Anthropic. Microsoft, qui a massivement investi dans l'IA via son partenariat avec OpenAI et l'intégration dans Azure et Copilot, se positionne ainsi comme acteur de référence sur la gouvernance de ces systèmes. Le fait que l'implémentation soit reproductible dans un notebook Colab, sans infrastructure complexe, signale une volonté claire de démocratiser ces pratiques au-delà des grandes entreprises. Les étapes naturelles incluent l'intégration de ce type de couche dans les plateformes d'orchestration existantes et l'adoption de standards communs pour l'audit des décisions IA.

UELa taxonomie de risques OWASP intégrée au toolkit s'aligne directement avec les exigences de traçabilité et de supervision humaine de l'AI Act européen, facilitant la conformité des équipes qui déploient des agents IA autonomes.

SécuritéTuto
1 source
Claude Opus 4.8 est désormais disponible sur AWS
55AWS ML Blog 

Claude Opus 4.8 est désormais disponible sur AWS

Anthropic a annoncé la disponibilité de Claude Opus 4.8, son modèle le plus avancé de la gamme Opus, sur Amazon Bedrock et sur la Claude Platform déployée sur AWS. Ce lancement permet aux équipes de développement d'intégrer le modèle directement dans leurs environnements AWS existants, tout en bénéficiant des garanties de sécurité entreprise, de résidence régionale des données et de la scalabilité d'infrastructure propres à Amazon. Pour les cas d'usage ne nécessitant pas de résidence régionale, le modèle est également accessible via la plateforme native d'Anthropic hébergée sur AWS. Techniquement, l'accès se fait via le SDK Anthropic avec l'identifiant de modèle us.anthropic.claude-opus-4-8, ou via les API Invoke et Converse d'Amazon Bedrock. Ce qui distingue Opus 4.8 de ses prédécesseurs, c'est sa capacité à maintenir un plan d'action sur plusieurs étapes successives, à suivre ce qui a été accompli et ce qui reste à faire, et surtout à se recorriger lorsqu'un blocage survient plutôt que de simplement s'arrêter sur une erreur. Pour les équipes qui automatisent des tâches longues et complexes, cette stabilité se traduit concrètement par moins de variance dans les sorties, moins de cycles de révision manuelle, et une supervision réduite des pipelines en production. En développement logiciel, le modèle est conçu pour naviguer dans de vraies bases de code, planifier avant d'éditer, et conserver le contexte sur des sessions prolongées. Les cas d'usage industriels ciblés incluent la recherche d'investissement et l'analyse de résultats financiers, la rédaction de contrats et de mémoires juridiques, la synthèse de littérature scientifique et de soumissions réglementaires en sciences du vivant, ainsi que l'analyse de menaces et la réponse à incident en cybersécurité. Ce lancement s'inscrit dans une stratégie de partenariat approfondi entre Anthropic et AWS, qui s'est notamment matérialisée par un investissement d'Amazon pouvant atteindre quatre milliards de dollars dans Anthropic. La disponibilité sur Bedrock est stratégique pour Anthropic, qui cherche à s'imposer comme fournisseur de référence pour les déploiements en entreprise, face à la concurrence directe d'OpenAI via Azure et de Google DeepMind via Vertex AI. Opus 4.8 représente le haut de gamme de la nouvelle génération Claude 4, une famille de modèles qui comprend également Sonnet 4.6 et Haiku 4.5, chacun positionné sur un équilibre différent entre performance et coût d'inférence. La prochaine étape pour Anthropic sera probablement d'élargir la disponibilité régionale du modèle sur Bedrock, et d'affiner ses capacités dans les domaines où la régulation de l'IA évolue rapidement.

UELes entreprises européennes peuvent déployer Claude Opus 4.8 sur Amazon Bedrock avec résidence régionale des données, facilitant la conformité RGPD pour les cas d'usage en production.

LLMsActu
1 source
META découvre à son tour l’économie du compute
56FrenchWeb 

META découvre à son tour l’économie du compute

Meta Platforms envisage de commercialiser une partie de sa gigantesque infrastructure informatique, une rupture stratégique majeure pour l'entreprise fondée par Mark Zuckerberg. Depuis plus de quinze ans, le groupe utilisait ses data centers exclusivement en interne pour faire fonctionner Facebook, Instagram et WhatsApp, sans jamais vendre de capacités cloud à des tiers. L'explosion des besoins en intelligence artificielle change la donne : Meta disposerait désormais d'une surcapacité de compute suffisante pour envisager une offre commerciale externe. Ce pivot potentiel placerait Meta en concurrence directe avec Amazon Web Services, Microsoft Azure et Google Cloud, les trois géants qui dominent aujourd'hui le marché mondial du cloud, estimé à plusieurs centaines de milliards de dollars. Pour les entreprises qui développent des modèles d'IA, une quatrième alternative crédible serait une opportunité de diversification et de pression à la baisse sur les prix. Meta apporterait une infrastructure taillée pour les workloads IA les plus exigeants, notamment grâce à ses clusters de GPU massivement parallèles. Cette évolution s'inscrit dans une logique que l'histoire de la tech a déjà validée : AWS est né des excédents d'infrastructure d'Amazon, et est devenu sa division la plus rentable. Meta, qui investit des dizaines de milliards de dollars par an en capital expenditure, cherche à rentabiliser ces actifs autrement que par la seule publicité. La question reste de savoir si le groupe possède la culture commerciale B2B nécessaire pour rivaliser avec des acteurs qui ont dix à vingt ans d'avance sur ce marché.

UESi Meta lance une offre cloud commerciale, les entreprises et startups européennes disposeraient d'un quatrième fournisseur d'infrastructure IA majeur, renforçant leur capacité de négociation et potentiellement réduisant leurs coûts de compute.

💬 L'histoire AWS, Meta l'a visiblement relue attentivement. Quand tu as des clusters GPU calibrés pour entraîner des modèles à l'échelle de Facebook et Instagram, laisser ça tourner à vide serait absurde. Reste à voir si Zuckerberg a les équipes commerciales B2B pour vendre ça aux DSI, parce qu'entre avoir l'infra et savoir la packager pour des clients enterprise, il y a un vrai fossé de culture.

InfrastructureOpinion
1 source
Merck et Mastercard obtiennent des résultats concrets avec les agents IA : l'infrastructure d'abord
57VentureBeat AI 

Merck et Mastercard obtiennent des résultats concrets avec les agents IA : l'infrastructure d'abord

Merck accélère sa recherche médicamenteuse d'un tiers et produit ses supports marketing conformes 70 à 80 % plus vite grâce à des agents d'intelligence artificielle, selon Sean Finnerty, vice-président des plateformes digitales du groupe pharmaceutique américain, qui s'exprimait lors d'un récent événement AI Impact Series. Concrètement, les brouillons de campagnes marketing générés par l'IA sont conformes à la réglementation à 99 %, réduisant les cycles de révision de plusieurs mois à quelques jours. En recherche scientifique, un cycle de découverte médicamenteuse a été raccourci d'un tiers, soit environ un an gagné avant qu'un traitement n'atteigne les patients. Derrière ces résultats, une infrastructure imposante : 2 500 comptes AWS, de nombreux abonnements Microsoft Azure, des intégrations Google Cloud Platform, 47 sites périphériques et des centaines de bases de données stockant plusieurs pétaoctets de données structurées et non structurées, répartis entre Oracle, SQL, Excel, transcriptions téléphoniques et autres dépôts. Ces gains ne sont pas tombés du ciel. Finnerty insiste sur un principe qu'il nomme la stratégie "plomberie d'abord" : avant de déployer des agents, il faut bâtir l'infrastructure qui les rend fiables, sécurisés et interopérables. Sans cela, chaque projet isolé devient une dette technique. Pour Merck, l'enjeu est particulièrement fort dans le domaine réglementaire : une campagne vaccinale dans l'État de Géorgie répond à des règles différentes de celle lancée au Canada, et la moindre erreur peut avoir des conséquences légales. L'IA prend désormais en charge les premières ébauches, là où des équipes humaines effectuaient auparavant de longues boucles de validation, libérant du temps pour des tâches à plus forte valeur ajoutée. La leçon tirée par Merck s'appuie directement sur l'expérience du passage au cloud dans les années 2010, une période que Finnerty décrit comme chaotique, mais dont les entreprises qui ont correctement posé les bases ont finalement tiré le meilleur parti. Le groupe s'appuie aujourd'hui sur plusieurs solutions en parallèle, Databricks, Amazon Redshift et d'autres, car "il n'existe pas de solution unique pour résoudre chaque problème". L'objectif affiché est d'intégrer ces couches d'infrastructure aux protocoles émergents comme MCP (Model Context Protocol) et A2A (Agent2Agent), pour permettre aux agents de fonctionner de façon fluide quelle que soit la plateforme cloud sous-jacente. Avec des milliers d'agents à venir selon Finnerty, la question de leur enregistrement, de leur sécurisation et de leur accès aux bonnes données devient un enjeu stratégique autant que technique.

UELes entreprises pharmaceutiques et financières européennes, soumises à des réglementations strictes similaires, peuvent s'inspirer de cette approche 'infrastructure d'abord' pour sécuriser leurs déploiements d'agents IA à grande échelle.

InfrastructureOpinion
1 source
Microsoft ouvre un nouveau front dans le débat sur les données pour les agents IA
58The Information AI 

Microsoft ouvre un nouveau front dans le débat sur les données pour les agents IA

Microsoft a durci sa position face à Databricks en bloquant l'accès de ce partenaire de longue date à Power BI, son outil phare d'analyse et de visualisation de données. Début mars, Databricks avait commencé à tester une nouvelle fonctionnalité permettant à ses clients de connecter facilement leurs données hébergées sur sa plateforme à des outils de visualisation tiers, dont Power BI. Microsoft a réagi en fermant cette intégration, protégeant ainsi un produit utilisé par la quasi-totalité des entreprises du Fortune 500 pour piloter leurs opérations via tableaux de bord et graphiques. Cette décision illustre une tension croissante autour du contrôle des flux de données dans l'écosystème des agents IA. Power BI n'est plus seulement un outil de reporting : il devient une porte d'entrée stratégique vers les données d'entreprise que les agents IA exploitent pour automatiser des décisions. En bloquant Databricks, Microsoft cherche à s'assurer que ces flux restent dans son propre écosystème, renforçant l'attrait de ses solutions Fabric et Azure pour les entreprises qui déploient des agents. Ce bras de fer s'inscrit dans une recomposition plus large du marché des données d'entreprise, où Databricks, valorisé à plus de 62 milliards de dollars, concurrence directement Microsoft sur le terrain du traitement analytique et de l'IA. La relation entre les deux entreprises, autrefois complémentaire, se transforme en rivalité frontale à mesure que l'IA agentique redéfinit la valeur des couches données. D'autres partenaires de Microsoft pourraient se trouver dans la même situation si leurs outils empiètent sur des territoires que Redmond considère comme stratégiques.

UELes entreprises européennes utilisant conjointement Power BI et Databricks devront évaluer les risques de verrouillage dans l'écosystème Microsoft pour leurs déploiements d'agents IA.

💬 C'est le jeu classique de la plateforme qui ferme ses portes dès que les enjeux deviennent vraiment sérieux. Microsoft ne bloque pas Databricks parce que ça les gêne aujourd'hui, il bloque parce que Power BI est en train de devenir le point de passage obligatoire pour tout agent IA qui veut lire les données de ton entreprise. À 62 milliards de valorisation, Databricks n'est plus un partenaire à ménager.

BusinessOpinion
1 source
Microsoft et EY investissent 1 milliard de dollars pour accélérer l’industrialisation de l’IA
59Le Big Data 

Microsoft et EY investissent 1 milliard de dollars pour accélérer l’industrialisation de l’IA

Microsoft et EY ont annoncé le 21 mai 2026 un partenariat stratégique d'un milliard de dollars sur cinq ans pour accélérer le déploiement industriel de l'intelligence artificielle dans les grandes entreprises. L'initiative prévoit la constitution d'équipes mixtes, composées d'ingénieurs Microsoft et de consultants sectoriels EY, chargées d'accompagner les organisations dans l'intégration de l'IA au coeur de leurs opérations critiques. Les secteurs ciblés en priorité sont les services financiers, l'industrie, l'énergie, la santé, le secteur public, la distribution et les biens de consommation. EY a déjà généralisé Microsoft 365 E7 à plus de 400 000 collaborateurs dans le monde, après avoir déployé Copilot auprès de 150 000 employés avec un gain de productivité estimé à 15 %. Dans la finance, l'usage de Microsoft Power Platform et Copilot Studio aurait réduit certains délais opérationnels de 95 % et les coûts de plus de 37 %. EY a par ailleurs intégré un système multi-agents basé sur Azure, Microsoft Foundry et Microsoft Fabric dans sa plateforme d'audit EY Canvas, couvrant déjà 130 000 professionnels sur 160 000 missions. Ce partenariat répond à un blocage structurel que rencontrent aujourd'hui la plupart des grands groupes : passer des expérimentations isolées à un déploiement IA à l'échelle de l'entreprise. La majorité des organisations accumulent des pilotes sans parvenir à les industrialiser, faute de gouvernance adaptée, de formation des collaborateurs et de processus internes reconfigurés. En ciblant précisément les secteurs où l'automatisation et l'analyse de données produisent des impacts financiers rapides et mesurables, Microsoft et EY cherchent à répondre à l'exigence croissante de retour sur investissement concret que posent les directions générales avant tout nouvel engagement budgétaire dans l'IA. EY joue dans cette alliance la carte du "Client Zéro" : le cabinet teste les technologies Microsoft sur ses propres opérations avant de les proposer à ses clients, ce qui lui confère un avantage crédible dans un marché saturé de promesses non vérifiées. Ce positionnement intervient dans un contexte de compétition intense entre les grands cabinets de conseil et les éditeurs technologiques pour capter les budgets de transformation IA des entreprises du Fortune 500. Microsoft, de son côté, consolide son écosystème Azure et Copilot comme infrastructure de référence pour l'entreprise, face à la concurrence de Google Cloud et AWS. La suite dépendra de la capacité des deux groupes à démontrer des résultats reproductibles et auditables, condition sine qua non pour convaincre les directions financières d'accélérer leurs investissements au-delà des phases pilotes.

UELes grandes entreprises françaises et européennes des secteurs financier, énergétique, de la santé et du secteur public sont directement ciblées par ce programme d'industrialisation IA, susceptible d'accélérer les transformations numériques dans l'UE.

💬 Le problème qu'ils attaquent, l'industrialisation après les pilotes, c'est le vrai blocage de l'IA en entreprise depuis deux ans. EY qui joue le Client Zéro sur 400 000 collaborateurs, c'est l'argument le plus solide qu'un cabinet peut sortir face aux DG qui ont avalé trop de PowerPoints. Les 95% de réduction de délais affichés, bon, sur le papier ça claque, mais ça va être une autre histoire à reproduire sans EY dans la boucle.

BusinessOpinion
1 source
Créer des agents multi-locataires avec Amazon Bedrock AgentCore
60AWS ML Blog 

Créer des agents multi-locataires avec Amazon Bedrock AgentCore

Amazon a lancé Bedrock AgentCore, un service managé et serverless conçu pour permettre aux éditeurs de logiciels SaaS de déployer des applications agentiques en environnement multi-tenant sur AWS. Le service offre des primitives pour héberger des agents et des serveurs MCP (Model Context Protocol), avec une gestion intégrée des identités, de la mémoire, de l'observabilité et des évaluations. Le coeur de son architecture repose sur des microVMs isolées par session: chaque session client obtient son propre environnement d'exécution éphémère, avec un système de fichiers persistant propre, sans le coût ni la latence d'une machine virtuelle complète. Le contexte du tenant transite via des en-têtes HTTP personnalisés, portant l'identifiant du tenant, son niveau de service, ses préférences régionales et ses droits d'accès aux outils, ce qui permet à l'agent d'adapter dynamiquement son comportement sans logique de routage codée en dur. Cette approche répond directement au fossé qui sépare un prototype fonctionnel d'un déploiement en production dans un contexte SaaS. Les architectes d'applications agentiques devaient jusqu'ici résoudre manuellement six problèmes distincts: l'isolation des tenants, la propagation de leur identité, l'observabilité par tenant, l'isolation des données, l'attribution des coûts et la mitigation du "noisy neighbor" (un tenant monopolisant les ressources au détriment des autres). AgentCore propose trois patterns d'isolation, appelés Silo, Pool et Bridge, chacun offrant un compromis différent entre protection stricte et mutualisation des coûts. Pour les éditeurs gérant des centaines ou des milliers de clients sur une même plateforme, cette capacité à choisir un modèle d'isolation par segment tarifaire change concrètement l'équation économique et de conformité. Le lancement s'inscrit dans une course des grands fournisseurs cloud à imposer leurs infrastructures agentiques comme standard de facto pour la prochaine génération d'applications IA. AWS fait face à la concurrence directe de Google avec Vertex AI Agent Builder et de Microsoft avec Azure AI Agent Service, tous trois cherchant à capter les équipes d'ingénierie qui passent de l'expérimentation à la production. L'article publié par AWS est le premier d'une série, ce qui suggère que d'autres composants d'AgentCore (évaluation, fine-tuning par tenant, facturation granulaire) seront détaillés dans les prochaines semaines. La question centrale pour les équipes SaaS reste le degré de lock-in accepté en échange de la simplicité opérationnelle qu'offre un service pleinement managé.

UELes éditeurs SaaS européens construisant sur AWS peuvent exploiter les patterns d'isolation et les préférences régionales d'AgentCore pour satisfaire les exigences de résidence des données imposées par le RGPD.

OutilsOpinion
1 source
Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI
61Le Big Data 

Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI

Anthropic s'apprête à verser jusqu'à 1,25 milliard de dollars par mois à xAI, la société d'intelligence artificielle d'Elon Musk, pour accéder à sa puissance de calcul. L'accord, révélé dans un dépôt S-1 de SpaceX auprès de la SEC, porte sur l'achat de la totalité de la production du centre de données Colossus 1, situé près de Memphis, dans le Tennessee. Le contrat court jusqu'en mai 2029 et pourrait représenter jusqu'à 45 milliards de dollars de revenus cumulés pour xAI, les deux parties conservant toutefois une option de résiliation avec un préavis de 90 jours. L'accord fait suite à une première annonce, quelques semaines plus tôt, selon laquelle Anthropic avait sécurisé 300 mégawatts de capacité de calcul auprès de xAI, une décision déjà jugée surprenante par le marché. Pour Anthropic, l'accès garanti à des milliers de GPU sur plusieurs années répond à une contrainte structurelle : les modèles génératifs de nouvelle génération exigent des volumes de calcul massifs, aussi bien pour l'entraînement que pour l'inférence et les usages professionnels en temps réel. Alors que la demande des entreprises s'emballe plus vite que l'offre mondiale en puces avancées, verrouiller plusieurs années de capacité permet au créateur de Claude de réduire sa dépendance aux grands fournisseurs cloud traditionnels, Amazon Web Services, Microsoft Azure et Google Cloud. L'accord réduit également le risque de goulots d'étranglement à mesure qu'Anthropic étend ses déploiements dans les produits et workflows d'entreprises. Pour xAI, en revanche, ce contrat s'inscrit dans une stratégie de monétisation agressive de sa capacité excédentaire. Selon les documents de SpaceX, l'accord permet de rentabiliser des serveurs sous-utilisés, une situation qui coïncide avec un ralentissement rapporté de l'usage de Grok, l'assistant IA de xAI, ces derniers mois. Ce modèle positionne xAI dans la catégorie des "néoclouds" : des acteurs qui construisent d'abord une infrastructure pour leurs propres modèles, puis revendent la capacité disponible à d'autres entreprises du secteur, accélérant ainsi l'amortissement des coûts colossaux liés aux GPU Nvidia et aux centres de données énergivores. Paradoxalement, la transaction illustre aussi une évolution du marché : deux concurrents directs sur le segment des modèles génératifs coopèrent désormais sur l'infrastructure, signe que les investissements nécessaires à la course à l'IA dépassent ce que même les leaders du secteur peuvent absorber seuls.

InfrastructureOpinion
1 source
Amazon SageMaker AI prend en charge l'API compatible OpenAI
62AWS ML Blog 

Amazon SageMaker AI prend en charge l'API compatible OpenAI

Amazon a annoncé ce mois-ci que SageMaker AI supporte désormais une API compatible avec celle d'OpenAI pour ses endpoints d'inférence en temps réel. Concrètement, les développeurs qui utilisent le SDK OpenAI, LangChain ou le framework Strands Agents peuvent désormais router leurs appels vers des modèles hébergés sur SageMaker AI en changeant uniquement l'URL de l'endpoint. Plus besoin de client personnalisé, de wrapper SigV4, ni de réécriture de code. Les endpoints SageMaker exposent un chemin /openai/v1 qui accepte les requêtes au format Chat Completions et renvoie les réponses du conteneur telles quelles, y compris en streaming. L'authentification repose sur des tokens bearer à durée limitée (jusqu'à 12 heures), générés à partir des credentials AWS existants via le SDK Python SageMaker, sans clé API supplémentaire. Ce changement simplifie radicalement l'intégration de SageMaker dans les stacks d'IA existantes. Pour les équipes qui orchestrent des agents multi-LLM via une gateway (comme Bifrost, mentionnée par Giorgio Piatti, ingénieur ML chez Caffeine.AI), SageMaker devient un fournisseur interchangeable sans adaptation technique. Les cas d'usage sont nombreux : workflows agentiques tournant entièrement sur de l'infrastructure dédiée en compte AWS, hébergement multi-modèles sur un seul endpoint via les inference components (par exemple Llama pour les tâches générales, un Mistral fine-tuné pour un domaine métier, et un petit modèle de classification), ou encore déploiement de modèles open source fine-tunés sans toucher au code applicatif existant. Pour les entreprises soumises à des contraintes de souveraineté des données ou de conformité, c'est un gain concret : elles peuvent utiliser les mêmes frameworks standardisés OpenAI tout en gardant les modèles dans leur propre compte AWS. Cette annonce s'inscrit dans une bataille plus large pour capter les workloads d'inférence IA en entreprise. Le standard OpenAI s'est imposé de facto comme protocole universel pour les LLMs, et les grands fournisseurs cloud (AWS, Google, Azure) cherchent à réduire les frictions pour attirer des équipes déjà investies dans cet écosystème. Amazon avait déjà investi massivement dans Bedrock et SageMaker, mais l'adoption restait freinée par les incompatibilités d'API qui forçaient les migrations de code. En adoptant la compatibilité OpenAI directement au niveau de SageMaker AI, AWS ferme cet écart et concurrence frontalement des solutions comme Azure OpenAI Service ou les endpoints Vertex AI de Google. Le notebook d'exemple avec Qwen3-4B (modèle d'Alibaba disponible sur Hugging Face) illustre aussi l'ouverture vers les modèles open source, un segment en forte croissance face aux modèles propriétaires.

UELes entreprises européennes soumises aux contraintes RGPD et de souveraineté des données peuvent désormais utiliser les frameworks OpenAI standard tout en maintenant leurs modèles dans leur propre infrastructure AWS hébergée en région européenne.

💬 C'est le genre de truc qui semble anodin et qui change tout en pratique. Changer juste l'URL pour basculer d'OpenAI vers SageMaker, sans toucher au code, c'est exactement ce que les équipes enterprise attendaient pour switcher sans se battre avec leur DSI. Bon, ça reste AWS, donc la facture peut vite grimper, mais pour les boîtes avec des contraintes de souveraineté data, l'argument est solide.

OutilsOpinion
1 source
AION : la gigafactory IA d'Orange, EDF et Capgemini
63FrenchWeb 

AION : la gigafactory IA d'Orange, EDF et Capgemini

Ardian, Orange, EDF, Capgemini, Artefact, Bull, le Groupe iliad et Scaleway ont annoncé leur regroupement au sein du consortium AION pour déposer une candidature française au programme européen des AI Gigafactories. Cette initiative, portée par la Commission européenne dans le cadre de son agenda pour la souveraineté numérique, vise à financer la construction de centres de calcul massifs dédiés à l'intelligence artificielle sur le sol européen. L'alliance réunit ainsi des acteurs complémentaires : un fonds d'investissement de premier plan, deux géants de l'énergie et des télécoms, un intégrateur IT mondial et plusieurs spécialistes du cloud français. L'enjeu est considérable pour l'écosystème européen de l'IA. L'Europe accuse un retard structurel face aux États-Unis et à la Chine en matière de puissance de calcul disponible pour entraîner et faire tourner des grands modèles de langage. Une gigafactory labellisée par Bruxelles permettrait de concentrer des milliers de GPU sur un même site, d'en garantir l'accès à des startups et laboratoires de recherche européens à des conditions compétitives, et de réduire la dépendance aux infrastructures américaines comme AWS ou Azure. Le programme AI Gigafactories s'inscrit dans le plan InvestAI annoncé par la Commission européenne début 2025, qui ambitionne de mobiliser 200 milliards d'euros pour rattraper le retard du continent. Plusieurs États membres ont déjà soumis des candidatures, et la France entend peser dans cette compétition en fédérant ses acteurs industriels et technologiques les plus solides. Le choix des lauréats par Bruxelles déterminera quels pays accueilleront les prochains piliers de l'infrastructure IA continentale.

UELe consortium AION réunit Orange, EDF, Capgemini, iliad et Scaleway pour candidater au programme européen des AI Gigafactories, ce qui pourrait permettre à la France d'accueillir un centre de calcul souverain offrant aux startups et laboratoires européens un accès compétitif à la puissance GPU nécessaire à l'entraînement de grands modèles.

💬 Du lourd dans ce consortium : Orange, EDF, Scaleway, iliad, c'est pas une candidature symbolique. Ce qui m'intéresse vraiment là-dedans, c'est pas la gigafactory en elle-même, c'est l'accès GPU garanti pour les startups et labos européens qui galèrent à se payer du compute H100. Bruxelles retient 2-3 sites max sur tout le continent, et là, faut pas se louper.

InfrastructureActu
1 source
Face aux États-Unis et à la Chine, MISTRAL cherche son propre modèle d’IA et fait l’acquisition d’Emmi AI
64FrenchWeb 

Face aux États-Unis et à la Chine, MISTRAL cherche son propre modèle d’IA et fait l’acquisition d’Emmi AI

Mistral AI, la startup parisienne fondée en 2023 et valorisée plus de six milliards d'euros, annonce l'acquisition d'Emmi AI, une société spécialisée dans les agents conversationnels d'entreprise. Cette opération s'inscrit dans une stratégie de diversification accélérée : plutôt que de se limiter à l'entraînement de modèles fondationnels, Mistral cherche à construire une offre verticalement intégrée, allant du modèle de base jusqu'aux applications déployées chez les clients. Les détails financiers de l'acquisition n'ont pas été rendus publics. L'enjeu est de taille pour l'écosystème européen. Les entreprises du continent restent largement dépendantes des hyperscalers américains (AWS, Azure, Google Cloud) pour leurs infrastructures, des GPU NVIDIA pour le calcul, et des modèles d'OpenAI, Anthropic ou Google pour l'inférence. En absorbant Emmi AI, Mistral tente de proposer une alternative souveraine complète aux directions informatiques européennes soucieuses de leur autonomie stratégique et de conformité réglementaire, notamment au regard de l'AI Act européen entré en vigueur en 2024. Ce rachat intervient alors que la compétition internationale s'intensifie sur deux fronts simultanés : les États-Unis maintiennent leur avance sur les modèles de pointe, tandis que la Chine rattrape son retard à marche forcée avec des architectures intégrées comme celles de Huawei ou Baidu. Pour Mistral, qui a levé 1,1 milliard de dollars en 2024 avec des investisseurs comme Andreessen Horowitz et la Banque publique d'investissement, l'heure est au passage à l'échelle commerciale, pas seulement technologique.

UEL'acquisition d'Emmi AI par Mistral AI renforce l'offre souveraine européenne en agents IA d'entreprise, donnant aux DSI françaises et européennes une alternative intégrée aux solutions américaines, dans un contexte de conformité à l'AI Act.

💬 Mistral fait le pari qu'un modèle de base, ça ne suffit plus. Racheter Emmi AI, c'est aller chercher le client là où il est, dans ses workflows d'entreprise, plutôt que d'attendre qu'il vienne lui-même sur une API. Reste à voir si une startup, même avec un milliard en caisse, peut tenir tête aux hyperscalers sur leur propre terrain.

BusinessOpinion
1 source
Le prochain défi de Claude en entreprise : pas les modèles, mais le plan de contrôle des agents
65VentureBeat AI 

Le prochain défi de Claude en entreprise : pas les modèles, mais le plan de contrôle des agents

Selon de nouvelles données publiées par VentureBeat Pulse, la prochaine bataille stratégique dans l'IA d'entreprise ne portera pas sur la qualité des modèles, mais sur le contrôle de la couche d'orchestration des agents. Le tracker indépendant VB Pulse, qui mesure régulièrement les préférences de décideurs techniques qualifiés en entreprise, révèle que Microsoft Copilot Studio et Azure AI Studio dominent ce segment avec 38,6 % d'adoption principale en février 2026, en hausse depuis 35,7 % en janvier. L'API Assistants et Responses d'OpenAI occupe la deuxième place avec 25,7 %, contre 23,2 % un mois plus tôt. Anthropic, lui, fait sa première apparition dans ce tracker : passant de 0 % en janvier à 5,7 % en février pour l'usage de ses outils et workflows natifs, soit quatre répondants sur un panel de 70 décideurs. Sur la couche modèle, les données sont encore plus spectaculaires pour l'entreprise de Dario Amodei : Claude est passé de 23,9 % en janvier à 28,6 % en février, puis à 56,2 % en mars, bien que cette dernière mesure soit qualifiée de directionnelle en raison d'un échantillon réduit à 16 répondants. Ce glissement d'Anthropic depuis la couche modèle vers l'orchestration native représente un signal stratégique significatif, même si les chiffres absolus restent modestes. Les entreprises ne choisissent plus seulement un chatbot ou un moteur de génération de texte : elles décident où installer la machinerie opérationnelle de leur IA, quels outils les agents peuvent appeler, quelles données ils peuvent consulter, quels workflows ils peuvent déclencher, et comment prouver aux équipes de sécurité que ces agents n'ont rien fait d'interdit. Tom Findling, PDG de la startup de cybersécurité IA Conifers, résume l'enjeu : les entreprises déplacent leur focus de la qualité du modèle vers le plan de contrôle qui l'entoure, notamment en matière de gouvernance, d'auditabilité et d'orchestration dans des environnements clients complexes. L'enjeu est d'autant plus lourd que remplacer un modèle reste relativement simple en théorie, une entreprise peut router une tâche vers Claude, une autre vers GPT, une troisième vers Gemini. Remplacer un runtime d'agents, en revanche, implique de reconfigurer des pipelines entiers, des intégrations d'outils, des politiques d'accès aux données et des mécanismes d'audit. Celui qui contrôle cette couche crée une dépendance bien plus profonde que celle d'un modèle. Microsoft dispose d'un avantage de distribution considérable dans les entreprises, et OpenAI d'une base installée bien plus large en orchestration. Mais la montée en puissance de Claude sur la couche modèle commence visiblement à se propager vers l'orchestration, et c'est précisément là que se joueront les parts de marché les plus durables des prochaines années.

💬 Anthropic gagne la bataille des modèles, et c'est bien, mais la vraie guerre se joue ailleurs. Changer de LLM, c'est l'affaire d'une clé API, mais démonter un runtime d'agents complet avec ses pipelines, ses intégrations et ses politiques d'accès, c'est des mois de boulot. Microsoft tient l'orchestration à 38 % et Anthropic débarque tout juste à 5,7 %, autant dire que c'est encore loin.

BusinessOpinion
1 source
La startup Modal en négociations pour lever des fonds à une valorisation de 4,5 milliards de dollars après une forte hausse de ses revenus
66The Information AI 

La startup Modal en négociations pour lever des fonds à une valorisation de 4,5 milliards de dollars après une forte hausse de ses revenus

La startup Modal est en négociation pour lever des fonds à une valorisation d'environ 4,5 milliards de dollars, selon deux sources proches du dossier. Ce montant représente une prime de 80 % par rapport à sa dernière valorisation, obtenue il y a seulement quelques mois. Fondée pour permettre aux développeurs de louer des GPU Nvidia et d'accéder à des outils logiciels pour entraîner et exécuter des modèles d'IA ainsi que des agents autonomes, la société affiche désormais un chiffre d'affaires annualisé d'environ 300 millions de dollars, soit une multiplication par cinq depuis l'automne 2025. Cette trajectoire illustre l'appétit croissant des entreprises pour des infrastructures capables d'exécuter des agents IA de façon sécurisée. La majeure partie de cette croissance provient des "sandboxes" de Modal, des environnements logiciels isolés qui permettent aux développeurs de faire tourner du code et des agents sans risquer d'affecter le reste de leur système ou de leur base de code. À mesure que les entreprises déploient des agents IA en production, ce type d'isolation devient une exigence technique non négociable. Modal s'inscrit dans une vague de startups d'infrastructure IA qui profitent de la ruée vers les agents autonomes. Alors que les grands fournisseurs cloud comme AWS, Google et Azure proposent des solutions similaires, Modal mise sur la simplicité et la rapidité de déploiement pour séduire les équipes d'ingénieurs. Une levée à 4,5 milliards de dollars lui donnerait les moyens d'accélérer son expansion et de renforcer sa capacité de calcul face à une demande qui ne montre aucun signe de ralentissement.

BusinessActu
1 source
Microsoft a récupéré plus du double de son investissement de 13 milliards de dollars dans OpenAI
67The Information AI 

Microsoft a récupéré plus du double de son investissement de 13 milliards de dollars dans OpenAI

Microsoft a investi 13 milliards de dollars dans OpenAI sur plusieurs années, obtenant en échange un droit exclusif de revendre les modèles de langage de la startup à d'autres entreprises via son cloud Azure. Pendant trois ans, Microsoft était ainsi le seul fournisseur cloud autorisé à commercialiser GPT-4 et ses successeurs auprès des professionnels. Malgré cet avantage concurrentiel, les données révèlent que les entreprises ont acheté davantage de capacités directement auprès d'OpenAI que via Microsoft durant cette période. Selon les estimations de The Information, basées sur des documents financiers d'OpenAI et des témoignages internes, Microsoft a toutefois déjà récupéré plus du double de son investissement initial en revenus nouveaux générés par les services liés à la technologie d'OpenAI. Ce résultat illustre que la valeur du partenariat pour Microsoft dépasse largement la simple revente de modèles. L'intégration de Copilot dans Microsoft 365, Azure OpenAI Service et les outils GitHub ont tous bénéficié directement de l'accès privilégié aux modèles d'OpenAI, générant des milliards de revenus supplémentaires que la comptabilité classique ne capturait pas forcément. Ce partenariat s'est construit dans un contexte de course effrénée à l'IA générative, où Microsoft cherchait à rattraper Google sur le terrain de la recherche et des outils de productivité. La relation entre les deux entreprises reste toutefois complexe : OpenAI développe désormais ses propres offres cloud concurrentes, et l'exclusivité commerciale de Microsoft s'érode progressivement, redessinant les contours d'une alliance stratégique à plusieurs dizaines de milliards de dollars.

UEL'érosion progressive de l'exclusivité commerciale de Microsoft sur les modèles OpenAI pourrait modifier les conditions d'accès et de tarification pour les entreprises européennes utilisant Azure OpenAI Service.

BusinessActu
1 source
OpenAI va économiser 97 milliards de dollars d'ici 2030 grâce à son nouvel accord avec Microsoft
68The Information AI 

OpenAI va économiser 97 milliards de dollars d'ici 2030 grâce à son nouvel accord avec Microsoft

OpenAI a conclu un nouvel accord avec Microsoft qui lui permettra d'économiser jusqu'à 97 milliards de dollars d'ici 2030. C'est la directrice financière Sarah Friar qui supervise cette renégociation majeure, dont les détails n'avaient jusqu'ici pas été rendus publics. Selon les termes initiaux du partenariat, OpenAI devait reverser 20 % de ses revenus à Microsoft, une clause qui aurait pu représenter 135 milliards de dollars si la société atteignait ses objectifs de croissance à long terme. Le nouvel accord réduit drastiquement cette obligation, limitant la part due à Microsoft à une fraction de ce montant. Cet allègement financier est considérable pour OpenAI, dont les ambitions d'expansion nécessitent des capitaux massifs. La société, valorisée à plus de 300 milliards de dollars après sa dernière levée de fonds, doit financer le développement de ses modèles, l'infrastructure de calcul et l'internationalisation de ChatGPT. Réduire la charge liée au partage de revenus libère des marges de manœuvre significatives pour investir dans la recherche et rester compétitif face à Google, Anthropic et Meta. Le partenariat entre OpenAI et Microsoft remonte à 2019, quand le géant de Redmond a injecté un premier milliard de dollars dans la startup. Depuis, Microsoft a engagé plus de 13 milliards de dollars et intégré les technologies d'OpenAI dans ses produits phares, de Copilot à Azure. La renégociation de cet accord de partage de revenus reflète le rapport de force qui a évolué entre les deux entités, OpenAI cherchant à préserver son autonomie financière à mesure qu'elle se transforme en une entreprise à but lucratif.

💬 Le rapport de force a changé de camp. Quand Microsoft a posé son premier milliard en 2019, les termes du deal reflétaient exactement ça, OpenAI avait besoin d'eux. À 300 milliards de valorisation, continuer à reverser 20% des revenus à Redmond, c'était une anomalie qui ne pouvait pas tenir.

BusinessActu
1 source
Claude sur AWS : toute la plateforme d'Anthropic
69Le Big Data 

Claude sur AWS : toute la plateforme d'Anthropic

Anthropic a annoncé ce 11 mai 2026 que l'intégralité de sa plateforme Claude est désormais accessible directement depuis Amazon Web Services, sous forme de disponibilité générale. Concrètement, les clients AWS peuvent désormais utiliser l'ensemble des fonctionnalités de l'API Claude, Claude Managed Agents pour déployer des agents IA à grande échelle, exécution de code Python via API, recherche web intégrée, et un système de Skills permettant à Claude d'apprendre des comportements ou méthodes de travail spécifiques, sans quitter leur environnement cloud habituel. L'intégration couvre l'authentification IAM, la facturation unifiée AWS, les audits via CloudTrail, et un accès immédiat aux nouvelles fonctionnalités au fil de leur sortie. Jusqu'ici, plusieurs capacités avancées de Claude restaient réservées à l'API native d'Anthropic. Pour les équipes techniques en entreprise, le gain est avant tout opérationnel : plus besoin de gérer des systèmes parallèles de connexion, de facturation ou de permissions. Cette simplification réduit la friction à l'adoption et abaisse la barrière d'entrée pour les organisations déjà investies dans AWS. Anthropic précise toutefois que le traitement des données sur cette plateforme s'effectue en dehors de l'infrastructure AWS classique, une nuance importante pour les entreprises soumises à des contraintes strictes de souveraineté ou de conformité. Pour celles-là, Anthropic maintient une offre distincte via Amazon Bedrock, où AWS reste l'opérateur principal et les données demeurent dans l'infrastructure Amazon, deux positionnements qui ciblent deux profils d'entreprises différents. Cette annonce s'inscrit dans une bataille industrielle plus large où les plateformes cloud sont devenues les principales portes d'entrée de l'IA générative. OpenAI pousse ChatGPT Enterprise, Google multiplie les intégrations Gemini dans son écosystème, Microsoft verrouille ses capacités IA dans Azure, et Anthropic devait muscler son jeu pour ne pas rester un fournisseur de modèles sans ancrage infrastructure. Le partenariat entre Anthropic et Amazon, qui s'est matérialisé par un investissement massif d'Amazon dans Anthropic ces dernières années, trouve ici une nouvelle expression concrète. En intégrant Claude profondément dans AWS, Anthropic gagne en distribution et en crédibilité enterprise, tandis qu'Amazon renforce l'attractivité de son cloud pour les projets IA. La prochaine étape sera de voir si cette intégration accélère effectivement l'adoption de Claude dans les grandes organisations, ou si la question non résolue de la localisation des données freinera les déploiements dans les secteurs les plus régulés.

UELes entreprises européennes sur AWS peuvent désormais accéder à l'ensemble de la plateforme Claude sans friction opérationnelle, mais le traitement des données hors infrastructure AWS standard soulève des questions de conformité pour les secteurs soumis aux exigences de souveraineté numérique de l'UE.

OutilsOpinion
1 source
Ruben BRYON, construire une alternative européenne au cloud américain
70FrenchWeb 

Ruben BRYON, construire une alternative européenne au cloud américain

Ruben Bryon a commencé à coder seul à l'âge de 12 ans, allant jusqu'à percer un mur dans le garage familial pour refroidir ses premiers serveurs. Quinze ans plus tard, il dirige Verda, une entreprise fondée sous le nom de DataCrunch, qui ambitionne de construire la première "Gigafactory" européenne de l'intelligence artificielle. Concrètement, il s'agit de déployer des centres de données massivement équipés en GPU, les puces indispensables à l'entraînement et à l'inférence des grands modèles d'IA, sur le sol européen, en dehors de la dépendance aux hyperscalers américains comme AWS, Azure ou Google Cloud. L'enjeu est considérable pour l'industrie technologique européenne. Les startups et laboratoires de recherche du continent paient aujourd'hui leurs coûts de calcul à des entreprises américaines, ce qui crée une dépendance structurelle tant sur le plan économique que réglementaire. Une infrastructure GPU souveraine permettrait aux acteurs européens de développer et déployer des modèles d'IA sans que leurs données transitent par des juridictions soumises au droit américain, un point particulièrement sensible depuis le Cloud Act de 2018. L'initiative de Bryon s'inscrit dans un mouvement plus large de souveraineté numérique européenne, porté aussi bien par des régulations comme le RGPD que par des initiatives industrielles telles que GAIA-X. Face à la concentration du marché du cloud d'IA entre les mains de quelques géants américains, des acteurs comme Verda cherchent à occuper le créneau de l'infrastructure de confiance en Europe, à mesure que la demande en puissance de calcul pour l'IA continue d'exploser.

UEVerda déploie des centres de données GPU sur sol européen pour permettre aux startups et laboratoires de recherche européens d'entraîner leurs modèles d'IA sans transiter par des juridictions soumises au Cloud Act américain.

💬 C'est exactement ce qu'on attendait depuis que le Cloud Act a rendu la question brûlante. Partir de l'infra GPU, pas du cadre réglementaire, c'est ce qui distingue Verda de toutes les initiatives européennes de souveraineté numérique qui finissent en comité de pilotage. Reste à voir si les capitaux suivent à l'échelle d'une gigafactory.

InfrastructureOpinion
1 source
AgentCore Optimization : AWS lance une boucle d'amélioration des performances des agents
71AWS ML Blog 

AgentCore Optimization : AWS lance une boucle d'amélioration des performances des agents

Amazon a annoncé le lancement en préversion d'AgentCore Optimization, une nouvelle fonctionnalité intégrée à sa plateforme Amazon Bedrock AgentCore. Cette brique complète ce qu'Amazon appelle la boucle "observer, évaluer, améliorer" pour les agents IA en production. Concrètement, le système analyse automatiquement les traces de production, génère des recommandations d'optimisation pour les prompts système ou les descriptions d'outils, puis propose deux mécanismes de validation : l'évaluation par lot sur des jeux de données prédéfinis, et les tests A/B en conditions réelles via AgentCore Gateway, avec découpage du trafic en production à un pourcentage configurable et résultats assortis d'intervalles de confiance et de signification statistique. NTT DATA, partenaire annoncé lors du lancement, indique que des processus qui nécessitaient auparavant plusieurs semaines d'ajustement manuel de prompts peuvent désormais s'exécuter en cycles rapides et reproductibles. L'enjeu est de taille pour les équipes produit qui déploient des agents IA : la qualité d'un agent se dégrade silencieusement à mesure que les modèles évoluent, que le comportement des utilisateurs change, et que les prompts sont réutilisés dans des contextes imprévus. Jusqu'ici, la remédiation reposait entièrement sur l'intuition du développeur, lire des traces, formuler une hypothèse, réécrire le prompt, tester quelques cas, déployer, un cycle qui introduit souvent de nouveaux problèmes en corrigeant les anciens. AgentCore Optimization remplace cette boucle artisanale par un processus systématique fondé sur les données : les recommandations sont générées à partir des traces réelles et validées avant tout déploiement, éliminant la part de pari inhérente aux corrections en aveugle. Amazon Bedrock AgentCore, déjà utilisé par des milliers de développeurs pour construire des agents capables de raisonner et d'agir dans des workflows complexes, s'enrichit ainsi d'une couche d'amélioration continue qui manquait jusqu'à présent à l'écosystème. Les grandes équipes disposent certes d'équipes scientifiques dédiées et de benchmarks centralisés, mais ces dispositifs fonctionnent sur des cycles hebdomadaires ou mensuels, pendant que les agents dérivent en production chaque jour. En intégrant la traçabilité OpenTelemetry, les évaluateurs built-in (taux de succès, précision de sélection d'outils, sécurité), et la possibilité de simuler des jeux de données via un acteur LLM jouant le rôle de l'utilisateur final, Amazon positionne AgentCore comme une plateforme complète pour industrialiser l'optimisation des agents, une capacité qui pourrait devenir un critère de choix déterminant face à des concurrents comme Google Vertex AI ou Microsoft Azure AI Foundry.

UELes équipes européennes déployant des agents IA sur Amazon Bedrock peuvent désormais automatiser l'optimisation de leurs prompts et outils, réduisant des cycles d'ajustement manuel qui duraient plusieurs semaines à des itérations rapides et reproductibles.

OutilsOutil
1 source
Big Tech prouve l'efficacité de ses dépenses en infrastructure IA, et augmente quand même la facture
72AI News 

Big Tech prouve l'efficacité de ses dépenses en infrastructure IA, et augmente quand même la facture

Microsoft, Alphabet, Meta et Amazon ont publié leurs résultats trimestriels le même jour, offrant la première vérification à grande échelle du pari colossal qu'elles ont engagé sur l'infrastructure IA. Le verdict est sans ambiguïté : les quatre entreprises ont dépassé les attentes des analystes, et toutes quatre ont simultanément rehaussé leurs prévisions de dépenses en capital pour 2026. Ensemble, elles s'engagent désormais sur une enveloppe totale comprise entre 630 et 650 milliards de dollars pour l'année. Microsoft a enregistré un chiffre d'affaires de 82,9 milliards de dollars au premier trimestre, en hausse de 18 % sur un an, avec une croissance d'Azure à 40 % en devise constante, au-delà des 38,8 % anticipés par le consensus CNBC. Les revenus annualisés liés à l'IA dépassent désormais 37 milliards de dollars. Alphabet a affiché sa plus forte croissance trimestrielle depuis 2022, avec un bond de 63 % pour Google Cloud et un bénéfice net de 62,57 milliards de dollars, en hausse de 81 % sur un an. Meta a de son côté enregistré une croissance de 33 % de ses revenus, à 56,31 milliards de dollars, son rythme le plus rapide depuis 2021. AWS d'Amazon a connu sa croissance la plus rapide en quinze trimestres. Ces chiffres importent parce qu'ils répondent à la question que les marchés posaient depuis des mois : l'infrastructure IA génère-t-elle des retours ? La réponse est oui, mais avec une nuance cruciale. Chez Meta, c'est la plateforme publicitaire Advantage+, dopée à l'IA, qui transforme les investissements en revenus. Chez Microsoft, les obligations de performances commerciales restantes ont bondi de 99 % à 627 milliards de dollars, signe d'une demande entreprise robuste. Chez Alphabet, le PDG Sundar Pichai a lui-même reconnu que la société est "contrainte à court terme par les capacités de calcul", ce qui signifie que la demande dépasse la vitesse de construction. Pourtant, malgré des résultats opérationnels solides, le titre Microsoft a reculé de plus de 3 % en après-marché, preuve que les investisseurs scrutent désormais les dépenses autant que les revenus. Cet épisode s'inscrit dans une dynamique plus large qui s'est accélérée depuis le lancement de ChatGPT fin 2022 : les grandes plateformes technologiques ont transformé leurs bilans en paris sur l'infrastructure IA, convaincues que celui qui construit le plus vite capturera la valeur de la prochaine décennie. Microsoft relève sa prévision de capex annuel à 190 milliards de dollars, bien au-delà des 154,6 milliards attendus. Meta porte la sienne à 125-145 milliards, en partie à cause de la hausse des prix des composants. Alphabet annonce que ses dépenses 2027 "augmenteront significativement" par rapport à 2026. La question ouverte est celle de la soutenabilité : les revenus publicitaires et cloud peuvent-ils continuer à financer des engagements qui rivalisent avec le PIB de certains États, à mesure que la concurrence entre Google, Microsoft, Meta et Amazon s'intensifie sur chaque couche de la pile IA ?

UELes engagements massifs de capex des géants américains conditionnent l'offre et les tarifs cloud IA accessibles aux entreprises européennes à moyen terme.

BusinessOpinion
1 source
Google Cloud et AWS brillent dans les résultats trimestriels des géants technologiques
73The Information AI 

Google Cloud et AWS brillent dans les résultats trimestriels des géants technologiques

Google, Microsoft, Amazon et Meta ont simultanément publié leurs résultats du premier trimestre 2026, déclenchant un déluge de chiffres qui a dominé l'actualité financière de la journée. Le constat le plus net qui se dégage de cette publication groupée : la demande en capacité de calcul liée à l'intelligence artificielle continue d'accélérer, et elle tire vers le haut les revenus cloud des trois grands, AWS, Google Cloud et Azure. Amazon a particulièrement brillé, tout comme Google Cloud, avec des croissances qui ont dépassé les attentes des analystes. Andy Jassy, PDG d'Amazon, a résumé l'ambiance en quelques mots : « Ce n'est un secret pour personne que les laboratoires d'IA dépensent des sommes considérables en infrastructure de calcul. » Ce dynamisme a pourtant une face moins reluisante. Une part significative de la demande cloud provient des grands laboratoires d'IA eux-mêmes, Anthropic, OpenAI et leurs équivalents, qui consomment massivement des ressources GPU pour entraîner et faire tourner leurs modèles. Cela signifie que la croissance actuelle du cloud est en partie circulaire : les fournisseurs cloud investissent dans l'IA, et les entreprises d'IA réinjectent ces revenus en achetant encore plus de cloud. Jassy a néanmoins tenu à nuancer le tableau, soulignant qu'une partie non négligeable de la demande émane d'entreprises classiques qui intègrent l'IA dans leurs opérations, ce qui est indispensable si l'on veut que la révolution de l'IA soit économiquement viable à long terme. Sur le front publicitaire, Meta et Google ont également affiché de bons résultats, l'IA améliorant le ciblage et l'efficacité de leurs régies. Ces résultats s'inscrivent dans une séquence d'investissements massifs : les grandes entreprises technologiques ont collectivement annoncé des centaines de milliards de dollars de dépenses en infrastructure IA pour 2025 et 2026. La question qui reste ouverte est celle de la rentabilité de cet écosystème au-delà des hyperscalers eux-mêmes. Si les entreprises ordinaires adoptent l'IA à grande échelle, comme Jassy l'espère, le modèle tient. Dans le cas contraire, la bulle d'investissement repose essentiellement sur une concentration de quelques acteurs qui se financent mutuellement, un équilibre que les prochains trimestres permettront de mieux évaluer.

UEL'essor de la demande cloud tirée par l'IA se répercute indirectement sur les entreprises européennes qui dépendent de ces infrastructures pour déployer leurs propres projets d'IA, sans que l'article n'identifie d'impact direct sur la France ou l'UE.

BusinessActu
1 source
IDC : comment les DSI de la zone EMEA peuvent accélérer leurs déploiements IA
74AI News 

IDC : comment les DSI de la zone EMEA peuvent accélérer leurs déploiements IA

Selon une étude IDC publiée en 2026, seulement 9 % des organisations de la région EMEA ont réussi à tirer des résultats business quantifiables de la majorité de leurs projets d'intelligence artificielle au cours des deux dernières années. Les 91 % restants sont enlisés dans la même impasse : des pilotes qui ne franchissent jamais le stade de la production. Après dix-huit mois d'investissements massifs dans les grands modèles de langage et le machine learning, les conseils d'administration freinent désormais, réduisent la voilure ou réorientent leurs initiatives IA. La cause n'est pas un désintérêt technique, mais une incapacité à démontrer un retour sur investissement concret face à des directions financières de plus en plus sceptiques et des pressions macroéconomiques croissantes. Le problème central tient à une inadéquation entre les méthodes traditionnelles d'évaluation et la nature réelle de la valeur générée par l'IA. Les outils de procurement classiques mesurent le logiciel à l'aune de la réduction de personnel, alors que les bénéfices des modèles génératifs se matérialisent différemment : nouveaux flux de revenus, accélération de la productivité, réduction des risques opérationnels. Un outil de maintenance prédictive dans une usine manufacturière n'élimine pas des postes d'ingénieurs, mais peut éviter une panne catastrophique de la chaîne d'assemblage, une économie réelle qui n'apparaît sur aucun tableau de bord budgétaire standard. Sans cadre financier adapté, les pilotes prometteurs perdent leur financement avant d'atteindre les réseaux de production. À cela s'ajoute le gouffre infrastructurel : passer d'un environnement sandbox AWS ou Azure à un déploiement d'entreprise complet expose des incompatibilités majeures entre bases vectorielles modernes et systèmes Oracle ou SAP vieillissants, des données mal structurées qui alimentent les hallucinations, et des coûts d'inférence et de fine-tuning qui explosent à mesure que le déploiement s'étend. Ce blocage s'inscrit dans un contexte réglementaire européen particulièrement exigeant, où les lois sur la protection des données et la cybersécurité imposent des contraintes strictes : documentation des arbres de décision des modèles, protection contre les attaques par injection de prompts, gouvernance formelle. Si beaucoup d'équipes vivent ces obligations comme un frein, IDC observe que les rares organisations ayant réussi à scaler leurs projets adoptent la posture inverse : elles intègrent la conformité dès la conception, ce qui accélère in fine le déploiement, améliore la résilience des systèmes et renforce la confiance des clients. Pour débloquer la situation, IDC recommande aux DSI de retravailler activement leurs calculs de ROI pour capturer ces bénéfices indirects, et de traiter la réglementation non comme un obstacle mais comme un levier d'architecture.

UELes DSI français et européens doivent revoir leurs cadres de mesure du ROI et peuvent transformer les contraintes réglementaires européennes (AI Act, RGPD, cybersécurité) en levier d'accélération en intégrant la conformité dès la conception de leurs projets IA.

BusinessOpinion
1 source
Comment Nadella et Altman ont évité un conflit juridique autour d'AWS
75The Information AI 

Comment Nadella et Altman ont évité un conflit juridique autour d'AWS

Il y a deux mois, OpenAI a conclu un accord surprise avec Amazon Web Services pour distribuer ses technologies d'intelligence artificielle aux entreprises via le cloud d'AWS, un concurrent direct de Microsoft. Cette annonce a immédiatement créé des tensions avec Microsoft, partenaire historique d'OpenAI et détenteur d'une licence exclusive pour revendre les technologies OpenAI à ses clients cloud. Microsoft estimait que cet accord avec Amazon violait les termes du contrat liant les deux entreprises, tandis qu'OpenAI considérait que l'arrangement avec AWS était parfaitement compatible avec leur partenariat. Face à cette divergence, Satya Nadella et Sam Altman ont entamé une série de réunions au cours des dernières semaines pour désamorcer la crise avant qu'elle ne dégénère en conflit juridique. L'enjeu est considérable pour les deux parties. Microsoft a investi plusieurs milliards de dollars dans OpenAI et fondé une large partie de sa stratégie cloud sur l'exclusivité de l'accès à ses modèles. Voir OpenAI s'allier avec AWS, numéro un mondial du cloud, représente une menace directe sur les revenus Azure et remet en cause l'avantage concurrentiel que Microsoft pensait avoir sécurisé. Cette dispute illustre les tensions croissantes au sein d'un partenariat devenu trop étroit pour les ambitions respectives des deux entreprises. Alors qu'OpenAI accélère ses ventes et multiplie ses débouchés commerciaux, ses intérêts divergent de ceux de Microsoft. L'issue de ces négociations pourrait redéfinir les contours de leur relation et influencer la façon dont les grandes plateformes cloud accèdent aux modèles d'IA frontier.

UELes entreprises européennes utilisant Azure ou AWS pour accéder aux modèles OpenAI pourraient être indirectement affectées si ces négociations reconfigurent les accords de distribution cloud.

BusinessOpinion
1 source
L'accord historique sur l'AGI entre Microsoft et OpenAI prend fin
76The Verge 

L'accord historique sur l'AGI entre Microsoft et OpenAI prend fin

Microsoft a annoncé lundi matin des modifications majeures à son partenariat historique avec OpenAI, dont la plus symbolique est la suppression officielle de la clause sur l'intelligence artificielle générale (AGI) qui régissait leur accord depuis plusieurs années. Selon les nouveaux termes, Microsoft demeure le "partenaire cloud principal" d'OpenAI, les produits de la startup étant toujours déployés en priorité sur Azure, sauf si Microsoft choisit de ne pas supporter les capacités requises. La rupture décisive: OpenAI peut désormais distribuer l'ensemble de ses produits à ses clients via n'importe quel fournisseur cloud. Ce changement libère considérablement OpenAI dans sa conquête du marché entreprise. En pouvant s'appuyer sur AWS, Google Cloud ou d'autres infrastructures concurrentes, la startup n'est plus tributaire des capacités ou des priorités commerciales de Microsoft. Pour les grandes entreprises clientes, cela signifie davantage de choix et de flexibilité pour intégrer les technologies OpenAI dans leurs environnements existants, ce qui rend OpenAI plus compétitif face à des acteurs comme Anthropic ou Google DeepMind. L'accord originel entre les deux entreprises, construit autour d'un investissement total de Microsoft dépassant treize milliards de dollars, contenait une clause AGI à la portée symbolique considérable: une fois OpenAI jugée avoir atteint l'AGI, les termes du partenariat devaient être renégociés. Sa suppression intervient alors qu'OpenAI finalise sa transformation en société à but lucratif classique et cherche activement à diversifier ses revenus et ses alliances technologiques dans un marché de l'IA de plus en plus concurrentiel.

UELes entreprises européennes clientes d'OpenAI gagnent en flexibilité pour déployer ses technologies sur des infrastructures cloud alternatives, potentiellement incluant des fournisseurs européens, réduisant leur dépendance à Azure.

BusinessOpinion
1 source
Les nuances de la marge brute de Cursor, comparatif GPT-5.5 et Claude Mythos
77The Information AI 

Les nuances de la marge brute de Cursor, comparatif GPT-5.5 et Claude Mythos

Microsoft et OpenAI ont revu les termes de leur partenariat, avec deux concessions majeures : Azure perd son droit exclusif de distribuer les modèles OpenAI, et Microsoft n'est plus tenu de reverser 20 % des revenus générés par ces modèles sur sa plateforme cloud. Cette renégociation intervient après que des cadres de Microsoft ont exprimé des inquiétudes le mois dernier : OpenAI avait annoncé un projet de déploiement d'un agent IA via Amazon Web Services, ce qui, selon eux, violait le contrat d'exclusivité liant les deux entreprises. Par ailleurs, Cursor, la startup spécialisée dans le codage assisté par IA, continue sa montée en puissance avec un chiffre d'affaires annualisé atteignant 2,7 milliards de dollars en mars 2026, contre 1 milliard en novembre 2025. SpaceX dispose désormais d'une option d'achat sur la société valorisée à 60 milliards de dollars. Ces deux révélations illustrent les tensions structurelles qui traversent l'écosystème IA. Du côté OpenAI-Microsoft, la fin de l'exclusivité Azure signifie qu'OpenAI peut désormais s'appuyer sur d'autres clouds pour commercialiser ses modèles, ce qui lui donne un levier de négociation et une flexibilité stratégique accrue. Pour Cursor, la croissance spectaculaire masque une réalité financière préoccupante : la marge brute était de -23 % au trimestre clos en janvier 2026, avant de passer tout juste en territoire positif. Les coûts d'inférence, c'est-à-dire le calcul nécessaire pour faire tourner les modèles, plombent la rentabilité. Ce contexte met en lumière une pratique comptable discrète mais répandue dans le secteur : certaines startups IA classent une partie de leurs dépenses d'inférence en frais marketing plutôt qu'en coût des ventes. Cela ne change pas les pertes nettes, mais améliore artificiellement la marge brute, un indicateur clé pour les investisseurs. Ce tour de passe-passe comptable révèle à quel point les marges sont sous pression dans l'IA générative, y compris pour des acteurs en forte croissance. La question de la rentabilité réelle de ces modèles économiques reste entière, alors que les valorisations continuent de s'envoler.

UELa fin de l'exclusivité Azure pour les modèles OpenAI pourrait indirectement modifier les conditions d'accès des entreprises européennes aux API d'OpenAI via d'autres clouds, mais l'impact direct sur la France ou l'UE reste limité à court terme.

BusinessOpinion
1 source
Google prêt à investir 40 milliards dans Anthropic pour rivaliser avec OpenAI
78Le Big Data 

Google prêt à investir 40 milliards dans Anthropic pour rivaliser avec OpenAI

Google s'apprête à injecter au minimum 10 milliards de dollars dans Anthropic, avec une enveloppe totale pouvant atteindre 40 milliards si la startup atteint certains objectifs de performance. L'annonce, révélée par Bloomberg le 24 avril 2026, propulse la valorisation d'Anthropic à 350 milliards de dollars. Ce mouvement intervient quelques jours après qu'Amazon a lui-même engagé 5 milliards supplémentaires dans la même entreprise. Côté infrastructure, Google s'engage également à fournir 5 gigawatts de puissance de calcul via ses TPU sur cinq ans, une ressource aussi stratégique que le capital financier pour une startup dont les modèles tournent en permanence à pleine capacité. Google n'est pas un nouvel entrant dans le capital d'Anthropic, mais l'ampleur de cet engagement marque un changement d'échelle radical. Cet investissement révèle une logique qui dépasse le simple pari financier. Google cherche à sécuriser un accès privilégié aux technologies d'Anthropic pour combler son retard face à OpenAI, dont ChatGPT domine encore les usages professionnels et grand public. En échange, Anthropic consomme les infrastructures cloud et les puces de ses investisseurs, ce qui génère en retour des revenus pour Google Cloud, lesquels dépasseraient déjà ceux produits par Gemini selon des données de marché citées dans l'annonce. La startup attire ces capitaux grâce à la traction réelle de ses produits : les modèles Claude et notamment Claude Code connaissent une adoption rapide dans les environnements de développement logiciel, même si les gains de productivité restent inégaux selon les cas d'usage. La croissance brutale de la demande a cependant généré des tensions opérationnelles, avec des pannes et des limitations de service aux heures de pointe que l'entreprise tente de réguler en bridant certaines fonctionnalités pour les offres d'entrée de gamme. Cette opération s'inscrit dans une recomposition profonde du marché de l'IA, où les géants du cloud ne développent plus uniquement leurs propres modèles mais financent des acteurs indépendants pour diversifier leurs positions. Microsoft applique la même stratégie avec OpenAI depuis 2019, combinant investissement massif et fourniture d'infrastructures Azure. Amazon multiplie les paris avec Anthropic et d'autres startups. Google joue désormais sur les deux tableaux : Gemini en interne, Claude en externe. Ce modèle d'alliance hybride devient la norme dans une industrie où les coûts d'entraînement et d'inférence à grande échelle dépassent ce que même les mieux financés peuvent absorber seuls. La prochaine étape pour Anthropic sera de démontrer que cette valorisation de 350 milliards se justifie par des revenus récurrents solides, dans un marché où la concurrence entre OpenAI, Google, Meta et les challengers comme Mistral ne laisse aucune place à la stagnation.

UECet investissement massif consolide la domination américaine dans l'IA générative et intensifie la pression concurrentielle sur les acteurs européens, notamment Mistral, dans la course aux modèles fondateurs.

OpenAI intensifie sa présence sur AWS alors que ses clients se tournent vers la concurrence
79The Information AI 

OpenAI intensifie sa présence sur AWS alors que ses clients se tournent vers la concurrence

Amazon Web Services a annoncé un accord pour intégrer les modèles d'OpenAI à sa plateforme cloud, via une nouvelle offre orientée vers l'exécution d'agents IA. L'annonce, attendue depuis plusieurs années, marque la première présence officielle d'OpenAI sur AWS, le plus grand fournisseur de cloud au monde. Six entreprises interrogées, clientes d'AWS ou consultantes pour ses clients, ont réagi avec un enthousiasme modéré, soulignant qu'elles n'ont pas attendu pour trouver des alternatives. L'arrivée tardive d'OpenAI sur AWS change peu de chose pour une partie des acteurs du marché : beaucoup se sont déjà organisés autour d'autres modèles disponibles via le service Bedrock d'Amazon, notamment ceux d'Anthropic et les modèles maison Amazon Nova, réputés pour leur rapport qualité-prix. Certaines entreprises accèdent déjà aux modèles OpenAI via Microsoft Azure ou Google Cloud, rendant l'accord AWS moins stratégique qu'il n'y paraît. Pour elles, le changement de fournisseur représente un coût de migration difficile à justifier. Cet accord intervient trois ans après qu'OpenAI a déclenché la course mondiale à l'IA avec le lancement de ChatGPT, période durant laquelle les concurrents ont comblé une grande partie de l'écart technologique. Amazon a massivement investi dans Anthropic, et les clients ont eu le temps de construire des intégrations solides avec ces modèles alternatifs. L'enjeu pour OpenAI est désormais de convaincre un marché qui a appris à se passer de lui, dans un contexte où la fidélité aux fournisseurs cloud se construit sur des mois d'intégration technique.

UELes entreprises européennes hébergées sur ce cloud disposent désormais d'un canal supplémentaire pour accéder aux modèles d'OpenAI, mais l'impact pratique reste limité car la majorité a déjà construit des intégrations solides avec des alternatives compétitives.

BusinessOpinion
1 source
Google I/O : les entreprises veulent de l'aide pour exploiter l'IA
80The Information AI 

Google I/O : les entreprises veulent de l'aide pour exploiter l'IA

Lors de la conférence Google Cloud Next, le discours dominant a changé de cap par rapport à l'année précédente. En 2025, les dirigeants de Google vantaient la puissance brute de leurs modèles d'IA pour les entreprises. En 2026, le message central est devenu : comment aider concrètement les entreprises à faire fonctionner ces modèles. Des entretiens menés sur place auprès de clients et de revendeurs Google Cloud révèlent que de nombreuses organisations buttent sur des obstacles concrets dans leur adoption de l'IA, certaines peinent encore à déployer leur premier agent, tandis que d'autres se retrouvent à gérer une multitude d'agents dont la coordination devient ingérable. Ce glissement de priorité illustre un problème structurel de l'industrie : l'écart entre la promesse marketing des outils d'IA et leur déploiement opérationnel réel. Les entreprises ne manquent pas de modèles ni d'accès aux API, elles manquent d'expertise pour intégrer ces briques dans leurs processus métier, gérer les erreurs, orchestrer plusieurs agents en parallèle et maintenir des systèmes fiables en production. C'est un frein majeur à la monétisation pour les fournisseurs de cloud, qui misent sur la consommation à grande échelle. Google Cloud se retrouve dans une position partagée par ses concurrents Microsoft Azure et Amazon Web Services : après avoir massivement investi dans la course aux modèles, les hyperscalers doivent maintenant construire la couche de services, d'outillage et d'accompagnement qui transforme la puissance brute en valeur business. La conférence Next marque ainsi une maturité nouvelle du marché, où l'implémentation devient le vrai champ de bataille.

UELes entreprises européennes font face aux mêmes obstacles d'adoption de l'IA, et pourraient bénéficier des nouvelles couches de services et d'outillage que les hyperscalers développent pour faciliter le déploiement opérationnel.

BusinessOpinion
1 source
Health Data Hub : la France acte (enfin) son virage vers un cloud souverain / UNIVITY mise 27 millions d’euros sur une infrastructure spatiale 5G / De Mistral à xAI : Devendra Chaplot change de camp
81FrenchWeb 

Health Data Hub : la France acte (enfin) son virage vers un cloud souverain / UNIVITY mise 27 millions d’euros sur une infrastructure spatiale 5G / De Mistral à xAI : Devendra Chaplot change de camp

La Plateforme des données de santé a officiellement sélectionné Scaleway, filiale du groupe Iliad, pour héberger ses infrastructures, mettant fin à des années de dépendance vis-à-vis de Microsoft Azure. Ce choix, issu d'un appel d'offres rigoureux, éloigne les données médicales de millions de Français du spectre du Cloud Act américain et affirme un virage vers la souveraineté numérique. En parallèle, la startup UNIVITY annonce une levée de 27 millions d'euros pour déployer une infrastructure 5G spatiale combinant satellites et réseaux terrestres. Enfin, Devendra Chaplot, chercheur passé par Mistral AI, rejoint xAI, la société d'intelligence artificielle d'Elon Musk. Ces trois actualités convergent autour d'un même enjeu : la souveraineté technologique européenne. Le choix de Scaleway par le Health Data Hub répond aux alertes répétées de la CNIL sur les risques d'exposition des données de santé aux injonctions extraterritoriales américaines, et constitue un signal fort pour les opérateurs de cloud souverain français. L'investissement d'UNIVITY positionne l'Europe sur le marché de la connectivité satellitaire face à Starlink, tandis que le départ de Chaplot vers xAI illustre la capacité des mastodontes américains à capter les talents IA européens. La controverse autour du Health Data Hub remonte à 2020, quand le contrat Microsoft avait déclenché une vague de critiques de juristes et d'associations de défense des droits numériques. Scaleway, certifié hébergeur de données de santé (HDS), était depuis le candidat naturel à ce contrat stratégique. Plus largement, ces trois événements dessinent un écosystème européen en tension entre ambition souveraine et attraction irrésistible des géants américains de la tech.

UELe Health Data Hub migre de Microsoft Azure vers Scaleway (groupe Iliad), soustrayant les données médicales de millions de Français au Cloud Act américain, victoire directe pour la souveraineté numérique française et signal fort pour l'écosystème cloud souverain européen.

InfrastructureActu
1 source
Google lance ses TPU v8 et spécialise ses puces pour l’IA : enjeux et comparatif maison
82Next INpact 

Google lance ses TPU v8 et spécialise ses puces pour l’IA : enjeux et comparatif maison

Google a annoncé sa huitième génération de Tensor Processing Units (TPU), ses puces spécialisées dans les calculs d'intelligence artificielle. Pour la première fois dans l'histoire de la gamme, la firme de Mountain View propose deux variantes distinctes basées non plus sur le niveau de performance, mais sur le type d'usage : le TPU v8t, orienté vers l'entraînement des modèles, et le TPU v8i, dédié à l'inférence. C'est une rupture notable avec les générations précédentes, comme les v5e et v5p, qui se différenciaient uniquement par l'efficacité énergétique contre la puissance brute. Cette spécialisation par usage représente un changement de stratégie significatif pour Google. Selon la firme elle-même, "les deux puces peuvent gérer différentes charges de travail, mais la spécialisation permet d'obtenir des gains significatifs". En séparant l'entraînement de l'inférence au niveau matériel, Google cherche à optimiser le rapport performances/coût pour chaque étape du cycle de vie d'un modèle d'IA. Pour les entreprises clientes de Google Cloud, cela se traduit potentiellement par des coûts d'exploitation réduits et une meilleure efficacité dans le déploiement de modèles génératifs à grande échelle. Cette annonce s'inscrit dans une course aux puces IA qui s'est considérablement intensifiée depuis 2018, date des TPU v3. En huit générations, Google a construit une alternative crédible aux GPU de Nvidia, qui dominent encore largement le marché de l'accélération IA. La firme utilise ses TPU en interne pour entraîner ses propres modèles Gemini, ce qui lui confère un avantage compétitif double : maîtrise du hardware et du software. Face à la montée en puissance de concurrents comme les puces Trainium d'Amazon ou les Gaudi d'Intel, la spécialisation des TPU v8 pourrait devenir un argument commercial décisif pour attirer les grandes entreprises vers Google Cloud plutôt que vers AWS ou Azure.

UELes entreprises européennes qui s'appuient sur Google Cloud pour entraîner ou déployer des modèles d'IA pourraient bénéficier d'une réduction des coûts d'exploitation grâce à la spécialisation matérielle des TPU v8.

InfrastructureOpinion
1 source
AutoAdapt : adaptation automatique des grands modèles de langage à des domaines spécifiques
83Microsoft Research 

AutoAdapt : adaptation automatique des grands modèles de langage à des domaines spécifiques

Des chercheurs de Microsoft Research ont publié AutoAdapt, un cadre automatisé destiné à adapter les grands modèles de langage (LLM) à des domaines spécialisés à forts enjeux, comme le droit, la médecine ou la gestion d'incidents cloud. Présenté dans un article intitulé "AutoAdapt: An Automated Domain Adaptation Framework for Large Language Models", le système prend en entrée un objectif défini en langage naturel, des données de domaine et des contraintes pratiques (latence, matériel, budget, confidentialité), puis construit automatiquement un pipeline d'adaptation complet et reproductible. Pour y parvenir, AutoAdapt s'appuie sur trois composants : un graphe de configuration appelé Adaptation Configuration Graph (ACG) qui cartographie l'espace des possibles, un agent planificateur qui sélectionne et séquence les bonnes étapes, et une boucle d'optimisation budgétaire nommée AutoRefine qui affine le résultat dans les limites imposées. L'enjeu est considérable pour les équipes qui déploient des LLM en production. Aujourd'hui, spécialiser un modèle généraliste implique de choisir manuellement entre des approches comme la génération augmentée par récupération (RAG), le fine-tuning supervisé ou des méthodes à efficacité paramétrique comme LoRA, puis d'ajuster des dizaines d'hyperparamètres dans un espace de décision vaste et peu lisible. Ce processus prend des semaines, sans garantie de résultat reproductible. Pour une équipe qui gère une panne critique, un modèle qui dérive de ses exigences de domaine n'est tout simplement pas une option. AutoAdapt transforme ce tâtonnement coûteux en un pipeline exécutable en une fraction du temps, rendant les LLM fiables et prévisibles dans des contextes où les erreurs ont des conséquences réelles. Cette publication s'inscrit dans une tendance de fond qui vise à industrialiser le déploiement des LLM, au-delà de la simple performance sur des benchmarks génériques. Les entreprises qui adoptent ces modèles dans des secteurs régulés ou techniques se heurtent systématiquement au même mur : la spécialisation est longue, chère et fragile. Microsoft Research, qui présente ce travail dans le cadre de son Microsoft Research Forum, positionne AutoAdapt comme une réponse structurée à ce goulot d'étranglement. Le système ouvre la voie à une standardisation des pratiques d'adaptation, là où chaque équipe réinventait jusqu'ici sa propre méthode. La prochaine étape logique sera de voir si ce cadre peut être intégré directement dans des plateformes cloud comme Azure AI Studio, ce qui accélérerait son adoption à grande échelle.

UELes entreprises européennes déployant des LLM dans des secteurs réglementés (santé, droit, finance) pourraient réduire significativement leurs coûts et délais de spécialisation grâce à ce type de framework d'adaptation automatisé.

RecherchePaper
1 source
NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents
84NVIDIA AI Blog 

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents

NVIDIA et Google Cloud ont annoncé cette semaine, lors de la conférence Google Cloud Next à Las Vegas, une nouvelle étape majeure dans leur partenariat vieux de plus de dix ans. Au cœur de l'annonce : le lancement des instances bare-metal A5X, alimentées par les systèmes rack NVIDIA Vera Rubin NVL72, qui promettent un coût d'inférence jusqu'à dix fois inférieur et un débit de tokens dix fois plus élevé par mégawatt par rapport à la génération précédente. Ces infrastructures s'appuient sur les interconnexions NVIDIA ConnectX-9 SuperNICs couplées au réseau Google Virgo de nouvelle génération, permettant de déployer des clusters allant jusqu'à 80 000 GPU Rubin sur un site unique, et jusqu'à 960 000 GPU dans une configuration multisite. Par ailleurs, Google Cloud met en préversion les modèles Gemini sur Google Distributed Cloud avec les GPU NVIDIA Blackwell et Blackwell Ultra, ainsi que des machines virtuelles confidentielles garantissant le chiffrement des données en cours d'utilisation. Des acteurs comme OpenAI et Thinking Machines Lab utilisent déjà ces infrastructures pour des charges d'inférence massives, notamment pour faire tourner ChatGPT. Ces annonces représentent un saut qualitatif significatif pour les entreprises qui cherchent à industrialiser l'IA agentique et l'IA physique, c'est-à-dire les systèmes capables d'agir de manière autonome dans des environnements réels, comme les robots ou les jumeaux numériques en usine. La réduction drastique des coûts d'inférence change concrètement l'équation économique pour les développeurs d'applications IA à grande échelle. La possibilité de déployer les modèles Gemini en environnement souverain, sur des données sensibles restant chiffrées y compris pendant leur traitement, répond à une exigence croissante des entreprises et des gouvernements en matière de conformité et de confidentialité. L'intégration de modèles ouverts NVIDIA Nemotron dans la plateforme Gemini Enterprise Agent Platform élargit également les options des équipes techniques qui souhaitent combiner modèles propriétaires et open source. Ce partenariat s'inscrit dans une compétition intense entre les grands fournisseurs de cloud pour capter les budgets d'infrastructure IA, qui se chiffrent désormais en dizaines de milliards de dollars annuellement. Google Cloud cherche à rattraper son retard sur AWS et Microsoft Azure, qui ont pris de l'avance sur l'hébergement des charges d'entraînement et d'inférence des grands modèles de langage. En s'associant étroitement à NVIDIA, dont les GPU dominent encore largement le marché de l'accélération IA, Google se positionne comme une plateforme de référence pour la prochaine vague, celle des agents autonomes et de la robotique industrielle. La feuille de route annoncée, avec la transition de Blackwell vers Vera Rubin, suggère que la cadence d'innovation s'accélère et que les entreprises devront adapter leur infrastructure régulièrement pour rester compétitives.

UELe déploiement souverain de Gemini sur Google Distributed Cloud avec chiffrement des données en cours d'utilisation répond aux exigences RGPD des entreprises européennes traitant des données sensibles.

InfrastructureOpinion
1 source
Les entreprises surestiment leur contrôle sur l'IA : 72 % ne sont pas aussi sécurisées qu'elles le croient
85VentureBeat AI 

Les entreprises surestiment leur contrôle sur l'IA : 72 % ne sont pas aussi sécurisées qu'elles le croient

Dans 72 % des entreprises interrogées, les décideurs affirment utiliser au moins deux plateformes d'intelligence artificielle qu'ils considèrent comme leur couche "primaire", selon une enquête menée par VentureBeat auprès de 40 grandes entreprises entre janvier et mars 2026. Ce chiffre révèle un écart béant entre la perception du contrôle et la réalité opérationnelle. L'exemple le plus frappant vient du système hospitalier Mass General Brigham (MGB), plus grand employeur du Massachusetts avec 90 000 salariés : l'an dernier, son directeur technique Nallan Sriraman a dû stopper un nombre incontrôlé de projets pilotes internes en IA qui avaient proliféré sans supervision. MGB a depuis construit une plateforme sécurisée maison autour de Microsoft Copilot, capable de supporter jusqu'à 30 000 utilisateurs, pour empêcher que les données de santé protégées (PHI) des patients ne soient transmises au fournisseur du modèle sous-jacent, OpenAI. En parallèle, l'hôpital doit bâtir un "plan de contrôle" central pour orchestrer les agents IA déployés séparément par Epic, Workday et ServiceNow, qui fonctionnent tous différemment. Ce phénomène de dispersion, que VentureBeat nomme "gouvernance mirage", traduit une contradiction structurelle : les entreprises croient avoir mis en place une gouvernance solide alors qu'elles n'ont défini ni responsabilités claires, ni garde-fous précis, ni processus d'évaluation ou de sécurité réels. Pour les responsables de la sécurité en particulier, cette multiplicité de plateformes, issues de Microsoft Azure, Google, OpenAI, Anthropic ou d'éditeurs applicatifs, élargit mécaniquement la surface d'attaque, à un moment où les cyberattaques assistées par IA gagnent en sophistication. Le paradoxe est d'autant plus aigu que les entreprises se sont tournées vers leurs grands fournisseurs logiciels existants pour éviter de dupliquer les efforts, mais se retrouvent malgré tout contraintes de construire autour de leurs lacunes. Ce contexte reflète la vitesse à laquelle les hyperscalers et les grands éditeurs ont intégré l'IA dans leurs offres, forçant leurs clients entreprise à absorber une complexité non anticipée. Comme l'explique Sriraman avec l'analogie des "six aveugles et l'éléphant", chaque fournisseur décrit l'IA à sa façon, rendant toute vision cohérente difficile à construire. Le marché reste "encore naissant", selon ses termes, ce qui rend les décisions stratégiques particulièrement hasardeuses. La prochaine étape pour des organisations comme MGB sera de stabiliser ces plans de contrôle multi-agents tout en attendant que les fournisseurs mûrissent leurs propres capacités de sécurité, un pari sur un calendrier que personne ne maîtrise vraiment.

UELes entreprises européennes soumises aux obligations de conformité de l'AI Act sont particulièrement exposées à ce risque de 'gouvernance mirage', où un écart entre gouvernance déclarée et réalité opérationnelle pourrait constituer une non-conformité réglementaire.

SécuritéActu
1 source
Stellantis et Microsoft : un partenariat de 5 ans pour révolutionner l’IA automobile
86Le Big Data 

Stellantis et Microsoft : un partenariat de 5 ans pour révolutionner l’IA automobile

Stellantis et Microsoft ont officialisé le 16 avril 2026 un partenariat stratégique de cinq ans destiné à accélérer la transformation numérique du constructeur automobile franco-italo-américain. L'accord prévoit le co-développement de plus de 100 cas d'usage concrets intégrant l'intelligence artificielle dans des domaines aussi variés que le développement produit, la validation, les tests, la maintenance prédictive et la relation client. Sur le plan infrastructure, Stellantis migre l'essentiel de son système informatique vers le cloud Azure de Microsoft, avec un objectif de réduction de 60 % de l'empreinte de ses centres de données d'ici 2029. Le groupe a également déployé 20 000 licences Microsoft 365 Copilot auprès de ses collaborateurs, accompagnées de programmes de formation pour ancrer l'IA dans les pratiques quotidiennes des équipes d'ingénierie, de production et de support. Ce partenariat aura des répercussions concrètes à plusieurs niveaux. Pour les équipes internes, l'IA permettra de détecter plus tôt les anomalies en production, de raccourcir les cycles de validation et d'accélérer la mise sur le marché de nouvelles fonctionnalités logicielles. Pour les clients, certains véhicules pourront suggérer des modes de conduite plus économes ou anticiper des besoins de maintenance avant même qu'une panne survienne. En matière de cybersécurité, Stellantis prévoit de renforcer son centre mondial de cyberdéfense en s'appuyant sur des analyses pilotées par l'IA, couvrant à la fois les systèmes informatiques internes, les véhicules connectés, les sites industriels et les services numériques, dans le but d'anticiper les menaces et de protéger les données clients. Ce rapprochement s'inscrit dans une dynamique de fond qui secoue l'ensemble de l'industrie automobile traditionnelle. Face à la montée en puissance des constructeurs chinois, structurellement plus agiles sur le logiciel et les données, les acteurs historiques comme Stellantis, Volkswagen ou Renault intensifient leurs alliances technologiques pour combler un retard accumulé depuis des années. Ned Curic, directeur de l'ingénierie et de la technologie de Stellantis, a explicitement présenté cette collaboration comme un levier pour « accélérer le déploiement de l'IA dans toute l'entreprise ». La dépendance croissante des véhicules modernes aux logiciels rend cette transformation à la fois urgente et risquée : plus une voiture est connectée, plus elle constitue une cible potentielle pour des cyberattaques, ce qui explique la place centrale accordée à la sécurité dans l'accord. Microsoft, de son côté, consolide ainsi sa position dans le secteur automobile, un marché stratégique où Azure et ses outils d'IA générative sont en concurrence directe avec Google Cloud et AWS.

UEStellantis, maison-mère de Peugeot, Citroën et DS, intègre l'IA dans ses opérations françaises et migre vers Azure, ce qui aura un impact direct sur ses dizaines de milliers de salariés en France et sur la compétitivité de la filière automobile hexagonale face aux constructeurs chinois.

BusinessActu
1 source
Les bons résultats de TSMC confirment l'élan de l'IA
87The Information AI 

Les bons résultats de TSMC confirment l'élan de l'IA

TSMC, le géant taïwanais de la fabrication de puces électroniques, a publié jeudi ses résultats du premier trimestre 2026 avec une croissance de revenus de 40,6%, dépassant le haut de sa fourchette de prévisions. Le PDG C.C. Wei a relevé l'objectif de croissance annuel à plus de 30%, et déclaré que "la demande liée à l'IA continue d'être extrêmement robuste." Cette évaluation repose sur les retours directs des clients de TSMC, au premier rang desquels Nvidia, ainsi que des grandes firmes cloud qui achètent ces puces. Ces résultats constituent un signal fort pour l'ensemble du secteur technologique. Si TSMC, qui fabrique les puces pour pratiquement tous les grands acteurs de l'IA, affiche une telle croissance, cela laisse présager des résultats solides pour les grandes entreprises tech qui publieront leurs chiffres trimestriels plus tard en avril. Les marchés ont déjà anticipé cette dynamique : depuis fin mars, Microsoft a progressé de 18%, Nvidia de 20%, et le Nasdaq dans son ensemble de 16%. La vigueur de TSMC s'inscrit dans un contexte de multiplication des signaux haussiers autour de l'IA, malgré les incertitudes macroéconomiques mondiales. Le fabricant taïwanais occupe une position unique dans la chaîne de valeur : il est le maillon indispensable entre les concepteurs de puces comme Nvidia ou AMD et les déploiements massifs des hyperscalers comme Microsoft Azure, Google Cloud ou Amazon AWS. La robustesse de sa demande suggère que les investissements en infrastructure IA ne montrent aucun signe de ralentissement, alimentant l'optimisme avant une saison de résultats qui s'annonce décisive pour valider, ou nuancer, l'enthousiasme des marchés.

InfrastructureOpinion
1 source
Google et le Pentagone discutent d'un accord IA classifié, l'entreprise renouant avec le secteur militaire
88The Information AI 

Google et le Pentagone discutent d'un accord IA classifié, l'entreprise renouant avec le secteur militaire

Google est en négociation avec le Département de la Défense américain pour un accord qui permettrait au Pentagone de déployer les modèles d'intelligence artificielle Gemini dans des environnements classifiés. L'information, révélée par deux personnes ayant une connaissance directe des discussions, indique que les deux parties envisagent un contrat autorisant l'utilisation de l'IA de Google pour l'ensemble des usages légaux au sein des forces armées américaines. Selon l'une de ces sources, Google aurait proposé d'inclure dans le contrat des clauses restrictives visant à empêcher que ses modèles soient utilisés pour de la surveillance de masse intérieure ou pour des systèmes d'armes autonomes, notamment le ciblage, sans supervision humaine "appropriée". Cet accord marquerait un tournant majeur dans la relation entre Google et le secteur militaire. L'entreprise deviendrait un contractant technologique significatif du Pentagone, avec un accès potentiel à des infrastructures classifiées, un niveau d'engagement rarement atteint dans l'industrie tech civile. Pour l'armée américaine, intégrer Gemini dans des environnements sécurisés ouvrirait la voie à des capacités d'analyse, de traitement du renseignement et de prise de décision assistée par IA à une échelle et une vitesse sans précédent. Les garde-fous proposés par Google, bien que symboliquement importants, restent formulés de façon vague, notamment autour de la notion de contrôle humain "approprié", ce qui laisse une marge d'interprétation considérable. Ce rapprochement s'inscrit dans un renversement de position spectaculaire pour Google. En 2018, face à une fronde interne massive de ses employés, l'entreprise avait abandonné le projet Maven, un contrat avec le Pentagone portant sur l'analyse d'images de drones par IA, et s'était engagée à ne pas développer d'IA à usage militaire offensif. Depuis, la concurrence acharnée avec Microsoft, qui fournit déjà des services cloud et d'IA à l'armée via Azure et ses partenariats avec OpenAI, ainsi que la pression des actionnaires ont poussé Google à reconsidérer cette posture. La course aux contrats gouvernementaux dans le domaine de l'IA est désormais un enjeu stratégique majeur pour l'ensemble des grandes entreprises technologiques américaines.

UECe rapprochement militaro-technologique américain pourrait accélérer les débats européens sur la souveraineté technologique et l'encadrement de l'IA dans la défense.

BusinessActu
1 source
Gemini 3.1 Flash TTS : prenez les commandes de l’émotion grâce aux balises audio
89Le Big Data 

Gemini 3.1 Flash TTS : prenez les commandes de l’émotion grâce aux balises audio

Google a lancé le 15 avril 2026 Gemini 3.1 Flash TTS, son nouveau modèle de synthèse vocale conçu pour donner aux créateurs un contrôle fin sur le rendu émotionnel des voix générées. La principale nouveauté réside dans l'introduction des balises audio, des commandes en langage naturel intégrées directement dans le texte pour piloter le rythme, l'intonation et le style vocal phrase par phrase. Concrètement, un développeur peut indiquer dans sa requête qu'un passage doit être prononcé avec "excitation" ou de manière "explicative", et le modèle adapte sa synthèse en conséquence. Le modèle prend en charge plus de 70 langues, dont 24 bénéficient d'une qualité dite premium, parmi lesquelles l'hindi, le japonais et l'allemand. Il est déjà intégré dans Google Vids, la Gemini API et Google AI Studio, et inclut le watermarking SynthID sur tous les outputs. Cette capacité à sculpter la voix par instructions textuelles représente un changement de paradigme pour les producteurs de contenu audio et les équipes de développement. Jusqu'ici, les modèles TTS généraient une voix uniforme, difficile à différencier selon le contexte ou le ton voulu. Avec Gemini 3.1 Flash TTS, les entreprises qui produisent des podcasts automatisés, des assistants vocaux, des vidéos pédagogiques ou des expériences de narration interactive peuvent adapter le rendu vocal sans post-production manuelle. La couverture multilingue avec maintien de la cohérence émotionnelle ouvre aussi la voie à des déploiements localisés à grande échelle, un enjeu crucial pour les acteurs globaux qui ne peuvent pas se permettre de perdre en expressivité lors du passage d'une langue à l'autre. Cette annonce s'inscrit dans une course intense entre les grands acteurs de l'IA générative pour dominer le segment de la voix. OpenAI a lancé ses propres capacités TTS via l'API et ses modèles de voix en temps réel, ElevenLabs a consolidé sa position sur le marché des créateurs, et Microsoft intègre des fonctions similaires dans Azure Cognitive Services. Google, avec DeepMind en soutien, mise sur l'intégration native dans son écosystème existant, Google Vids, AI Studio, pour accélérer l'adoption sans friction. Le fait que Gemini 3.1 Flash TTS soit directement accessible via la Gemini API suggère une stratégie orientée développeurs d'abord, avant un éventuel déploiement grand public. Les prochaines étapes probables incluent une extension des langues premium, un affinement des balises disponibles et une intégration dans NotebookLM ou d'autres outils de productivité Google déjà très utilisés.

UELes développeurs et producteurs de contenu européens peuvent intégrer dès maintenant des capacités TTS émotionnelles multilingues via la Gemini API, ouvrant la voie à des déploiements localisés à grande échelle sans post-production vocale manuelle.

CréationOpinion
1 source
90VentureBeat AI 

Claude Managed Agents d'Anthropic offre aux entreprises un guichet unique mais soulève un risque de dépendance fournisseur

Anthropic a lancé la semaine dernière une nouvelle plateforme baptisée Claude Managed Agents, destinée aux entreprises souhaitant déployer des agents IA sans se confronter aux complexités techniques habituelles de l'orchestration. Selon Anthropic, la plateforme permet de passer d'un déploiement en semaines ou en mois à quelques jours seulement, en gérant nativement la définition des tâches, des outils et des garde-fous, ainsi que l'exécution des graphes d'état, le routage, la gestion des permissions et le traçage de bout en bout. Des données directionnelles de VentureBeat portant sur plusieurs dizaines d'entreprises au premier trimestre 2026 montrent par ailleurs que l'adoption des API d'orchestration native d'Anthropic est passée de 0 % à 5,7 % entre janvier et février, sur des panels respectifs de 56 et 70 organisations de plus de 100 employés. Microsoft Copilot Studio et Azure AI Studio restaient en tête avec 38,6 % des répondants en février, suivis d'OpenAI à 25,7 %. L'enjeu concret pour les entreprises est double. D'un côté, Claude Managed Agents promet de supprimer la couche d'orchestration externe, sandboxing, checkpointing, gestion des credentials, traçabilité, en l'absorbant directement dans le modèle. C'est un gain de vitesse et de simplicité réel pour des équipes déjà saturées par la multiplication des agents. De l'autre, cela implique de confier les données de session à une base gérée par Anthropic et de laisser l'exécution des agents se dérouler dans un environnement que l'entreprise ne contrôle pas pleinement. Le comportement des agents devient plus difficile à garantir, et les organisations s'exposent à des instructions contradictoires si leur seul levier de contrôle reste le prompting contextuel. Cette sortie s'inscrit dans une course à l'orchestration qui s'intensifie à mesure que les entreprises industrialisent leurs workflows agentiques. Anthropic, porté notamment par l'essor de Claude Code au cours de l'année écoulée, tente ainsi d'élargir son empreinte au-delà de la fourniture de modèles fondamentaux pour devenir le runtime de référence des agents d'entreprise. La stratégie ressemble à celle des grandes plateformes SaaS : créer un écosystème suffisamment intégré pour devenir difficile à quitter. C'est précisément ce que beaucoup d'entreprises espéraient éviter en adoptant l'IA, après avoir déjà subi les effets du lock-in avec leurs fournisseurs logiciels traditionnels. La question qui se pose désormais est de savoir si la promesse de simplicité et de rapidité justifie cette dépendance accrue à un fournisseur unique, et si les concurrents comme Microsoft ou OpenAI proposeront rapidement des alternatives comparables.

UELes entreprises européennes qui adoptent Claude Managed Agents s'exposent à un risque de dépendance fournisseur accru, sans cadre contractuel ou réglementaire spécifique encadrant la souveraineté des données de session confiées à Anthropic.

OutilsOpinion
1 source
Eric Boyd quitte Microsoft pour diriger l’infrastructure chez Anthropic
91Le Big Data 

Eric Boyd quitte Microsoft pour diriger l’infrastructure chez Anthropic

Eric Boyd a quitté Microsoft la semaine dernière après près de 17 ans au sein de l'entreprise pour rejoindre Anthropic en tant que responsable de l'ensemble de l'infrastructure. Boyd avait intégré Microsoft en 2009 à Redmond, d'abord à la tête de Bing Ads, avant de devenir président de la plateforme IA en 2015, puis de prendre la direction d'Azure AI en 2018 sur nomination de Satya Nadella. Dans ce rôle, il a supervisé le développement des grands modèles de langage de Microsoft et planifié les clusters de calcul utilisés par OpenAI pour entraîner et faire tourner ses modèles, consolidant ainsi la position de Microsoft comme acteur incontournable du cloud IA. Avant cela, il avait passé neuf ans chez Yahoo comme vice-président de l'ingénierie de plateforme, qu'il avait quitté en 2008. Chez Anthropic, Boyd n'occupera pas un simple poste administratif : il est chargé de faire évoluer l'infrastructure critique qui permet à l'entreprise d'héberger, déployer et opérer ses modèles à très grande échelle. Sa mission répond à une urgence concrète, la demande pour les services Claude, et en particulier Claude Code, a connu une croissance explosive ces six derniers mois. Rahul Patil, directeur technique d'Anthropic, a précisé sur LinkedIn que Boyd apportera son expertise des infrastructures pour modèles de base à un moment où la scalabilité devient le principal défi opérationnel de l'entreprise. Pour les utilisateurs de Claude et les entreprises qui s'appuient sur l'API, cette nomination signifie qu'Anthropic mise sérieusement sur sa capacité à tenir la charge, et pas seulement sur la qualité de ses modèles. Ce recrutement s'inscrit dans une séquence d'accélération majeure pour Anthropic. La startup a levé 30 milliards de dollars en février 2026 lors d'un tour de table de série G mené par GIC et Coatue, avec la participation de Microsoft et Nvidia, portant sa valorisation à 380 milliards de dollars. Son chiffre d'affaires annuel récurrent a bondi à 30 milliards de dollars, contre environ 9 milliards fin 2025. Parallèlement, Anthropic recrute activement des profils expérimentés du cloud, deux anciens dirigeants de Google auraient déjà rejoint l'entreprise selon The Information, et négocie pour sécuriser plus de 10 GW de capacité de calcul dans les prochaines années. Un accord avec Google et Broadcom prévoit également le développement ou la location de 3,5 GW de TPU à partir de 2027. L'arrivée de Boyd, l'un des architectes de l'infrastructure IA de Microsoft, illustre qu'Anthropic ne cherche plus seulement à produire les meilleurs modèles : elle veut aussi construire la plomberie pour les délivrer au monde entier.

💬 L'homme qui planifiait les clusters d'entraînement d'OpenAI chez Azure débarque chez Anthropic pour prendre toute l'infrastructure. Bon, les modèles Claude sont déjà excellents, mais si l'infra flanche quand Claude Code explose en prod, tout le reste ne sert à rien, et Boyd a construit exactement cette plomberie à l'échelle industrielle pendant des années. C'est le recrutement qui dit que la course n'est plus seulement sur les modèles.

BusinessOpinion
1 source
Nebius en discussions pour racheter la startup israélienne AI21 après l'échec des négociations avec Nvidia
92The Information AI 

Nebius en discussions pour racheter la startup israélienne AI21 après l'échec des négociations avec Nvidia

Nebius, fournisseur cloud soutenu par Nvidia et valorisé à 32 milliards de dollars, est en discussions pour racheter la startup israélienne AI21 Labs, selon des sources proches du dossier. La société, basée à Amsterdam, cherche à élargir ses services d'intelligence artificielle au-delà de son activité principale de location de serveurs GPU. AI21 Labs, dont la dernière valorisation connue était de 1,4 milliard de dollars en 2023, développe des grands modèles de langage et des systèmes d'agents pour les entreprises. Ce rachat potentiel permettrait à Nebius de monter dans la chaîne de valeur de l'IA, en passant de simple infrastructure à fournisseur de solutions logicielles complètes. Pour ses clients, cela signifierait un accès intégré à des modèles et outils d'IA directement via la plateforme cloud, sans passer par des tiers. Pour AI21 Labs, une acquisition représente une issue après l'échec d'une précédente tentative de vente à Nvidia, qui ne s'était pas concrétisée. AI21 Labs fait partie de la première vague de startups israéliennes spécialisées en IA générative, concurrente directe d'OpenAI et Anthropic sur le segment entreprise. La startup avait levé des fonds auprès d'investisseurs majeurs dont Google, Intel Capital et Nvidia lui-même. Le secteur cloud connaît une consolidation accélérée, les fournisseurs d'infrastructure cherchant à intégrer verticalement des capacités IA pour fidéliser leurs clients face à la concurrence d'AWS, Azure et Google Cloud.

UENebius étant basée à Amsterdam, ce rachat potentiel renforcerait la position d'un acteur cloud ancré en Europe dans la chaîne de valeur de l'IA générative enterprise.

BusinessActu
1 source
Manipulateur, sociopathe : qui est vraiment le patron de ChatGPT ?
93Le Big Data 

Manipulateur, sociopathe : qui est vraiment le patron de ChatGPT ?

Une enquête publiée par le New Yorker le 6 avril 2026, signée par les journalistes Ronan Farrow et Andrew Marantz, dresse un portrait sévère de Sam Altman, PDG d'OpenAI. Basée sur des mémos internes inédits et plus de 200 pages de documents, l'enquête compile des témoignages d'anciens collaborateurs qui décrivent un dirigeant au profil atypique : non pas un ingénieur visionnaire, mais un stratège de la persuasion. Altman dirige une entreprise valorisée près de 1 000 milliards de dollars, et son influence sur le secteur de l'intelligence artificielle est considérable. Pourtant, plusieurs sources lui reprochent un rapport très flexible à la vérité : renégociation d'accords après coup, déni d'engagements pourtant documentés, reformulation des faits selon les circonstances. Un ancien collaborateur décrit un effet "Jedi", une capacité à faire croire à chaque interlocuteur que la vision d'Altman est en réalité la sienne. L'impact de ces révélations dépasse le simple portrait de dirigeant. OpenAI occupe une position centrale dans le développement de l'IA mondiale, et la question de sa gouvernance touche directement à la confiance que lui accordent partenaires, régulateurs et utilisateurs. Le cas de Dario Amodei, ancien cadre d'OpenAI devenu PDG d'Anthropic, est particulièrement éloquent : lors des négociations avec Microsoft en 2019, des garanties strictes en matière de sécurité auraient été validées, avant qu'une clause clé ne soit discrètement modifiée. Altman aurait ensuite nié l'existence de ce changement malgré des preuves écrites. Microsoft, principal investisseur d'OpenAI, aurait également subi des revirements similaires : alors qu'OpenAI réaffirmait publiquement l'exclusivité de Azure comme fournisseur cloud, l'entreprise annonçait en parallèle un partenariat avec Amazon sur sa plateforme Frontier dédiée aux agents IA. Ce double discours érode la confiance des partenaires et brouille la lisibilité stratégique d'une entreprise dont chaque mouvement est scruté à l'échelle mondiale. Ces tensions s'inscrivent dans un contexte plus large de questionnement sur la gouvernance d'OpenAI. En novembre 2023, le conseil d'administration avait temporairement évincé Altman avant de le réintégrer sous pression des employés et des investisseurs, révélant déjà des fractures profondes. La conversion d'OpenAI d'organisation à but non lucratif en entreprise commerciale alimente les doutes sur la sincérité de ses engagements éthiques. Le terme "sociopathe" revient dans plusieurs témoignages, ce qui illustre la violence des jugements portés en interne. Altman, lui, continue de se présenter comme un acteur responsable de la transition vers l'IA générale. La question qui traverse toute l'enquête est finalement celle-ci : peut-on bâtir une technologie civilisationnelle en s'appuyant sur un leadership dont la méthode principale est la manipulation, même brillante ?

UELes révélations sur la gouvernance d'OpenAI pourraient renforcer la méfiance des régulateurs européens et compliquer les négociations de conformité dans le cadre de l'AI Act.

BusinessActu
1 source
Transcription, voix, image : Microsoft déploie ses modèles maison dans Foundry
94Blog du Modérateur 

Transcription, voix, image : Microsoft déploie ses modèles maison dans Foundry

Microsoft a intégré trois nouveaux modèles propriétaires à sa plateforme Azure AI Foundry : un modèle de transcription audio, un modèle de synthèse vocale et un modèle de traitement d'image. Ces outils, développés en interne par les équipes de recherche de la firme de Redmond, sont désormais disponibles pour les développeurs et entreprises via l'interface Foundry, la plateforme centralisée de Microsoft pour déployer et tester des modèles d'IA. Cette initiative marque une étape significative dans la stratégie de diversification de Microsoft, qui cherche à réduire sa dépendance technologique à l'égard d'OpenAI, son partenaire de référence depuis l'investissement massif de 13 milliards de dollars. En proposant ses propres modèles spécialisés sur des tâches précises comme la transcription ou la reconnaissance visuelle, Microsoft offre aux entreprises clientes des alternatives intégrées à l'écosystème Azure, potentiellement moins coûteuses et plus facilement personnalisables. Cette évolution s'inscrit dans une tendance de fond : les grandes plateformes cloud cherchent toutes à maîtriser leur chaîne de valeur IA de bout en bout. Google avec Gemini, Amazon avec Titan et Nova, et désormais Microsoft avec ses modèles maison renforcent chacun leurs capacités propriétaires, réduisant le pouvoir de négociation des fournisseurs tiers et consolidant leur emprise sur les entreprises qui bâtissent sur leur infrastructure.

UELes entreprises européennes sur Azure AI Foundry disposent désormais de modèles propriétaires Microsoft pour la transcription, la synthèse vocale et l'image, comme alternatives intégrées aux solutions OpenAI.

OutilsOutil
1 source
Microsoft étend son offre IA avec de nouveaux modèles vocaux et visuels
95AI Business 

Microsoft étend son offre IA avec de nouveaux modèles vocaux et visuels

Microsoft franchit une nouvelle étape dans le développement de ses propres modèles d'intelligence artificielle en annonçant des systèmes dédiés à la voix et à l'image, allant au-delà des grands modèles de langage textuels sur lesquels la firme de Redmond s'est largement appuyée jusqu'ici. Cette initiative marque une volonté affichée de maîtriser l'ensemble de la chaîne des capacités d'IA, plutôt que de sous-traiter ces briques à des partenaires externes. L'enjeu est considérable pour l'industrie : en développant ses propres modèles vocaux et visuels, Microsoft réduit sa dépendance vis-à-vis d'OpenAI, dont il est le principal investisseur et distributeur via Azure. Cela lui permettrait de proposer des solutions plus intégrées, moins coûteuses et plus personnalisables pour ses clients entreprises, tout en gardant la main sur la roadmap technologique de ses produits phares comme Copilot. Cette évolution s'inscrit dans une tendance plus large de verticalisation de l'IA au sein des grandes plateformes technologiques : Google, Apple et Amazon ont chacun suivi une trajectoire similaire. La relation entre Microsoft et OpenAI, longtemps présentée comme un partenariat exclusif, montre ainsi ses limites stratégiques à mesure que l'IA devient un avantage concurrentiel central. La course à la souveraineté sur les modèles fondamentaux ne fait que commencer.

UELes entreprises françaises et européennes utilisant Azure pourraient accéder à des modèles vocaux et visuels plus intégrés et compétitifs, réduisant leur dépendance indirecte à OpenAI.

OutilsOpinion
1 source
AWS lance des agents autonomes pour les tests de sécurité et les opérations cloud
96AWS ML Blog 

AWS lance des agents autonomes pour les tests de sécurité et les opérations cloud

Amazon Web Services a annoncé la disponibilité générale de deux agents autonomes d'intelligence artificielle lors de son événement re:Invent : AWS Security Agent, dédié aux tests d'intrusion, et AWS DevOps Agent, spécialisé dans les opérations cloud. Ces systèmes appartiennent à une nouvelle catégorie baptisée « frontier agents » — des IA capables de travailler de façon autonome pendant des heures, voire des jours, sans supervision humaine continue. Selon AWS, les retours des clients en phase de préversion sont significatifs : AWS Security Agent réduit les délais de tests de pénétration de plusieurs semaines à quelques heures, tandis qu'AWS DevOps Agent accélère la résolution d'incidents de 3 à 5 fois. Des entreprises comme Bamboo Health et HENNGE K.K. témoignent de résultats concrets, cette dernière affirmant avoir réduit la durée de ses cycles de sécurité de plus de 90 %. L'enjeu pour les équipes de sécurité et d'exploitation est majeur. La plupart des organisations ne peuvent aujourd'hui faire réaliser des tests de pénétration manuels que sur leurs applications les plus critiques, faute de temps et de budget — laissant la majorité de leur portefeuille logiciel vulnérable entre deux cycles d'audit. AWS Security Agent change cette équation en analysant le code source, les diagrammes d'architecture et la documentation pour reconstituer des chaînes d'attaque complexes que les scanners traditionnels ne détectent pas. Côté opérations, AWS DevOps Agent s'intègre avec les principaux outils du marché — CloudWatch, Datadog, Dynatrace, Splunk, Grafana, GitHub, GitLab — et corrèle télémétrie, code et données de déploiement pour identifier la cause racine d'un incident, qu'il s'agisse d'infrastructures AWS, Azure, hybrides ou on-premise. Pour les équipes SRE débordées, c'est la promesse d'un coéquipier disponible en permanence. Ces annonces s'inscrivent dans une course à l'automatisation des opérations IT qui s'intensifie depuis l'essor des grands modèles de langage. Les hyperscalers — AWS, Microsoft Azure, Google Cloud — cherchent tous à proposer des agents capables de gérer des tâches complexes et durables, au-delà des simples assistants conversationnels. AWS positionne explicitement ces outils non comme des aides ponctuelles, mais comme de véritables extensions de l'équipe humaine, capables de prendre des décisions en plusieurs étapes sans intervention constante. Amy Herzog, vice-présidente et RSSI d'AWS, indique que l'entreprise utilise elle-même AWS Security Agent en interne. La question qui se posera à mesure de l'adoption est celle de la gouvernance : jusqu'où déléguer à une IA des décisions critiques sur la sécurité ou la stabilité des systèmes de production ?

UELes entreprises européennes utilisant AWS peuvent adopter ces agents pour réduire leurs coûts et délais de tests de sécurité, mais la délégation de décisions critiques à une IA soulève des questions de conformité avec le RGPD et l'AI Act.

OutilsOutil
1 source
NVIDIA GTC : l'Omniverse au service de l'IA physique
97NVIDIA AI Blog 

NVIDIA GTC : l'Omniverse au service de l'IA physique

Lors de la conférence GTC la semaine dernière, NVIDIA a présenté plusieurs avancées majeures pour ce que l'entreprise appelle l'« ère de l'IA physique » — une phase où robots, véhicules autonomes et usines intelligentes passent de déploiements isolés à des systèmes industriels à grande échelle. Au cœur de ces annonces figurent trois nouveaux modèles de frontière : Cosmos 3 pour la modélisation du monde réel, Isaac GR00T N1.7 dédié aux compétences des robots humanoïdes, et Alpamayo 1.5 pour la conduite autonome. NVIDIA a également lancé deux blueprints open source : le Physical AI Data Factory Blueprint, destiné à produire des données d'entraînement à partir de simulations, et l'Omniverse DSX Blueprint, une architecture de référence pour créer des jumeaux numériques d'usines d'IA complètes. Des partenaires comme FieldAI, Hexagon Robotics, Skild AI et Teradyne Robotics utilisent déjà ces outils, tandis que Microsoft Azure et Nebius sont les premiers clouds à proposer le blueprint en mode clé en main. L'enjeu central de ces annonces est de résoudre un problème structurel de l'IA physique : les données réelles ne suffisent plus. Le monde réel est imprévisible, les cas limites sont innombrables, et les pipelines de collecte restent fragmentés. NVIDIA positionne donc la puissance de calcul elle-même comme une fabrique de données — transformant des scènes simulées en datasets massifs, diversifiés et hautement qualifiés. Pour les développeurs de robots et de véhicules autonomes, cela signifie pouvoir entraîner des modèles sur des millions de situations synthétiques sans dépendre d'une collecte terrain coûteuse. Parallèlement, l'Omniverse DSX Blueprint permet aux opérateurs d'usines d'IA de simuler thermiques, réseaux électriques et charges réseau avant même d'installer le premier serveur — réduisant les délais et les dépassements de budget sur des infrastructures qui coûtent des centaines de millions de dollars. Ces développements s'inscrivent dans une stratégie plus large de NVIDIA pour imposer son écosystème comme couche universelle de l'IA industrielle. Le format OpenUSD — langage de description de scènes 3D initialement développé par Pixar — joue un rôle clé en permettant de convertir des fichiers CAO d'ingénierie en environnements de simulation directement exploitables. Des frameworks open source comme OpenClaw viennent compléter la pile en orchestrant des agents autonomes capables de gérer des workflows complexes sur des machines dédiées. Avec l'intégration de partenaires cloud majeurs et d'une dizaine d'acteurs industriels, NVIDIA consolide une position de plateforme incontournable à un moment où la compétition pour contrôler l'infrastructure de l'IA physique — robots, voitures, usines — s'intensifie face à des concurrents comme Google DeepMind, Boston Dynamics et les constructeurs automobiles investissant massivement dans leurs propres systèmes embarqués.

UELes industriels et startups européens en robotique ou véhicules autonomes peuvent accéder via Microsoft Azure aux blueprints open source NVIDIA pour entraîner des modèles sur données synthétiques, réduisant leur dépendance coûteuse à la collecte terrain.

InfrastructureOpinion
1 source
IA pratique : cessez de confier vos secrets aux services d’IA
98ZDNET FR 

IA pratique : cessez de confier vos secrets aux services d’IA

OpenAI, Google, Microsoft et d'autres géants du cloud proposent des services d'intelligence artificielle capables d'analyser des documents, rédiger des emails et automatiser des tâches complexes — mais à quel prix pour la confidentialité ? Chaque texte soumis à ces plateformes transite par des serveurs distants, où il peut être stocké, analysé par des ingénieurs pour améliorer les modèles, ou exposé lors de violations de données. Des entreprises comme Samsung ont déjà subi des fuites après que des employés ont collé du code source propriétaire dans ChatGPT, illustrant concrètement ce risque souvent sous-estimé. Pour les professionnels manipulant des données sensibles — contrats juridiques, dossiers médicaux, informations financières ou secrets industriels — utiliser des services d'IA cloud sans précautions revient à confier ses dossiers à un tiers inconnu. Les conditions d'utilisation de la plupart des plateformes autorisent explicitement l'usage des données soumises pour entraîner ou améliorer leurs modèles, sauf opt-out explicite. Les risques sont amplifiés dans les secteurs régulés : une fuite peut entraîner des sanctions RGPD pouvant atteindre 4 % du chiffre d'affaires annuel mondial, voire engager la responsabilité pénale. Des alternatives existent : déploiement de modèles en local via des outils comme Ollama ou LM Studio, utilisation d'offres cloud avec garanties de confidentialité renforcées (Azure OpenAI avec data residency, Mistral AI en souverain européen), ou anonymisation systématique avant soumission. La montée en puissance des modèles locaux performants — Llama 3, Mistral, Gemma — rend désormais viables ces approches pour de nombreux cas d'usage professionnels, réduisant la dépendance aux services cloud tout en préservant la confidentialité des données critiques.

UELes entreprises françaises et européennes sont directement exposées aux sanctions RGPD (jusqu'à 4 % du CA mondial) en cas de fuite de données via des services IA cloud, et peuvent se tourner vers Mistral AI comme alternative souveraine européenne.

SécuritéOpinion
1 source
Nvidia et des startups s'affrontent pour rendre OpenClaw plus sûr
99The Information AI 

Nvidia et des startups s'affrontent pour rendre OpenClaw plus sûr

Nvidia, des startups comme Perplexity et Genspark s'activent pour proposer des versions sécurisées d'OpenClaw, le logiciel open-source populaire pour agents IA personnels, après plusieurs incidents de sécurité embarrassants — dont la suppression massive d'e-mails de la directrice d'alignement de Meta, Summer Yue. En Chine, des agences gouvernementales ont déjà interdit l'installation d'OpenClaw sur les appareils professionnels. Genspark lance notamment Genspark Claw, qui isole l'agent dans une machine virtuelle cloud (Microsoft Azure) pour contenir les dommages potentiels, à 80 ou 140 $/mois selon Wen Sang, co-fondateur et COO.

SécuritéActu
1 source
Anthropic veut imposer Claude aux entreprises avec sa marketplace
100Le Big Data 

Anthropic veut imposer Claude aux entreprises avec sa marketplace

Anthropic lance l'Anthropic Marketplace, une plateforme permettant aux entreprises clientes d'utiliser leur budget API existant pour acheter des logiciels de partenaires comme Snowflake, Harvey et Replit, sans multiplier les contrats séparés. Contrairement aux marketplaces cloud d'AWS ou Azure, Anthropic ne prélève aucune commission sur les ventes, misant sur la fidélisation plutôt que sur les revenus directs. Ce lancement intervient dans un contexte tendu : le Pentagone vient de classer Anthropic comme risque pour sa chaîne d'approvisionnement, compliquant ses relations avec certaines organisations liées au ministère de la Défense.

BusinessActu
1 source