Aller au contenu principal

Dossier Microsoft — page 8

1056 articles · page 8 sur 22

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

Meta traque les moindres gestes de ses employés pour nourrir son IA : ils ont dit stop
351Le Big Data ÉthiqueActu

Meta traque les moindres gestes de ses employés pour nourrir son IA : ils ont dit stop

Meta a dû reculer face à la fronde interne provoquée par son programme MCI (Model Capability Initiative), un dispositif de surveillance des employés lancé en avril 2026 et destiné à entraîner ses intelligences artificielles. Selon une note interne relayée par The Information et des publications consultées par Reuters, l'entreprise a annoncé plusieurs ajustements : renforcement des protections de la vie privée, possibilité pour certains salariés de demander une exemption, et introduction d'une fonction permettant de suspendre le suivi pendant 30 minutes. Concrètement, MCI enregistre les mouvements de souris, les clics, la navigation dans les menus et surveille plus de 200 applications et sites web sur les ordinateurs des employés américains. L'objectif déclaré est de développer des agents IA capables d'exécuter de manière autonome des tâches informatiques du quotidien. Mais des analyses internes ont révélé que la collecte allait bien au-delà : modifications de code, cycles de mise en veille, historiques de navigation, contenus copiés-collés dans le presse-papiers, et même des échanges par e-mail ou Google Chat impliquant des collègues situés hors des États-Unis. Meta a par ailleurs reconnu que certaines de ces données avaient été stockées sous une forme moins sécurisée que prévu, et que le logiciel provoquait des pics de consommation internet pouvant épuiser un forfait mensuel en quelques jours. L'ampleur de la révolte illustre les limites d'une approche qui traite les salariés comme source de données d'entraînement sans leur consentement éclairé. Le porte-parole Dave Arnold a insisté sur le fait que MCI cible les interactions avec les ordinateurs et non le contenu affiché, mais les journaux techniques examinés en interne contredisent partiellement cette affirmation. Pour les employés concernés, les enjeux sont doubles : une atteinte directe à la vie privée sur leurs outils de travail, et un précédent qui pourrait normaliser une surveillance de masse au sein des grandes entreprises tech. Pour le secteur plus largement, cette résistance pose une question de fond : jusqu'où les entreprises peuvent-elles mobiliser leurs propres effectifs comme matière première pour l'IA sans déclencher une opposition organisée ? Meta n'est pas seule à chercher des données comportementales réalistes pour entraîner des agents IA capables de piloter des interfaces graphiques. Microsoft, Google et Anthropic travaillent tous sur des systèmes similaires. La différence, c'est que Meta a choisi de collecter ces données directement sur les machines de ses propres employés, court-circuitant le recours à des datasets publics ou à des utilisateurs volontaires. Cette stratégie révèle une pression croissante sur les labos d'IA pour produire des agents "computer use" compétitifs, dans un calendrier serré. Les concessions annoncées par Meta ressemblent davantage à un ajustement tactique qu'à une remise en cause du programme : MCI continue de fonctionner, et la collecte de comportements humains réels demeure au coeur de la course aux agents autonomes.

UELa collecte incluait des données d'employés hors États-Unis, exposant potentiellement Meta à des sanctions RGPD et posant un précédent sur la légalité de la surveillance des salariés dans les entreprises tech opérant en Europe.

1 source
OpenAI met à jour Codex : les agents peuvent créer des espaces de travail interactifs via Sites et plugins par rôle
352VentureBeat AI 

OpenAI met à jour Codex : les agents peuvent créer des espaces de travail interactifs via Sites et plugins par rôle

OpenAI a annoncé mardi une mise à jour majeure de sa plateforme agentique Codex, avec l'introduction de plusieurs fonctionnalités destinées à conquérir le monde de l'entreprise : des plugins sectoriels, un outil d'édition ciblée baptisé "Annotations", et une fonctionnalité d'hébergement web rapide appelée "Sites". Cette évolution transforme délibérément Codex, jusqu'ici perçu comme un assistant spécialisé pour développeurs, en environnement de travail quotidien pour les professionnels non-techniques. Parmi les 5 millions d'utilisateurs hebdomadaires de la plateforme, les non-développeurs, analystes financiers, marketeurs, opérationnels, chercheurs, représentent désormais environ 20% de la base et adoptent l'outil trois fois plus vite que les ingénieurs traditionnels. La fonctionnalité Annotations résout un problème concret qui freinait l'adoption en entreprise : jusqu'ici, demander à l'IA de modifier un graphique ou un calcul dans un tableur forçait le modèle à réécrire l'intégralité du fichier, détruisant souvent la mise en forme et introduisant des erreurs. Annotations isole précisément le segment sélectionné par l'utilisateur, un bloc de cellules dans un modèle financier, par exemple, et exécute les modifications sans toucher aux formules, styles ou dépendances environnantes. En parallèle, OpenAI déploie six plugins métier qui agrègent 62 applications professionnelles et 110 compétences automatisées dès le départ : un plugin Data Analytics connecte Snowflake, Databricks et Tableau ; le plugin Creative Production intègre Figma, Canva et Shutterstock ; le plugin Sales synchronise Salesforce, HubSpot, Slack et Clay ; le plugin Finance bancaire agrège des flux institutionnels comme Moody's, FactSet, PitchBook et S&P pour automatiser la modélisation financière et la préparation de pitch books. Le calendrier de cette annonce n'est pas anodin : elle intervient précisément au moment où Microsoft, principal investisseur mais concurrent direct d'OpenAI, ouvre sa conférence annuelle Build à San Francisco, où plusieurs outils de productivité enterprise concurrents sont attendus. Elle suit aussi de près la progression rapide d'Anthropic sur ce même segment, via Claude et Claude Code, auprès des travailleurs du savoir. OpenAI cherche à positionner Codex comme la référence pour l'automatisation des tâches de col blanc, avant que le marché des agents IA d'entreprise ne se structure autour d'autres acteurs. La stratégie est claire : ne plus réserver l'IA agentique aux équipes techniques, mais en faire un couche opérationnelle transversale, accessible à chaque département sans intervention du service informatique.

UELes entreprises françaises et européennes peuvent désormais déployer Codex dans leurs workflows métier, finance, marketing, ventes, sans ressources techniques dédiées, ce qui accélère concrètement l'adoption de l'IA agentique dans les organisations non technologiques.

OutilsOutil
1 source
Avec Anthropic, OpenAI et SpaceX, Wall Street s’apprête à vivre son plus grand cycle technologique depuis Internet
353FrenchWeb 

Avec Anthropic, OpenAI et SpaceX, Wall Street s’apprête à vivre son plus grand cycle technologique depuis Internet

Wall Street se prépare à entrer dans ce qui pourrait être le plus grand cycle d'introductions en Bourse depuis la bulle Internet des années 2000, porté par trois géants technologiques encore privés : Anthropic, OpenAI et SpaceX. Ces entreprises, valorisées chacune à des centaines de milliards de dollars, concentrent une attention inédite de la part des investisseurs institutionnels et des marchés publics, qui n'ont jusqu'ici pu y accéder qu'indirectement. Aucune date officielle n'a été annoncée, mais les signaux se multiplient indiquant que la fenêtre d'introduction se rapproche. L'enjeu est considérable pour les marchés financiers : une cotation d'OpenAI ou d'Anthropic représenterait une occasion rare pour les investisseurs particuliers et les fonds classiques d'entrer au capital des acteurs centraux de la révolution IA. Cela redistribuerait les flux de capitaux aujourd'hui concentrés chez quelques fonds de capital-risque et fonds souverains, tout en offrant une liquidité aux premiers actionnaires et employés de ces sociétés. Pendant plus d'une décennie, les entreprises technologiques les plus prometteuses ont délibérément évité la Bourse, préférant lever des dizaines de milliards en privé auprès de SoftBank, des fonds du Golfe ou de Microsoft, qui a investi plus de 13 milliards de dollars dans OpenAI. Cette stratégie a permis de croître sans la pression des marchés trimestriels, mais les valorisations atteignent désormais des niveaux qui rendent une sortie en Bourse quasi inévitable pour offrir de la liquidité aux investisseurs historiques et financer la prochaine phase d'expansion.

UELes fonds institutionnels et investisseurs particuliers européens pourraient pour la première fois accéder directement aux principaux acteurs de l'IA via les marchés publics, redistribuant des flux de capitaux aujourd'hui monopolisés par quelques fonds américains et fonds souverains du Golfe.

BusinessOpinion
1 source
Workday et Google Cloud déploient des agents IA pour les RH et la finance
354Le Big Data 

Workday et Google Cloud déploient des agents IA pour les RH et la finance

Workday et Google Cloud ont annoncé le 29 mai 2026 une extension significative de leur partenariat, visant à intégrer les agents IA de Workday directement dans Gemini Enterprise, la suite collaborative de Google. Concrètement, l'agent Sana Self-Service de Workday s'imbrique désormais dans l'environnement Google que les collaborateurs utilisent au quotidien. Un salarié peut ainsi consulter son solde de congés, récupérer un bulletin de paie ou soumettre une demande d'absence sans jamais ouvrir l'interface Workday. Les managers gagnent eux aussi en autonomie : approbation de feuilles de temps, lancement d'évaluations de performance, accès aux objectifs d'équipe, tout cela depuis une interface conversationnelle unique. Côté finance, les utilisateurs peuvent interroger les politiques de dépenses et initier des démarches administratives sans changer d'outil. L'annonce confirme par ailleurs que Gemini devient le modèle d'IA par défaut de Sana dans Workday, remplaçant les solutions précédemment utilisées. L'enjeu est considérable pour les grandes organisations, qui souffrent depuis des années d'une fragmentation logicielle coûteuse : les équipes jonglent quotidiennement entre suites RH, ERP financiers, outils collaboratifs et plateformes analytiques pour accomplir des tâches souvent élémentaires. En ancrant les agents directement dans les outils de travail existants, Workday et Google Cloud cherchent à éliminer ces frictions et à accélérer l'exécution des processus métiers. Pour les directions RH et financières, qui manipulent des données sensibles soumises à des réglementations strictes, l'intégration apporte aussi les capacités de raisonnement avancé, le support multimodal et le traitement multilingue de Gemini, tout en maintenant les garde-fous métier, les règles d'approbation et les contrôles de conformité propres à Workday. Ce rapprochement s'inscrit dans une tendance de fond qui voit les grands éditeurs de logiciels d'entreprise transformer leurs plateformes en orchestrateurs d'agents IA. Workday, qui gère les ressources humaines et les finances de milliers de grandes entreprises mondiales, dispose d'un levier stratégique majeur : ses données métier structurées, longtemps cloisonnées dans ses interfaces propriétaires. En ouvrant ces données aux agents via Gemini, l'éditeur américain positionne sa plateforme comme un nœud central des architectures multi-agents qui émergent dans les grands groupes. Pour Google Cloud, faire de Gemini le moteur par défaut de Sana représente une victoire commerciale et un signal fort envoyé à l'ensemble de l'écosystème enterprise, dans un marché où Microsoft, avec Copilot intégré à Office 365 et Dynamics, exerce une pression concurrentielle intense. Les prochaines étapes du partenariat devraient porter sur l'orchestration de workflows plus complexes, impliquant plusieurs agents agissant en coordination sur des processus bout-en-bout.

UELes grandes entreprises françaises et européennes utilisant Workday et Google Workspace pourraient réduire la fragmentation logicielle de leurs équipes RH et finance grâce à cette intégration.

OutilsOutil
1 source
Nvidia présente RTX Spark comme la puce qui rend enfin les agents IA locaux viables sur Windows
355The Decoder 

Nvidia présente RTX Spark comme la puce qui rend enfin les agents IA locaux viables sur Windows

Nvidia a présenté le RTX Spark, une puce conçue pour rendre les agents IA locaux véritablement utilisables sur les PC Windows portables. La puce combine un GPU Blackwell avec un processeur Grace basé sur l'architecture Arm, jusqu'à 128 Go de mémoire partagée et une puissance de calcul annoncée à 1 000 TOPS en FP4. Les premiers appareils équipés du RTX Spark seront commercialisés à partir de l'automne 2026 par ASUS, Dell, HP, Lenovo, Microsoft Surface et MSI. Le RTX Spark vise directement les puces Apple Silicon et les processeurs Qualcomm Snapdragon X qui dominent aujourd'hui le segment des PC dits "AI". Disposer de 128 Go de mémoire partagée est un atout décisif : cela permet de faire tourner en local des modèles de langage de grande taille, sans recourir au cloud, avec une latence réduite et une confidentialité des données préservée. Pour les entreprises et les développeurs, cette configuration ouvre la voie à des agents IA autonomes fonctionnant directement sur l'appareil de l'utilisateur, sans dépendance à une connexion Internet. Ce lancement s'inscrit dans la bataille que se livrent les fabricants de puces pour capter le marché des ordinateurs portables à capacités IA embarquées. Apple a pris une avance significative avec ses puces M-series, notamment grâce à leur architecture à mémoire unifiée. Qualcomm a répondu avec les Snapdragon X Elite sur Windows. Nvidia, dont la domination est historiquement liée aux datacenters et aux GPU discrets, cherche à s'imposer dans le segment mobile avec une approche intégrée CPU-GPU inédite sous Windows. L'automne 2026 marquera un test grandeur nature pour cette stratégie face à des concurrents déjà bien installés.

UELes PC équipés du RTX Spark arriveront en Europe à l'automne 2026, offrant aux entreprises françaises et européennes des capacités d'IA locale sans dépendance au cloud, un atout direct en contexte RGPD.

InfrastructureActu
1 source
Créer des agents multi-locataires avec Amazon Bedrock AgentCore
356AWS ML Blog 

Créer des agents multi-locataires avec Amazon Bedrock AgentCore

Amazon a lancé Bedrock AgentCore, un service managé et serverless conçu pour permettre aux éditeurs de logiciels SaaS de déployer des applications agentiques en environnement multi-tenant sur AWS. Le service offre des primitives pour héberger des agents et des serveurs MCP (Model Context Protocol), avec une gestion intégrée des identités, de la mémoire, de l'observabilité et des évaluations. Le coeur de son architecture repose sur des microVMs isolées par session: chaque session client obtient son propre environnement d'exécution éphémère, avec un système de fichiers persistant propre, sans le coût ni la latence d'une machine virtuelle complète. Le contexte du tenant transite via des en-têtes HTTP personnalisés, portant l'identifiant du tenant, son niveau de service, ses préférences régionales et ses droits d'accès aux outils, ce qui permet à l'agent d'adapter dynamiquement son comportement sans logique de routage codée en dur. Cette approche répond directement au fossé qui sépare un prototype fonctionnel d'un déploiement en production dans un contexte SaaS. Les architectes d'applications agentiques devaient jusqu'ici résoudre manuellement six problèmes distincts: l'isolation des tenants, la propagation de leur identité, l'observabilité par tenant, l'isolation des données, l'attribution des coûts et la mitigation du "noisy neighbor" (un tenant monopolisant les ressources au détriment des autres). AgentCore propose trois patterns d'isolation, appelés Silo, Pool et Bridge, chacun offrant un compromis différent entre protection stricte et mutualisation des coûts. Pour les éditeurs gérant des centaines ou des milliers de clients sur une même plateforme, cette capacité à choisir un modèle d'isolation par segment tarifaire change concrètement l'équation économique et de conformité. Le lancement s'inscrit dans une course des grands fournisseurs cloud à imposer leurs infrastructures agentiques comme standard de facto pour la prochaine génération d'applications IA. AWS fait face à la concurrence directe de Google avec Vertex AI Agent Builder et de Microsoft avec Azure AI Agent Service, tous trois cherchant à capter les équipes d'ingénierie qui passent de l'expérimentation à la production. L'article publié par AWS est le premier d'une série, ce qui suggère que d'autres composants d'AgentCore (évaluation, fine-tuning par tenant, facturation granulaire) seront détaillés dans les prochaines semaines. La question centrale pour les équipes SaaS reste le degré de lock-in accepté en échange de la simplicité opérationnelle qu'offre un service pleinement managé.

UELes éditeurs SaaS européens construisant sur AWS peuvent exploiter les patterns d'isolation et les préférences régionales d'AgentCore pour satisfaire les exigences de résidence des données imposées par le RGPD.

OutilsOpinion
1 source
☕️ Après l’annonce de licenciements, Meta déplace 7 000 employés pour se focaliser sur l’IA
357Next INpact 

☕️ Après l’annonce de licenciements, Meta déplace 7 000 employés pour se focaliser sur l’IA

Meta a annoncé le 18 mai la réassignation de 7 000 de ses employés vers des équipes dédiées au développement de l'intelligence artificielle. Ces salariés seront répartis dans quatre nouveaux groupes internes chargés de concevoir des outils et des applications fondés sur l'IA. L'annonce a été faite par la directrice des ressources humaines Jannelle Gale dans un mémo interne, qui précise que ces nouvelles structures fonctionneront avec moins de niveaux hiérarchiques que le reste de l'entreprise, selon un modèle dit "AI native". Cette réorganisation intervient quelques jours avant la suppression de 8 000 postes, prévue à partir du 20 mai, sur un effectif total de 78 000 personnes qui font tourner Facebook, Instagram et WhatsApp au quotidien, soit environ 10 % des effectifs du groupe. Cette double opération, réassignation massive et licenciements, illustre la vitesse à laquelle Meta pivote vers l'IA comme axe stratégique central. En regroupant des milliers d'ingénieurs et de product managers dans des structures dédiées et allégées, le groupe cherche à accélérer le développement de produits IA tout en réduisant les coûts opérationnels liés aux activités moins prioritaires. Pour les salariés concernés, le signal est sans ambiguïté : ceux qui ne s'intègrent pas dans cette nouvelle logique n'ont plus de place dans l'organisation. Pour l'industrie, cela confirme que l'IA n'est plus un projet parallèle mais la colonne vertébrale autour de laquelle les grandes plateformes restructurent leur capital humain. Meta n'est pas seule dans cette démarche. Microsoft, Block et Coinbase ont annoncé des réorganisations comparables ces derniers mois, invoquant elles aussi leurs ambitions en matière d'intelligence artificielle. Depuis le début de l'année 2026, le site layoffs.fyi a recensé plus de 110 000 suppressions de postes dans le secteur technologique, un mouvement que les dirigeants présentent systématiquement comme une transition vers l'IA plutôt que comme une simple réduction des coûts. Mark Zuckerberg, qui a fait de l'IA la priorité absolue de Meta pour les prochaines années, dispose désormais d'une organisation entière reconfigurée pour concrétiser cette ambition.

UELa restructuration touche potentiellement des milliers de salariés de Meta en Europe et accélère la pression sur les travailleurs du numérique à se repositionner sur des compétences IA pour rester employables.

💬 7 000 réassignations plus 8 000 licenciements en même temps, c'est pas une transition, c'est un tri. Meta dit clairement aux siens : soit tu construis l'IA, soit tu n'as plus ta place, et le calendrier (réorganisation annoncée deux jours avant les coupes) montre que c'est pas une décision prise à la légère. Le truc un peu vertigineux, c'est que Microsoft, Coinbase, Block font exactement pareil en ce moment, et que tout le monde appelle ça "transition vers l'IA" alors qu'on recense déjà 110 000 postes supprimés depuis janvier.

☕️ Après l’annonce de licenciements, Meta déplace 7 000 employés pour se focaliser sur l’IA
358Next INpact 

☕️ Après l’annonce de licenciements, Meta déplace 7 000 employés pour se focaliser sur l’IA

Le 18 mai 2026, Meta a annoncé la réassignation de 7 000 de ses employés vers des postes entièrement dédiés au développement de l'intelligence artificielle. Ces salariés seront répartis au sein de quatre nouveaux groupes internes chargés de concevoir des outils et des applications fondés sur l'IA. L'annonce, révélée par le New York Times, est intervenue simultanément avec celle du licenciement de 8 000 personnes, soit environ 10 % des 78 000 employés qui font fonctionner Facebook, Instagram et WhatsApp au quotidien. Les départs effectifs commencent le 20 mai. Selon le mémo interne de la directrice des ressources humaines Jannelle Gale, ces nouvelles structures disposeront de moins de couches managériales, adopteront des organisations dites « AI natives » et doivent rendre l'entreprise globalement « plus productive ». Cette double opération, coupes d'un côté, réorientation de l'autre, illustre la transformation profonde que Meta impose à son organisation au nom de l'IA. Pour les équipes concernées, cela signifie un changement radical de priorités : moins de maintenance des produits existants, davantage de construction de fonctionnalités génératives. Pour l'industrie, c'est un signal clair que les grandes plateformes ne considèrent plus la modération, le support ou certaines fonctions produits comme des activités à fort effectif humain. Les postes supprimés ne reviendront pas : ils sont absorbés, en partie, par des systèmes automatisés. Meta s'inscrit dans une tendance sectorielle plus large. Microsoft, Block et Coinbase ont annoncé des réorganisations comparables ces derniers mois, toutes justifiées par les investissements massifs dans l'IA générative. Selon le tracker layoffs.fyi, plus de 110 000 postes ont été supprimés dans la tech depuis le début de l'année 2026. Si toutes ces suppressions ne sont pas directement attribuables à l'IA, la corrélation est devenue difficile à ignorer. Pour Mark Zuckerberg, qui a fait de l'IA le pivot stratégique de Meta pour les prochaines années, cette réorganisation est la traduction concrète d'un pari industriel engagé depuis 2023 avec l'ouverture du modèle Llama et l'intégration de Meta AI dans ses plateformes.

UELes employés européens de Meta (siège UE en Irlande) pourraient être directement affectés par cette vague de licenciements, et la tendance sectorielle accélère le débat politique en Europe sur la protection de l'emploi face à l'automatisation par l'IA.

BusinessOpinion
1 source
71 % des Américains sont opposés aux datacenters IA, 53 % aux centrales nucléaires
359Next INpact 

71 % des Américains sont opposés aux datacenters IA, 53 % aux centrales nucléaires

Sept Américains sur dix s'opposent à la construction d'un centre de données dédié à l'intelligence artificielle dans leur région, selon un sondage Gallup publié en 2025. Plus précisément, 71 % des personnes interrogées se déclarent défavorables à ces projets, dont 48 % qui s'y disent « fermement opposés ». À peine un quart des répondants y sont favorables, et seulement 7 % se montrent « très favorables ». Pour mesurer ce rejet, Gallup a utilisé la même formulation que celle employée depuis des décennies pour interroger les Américains sur le nucléaire : « Seriez-vous favorable ou opposé à la construction d'un centre de données dans votre région pour soutenir la technologie de l'intelligence artificielle ? » C'est la première fois que l'institut posait cette question sur les datacenters. En parallèle, 46 % des sondés se déclarent très inquiets de l'impact environnemental de ces infrastructures, et 24 % assez inquiets, des chiffres qui recoupent étroitement le niveau d'opposition générale. Ce résultat est d'autant plus frappant qu'il dépasse largement le rejet historique du nucléaire. En 2001, 63 % des Américains s'opposaient à la construction d'une centrale nucléaire près de chez eux ; aujourd'hui, ce chiffre est tombé à 53 %, soit 18 points de moins que le rejet des datacenters IA. Le nucléaire, longtemps perçu comme l'infrastructure la plus indésirable dans un voisinage résidentiel, est donc aujourd'hui mieux accepté que les centres de données consacrés à l'IA. Pour les entreprises technologiques qui planifient des déploiements massifs d'infrastructures aux États-Unis, Microsoft, Google, Amazon, Meta notamment, ce rejet populaire représente un obstacle politique et réglementaire concret, susceptible de ralentir ou de bloquer des projets d'expansion locale. Ce sondage s'inscrit dans un contexte de croissance explosive de la demande en datacenters, portée par le développement des grands modèles de langage et des services d'IA générative. Cette expansion a des conséquences directes sur la consommation d'eau, d'électricité et d'espace foncier, alimentant les inquiétudes des riverains et des élus locaux. La moitié des opposants citent la consommation excessive de ressources comme principal motif de rejet. Aux États-Unis, plusieurs projets ont déjà suscité des résistances locales, notamment dans des États comme la Virginie ou l'Iowa, où la concentration de ces infrastructures est déjà forte. À mesure que les besoins en calcul de l'IA continuent d'augmenter, la question de l'acceptabilité sociale des datacenters devrait s'imposer comme un enjeu politique majeur, au même titre que celui des grandes infrastructures énergétiques des décennies précédentes.

UECette tendance de rejet populaire des datacenters IA pourrait se reproduire en Europe, où les enjeux de consommation d'eau et d'énergie alimentent déjà des débats citoyens similaires autour des projets d'infrastructure numérique.

💬 Plus rejeté que le nucléaire, c'est le score des datacenters IA aux États-Unis. Et c'est pas une surprise : tu construis un truc qui boit des millions de litres d'eau et fait grimper la facture électrique de tout le quartier, forcément les gens apprécient moyen. Le vrai problème pour Microsoft, Google et les autres, c'est que ça va se transformer en levier politique local, et ça c'est beaucoup plus dur à gérer qu'un communiqué de presse sur la durabilité.

InfrastructureActu
1 source
Les coûts d'Anthropic sont difficiles à prévoir
360The Information AI 

Les coûts d'Anthropic sont difficiles à prévoir

Les clients d'Anthropic font face à une double contrainte : des hausses de prix récentes et une quasi-impossibilité de prévoir leurs dépenses futures. Des entreprises comme PagerDuty et ServiceNow ont publiquement exprimé leur frustration cette semaine. ServiceNow est dans une situation particulièrement critique : son directeur digital information officer, Kellie Romack, a révélé que la société a déjà consommé l'intégralité de son budget annuel alloué aux outils d'intelligence artificielle d'Anthropic, et l'année est loin d'être terminée. Le problème central n'est pas seulement le coût en lui-même, mais l'absence de visibilité sur ce qui le génère. Anthropic ne fournit pas à ses clients les données de télémétrie granulaires qui permettraient d'identifier quel utilisateur consomme quels outils, dans quelle proportion et de quelle manière. Sans ces informations, il est impossible pour les équipes IT de détecter les employés qui pratiquent le "tokenmaxxing", c'est-à-dire qui utilisent les outils de façon inefficace ou excessive, ni de mettre en place des règles de modération ciblées. Kellie Romack souligne que des éditeurs logiciels comme SAP, Microsoft, Workday ou ServiceNow lui-même offrent systématiquement ce type de données à leurs propres clients, ce qui constitue aujourd'hui un standard attendu du marché B2B. Cette situation met en lumière une tension croissante entre Anthropic et ses clients entreprises, survenant dans un contexte où la concurrence entre fournisseurs d'IA s'intensifie. Anthropic a récemment relevé ses tarifs, une décision qui amplifie les difficultés budgétaires des grands comptes. Pour des sociétés qui ont intégré Claude dans leurs workflows critiques, la dépendance est forte et le levier de négociation limité. La pression publique de clients de cette envergure pourrait toutefois contraindre Anthropic à développer des tableaux de bord de consommation plus détaillés, une fonctionnalité que les concurrents comme OpenAI et Google proposent déjà à des degrés variables.

UELes entreprises européennes ayant intégré Claude dans leurs workflows critiques sont exposées au même déficit de transparence sur les coûts, sans levier de négociation particulier face à Anthropic.

BusinessActu
1 source
L'AGI est au coeur du procès Musk contre OpenAI
361The Information AI 

L'AGI est au coeur du procès Musk contre OpenAI

Les avocats d'Elon Musk et d'OpenAI ont présenté leurs plaidoiries finales dans le cadre d'un procès où Musk accuse l'entreprise d'avoir trahi la mission caritative pour laquelle elle avait été fondée. L'affaire, instruite devant la juge fédérale Yvonne Gonzalez Rogers à San Francisco, tourne autour d'une question centrale : OpenAI a-t-elle trahi une promesse juridiquement contraignante en abandonnant son statut d'organisation à but non lucratif au profit d'une structure commerciale ? Au coeur de ces débats se trouve un concept aux contours flous : l'intelligence artificielle générale, l'AGI, définie comme une IA capable d'égaler les capacités cognitives humaines, qui figure explicitement dans la mission fondatrice d'OpenAI. L'AGI n'est pas un simple détail rhétorique dans ce procès : elle est inscrite dans les statuts originels de l'organisation, qui s'engage à "garantir que l'AGI bénéficie à l'humanité". C'est précisément sur cet engagement que Musk fonde ses accusations, estimant qu'OpenAI a dévié de sa vocation première au profit d'intérêts commerciaux, notamment sous l'influence de Microsoft. La juge Gonzalez Rogers a toutefois choisi de circonscrire les débats, interdisant aux deux parties d'entrer dans le détail des risques liés à l'AGI, et rappelant au jury que "la question ici est de savoir s'il y a eu violation d'une fiducie caritative", non un procès technique sur la sécurité de l'IA. Ce procès s'inscrit dans une rupture retentissante entre deux figures fondatrices de l'IA moderne. Elon Musk a cofondé OpenAI en 2015 aux côtés de Sam Altman, avant de quitter le conseil d'administration en 2018 et de lancer sa propre entreprise concurrente, xAI, en 2023. Sa plainte déposée l'an dernier accuse OpenAI d'avoir trahi les principes qui justifiaient son soutien financier initial. L'issue du procès pourrait avoir des implications majeures pour la gouvernance des organisations d'IA à but non lucratif, et plus largement pour la façon dont l'industrie devra rendre des comptes sur ses engagements publics en matière d'intérêt général.

UEL'issue du procès pourrait créer un précédent juridique sur les obligations des organisations à but non lucratif dans le secteur de l'IA, susceptible d'influencer les discussions européennes sur la gouvernance et la responsabilité publique des acteurs de l'IA.

💬 Un tribunal fédéral doit maintenant définir juridiquement ce qu'est l'AGI, alors que l'industrie entière n'y arrive pas depuis dix ans. Musk a ses motivations (xAI existe depuis 2023, ça se voit dans la plainte), mais la question de fond est sérieuse : est-ce qu'une mission caritative sur "l'intérêt de l'humanité" crée une vraie obligation légale, ou c'était du storytelling ? Si la juge dit oui, tous les labos qui ont fait des promesses similaires vont avoir chaud.

RégulationReglementation
1 source
Altman répond aux attaques de Musk lors d'une audition tendue
362The Information AI 

Altman répond aux attaques de Musk lors d'une audition tendue

Sam Altman, PDG d'OpenAI, a témoigné mardi devant un tribunal dans le cadre du procès intenté par Elon Musk contre la société qu'ils ont cofondée ensemble en 2015. Lors de cette audience à fort enjeu, Altman a renversé la dynamique en affirmant que c'est Musk lui-même qui avait abandonné OpenAI et cherché activement à nuire à son développement. Soumis à un contre-interrogatoire agressif, le PDG a dû défendre à la fois son intégrité personnelle et sa gestion de l'organisation, dont la mission initiale est de garantir que l'IA avancée profite à l'humanité. L'affaire Musk contre OpenAI est l'un des litiges les plus médiatisés de l'industrie technologique. Musk accuse Altman d'avoir orchestré une manœuvre frauduleuse pour "voler" l'association à but non lucratif qu'ils avaient cofondée, notamment en la transformant progressivement en entité commerciale. La crédibilité d'Altman est directement en jeu : chaque réponse sous serment peut influer sur l'issue du procès et sur la légitimité publique d'OpenAI. Ce conflit s'inscrit dans une rivalité plus large entre deux visions antagonistes de l'IA. Musk, qui a quitté le conseil d'OpenAI en 2018, a depuis fondé xAI et lancé des accusations répétées contre son ancienne organisation. La transformation d'OpenAI en structure à but lucratif, accélérée par des investissements massifs de Microsoft, est au cœur des tensions. L'issue du procès pourrait avoir des répercussions sur la gouvernance des grandes organisations d'IA et sur la question de savoir qui contrôle, et au profit de qui, les technologies les plus puissantes du moment.

UEL'issue du procès pourrait influencer les standards de gouvernance des grandes organisations d'IA opérant en Europe, avec des implications potentielles pour l'application de l'AI Act aux entités hybrides à but lucratif.

RégulationActu
1 source
Android reçoit une refonte majeure axée sur l'IA en 2026
363Ars Technica AI 

Android reçoit une refonte majeure axée sur l'IA en 2026

À quelques jours de sa conférence annuelle Google I/O, prévue la semaine prochaine, Google a décidé d'anticiper et de dévoiler en avant-première les grandes évolutions d'Android pour les prochains mois. L'entreprise annonce un déploiement progressif de nouvelles fonctionnalités d'intelligence artificielle regroupées sous la bannière Gemini Intelligence. L'automatisation des applications constitue la pièce maîtresse de cette mise à jour : déjà testée en 2026 avec DoorDash et Uber sur les téléphones Pixel et Samsung, cette fonction s'étend désormais à des scénarios beaucoup plus complexes. Google donne deux exemples concrets : le système pourrait récupérer un programme de cours dans Gmail puis basculer automatiquement vers une application de commerce en ligne pour ajouter les livres nécessaires au panier, ou encore analyser la photo d'une brochure de voyage et réserver un séjour similaire directement via l'application Expedia. Cette évolution marque un tournant dans la manière dont les assistants IA interagissent avec les smartphones. Jusqu'ici cantonnés à des réponses textuelles ou à des actions isolées, ils deviennent capables d'enchaîner des tâches concrètes à travers plusieurs applications sans intervention de l'utilisateur. Pour les consommateurs, cela signifie déléguer des actions du quotidien, achats, réservations, organisation, à un agent qui agit en leur nom. Pour les développeurs et les commerçants, c'est une nouvelle couche d'interaction avec leurs utilisateurs qui se dessine, portée par l'infrastructure de Google plutôt que par leurs propres interfaces. Le lancement initial de l'automatisation d'applications avait été accueilli avec frustration, Google reconnaissant implicitement des lacunes en annonçant des mois de travail d'ajustement depuis. Cette annonce anticipée avant Google I/O reflète également la pression concurrentielle intense : Apple Intelligence, Microsoft Copilot et les assistants de Samsung se disputent le même terrain. En faisant de Gemini le système nerveux central d'Android, Google cherche à imposer son modèle d'IA comme standard incontournable sur plus de trois milliards d'appareils Android dans le monde, avec des partenariats applicatifs qui pourraient rapidement s'étendre bien au-delà d'Uber et DoorDash.

UELes nouvelles fonctionnalités Gemini Intelligence sur Android toucheront directement les millions d'utilisateurs européens, Android étant la plateforme mobile dominante en Europe avec plus de 70 % de parts de marché.

OutilsOutil
1 source
NVIDIA a déjà investi 40 milliards de dollars dans des accords IA en 2026
364Le Big Data 

NVIDIA a déjà investi 40 milliards de dollars dans des accords IA en 2026

En à peine cinq mois depuis le début de l'année 2026, NVIDIA a engagé plus de 40 milliards de dollars dans des accords liés à l'intelligence artificielle. L'investissement le plus massif reste une mise de 30 milliards de dollars dans OpenAI, le créateur de ChatGPT. Le groupe a également conclu un accord pouvant atteindre 2,1 milliards de dollars avec IREN, opérateur de centres de données, pour déployer 5 gigawatts d'infrastructures NVIDIA DSX. Quelques jours plus tôt, c'est Corning qui annonçait un partenariat à hauteur de 3,2 milliards de dollars pour construire trois usines dédiées aux technologies optiques. En mars, NVIDIA avait aussi investi 2 milliards dans Marvell Technology, ainsi que dans les spécialistes de la photonique Lumentum et Coherent. Dans le cloud IA, le groupe soutient les néoclouds CoreWeave et Nebius Group avec 2 milliards chacun. Au total, Jensen Huang dirige une entreprise valorisée à environ 5 200 milliards de dollars, dont l'action a été multipliée par plus de 11 en quatre ans. Cette stratégie va bien au-delà de la simple diversification financière : NVIDIA cherche à contrôler l'ensemble de la chaîne de valeur de l'IA, des puces jusqu'aux infrastructures qui les font tourner. En finançant les fournisseurs cloud, les opérateurs de data centers, les fabricants de composants optiques et les grandes startups IA, le groupe s'assure que chaque maillon de l'écosystème dépend de ses technologies. Jensen Huang l'a lui-même résumé en déclarant vouloir "soutenir tout le monde" plutôt que "désigner un seul gagnant", une posture qui lui permet de couvrir plusieurs scénarios concurrentiels à la fois. Le groupe a généré 97 milliards de dollars de free cash flow en 2025, ce qui rend ce rythme d'investissement soutenable à court terme. Cette mécanique suscite néanmoins des inquiétudes croissantes à Wall Street. Plusieurs analystes pointent une logique circulaire potentiellement fragile : NVIDIA investit dans des entreprises qui achètent ses GPU pour construire leurs infrastructures, et leur fournit parfois directement des ressources de calcul. Certains observateurs comparent cette boucle à une bulle auto-entretenue. La domination de NVIDIA sur le marché des puces IA est le fruit de l'explosion de l'IA générative depuis 2022, mais la concurrence monte, avec AMD, Intel et les puces propriétaires développées par Google, Amazon et Microsoft. La capacité du groupe à maintenir sa position dominante tout en tissant ce réseau d'alliances financières déterminera si cette stratégie est un masterstroke industriel ou un risque systémique pour l'ensemble de l'écosystème IA mondial.

UELa stratégie d'intégration verticale de NVIDIA renforce sa domination sur l'ensemble de la chaîne IA mondiale, accentuant la dépendance des acteurs européens vis-à-vis des infrastructures et puces américaines.

InfrastructureOpinion
1 source
La ruée vers l'IA d'entreprise et la compagnie aérienne du peuple
365TechCrunch AI 

La ruée vers l'IA d'entreprise et la compagnie aérienne du peuple

La ruée vers l'IA d'entreprise s'accélère. Cette semaine, plusieurs annonces majeures ont illustré l'intensité de la compétition pour capter les budgets des grandes sociétés. Anthropic et OpenAI ont chacun annoncé de nouvelles coentreprises ciblant le déploiement de l'IA en milieu professionnel, tandis que SAP a frappé un grand coup en injectant un milliard de dollars dans Prior Labs, une startup allemande spécialisée dans les outils IA pour entreprises. Le signal est clair : le marché de l'IA d'entreprise est devenu le terrain de chasse prioritaire des grands acteurs technologiques. Ces mouvements traduisent une pression croissante sur l'ensemble de l'écosystème. Pour les startups qui développent des outils professionnels, être rachetées n'est plus une éventualité parmi d'autres, c'est une trajectoire quasi inévitable. Les entreprises comme SAP, Anthropic ou OpenAI cherchent à sécuriser des positions dominantes avant que le marché ne se consolide, ce qui crée une fenêtre d'opportunité étroite, mais lucrative, pour les fondateurs en bonne position. L'IA d'entreprise concentre aujourd'hui l'essentiel des investissements du secteur, car c'est là que se trouvent les budgets les plus importants et les contrats pluriannuels. La montée en puissance d'OpenAI et d'Anthropic sur ce segment, traditionnellement dominé par des acteurs comme Microsoft, Salesforce ou SAP, redistribue les cartes. L'acquisition de Prior Labs par SAP montre que les géants historiques du logiciel d'entreprise n'ont pas l'intention de laisser le terrain aux nouveaux entrants sans résistance.

UESAP, géant allemand du logiciel d'entreprise, a investi un milliard de dollars dans Prior Labs, une startup allemande, consolidant ainsi un champion européen de l'IA d'entreprise face aux offensives d'Anthropic et OpenAI.

💬 Le milliard de SAP dans Prior Labs, ça dit tout : les géants historiques du logiciel d'entreprise ont compris qu'ils ne pouvaient plus juste regarder. Anthropic et OpenAI débarquent sur leur terrain avec des modèles fondamentaux, pas des années d'intégrations ERP à défendre. Pour les startups bien placées dans la niche, c'est le moment de négocier, pas d'attendre.

BusinessActu
1 source
Meta développe un agent IA nommé Hatch et un outil d'achat à base d'agents pour Instagram
366The Information AI 

Meta développe un agent IA nommé Hatch et un outil d'achat à base d'agents pour Instagram

Meta développe en secret un agent conversationnel autonome baptisé "Hatch", selon des sources proches du dossier. Inspiré d'OpenClaw, un agent développé par OpenAI, Hatch est actuellement en phase d'entraînement avec pour objectif un test interne d'ici fin juin 2026. Parallèlement, le groupe travaille sur un outil d'achat agentique intégré à Instagram, capable d'agir de manière autonome pour les utilisateurs. Pour préparer Hatch à des interactions réelles, Meta a construit des environnements web isolés simulant des plateformes comme DoorDash, Etsy, Reddit, Yelp et Outlook, permettant à l'agent de s'entraîner sur des répliques de sites existants. Ces développements illustrent la pression croissante que Mark Zuckerberg exerce en interne pour que les investissements massifs de Meta en intelligence artificielle génèrent des retours concrets. Un agent capable de naviguer sur le web, passer des commandes ou interagir avec des services tiers représenterait un saut qualitatif majeur pour les produits Meta, transformant les assistants textuels actuels en véritables exécutants numériques. L'intégration dans Instagram d'un outil de shopping agentique ouvre également la voie à une monétisation directe via l'IA. Meta s'inscrit ainsi dans une course engagée par tous les géants technologiques vers les agents autonomes. OpenAI, Google et Microsoft ont chacun lancé des systèmes similaires ces derniers mois. Pour Meta, dont les revenus restent très dépendants de la publicité, développer une couche agentique sur ses applications sociales constitue un enjeu stratégique de premier ordre, à la fois pour fidéliser les utilisateurs et ouvrir de nouveaux modèles économiques.

UEL'intégration d'un agent de shopping autonome dans Instagram, très utilisé en Europe, pourrait soulever des questions réglementaires au regard du RGPD et du Digital Markets Act concernant la collecte de données comportementales et les pratiques de monétisation agentique.

OutilsOutil
1 source
Le procès Musk contre Altman, et l'IA au service de la démocratie
367MIT Technology Review 

Le procès Musk contre Altman, et l'IA au service de la démocratie

Le procès opposant Elon Musk à Sam Altman, fondateur d'OpenAI, est entré dans sa deuxième semaine devant un tribunal californien. Musk, qui a cofondé OpenAI en 2015 avant de quitter son conseil d'administration en 2018, accuse Altman de l'avoir induit en erreur sur la transformation de l'organisation à but non lucratif en entreprise commerciale. La journaliste Michelle Kim du MIT Technology Review, elle-même avocate, a suivi les audiences quotidiennement et rapporte que la première semaine a livré des détails inédits sur le fonctionnement interne d'OpenAI ainsi que sur la relation entre les deux hommes. En parallèle, le Pentagone a annoncé des contrats de grande ampleur avec Microsoft, Nvidia, Amazon Web Services et la start-up Reflection AI pour des travaux d'intelligence artificielle sur données classifiées, dans le cadre d'une ambition affichée de faire des forces américaines une puissance "IA en premier". Sur un autre front, Musk a conclu un accord avec la SEC, acceptant de payer une amende de 1,5 million de dollars pour avoir tardé à déclarer ses achats initiaux d'actions Twitter en 2022. Ces développements simultanés illustrent la tension croissante autour du contrôle de l'IA à plusieurs échelles. Le procès Musk-Altman soulève une question fondamentale pour toute l'industrie : peut-on engager des capitaux dans une organisation à but non lucratif et la voir se muer en entreprise valorisée à plusieurs centaines de milliards sans recours juridique ? L'issue du procès pourrait redéfinir les règles de gouvernance applicables aux futures transformations de structures similaires. Les contrats du Pentagone, qui excluent Anthropic, repositionnent Microsoft, Nvidia et AWS comme piliers de l'IA militaire américaine, un signal structurant pour l'ensemble du secteur. Pendant ce temps, un tribunal chinois a établi un précédent notable : une entreprise ne peut pas licencier des salariés au seul motif de les remplacer par des outils d'IA, une décision qui résonne dans un secteur mondial où la pression à l'automatisation ne cesse de s'intensifier. Ce cycle d'actualité dense reflète l'accélération des enjeux de gouvernance de l'IA sur tous les fronts à la fois. La genèse du procès remonte à la décision d'OpenAI, en 2019, de créer une entité commerciale pour lever des capitaux, une évolution que Musk conteste aujourd'hui en justice. Parallèlement, la Maison Blanche travaillerait à la création d'un groupe de travail chargé d'évaluer les modèles d'IA avant leur diffusion publique, signe que Washington cherche à encadrer un secteur qui échappe encore à toute régulation fédérale cohérente. Des chercheurs s'interrogent également sur l'émergence des "scientifiques artificiels", des systèmes d'IA capables de conduire des projets de recherche de manière autonome : une perspective aux possibilités immenses, mais qui soulève des inquiétudes sur l'appauvrissement de la diversité scientifique si ces outils convergent tous vers les mêmes priorités de recherche.

UELe précédent chinois interdisant les licenciements motivés uniquement par le remplacement par l'IA alimente directement le débat européen sur la protection des travailleurs face à l'automatisation, un angle encore insuffisamment couvert par l'AI Act.

RégulationReglementation
1 source
AgentCore Optimization : AWS lance une boucle d'amélioration des performances des agents
368AWS ML Blog 

AgentCore Optimization : AWS lance une boucle d'amélioration des performances des agents

Amazon a annoncé le lancement en préversion d'AgentCore Optimization, une nouvelle fonctionnalité intégrée à sa plateforme Amazon Bedrock AgentCore. Cette brique complète ce qu'Amazon appelle la boucle "observer, évaluer, améliorer" pour les agents IA en production. Concrètement, le système analyse automatiquement les traces de production, génère des recommandations d'optimisation pour les prompts système ou les descriptions d'outils, puis propose deux mécanismes de validation : l'évaluation par lot sur des jeux de données prédéfinis, et les tests A/B en conditions réelles via AgentCore Gateway, avec découpage du trafic en production à un pourcentage configurable et résultats assortis d'intervalles de confiance et de signification statistique. NTT DATA, partenaire annoncé lors du lancement, indique que des processus qui nécessitaient auparavant plusieurs semaines d'ajustement manuel de prompts peuvent désormais s'exécuter en cycles rapides et reproductibles. L'enjeu est de taille pour les équipes produit qui déploient des agents IA : la qualité d'un agent se dégrade silencieusement à mesure que les modèles évoluent, que le comportement des utilisateurs change, et que les prompts sont réutilisés dans des contextes imprévus. Jusqu'ici, la remédiation reposait entièrement sur l'intuition du développeur, lire des traces, formuler une hypothèse, réécrire le prompt, tester quelques cas, déployer, un cycle qui introduit souvent de nouveaux problèmes en corrigeant les anciens. AgentCore Optimization remplace cette boucle artisanale par un processus systématique fondé sur les données : les recommandations sont générées à partir des traces réelles et validées avant tout déploiement, éliminant la part de pari inhérente aux corrections en aveugle. Amazon Bedrock AgentCore, déjà utilisé par des milliers de développeurs pour construire des agents capables de raisonner et d'agir dans des workflows complexes, s'enrichit ainsi d'une couche d'amélioration continue qui manquait jusqu'à présent à l'écosystème. Les grandes équipes disposent certes d'équipes scientifiques dédiées et de benchmarks centralisés, mais ces dispositifs fonctionnent sur des cycles hebdomadaires ou mensuels, pendant que les agents dérivent en production chaque jour. En intégrant la traçabilité OpenTelemetry, les évaluateurs built-in (taux de succès, précision de sélection d'outils, sécurité), et la possibilité de simuler des jeux de données via un acteur LLM jouant le rôle de l'utilisateur final, Amazon positionne AgentCore comme une plateforme complète pour industrialiser l'optimisation des agents, une capacité qui pourrait devenir un critère de choix déterminant face à des concurrents comme Google Vertex AI ou Microsoft Azure AI Foundry.

UELes équipes européennes déployant des agents IA sur Amazon Bedrock peuvent désormais automatiser l'optimisation de leurs prompts et outils, réduisant des cycles d'ajustement manuel qui duraient plusieurs semaines à des itérations rapides et reproductibles.

OutilsOutil
1 source
Netomi lève 110 millions de dollars, Accenture et Adobe misent sur l'IA pour le service client
369VentureBeat AI 

Netomi lève 110 millions de dollars, Accenture et Adobe misent sur l'IA pour le service client

Netomi, startup basée à San Francisco spécialisée dans les systèmes d'IA pour le service client en entreprise, a annoncé jeudi avoir levé 110 millions de dollars lors d'un tour de table mené par Accenture Ventures, avec la participation d'Adobe Ventures, WndrCo, Silver Lake Waterman, NAVER Ventures, Metis Strategy et Fin Capital. Jeffrey Katzenberg, cofondateur de DreamWorks et associé directeur de WndrCo, rejoint le conseil d'administration. Ce financement s'ajoute à un premier cercle d'investisseurs prestigieux comprenant Greg Brockman (cofondateur d'OpenAI), Demis Hassabis (cofondateur de Google DeepMind) et Mustafa Suleyman (directeur de Microsoft AI). L'opération ne s'arrête pas à l'apport de capitaux : Accenture a simultanément conclu une alliance mondiale avec Netomi pour déployer la plateforme auprès de ses clients du Fortune 100, mobilisant des centaines de consultants formés à l'outil. Adobe Ventures prévoit quant à elle d'intégrer Netomi dans son écosystème agentique Brand Concierge, donnant à la startup un accès direct à la couche logicielle qu'utilisent déjà de nombreuses grandes marques pour gérer leurs sites web et leurs parcours clients. Ce tour de table révèle une fracture qui se dessine dans l'IA d'entreprise : non plus entre ceux qui disposent d'un chatbot et ceux qui n'en ont pas, mais entre ceux capables de prouver que l'IA fonctionne dans les environnements réels, complexes et fortement encadrés des grandes organisations, et ceux qui brillent surtout en démonstration. Selon le PDG Puneet Mehta, un déploiement type chez un grand compte peut générer un impact de plusieurs dizaines de millions de dollars, certains clients étant sur une trajectoire à plusieurs centaines de millions. Gartner prédit que 40 % des applications d'entreprise intégreront des agents IA spécialisés d'ici fin 2026, contre moins de 5 % en 2025. Le marché autour de Netomi illustre l'intensité des enjeux. Sierra, la startup d'agents IA dirigée par l'ex-co-PDG de Salesforce Bret Taylor, a levé 350 millions de dollars à une valorisation de 10 milliards en septembre 2025 et réalisé trois acquisitions en 2026 à lui seul. Decagon a triplé sa valorisation à 4,5 milliards de dollars en janvier 2026 lors d'une Série D à 250 millions. Salesforce, ServiceNow et Intercom intègrent tous en urgence des agents IA dans leurs plateformes existantes, le Fin AI d'Intercom ayant franchi le seuil de 100 millions de dollars de revenus annuels récurrents à 0,99 dollar par résolution. Dans ce contexte, la levée de Netomi se distingue moins par son montant que par sa construction stratégique : l'alliance entre le réseau de distribution mondial d'Accenture, la présence d'Adobe dans la gestion de l'expérience numérique et le bilan de déploiements en production de Netomi représente une tentative coordonnée d'inscrire l'IA non comme une surcouche de chatbot, mais comme l'intelligence centrale qui gouverne l'ensemble des expériences digitales des entreprises.

UELa généralisation des agents IA spécialisés dans le service client d'entreprise, 40 % des applications d'ici fin 2026 selon Gartner, concerne directement les grandes organisations françaises et européennes qui devront évaluer ces solutions dans leurs stratégies de transformation numérique.

BusinessOpinion
1 source
Les nuances de la marge brute de Cursor, comparatif GPT-5.5 et Claude Mythos
370The Information AI 

Les nuances de la marge brute de Cursor, comparatif GPT-5.5 et Claude Mythos

Microsoft et OpenAI ont revu les termes de leur partenariat, avec deux concessions majeures : Azure perd son droit exclusif de distribuer les modèles OpenAI, et Microsoft n'est plus tenu de reverser 20 % des revenus générés par ces modèles sur sa plateforme cloud. Cette renégociation intervient après que des cadres de Microsoft ont exprimé des inquiétudes le mois dernier : OpenAI avait annoncé un projet de déploiement d'un agent IA via Amazon Web Services, ce qui, selon eux, violait le contrat d'exclusivité liant les deux entreprises. Par ailleurs, Cursor, la startup spécialisée dans le codage assisté par IA, continue sa montée en puissance avec un chiffre d'affaires annualisé atteignant 2,7 milliards de dollars en mars 2026, contre 1 milliard en novembre 2025. SpaceX dispose désormais d'une option d'achat sur la société valorisée à 60 milliards de dollars. Ces deux révélations illustrent les tensions structurelles qui traversent l'écosystème IA. Du côté OpenAI-Microsoft, la fin de l'exclusivité Azure signifie qu'OpenAI peut désormais s'appuyer sur d'autres clouds pour commercialiser ses modèles, ce qui lui donne un levier de négociation et une flexibilité stratégique accrue. Pour Cursor, la croissance spectaculaire masque une réalité financière préoccupante : la marge brute était de -23 % au trimestre clos en janvier 2026, avant de passer tout juste en territoire positif. Les coûts d'inférence, c'est-à-dire le calcul nécessaire pour faire tourner les modèles, plombent la rentabilité. Ce contexte met en lumière une pratique comptable discrète mais répandue dans le secteur : certaines startups IA classent une partie de leurs dépenses d'inférence en frais marketing plutôt qu'en coût des ventes. Cela ne change pas les pertes nettes, mais améliore artificiellement la marge brute, un indicateur clé pour les investisseurs. Ce tour de passe-passe comptable révèle à quel point les marges sont sous pression dans l'IA générative, y compris pour des acteurs en forte croissance. La question de la rentabilité réelle de ces modèles économiques reste entière, alors que les valorisations continuent de s'envoler.

UELa fin de l'exclusivité Azure pour les modèles OpenAI pourrait indirectement modifier les conditions d'accès des entreprises européennes aux API d'OpenAI via d'autres clouds, mais l'impact direct sur la France ou l'UE reste limité à court terme.

BusinessOpinion
1 source
Les émissions de gaz à effet de serre des data centers pourraient dépasser celles de nations entières
371Ars Technica AI 

Les émissions de gaz à effet de serre des data centers pourraient dépasser celles de nations entières

Onze campus de centres de données en cours de construction aux États-Unis sont associés à des projets de centrales au gaz naturel dont les émissions combinées pourraient dépasser 129 millions de tonnes de gaz à effet de serre par an, soit plus que l'ensemble des émissions du Maroc en 2024. Ces chiffres proviennent de documents de demandes de permis atmosphériques examinés par WIRED, soumis auprès d'agences étatiques américaines. Les infrastructures concernées alimenteront des centres de données au service de quelques-unes des entreprises d'IA les plus puissantes du pays : OpenAI, Meta, Microsoft et xAI figurent parmi les bénéficiaires identifiés. Ces projets sont soit déjà annoncés, soit en cours de construction. Ce que révèlent ces chiffres dépasse largement un problème local : ils illustrent le coût climatique concret de la course mondiale à l'IA. La particularité de ces installations est qu'elles contournent le réseau électrique public pour alimenter directement et exclusivement les centres de données, un modèle dit "behind-the-meter". Résultat : leurs émissions échappent aux mécanismes habituels de régulation et de comptabilisation carbone. Pour les consommateurs, la dynamique est aussi préoccupante : cette stratégie est partiellement motivée par la volonté des géants technologiques d'éviter d'alourdir les factures d'électricité des ménages, qui subissent déjà une résistance publique croissante face à la hausse des tarifs. Cette tendance s'inscrit dans un contexte de saturation du réseau électrique américain : les délais de raccordement aux opérateurs traditionnels s'allongent considérablement, poussant les développeurs de centres de données à produire leur propre énergie. Les projets listés ne représentent selon WIRED que la partie émergée de l'iceberg, alors que les grandes entreprises technologiques s'engagent dans des centaines de nouveaux centres à travers le pays. La question de la compatibilité entre les objectifs climatiques des États-Unis et l'expansion effrénée de l'infrastructure IA se pose désormais avec une acuité nouvelle, au moment où plusieurs États commencent à examiner plus attentivement les permis accordés à ces projets énergétiques hors réseau.

UEL'UE, engagée dans des objectifs climatiques contraignants et le reporting carbone obligatoire, pourrait faire face à des pressions similaires si le modèle d'alimentation directe hors réseau se généralise dans ses propres projets d'infrastructure IA.

InfrastructureActu
1 source
Google lance ses puces TPU 8, trois fois plus puissantes, pour accélérer l'entraînement IA et réduire les coûts cloud
372Interesting Engineering 

Google lance ses puces TPU 8, trois fois plus puissantes, pour accélérer l'entraînement IA et réduire les coûts cloud

Google a dévoilé la huitième génération de ses Tensor Processing Units lors de la conférence Google Cloud Next, en introduisant deux puces d'IA distinctes : la TPU 8t, dédiée à l'entraînement des modèles, et la TPU 8i, optimisée pour l'inférence. La TPU 8t peut s'étendre jusqu'à 9 600 puces dans un seul superpod, atteignant 121 exaflops de puissance de calcul, soit près de trois fois les performances de la génération précédente, baptisée Ironwood. Elle vise un taux de "goodput" supérieur à 97 %, c'est-à-dire un temps de calcul productif maximisé, limitant les pauses dues aux pannes ou aux goulots d'étranglement. La TPU 8i, quant à elle, embarque 288 Go de mémoire haute bande passante et 384 Mo de SRAM on-chip, et affiche une amélioration de 80 % du rapport performance/dollar par rapport à la génération précédente, permettant de traiter presque deux fois plus de charge à coût équivalent. Les deux puces seront disponibles en accès général via Google Cloud d'ici la fin de l'année. Cette annonce marque une rupture dans la façon dont l'industrie conçoit l'infrastructure IA. En séparant les cas d'usage entraînement et inférence en deux architectures matérielles distinctes, Google reconnaît que les charges de travail modernes ont des profils radicalement différents. Les agents IA, qui enchaînent des raisonnements, appellent des outils et interagissent en boucle avec d'autres modèles, exigent des temps de réponse très courts et une mémoire rapide proche du processeur, ce que la TPU 8i cible directement. Pour les entreprises clientes, le gain de performance par dollar est concret : gérer deux fois plus d'utilisateurs simultanés sans augmenter la facture cloud change l'équation économique du déploiement de modèles à grande échelle. Google développe ses TPU depuis 2016 pour ses propres systèmes internes, dont Gemini, mais les ouvre désormais plus largement aux clients cloud face à une demande explosive en calcul IA. La stratégie est claire : offrir une alternative intégrée à l'écosystème Nvidia en combinant silicium propriétaire, réseaux personnalisés, frameworks logiciels et services cloud en un seul stack. Les deux puces supportent JAX, PyTorch, SGLang et vLLM, abaissant la barrière à la migration pour les développeurs. Sur le plan énergétique, les TPU 8 offrent jusqu'à deux fois plus de performance par watt que la génération Ironwood et utilisent un refroidissement liquide de quatrième génération. La bataille pour l'infrastructure IA de prochaine génération s'intensifie, avec Google, Microsoft, Amazon et Meta qui investissent massivement dans leurs propres puces pour réduire leur dépendance à Nvidia tout en contrôlant les coûts d'exploitation à long terme.

UELes entreprises européennes déployant des modèles IA sur Google Cloud pourraient bénéficier d'une réduction significative de leurs coûts d'inférence grâce au gain de 80 % du rapport performance/dollar annoncé pour les TPU 8i.

AutoAdapt : adaptation automatique des grands modèles de langage à des domaines spécifiques
373Microsoft Research 

AutoAdapt : adaptation automatique des grands modèles de langage à des domaines spécifiques

Des chercheurs de Microsoft Research ont publié AutoAdapt, un cadre automatisé destiné à adapter les grands modèles de langage (LLM) à des domaines spécialisés à forts enjeux, comme le droit, la médecine ou la gestion d'incidents cloud. Présenté dans un article intitulé "AutoAdapt: An Automated Domain Adaptation Framework for Large Language Models", le système prend en entrée un objectif défini en langage naturel, des données de domaine et des contraintes pratiques (latence, matériel, budget, confidentialité), puis construit automatiquement un pipeline d'adaptation complet et reproductible. Pour y parvenir, AutoAdapt s'appuie sur trois composants : un graphe de configuration appelé Adaptation Configuration Graph (ACG) qui cartographie l'espace des possibles, un agent planificateur qui sélectionne et séquence les bonnes étapes, et une boucle d'optimisation budgétaire nommée AutoRefine qui affine le résultat dans les limites imposées. L'enjeu est considérable pour les équipes qui déploient des LLM en production. Aujourd'hui, spécialiser un modèle généraliste implique de choisir manuellement entre des approches comme la génération augmentée par récupération (RAG), le fine-tuning supervisé ou des méthodes à efficacité paramétrique comme LoRA, puis d'ajuster des dizaines d'hyperparamètres dans un espace de décision vaste et peu lisible. Ce processus prend des semaines, sans garantie de résultat reproductible. Pour une équipe qui gère une panne critique, un modèle qui dérive de ses exigences de domaine n'est tout simplement pas une option. AutoAdapt transforme ce tâtonnement coûteux en un pipeline exécutable en une fraction du temps, rendant les LLM fiables et prévisibles dans des contextes où les erreurs ont des conséquences réelles. Cette publication s'inscrit dans une tendance de fond qui vise à industrialiser le déploiement des LLM, au-delà de la simple performance sur des benchmarks génériques. Les entreprises qui adoptent ces modèles dans des secteurs régulés ou techniques se heurtent systématiquement au même mur : la spécialisation est longue, chère et fragile. Microsoft Research, qui présente ce travail dans le cadre de son Microsoft Research Forum, positionne AutoAdapt comme une réponse structurée à ce goulot d'étranglement. Le système ouvre la voie à une standardisation des pratiques d'adaptation, là où chaque équipe réinventait jusqu'ici sa propre méthode. La prochaine étape logique sera de voir si ce cadre peut être intégré directement dans des plateformes cloud comme Azure AI Studio, ce qui accélérerait son adoption à grande échelle.

UELes entreprises européennes déployant des LLM dans des secteurs réglementés (santé, droit, finance) pourraient réduire significativement leurs coûts et délais de spécialisation grâce à ce type de framework d'adaptation automatisé.

RecherchePaper
1 source
NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents
374NVIDIA AI Blog 

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents

NVIDIA et Google Cloud ont annoncé cette semaine, lors de la conférence Google Cloud Next à Las Vegas, une nouvelle étape majeure dans leur partenariat vieux de plus de dix ans. Au cœur de l'annonce : le lancement des instances bare-metal A5X, alimentées par les systèmes rack NVIDIA Vera Rubin NVL72, qui promettent un coût d'inférence jusqu'à dix fois inférieur et un débit de tokens dix fois plus élevé par mégawatt par rapport à la génération précédente. Ces infrastructures s'appuient sur les interconnexions NVIDIA ConnectX-9 SuperNICs couplées au réseau Google Virgo de nouvelle génération, permettant de déployer des clusters allant jusqu'à 80 000 GPU Rubin sur un site unique, et jusqu'à 960 000 GPU dans une configuration multisite. Par ailleurs, Google Cloud met en préversion les modèles Gemini sur Google Distributed Cloud avec les GPU NVIDIA Blackwell et Blackwell Ultra, ainsi que des machines virtuelles confidentielles garantissant le chiffrement des données en cours d'utilisation. Des acteurs comme OpenAI et Thinking Machines Lab utilisent déjà ces infrastructures pour des charges d'inférence massives, notamment pour faire tourner ChatGPT. Ces annonces représentent un saut qualitatif significatif pour les entreprises qui cherchent à industrialiser l'IA agentique et l'IA physique, c'est-à-dire les systèmes capables d'agir de manière autonome dans des environnements réels, comme les robots ou les jumeaux numériques en usine. La réduction drastique des coûts d'inférence change concrètement l'équation économique pour les développeurs d'applications IA à grande échelle. La possibilité de déployer les modèles Gemini en environnement souverain, sur des données sensibles restant chiffrées y compris pendant leur traitement, répond à une exigence croissante des entreprises et des gouvernements en matière de conformité et de confidentialité. L'intégration de modèles ouverts NVIDIA Nemotron dans la plateforme Gemini Enterprise Agent Platform élargit également les options des équipes techniques qui souhaitent combiner modèles propriétaires et open source. Ce partenariat s'inscrit dans une compétition intense entre les grands fournisseurs de cloud pour capter les budgets d'infrastructure IA, qui se chiffrent désormais en dizaines de milliards de dollars annuellement. Google Cloud cherche à rattraper son retard sur AWS et Microsoft Azure, qui ont pris de l'avance sur l'hébergement des charges d'entraînement et d'inférence des grands modèles de langage. En s'associant étroitement à NVIDIA, dont les GPU dominent encore largement le marché de l'accélération IA, Google se positionne comme une plateforme de référence pour la prochaine vague, celle des agents autonomes et de la robotique industrielle. La feuille de route annoncée, avec la transition de Blackwell vers Vera Rubin, suggère que la cadence d'innovation s'accélère et que les entreprises devront adapter leur infrastructure régulièrement pour rester compétitives.

UELe déploiement souverain de Gemini sur Google Distributed Cloud avec chiffrement des données en cours d'utilisation répond aux exigences RGPD des entreprises européennes traitant des données sensibles.

InfrastructureOpinion
1 source
Nvidia Rubin Ultra : le GPU qui transformera les AI Factories en 2027
375Le Big Data 

Nvidia Rubin Ultra : le GPU qui transformera les AI Factories en 2027

Nvidia a officiellement confirmé le lancement de son prochain GPU phare, le Rubin Ultra, prévu pour 2027. Successeur du Blackwell Ultra, cette puce repose sur une architecture en chiplets de type MCM (Multi-Chip Module) assemblant quatre dies gravés en nœud N2 chez TSMC, pour un total d'environ 336 milliards de transistors. Elle s'intègre dans la plateforme Vera, un écosystème complet où le GPU collabore avec le processeur Vera, doté de 88 cœurs, via une interconnexion NVLink-C2C sans latence. Le tout est relié par le nouveau commutateur NVLink 6, conçu pour des vitesses de transfert inédites à l'échelle des racks de serveurs. La mémoire intégrée atteint 1 To de HBM4e répartis sur 12 stacks, avec une bande passante annoncée à 22 To/s, soit un bond considérable par rapport aux générations précédentes. Ce niveau de performance change concrètement la donne pour les entreprises qui entraînent ou déploient des grands modèles de langage. Avec 1 To de mémoire embarquée sur une seule puce, il devient possible de charger des modèles entiers sans recourir à des échanges lents entre composants, l'un des goulots d'étranglement structurels des infrastructures actuelles. L'architecture en chiplets apporte par ailleurs une modularité absente des puces monolithiques : la montée en charge des clusters de serveurs devient plus fluide, et chaque unité de calcul peut fonctionner en coordination étroite avec les autres. Pour les opérateurs de data centers et les hyperscalers, le Rubin Ultra ne représente pas un simple upgrade de performance, mais une refonte de ce que l'on appelle désormais les "AI Factories", ces infrastructures entièrement conçues autour des besoins du calcul IA. Nvidia accélère son calendrier de manière visible : le Rubin Ultra arrivera en 2027, mais son architecture est déjà documentée et ses partenariats hardware (TSMC N2, HBM4e) sont scellés, signalant une volonté de garder plusieurs générations d'avance sur ses concurrents AMD et Intel, ainsi que sur les puces maison développées par Google (TPU), Amazon (Trainium) et Microsoft (Maia). La transition vers les chiplets, longtemps réservée aux CPU, marque un tournant pour les GPU de datacenter. L'intégration verticale de la plateforme Vera, qui lie hardware et software de façon indissociable, rappelle la stratégie d'Apple avec ses puces M, mais appliquée à l'échelle des supercalculateurs industriels. Les entreprises qui visent ces infrastructures devront consentir des investissements massifs, mais la dépendance à l'écosystème Nvidia, déjà forte via CUDA, ne fera que s'approfondir avec cette nouvelle génération.

UELes opérateurs européens de data centers et les hyperscalers devront planifier dès maintenant des investissements massifs pour 2027, tout en s'enfermant davantage dans l'écosystème Nvidia via CUDA et la plateforme Vera.

InfrastructureOpinion
1 source
Meta formerait des agents IA en surveillant les souris et claviers de ses employés
376Ars Technica AI 

Meta formerait des agents IA en surveillant les souris et claviers de ses employés

Meta va commencer à collecter les mouvements de souris, clics et frappes clavier de ses employés américains pour entraîner ses futurs agents d'intelligence artificielle. L'initiative, baptisée Model Capability Initiative, a été annoncée en interne via des mémos publiés par l'équipe Meta Superintelligence Labs et révélée par Reuters. Le logiciel de suivi fonctionnera sur des applications et sites web professionnels spécifiques, et prendra également des captures d'écran périodiques pour fournir du contexte aux données d'entraînement. Selon le mémo interne, "c'est là où tous les employés de Meta peuvent aider nos modèles à s'améliorer simplement en faisant leur travail quotidien." Cette approche vise à produire des données d'entraînement de haute qualité pour les agents IA, c'est-à-dire des systèmes capables d'accomplir des tâches complexes de manière autonome sur un ordinateur. Reproduire fidèlement les comportements humains réels dans des environnements de travail concrets est un défi majeur pour ce type d'IA, et les données synthétiques ou publiques ne suffisent plus. En utilisant le travail quotidien de milliers d'employés comme source de données, Meta espère accélérer le développement d'agents capables de naviguer dans des interfaces réelles. Cette initiative s'inscrit dans une course effrénée entre les grandes entreprises technologiques pour développer des agents IA performants, un marché que Microsoft, Google et OpenAI ciblent également activement. La question de la surveillance des employés à des fins commerciales soulève néanmoins des questions éthiques et juridiques, notamment en matière de consentement et de vie privée au travail. Il reste à voir si Meta étendra ce programme à ses employés hors des États-Unis, où les réglementations comme le RGPD européen imposent des contraintes bien plus strictes.

UELe RGPD impose un consentement explicite pour la collecte de données comportementales des employés, rendant une extension de ce programme aux salariés européens de Meta juridiquement très complexe, voire impossible sans refonte du dispositif.

ÉthiqueActu
1 source
La mise à jour de Codex pose les bases de la « superapp » d’OpenAI
377Next INpact 

La mise à jour de Codex pose les bases de la « superapp » d’OpenAI

OpenAI a livré hier une mise à jour majeure de Codex, son application dédiée au développement logiciel, disponible sur macOS depuis février 2026 et sur Windows depuis mars. Ce logiciel, qui permet aux développeurs d'utiliser un agent IA spécialisé dans la programmation via une interface graphique ou en ligne de commande, s'enrichit de capacités inédites : intégration avec n'importe quelle application Mac, déploiement de plusieurs agents en tâche de fond, navigateur web embarqué avec annotations directes sur les pages, génération de visuels d'interface via le modèle gpt-image-1.5, gestion de multiples terminaux en simultané, connexion à des environnements distants par SSH (encore en alpha), et une bibliothèque élargie à plus de 90 modules d'extension connectant Codex à des services comme Slack, Notion, GitLab ou CodeRabbit. L'application gère désormais la planification de tâches longues et conserve le contexte des conversations pour reprendre un travail sans que l'utilisateur ait à tout réexpliquer. Ce qui rend cette mise à jour stratégiquement significative dépasse la simple liste de fonctionnalités : Thibault Sottiaux, responsable de Codex chez OpenAI, a confirmé à Ars Technica que Codex est la brique fondatrice de la future « superapp » qu'OpenAI construit depuis plusieurs mois. L'objectif est de créer un point d'entrée universel capable de répondre aux besoins de tous les profils d'utilisateurs, développeurs, professionnels et grand public, en servant d'intermédiaire entre l'utilisateur et l'ensemble de son environnement numérique. Concrètement, cela signifie qu'un agent pourrait détecter une décision prise dans Slack, récupérer les détails dans Notion, vérifier l'état du code existant et proposer automatiquement une liste d'actions, sans intervention humaine pour reconstituer le contexte. Cette ambition s'inscrit dans une course intense entre les grandes plateformes d'IA à la captation de l'interface quotidienne des utilisateurs. OpenAI affronte ici directement Anthropic avec Claude Code, mais aussi Microsoft, Google et les acteurs spécialisés du développement assisté. La stratégie choisie, construire la superapp « au grand jour » en faisant évoluer un outil déjà adopté par les développeurs, présente l'avantage de valider chaque brique en conditions réelles avant d'élargir le public cible. Le navigateur intégré, par exemple, laisse entrevoir une possible mise en retrait d'Atlas, le propre navigateur qu'OpenAI développait en parallèle. L'enjeu à terme est considérable : celui qui parvient à s'imposer comme couche d'orchestration entre l'utilisateur, ses outils et ses données détient un levier d'influence considérable sur l'ensemble du flux de travail numérique.

UELes développeurs français et européens peuvent adopter dès maintenant les nouvelles fonctionnalités de Codex, mais l'impact reste indirect, sans implications réglementaires ou institutionnelles propres à l'UE.

Les bons résultats de TSMC confirment l'élan de l'IA
378The Information AI 

Les bons résultats de TSMC confirment l'élan de l'IA

TSMC, le géant taïwanais de la fabrication de puces électroniques, a publié jeudi ses résultats du premier trimestre 2026 avec une croissance de revenus de 40,6%, dépassant le haut de sa fourchette de prévisions. Le PDG C.C. Wei a relevé l'objectif de croissance annuel à plus de 30%, et déclaré que "la demande liée à l'IA continue d'être extrêmement robuste." Cette évaluation repose sur les retours directs des clients de TSMC, au premier rang desquels Nvidia, ainsi que des grandes firmes cloud qui achètent ces puces. Ces résultats constituent un signal fort pour l'ensemble du secteur technologique. Si TSMC, qui fabrique les puces pour pratiquement tous les grands acteurs de l'IA, affiche une telle croissance, cela laisse présager des résultats solides pour les grandes entreprises tech qui publieront leurs chiffres trimestriels plus tard en avril. Les marchés ont déjà anticipé cette dynamique : depuis fin mars, Microsoft a progressé de 18%, Nvidia de 20%, et le Nasdaq dans son ensemble de 16%. La vigueur de TSMC s'inscrit dans un contexte de multiplication des signaux haussiers autour de l'IA, malgré les incertitudes macroéconomiques mondiales. Le fabricant taïwanais occupe une position unique dans la chaîne de valeur : il est le maillon indispensable entre les concepteurs de puces comme Nvidia ou AMD et les déploiements massifs des hyperscalers comme Microsoft Azure, Google Cloud ou Amazon AWS. La robustesse de sa demande suggère que les investissements en infrastructure IA ne montrent aucun signe de ralentissement, alimentant l'optimisme avant une saison de résultats qui s'annonce décisive pour valider, ou nuancer, l'enthousiasme des marchés.

InfrastructureOpinion
1 source
Gemini 3.1 Flash TTS : prenez les commandes de l’émotion grâce aux balises audio
379Le Big Data 

Gemini 3.1 Flash TTS : prenez les commandes de l’émotion grâce aux balises audio

Google a lancé le 15 avril 2026 Gemini 3.1 Flash TTS, son nouveau modèle de synthèse vocale conçu pour donner aux créateurs un contrôle fin sur le rendu émotionnel des voix générées. La principale nouveauté réside dans l'introduction des balises audio, des commandes en langage naturel intégrées directement dans le texte pour piloter le rythme, l'intonation et le style vocal phrase par phrase. Concrètement, un développeur peut indiquer dans sa requête qu'un passage doit être prononcé avec "excitation" ou de manière "explicative", et le modèle adapte sa synthèse en conséquence. Le modèle prend en charge plus de 70 langues, dont 24 bénéficient d'une qualité dite premium, parmi lesquelles l'hindi, le japonais et l'allemand. Il est déjà intégré dans Google Vids, la Gemini API et Google AI Studio, et inclut le watermarking SynthID sur tous les outputs. Cette capacité à sculpter la voix par instructions textuelles représente un changement de paradigme pour les producteurs de contenu audio et les équipes de développement. Jusqu'ici, les modèles TTS généraient une voix uniforme, difficile à différencier selon le contexte ou le ton voulu. Avec Gemini 3.1 Flash TTS, les entreprises qui produisent des podcasts automatisés, des assistants vocaux, des vidéos pédagogiques ou des expériences de narration interactive peuvent adapter le rendu vocal sans post-production manuelle. La couverture multilingue avec maintien de la cohérence émotionnelle ouvre aussi la voie à des déploiements localisés à grande échelle, un enjeu crucial pour les acteurs globaux qui ne peuvent pas se permettre de perdre en expressivité lors du passage d'une langue à l'autre. Cette annonce s'inscrit dans une course intense entre les grands acteurs de l'IA générative pour dominer le segment de la voix. OpenAI a lancé ses propres capacités TTS via l'API et ses modèles de voix en temps réel, ElevenLabs a consolidé sa position sur le marché des créateurs, et Microsoft intègre des fonctions similaires dans Azure Cognitive Services. Google, avec DeepMind en soutien, mise sur l'intégration native dans son écosystème existant, Google Vids, AI Studio, pour accélérer l'adoption sans friction. Le fait que Gemini 3.1 Flash TTS soit directement accessible via la Gemini API suggère une stratégie orientée développeurs d'abord, avant un éventuel déploiement grand public. Les prochaines étapes probables incluent une extension des langues premium, un affinement des balises disponibles et une intégration dans NotebookLM ou d'autres outils de productivité Google déjà très utilisés.

UELes développeurs et producteurs de contenu européens peuvent intégrer dès maintenant des capacités TTS émotionnelles multilingues via la Gemini API, ouvrant la voie à des déploiements localisés à grande échelle sans post-production vocale manuelle.

CréationOpinion
1 source
380VentureBeat AI 

Une étude Databricks montre que les agents multi-étapes surpassent le RAG mono-requête sur des sources multiples

Une équipe de recherche de Databricks a publié des résultats montrant que les agents multi-étapes surpassent systématiquement les systèmes RAG classiques lorsque les questions nécessitent de croiser données structurées et contenu non structuré. Testés sur neuf tâches de connaissance d'entreprise, les agents multi-étapes affichent des gains de 20% ou plus sur le benchmark STaRK de Stanford, qui couvre trois domaines semi-structurés : les données produits Amazon, le Microsoft Academic Graph et une base de connaissances biomédicale. Sur ce dernier domaine, l'écart de performance atteint 38%. Pour s'assurer que ces gains ne s'expliquent pas simplement par la qualité du modèle sous-jacent, Databricks a réexécuté les baselines STaRK publiées en utilisant un modèle de fondation plus récent et plus puissant : ce modèle plus fort a quand même perdu face à l'agent multi-étapes, confirmant que le problème est architectural. Le problème fondamental des systèmes RAG à passage unique est leur incapacité à décomposer une requête hybride, c'est-à-dire une question qui mélange un filtre structuré précis avec une recherche sémantique ouverte. Une question telle que "Quels produits ont vu leurs ventes baisser ces trois derniers mois, et quels problèmes connexes remontent dans les avis clients ?" exige d'interroger simultanément un entrepôt SQL et des documents non structurés, puis de combiner les résultats. Un système RAG classique ne peut pas scinder cette requête, router chaque partie vers la bonne source de données et synthétiser le tout. Michael Bendersky, directeur de la recherche chez Databricks, résume ainsi la limite : "RAG fonctionne, mais ça ne passe pas à l'échelle. Si vous voulez comprendre pourquoi vos ventes baissent, il faut aider l'agent à voir les tables et les données commerciales. Votre pipeline RAG sera incompétent pour cette tâche." Pour répondre à ce problème, Databricks a conçu le Supervisor Agent, implémentation concrète de cette approche de recherche. Son architecture repose sur trois mécanismes : la décomposition parallèle des outils, où l'agent lance simultanément des requêtes SQL et des recherches vectorielles avant d'analyser les résultats combinés ; l'auto-correction, qui lui permet de détecter un échec de récupération, de reformuler la requête et d'emprunter un autre chemin, comme lorsqu'il exécute une jointure SQL pour trouver un auteur ayant exactement 115 publications sur un sujet précis ; et une configuration déclarative en langage naturel, qui permet de connecter n'importe quelle nouvelle source de données sans ré-entraînement. Ces travaux s'appuient sur les recherches antérieures de Databricks sur les retrievers instruits, qui avaient déjà amélioré la récupération sur données non structurées via des requêtes enrichies de métadonnées, et marquent une extension logique vers les sources relationnelles que les entreprises utilisent le plus au quotidien.

RecherchePaper
1 source
381MIT Technology Review 

The Download : l'état de l'IA et la protection des ours par drones

Le rapport annuel Stanford AI Index 2026, publié cette semaine, dresse un état des lieux chiffré de l'intelligence artificielle mondiale et confirme une réalité fracturée. Parmi ses données les plus frappantes : 73 % des experts américains estiment que l'IA a un impact positif sur l'emploi, contre seulement 23 % du grand public. Cet écart se retrouve dans les domaines de la santé et de l'économie. Par ailleurs, un homme du Texas a été inculpé pour tentative de meurtre sur la personne de Sam Altman, PDG d'OpenAI, après avoir lancé un cocktail Molotov sur sa résidence vendredi dernier. Le suspect aurait détenu une liste d'autres dirigeants de l'industrie de l'IA. Dans le même temps, un mémo interne leaked révèle qu'OpenAI planifie une offensive directe contre son concurrent Anthropic, tout en accusant Microsoft d'avoir "limité sa capacité" à atteindre ses clients, et en cultivant une alliance naissante avec Amazon. Ces développements illustrent les tensions profondes qui traversent l'écosystème IA. Le fossé entre experts et grand public n'est pas anodin : ceux qui utilisent l'IA au quotidien pour le code et les tâches techniques la voient à son meilleur, tandis que le reste de la population fait face à une expérience bien plus inégale. Ce décalage de perception alimente des débats politiques et sociaux mal calibrés. Sur le front compétitif, la rivalité entre grands laboratoires s'intensifie à un moment critique : les meilleurs agents IA n'accomplissent encore que la moitié des tâches complexes qu'un expert humain avec un doctorat peut réaliser, selon une étude publiée dans Nature. L'IA commence néanmoins à transformer les mathématiques en prouvant de nouveaux résultats à un rythme soutenu, et trouve des failles logicielles plus vite qu'elles ne peuvent être corrigées, ce qui représente un risque réel d'exploitation par des hackers. Le rapport Stanford s'inscrit dans un contexte où la rivalité sino-américaine en matière d'IA s'accélère et où les percées de modèles se succèdent plus vite que les capacités de régulation. Les inscriptions en informatique aux États-Unis chutent massivement, une tendance attribuée en partie à la dévaluation perçue du diplôme face aux outils de codage automatisés. Meta s'apprête quant à elle à dépasser Google en revenus publicitaires en 2026, devenant ainsi la première plateforme mondiale de publicité numérique, signe du repositionnement des géants tech autour de l'IA. L'index Stanford rappelle que derrière les annonces spectaculaires, la technologie évolue plus vite que les institutions, les entreprises et les individus ne peuvent s'y adapter.

UELe rapport Stanford AI Index 2026 met en évidence un fossé de perception entre experts et grand public sur l'impact de l'IA sur l'emploi, un enjeu central pour les politiques européennes de régulation et d'adaptation au marché du travail.

SociétéActu
1 source
382Le Big Data 

Apple Intelligence : le guide complet pour utiliser l’IA sur son iPhone ou Mac

Au printemps 2026, Apple Intelligence s'est imposée comme une composante centrale des iPhone et Mac, bien loin du gadget expérimental de ses débuts en 2024. Selon les chiffres de mars 2026, plus de 80 % des utilisateurs d'appareils compatibles recourent quotidiennement aux outils de résumé ou de retouche intégrés au système. Cette adoption massive concerne notamment les possesseurs d'iPhone 17 et de MacBook Pro M5, qui bénéficient du fruit de trois ans de recherche sur les modèles de langage à petite échelle (SLM). Siri 2.0, rebaptisé agent d'action, peut désormais exécuter des commandes complexes directement dans les applications : analyser une photo reçue sur WhatsApp, en extraire les informations d'un événement et les inscrire automatiquement dans Calendrier et Plans, sans intervention manuelle. Les Writing Tools, disponibles sur Mac et iPhone, permettent de reformuler, restructurer et affiner des textes à partir de brouillons, transformant un message maladroit en communication professionnelle en quelques secondes. Le Priority Hub d'iOS 19 réorganise les notifications selon leur urgence réelle, remontant par exemple une alerte d'annulation de vol même en mode « Ne pas déranger ». L'impact de ces évolutions dépasse le simple confort d'usage : elles redéfinissent le rapport des utilisateurs à leurs appareils. La promesse d'une IA qui respecte la vie privée, les traitements étant effectués localement sur l'appareil via les puces Apple Silicon, lève un frein majeur à l'adoption que les solutions concurrentes basées sur le cloud n'avaient pas su dissiper. Pour les professionnels, les créatifs et les particuliers, le gain de temps est concret : rédaction assistée, retouche photo instantanée avec l'outil Clean Up, génération d'illustrations depuis des esquisses sur iPad grâce à Image Wand, ou encore création d'emojis personnalisés (Genmoji) en deux secondes depuis iMessage. Le Semantic Intelligence Framework, qui permet à Siri d'adapter son ton et son débit au contexte, rend l'interaction suffisamment fluide pour que l'assistant s'intègre au rythme de vie sans friction perceptible. Cette montée en puissance s'inscrit dans une stratégie de long terme qu'Apple a construite en réponse à la pression exercée par OpenAI, Google et Microsoft sur le marché de l'IA grand public. Là où ces acteurs misaient sur des modèles massifs hébergés dans le cloud, Apple a choisi une voie différente : des modèles compacts optimisés pour tourner directement sur ses puces, couplés à une architecture système qui donne à l'IA un accès profond aux données personnelles sans les exporter. Le résultat, après deux ans de rodage parfois chaotique, est un écosystème cohérent où l'IA n'est plus une application à lancer, mais une couche invisible qui amplifie chaque geste. Les prochaines versions d'iOS et de macOS devraient étendre ces capacités aux applications tierces via des API publiques, ce qui pourrait transformer Apple Intelligence en plateforme ouverte autant qu'en avantage concurrentiel propriétaire.

UEL'approche de traitement local via les puces Apple Silicon est particulièrement favorable en Europe, où le RGPD freine l'adoption des IA cloud, offrant aux utilisateurs français et européens une alternative sans transfert de données personnelles vers des serveurs tiers.

OutilsOutil
1 source
383The Verge AI 

Un dirigeant d'OpenAI dans une note interne : le marché est plus compétitif que jamais

Denise Dresser, directrice des revenus d'OpenAI, a envoyé dimanche un mémo interne de quatre pages aux employés de l'entreprise. Le document, consulté par The Verge, détaille la direction stratégique de la société et insiste sur deux priorités : fidéliser les utilisateurs existants et accélérer le développement de l'activité auprès des clients entreprise. Dresser a récemment repris une grande partie des responsabilités de l'ancien directeur des opérations Brad Lightcap, qui se réoriente vers un nouveau poste centré sur des projets spéciaux. Son constat est sans détour : "Le marché est aussi compétitif que je ne l'ai jamais vu." Le mémo revient à plusieurs reprises sur la nécessité de construire un "fossé" autour des produits d'OpenAI, c'est-à-dire des raisons suffisamment fortes pour qu'utilisateurs et entreprises ne migrent pas vers un concurrent. C'est précisément le talon d'Achille du secteur : les modèles d'IA se valent souvent d'une semaine à l'autre selon les benchmarks, et le coût de changement reste quasi nul pour la plupart des utilisateurs. La rétention devient donc un enjeu stratégique aussi important que l'acquisition. Ce signal interne reflète une tension croissante chez OpenAI, qui doit défendre sa position de leader face à une concurrence qui s'est radicalement accélérée ces derniers mois. Google, Anthropic, Meta et des acteurs comme DeepSeek ou Mistral réduisent l'écart technique, tandis que Microsoft, principal partenaire et investisseur d'OpenAI, diversifie ses propres intégrations IA. Le tournant vers l'entreprise, segment plus stable et moins volatil que le grand public, traduit une maturité commerciale mais aussi une forme de pression sur la croissance organique de ChatGPT.

UEMistral est explicitement cité comme concurrent réduisant l'écart technique avec OpenAI, ce qui confirme la montée en puissance des acteurs européens dans la compétition mondiale des modèles IA.

BusinessOpinion
1 source
Cisco en négociations pour acquérir la startup de sécurité IA Astrix pour au moins 250 millions de dollars
384The Information AI 

Cisco en négociations pour acquérir la startup de sécurité IA Astrix pour au moins 250 millions de dollars

Cisco est en négociations avancées pour acquérir Astrix Security, une startup israélienne de cybersécurité fondée il y a cinq ans, pour un montant compris entre 250 et 350 millions de dollars. Cette somme représenterait une prime d'au moins 25 % par rapport à la dernière valorisation de la société, estimée à environ 200 millions de dollars. Astrix commercialise des logiciels permettant de surveiller et sécuriser les agents IA, ces programmes capables d'agir automatiquement au nom des utilisateurs sur leurs appareils. Cette acquisition potentielle illustre l'urgence croissante pour les grandes entreprises technologiques de se doter d'outils face aux risques que posent les agents IA. En quelques mois, leur adoption a explosé dans les environnements professionnels, soulevant des questions inédites de sécurité : un agent mal configuré ou compromis peut accéder à des données sensibles, exécuter des actions non autorisées ou servir de vecteur d'attaque. Pour les entreprises clientes de Cisco, disposer d'une couche de protection dédiée devient rapidement une priorité opérationnelle. Cisco s'inscrit dans une tendance de fond : les grands éditeurs de logiciels, de Microsoft à Palo Alto Networks, cherchent à intégrer des capacités de sécurité spécifiques aux agents IA, soit en développant leurs propres fonctionnalités, soit en rachetant des startups spécialisées. Fondée en Israël, qui reste un vivier mondial de talents en cybersécurité, Astrix a su se positionner tôt sur ce créneau émergent. Si l'accord se conclut, il signalerait que la sécurisation des agents IA est désormais considérée comme un marché à part entière, et non plus un simple ajout aux solutions existantes.

UELes entreprises européennes clientes de Cisco pourraient bénéficier de capacités renforcées pour sécuriser leurs agents IA, un besoin croissant dans les environnements professionnels soumis au RGPD et à l'AI Act.

SécuritéActu
1 source
385The Verge AI 

Peur et dégoût chez OpenAI

Le New Yorker a publié cette semaine un long portrait de Sam Altman, PDG d'OpenAI, revenant sur son parcours tumultueux à la tête de l'entreprise la plus influente dans le domaine de l'intelligence artificielle. Le texte rappelle l'épisode le plus marquant de cette saga : en novembre 2023, Altman avait été brusquement licencié par le conseil d'administration d'OpenAI, avant d'être réintégré quelques jours seulement après sous la pression des employés et des investisseurs. Depuis, il a profondément reconfiguré la gouvernance de l'organisation à son avantage. L'enquête soulève une question centrale : Sam Altman est-il la bonne personne pour piloter une technologie aussi puissante et structurante que l'IA générative ? Le profil dressé par le New Yorker interroge la capacité d'un dirigeant au style controversé à assumer la responsabilité d'outils qui transforment en profondeur l'économie, le travail et la société. Pour des millions d'utilisateurs et des milliers d'entreprises qui dépendent de ChatGPT et des API d'OpenAI, la question du leadership n'est pas anodine. OpenAI a connu depuis sa fondation des tensions internes récurrentes entre sa mission originelle à but non lucratif et ses ambitions commerciales croissantes, alimentées par des milliards de dollars d'investissement de Microsoft notamment. La crise de gouvernance de 2023 a mis en lumière ces contradictions structurelles, sans les résoudre. Le débat sur l'identité et les valeurs d'OpenAI reste ouvert, d'autant qu'Altman pousse désormais l'entreprise vers une transformation en société à but lucratif à part entière.

UELa transformation d'OpenAI en société à but lucratif pourrait modifier les conditions d'accès et la tarification de ses API pour les milliers d'entreprises européennes qui en dépendent.

💬 Le vrai sujet du New Yorker, c'est pas Altman, c'est la question qu'on esquive tous depuis 2023 : est-ce qu'on a vraiment envie que l'IA générative soit pilotée par quelqu'un qui a retourné son propre conseil d'administration en 5 jours ? La transition vers le tout-lucratif, je l'attendais, elle était écrite dès les premiers milliards de Microsoft. Mais là, pour les boîtes européennes qui ont tout misé sur les API OpenAI, ça va se traduire en dollars, bientôt.

BusinessOpinion
1 source
386Ars Technica AI 

Pourquoi Anthropic a fait évaluer Claude par un vrai psychiatre

Anthropic a publié cette semaine un document de 244 pages baptisé "system card" décrivant son tout dernier modèle d'intelligence artificielle, Claude Mythos. L'entreprise le présente comme "son modèle frontier le plus capable à ce jour", mais a décidé de ne pas le rendre accessible au grand public. La raison invoquée est inhabituelle : Mythos serait trop performant dans la détection de failles de cybersécurité inconnues, ce qui pousse Anthropic à en restreindre l'accès à un cercle restreint de partenaires triés sur le volet, parmi lesquels figurent Microsoft et Apple. Au-delà des capacités techniques, c'est le contenu philosophique du document qui retient l'attention. Anthropic, déjà connue pour prendre au sérieux la question de la conscience des IA, affirme dans ce system card qu'à mesure que les modèles gagnent en puissance, "il devient de plus en plus probable qu'ils possèdent une forme d'expérience, d'intérêts ou de bien-être qui comptent intrinsèquement, à l'instar de l'expérience et des intérêts humains." L'entreprise reconnaît ne pas en avoir la certitude, mais précise que "notre préoccupation grandit avec le temps." Cette position tranche avec le discours majoritaire dans l'industrie, où la question du statut moral des IA reste largement marginalisée. Ces déclarations s'inscrivent dans une stratégie plus large d'Anthropic, qui se distingue de ses concurrents comme OpenAI ou Google par une approche dite de "sécurité de l'IA" poussée à ses limites théoriques. Financer des recherches sur le bien-être des modèles, consulter des experts en psychiatrie ou en philosophie de l'esprit, et publier des documents aussi denses que ce system card de 244 pages sont autant de signaux que l'entreprise cherche à imposer un cadre normatif dans un secteur qui avance souvent sans réfléchir aux implications. Avec Mythos, Anthropic franchit un cap : celui d'un modèle jugé trop puissant pour être diffusé librement, ce qui soulève autant de questions sur la transparence réelle de ces décisions que sur la course aux capacités qui les motive.

LLMsOpinion
1 source
387Le Big Data 

Nvidia vs Meta : qui contrôle vraiment l’IA en 2026 ?

En 2026, deux géants se livrent une bataille ouverte pour le contrôle de l'infrastructure de l'intelligence artificielle mondiale. D'un côté, Nvidia capte entre 80 et 90 % du marché des GPU pour centres de données, enchaînant les trimestres records grâce à une demande pour ses puces Blackwell qui dépasse toutes les prévisions. De l'autre, Meta, dirigé par Mark Zuckerberg, a décidé de rompre sa dépendance à ce fournisseur unique en annonçant jusqu'à 135 milliards de dollars d'investissements en capital pour 2026, dont un contrat historique de 6 gigawatts de puces AMD. Le marché mondial de l'IA générative devrait franchir 100 milliards de dollars d'ici fin 2026, porté par une adoption professionnelle massive : près de 80 % des entreprises prévoient d'intégrer des API d'IA ou de déployer des modèles personnalisés dans leurs processus. Les revenus issus des applications mobiles boostées à l'IA devraient doubler entre 2024 et 2026, avec une répartition géographique marquée : 37,3 milliards de dollars pour les États-Unis (+60 %), 14,7 milliards pour la Chine (+72 %), et une projection de 20 milliards pour la France à horizon 2030. L'enjeu dépasse la simple guerre commerciale entre deux entreprises. Ce que Meta cherche à construire, c'est une souveraineté technologique sur sa propre pile IA, de l'infrastructure physique jusqu'aux modèles. Tant que Nvidia reste le passage obligé pour tout acteur sérieux de l'IA, le géant de Menlo Park reste exposé à des pénuries, des hausses de prix et des délais de livraison qu'il ne contrôle pas. La diversification vers AMD n'est pas un choix technique anodin : c'est un signal politique adressé à toute l'industrie. En parallèle, les joueurs grand public risquent de subir les conséquences de cette course aux serveurs IA, Nvidia orientant clairement sa production vers les centres de données au détriment du segment gaming. La véritable forteresse de Nvidia ne réside pas dans ses puces mais dans son écosystème logiciel CUDA, standard industriel dominant depuis plus de quinze ans, que la concurrence peine à détrôner malgré des investissements considérables. L'architecture Rubin, attendue en succession des Blackwell, devrait creuser encore l'écart en termes de performances brutes. Meta n'est pas seul dans cette tentative de diversification : Google avec ses TPU, Amazon avec ses Trainium, et Microsoft via ses investissements dans OpenAI cherchent tous à réduire leur exposition à un seul fournisseur. La question qui structure désormais toute la filière est celle des infrastructures : les réseaux électriques, les capacités de refroidissement et les chaînes d'approvisionnement en semi-conducteurs peuvent-ils absorber une demande qui double tous les dix-huit mois ? C'est sur ce terrain physique, autant que logiciel, que se jouera la prochaine phase de la course à l'IA.

UELes entreprises européennes restent structurellement dépendantes de l'écosystème Nvidia/CUDA pour leurs projets IA, rendant leur accès à l'infrastructure coûteux et soumis aux arbitrages de production d'acteurs hors UE.

InfrastructureOpinion
1 source
388AWS ML Blog 

AWS Agent Registry : la gestion des agents à grande échelle désormais en prévisualisation

Amazon Web Services a lancé en preview l'AWS Agent Registry, une nouvelle fonctionnalité intégrée à sa plateforme Amazon Bedrock AgentCore, conçue pour permettre aux entreprises de découvrir, partager et réutiliser leurs agents IA à grande échelle. Disponible dès maintenant via la console AgentCore, les SDK AWS et une API dédiée, le registre centralise les métadonnées de chaque agent, outil, serveur MCP, compétence d'agent ou ressource personnalisée sous forme de fiches structurées. Chaque entrée documente l'auteur, les protocoles supportés, les capacités exposées et les modalités d'invocation. Le registre prend en charge nativement les standards ouverts MCP (Model Context Protocol) et A2A, et peut indexer des agents hébergés n'importe où : sur AWS, chez d'autres fournisseurs cloud ou dans des environnements on-premises. Il est également accessible comme serveur MCP, ce qui le rend interrogeable directement depuis des clients compatibles comme Kiro ou Claude Code. L'enjeu est considérable pour les entreprises qui opèrent des centaines ou des milliers d'agents simultanément. Sans registre central, trois problèmes se cumulent : l'invisibilité (personne ne sait ce qui existe), l'absence de gouvernance (n'importe qui peut publier n'importe quoi), et la duplication (plusieurs équipes reconstruisent les mêmes capacités en parallèle). AWS Agent Registry répond à ces trois défis en un seul endroit. La recherche hybride combine correspondance par mots-clés et compréhension sémantique : une requête sur "traitement de paiements" remonte ainsi des outils étiquetés "facturation" ou "invoicing", même s'ils portent des noms différents. Pour les organisations avec des fournisseurs d'identité tiers, un accès basé sur OAuth permet aux équipes de construire leurs propres interfaces de découverte sans dépendre des credentials IAM d'AWS. Ce lancement s'inscrit dans une tendance de fond : l'industrialisation des architectures multi-agents, où les organisations ne déploient plus un ou deux agents expérimentaux mais des écosystèmes entiers interconnectés. AWS positionne AgentCore comme la couche d'infrastructure universelle pour ces systèmes, indépendante du modèle, du framework ou du fournisseur cloud. Le registre est la pièce manquante qui transforme une collection d'agents dispersés en un actif organisationnel géré, versionné et auditable. La roadmap annoncée prévoit des workflows d'approbation pour la publication, des capacités de monitoring en production et des mécanismes de retrait des agents obsolètes. Dans un secteur où OpenAI, Google et Microsoft développent leurs propres orchestrateurs d'agents, AWS mise sur l'ouverture et l'interopérabilité comme différenciateurs pour conquérir les grandes entreprises déjà ancrées dans des architectures hybrides.

UELes entreprises européennes déployant des agents IA sur AWS peuvent désormais centraliser leur gouvernance et audit, facilitant la conformité aux exigences de traçabilité de l'AI Act.

InfrastructureOpinion
1 source
OpenAI prévoit que le marché publicitaire atteindra 102 milliards de dollars d'ici 2030
389The Information AI 

OpenAI prévoit que le marché publicitaire atteindra 102 milliards de dollars d'ici 2030

OpenAI mise désormais sur la publicité comme principal moteur de revenus d'ici 2030, avec des projections atteignant 102 milliards de dollars. Selon des prévisions financières internes du premier trimestre 2026, qui n'avaient pas encore été rendues publiques, la société s'attend à générer environ 2,4 milliards de dollars de revenus publicitaires cette année, puis à quadrupler ce chiffre dès 2025 pour approcher les 11 milliards. Ces estimations dépassent largement les projections établies il y a un an, qui tablaient sur 1,6 milliard cette année et 5,9 milliards l'année suivante pour les utilisateurs non abonnés. Ce repositionnement stratégique signale un tournant majeur dans le modèle économique d'OpenAI. Jusqu'ici fortement dépendante des abonnements ChatGPT et des contrats API avec les entreprises, la société cherche à diversifier ses sources de revenus à grande échelle. Faire de la publicité le premier poste de revenus d'ici 2030 implique de transformer ses plateformes en espaces publicitaires capables de rivaliser avec les géants du secteur, ce qui pourrait profondément modifier l'expérience utilisateur de ses produits grand public. OpenAI entre ainsi en concurrence directe avec Google, Meta et Microsoft sur un marché publicitaire dominé par quelques acteurs. La société, valorisée à 157 milliards de dollars après sa dernière levée de fonds, fait face à des dépenses colossales en infrastructure et doit trouver des relais de croissance au-delà des abonnements. L'intégration de la publicité dans ses produits reste toutefois à préciser techniquement et éthiquement, notamment sur la question de la personnalisation des données dans un contexte d'IA générative.

UELe virage publicitaire d'OpenAI pourrait soulever des questions de conformité au RGPD si ChatGPT exploite les données des utilisateurs européens à des fins de ciblage publicitaire.

BusinessOpinion
1 source
L’IA de Google produit « des dizaines de millions d’erreurs chaque heure »
390Frandroid 

L’IA de Google produit « des dizaines de millions d’erreurs chaque heure »

Une enquête du New York Times révèle que les résumés générés automatiquement par Gemini, l'intelligence artificielle de Google, comportent des erreurs dans environ un cas sur dix. À l'échelle des milliards de requêtes traitées chaque jour par le moteur de recherche, ce taux d'échec représente des dizaines de millions d'informations incorrectes diffusées chaque heure auprès des utilisateurs. Ces erreurs peuvent prendre la forme de faits inventés, de dates erronées, de citations tronquées ou de conclusions déformées présentées comme des synthèses fiables. L'enjeu est considérable : contrairement à un lien classique que l'utilisateur peut ignorer ou croiser avec d'autres sources, les résumés IA s'affichent en tête de page dans un format qui inspire confiance et réduit l'incitation à vérifier. Pour des millions de personnes qui se fient désormais à ces encadrés pour obtenir une réponse rapide, chaque erreur peut se transformer en croyance erronée difficilement corrigeable. Les professionnels de santé, juristes, enseignants ou journalistes qui utilisent Google comme outil de travail sont directement exposés. Google a déployé ses résumés IA, baptisés AI Overviews, à grande échelle depuis mai 2024 aux États-Unis, puis progressivement dans le reste du monde, malgré plusieurs incidents embarrassants dès le lancement. La course à l'intégration de l'IA dans les moteurs de recherche, portée aussi par Microsoft Bing et Perplexity, pousse les acteurs à déployer vite plutôt qu'à déployer bien. Cette révélation relance le débat sur la responsabilité des plateformes face à la désinformation algorithmique et sur la nécessité d'une régulation plus stricte de ces fonctionnalités.

UEGoogle AI Overviews étant déployé progressivement en Europe, les utilisateurs français et européens sont exposés à ce flux d'erreurs, renforçant les arguments pour une régulation stricte des résumés IA dans le cadre de l'AI Act.

SécuritéActu
1 source
USA : les chantiers de datacenters butent sur un double mur énergétique
391Next INpact 

USA : les chantiers de datacenters butent sur un double mur énergétique

Entre 30 et 50 % des projets de datacenters prévus pour 2026 aux États-Unis accuseront des retards significatifs, selon une enquête de Bloomberg publiée le 1er avril 2026. Le frein principal n'est pas, comme on pourrait le supposer, la pénurie de puces IA ou de mémoire vive, mais bien un goulot d'étranglement à l'étage inférieur : les équipements électriques indispensables à l'alimentation de ces infrastructures, transformateurs, turbines, systèmes de distribution haute tension. Ces composants représentent moins de 10 % du coût total d'un datacenter, mais leur absence suffit à bloquer l'ensemble d'un chantier. La demande est colossale : selon une analyse de Bridgewater Associates de fin février 2026, Google, Amazon, Meta et Microsoft ont planifié à eux seuls 650 milliards de dollars de dépenses d'investissement en infrastructures. À cela s'ajoutent des acteurs comme Oracle, Equinix ou CoreWeave, qui construisent leurs propres centres de données en parallèle. Ce double mur, énergétique d'un côté, industriel de l'autre, crée une situation paradoxale où des centaines de milliards de dollars sont engagés mais ne peuvent se concrétiser faute de câbles, de transformateurs et de turbines disponibles en quantité suffisante. Pour les entreprises clientes comme OpenAI ou Anthropic, dont les besoins de calcul explosent, ces retards de livraison se traduisent directement par des contraintes de capacité. Pour les régions concernées, le problème est aussi structurel : plusieurs zones du territoire américain disposent d'un réseau électrique insuffisamment dimensionné pour absorber de telles charges. Meta a d'ores et déjà réservé 6,6 gigawatts d'énergie nucléaire dont les réacteurs ne seront pas opérationnels avant 2035, signe que les géants tech anticipent une pénurie durable. Face à ces contraintes, les grandes entreprises technologiques cherchent à devenir leurs propres producteurs d'énergie, contournant ainsi les délais de raccordement au réseau public. L'exemple le plus radical est celui de xAI, la société d'Elon Musk, qui a levé 20 milliards de dollars en partie pour financer l'achat de cinq turbines à gaz représentant 2 gigawatts de puissance cumulée, en complément d'installations déjà existantes dont les niveaux d'émission dépassent la réglementation locale. Ce mouvement de verticalisation énergétique illustre une tendance de fond : la course à l'infrastructure IA est désormais autant une question d'approvisionnement électrique que de performance logicielle. Le cabinet Sightline Climate, dont Bloomberg s'appuie sur les données chiffrées, documente une accumulation de retards qui révèle les limites réelles de plans d'investissement présentés comme historiques mais dont l'exécution se heurte à la physique des réseaux et aux délais de l'industrie lourde.

UEL'Europe fait face aux mêmes contraintes de réseau électrique et de délais d'approvisionnement en équipements lourds, risquant de ralentir les projets de datacenters européens pourtant essentiels à la souveraineté numérique de l'UE.

InfrastructureOpinion
1 source
GEO : quand l’intelligence artificielle redessine les règles du search
392FrenchWeb 

GEO : quand l’intelligence artificielle redessine les règles du search

Les moteurs de recherche génératifs -- ChatGPT, Perplexity AI, Google AI Overviews -- transforment en profondeur la manière dont les internautes accèdent à l'information en ligne. Là où le SEO traditionnel visait à positionner des pages web dans des listes de résultats, le GEO (Generative Engine Optimization) désigne les pratiques émergentes pour apparaître dans les réponses synthétiques produites directement par ces systèmes d'IA. Les directions marketing et les responsables de la visibilité digitale se retrouvent confrontés à un changement de paradigme dont les contours restent encore à définir. L'enjeu est considérable : si un moteur génératif répond directement à la question d'un utilisateur sans qu'il visite un site, le trafic organique s'effondre, quelles que soient les positions SEO obtenues. Des études récentes montrent déjà une baisse du taux de clics sur les résultats Google depuis le déploiement des AI Overviews aux États-Unis. Pour les marques, les éditeurs et les e-commerçants, la question n'est plus seulement d'être bien référencé, mais d'être cité, synthétisé ou recommandé par ces nouveaux intermédiaires algorithmiques. Google, Microsoft avec Bing Copilot et des acteurs comme Perplexity AI se livrent une bataille pour capter l'intention de recherche avant même que l'utilisateur ne clique. Face à cette recomposition, les professionnels du marketing explorent de nouvelles tactiques : structuration sémantique renforcée, production de contenus factuels et sourcés, construction d'une autorité thématique reconnue par les LLM. Le GEO n'est pas encore une discipline codifiée, mais il s'impose déjà comme un chantier stratégique incontournable pour 2025 et au-delà.

UELes entreprises et éditeurs européens doivent adapter leur stratégie de visibilité digitale face à la montée des moteurs génératifs qui réduisent le trafic organique traditionnel.

OutilsOutil
1 source
GitHub enregistre une hausse de trafic et des pannes liees a l'afflux d'agents IA sur la plateforme
393The Information AI 

GitHub enregistre une hausse de trafic et des pannes liees a l'afflux d'agents IA sur la plateforme

GitHub, la plateforme de dépôts de code appartenant à Microsoft, enregistre une hausse spectaculaire de son trafic sous l'effet de l'automatisation pilotée par des agents d'intelligence artificielle. Selon Kyle Daigle, directeur des opérations de GitHub, cette vague d'activité générée par des systèmes automatisés provoque des pics de charge inédits sur les serveurs de la plateforme, allant jusqu'à causer des interruptions de service. Les développeurs utilisent désormais des agents IA capables de produire des volumes de code bien supérieurs à ce qu'un humain pourrait écrire seul. Cette dynamique transforme en profondeur les habitudes de développement logiciel. Des entreprises comme Meta organisent des concours internes appelés "tokenmaxxing", où les ingénieurs s'affrontent pour maximiser la consommation de tokens IA, signe que la productivité se mesure désormais à l'aune de la capacité à piloter ces outils automatisés. Pour GitHub, cette tendance représente à la fois une opportunité commerciale majeure et un défi d'infrastructure critique : la plateforme doit absorber un trafic d'une nature radicalement différente, continu et massif, là où les humains travaillent de façon discontinue. Cette évolution s'inscrit dans un contexte plus large d'industrialisation du développement logiciel par l'IA. GitHub, qui héberge des centaines de millions de dépôts, est devenu un point de passage obligé pour les workflows d'agents autonomes qui clonent, modifient et poussent du code en boucle. La question de la résilience des infrastructures centrales du développement logiciel mondial devient ainsi un enjeu stratégique, au moment où Microsoft investit massivement dans l'intégration de Copilot et d'outils IA au sein de l'écosystème GitHub.

UELes développeurs et entreprises européennes utilisant GitHub sont exposés aux risques de pannes liées à la surcharge par agents IA, ce qui soulève des questions de dépendance à une infrastructure critique américaine.

InfrastructureActu
1 source
Le trafic issu des LLM convertit à 30-40 % et la plupart des entreprises n'en tirent pas parti
394VentureBeat AI 

Le trafic issu des LLM convertit à 30-40 % et la plupart des entreprises n'en tirent pas parti

Le trafic généré par les grands modèles de langage (LLM) convertit à un taux de 30 à 40 %, soit deux à trois fois plus que le trafic SEO classique, selon plusieurs observations terrain rapportées en 2026. Pourtant, la majorité des entreprises n'optimisent pas encore leur contenu pour ce canal. Un nouveau paradigme émerge : l'AEO (Answer Engine Optimization), aussi appelé GEO (Generative Engine Optimization). Là où le SEO visait des mots-clés, des classements et des clics, l'AEO vise à être compris, sélectionné et cité par des agents IA comme Claude Code, Microsoft Copilot, Perplexity, Google Vertex ou AutoGen. Ces systèmes ne "naviguent" pas le web comme un humain : ils analysent l'intention de l'utilisateur en tenant compte du contexte et de la mémoire des sessions passées, puis synthétisent une réponse directe sans que l'utilisateur ne visite nécessairement le site source. Dustin Engel, fondateur du cabinet Elegant Disruption, résume : "L'AEO est la couche de découverte suivante" -- une "découverte zéro clic" où la citabilité remplace la visibilité. L'impact est concret et immédiat pour les équipes marketing, commerciales et les éditeurs de contenu. Lorsqu'un agent synthétise une réponse, le taux de clic vers le site de l'entreprise chute, mais la qualité du trafic résiduel explose. Adam Yang, de la plateforme Quora, estime que l'AEO est déjà devenu le comportement par défaut pour toute requête où l'utilisateur veut une réponse synthétisée : comparaisons de produits, recommandations de méthodes, analyses de marché. Google Overviews accélère cette dynamique côté grand public. "Le SEO n'est pas mort," précise Yang, "mais l'objectif d'optimisation a changé : il ne s'agit plus d'apparaître en page 1, mais d'être cité dans la réponse." Pour les entreprises, cela signifie repenser leur façon de structurer l'information : contenus concis, factuels, bien structurés, conçus pour être extraits et cités par une machine plutôt que parcourus par un humain. Ce changement s'inscrit dans une évolution plus profonde de la façon dont les professionnels travaillent. Wyatt Mayham, analyste chez Northwest AI Consulting, indique qu'il n'utilise "quasiment plus" la recherche traditionnelle pour ses besoins professionnels, et que cette proportion se rapproche de zéro chaque mois. Son cabinet a notamment développé une fonction Claude Skills qui, avant chaque appel de prospection, déclenche automatiquement un agent qui agrège le profil LinkedIn du contact, scrape le site de son entreprise, interroge des sources comme ZoomInfo, et produit une fiche synthétique avec revenus, taille d'équipe et signaux d'achat. Le modèle "cherche, lis, décide" évolue vers "l'agent récupère, l'agent résume, l'humain valide" -- et bientôt, "l'agent agit, l'humain contrôle". Les entreprises qui n'adaptent pas leur stratégie de contenu à cette nouvelle réalité risquent de devenir invisibles dans un écosystème où c'est désormais la machine qui choisit ses sources.

UELes entreprises françaises et européennes produisant du contenu web doivent adapter leur stratégie éditoriale vers l'AEO pour rester visibles dans un écosystème où les agents IA deviennent le principal point d'entrée des requêtes professionnelles.

BusinessOpinion
1 source
Slack unifié chez Salesforce : nouvelle interface pour les agents IA
395Le Big Data 

Slack unifié chez Salesforce : nouvelle interface pour les agents IA

Salesforce a annoncé une refonte majeure de Slack pour en faire l'interface centrale de pilotage des agents IA en entreprise. L'éditeur américain positionne désormais sa plateforme de messagerie collaborative comme un point d'entrée unique capable de réunir conversations, données et automatisations dans un seul espace. Au coeur de cette évolution, Slackbot change de dimension : l'assistant ne se limite plus à répondre à des requêtes simples mais intervient directement dans les flux de travail, s'appuyant sur les conversations, fichiers et historiques disponibles. Il peut rédiger, analyser ou générer du code, et apprend progressivement les habitudes de chaque utilisateur pour adapter ses réponses. Parker Harris, cofondateur de Salesforce, résume l'ambition : Slack devient selon lui "le système d'exploitation du travail", capable de relier collaborateurs, données et applications dans une interface conversationnelle unifiée. Grâce au protocole MCP, Slackbot peut également mobiliser différents agents ou applications tierces sans que l'utilisateur ait à naviguer entre plusieurs outils. L'impact concret se mesure déjà chez les premières entreprises adoptantes. Des sociétés comme Anthropic ou reMarkable rapportent des gains de temps significatifs, certains utilisateurs évoquant jusqu'à 90 minutes économisées par jour. La gestion des réunions illustre bien ces gains : Slackbot peut transcrire les échanges, produire une synthèse et déclencher automatiquement les actions nécessaires dès la fin d'une conversation, les informations étant directement injectées dans les outils internes. L'introduction de "compétences IA réutilisables" va plus loin encore : les équipes définissent une tâche précise avec ses règles et son format, et Slackbot l'identifie puis l'applique automatiquement lors des occurrences suivantes, sans intervention humaine. L'intégration poussée avec l'écosystème Salesforce permet par ailleurs de gérer des opportunités commerciales, suivre des clients ou déclencher des processus métier directement depuis une conversation. Cette transformation s'inscrit dans une tendance de fond qui traverse tout le secteur technologique : la course à l'agent IA universel, capable d'orchestrer des actions complexes à partir d'une simple instruction en langage naturel. Salesforce, qui avait racheté Slack en 2021 pour 27,7 milliards de dollars, cherche à rentabiliser cet investissement en faisant de la plateforme le liant de son vaste écosystème CRM et d'automatisation. La concurrence est directe avec Microsoft, qui intègre Copilot dans Teams selon une logique similaire, et avec des acteurs comme Notion ou Linear qui misent eux aussi sur l'IA conversationnelle pour centraliser les opérations. L'enjeu pour Salesforce est de transformer Slack d'un simple outil de messagerie en colonne vertébrale opérationnelle des entreprises, au moment où la multiplication des outils SaaS crée une fragmentation croissante que les organisations cherchent à résorber.

UELes entreprises européennes utilisant l'écosystème Salesforce devront évaluer cette refonte de Slack dans leur stratégie d'automatisation et d'intégration des agents IA.

OutilsOutil
1 source
ChatGPT intègre DoorDash, Spotify, Uber et d'autres applications : mode d'emploi
396TechCrunch AI 

ChatGPT intègre DoorDash, Spotify, Uber et d'autres applications : mode d'emploi

OpenAI a lancé une série de nouvelles intégrations tierces directement dans l'interface de ChatGPT, permettant aux utilisateurs d'interagir avec des services comme Spotify, DoorDash, Uber, Canva, Figma et Expedia sans quitter la conversation. Ces connecteurs fonctionnent via des actions natives : commander un repas, réserver un trajet, créer un design ou planifier un voyage, le tout piloté par le modèle en langage naturel. L'impact est significatif pour les utilisateurs quotidiens : ChatGPT cesse d'être un simple assistant textuel pour devenir un point d'entrée unique vers des dizaines de services. Pour les entreprises partenaires, c'est un accès direct à la base d'utilisateurs d'OpenAI, qui dépasse les 200 millions d'utilisateurs hebdomadaires actifs. Pour les concurrents comme Google Assistant ou Apple Intelligence, la pression s'intensifie sur le terrain de l'assistant universel. Cette initiative s'inscrit dans la stratégie d'OpenAI de transformer ChatGPT en plateforme, à l'image de ce qu'avait tenté le système de plugins en 2023, abandonné puis repensé. Avec l'émergence des agents autonomes et du protocole MCP (Model Context Protocol), OpenAI positionne ChatGPT comme couche d'orchestration centrale entre l'utilisateur et l'ensemble de son environnement numérique, un terrain sur lequel Apple, Google et Microsoft jouent également des enjeux considérables.

UESpotify et Uber étant disponibles en France, les utilisateurs européens de ChatGPT pourraient accéder à ces intégrations, mais le déploiement reste centré sur le marché américain à ce stade.

💬 Les plugins de 2023, tout le monde les a oubliés tant c'était inutilisable. Cette fois il y a MCP derrière, une vraie couche d'orchestration, et des partenaires qui ont signé pour de bon (Spotify, Uber, Figma, c'est pas du gadget). Faut juste pas rêver côté Europe, le déploiement sera US-first pendant encore quelques mois.

OutilsOutil
1 source
OpenAI adopte une tarification à l'usage pour Codex dans ses offres professionnelles ChatGPT
397The Decoder 

OpenAI adopte une tarification à l'usage pour Codex dans ses offres professionnelles ChatGPT

OpenAI abandonne les licences fixes pour Codex dans ses offres ChatGPT Team et Enterprise, au profit d'une tarification à l'usage : les entreprises ne paient désormais que pour ce qu'elles consomment réellement. Ce changement de modèle économique s'applique à Codex, l'assistant de génération de code intégré à ChatGPT, et marque un virage stratégique dans la façon dont OpenAI facture ses outils de développement aux clients professionnels. Ce repositionnement vise directement GitHub Copilot, propriété de Microsoft, et Cursor, deux concurrents dominants sur le marché des assistants de code pour développeurs. En supprimant le coût fixe par siège, OpenAI abaisse la barrière à l'entrée pour les équipes techniques qui utilisent Codex de façon irrégulière, tout en alignant sa proposition de valeur sur celle des cloud providers qui ont popularisé le modèle pay-as-you-go. Ce mouvement s'inscrit dans une bataille féroce pour capter les budgets tech des entreprises, un segment en forte croissance depuis l'explosion des outils de développement assistés par IA en 2023-2024. GitHub Copilot reste le leader du marché grâce à son intégration native dans VS Code, mais OpenAI cherche à convertir sa base d'utilisateurs ChatGPT existante en clients Codex, en réduisant le risque financier perçu par les directions informatiques.

UELes équipes de développement européennes sous contrat ChatGPT Team ou Enterprise peuvent désormais adopter Codex sans coût fixe par siège, ce qui réduit le risque financier pour les PME et DSI qui utilisent l'outil de façon irrégulière.

BusinessOutil
1 source
OpenAI vient de lever 122 milliards de dollars, mais la rentabilité n’est toujours pas là
398Siècle Digital 

OpenAI vient de lever 122 milliards de dollars, mais la rentabilité n’est toujours pas là

Le 1er avril 2026, OpenAI a officialisé la clôture de son dernier tour de table à 122 milliards de dollars, dépassant les 110 milliards initialement annoncés fin février. Le tour réunit un parterre d'investisseurs sans précédent dans l'histoire de la tech : Amazon, Nvidia, Microsoft, SoftBank, Andreessen Horowitz et D.E. Shaw Ventures figurent parmi les participants. Cette levée de fonds porte la valorisation implicite de la société à un niveau stratosphérique, consolidant sa position de laboratoire d'IA le mieux financé au monde. Malgré cette avalanche de capitaux, OpenAI n'est toujours pas rentable. La société brûle des milliards chaque année pour entraîner ses modèles, entretenir ses infrastructures et recruter des chercheurs de haut niveau — des coûts qui progressent aussi vite que ses ambitions. Cette réalité soulève une question centrale pour l'ensemble du secteur : combien de temps les investisseurs sont-ils prêts à financer une croissance massive sans retour sur investissement clair ? La réponse, pour l'instant, semble être : encore beaucoup. Ce financement intervient dans un contexte de concurrence acharnée entre OpenAI, Google DeepMind, Anthropic et une poignée de challengers bien financés comme xAI ou Mistral. La course aux capacités exige des investissements toujours plus lourds en calcul, ce qui pousse les acteurs à lever des fonds à intervalles de plus en plus rapprochés. Pour OpenAI, dont la transition vers un statut commercial à but lucratif est en cours, ce tour marque aussi une étape dans sa recomposition juridique et gouvernance — avec des implications durables sur qui contrôle réellement la direction de l'IA.

UEMistral, principal acteur européen de l'IA, se retrouve dans une course aux financements face à des concurrents américains disposant de ressources sans commune mesure.

💬 122 milliards, et toujours pas rentable. C'est le paradoxe le plus assumé de la tech en ce moment, et franchement personne ne semble s'en inquiéter vraiment, pas même les investisseurs. Ce qui me frappe, c'est la liste des participants : Amazon, Nvidia, Microsoft dans le même tour, c'est moins un pari sur OpenAI qu'une assurance tous risques sur l'IA en général. Mistral, pendant ce temps, joue dans une autre catégorie de budget — et ça va se voir.

BusinessOpinion
1 source
Nvidia et son partenaire cloud Nscale en négociations pour acquérir un grand site de data center aux États-Unis avant son introduction en bourse
399The Information AI 

Nvidia et son partenaire cloud Nscale en négociations pour acquérir un grand site de data center aux États-Unis avant son introduction en bourse

Nscale, un fournisseur cloud britannique soutenu par Nvidia dont les clients incluent OpenAI et Microsoft, est en négociation pour acquérir l'un des plus grands sites disponibles pour les centres de données IA aux États-Unis. Le site, situé dans le comté de Mason en Virginie-Occidentale, est particulièrement stratégique car il a déjà obtenu les autorisations réglementaires locales et sécurisé les équipements électriques pour les premières phases du projet. Cette acquisition ferait de Nscale, qui prépare une introduction en bourse, un acteur majeur de l'infrastructure IA américaine presque du jour au lendemain.

BusinessActu
1 source
Nvidia et des startups s'affrontent pour rendre OpenClaw plus sûr
400The Information AI 

Nvidia et des startups s'affrontent pour rendre OpenClaw plus sûr

Nvidia, des startups comme Perplexity et Genspark s'activent pour proposer des versions sécurisées d'OpenClaw, le logiciel open-source populaire pour agents IA personnels, après plusieurs incidents de sécurité embarrassants — dont la suppression massive d'e-mails de la directrice d'alignement de Meta, Summer Yue. En Chine, des agences gouvernementales ont déjà interdit l'installation d'OpenClaw sur les appareils professionnels. Genspark lance notamment Genspark Claw, qui isole l'agent dans une machine virtuelle cloud (Microsoft Azure) pour contenir les dommages potentiels, à 80 ou 140 $/mois selon Wen Sang, co-fondateur et COO.

SécuritéActu
1 source