Aller au contenu principal

Dossier Microsoft — page 3

1056 articles · page 3 sur 22

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

Apple Intelligence : comment Siri AI voit vraiment votre écran iPhone ?
101Le Big Data OutilsOutil

Apple Intelligence : comment Siri AI voit vraiment votre écran iPhone ?

Le 8 juin 2026, Tim Cook a officialisé la prochaine génération d'Apple Intelligence, qui dote Siri d'une capacité inédite : lire et comprendre en temps réel ce qui s'affiche à l'écran de l'iPhone, de l'iPad, du Mac et de l'Apple Vision Pro. Concrètement, l'assistant peut désormais détecter une adresse dans un message et l'ajouter automatiquement à un contact, identifier une invitation et proposer d'organiser la suite, ou encore interagir avec des éléments visuels affichés dans n'importe quelle application. Sur Vision Pro, Siri peut même répondre en fonction de l'environnement physique regardé par l'utilisateur. Apple parle de "conscience de l'écran" pour qualifier cette capacité : l'assistant ne se contente plus d'écouter des commandes vocales, il interprète le contexte visuel de l'appareil. Ce basculement représente une rupture nette avec le Siri passif lancé en 2011. L'assistant devient un agent contextuel capable d'agir dans les applications, pas seulement de répondre à côté. Pour les utilisateurs professionnels, cela signifie concrètement moins de copier-coller entre apps, moins de recherches manuelles dans les mails ou les messages, et un assistant qui anticipe les actions probables plutôt que d'attendre une instruction explicite. Pour Apple, c'est aussi un enjeu stratégique majeur face à OpenAI, Google et Microsoft, qui ont tous intégré des assistants à forte conscience contextuelle dans leurs écosystèmes. Le retard de Siri sur ces concurrents est documenté depuis des années ; Apple Intelligence est censé combler cet écart en s'appuyant sur l'intégration matériel-logiciel propre à Apple. La question centrale reste celle de la vie privée. Un assistant qui lit les écrans, les messages, les photos et les mails concentre un volume considérable d'informations personnelles. Apple défend un modèle de traitement en local prioritaire, complété par son Private Cloud Compute pour les requêtes plus lourdes, avec la promesse que les données ne sont ni stockées ni accessibles à Apple. Ce cadre technique s'inscrit dans une stratégie de différenciation vis-à-vis de Google et Microsoft, perçus comme plus collecteurs de données. Mais la crédibilité de ces garanties sera testée à l'usage, notamment par les régulateurs européens qui scrutent déjà les pratiques des géants tech en matière d'IA embarquée. Si Apple réussit à convaincre que Siri peut être à la fois utile et discret, elle dispose d'un avantage concurrentiel durable. Dans le cas contraire, chaque mise à jour risque de raviver un débat que la marque préférerait clore une bonne fois pour toutes.

UELes régulateurs européens, qui scrutent déjà les pratiques des géants tech en matière d'IA embarquée, devront évaluer si le traitement des données par Apple Intelligence respecte le RGPD et l'AI Act.

1 source
Qui achètera réellement l’action OpenAI ?
102FrenchWeb 

Qui achètera réellement l’action OpenAI ?

OpenAI a déposé confidentiellement son dossier d'introduction en Bourse auprès de la Securities and Exchange Commission américaine, tout en affirmant qu'aucune décision définitive n'a été arrêtée quant à la réalisation effective de cette IPO. L'entreprise, créatrice de ChatGPT et valorisée à 300 milliards de dollars lors de sa levée de fonds de 40 milliards de dollars en mars 2025, entend simplement préserver cette option sans s'y engager formellement. Le dépôt confidentiel, procédure courante aux États-Unis, permet à une société de préparer son entrée en Bourse loin des regards des concurrents et des marchés, avant de rendre le dossier public quelques semaines avant l'opération. La question centrale reste de savoir qui achètera réellement ces actions. OpenAI n'est pas encore rentable : ses coûts d'infrastructure et de calcul restent colossaux, et la concurrence s'intensifie avec Google, Anthropic, Mistral ou Meta. Les investisseurs institutionnels devront donc parier sur une rentabilité future dans un secteur où les marges sont incertaines et les modèles économiques en construction. L'appétit des marchés pour les valeurs IA reste fort, mais la valorisation actuelle implique des attentes de croissance extrêmement élevées. Cette annonce s'inscrit dans une période de transformation structurelle pour OpenAI, qui a amorcé début 2025 sa conversion en société à but lucratif classique, abandonnant son statut hybride original. Ce changement de gouvernance était précisément l'une des conditions préalables à une introduction en Bourse. Microsoft, son principal partenaire et investisseur avec plus de 13 milliards de dollars engagés, sera l'un des acteurs clés à surveiller dans ce processus, ses intérêts pouvant diverger de ceux des futurs actionnaires publics.

UEUne introduction en Bourse d'OpenAI renforcerait massivement ses capacités de financement face aux acteurs européens comme Mistral, creusant davantage le fossé de ressources entre l'IA américaine et européenne.

💬 300 milliards de valorisation pour une boîte pas rentable, sur un marché où Google et Meta jouent à domicile, c'est le genre de dossier qui va faire saliver les marchés six mois et flipper les analystes six mois plus tard. Le vrai sujet, c'est Microsoft : avec 13 milliards investis et une relation contractuelle profonde, leurs intérêts ne sont pas forcément alignés avec ceux d'un actionnaire lambda qui veut voir des bénéfices. Reste à voir si la conversion en société classique suffit à rendre le modèle lisible, parce que pour l'instant les chiffres ressemblent plus à un pari qu'à un business.

BusinessOpinion
1 source
iOS 27 et Siri AI : marre des promesses d’Apple
103Frandroid 

iOS 27 et Siri AI : marre des promesses d’Apple

Lors de la WWDC 2026, Apple a présenté iOS 27 avec une série de fonctionnalités Siri dopées à l'intelligence artificielle : résumés de notifications, réponses contextuelles dans les applications, intégration avancée avec les modèles de langage. Une keynote ambitieuse, destinée à rattraper le retard d'Apple sur l'IA générative face à Google et Microsoft. Sauf qu'une large partie de ces annonces ne s'applique pas aux utilisateurs européens, contraints une fois de plus de regarder depuis les gradins. La cause est connue : le Règlement sur les marchés numériques (DMA) impose à Apple des obligations d'interopérabilité et de transparence que la firme de Cupertino juge incompatibles avec son modèle de déploiement IA. Résultat, les fonctionnalités Apple Intelligence continuent d'arriver au compte-gouttes en Europe, quand elles arrivent. Pour des millions d'utilisateurs qui paient le même prix qu'un Américain pour leur iPhone, c'est une frustration croissante : acheter un produit premium et se retrouver avec une version bridée d'office. Ce décalage entre annonces mondiales et disponibilité réelle en Europe s'est installé depuis iOS 18 et ne fait qu'empirer avec chaque cycle. Apple et la Commission européenne négocient en arrière-plan, mais aucune résolution n'est en vue à court terme. D'autres acteurs comme Google et Meta déploient eux aussi leurs IA en ordre dispersé selon les régions, mais Apple, avec sa réputation d'expérience unifiée et premium, souffre davantage de l'écart. La question n'est plus de savoir si ces fonctionnalités arriveront, mais combien de keynotes européens devront encore encaisser avant d'y avoir vraiment accès.

UELe DMA contraint Apple à déployer ses fonctionnalités Siri IA au compte-gouttes en Europe, privant des millions d'utilisateurs français et européens des nouveautés iOS 27 malgré un prix d'achat identique aux marchés non-européens, sans résolution à court terme entre Apple et la Commission européenne.

RégulationReglementation
1 source
Apple annonce un assistant vocal plus conversationnel, surnommé « Siri AI »
104Ars Technica AI 

Apple annonce un assistant vocal plus conversationnel, surnommé « Siri AI »

Apple a officiellement présenté la refonte majeure de son assistant vocal Siri lors de sa conférence annuelle WWDC, filmée en avance comme à son habitude. Baptisée "Siri AI", cette nouvelle version s'inscrit dans le cadre plus large du programme "Apple Intelligence" dont le lancement avait été plusieurs fois repoussé. La mise à jour sera déployée cet automne via les mises à jour des systèmes d'exploitation Apple. Elle s'accompagne d'une intégration plus poussée des modèles d'IA embarqués, désormais alimentés en partie par Google, ainsi qu'une cohérence renforcée entre iOS, macOS et les autres plateformes de la marque. Le changement central porte sur la nature même de l'interaction : Siri ne se limite plus à des requêtes ponctuelles isolées, mais devient capable de mener des conversations continues, en jonglant entre différentes applications et contextes au fil d'un même échange. Lors des démonstrations, les cadres d'Apple ont montré l'assistant passer d'une tâche à une autre sans rupture, illustrant ce que la firme appelle une "expérience conversationnelle entièrement nouvelle". Pour les utilisateurs, cela représente un changement de paradigme : l'assistant devient un interlocuteur persistant plutôt qu'un outil de commande vocale. Apple tente ainsi de rattraper son retard face à des concurrents comme Google, OpenAI ou Microsoft, qui ont multiplié les annonces d'IA générative depuis 2023. Le vice-président senior Craig Federighi a d'ailleurs choisi de se démarquer explicitement, en critiquant implicitement cette course effrénée et en positionnant Apple comme un acteur centré sur l'utilisateur plutôt que sur la technologie pour elle-même. Ce discours, combiné au partenariat avec Google pour les modèles de fondation, soulève des questions sur la dépendance d'Apple à des tiers pour ses ambitions en IA, et sur la capacité de la marque à tenir ses promesses lors du déploiement effectif cet automne.

UELe déploiement de Siri AI sur les millions d'appareils Apple utilisés en France et en Europe soulève des questions de dépendance aux modèles Google, un axe susceptible d'intéresser les régulateurs européens au titre du DMA.

💬 Apple prend enfin le virage conversationnel, et c'est plus crédible que leurs annonces des deux dernières années. Bon, sur le papier, le coup du "pas de hype, on pense à l'utilisateur" sonne creux quand tu as signé un deal avec Google pour les modèles de fond. Reste à voir si ça tient à l'automne, ou si on se retrouve encore avec une démo parfaite et un rollout en demi-teinte.

Apple rend enfin Siri intelligent avec Siri AI (mais pas tout de suite en Europe…)
10501net 

Apple rend enfin Siri intelligent avec Siri AI (mais pas tout de suite en Europe…)

Apple s'apprête à transformer radicalement Siri en 2026, en intégrant l'intelligence artificielle générative ainsi que le modèle Gemini de Google au coeur de son assistant vocal. Cette refonte majeure dotера Siri d'une interface redessinée, d'une voix personnalisable et d'une capacité de compréhension contextuelle nettement améliorée, capable de produire des réponses plus précises et adaptées aux besoins de chaque utilisateur. Une nouvelle application dédiée permettra également de consulter l'historique complet des conversations et de synchroniser toutes les interactions sur l'ensemble des appareils Apple. Cette mise à jour représente un tournant pour Apple, qui accuse un retard significatif face à des concurrents comme OpenAI avec ChatGPT, Google avec Gemini ou Microsoft avec Copilot. L'intégration de l'IA générative devrait transformer Siri d'un assistant limité en un véritable copilote numérique capable de raisonner, d'enchaîner des tâches complexes et de maintenir le fil d'une conversation sur la durée. Pour les quelque 2 milliards d'utilisateurs d'appareils Apple dans le monde, cela représente un changement d'usage potentiellement profond. Le déploiement ne sera cependant pas immédiat ni universel : l'Europe, soumise aux contraintes réglementaires du Digital Markets Act, devra attendre une date encore indéfinie avant d'accéder à ces fonctionnalités. Ce retard illustre la tension croissante entre les ambitions des géants technologiques américains et le cadre législatif européen. Apple avait déjà retardé plusieurs fonctions d'Apple Intelligence dans l'Union européenne pour des raisons similaires, laissant les utilisateurs du Vieux Continent en marge des dernières avancées de la plateforme.

UELes utilisateurs européens d'appareils Apple devront attendre une date indéfinie avant d'accéder aux nouvelles fonctionnalités de Siri AI, le Digital Markets Act imposant des contraintes réglementaires qui excluent temporairement l'UE de ce déploiement majeur.

💬 Siri avec du raisonnement contextuel et Gemini derrière, c'est quand même pas rien pour 2 milliards d'appareils. Apple accusait un retard visible depuis des années, tout le monde le voyait, et là c'est enfin du concret. En Europe on attend encore, le DMA fait son travail, et on commence à s'y habituer.

OutilsOpinion
1 source
Amazon Bedrock AgentCore permet d'héberger des agents de codage en toute sécurité
106AWS ML Blog 

Amazon Bedrock AgentCore permet d'héberger des agents de codage en toute sécurité

Amazon a lancé Bedrock AgentCore Runtime, un service cloud conçu pour héberger les agents de codage, Claude Code, Codex, Kiro, Cursor CLI, Gemini CLI ou tout autre outil similaire, sans que le développeur n'ait à garder son ordinateur portable allumé et ouvert. Chaque session obtient un microVM Linux isolé avec un espace de travail persistant, un shell réel et une exécution déterministe des commandes. Le service embarque également trois composantes clés : une couche d'identité qui fait agir l'agent au nom de l'utilisateur qui l'a déclenché, une passerelle MCP (Model Context Protocol) unique donnant accès à GitHub, Jira, Slack et aux services internes avec les vrais tokens stockés hors de portée de l'agent, et une intégration native à Amazon CloudWatch pour tracer chaque action effectuée. Amazon annonce que plusieurs agents concurrents, Claude Code, Codex, Kiro et Cursor, pourront être lancés simultanément sur le même dépôt, chacun dans son propre environnement isolé, et évalués sur la latence, le coût et le taux de réussite des tests. L'enjeu va bien au-delà du confort : héberger un agent de codage sur un laptop expose l'ensemble de l'environnement du développeur. L'agent partage le shell, le système de fichiers, les clés SSH, les credentials AWS stockés dans ~/.aws/credentials, les tokens npm, et le VPN actif. Un fichier README piégé suffit à déclencher une exécution malveillante avec accès complet aux secrets. La parallélisation pose un problème distinct : lancer deux agents via git worktree ne règle que la partie git, les deux processus se battent toujours pour le même localhost:5432, le même port :3000, le même trousseau SSH. Trois agents sur trois branches, c'est trois processus en compétition sur une seule machine. Enfin, fermer le couvercle du laptop tue la session : dépendances à moitié installées, refactoring en cours, suite de tests en attente, tout disparaît. Un chantier de 90 minutes ou une migration nocturne exige que l'écran reste allumé pendant toute la durée. La montée en puissance des agents de codage autonomes a rendu ce problème structurel. Ces outils peuvent désormais tenir des tâches longues, audit de codebase, migrations de schéma, refactoring multi-fichiers, qui dépassent largement la durée d'une session de travail classique. Les équipes qui veulent en tirer parti à l'échelle se heurtent aux limites du modèle "un agent par laptop ouvert". Amazon positionne AgentCore comme la réponse infrastructure à ce changement de régime : un environnement cloud dédié par agent, cloisonné par défaut, observable dès le départ, et déconnecté du cycle de vie de la machine du développeur. Le service s'inscrit dans une compétition plus large entre AWS, Google et Microsoft pour capter les workflows d'IA des équipes engineering, à mesure que les agents de codage passent du statut d'expérimentation à celui d'outil de production.

UELes équipes engineering européennes qui déploient des agents de codage autonomes peuvent désormais héberger leurs workflows sur une infrastructure cloud isolée et observable, sans dépendance au cycle de vie de leur machine locale.

InfrastructureOpinion
1 source
Gemma 4 12B permet des flux de travail multimodaux à base d'agents sur appareil, sans encodeur
107InfoQ AI 

Gemma 4 12B permet des flux de travail multimodaux à base d'agents sur appareil, sans encodeur

Google a présenté Gemma 4 12B, un modèle multimodal de 12 milliards de paramètres conçu pour fonctionner directement sur des machines grand public, ordinateurs portables inclus. Contrairement à ses prédécesseurs, ce modèle adopte une architecture sans encodeur (encoder-free), ce qui réduit la complexité et les ressources nécessaires à l'inférence locale. Combiné à Google AI Edge, Gemma 4 12B permet de construire des workflows agentiques complets en local, sans dépendre du cloud : traitement autonome de données, génération d'analyses visuelles, création de pages web ou exécution d'outils externes. L'enjeu est significatif pour les développeurs et les entreprises soucieuses de confidentialité ou de latence. Disposer d'un modèle multimodal capable de raisonnement agentique sur une machine locale élimine les coûts d'API, les délais réseau et les risques liés à l'envoi de données sensibles vers des serveurs distants. C'est un changement concret pour les cas d'usage professionnels où les données ne peuvent pas quitter l'environnement de travail. Google positionne ainsi Gemma 4 12B dans une course qui oppose désormais plusieurs acteurs majeurs sur le terrain des modèles embarqués : Apple avec ses modèles on-device, Meta avec Llama, et Microsoft avec Phi. L'approche encoder-free de Google représente un pari architectural distinctif pour maximiser l'efficacité à paramètres équivalents. La disponibilité via Google AI Edge laisse également présager une intégration future dans l'écosystème Android et les appareils Pixel, élargissant potentiellement le déploiement à des centaines de millions d'appareils.

UEL'inférence locale sans envoi vers le cloud répond directement aux exigences RGPD pour les entreprises européennes traitant des données sensibles.

💬 Un multimodal agentique qui tourne en local sans encodeur, c'est pas juste un benchmark de plus. Pour les boîtes qui ne peuvent pas envoyer leurs données dans le cloud, ça ouvre des cas d'usage qui étaient bloqués depuis des mois. Reste à voir si les perfs visuelles suivent vraiment sans encodeur, c'est le pari architectural de Google.

LLMsOpinion
1 source
Microsoft Fara : lancer un agent Browser-Use dans Google Colab avec un endpoint OpenAI factice
108MarkTechPost 

Microsoft Fara : lancer un agent Browser-Use dans Google Colab avec un endpoint OpenAI factice

Un tutoriel récemment publié décrit comment déployer Fara, l'agent de navigation web de Microsoft, directement depuis Google Colab sans nécessiter d'infrastructure dédiée. Le guide couvre l'ensemble du pipeline opérationnel : clonage du dépôt GitHub (github.com/microsoft/fara), installation des dépendances via pip, configuration du navigateur Playwright Firefox, puis exécution d'une tâche concrète telle que "ouvrir example.com et décrire le contenu de la page". L'approche centrale repose sur la création d'un point de terminaison fictif compatible avec l'API OpenAI, qui simule les réponses du vrai modèle Fara-7B. Ce serveur mock retourne des actions de navigation valides que Playwright exécute réellement dans le navigateur, reproduisant fidèlement la boucle complète de l'agent en conditions quasi-réelles, sans avoir à héberger un modèle de 7 milliards de paramètres. L'intérêt de cette méthode est de rendre le développement d'agents de navigation accessible sans GPU ni serveur dédié. En découplant la logique de l'agent du modèle de langage sous-jacent, les développeurs peuvent valider leurs flux de travail, déboguer leur code et tester des scénarios d'automatisation à moindre coût. La configuration reste entièrement portable : le même notebook peut être reconnecté à un vrai endpoint Fara-7B hébergé sur Azure AI Foundry, vLLM, LM Studio ou Ollama, en basculant une unique variable booléenne (USEREALFARA_ENDPOINT). Cette flexibilité entre backends réduit significativement le coût d'entrée pour les équipes qui souhaitent expérimenter l'automatisation web par IA sans s'engager d'emblée dans une infrastructure lourde. Les agents capables de piloter un navigateur de façon autonome constituent l'une des frontières les plus actives de l'IA appliquée en 2026. Anthropic a introduit son API "computer use" pour Claude, OpenAI a déployé son agent Operator, et Google explore des capacités similaires via Project Mariner. Microsoft, avec Fara, mise sur un modèle spécialisé entraîné spécifiquement pour piloter des interfaces web, une approche différente des solutions généralistes de ses concurrents. Le choix délibéré de la compatibilité avec le format OpenAI n'est pas anodin : il permet à Fara de s'intégrer dans l'écosystème d'outillage existant sans réécriture majeure. La publication de ce type de tutoriel accessible joue un rôle clé dans la démocratisation de ces technologies, en abaissant la barrière technique pour les développeurs indépendants et les équipes produit qui n'ont pas encore accès à des infrastructures d'inférence dédiées.

OutilsOutil
1 source
Doctolib réfute livrer « les infos de ses utilisateurs » aux grands acteurs de l’IA
109Next INpact 

Doctolib réfute livrer « les infos de ses utilisateurs » aux grands acteurs de l’IA

Le Canard Enchaîné a affirmé, dans son édition du 2 juin 2026, que Doctolib transmettait les données de ses utilisateurs à Microsoft, Anthropic et Google dans le but d'entraîner leurs grands modèles de langage. L'article vise notamment l'assistant de consultation que la licorne française commercialise depuis 2024 auprès des professionnels de santé. Ce service écoute les consultations médicales, avec l'accord du patient, pour générer automatiquement comptes-rendus et courriers. Or, les documents contractuels de Doctolib consultés par la rédaction de Next confirment que Microsoft Azure, Anthropic et Google Irlande figurent bien dans la liste des « sous-traitants ultérieurs » de l'entreprise, avec pour service déclaré la « fourniture du modèle de LLM » et pour finalité l'« analyse et création de contenu à des fins d'automatisation de tâches ». Doctolib dément catégoriquement que ces données médicales servent à entraîner les modèles de ses fournisseurs. Selon un porte-parole de l'entreprise, Microsoft, Anthropic et Google interviennent exclusivement comme prestataires techniques, sur instructions strictes de Doctolib, dans un cadre contractuel qui leur interdit d'utiliser les données à d'autres fins que la fourniture du service. En clair : les LLM américains sont bien mobilisés pour faire tourner les fonctionnalités de transcription et de synthèse, mais les notes médicales ne serviraient pas à affiner leurs poids. Sur le plan du stockage, Doctolib assure que les données sont hébergées sur des serveurs européens certifiés Hébergement de Données de Santé. Le Canard Enchaîné objecte toutefois que la justice américaine peut contraindre ces entreprises à transmettre des données outre-Atlantique, indépendamment de leur localisation physique. Cette controverse s'inscrit dans un débat plus large sur la souveraineté numérique des données de santé en France. Doctolib, qui traite des dizaines de millions de consultations, est une infrastructure critique du système de soins français, et toute ambiguïté sur le traitement de ses données sensitives déclenche une réaction immédiate. La tension entre innovation IA et protection des données médicales est structurelle : utiliser des LLM de pointe implique presque inévitablement de s'appuyer sur les infrastructures des géants américains, Microsoft, Google ou Anthropic, faute d'alternatives européennes comparables. Le RGPD et la certification HDS imposent des garanties, mais le Cloud Act américain crée un angle mort juridique que ni les certifications ni les contrats ne peuvent complètement combler. L'affaire illustre la fragilité des engagements de confidentialité dès lors que les données de santé transitent, même partiellement, par des acteurs soumis au droit américain.

UELes données médicales de millions de patients français transitent par des sous-traitants américains soumis au Cloud Act, créant une faille juridique structurelle que ni la certification HDS ni le RGPD ne peuvent entièrement combler.

💬 La distinction que fait Doctolib entre "faire tourner" et "entraîner" un LLM, elle est réelle. Mais ça n'enlève pas le truc qui gratte : tes comptes-rendus médicaux passent par des serveurs d'entreprises soumises au Cloud Act, et aucun label HDS ne te protège de ça. C'est une impasse structurelle, pas une faute de Doctolib spécifiquement.

ÉthiqueReglementation
1 source
Scout, l'Autopilot à base d'agents de Microsoft pour l'ensemble de M365
110AI News 

Scout, l'Autopilot à base d'agents de Microsoft pour l'ensemble de M365

Microsoft a présenté Scout lors de sa conférence Build 2026 cette semaine, le positionnant comme le premier représentant d'une nouvelle catégorie d'agents autonomes qu'il nomme "Autopilots". Testé en interne par des employés de Microsoft avant d'être étendu à un groupe restreint de clients et d'organisations membres du programme Frontier, Scout opère au sein de l'écosystème Microsoft 365 : Outlook, OneDrive, SharePoint et Teams. L'agent planifie des réunions, signale des messages prioritaires, génère des événements de calendrier et anticipe les échéances en bloquant des créneaux dans l'agenda d'un utilisateur pour dégager du temps de travail concentré. Il apprend progressivement les habitudes et préférences de chaque utilisateur pour affiner ses priorités. Techniquement, Scout repose sur OpenClaw, un projet open source développé en un week-end par Peter Steinberger, et Microsoft s'est engagé à contribuer en retour à ce projet. L'annonce a été rédigée par Omar Shahine, vice-président de Microsoft Scout, vétéran de Redmond dont le parcours inclut les divisions Windows Live, OneDrive et Mac Office. Pour accéder à Scout, les entreprises doivent être inscrites au programme Frontier, disposer d'une configuration Intune, d'une licence GitHub Copilot active et soumettre une attestation d'acceptation explicite. Scout représente une évolution significative dans la manière dont les outils de productivité intègrent l'automatisation. Contrairement à un simple assistant réactif, un Autopilot possède sa propre identité numérique, ce qui permet à plusieurs agents de coexister avec des règles de gouvernance distinctes : une instance personnelle et une instance professionnelle peuvent fonctionner en parallèle avec des droits différenciés selon le contexte. Pour les équipes informatiques, l'intégration via Microsoft Entra permet de vérifier l'identité des agents et de s'assurer qu'ils respectent les politiques de sécurité internes. La protection des données s'appuie sur Microsoft Purview, les identifiants liés aux identités machines étant masqués dans les journaux de diagnostics. Les actions jugées sensibles par l'algorithme requièrent systématiquement une validation humaine, ce qui préserve un contrôle sur les décisions à fort impact. La notion d'Autopilot s'inscrit dans la course que se livrent les grandes plateformes pour intégrer des agents réellement autonomes dans les flux de travail professionnels. Microsoft, qui a massivement investi dans l'IA générative depuis son partenariat avec OpenAI, cherche à différencier sa suite Copilot en y ajoutant une couche d'agentivité persistante et contextuelle. En bâtissant Scout sur une base open source et en promettant d'y contribuer, l'entreprise adopte une posture d'ouverture inhabituelle dans ce segment très compétitif. La prochaine étape sera l'élargissement progressif du programme Frontier et l'extension des capacités de Scout au-delà de Microsoft 365 vers d'autres surfaces applicatives, à mesure que les essais en conditions réelles permettront d'affiner la gestion des risques de sécurité identifiés lors des tests internes.

UELes entreprises françaises et européennes utilisant Microsoft 365 devront évaluer les implications de gouvernance et de conformité (RGPD, AI Act) liées à l'adoption d'agents autonomes dotés d'une identité numérique propre.

OutilsOutil
1 source
Fini le statu quo : l’Europe déclare son indépendance technologique
111Le Big Data 

Fini le statu quo : l’Europe déclare son indépendance technologique

La Commission européenne a présenté début juin 2026 un vaste paquet législatif destiné à renforcer l'autonomie technologique du continent face aux géants américains et chinois. Le texte couvre trois domaines stratégiques : le cloud, l'intelligence artificielle et les semi-conducteurs. Parmi les mesures phares figure une refonte du Chips Act, avec l'ambition de doubler la part de marché mondiale de l'Europe dans les semi-conducteurs pour atteindre 20 % d'ici 2030. Une nouvelle loi sur le cloud et l'IA impose par ailleurs des exigences renforcées aux fournisseurs opérant dans des secteurs sensibles, santé, énergie, finance, et les contraint à développer leurs logiciels sur le territoire européen. Pour certains marchés publics stratégiques, le matériel devra être conçu au sein de l'Union, ce qui pourrait exclure de facto des acteurs comme Microsoft, Amazon ou Google. L'enjeu dépasse la simple rivalité commerciale. Lorsque des hôpitaux, des réseaux énergétiques ou des administrations fonctionnent sur des infrastructures contrôlées par des entreprises étrangères soumises à des législations extraterritoriales, la souveraineté numérique devient une question de sécurité nationale. Le Cloud Act américain, qui permet aux autorités américaines d'accéder aux données hébergées par des entreprises américaines même à l'étranger, illustre précisément ce risque. Les nouvelles règles visent à garantir qu'aucun interrupteur situé à des milliers de kilomètres ne puisse mettre en péril des services essentiels pour les citoyens et les États membres. Cette offensive législative s'inscrit dans une prise de conscience progressive, accélérée par la pandémie et les tensions géopolitiques des dernières années, qui ont révélé la fragilité des chaînes d'approvisionnement européennes en puces et la dépendance structurelle au cloud américain. Plusieurs initiatives de cloud souverain ont déjà émergé en réponse, portées par des acteurs comme OVHcloud ou des consortiums nationaux, mais sans jamais atteindre la masse critique nécessaire. Les propositions de la Commission doivent encore être négociées avec les États membres et le Parlement européen avant d'entrer en vigueur, un processus qui peut prendre des années. Les partisans y voient un levier indispensable de résilience ; les critiques redoutent un protectionnisme qui compliquerait les relations commerciales transatlantiques et pourrait ralentir l'accès aux technologies les plus avancées. La bataille politique ne fait que commencer.

UELe paquet législatif de la Commission européenne impose aux fournisseurs cloud et IA d'opérer et développer leurs logiciels sur le territoire européen pour les secteurs sensibles (santé, énergie, finance), ce qui renforce directement la souveraineté numérique française et pourrait avantager des acteurs comme OVHcloud dans les marchés publics stratégiques.

💬 Enfin du concret, pas juste un discours sur la souveraineté. L'obligation d'opérer et développer sur le territoire pour les secteurs sensibles, c'est la première fois que je vois Bruxelles poser de vraies contraintes sur AWS et Azure, et OVHcloud n'est pas le seul à se frotter les mains. Reste à voir ce qu'il en reste une fois que tout le monde aura amendé le texte.

RégulationReglementation
1 source
Un badge d’accès dopé à l’IA : le gadget de Microsoft qui voit, écoute et accompagne les salariés
112Le Big Data 

Un badge d’accès dopé à l’IA : le gadget de Microsoft qui voit, écoute et accompagne les salariés

Microsoft a présenté lors de sa conférence Build un prototype de badge d'entreprise dopé à l'intelligence artificielle, baptisé Project Solara. Cet objet, conçu comme un compagnon de terrain connecté à Copilot, embarque un écran tactile, une caméra latérale, un microphone, un capteur d'empreintes digitales, du Wi-Fi et de la 5G. Steven Bathiche, expert technique chez Microsoft, a démontré sur scène comment demander à Copilot de repérer des prises de vue, de les retoucher et de les envoyer directement à une équipe. Un second prototype, lui destiné à rester sur un bureau, intègre des capteurs de présence à ultra-large bande capables de détecter l'approche de l'utilisateur, et se synchronise avec le PC principal via Bluetooth pour permettre de basculer des tâches entre les deux appareils. L'ambition de Microsoft est claire : faire sortir ses agents d'IA des interfaces logicielles pour les ancrer dans le monde physique, doté d'yeux, d'oreilles et d'une connexion permanente. La cible prioritaire n'est pas le cadre devant son écran, mais les travailleurs de première ligne, infirmières, employés de magasin, techniciens de terrain, pour qui un assistant capable de lire une scène en temps réel représente un gain concret. Le badge tire sa force du format lui-même : c'est un objet déjà accepté, voire ignoré, dans la plupart des organisations, ce qui facilite son adoption. Mais cette même discrétion soulève des questions immédiates sur la vie privée : un badge avec caméra et micro porté en permanence au travail franchit rapidement la ligne entre outil d'assistance et dispositif de surveillance. Cette annonce s'inscrit dans une stratégie plus large que Microsoft déploie depuis plusieurs années : après les PC Copilot, les agents logiciels autonomes et l'intégration de l'IA dans Microsoft 365, l'entreprise cherche à coloniser tous les points de contact du quotidien professionnel. Le mouvement n'est pas isolé, lunettes connectées, pendentifs IA et autres wearables fleurissent chez des concurrents comme Meta ou des startups spécialisées. Microsoft mise ici sur le monde de l'entreprise plutôt que sur le grand public, avec des secteurs comme la santé ou la distribution en ligne de mire. Le projet reste à ce stade un concept sans date de commercialisation annoncée, mais il signale une direction : si les agents d'IA doivent devenir vraiment utiles hors des bureaux, ils auront besoin d'un support physique. Microsoft parie que ce support pourrait se porter autour du cou.

UELe port permanent d'un badge caméra-micro en entreprise se heurterait directement au RGPD et au droit du travail français, qui encadrent strictement la surveillance des salariés et imposent un consentement explicite pour toute collecte de données biométriques ou audio sur le lieu de travail.

OutilsOutil
1 source
Le plan de GitHub pour les agents, par Kyle Daigle
113Latent Space 

Le plan de GitHub pour les agents, par Kyle Daigle

Kyle Daigle, directeur des opérations de GitHub, a accordé une longue interview au podcast AI Engineer World's Fair, enregistrée en marge de Microsoft Build, pour expliquer comment l'essor des agents de code transforme en profondeur la plateforme. Le chiffre clé de l'entretien : les contributions générées par des agents ont bondi de 1 400 % en 2026, une explosion qui se traduit concrètement par une multiplication massive des commits, des pull requests, des builds et des charges sur l'infrastructure GitHub, conçue à l'origine pour des développeurs humains travaillant à vitesse humaine. Face à cette pression, GitHub a connu des épisodes d'indisponibilité remarqués. Daigle détaille les outils que son équipe a déployés en interne : WorkIQ, des flux de travail Copilot intégrés dans Slack, Teams et l'e-mail, le protocole MCP, une nouvelle application de bureau Copilot, une interface CLI, et des agents cloud. Il décrit aussi sa propre routine du week-end, où il pilote jusqu'à quinze agents en parallèle pour préparer ses décisions stratégiques en consultant l'historique de contexte de l'entreprise. L'enjeu dépasse largement la fiabilité d'une plateforme : c'est la définition même du développeur et du logiciel qui est en train de changer. Quand n'importe quelle idée déclenche automatiquement un build, les systèmes CI/CD actuels atteignent leurs limites. Les mainteneurs de projets open source, eux, se retrouvent submergés de contributions automatiques de faible qualité, que Daigle qualifie de « slop forks ». GitHub doit donc inventer de nouveaux mécanismes de confiance, révision assistée par IA, système de parrainage, requêtes de prompt, pour préserver le contrat social qui a fait le succès de l'open source. Par ailleurs, Copilot n'est plus seulement un outil d'autocomplétion : il évolue vers un agent ambiant capable d'agir sur un contexte d'entreprise complet, ce qui redéfinit des fonctions comme celle de chef de cabinet ou d'analyste. GitHub aborde cette transition avec une histoire particulière : près de vingt ans de couches d'infrastructure accumulées, des webhooks aux Actions, en passant par le rachat de npm et l'intégration de Dependabot et de Semmle pour la sécurité de la chaîne d'approvisionnement. GitHub Actions, initialement pensé pour l'automatisation des workflows de développement, est devenu de facto une couche de calcul généraliste sur laquelle les agents s'appuient. Daigle reconnaît que cette évolution « casse » GitHub d'une façon inédite, mais il y voit aussi une opportunité : les anciens développeurs reconvertis dans le management pourraient avoir un avantage structurel dans cette ère où comprendre le code redevient une compétence décisionnelle clé. La prochaine étape, selon lui, est de faire en sorte que GitHub « agisse comme Kyle veut qu'il agisse », c'est-à-dire transformer la plateforme en système d'exploitation personnel pour agents.

UEL'essor des agents de code redéfinit les pratiques DevOps des équipes techniques européennes, qui devront adapter leurs workflows CI/CD et leur gouvernance des contributions open source face à la multiplication des commits automatisés.

OutilsOpinion
1 source
L'IA peut désormais gérer votre administration
114MIT Technology Review 

L'IA peut désormais gérer votre administration

L'actualité de l'IA cette semaine illustre à la fois son essor commercial et les tensions qu'il suscite. Anthropic, la startup fondée par d'anciens membres d'OpenAI, a déposé confidentiellement un dossier d'introduction en bourse et vise une entrée sur les marchés dès cet automne, possiblement avant OpenAI elle-même, sans dévoiler de valorisation cible. En parallèle, la Floride est devenue le premier État américain à poursuivre OpenAI en justice, accusant ChatGPT de mettre en danger la sécurité des enfants et de faire primer le profit sur la sûreté publique, selon le procureur général James Uthmeier. Du côté de la cybersécurité, des hackers ont pris le contrôle de comptes Instagram de célébrités en exploitant Meta AI : en demandant simplement des informations d'accès à l'assistant, ils ont contourné les protections habituelles. Enfin, l'Union européenne envisage d'exclure les géants américains du cloud, notamment Amazon, Microsoft et Google, des contrats liés aux infrastructures critiques, dans le cadre d'un effort de souveraineté numérique accéléré par les tensions commerciales avec Washington. Ces événements convergent pour dessiner un secteur à un tournant décisif. L'IPO d'Anthropic s'inscrit dans une course au capital où être premier en bourse pourrait donner un avantage symbolique et financier considérable face à OpenAI, attendue juste après la cotation de SpaceX, valorisée à mille milliards de dollars. La poursuite floridienne signale que la patience des régulateurs américains s'amenuise face aux risques supposés des chatbots grand public, une préoccupation qui pousse déjà plusieurs plateformes à intégrer des vérifications d'âge. La faille Meta AI révèle un risque systémique croissant : déléguer le support client à des intelligences artificielles crée de nouveaux vecteurs d'attaque que les équipes de sécurité n'ont pas encore pleinement anticipés. Pour les petites entreprises, en revanche, l'IA représente une opportunité concrète : les modèles actuels peuvent déjà gérer la comptabilité de base, la facturation, la prise de notes ou la planification des réseaux sociaux, des tâches autrefois réservées aux structures capables d'embaucher des spécialistes. Ces développements s'inscrivent dans un contexte où l'IA s'est imposée en moins de quatre ans comme un enjeu géopolitique, économique et social de premier ordre. La décision européenne d'écarter les fournisseurs américains reflète une défiance croissante vis-à-vis de la dépendance technologique envers les États-Unis, renforcée par les politiques commerciales de l'administration Trump. Pendant ce temps, des universités chinoises affiliées à l'armée cherchent à se procurer des puces Nvidia en dépit des restrictions américaines à l'exportation, et Pékin développerait des outils capables de prédire la dissidence politique. Sur le front scientifique, Meta, Anthropic et DeepMind auraient intensifié leurs recherches sur la conscience des machines, ouvrant un débat philosophique que la communauté scientifique commence à prendre au sérieux. L'ensemble du secteur avance à une vitesse que les cadres réglementaires, les protocoles de sécurité et les normes éthiques peinent encore à suivre.

UEL'UE envisage d'exclure Amazon, Microsoft et Google des contrats d'infrastructures critiques, une décision qui pourrait remodeler le marché du cloud souverain européen et accélérer l'adoption de solutions locales.

💬 L'IA qui gère ton administration, c'est pas du flan, les modèles actuels font vraiment le boulot sur la compta de base ou la facturation. Mais la faille Meta AI cette semaine rappelle un truc simple : brancher un assistant sur des processus sensibles sans repenser la sécurité, c'est offrir un boulevard aux attaquants. Bon, on le savait, mais là c'est plus théorique.

BusinessReglementation
1 source
Microsoft Build 2026 : comment suivre en direct la grande conférence sur Windows et Copilot ?
115Numerama 

Microsoft Build 2026 : comment suivre en direct la grande conférence sur Windows et Copilot ?

Microsoft tient sa conférence annuelle Build 2026 cette semaine, réunissant les développeurs du monde entier pour présenter ses grandes orientations technologiques. L'événement se déroule dans un calendrier serré entre les deux autres rendez-vous majeurs du secteur : il succède d'une semaine à la Google I/O et précède d'une semaine la WWDC d'Apple, confirmant que juin s'impose comme le mois stratégique où les trois géants dévoilent leurs ambitions aux développeurs. Microsoft Build s'annonce cette année comme un moment charnière pour la firme de Redmond, qui doit démontrer que Windows et son assistant Copilot occupent une place centrale dans l'écosystème de l'intelligence artificielle générative. L'enjeu est considérable : convaincre une communauté de développeurs attentive aux signaux de Google et Apple que la plateforme Microsoft reste incontournable à l'heure où l'IA redessine les usages professionnels et grand public. Microsoft arrive à cette conférence dans un contexte de compétition intense sur le front de l'IA. Copilot, intégré à Windows et aux outils Office, se mesure directement aux assistants de Google et aux ambitions d'Apple en matière d'intelligence artificielle sur appareil. La Build constitue traditionnellement le terrain où Microsoft fixe sa feuille de route technique pour les douze mois suivants, avec des annonces qui orientent les choix d'investissement des équipes de développement à l'échelle mondiale.

UELes annonces de Microsoft Build 2026 sur Copilot et Windows concernent les développeurs et entreprises européens qui utilisent la suite Microsoft 365 et Azure.

OutilsActu
1 source
Amazon Bedrock AgentCore Gateway étend sa prise en charge du protocole MCP
116AWS ML Blog 

Amazon Bedrock AgentCore Gateway étend sa prise en charge du protocole MCP

Amazon a annoncé cette semaine une extension significative des capacités d'AgentCore Gateway, son service de passerelle centralisée pour le protocole MCP (Model Context Protocol) au sein d'Amazon Bedrock. Les nouvelles fonctionnalités couvrent notamment la prise en charge étendue des schémas d'outils MCP, l'intégration des primitives MCP prompts et ressources, la découverte dynamique de serveurs MCP à l'exécution, la gestion de sessions pour les interactions temps réel, un mécanisme d'élicitation permettant des demandes d'entrée en cours d'exécution, et un échange de jetons OAuth 2.0 pour l'authentification déléguée. Ces ajouts s'appliquent à un service qui sert déjà de point d'entrée unique entre les serveurs MCP d'une organisation et les clients qui les consomment, en centralisant la gestion des identifiants, l'observabilité et la connectivité sécurisée. L'enjeu est directement opérationnel pour les équipes engineering en entreprise. Sans passerelle centralisée, chaque serveur MCP déployé, qu'il gère les contrats pour l'équipe juridique, les données financières ou les incidents opérationnels, doit gérer indépendamment ses propres mécanismes d'authentification, de contrôle d'accès et de journalisation. Cela multiplie les délais d'approbation, fragmente la visibilité sur l'usage des outils et oblige les équipes sécurité à auditer chaque serveur séparément. AgentCore Gateway réduit ce fardeau en laissant chaque équipe se concentrer sur la logique métier de son serveur MCP, tandis que la passerelle prend en charge tout le reste : agrégation des capacités, politiques d'accès basées sur les ressources, isolation réseau via AWS PrivateLink, logs d'audit centralisés, et guardrails déterministes via AgentCore Policy. MCP, le protocole lancé par Anthropic fin 2024 pour standardiser la façon dont les agents IA interagissent avec des outils et services externes, a rapidement été adopté par les grands acteurs du cloud, dont AWS, Microsoft et Google. Amazon intègre AgentCore Gateway dans son écosystème Bedrock, qui concurrence directement Azure AI et Google Cloud Vertex AI dans la course aux infrastructures d'agents IA en entreprise. La montée en puissance des architectures multi-agents, où plusieurs modèles coopèrent en orchestrant des dizaines d'outils, rend ce type de couche de gouvernance centrale de plus en plus stratégique. Les prochaines étapes probables incluent une intégration plus poussée avec les outils d'identité AWS IAM et une extension du support aux agents tiers via les flux OAuth 2.0 maintenant disponibles dans la passerelle.

InfrastructureOpinion
1 source
Workday et Google Cloud déploient des agents IA pour les RH et la finance
117Le Big Data 

Workday et Google Cloud déploient des agents IA pour les RH et la finance

Workday et Google Cloud ont annoncé le 29 mai 2026 une extension significative de leur partenariat, visant à intégrer les agents IA de Workday directement dans Gemini Enterprise, la suite collaborative de Google. Concrètement, l'agent Sana Self-Service de Workday s'imbrique désormais dans l'environnement Google que les collaborateurs utilisent au quotidien. Un salarié peut ainsi consulter son solde de congés, récupérer un bulletin de paie ou soumettre une demande d'absence sans jamais ouvrir l'interface Workday. Les managers gagnent eux aussi en autonomie : approbation de feuilles de temps, lancement d'évaluations de performance, accès aux objectifs d'équipe, tout cela depuis une interface conversationnelle unique. Côté finance, les utilisateurs peuvent interroger les politiques de dépenses et initier des démarches administratives sans changer d'outil. L'annonce confirme par ailleurs que Gemini devient le modèle d'IA par défaut de Sana dans Workday, remplaçant les solutions précédemment utilisées. L'enjeu est considérable pour les grandes organisations, qui souffrent depuis des années d'une fragmentation logicielle coûteuse : les équipes jonglent quotidiennement entre suites RH, ERP financiers, outils collaboratifs et plateformes analytiques pour accomplir des tâches souvent élémentaires. En ancrant les agents directement dans les outils de travail existants, Workday et Google Cloud cherchent à éliminer ces frictions et à accélérer l'exécution des processus métiers. Pour les directions RH et financières, qui manipulent des données sensibles soumises à des réglementations strictes, l'intégration apporte aussi les capacités de raisonnement avancé, le support multimodal et le traitement multilingue de Gemini, tout en maintenant les garde-fous métier, les règles d'approbation et les contrôles de conformité propres à Workday. Ce rapprochement s'inscrit dans une tendance de fond qui voit les grands éditeurs de logiciels d'entreprise transformer leurs plateformes en orchestrateurs d'agents IA. Workday, qui gère les ressources humaines et les finances de milliers de grandes entreprises mondiales, dispose d'un levier stratégique majeur : ses données métier structurées, longtemps cloisonnées dans ses interfaces propriétaires. En ouvrant ces données aux agents via Gemini, l'éditeur américain positionne sa plateforme comme un nœud central des architectures multi-agents qui émergent dans les grands groupes. Pour Google Cloud, faire de Gemini le moteur par défaut de Sana représente une victoire commerciale et un signal fort envoyé à l'ensemble de l'écosystème enterprise, dans un marché où Microsoft, avec Copilot intégré à Office 365 et Dynamics, exerce une pression concurrentielle intense. Les prochaines étapes du partenariat devraient porter sur l'orchestration de workflows plus complexes, impliquant plusieurs agents agissant en coordination sur des processus bout-en-bout.

UELes grandes entreprises françaises et européennes utilisant Workday et Google Workspace pourraient réduire la fragmentation logicielle de leurs équipes RH et finance grâce à cette intégration.

OutilsOutil
1 source
Microsoft Build 2026 : ce qu’il faut attendre — et ce qu’il ne faut pas espérer
118Le Big Data 

Microsoft Build 2026 : ce qu’il faut attendre — et ce qu’il ne faut pas espérer

Microsoft Build 2026 ouvre ses portes les 2 et 3 juin au Fort Mason Center de San Francisco, avec un accès en ligne gratuit pour les développeurs du monde entier. Satya Nadella prendra la parole en keynote dès 9h30 heure du Pacifique. L'édition 2026 tourne résolument autour de l'IA agentique : des systèmes capables non plus seulement de répondre à des questions, mais d'agir de manière autonome sur des tâches complexes, en coordonnant plusieurs agents entre eux. Azure AI Foundry est présenté comme le socle technique de ces architectures multi-agents. GitHub Copilot devrait lui aussi franchir un cap, avec des capacités renforcées de débogage, de tests et de correction de code. Reuters signale en parallèle que Microsoft prépare de nouveaux modèles maison, dont un orienté code, pour alimenter Copilot. Côté Windows, Windows AI Foundry permettrait aux applications d'exécuter certains modèles directement sur les PC, via NPU, GPU ou CPU, sans passer par le cloud. Ces annonces dépassent largement le cercle des développeurs. Si les briques agentiques déployées sur Azure finissent intégrées dans Excel, Teams ou Outlook, elles modifieront concrètement les flux de travail de millions d'utilisateurs en entreprise. L'exécution locale des modèles via Windows AI Foundry présente des avantages tangibles : latence réduite, confidentialité améliorée et fonctionnement hors ligne. Microsoft devrait aussi détailler comment réduire les coûts et les délais du passage des prototypes IA à la production, un point de friction majeur pour les équipes qui cherchent à industrialiser ces outils. L'enjeu est de rendre ces technologies utilisables à grande échelle, pas seulement impressionnantes en démonstration. Microsoft Build 2026 s'inscrit dans une course effrénée entre les grands acteurs technologiques pour imposer leurs plateformes comme infrastructure de référence de la prochaine génération d'applications IA. Google, Amazon et Meta jouent la même partition, et chaque Build est aussi une occasion pour Microsoft de montrer que son investissement massif dans OpenAI et dans Azure se traduit en outils concrets pour les développeurs. Le Windows Agent Framework, pressenti pour transformer les agents IA en fonctionnalités système à part entière, et un Windows Agent Store avec un partage de revenus à 85% pour les éditeurs, témoignent d'une ambition claire : faire de Windows une plateforme agentique native. Ce que Build ne montrera probablement pas : du nouveau matériel Surface, un Windows 12 ou des surprises Xbox. L'événement est avant tout une vitrine pour les outils que Microsoft veut mettre dans les mains des développeurs afin de construire la prochaine vague d'applications IA, dont les effets réels se feront sentir sur les mois qui suivent.

UELes développeurs et entreprises européens utilisant Azure et GitHub Copilot seront directement impactés par les nouvelles capacités agentiques, tandis que l'exécution locale de modèles via Windows AI Foundry pourrait faciliter la conformité RGPD en réduisant les transferts de données vers le cloud.

OutilsOutil
1 source
Une implémentation du Microsoft Agent Governance Toolkit pour un usage sécurisé des outils d'agents IA : politiques, validations, journaux d'audit et contrôles des risques
119MarkTechPost 

Une implémentation du Microsoft Agent Governance Toolkit pour un usage sécurisé des outils d'agents IA : politiques, validations, journaux d'audit et contrôles des risques

Microsoft a publié le Agent Governance Toolkit, un cadre de référence permettant de contrôler et d'auditer les actions des agents IA avant leur exécution. Un tutoriel d'implémentation, conçu pour fonctionner directement dans Google Colab, illustre concrètement son fonctionnement : les agents ne peuvent pas exécuter directement leurs outils. Chaque action est d'abord soumise à une couche de gouvernance qui vérifie l'identité de l'agent, son score de confiance, le niveau de risque de l'opération, la sensibilité des données concernées et les règles de politique applicables. Le système repose sur des fichiers de configuration YAML définissant des règles précises : blocage des opérations destructrices en base de données (suppression ou vidage de tables), approbation humaine obligatoire pour l'envoi d'e-mails vers des destinataires externes, exécution en bac à sable des commandes shell avec filtrage de termes dangereux comme rm -rf ou chmod 777, et refus d'accès aux données sensibles pour les agents dont le score de confiance est inférieur à 0,65. Le toolkit génère également des journaux d'audit infalsifiables, permet d'activer un coupe-circuit global et offre une visualisation graphique des relations entre agents, outils, règles et résultats. Cette architecture répond à un problème croissant dans le déploiement des agents IA : l'agentivité excessive. À mesure que ces systèmes deviennent capables d'enchaîner des actions autonomes, qu'il s'agisse d'écrire dans des bases de données, d'envoyer des e-mails ou d'exécuter du code, le risque qu'ils accomplissent des opérations non souhaitées ou dommageables augmente considérablement. Le toolkit propose un modèle où chaque action peut être autorisée, refusée, mise en sandbox ou redirigée vers un processus d'approbation humaine, selon des critères déterministes et traçables. Les règles s'appuient sur la taxonomie de risques de l'OWASP pour les agents IA, notamment les catégories « Tool misuse », « Goal hijacking » et « Unauthorized action », apportant un cadre de conformité reconnu aux équipes de sécurité. La publication de ce toolkit s'inscrit dans un mouvement plus large de l'industrie pour encadrer les agents autonomes, dont la prolifération s'est accélérée depuis 2024 avec l'essor de frameworks comme LangChain, AutoGen (lui aussi développé par Microsoft) et les API d'agents d'OpenAI et Anthropic. Microsoft, qui a massivement investi dans l'IA via son partenariat avec OpenAI et l'intégration dans Azure et Copilot, se positionne ainsi comme acteur de référence sur la gouvernance de ces systèmes. Le fait que l'implémentation soit reproductible dans un notebook Colab, sans infrastructure complexe, signale une volonté claire de démocratiser ces pratiques au-delà des grandes entreprises. Les étapes naturelles incluent l'intégration de ce type de couche dans les plateformes d'orchestration existantes et l'adoption de standards communs pour l'audit des décisions IA.

UELa taxonomie de risques OWASP intégrée au toolkit s'aligne directement avec les exigences de traçabilité et de supervision humaine de l'AI Act européen, facilitant la conformité des équipes qui déploient des agents IA autonomes.

SécuritéTuto
1 source
Claude Opus 4.8 est-il enfin honnête ? Le test de l’honnêteté
120Le Big Data 

Claude Opus 4.8 est-il enfin honnête ? Le test de l’honnêteté

Anthropic a lancé Claude Opus 4.8 le 28 mai 2026, avec une promesse inhabituelle dans le secteur : moins d'affirmations non étayées et davantage de doutes assumés. Disponible immédiatement sur Claude et via l'API sous la référence claude-opus-4-8, le modèle conserve la tarification de son prédécesseur Opus 4.7, soit 5 dollars par million de tokens en entrée et 25 dollars en sortie. La nouveauté la plus concrète concerne la fiabilité du code : selon Anthropic, Opus 4.8 serait environ quatre fois moins susceptible de laisser passer sans avertissement des failles dans le code qu'il a lui-même généré. Le modèle vérifie davantage ses propres sorties avant de les restituer, et signale plus systématiquement ses incertitudes. Un mode rapide promet en outre une vitesse 2,5 fois supérieure à coût réduit. L'enjeu n'est pas anodin. Le vrai problème des modèles de langage n'est pas tant l'erreur que l'erreur présentée avec aplomb, transformant un bug en dette technique invisible. Dans les usages professionnels, revues de code, migrations de systèmes, analyses de documents longs, une approximation confiante peut contaminer l'ensemble d'un travail. Si Opus 4.8 tient sa promesse d'honnêteté, l'impact est direct pour les équipes d'ingénierie qui utilisent l'IA comme copilote. En parallèle, le modèle intègre en avant-première une capacité étendue dans Claude Code : planifier des tâches complexes et lancer des centaines de sous-agents en parallèle pour s'attaquer à des migrations de bases de code comptant des centaines de milliers de lignes. Cette montée en puissance vers l'orchestration rend la question de l'honnêteté encore plus structurante. Plus un modèle délègue à des agents autonomes, moins l'utilisateur peut surveiller chaque étape intermédiaire. Anthropic s'inscrit ici dans une tendance lourde : tous les grands laboratoires, OpenAI, Google DeepMind, cherchent à faire de leurs modèles de véritables chefs de projet capables de superviser des pipelines automatisés. Le risque, si la vérification interne n'est pas à la hauteur, est d'obtenir une usine à erreurs distribuées à grande échelle. Le verdict d'Opus 4.8 ne viendra pas des benchmarks officiels mais des développeurs confrontés à des migrations réelles, des audits de sécurité ou des analyses juridiques où une réponse prudente vaut mieux qu'une réponse rapide et fausse.

UELes équipes de développement françaises et européennes utilisant Claude via l'API peuvent adopter immédiatement Opus 4.8 pour leurs audits de code et migrations, sans surcoût par rapport à Opus 4.7.

💬 C'est le vrai problème des LLMs qu'Anthropic cible enfin : pas l'erreur, mais l'erreur dite avec confiance. Quatre fois moins de failles passées en silence dans le code généré, si ça tient hors benchmarks maison, tu peux commencer à lui confier des migrations réelles sans te retrouver avec une usine à dette technique. Le verdict ne viendra pas des slides Anthropic.

LLMsOpinion
1 source
RAG (Retrieval-Augmented Generation) : une approche pour optimiser l’usage de l’IA
121Le Big Data 

RAG (Retrieval-Augmented Generation) : une approche pour optimiser l’usage de l’IA

La Retrieval-Augmented Generation, ou RAG, est une architecture technique qui associe un modèle de langage à une base documentaire externe, permettant à l'intelligence artificielle de consulter des informations précises avant de formuler une réponse. Concrètement, le processus se déroule en trois temps : les documents de l'entreprise sont d'abord découpés en fragments, puis convertis en représentations mathématiques appelées embeddings, qui transforment le sens d'une phrase en coordonnées numériques. Lorsqu'un utilisateur pose une question, sa requête est elle aussi encodée de cette façon, puis comparée aux vecteurs stockés pour identifier les passages les plus pertinents. Ces extraits sont ensuite injectés dans le prompt envoyé au modèle, qui rédige sa réponse à partir d'un contexte documenté et vérifiable. Contrairement à une recherche par mots-clés classique, le système reconnaît deux phrases sémantiquement proches même si elles n'ont pas de termes en commun. L'intérêt pour les entreprises est considérable. Les modèles de langage traditionnels fonctionnent uniquement à partir de leur corpus d'entraînement : toute information absente ou modifiée depuis génère inévitablement des erreurs, ce que les praticiens appellent les "hallucinations". Le RAG court-circuite ce problème en dotant l'IA d'une mémoire externe dynamique, mise à jour en temps réel. Un service client peut ainsi déployer un assistant conversationnel capable de consulter les procédures internes à jour avant chaque réponse, sans que les données quittent le périmètre de l'organisation. Pour des secteurs manipulant des documents sensibles, comme le juridique, la conformité ou l'ingénierie, cette architecture représente la différence entre un outil expérimental et un outil déployable en production. Le RAG s'est imposé comme l'une des réponses les plus pragmatiques aux limites structurelles des LLM depuis que ces modèles ont commencé à être déployés en entreprise à grande échelle. Les géants du cloud, d'AWS à Microsoft Azure en passant par Google Cloud, proposent désormais des services RAG managés, tandis qu'une constellation de startups comme Pinecone, Weaviate ou Qdrant se sont spécialisées dans les bases vectorielles qui en constituent le socle technique. La question qui reste ouverte est celle de la mise à l'échelle : indexer des dizaines de milliers de documents internes, maintenir la cohérence des embeddings lors des mises à jour, et gérer la latence de récupération sont des défis d'ingénierie non triviaux. Les prochaines évolutions du RAG s'orientent vers des architectures hybrides combinant recherche vectorielle et recherche structurée, ainsi que vers des systèmes capables de raisonner sur plusieurs documents simultanément plutôt que de simplement les concaténer.

LLMsTuto
1 source
Microsoft lancera un nouveau modèle de code la semaine prochaine
122The Information AI 

Microsoft lancera un nouveau modèle de code la semaine prochaine

Microsoft s'apprête à dévoiler une gamme de nouveaux modèles d'intelligence artificielle développés en interne lors de sa conférence annuelle Build, prévue la semaine prochaine à San Francisco. Parmi les annonces attendues figure un modèle spécialisé dans la génération de code, conçu pour renforcer GitHub Copilot, l'assistant de programmation appartenant à Microsoft. L'entreprise prévoit également de présenter plusieurs modèles déclinés en différentes tailles, chacun optimisé pour des tâches spécifiques : transcription audio, raisonnement, synthèse vocale et traitement d'images. Cette famille de modèles s'inscrit dans la continuité des premiers modèles maison que Microsoft avait présentés en avant-première plus tôt cette année. L'enjeu est considérable pour GitHub Copilot, qui avait pourtant pris une longueur d'avance significative sur le marché des assistants de codage alimentés par l'IA. Cet avantage s'est progressivement érodé face à la montée en puissance de concurrents comme Cursor et Claude Code d'Anthropic, qui ont su séduire une large communauté de développeurs. Microsoft cherche donc à reconquérir ce terrain perdu en proposant des modèles plus performants et mieux adaptés aux besoins concrets des programmeurs. La capacité à regagner la confiance de cette communauté représente un test majeur pour la crédibilité de la stratégie IA de la firme de Redmond. Cette initiative s'inscrit dans un contexte de compétition intense entre les grands acteurs de la technologie pour s'imposer auprès des développeurs, qui constituent un segment stratégique dans l'adoption des outils d'IA. Microsoft, qui a investi massivement dans OpenAI, cherche en parallèle à développer ses propres capacités pour réduire sa dépendance à des partenaires externes. La conférence Build est traditionnellement le moment choisi par l'entreprise pour annoncer ses ambitions en matière de plateforme et d'outillage. La montée en puissance des cas d'usage liés à la voix et à la transcription, de plus en plus plébiscités par les développeurs, explique par ailleurs pourquoi Microsoft intègre ces capacités dès le lancement de cette nouvelle famille de modèles.

UELes développeurs européens et français utilisant GitHub Copilot pourraient bénéficier de modèles maison Microsoft plus performants, dans un marché des assistants de codage de plus en plus concurrentiel face à Cursor et autres outils.

💬 Copilot s'est fait dépasser par Cursor et Claude Code, et Microsoft le sait très bien. Ce qui m'intéresse là-dedans, c'est moins le modèle code en lui-même que la volonté de réduire la dépendance à OpenAI, parce qu'investir des milliards dans un partenaire et lui laisser le cerveau de ton produit phare, c'est un pari bizarre. Regagner la confiance des devs, ça ne se décrète pas avec une annonce à Build.

LLMsActu
1 source
Daily Brief : l’agent IA de Google pense déjà à votre journée avant vous
123Le Big Data 

Daily Brief : l’agent IA de Google pense déjà à votre journée avant vous

Google a présenté Daily Brief lors de Google I/O le 26 mai 2026, un agent IA intégré à Gemini conçu pour préparer automatiquement le début de journée de ses utilisateurs. Le système analyse en temps réel trois sources de données : la boîte Gmail, Google Calendar et Google Tasks. Chaque matin, il génère un briefing personnalisé qui résume les échanges importants, signale les échéances critiques et propose des actions concrètes comme répondre à un message ou planifier un rendez-vous. L'agent ne se contente pas de trier : il formule aussi des "étapes suivantes" contextuelles, prenant lui-même des initiatives sans attendre que l'utilisateur pose la moindre question. Pour les professionnels déjà ancrés dans l'écosystème Google Workspace, l'impact est immédiat : moins de temps passé à fouiller des dizaines de fils de discussion pour retrouver une information enfouie, plus de bande passante cognitive pour le travail réel. Daily Brief s'inscrit dans une tendance plus large où l'IA glisse d'un rôle réactif vers un rôle proactif, anticipant les besoins plutôt que d'y répondre. Google promet en outre une personnalisation progressive : les retours utilisateurs permettraient à Gemini d'affiner ses résumés et ses priorités au fil du temps, rendant l'outil théoriquement plus pertinent à mesure qu'il observe les habitudes de travail. Cette annonce s'inscrit dans la stratégie de Google visant à faire de Gemini le pivot central de toute la productivité numérique, face à la concurrence de Microsoft Copilot intégré à Office 365 et d'assistants tiers comme Notion AI ou Superhuman. Mais l'efficacité de Daily Brief repose entièrement sur un accès étendu aux données personnelles et professionnelles de l'utilisateur : agenda, courriers, rappels, habitudes quotidiennes. Google ne fait pas mystère de cette logique d'assistance proactive, déjà présente dans des fonctions comme Smart Reply ou les suggestions de Gmail, mais Daily Brief la pousse à un niveau inédit en agrégeant l'ensemble du contexte de vie numérique d'une personne. La vraie question, que Google n'a pas encore tranchée publiquement, est de savoir si les utilisateurs hors Workspace pourront accéder à cette fonctionnalité, et dans quelle mesure les données d'analyse resteront locales ou alimenteront les modèles d'entraînement de l'entreprise.

UEL'accès étendu aux données personnelles (Gmail, Calendar, tâches) par Daily Brief soulève des questions de conformité GDPR pour les utilisateurs européens, notamment sur la localisation des données analysées et leur éventuelle utilisation pour l'entraînement des modèles de Google.

💬 C'est le genre de truc qu'on attendait depuis qu'Agentic AI est devenu le mot du moment. Google coche les cases : Gmail, Calendar, Tasks agrégés en un brief du matin qui t'évite de passer vingt minutes à reconstituer ta journée, c'est utile pour de vrai. Sauf que tu leur confies littéralement l'intégralité de ton contexte de vie numérique, et ce que Google compte en faire, notamment pour l'entraînement, reste soigneusement flou.

OutilsOutil
1 source
Les fournisseurs d'inférence connaissent-ils un essor ?
124The Information AI 

Les fournisseurs d'inférence connaissent-ils un essor ?

Il y a moins d'un an, les fournisseurs d'inférence spécialisés suscitaient un scepticisme marqué dans l'industrie de l'IA. Des startups comme Fireworks AI, Baseten et Together AI, qui louent des serveurs Nvidia à des développeurs d'applications et les aident à déployer des modèles open source, avaient connu une croissance rapide, mais semblaient fragilisées face à la concurrence des grands fournisseurs cloud. Ces derniers disposent en effet d'un avantage structurel majeur : ils possèdent leurs propres puces, là où les fournisseurs d'inférence doivent d'abord les louer à AWS, Google ou Azure avant de les revendre à leurs clients, ce qui comprime mécaniquement leurs marges brutes. Pourtant, le discours dominant a changé. Ces acteurs spécialisés semblent aujourd'hui trouver leur place dans un écosystème où la demande d'inférence explose, portée par la multiplication des applications IA en production. Leur proposition de valeur, flexibilité, optimisation technique, et support des modèles open source, répond à des besoins que les clouds généralistes satisfont moins bien, notamment pour les équipes cherchant à éviter l'enfermement propriétaire et à contrôler précisément leurs coûts d'inférence. Ce retournement s'inscrit dans une dynamique plus large : avec la prolifération des modèles open source performants comme Llama ou Mistral, les développeurs disposent désormais d'alternatives crédibles aux API propriétaires d'OpenAI ou Anthropic. Les fournisseurs d'inférence se positionnent comme l'infrastructure neutre de ce marché alternatif, pariant sur le fait que la fragmentation des modèles leur garantit une demande structurelle durable face aux géants du cloud.

UELa montée en puissance des fournisseurs d'inférence open source renforce l'écosystème autour de Mistral (entreprise française), offrant aux développeurs européens une infrastructure neutre pour déployer des modèles sans dépendance aux API propriétaires.

InfrastructureOpinion
1 source
Construire des systèmes multi-agents LangGraph serverless et scalables sur AWS avec Amazon Bedrock AgentCore
125AWS ML Blog 

Construire des systèmes multi-agents LangGraph serverless et scalables sur AWS avec Amazon Bedrock AgentCore

Amazon Web Services a présenté une architecture de référence pour déployer des systèmes multi-agents d'IA générative à grande échelle sur AWS, en combinant LangGraph, AWS Lambda, AWS Step Functions et les deux nouveaux services Amazon Bedrock AgentCore Memory et AgentCore Observability. L'approche repose sur une infrastructure entièrement serverless : les agents LangGraph sont packagés dans des conteneurs Docker exécutés sur Lambda, ce qui permet une montée en charge automatique sans gestion d'infrastructure. Pour illustrer le concept, AWS décrit un système concret de révision de campagnes marketing orchestrant trois agents spécialisés en parallèle, un agent "persona reviewer" qui évalue la résonance du contenu auprès de différents profils démographiques, un agent "validator" qui vérifie la conformité juridique et les chartes de marque, et un agent "finalizer" qui synthétise les retours en recommandations actionnables. Une interface React permet aux utilisateurs de télécharger leurs documents et de consulter les résultats en temps réel. Ce type d'architecture répond à un problème concret que rencontrent les entreprises en production : les agents IA performants en démo s'effondrent souvent sous la charge réelle, perdent le contexte entre les sessions et restent des boîtes noires difficiles à déboguer. AgentCore Memory résout la question de la mémoire en offrant à la fois un contexte conversationnel à court terme et une base de connaissances persistante entre sessions. AgentCore Observability capture quant à lui chaque invocation avec ses entrées et sorties LLM, la latence, et les métriques de chaîne d'outils sur l'ensemble des composants distribués. Pour les équipes en charge de systèmes critiques, c'est un changement de paradigme : il devient possible d'auditer exactement comment un agent a raisonné, quelle décision il a prise à quelle étape, et pourquoi. Cette publication s'inscrit dans une accélération visible chez AWS pour proposer une pile complète d'IA agentique cloud-native, face à la concurrence de Google (Vertex AI Agents) et Microsoft (Azure AI Foundry). LangGraph, développé par LangChain, s'impose progressivement comme standard de facto pour l'orchestration d'agents grâce à son modèle d'exécution en graphe orienté qui rend le flux de contrôle déterministe, parallélisable et conditionnel. L'intégration native avec Lambda et Step Functions est particulièrement stratégique pour les charges de travail "bursty" typiques des agents IA, où la demande est imprévisible et les coûts d'une infrastructure dédiée permanente seraient prohibitifs. La prochaine étape logique pour AWS sera d'étendre ces patterns à des workflows plus complexes impliquant des boucles de feedback humain et des agents à longue durée de vie, un segment encore largement inexploré en production.

InfrastructureActu
1 source
L’IA physique : le prochain marché que surveille déjà Wall Street
126Robot Magazine FR 

L’IA physique : le prochain marché que surveille déjà Wall Street

Wall Street identifie désormais la "Physical AI" comme le prochain cycle d'investissement majeur après l'IA générative. Selon plusieurs cabinets spécialisés, le marché mondial de la robotique intelligente et de l'IA physique pourrait dépasser 3 000 milliards de dollars d'ici 2040. Goldman Sachs est plus précis sur le segment humanoïde : 150 milliards de dollars d'ici 2035, avec un marché global de robotique intelligente franchissant les 400 milliards. NVIDIA, valorisé à plus de 3 000 milliards de dollars en 2026, est présenté comme le principal bénéficiaire actuel de cette tendance, son PDG Jensen Huang ayant publiquement intégré la "Physical AI" à sa feuille de route. Tesla, de son côté, est repositionnée dans cette grille de lecture grâce à son robot humanoïde Optimus, au-delà de son coeur de marché automobile. À noter : ces chiffres sont des projections de marché, pas des revenus confirmés, et l'article ne cite aucune métrique opérationnelle de déploiement. La rupture que pointe cet article est structurelle : l'IA générative est restée confinée aux écrans (texte, images, code), tandis que la Physical AI vise à en faire une force de travail dans le monde réel, capable de manipuler des objets, se déplacer et exécuter des tâches physiques de manière autonome. Pour un COO industriel ou un intégrateur, ce changement de paradigme est pertinent dans un contexte de pénuries de main-d'oeuvre persistantes et d'accélération de l'automatisation. Ce qui change pour les décideurs B2B, c'est l'horizon de planification : les fonds se positionnent déjà, ce qui signifie que les valuations des acteurs émergents (robotique, simulation, edge computing industriel) vont probablement se comprimer dans les 18 à 36 prochains mois, avant même que des déploiements à grande échelle soient prouvés. Ce récit s'inscrit dans un cycle bien rodé : après le cloud (AWS, Azure), puis l'IA générative (NVIDIA, OpenAI), les analystes financiers cherchent le prochain thème de surperformance. NVIDIA a amorcé ce pivot avec ses plateformes Isaac (simulation robotique) et Cosmos (world model pour robots), et ses partenariats avec Figure, 1X, Agility Robotics ou Boston Dynamics. Tesla joue la même carte avec Optimus, dont les premières vidéos de ligne de production interne ont été diffusées fin 2024, sans chiffres de cadence publiés. L'article reste toutefois une analyse financière généraliste : il ne cite aucun robot spécifique avec des métriques techniques (DOF, payload, cycle time), aucun site de déploiement confirmé, et aucun acteur européen malgré la pertinence d'entreprises comme Wandercraft ou Enchanted Tools sur ce segment. Les prochaines étapes annoncées restent floues, ce qui est caractéristique du registre "thème d'investissement émergent" plutôt que d'un bilan opérationnel.

UELa dynamique d'investissement Wall Street sur la Physical AI devrait indirectement comprimer les valorisations des startups robotiques européennes dans les 18-36 mois, avant tout déploiement prouvé, ce qui rend la fenêtre de levée de fonds pour des acteurs comme Wandercraft ou Enchanted Tools potentiellement plus courte.

RobotiqueOpinion
1 source
Microsoft et EY investissent 1 milliard de dollars pour accélérer l’industrialisation de l’IA
127Le Big Data 

Microsoft et EY investissent 1 milliard de dollars pour accélérer l’industrialisation de l’IA

Microsoft et EY ont annoncé le 21 mai 2026 un partenariat stratégique d'un milliard de dollars sur cinq ans pour accélérer le déploiement industriel de l'intelligence artificielle dans les grandes entreprises. L'initiative prévoit la constitution d'équipes mixtes, composées d'ingénieurs Microsoft et de consultants sectoriels EY, chargées d'accompagner les organisations dans l'intégration de l'IA au coeur de leurs opérations critiques. Les secteurs ciblés en priorité sont les services financiers, l'industrie, l'énergie, la santé, le secteur public, la distribution et les biens de consommation. EY a déjà généralisé Microsoft 365 E7 à plus de 400 000 collaborateurs dans le monde, après avoir déployé Copilot auprès de 150 000 employés avec un gain de productivité estimé à 15 %. Dans la finance, l'usage de Microsoft Power Platform et Copilot Studio aurait réduit certains délais opérationnels de 95 % et les coûts de plus de 37 %. EY a par ailleurs intégré un système multi-agents basé sur Azure, Microsoft Foundry et Microsoft Fabric dans sa plateforme d'audit EY Canvas, couvrant déjà 130 000 professionnels sur 160 000 missions. Ce partenariat répond à un blocage structurel que rencontrent aujourd'hui la plupart des grands groupes : passer des expérimentations isolées à un déploiement IA à l'échelle de l'entreprise. La majorité des organisations accumulent des pilotes sans parvenir à les industrialiser, faute de gouvernance adaptée, de formation des collaborateurs et de processus internes reconfigurés. En ciblant précisément les secteurs où l'automatisation et l'analyse de données produisent des impacts financiers rapides et mesurables, Microsoft et EY cherchent à répondre à l'exigence croissante de retour sur investissement concret que posent les directions générales avant tout nouvel engagement budgétaire dans l'IA. EY joue dans cette alliance la carte du "Client Zéro" : le cabinet teste les technologies Microsoft sur ses propres opérations avant de les proposer à ses clients, ce qui lui confère un avantage crédible dans un marché saturé de promesses non vérifiées. Ce positionnement intervient dans un contexte de compétition intense entre les grands cabinets de conseil et les éditeurs technologiques pour capter les budgets de transformation IA des entreprises du Fortune 500. Microsoft, de son côté, consolide son écosystème Azure et Copilot comme infrastructure de référence pour l'entreprise, face à la concurrence de Google Cloud et AWS. La suite dépendra de la capacité des deux groupes à démontrer des résultats reproductibles et auditables, condition sine qua non pour convaincre les directions financières d'accélérer leurs investissements au-delà des phases pilotes.

UELes grandes entreprises françaises et européennes des secteurs financier, énergétique, de la santé et du secteur public sont directement ciblées par ce programme d'industrialisation IA, susceptible d'accélérer les transformations numériques dans l'UE.

💬 Le problème qu'ils attaquent, l'industrialisation après les pilotes, c'est le vrai blocage de l'IA en entreprise depuis deux ans. EY qui joue le Client Zéro sur 400 000 collaborateurs, c'est l'argument le plus solide qu'un cabinet peut sortir face aux DG qui ont avalé trop de PowerPoints. Les 95% de réduction de délais affichés, bon, sur le papier ça claque, mais ça va être une autre histoire à reproduire sans EY dans la boucle.

BusinessOpinion
1 source
Anthropic en négociations pour utiliser les puces IA de Microsoft
128The Information AI 

Anthropic en négociations pour utiliser les puces IA de Microsoft

Anthropic serait en discussions avec Microsoft pour louer des serveurs équipés de puces d'intelligence artificielle conçues en interne par le géant de Redmond. Selon deux personnes ayant eu des échanges directs avec des dirigeants impliqués dans les négociations, la startup fondatrice de Claude cherche à augmenter sa capacité de calcul pour répondre à une demande croissante pour ses modèles d'IA. Aucun accord n'a encore été officialisé, mais les tractations sont en cours. Pour Microsoft, convaincre Anthropic d'adopter ses propres puces constituerait une victoire symbolique et commerciale majeure. L'effort de design de puces maison de l'entreprise a accusé des retards en 2024, compliquant sa stratégie d'indépendance vis-à-vis des fournisseurs externes. Séduire un acteur aussi visible qu'Anthropic permettrait à Microsoft de valider publiquement ses capacités matérielles et de diversifier les revenus issus de son infrastructure cloud Azure. La démarche s'inscrit dans une tendance de fond : les grands fournisseurs de cloud cherchent à réduire leur dépendance aux puces Nvidia, qui dominent aujourd'hui presque l'intégralité du marché des accélérateurs IA et dont la disponibilité reste contrainte. Google dispose déjà de ses TPU, Amazon de ses puces Trainium et Inferentia. Microsoft, en retard sur ce front, tente de combler l'écart. Anthropic, de son côté, bénéficie déjà d'investissements massifs d'Amazon et de Google, ce qui rend un partenariat avec Microsoft d'autant plus significatif sur le plan stratégique.

InfrastructureActu
1 source
Plongée dans Antigravity 2.0 : Le nouvel eldorado des agents IA autonomes
129Le Big Data 

Plongée dans Antigravity 2.0 : Le nouvel eldorado des agents IA autonomes

Google a dévoilé Antigravity 2.0 le 19 mai 2026 lors de sa conférence I/O, une application de bureau autonome entièrement reconstruite depuis zéro à partir de son IDE agentique lancé l'année précédente. Disponible sur macOS, Linux et Windows, cette nouvelle version ne nécessite aucun environnement de développement intégré traditionnel. Son architecture repose sur un agent principal capable de générer dynamiquement des sous-agents spécialisés, chacun chargé d'une tâche précise, ce qui permet un traitement parallèle sans surcharger le contexte principal. S'ajoutent à cela des tâches asynchrones, des hooks JSON pour intercepter et modifier le comportement des agents en temps réel, un système de planification cron pour des exécutions automatiques sans intervention humaine, une série de slash commands pour piloter finement chaque interaction, et une dictée vocale qui transcrit la parole en direct plutôt que d'envoyer un fichier audio brut au modèle. Cette refonte marque un tournant dans la manière dont Google positionne ses outils agentiques. En découplant l'interface agentique de l'IDE classique, la plateforme s'adresse désormais bien au-delà du développement logiciel : tout professionnel qui pilote des workflows complexes ou répétitifs est une cible potentielle. La logique basée sur les projets, remplaçant le lien rigide entre agent et dépôt, permet de regrouper plusieurs dossiers avec leurs propres règles et permissions, ce qui facilite l'adoption dans des environnements non techniques. La combinaison de l'autonomie planifiée et du traitement parallèle réduit considérablement la supervision humaine nécessaire, ce qui change concrètement l'économie du travail automatisé. Antigravity avait été lancé comme une preuve de concept : démontrer qu'une interface centrée sur les agents était viable à grande échelle. Un an après, face à une concurrence féroce dans l'espace des assistants de développement, notamment Cursor, GitHub Copilot et Windsurf, Google accélère en proposant une plateforme d'orchestration multi-agents à vocation généraliste. L'enjeu dépasse le codage : il s'agit d'imposer une infrastructure capable de gérer des équipes d'agents autonomes comme une nouvelle couche de productivité. Les utilisateurs existants de l'IDE recevront une mise à jour automatique, mais pourront conserver l'ancienne version, ce qui laisse à Google le temps de migrer son écosystème sans rupture brutale.

UELes professionnels et entreprises européens peuvent adopter cette plateforme d'orchestration multi-agents pour automatiser leurs workflows complexes, avec un impact potentiel sur la productivité dans de nombreux secteurs.

💬 Enfin du concret côté orchestration multi-agents. Google découple l'interface agentique de l'IDE, vise les workflows non-techniques, et ajoute des hooks JSON pour intercepter le comportement des agents en temps réel, ce qui allège sérieusement la supervision manuelle. Sur le papier c'est exactement ce qu'on attendait depuis deux ans, reste à voir si ça tient en prod.

OutilsOutil
1 source
Free, Orange et EDF s’allient pour créer une AI Gigafactory en France
130Le Big Data 

Free, Orange et EDF s’allient pour créer une AI Gigafactory en France

Le 20 mai 2026, huit grands groupes français ont annoncé la création du consortium AION pour porter la candidature de la France au programme européen des AI Gigafactories. Parmi eux : Iliad (la maison mère de Free), Orange, EDF, Capgemini, Scaleway, Ardian, Artefact et Bull. L'objectif est de construire une infrastructure capable d'héberger, d'entraîner et de déployer des modèles d'intelligence artificielle à très grande échelle, entièrement sur sol européen. Chaque membre apporte une brique stratégique : Bull fournit les supercalculateurs haute performance, EDF sécurise l'approvisionnement en électricité bas carbone, Orange et Scaleway assurent le cloud et l'hébergement des données, tandis que Capgemini et Artefact se concentrent sur l'intégration de l'IA en entreprise. Iliad et Ardian apportent le capital et l'expertise numérique pour soutenir un projet de très long terme. Le consortium peut également s'appuyer sur un écosystème plus large incluant Hugging Face, INRIA, Nokia, LightOn et Schneider Electric. L'enjeu est direct : aujourd'hui, l'essentiel de la puissance de calcul utilisée pour entraîner les grands modèles d'IA repose sur des infrastructures américaines, Microsoft, Google, Amazon. Pour les entreprises françaises et européennes des secteurs sensibles comme la santé, l'industrie ou les services publics, cette dépendance pose des problèmes concrets de souveraineté des données et de conformité réglementaire. Une gigafactory IA en France offrirait une alternative crédible, d'autant que le mix énergétique français, nucléaire et hydraulique, produit une électricité moins carbonée et plus stable que dans beaucoup de pays européens. Or les infrastructures IA consomment des volumes d'énergie colossaux, ce qui fait de l'accès à une énergie abondante et décarbonée un avantage compétitif aussi déterminant que les semi-conducteurs. Le consortium indique par ailleurs vouloir privilégier les technologies open source pour éviter de recréer des dépendances aux solutions propriétaires. Ce projet s'inscrit dans une dynamique européenne plus large : la Commission européenne a lancé son programme AI Gigafactories pour doter le continent d'infrastructures capables de rivaliser avec celles des États-Unis et de la Chine, dans un contexte où la course aux modèles génératifs et aux agents IA s'accélère. La France, qui abrite déjà des acteurs de premier plan comme Mistral AI et Hugging Face, tente de transformer cet avantage écosystémique en infrastructure physique souveraine. AION devra encore préciser le calendrier de déploiement et les montants d'investissement engagés, mais la mobilisation de groupes aussi diversifiés, télécoms, énergie, cloud, conseil, finance, signal que la France mise sur une approche de filière plutôt que sur un champion unique pour peser dans la prochaine phase de l'IA industrielle.

UELe consortium AION, porté par EDF, Orange, Iliad et Capgemini, vise à offrir aux entreprises françaises et européennes des secteurs sensibles (santé, industrie, services publics) une alternative souveraine aux infrastructures cloud américaines, en réponse directe au programme européen des AI Gigafactories.

💬 Bon, sur le papier, c'est exactement ce qu'il manquait. Avoir EDF dans la boucle pour sécuriser de l'énergie nucléaire bas carbone, c'est l'argument que personne d'autre en Europe ne peut vraiment sortir, et ça change tout quand tes GPU tournent 24h/24. La question maintenant : calendrier, montants, et si ce consortium reste soudé quand il faudra écrire les vrais chèques.

Bons plans, immo, week-ends : les agents IA de Google vont surveiller le web pour vous
131Le Big Data 

Bons plans, immo, week-ends : les agents IA de Google vont surveiller le web pour vous

Lors de la conférence Google I/O 2026, Google a dévoilé une nouvelle génération d'agents IA capables de parcourir le web de façon autonome et proactive, à la place des utilisateurs. Ces agents s'ajoutent à plusieurs annonces majeures de l'événement, dont les modèles Gemini Omni, Gemini Spark et Gemini 3.5 Flash. Concrètement, un utilisateur peut confier à ces agents une tâche récurrente, trouver un studio avec balcon près d'une gare sous un budget donné, repérer un concert, comparer des prix de voyage, et l'IA surveille en continu les sources pertinentes, SeLoger, Leboncoin ou autres, pour alerter dès qu'une offre correspond aux critères définis. L'interface est conversationnelle : les demandes s'affinent en langage naturel, sans avoir à reformuler des requêtes rigides. Ces agents seront d'abord réservés aux abonnés Google AI Pro et AI Ultra aux États-Unis, avant un déploiement plus large. Ce changement marque un basculement de la recherche passive vers la recherche proactive. Pendant des décennies, utiliser Google signifiait taper des mots-clés, parcourir des liens et recommencer la manœuvre régulièrement. Ici, c'est l'agent qui prend l'initiative, surveille, compare et synthétise, libérant l'utilisateur de la corvée de répétition. Pour les particuliers en quête d'un logement, d'un billet d'avion ou d'un bon plan commercial, le gain de temps est potentiellement considérable. Pour les sites d'annonces et comparateurs, la menace est symétrique : si Google devient le premier agrégateur de leurs données, leur trafic direct pourrait s'effondrer, restructurant en profondeur l'économie de l'information en ligne. Google prévoit de connecter ces agents à Gmail, Google Photos et bientôt Google Agenda, afin de personnaliser les réponses en fonction de la vie réelle de chaque utilisateur. La firme de Mountain View insiste sur le contrôle laissé aux utilisateurs, mais cette intégration dessine un écosystème où Google deviendrait l'intermédiaire central entre les internautes et le reste du web, connaissant habitudes, déplacements, projets et préférences avec une précision inédite. Ce mouvement s'inscrit dans une course accélérée entre les géants technologiques : Microsoft avec Copilot, OpenAI avec ses propres agents et Anthropic positionnent tous leurs modèles sur ce terrain de l'autonomie IA. Google, fort de ses données propriétaires et de sa maîtrise de l'infrastructure de recherche, joue ici une carte que ses concurrents ne peuvent pas facilement dupliquer, mais les questions sur la vie privée et la concentration du pouvoir numérique resteront au cœur du débat à mesure que ces outils se généraliseront.

UELes plateformes françaises d'annonces comme SeLoger et Leboncoin s'exposent à une chute de trafic si Google s'impose comme agrégateur central, et l'intégration de données personnelles dans Gmail et Photos soulève des questions de conformité RGPD pour les utilisateurs européens.

OutilsOutil
1 source
Google lance Antigravity 2.0 à I/O 2026 : plateforme autonome orientée agents, avec CLI, SDK et support entreprise
132MarkTechPost 

Google lance Antigravity 2.0 à I/O 2026 : plateforme autonome orientée agents, avec CLI, SDK et support entreprise

Google a profité de sa keynote développeurs I/O 2026 pour annoncer un changement d'architecture majeur dans ses outils de développement assisté par IA. La compagnie a lancé Antigravity 2.0, une application desktop autonome construite entièrement autour de l'orchestration d'agents, accompagnée d'un Antigravity CLI, d'un Antigravity SDK, de Managed Agents dans l'API Gemini, et d'un support enterprise via la Gemini Enterprise Agent Platform. Contrairement à l'Antigravity IDE existant, cette version 2.0 abandonne l'approche centrée sur l'éditeur de code pour placer la gestion de workflows multi-agents comme abstraction principale. L'application permet d'orchestrer plusieurs agents en parallèle, d'exécuter des tâches planifiées en arrière-plan via des sous-agents dynamiques, et s'intègre nativement avec Google AI Studio, Android et Firebase. Une commande vocale native est également intégrée, dans la continuité des ajouts récents à Gmail et Google Docs. Le CLI Antigravity remplace officiellement le Gemini CLI, tout en conservant ses fonctionnalités essentielles: Agent Skills, Hooks, Subagents et Extensions, ces dernières rebaptisées plugins. Les Managed Agents, propulsés par Gemini 3.5 Flash, permettent de lancer via un simple appel API un agent capable de raisonner, d'utiliser des outils et d'exécuter du code dans un environnement Linux isolé, accessible depuis l'Interactions API et Google AI Studio. Ce pivot stratégique change fondamentalement la proposition de Google aux développeurs. La fonctionnalité de tâches planifiées est particulièrement significative: plutôt que d'interroger manuellement un agent à chaque fois, les développeurs définissent des tâches qui invoquent les agents automatiquement, transformant l'assistant ponctuel en pipeline d'automatisation persistant. Pour les équipes enterprise, la connexion directe aux projets Google Cloud via la Gemini Enterprise Agent Platform simplifie le déploiement d'agents dans une infrastructure existante. Le SDK permet aux équipes d'ingénierie d'intégrer des agents Antigravity dans leurs propres produits internes, optimisés pour les modèles Gemini. Les environnements isolés des Managed Agents conservent fichiers et état entre appels successifs, permettant des sessions multi-tours sans réinitialiser le contexte. Cette annonce s'inscrit dans une bataille d'écosystèmes entre les grandes plateformes tech pour capter les développeurs dans leur univers d'agents IA. Google fait face à la concurrence directe de Claude Code d'Anthropic, de GitHub Copilot Workspace de Microsoft et d'outils comme Cursor. En unifiant desktop, CLI, SDK et enterprise autour d'un même "agent harness" co-optimisé avec Gemini 3.5 Flash, Google parie sur une cohérence verticale: chaque amélioration du harness central se propage automatiquement à toutes les surfaces. La disparition du Gemini CLI au profit de l'Antigravity CLI marque aussi un repositionnement de marque clair, signalant que l'IA agentique, et non plus le chatbot, est désormais la porte d'entrée principale de Google pour les développeurs.

UELes développeurs et équipes enterprise européens disposent d'une nouvelle plateforme unifiée d'orchestration d'agents intégrable à une infrastructure cloud existante, sans contrainte réglementaire européenne spécifique identifiée à ce stade.

OutilsOutil
1 source
Créer un système de traitement de documents financiers avec Pulse AI et Amazon Bedrock
133AWS ML Blog 

Créer un système de traitement de documents financiers avec Pulse AI et Amazon Bedrock

Pulse AI et Amazon Bedrock s'associent pour proposer un pipeline de traitement intelligent des documents financiers complexes, ciblant les établissements bancaires, les fonds d'investissement privés et les grandes entreprises. Contrairement aux outils OCR traditionnels qui traitent les documents comme de simples images, la solution combine les modèles de langage visuels de Pulse avec des composants de machine learning classiques spécifiquement conçus pour comprendre la structure des documents financiers : bilans comptables, comptes de résultats, dépôts SEC, rapports de recherche et documents d'audit. Le résultat le plus concret : un lot d'environ 1 000 documents financiers complexes, qui nécessitait auparavant plusieurs jours de traitement, est désormais traité en moins de trois heures, produisant des sorties structurées et auditables prêtes pour l'analyse. La solution est déjà déployée chez Samsung, Cloudera, Howard Hughes, ainsi que dans plusieurs institutions financières du classement Fortune 500. L'enjeu est critique pour le secteur financier : une erreur OCR dans un bilan ou un tableau à cellules fusionnées ne reste pas isolée, elle se propage en cascade à travers les calculs interconnectés, faussant l'ensemble de l'analyse. Le pipeline Pulse-Bedrock extrait les données de façon structurée et sémantiquement consciente, puis utilise Amazon Bedrock pour affiner les modèles Nova d'Amazon sur ces données de haute qualité. L'organisation obtient ainsi un modèle de langage personnalisé, entraîné sur ses propres conventions financières, capable de traiter les nouveaux documents avec une compréhension spécifique à l'entreprise. La révision manuelle, qui prenait des jours, se réduit à quelques heures. Ce développement s'inscrit dans une course à l'automatisation documentaire dans laquelle les institutions financières investissent massivement, sous la pression de volumes croissants de rapports réglementaires et de due diligence. Amazon Bedrock se positionne ici comme infrastructure de fine-tuning clé en main, sans gestion d'infrastructure ML ni planification de capacité, ce qui réduit la barrière d'entrée pour les équipes sans expertise MLOps. Pour Pulse AI, ce partenariat valide son approche hybride vision-langage face aux acteurs OCR historiques comme ABBYY ou aux offres cloud génériques de Google Document AI et Azure Form Recognizer. La prochaine étape logique est l'extension à d'autres verticales documentaires lourdes, comme le juridique ou le médical, où les mêmes problèmes de structure complexe et de dépendances contextuelles se posent.

OutilsOutil
1 source
Microsoft a récupéré plus du double de son investissement de 13 milliards de dollars dans OpenAI
134The Information AI 

Microsoft a récupéré plus du double de son investissement de 13 milliards de dollars dans OpenAI

Microsoft a investi 13 milliards de dollars dans OpenAI sur plusieurs années, obtenant en échange un droit exclusif de revendre les modèles de langage de la startup à d'autres entreprises via son cloud Azure. Pendant trois ans, Microsoft était ainsi le seul fournisseur cloud autorisé à commercialiser GPT-4 et ses successeurs auprès des professionnels. Malgré cet avantage concurrentiel, les données révèlent que les entreprises ont acheté davantage de capacités directement auprès d'OpenAI que via Microsoft durant cette période. Selon les estimations de The Information, basées sur des documents financiers d'OpenAI et des témoignages internes, Microsoft a toutefois déjà récupéré plus du double de son investissement initial en revenus nouveaux générés par les services liés à la technologie d'OpenAI. Ce résultat illustre que la valeur du partenariat pour Microsoft dépasse largement la simple revente de modèles. L'intégration de Copilot dans Microsoft 365, Azure OpenAI Service et les outils GitHub ont tous bénéficié directement de l'accès privilégié aux modèles d'OpenAI, générant des milliards de revenus supplémentaires que la comptabilité classique ne capturait pas forcément. Ce partenariat s'est construit dans un contexte de course effrénée à l'IA générative, où Microsoft cherchait à rattraper Google sur le terrain de la recherche et des outils de productivité. La relation entre les deux entreprises reste toutefois complexe : OpenAI développe désormais ses propres offres cloud concurrentes, et l'exclusivité commerciale de Microsoft s'érode progressivement, redessinant les contours d'une alliance stratégique à plusieurs dizaines de milliards de dollars.

UEL'érosion progressive de l'exclusivité commerciale de Microsoft sur les modèles OpenAI pourrait modifier les conditions d'accès et de tarification pour les entreprises européennes utilisant Azure OpenAI Service.

BusinessActu
1 source
Android reçoit une refonte majeure axée sur l'IA en 2026
135Ars Technica AI 

Android reçoit une refonte majeure axée sur l'IA en 2026

À quelques jours de sa conférence annuelle Google I/O, prévue la semaine prochaine, Google a décidé d'anticiper et de dévoiler en avant-première les grandes évolutions d'Android pour les prochains mois. L'entreprise annonce un déploiement progressif de nouvelles fonctionnalités d'intelligence artificielle regroupées sous la bannière Gemini Intelligence. L'automatisation des applications constitue la pièce maîtresse de cette mise à jour : déjà testée en 2026 avec DoorDash et Uber sur les téléphones Pixel et Samsung, cette fonction s'étend désormais à des scénarios beaucoup plus complexes. Google donne deux exemples concrets : le système pourrait récupérer un programme de cours dans Gmail puis basculer automatiquement vers une application de commerce en ligne pour ajouter les livres nécessaires au panier, ou encore analyser la photo d'une brochure de voyage et réserver un séjour similaire directement via l'application Expedia. Cette évolution marque un tournant dans la manière dont les assistants IA interagissent avec les smartphones. Jusqu'ici cantonnés à des réponses textuelles ou à des actions isolées, ils deviennent capables d'enchaîner des tâches concrètes à travers plusieurs applications sans intervention de l'utilisateur. Pour les consommateurs, cela signifie déléguer des actions du quotidien, achats, réservations, organisation, à un agent qui agit en leur nom. Pour les développeurs et les commerçants, c'est une nouvelle couche d'interaction avec leurs utilisateurs qui se dessine, portée par l'infrastructure de Google plutôt que par leurs propres interfaces. Le lancement initial de l'automatisation d'applications avait été accueilli avec frustration, Google reconnaissant implicitement des lacunes en annonçant des mois de travail d'ajustement depuis. Cette annonce anticipée avant Google I/O reflète également la pression concurrentielle intense : Apple Intelligence, Microsoft Copilot et les assistants de Samsung se disputent le même terrain. En faisant de Gemini le système nerveux central d'Android, Google cherche à imposer son modèle d'IA comme standard incontournable sur plus de trois milliards d'appareils Android dans le monde, avec des partenariats applicatifs qui pourraient rapidement s'étendre bien au-delà d'Uber et DoorDash.

UELes nouvelles fonctionnalités Gemini Intelligence sur Android toucheront directement les millions d'utilisateurs européens, Android étant la plateforme mobile dominante en Europe avec plus de 70 % de parts de marché.

OutilsOutil
1 source
JBS Dev : données imparfaites et le dernier kilomètre de l'IA, de la performance des modèles à la viabilité des coûts
136AI News 

JBS Dev : données imparfaites et le dernier kilomètre de l'IA, de la performance des modèles à la viabilité des coûts

Joe Rose, président de JBS Dev, un fournisseur de technologies stratégiques, remet en question l'un des mythes les plus répandus autour de l'IA générative : celui selon lequel les données doivent être parfaites avant de lancer tout projet d'IA. Lors de sa participation à l'AI & Big Data Expo, Rose a détaillé comment les outils actuels permettent de travailler efficacement avec des données imparfaites, en donnant l'exemple concret d'un client dans le secteur médical. L'objectif était de migrer vers un nouveau système de réconciliation de facturation, avec des dossiers hétérogènes : certains en PDF, d'autres sous forme d'images scannées, des noms de médecins mal placés dans les champs patients, des procédures mal catégorisées. L'IA générative a permis d'extraire les données exploitables via OCR et extraction de texte, puis des approches plus agentiques ont pris le relais, comme la comparaison automatique entre un dossier patient et un contrat d'assurance pour vérifier que la facturation était correcte. Le niveau d'automatisation est ainsi passé de 20 % à 40 %, puis 60 %, puis 80 %, avec un humain dans la boucle pour traiter les cas limites. Ce changement de paradigme a des implications concrètes pour les entreprises qui hésitent à se lancer dans des projets d'IA par peur d'un patrimoine data insuffisant. Rose souligne que les conseils des éditeurs et consultants, qui recommandent des lacs de données massifs et des programmes de transformation pluriannuels, servent avant tout leurs propres intérêts commerciaux. En pratique, un LLM est capable de comprendre une instruction à moitié rédigée, ce qui rend ces systèmes étonnamment robustes face à la qualité variable des données. La vraie rupture culturelle est ailleurs : les équipes IT doivent abandonner le réflexe "on construit, ça tourne, on oublie", car les systèmes agentiques nécessitent une supervision continue et une montée en automatisation progressive. Les prochains enjeux du secteur ne seront pas dans la course aux capacités des modèles, estime Rose, mais dans leur soutenabilité économique et leur portabilité. La question centrale devient : comment faire tourner ces modèles sur un laptop ou un smartphone plutôt que dans des data centers que l'on construit à un rythme difficilement tenable ? Rose va plus loin avec une prise de position tranchée : les entreprises devraient arrêter d'acheter des solutions SaaS pour des cas d'usage IA qu'elles peuvent implémenter elles-mêmes. Les outils cloud des trois grands fournisseurs (AWS, Azure, Google Cloud) suffisent pour démarrer des workloads agentiques dès demain, sans nouvelles licences ni formations spécifiques. Une position qui tranche avec les discours dominants de l'écosystème, et qui reflète une maturité croissante du marché face aux promesses de l'IA d'entreprise.

OutilsOpinion
1 source
OpenAI va économiser 97 milliards de dollars d'ici 2030 grâce à son nouvel accord avec Microsoft
137The Information AI 

OpenAI va économiser 97 milliards de dollars d'ici 2030 grâce à son nouvel accord avec Microsoft

OpenAI a conclu un nouvel accord avec Microsoft qui lui permettra d'économiser jusqu'à 97 milliards de dollars d'ici 2030. C'est la directrice financière Sarah Friar qui supervise cette renégociation majeure, dont les détails n'avaient jusqu'ici pas été rendus publics. Selon les termes initiaux du partenariat, OpenAI devait reverser 20 % de ses revenus à Microsoft, une clause qui aurait pu représenter 135 milliards de dollars si la société atteignait ses objectifs de croissance à long terme. Le nouvel accord réduit drastiquement cette obligation, limitant la part due à Microsoft à une fraction de ce montant. Cet allègement financier est considérable pour OpenAI, dont les ambitions d'expansion nécessitent des capitaux massifs. La société, valorisée à plus de 300 milliards de dollars après sa dernière levée de fonds, doit financer le développement de ses modèles, l'infrastructure de calcul et l'internationalisation de ChatGPT. Réduire la charge liée au partage de revenus libère des marges de manœuvre significatives pour investir dans la recherche et rester compétitif face à Google, Anthropic et Meta. Le partenariat entre OpenAI et Microsoft remonte à 2019, quand le géant de Redmond a injecté un premier milliard de dollars dans la startup. Depuis, Microsoft a engagé plus de 13 milliards de dollars et intégré les technologies d'OpenAI dans ses produits phares, de Copilot à Azure. La renégociation de cet accord de partage de revenus reflète le rapport de force qui a évolué entre les deux entités, OpenAI cherchant à préserver son autonomie financière à mesure qu'elle se transforme en une entreprise à but lucratif.

💬 Le rapport de force a changé de camp. Quand Microsoft a posé son premier milliard en 2019, les termes du deal reflétaient exactement ça, OpenAI avait besoin d'eux. À 300 milliards de valorisation, continuer à reverser 20% des revenus à Redmond, c'était une anomalie qui ne pouvait pas tenir.

BusinessActu
1 source
OpenAI sort (enfin) l’extension Codex pour Chrome (mais il y a un hic)
138Le Big Data 

OpenAI sort (enfin) l’extension Codex pour Chrome (mais il y a un hic)

OpenAI a lancé le 7 mai 2026 une extension Chrome pour son agent de développement Codex, compatible avec macOS et Windows. L'outil permet à Codex d'opérer directement depuis le navigateur : effectuer des recherches, remplir des formulaires, consulter des tableaux de bord, ou gérer plusieurs tâches en parallèle sur différents onglets, sans mobiliser l'interface principale. L'extension s'intègre notamment avec des plateformes comme LinkedIn, Salesforce ou Gmail, ainsi qu'avec des outils internes d'entreprise qui nécessitent une session déjà authentifiée. Les premiers retours des développeurs sont enthousiastes : l'un d'eux rapporte que Codex a automatiquement détecté et fermé des doublons pour faire passer son nombre d'onglets ouverts de 77 à 42. L'équipe d'OpenAI elle-même a qualifié l'intégration de "miracle". Un bémol notable : l'extension n'est pas encore disponible pour les utilisateurs européens et britanniques, et la version Firefox n'a pas encore été annoncée. Cette extension représente un saut qualitatif dans la manière dont les agents IA s'intègrent au travail quotidien des développeurs et des professionnels. Jusqu'ici, les agents devaient souvent contourner les limitations liées à l'authentification, incapables d'accéder aux plateformes protégées sans sessions actives. En opérant directement dans Chrome, Codex peut désormais agir là où se trouve réellement le travail, c'est-à-dire dans les interfaces web des outils métier. L'agent sélectionne automatiquement le bon mode d'action selon la tâche : il utilise un plugin dédié quand une intégration existe, bascule sur Chrome quand un accès authentifié est requis, et recourt à son navigateur interne pour les environnements locaux. Ce niveau d'autonomie contextuelle réduit considérablement la friction entre l'intention de l'utilisateur et l'exécution réelle, ce qui change la proposition de valeur des agents IA pour les usages professionnels intensifs. Codex est le pari d'OpenAI sur les agents de développement autonomes, un segment en forte compétition avec GitHub Copilot Workspace, Cursor ou encore Devin de Cognition. L'extension Chrome s'inscrit dans une stratégie plus large visant à ancrer Codex dans les workflows réels plutôt que dans des environnements sandbox isolés. Sur le plan de la confidentialité, OpenAI précise ne pas conserver l'historique complet des actions dans Chrome : seuls les éléments utilisés dans le contexte de la conversation sont enregistrés, captures d'écran, textes consultés, appels d'outils. L'entreprise recommande d'éviter de transmettre des informations très sensibles, sauf nécessité vérifiée. Le comportement de l'agent est également conditionné par le paramètre "Mémoires Codex" : activé, il peut s'appuyer sur ses souvenirs enregistrés ; désactivé, il opère sans cet historique. L'absence de disponibilité en Europe reste la principale contrainte à court terme, dans un contexte réglementaire où le RGPD complique le déploiement rapide de ce type d'outil.

UEL'extension n'est pas disponible pour les utilisateurs européens et britanniques, le RGPD compliquant son déploiement rapide dans la région.

💬 L'anecdote des 77 onglets ramenés à 42 fait sourire, mais elle dit quelque chose de vrai : pour la première fois, un agent peut opérer dans les interfaces web avec session active, sans contourner les logins. C'est le verrou qui bloquait tous les agents depuis deux ans. On attendra la disponibilité en Europe, donc.

OutilsOutil
1 source
Réservez de la capacité GPU à court terme pour vos workloads ML avec EC2 Capacity Blocks et SageMaker
139AWS ML Blog 

Réservez de la capacité GPU à court terme pour vos workloads ML avec EC2 Capacity Blocks et SageMaker

Amazon Web Services propose deux solutions complémentaires pour sécuriser de la capacité GPU à court terme : les EC2 Capacity Blocks for ML et les SageMaker training plans. Les Capacity Blocks permettent de réserver un nombre précis d'instances GPU pour une fenêtre temporelle définie, jusqu'à huit semaines à l'avance, avec des durées allant de 1 à 14 jours (par paliers d'un jour) ou de 15 à 182 jours (par paliers de sept jours). Chaque bloc peut couvrir jusqu'à 64 instances d'un même type, et une organisation peut cumuler jusqu'à 256 instances sur une même date en combinant plusieurs blocs au sein d'AWS Organizations. Contrairement aux réservations de capacité à la demande classiques (ODCR), ces Capacity Blocks sont entièrement en libre-service et affichent une décote de 40 à 50 % par rapport aux tarifs à la demande, tout en offrant une bien meilleure disponibilité pour les instances de type P, particulièrement recherchées. Ces solutions répondent à un besoin concret et pressant : la demande mondiale de GPU pour l'entraînement, le fine-tuning et l'inférence de modèles d'intelligence artificielle dépasse largement l'offre disponible. Pour les équipes qui ont besoin de GPU de manière ponctuelle, que ce soit pour des tests de charge, la validation de modèles, des ateliers techniques ou la préparation d'une mise en production, les options existantes présentent des limites sérieuses. Les instances à la demande ne garantissent pas la disponibilité au moment du lancement, et relâcher une instance peut signifier ne plus pouvoir la récupérer. Les instances Spot, bien que jusqu'à 90 % moins chères, peuvent être interrompues à tout moment par AWS. Les Capacity Blocks éliminent cette incertitude : la capacité est garantie pendant toute la durée réservée, ce qui permet de planifier des workloads critiques en temps contraint sans risque de pénurie de ressources. Cette pénurie de GPU n'est pas nouvelle : depuis l'explosion des usages d'IA générative à partir de 2023, les grands hyperscalers comme AWS, Google Cloud et Microsoft Azure font face à une concurrence intense pour l'acquisition et la mise à disposition de puces Nvidia H100 et autres accélérateurs. AWS avait introduit les Capacity Blocks dès 2023 pour les instances P5, mais l'offre s'est depuis progressivement élargie. L'intégration avec les SageMaker training plans vise à couvrir également les usages managés, où AWS gère l'infrastructure sous-jacente. À terme, ces mécanismes de réservation structurée devraient devenir la norme pour toute organisation menant des expérimentations ML d'envergure, car ils permettent de concilier agilité opérationnelle et maîtrise des coûts sans recourir à des contrats pluriannuels.

UELes équipes françaises et européennes utilisant AWS pour leurs workloads ML peuvent sécuriser de la capacité GPU à court terme avec une décote de 40-50%, réduisant l'incertitude opérationnelle liée à la pénurie mondiale de GPU.

InfrastructureActu
1 source
Anthropic dévoile des agents IA pour automatiser les tâches financières
140Le Big Data 

Anthropic dévoile des agents IA pour automatiser les tâches financières

Anthropic a dévoilé le 5 mai 2026 une suite de dix agents IA spécialisés dans l'automatisation des tâches financières complexes. Construits sur Claude Opus 4.7, ces agents ciblent les banques, sociétés de gestion d'actifs et équipes finance d'entreprise. Ils couvrent un spectre large : préparation de pitchs commerciaux, analyse de résultats d'entreprises, suivi de marchés, modélisation financière, rapprochement comptable, clôture mensuelle, audit d'états financiers et vérification KYC. Chaque agent combine des compétences métiers, des connecteurs de données et des sous-agents spécialisés. Sur le benchmark Finance Agent de Vals AI, Anthropic revendique un score de 64,37 % pour Claude Opus 4.7, ce qui en ferait le modèle le plus performant du marché sur les usages financiers selon l'entreprise. En parallèle, Anthropic intègre nativement Claude à Microsoft 365 via des modules complémentaires pour Excel, PowerPoint et Word, avec une extension Outlook annoncée prochainement. Une fonctionnalité appelée Dispatch permet également d'assigner des tâches à distance par message ou commande vocale, l'agent poursuivant alors le travail en arrière-plan sur les fichiers locaux. L'enjeu opérationnel est considérable pour les services financiers, où une part significative du temps des analystes est absorbée par des tâches répétitives à faible valeur ajoutée. L'intégration native avec Microsoft 365 est particulièrement stratégique : Claude peut construire un modèle financier dans Excel, le transférer automatiquement dans PowerPoint et générer une présentation qui se met à jour en temps réel quand les données changent. Dans Word, il peut adapter des notes de crédit aux standards internes d'une institution. La continuité contextuelle entre applications, argument central d'Anthropic, élimine la friction habituelle : les analystes n'ont plus à réexpliquer leur travail lorsqu'ils changent d'outil. Pour les institutions qui souhaiteraient personnaliser les agents, Anthropic permet d'adapter les modèles aux règles de conformité, politiques de risque ou méthodes d'évaluation propres à chaque organisation. Cette offensive s'inscrit dans une compétition féroce entre les grands laboratoires d'IA pour s'implanter durablement dans les workflows des services financiers, secteur perçu comme l'un des plus rentables pour les déploiements à grande échelle. Anthropic s'appuie sur des connecteurs vers les plateformes de données de référence du secteur, FactSet, S&P Capital IQ, PitchBook, Morningstar, LSEG, pour crédibiliser son offre face à des acteurs comme OpenAI ou Microsoft Copilot, déjà bien installés dans les grandes institutions. D'après le Wall Street Journal, la demande des institutions financières pour des outils IA pleinement intégrés dans les processus métiers est en forte croissance, et Anthropic cherche à se positionner non plus comme un fournisseur de modèle, mais comme une véritable plateforme opérationnelle. Le déploiement en quelques jours promis par l'entreprise reste à vérifier à l'échelle, mais le signal envoyé au marché est clair : Claude vise désormais le cœur des opérations financières.

UELes institutions financières européennes (banques, sociétés de gestion d'actifs) peuvent accéder à ces agents via Microsoft 365, mais devront évaluer leur conformité avec l'AI Act et les réglementations sectorielles avant tout déploiement à grande échelle.

💬 C'est le virage qu'on attendait : Anthropic arrête d'être un fournisseur de modèle pour devenir une plateforme métier à part entière. L'intégration dans M365, avec Claude qui garde le fil entre Excel, PowerPoint et Word sans qu'on lui réexplique tout à chaque changement d'outil, c'est là que ça peut vraiment mordre face à Copilot. Le 64,37% sur le benchmark Finance, bon, c'est leur propre terrain de jeu, faut attendre les vrais déploiements pour voir si ça tient.

OutilsOutil
1 source
Amazon envisage un mode de recherche IA hybride sur son site marchand
141The Information AI 

Amazon envisage un mode de recherche IA hybride sur son site marchand

Amazon envisage d'intégrer des réponses conversationnelles directement dans sa barre de recherche principale, selon Amanda Doerr, vice-présidente en charge du shopping chez Amazon. Jusqu'ici, l'assistant IA Rufus fonctionnait comme un outil séparé, distinct du moteur de recherche classique utilisé par des centaines de millions d'acheteurs. Le modèle envisagé consisterait à afficher un encart conversationnel au-dessus des résultats de recherche pour certaines requêtes, sans rediriger l'utilisateur vers une interface de chatbot distincte. Ce changement pourrait transformer en profondeur la manière dont les consommateurs naviguent sur Amazon, qui reste l'une des premières destinations mondiales pour la recherche de produits. En fusionnant la navigation, la recherche d'information et l'achat dans un seul flux, Amazon réduirait la friction entre la phase de découverte et l'acte d'achat. Pour les vendeurs et les marques présents sur la plateforme, cela soulèverait également des questions importantes sur la visibilité des produits dans un format où une réponse IA pourrait éclipser les résultats organiques traditionnels. Cette évolution s'inscrit dans une course plus large entre les géants technologiques pour intégrer l'IA générative aux interfaces de recherche. Google expérimente depuis 2023 ses "AI Overviews" dans les résultats de recherche, tandis que Microsoft a ajouté Copilot à Bing. Amazon, dont le cœur de métier reste le commerce, doit trouver un équilibre délicat entre améliorer l'expérience utilisateur et préserver la lisibilité des catalogues produits sur lesquels repose son modèle publicitaire.

UELes millions de consommateurs français et les vendeurs présents sur Amazon.fr seraient directement affectés par ce changement, qui modifierait la visibilité des produits et la dynamique de découverte d'articles sur la plateforme.

💬 Amazon c'est la vraie barre de recherche pour les achats, pas Google, et c'est pour ça que ce changement est plus important qu'il n'y paraît. Une réponse IA qui s'affiche avant les résultats organiques, ça remet à zéro dix ans de stratégie SEO marchand pour des milliers de vendeurs. Reste à voir si Amazon est vraiment prêt à toucher à son modèle pub pour ça, parce que là c'est leur chiffre d'affaires qui est en jeu.

OutilsOutil
1 source
AgentCore Optimization en préversion : la boucle de qualité des agents
142AWS ML Blog 

AgentCore Optimization en préversion : la boucle de qualité des agents

Amazon a annoncé le 5 mai 2026 la disponibilité en preview d'AgentCore Optimization, une nouvelle fonctionnalité de sa plateforme Amazon Bedrock AgentCore dédiée à l'amélioration continue des agents d'intelligence artificielle en production. Le système introduit une boucle automatisée en trois étapes : génération de recommandations à partir des traces de production, validation par évaluation en batch ou par test A/B, puis déploiement. Concrètement, l'API Recommendations analyse les logs stockés dans CloudWatch pour identifier les failles dans le prompt système ou les descriptions d'outils, en ciblant un signal de récompense défini par l'équipe, taux de succès des objectifs, précision dans la sélection d'outils, ou critères personnalisés via un LLM-as-judge. L'évaluation en batch compare ensuite la nouvelle version sur un jeu de tests préétabli, tandis que le test A/B, routé via AgentCore Gateway, divise le trafic réel selon un pourcentage configurable et produit des résultats avec intervalles de confiance et significativité statistique. NTT DATA, via Yoshiharu Okuda, son responsable de la stratégie IA générative, confirme déjà que des cycles de tuning de prompts qui prenaient auparavant plusieurs semaines sont devenus des itérations rapides et reproductibles grâce à ce système. L'enjeu est de taille pour les équipes produit qui déploient des agents à grande échelle. Jusqu'ici, lorsqu'un agent dégradait en qualité, parce qu'un modèle sous-jacent avait évolué, que les comportements utilisateurs avaient changé, ou qu'un prompt était réutilisé hors de son contexte d'origine, la correction reposait entièrement sur l'intuition d'un développeur : lire les traces, formuler une hypothèse, réécrire le prompt, tester quelques cas, déployer, et recommencer. Ce cycle manuel était non seulement lent, mais souvent contre-productif, un correctif résolvant un problème pour un utilisateur tout en en créant un nouveau pour un autre. AgentCore Optimization remplace cette mécanique artisanale par une boucle systématique alimentée par des données réelles, ce qui permet aux équipes produit de détecter les dérives au fil du quotidien plutôt que d'attendre les benchmarks hebdomadaires ou mensuels des équipes scientifiques dédiées. Amazon Bedrock AgentCore est la plateforme sur laquelle des milliers de développeurs construisent déjà des agents capables de raisonner, planifier et agir dans des workflows complexes. La composante Observability du service capture chaque appel de modèle, invocation d'outil et étape de raisonnement sous forme de traces compatibles OpenTelemetry, fournissant ainsi la matière première nécessaire à la nouvelle boucle d'optimisation. Cette annonce s'inscrit dans une tendance de fond : les grands fournisseurs cloud cherchent à industrialiser non plus seulement la création d'agents, mais leur maintenance opérationnelle dans la durée. Avec cette fonctionnalité encore en preview, Amazon positionne Bedrock comme une plateforme de bout en bout pour le cycle de vie complet des agents, dans un marché où Google Vertex AI et Microsoft Azure AI Foundry jouent la même carte d'intégration verticale.

UELes équipes produit françaises et européennes déployant des agents sur Amazon Bedrock pourront bénéficier de cycles d'optimisation automatisés, réduisant une dépendance aux processus manuels chronophages, sans impact réglementaire ou institutionnel spécifique à l'UE.

OutilsOutil
1 source
AgentCore : optimisation de la qualité des agents, désormais en préversion
143AWS ML Blog 

AgentCore : optimisation de la qualité des agents, désormais en préversion

Amazon a annoncé ce 5 mai 2026 l'intégration de nouvelles capacités d'optimisation automatique dans AgentCore, sa plateforme de déploiement d'agents IA, désormais disponibles en préversion. Ces fonctionnalités couvrent trois mécanismes complémentaires : les Recommandations, l'évaluation par lots (batch evaluation) et les tests A/B. Le moteur de recommandations analyse les traces de production et les résultats d'évaluation pour proposer des améliorations concrètes des prompts système ou des descriptions d'outils, en ciblant un critère de performance défini par le développeur. L'évaluation par lots permet ensuite de valider ces suggestions sur un jeu de données de test prédéfini, en mesurant des scores agrégés pour détecter d'éventuelles régressions. Enfin, les tests A/B comparent deux versions d'un agent en production via AgentCore Gateway, en répartissant le trafic réel selon un pourcentage configurable et en restituant les résultats avec intervalles de confiance et significativité statistique. L'ensemble s'appuie sur un système de traçabilité OpenTelemetry géré par AgentCore Observability, qui capture chaque appel au modèle, chaque invocation d'outil et chaque étape de raisonnement. Ces nouvelles capacités répondent à un problème structurel bien connu des équipes IA en production : la dégradation silencieuse des agents au fil du temps. Lorsque les modèles évoluent, les comportements utilisateurs changent, ou les prompts sont réutilisés dans des contextes imprévus, la qualité baisse sans signal d'alerte clair. Jusqu'ici, le cycle de correction restait entièrement manuel : un utilisateur se plaint, un développeur lit des traces, formule une hypothèse, réécrit le prompt, teste quelques cas et pousse un correctif qui peut en créer un autre. AgentCore ferme cette boucle en remplaçant l'intuition du développeur par des données systématiques, avec un signal de récompense configurable : taux de succès des objectifs, précision de sélection des outils, pertinence, sécurité. Yoshiharu Okuda, directeur de la stratégie IA générative chez NTT DATA, a confirmé que des processus qui nécessitaient auparavant plusieurs semaines de réglage manuel se transforment désormais en cycles rapides et reproductibles. AgentCore est la plateforme d'Amazon Web Services pour construire, connecter et optimiser des agents IA à grande échelle, avec des milliers de développeurs déjà actifs. Cette annonce s'inscrit dans une course plus large entre les grands fournisseurs cloud pour proposer des outils d'opérationnalisation des agents, au-delà de la simple inférence. Google Vertex AI, Microsoft Azure AI et AWS se disputent les équipes qui passent de la phase expérimentale à la production à grande échelle, là où la maintenance de la qualité devient un défi d'ingénierie à part entière. En automatisant la boucle observer-évaluer-améliorer, AWS positionne AgentCore comme une infrastructure de fond pour les organisations qui ne peuvent pas se permettre des équipes dédiées à l'optimisation manuelle de prompts sur des cycles hebdomadaires, alors que leurs agents dérivent chaque jour en production.

OutilsActu
1 source
Red-teaming d'un réseau d'agents : ce qui se brise quand les agents IA interagissent à grande échelle
144Microsoft Research 

Red-teaming d'un réseau d'agents : ce qui se brise quand les agents IA interagissent à grande échelle

Des chercheurs ont mené des tests offensifs, ou red-teaming, sur une plateforme interne réunissant plus de 100 agents d'intelligence artificielle en interaction, chacun tournant sur des modèles différents, avec des instructions et des mémoires distinctes, et agissant au nom d'un utilisateur humain. Le résultat est sans ambiguïté : certains risques n'apparaissent pas lors des tests d'agents isolés, ils émergent uniquement lorsque les agents communiquent entre eux. L'équipe a identifié quatre types de vulnérabilités spécifiques aux réseaux : la propagation (un message malveillant se transmet de proche en proche en collectant des données privées à chaque étape), l'amplification (un attaquant exploite la réputation d'un agent fiable pour diffuser une fausse information jusqu'à générer de fausses preuves en chaîne), la capture de confiance (détournement du mécanisme de vérification entre agents pour qu'il valide des mensonges), et l'invisibilité (l'origine d'une attaque devient intraçable car l'information transite par des agents qui n'en ont pas conscience). Ces découvertes ont des implications concrètes pour l'ensemble de l'industrie de l'IA. Les plateformes comme Claude, Copilot ou ChatGPT, combinées à des outils existants comme GitHub ou la messagerie électronique, mettent des agents en contact permanent. Lorsqu'un réseau d'agents opère en continu et communique plus vite que les humains, une information, ou une attaque, peut se propager en quelques minutes à travers des dizaines d'entités. La fiabilité d'un agent individuel ne prédit pas le comportement collectif du réseau : les défaillances se propagent aussi vite que les succès. Un réseau social exclusivement peuplé d'agents, lancé récemment, a attiré des dizaines de milliers de participants en quelques jours avant d'être rapidement submergé de spam et d'arnaques, illustrant concrètement ce phénomène. Ces travaux s'inscrivent dans une ligne de recherche émergente sur les systèmes multi-agents, qui comprend notamment les frameworks Prompt Infection et ClawWorm, ou encore le rapport Agents of Chaos, qui documentent comment des prompts adversariaux peuvent se propager de façon autonome. La particularité de cette étude est d'avoir été conduite sur un environnement réel et en conditions opérationnelles, et non sur un dispositif purement expérimental. Les chercheurs ont également observé des signes précoces de défense spontanée : une minorité d'agents avait adopté des comportements orientés sécurité qui limitaient la progression des attaques. Ce résultat encourage, mais les auteurs soulignent que les mécanismes de défense au niveau réseau restent un défi ouvert. Construire des réseaux d'agents robustes exigera de dépasser les benchmarks mono-agent, désormais insuffisants face à la réalité des déploiements interconnectés.

UELes organisations européennes déployant des architectures multi-agents pour automatiser leurs processus sont exposées à des classes de vulnérabilités émergentes (propagation, amplification, capture de confiance) non détectables par les tests mono-agent standards actuellement en usage.

SécuritéOpinion
1 source
AWS : guide complet pour migrer des LLMs en production d'IA générative
145AWS ML Blog 

AWS : guide complet pour migrer des LLMs en production d'IA générative

Amazon Web Services a publié un guide technique détaillant un cadre structuré pour migrer des modèles de langage (LLM) en production, baptisé "Generative AI Model Agility Solution". Conçu pour les équipes qui souhaitent passer d'un modèle à un autre, que ce soit entre différentes familles de LLM ou vers une version plus récente du même modèle, le dispositif repose sur trois étapes clés : évaluation du modèle source, migration et optimisation des prompts via Amazon Bedrock Prompt Optimization et l'outil Anthropic Metaprompt, puis évaluation du modèle cible. La durée totale d'une migration en suivant ce cadre varie de deux jours à deux semaines selon la complexité du cas d'usage. AWS met à disposition plusieurs exemples de fonctionnalités et de scénarios concrets pour faciliter la prise en main. La capacité à changer rapidement de modèle est devenue un enjeu stratégique pour les organisations qui déploient de l'IA en production : les performances évoluent vite, les coûts varient fortement d'un fournisseur à l'autre, et rester lié à un seul LLM expose à des risques opérationnels. Ce framework répond à ce problème en automatisant une grande partie du travail de comparaison : il fournit des métriques quantifiables sur le coût, la latence, la précision et la qualité, permettant des décisions fondées sur des données plutôt que sur des impressions. Il prend également en charge les cas où aucune réponse de référence ("ground truth") n'est disponible, en s'appuyant sur des indicateurs comme la pertinence des réponses, leur fidélité au contexte, ou la détection de biais et de contenus toxiques. Le lancement de ce guide s'inscrit dans une compétition intense entre fournisseurs de cloud pour capter les budgets IA des grandes entreprises. Amazon Bedrock, la plateforme d'accès aux LLM managés d'AWS, doit convaincre les organisations qu'elles peuvent migrer vers ses modèles sans friction excessive, notamment face à des concurrents comme Azure OpenAI ou Google Vertex AI. En intégrant nativement l'outil Metaprompt d'Anthropic, AWS mise sur la qualité des prompts comme levier différenciant, une approche cohérente avec les investissements massifs du groupe dans Anthropic. La publication de ce cadre open au niveau méthodologique signale aussi une volonté d'AWS de standardiser les pratiques de migration LLM avant que ce marché ne se fragmente davantage, en positionnant Bedrock comme la plateforme de destination naturelle pour les migrations de production.

OutilsOutil
1 source
Configurer Amazon Bedrock AgentCore Gateway pour un accès sécurisé aux ressources privées
146AWS ML Blog 

Configurer Amazon Bedrock AgentCore Gateway pour un accès sécurisé aux ressources privées

Amazon a dévoilé une nouvelle fonctionnalité pour son service Bedrock AgentCore Gateway : la connectivité VPC gérée, qui permet aux agents d'intelligence artificielle d'accéder à des ressources privées hébergées derrière des réseaux Amazon Virtual Private Cloud (VPC) sans exposer le trafic sur l'internet public. Concrètement, ce mécanisme repose sur un composant appelé Resource Gateway, qui provisionne automatiquement des interfaces réseau élastiques (ENI) directement à l'intérieur du VPC cible, à raison d'une interface par sous-réseau. Deux modes de fonctionnement sont proposés : le mode managé, où AgentCore prend en charge l'intégralité de l'infrastructure réseau à partir des identifiants VPC, de sous-réseau et des groupes de sécurité fournis par l'utilisateur ; et le mode auto-géré, qui laisse davantage de contrôle à l'équipe technique. Trois scénarios pratiques illustrent ces cas d'usage : la connexion à un endpoint privé Amazon API Gateway, l'intégration avec un serveur MCP (Model Context Protocol) hébergé sur Amazon Elastic Kubernetes Service (EKS), et l'accès à une API REST privée dans un réseau isolé. Pour les équipes qui déploient des agents IA en production, cette capacité représente un gain opérationnel significatif. Jusqu'ici, chaque chemin de connexion entre un agent et un outil interne (base de données, API métier, microservice) nécessitait une configuration réseau manuelle, ralentissant les déploiements et multipliant les risques de mauvais paramétrage. Avec AgentCore Gateway VPC egress, une Resource Configuration délimite précisément l'endpoint accessible, un nom de domaine ou une adresse IP, plutôt que d'ouvrir l'accès à l'ensemble du VPC. La Service Network Resource Association, créée et gérée automatiquement par AgentCore, connecte ensuite cette configuration au réseau de service, ce qui permet à l'agent d'invoquer l'endpoint privé de façon sécurisée et traçable. Pour les organisations avec des architectures multi-VPC ou hybrides, le service s'intègre nativement avec AWS Transit Gateway et le VPC peering inter-régions. Cette annonce s'inscrit dans la stratégie plus large d'Amazon pour rendre ses agents IA exploitables dans des environnements d'entreprise contraints, où la sécurité réseau et la conformité interdisent tout transit par l'internet public. Bedrock AgentCore est la couche d'infrastructure d'Amazon dédiée à l'orchestration et au déploiement d'agents autonomes en production, concurrençant directement les offres de Microsoft Azure AI Foundry et Google Vertex AI Agent Builder. La prise en charge du protocole MCP, standard ouvert porté par Anthropic pour connecter les agents à des outils externes, signale une convergence de l'écosystème autour d'interfaces interopérables. À mesure que les agents IA migrent du prototype vers le système critique, la capacité à les brancher sur des ressources internes sans compromettre le périmètre de sécurité devient un prérequis incontournable pour les DSI, ce qu'Amazon positionne désormais comme une fonctionnalité de première classe.

UELes organisations européennes soumises au RGPD déployant des agents IA peuvent exploiter cette connectivité VPC privée pour maintenir leurs données internes hors de l'internet public, facilitant ainsi la conformité réglementaire.

InfrastructureTuto
1 source
Claude Code, Copilot et Codex ont tous été piratés : les attaquants visaient les identifiants, pas le modèle
147VentureBeat AI 

Claude Code, Copilot et Codex ont tous été piratés : les attaquants visaient les identifiants, pas le modèle

En l'espace de quelques jours fin mars 2026, trois des principaux agents de codage IA ont été compromis. Le 30 mars, le chercheur Tyler Jespersen de BeyondTrust a démontré qu'un simple nom de branche GitHub pouvait forcer Codex d'OpenAI à exfiltrer son token OAuth en clair : en injectant une sous-commande via un point-virgule et des backticks dans le paramètre de nom de branche, le script de clonage devenait un vecteur d'exfiltration. Pour masquer l'attaque, 94 caractères "Ideographic Space" (Unicode U+3000) rendaient la branche malveillante visuellement identique à "main" dans l'interface Codex. OpenAI a classé la faille Critical P1 et livré un correctif complet le 5 février 2026. Deux jours plus tard, le code source de Claude Code d'Anthropic se retrouvait sur le registre npm public. Dans la foulée, Adversa découvrait que Claude Code cessait silencieusement d'appliquer ses règles de blocage dès qu'une commande dépassait 50 sous-commandes, un compromis délibéré entre sécurité et performance. Trois CVE distincts ont touché Claude Code en parallèle : CVE-2026-25723 permettait de contourner le sandbox via des commandes chaînées sed/echo ; CVE-2026-33068 permettait à un dépôt malveillant de pré-configurer le mode bypassPermissions dans .claude/settings.json avant même que la boîte de dialogue de confiance n'apparaisse. Côté Microsoft, Johann Rehberger a prouvé que des instructions cachées dans une description de pull request pouvaient activer l'auto-approbation dans les paramètres VS Code de Copilot, accordant une exécution shell illimitée sur Windows, macOS et Linux. Orca Security a ensuite montré qu'un simple ticket GitHub suffisait à faire exfiltrer le GITHUB_TOKEN privilégié par Copilot dans GitHub Codespaces. Ce qui unit toutes ces attaques, c'est l'identique surface d'entrée : non pas le modèle de langage, mais le credential qu'il détient et qu'il utilise sans session humaine pour l'ancrer. Merritt Baer, CSO d'Enkrypt AI et ancienne Deputy CISO chez AWS, résume le problème : les entreprises croient avoir "approuvé" un fournisseur d'IA, mais elles n'ont approuvé qu'une interface, pas le système sous-jacent. Ce sont les credentials sous cette interface qui constituent la vraie surface d'attaque. Un agent compromis n'a pas besoin d'exploiter le modèle, il lui suffit d'hériter des droits d'accès de l'environnement dans lequel il s'exécute pour prendre le contrôle d'un dépôt entier. Ces incidents s'inscrivent dans une série de neuf mois commencée à Black Hat USA 2025, où Michael Bargury, CTO de Zenity, avait détourné en direct ChatGPT, Microsoft Copilot Studio, Google Gemini, Salesforce Einstein et Cursor via un MCP Jira, sans aucun clic utilisateur. Six équipes de recherche ont depuis publié des exploits contre Codex, Claude Code, Copilot et Vertex AI, tous suivant le même schéma. L'enjeu n'est plus théorique : les agents de codage sont désormais branchés sur des pipelines CI/CD réels, disposent de tokens avec des droits d'écriture sur des dépôts de production, et opèrent avec une supervision humaine minimale. Tant que l'autorisation restera aussi plate que celle d'un LLM et que les règles de sécurité pourront être contournées par un simple dépassement de seuil arbitraire, les tokens resteront la cible de choix.

UELes développeurs et entreprises européens utilisant Claude Code, GitHub Copilot ou Codex dans leurs pipelines CI/CD sont exposés à des risques de vol de tokens et de compromission de dépôts de production, nécessitant une révision immédiate des permissions accordées à ces agents IA.

💬 Trois agents, trois failles, même surface d'attaque : le token, pas le modèle. C'est un peu gênant de voir qu'on reproduit les mêmes erreurs d'OAuth mal configuré qu'il y a dix ans, juste avec plus de puissance de feu et des droits d'écriture sur des dépôts de production. On a déployé avant de comprendre, et maintenant on ramasse.

SécuritéOpinion
1 source
Groupe SoftBank lance une pépite robotique déjà valorisée 100 milliards
148Le Big Data 

Groupe SoftBank lance une pépite robotique déjà valorisée 100 milliards

SoftBank prépare le lancement d'une nouvelle entité baptisée Roze AI, dédiée à l'automatisation de la construction de centres de données, avec une introduction en bourse envisagée dès le second semestre 2026 aux États-Unis. Selon le Financial Times et le Wall Street Journal, le groupe japonais vise une valorisation de 100 milliards de dollars pour cette structure encore embryonnaire. L'idée centrale : déployer des robots autonomes pour accélérer, standardiser et réduire les coûts de construction des data centers, infrastructures devenues critiques pour alimenter la demande explosive en puissance de calcul liée à l'IA générative. L'enjeu est colossal. Construire un centre de données reste aujourd'hui un processus long, coûteux et très dépendant de la main-d'œuvre humaine. En automatisant cette chaîne, Roze AI pourrait réduire significativement les délais de mise en service au moment précis où hyperscalers, gouvernements et entreprises technologiques se disputent la capacité de calcul disponible. Si la formule fonctionne, SoftBank ne se contenterait plus d'être un investisseur dans l'écosystème IA : il deviendrait un acteur industriel direct, capturant une part de la chaîne de valeur physique de l'intelligence artificielle, au même titre qu'un grand fournisseur cloud comme AWS ou Microsoft Azure. SoftBank évolue depuis des années dans une logique de paris technologiques massifs, parfois triomphants comme avec Alibaba, parfois catastrophiques comme avec Zume, la startup de livraison de pizzas robotisées qui a tourné court. Cette fois, la stratégie change de nature : il ne s'agit plus de financer des startups prometteuses depuis l'extérieur, mais de créer de toutes pièces une entité industrielle intégrée. SoftBank n'est pas seul sur ce terrain : Jeff Bezos a cofondé Project Prometheus, initiative visant à racheter des entreprises industrielles pour les moderniser par l'IA, signalant une convergence plus large entre capital technologique et transformation des infrastructures physiques. En interne, le projet Roze AI suscite néanmoins des interrogations : selon le Financial Times, plusieurs employés du groupe doutent de la pertinence d'une valorisation à 100 milliards pour une entité qui n'a pas encore prouvé son modèle à grande échelle, et le calendrier d'IPO pour fin 2026 est jugé très ambitieux. La question reste entière : Roze AI deviendra-t-elle un standard de l'infrastructure IA mondiale, ou un nouveau pari à haut risque dans la longue histoire des investissements de SoftBank ?

RobotiqueOpinion
1 source
AWS approfondit sa collaboration avec OpenAI pour séduire les grandes entreprises
149Le Big Data 

AWS approfondit sa collaboration avec OpenAI pour séduire les grandes entreprises

Amazon Web Services et OpenAI ont annoncé le 28 avril 2026 un élargissement significatif de leur partenariat, avec l'intégration des derniers modèles d'OpenAI directement dans Amazon Bedrock, la plateforme d'IA managée d'AWS. Concrètement, les entreprises clientes d'AWS peuvent désormais accéder aux modèles OpenAI via les mêmes API et outils que ceux déjà utilisés pour Anthropic, Meta, Mistral AI ou Cohere, sans changer d'environnement ni multiplier les contrats. Dans la foulée, AWS a annoncé le lancement de Codex sur Bedrock, l'agent de développement logiciel d'OpenAI déjà utilisé par plus de 4 millions de personnes chaque semaine, ainsi que le déploiement des Amazon Bedrock Managed Agents, une couche d'orchestration pour automatiser des workflows complexes en production. Pour les grandes organisations, l'enjeu dépasse le simple accès à de nouveaux modèles. Ce qui change concrètement, c'est la possibilité d'utiliser l'IA d'OpenAI sans renoncer aux garanties de sécurité et de conformité d'AWS : gestion des accès via IAM, chiffrement des données, journalisation avec CloudTrail, connectivité sécurisée via PrivateLink. Ces couches de gouvernance, déjà en place pour d'autres modèles Bedrock, s'appliquent désormais aux modèles OpenAI sans reconfiguration. À cela s'ajoute un avantage financier non négligeable : les usages OpenAI peuvent être imputés directement aux engagements cloud AWS existants, évitant la multiplication des fournisseurs et des lignes budgétaires. Pour les directions techniques et achats des grandes entreprises, c'est précisément le type de friction qui bloquait le passage du pilote à la production à grande échelle. Cette annonce s'inscrit dans une compétition acharnée entre les grands clouds pour capter les budgets IA des entreprises. Azure bénéficie depuis plusieurs années d'une exclusivité de fait sur OpenAI via l'investissement de Microsoft, qui détient une participation estimée à plusieurs dizaines de milliards de dollars dans la startup. En ouvrant Bedrock aux modèles OpenAI, AWS brouille cette distinction et positionne sa plateforme comme un guichet unique multi-modèles, où l'entreprise choisit le meilleur outil pour chaque cas d'usage sans dépendre d'un fournisseur unique. Pour OpenAI, l'accord élargit considérablement sa distribution commerciale au-delà de l'écosystème Microsoft, à une clientèle enterprise déjà ancrée dans AWS. Les prochains mois diront si cette convergence accélère l'adoption de Codex dans les équipes de développement, un marché où GitHub Copilot d'Amazon et Microsoft se livrent déjà une bataille directe.

UELes entreprises européennes déjà clientes d'AWS peuvent désormais déployer les modèles OpenAI en production via leur infrastructure cloud existante, avec les couches de conformité AWS déjà en place, supprimant un frein réglementaire majeur à l'adoption à grande échelle.

BusinessOpinion
1 source
Le pari d'Amazon sur OpenAI marque une nouvelle phase dans la guerre du cloud, sans exclusivité
150VentureBeat AI 

Le pari d'Amazon sur OpenAI marque une nouvelle phase dans la guerre du cloud, sans exclusivité

Amazon Web Services a lancé mardi l'une des offensives les plus significatives de ses vingt ans d'histoire dans l'IA d'entreprise. Lors d'un événement à San Francisco intitulé "What's Next with AWS", le cloud d'Amazon a annoncé simultanément l'intégration des modèles OpenAI les plus puissants sur sa plateforme Bedrock, le lancement d'un nouveau framework de développement agentique, d'un outil de productivité desktop appelé Amazon Quick, et l'extension d'Amazon Connect en une famille de quatre solutions d'IA ciblant les chaînes d'approvisionnement, le recrutement, la santé et l'expérience client. Les modèles GPT-5.4 et GPT-5.5 d'OpenAI sont désormais accessibles via Bedrock en préversion limitée, avec une disponibilité générale attendue dans les prochaines semaines. Ces annonces sont intervenues exactement vingt-quatre heures après la restructuration publique du partenariat exclusif entre OpenAI et Microsoft, qui libère pour la première fois OpenAI de toute restriction de distribution vers d'autres fournisseurs cloud. Le PDG d'AWS, Matt Garman, a qualifié l'accord de "partenariat majeur", précisant que les clients réclamaient les modèles OpenAI sur AWS "depuis les tous premiers jours". L'impact concret pour les entreprises est immédiat. Anthony Liguori, vice-président et ingénieur distingué chez AWS, a souligné que l'intégration via les API sans état, les API chat completions et responses classiquement utilisées, supprime totalement la friction de migration : les clients peuvent basculer leurs charges de travail existantes sur AWS sans réécrire une seule ligne de code. Les modèles OpenAI rejoignent désormais sur Bedrock les offres d'Anthropic, Meta, Mistral, Cohere et les propres modèles d'Amazon, sous un cadre unifié de sécurité, gouvernance et contrôle des coûts. Pour les équipes achats des grandes entreprises, ce qui était un écosystème multi-fournisseurs fragmenté se consolide en un seul point d'accès. AWS positionne ainsi Bedrock comme l'infrastructure de référence pour l'ère des agents logiciels autonomes. Le chemin vers cette alliance n'a pas été linéaire. L'accord de 50 milliards de dollars entre Amazon et OpenAI, annoncé en février 2026, avait créé une tension juridique avec Microsoft, qui revendiquait une exclusivité sur les API stateless d'OpenAI via Azure. Le Financial Times avait même rapporté que Microsoft envisageait des poursuites judiciaires. Le nouvel accord signé lundi a remplacé cette exclusivité à durée indéterminée par une licence non exclusive courant jusqu'en 2032, débloquant ainsi la voie pour AWS. Ce repositionnement marque une rupture structurelle dans les guerres du cloud : la course à l'exclusivité des modèles IA laisse place à une compétition sur l'infrastructure, l'outillage et l'expérience développeur. OpenAI, désormais libre de distribuer ses modèles partout, joue la carte de la ubiquité, tandis qu'AWS et Microsoft s'affrontent sur leur capacité à être la meilleure plateforme pour les déployer à l'échelle.

UELa consolidation du cloud IA entre AWS et OpenAI renforce la domination américaine sur l'infrastructure IA, réduisant l'espace stratégique pour des acteurs européens comme Mistral, déjà présent sur Bedrock mais en position minoritaire face à des plateformes unifiées.

BusinessOpinion
1 source