Aller au contenu principal

AWS· sujet

559 articlesmis à jour le 2026-06-09

Ce qu'on suit chez AWS côté IA : Bedrock et ses modèles, SageMaker, les puces Trainium et Inferentia, l'investissement dans Anthropic et l'offre cloud IA.

Hub d'actualité sur AWS, agrégé en continu depuis 72 sources éditoriales. Pour les analyses long-form, voir /analyses.

Le pouls du sujet · 30 derniers jours

données Le Fil IA
125 9%
articles (vs 30j préc.)
9.8%
de la couverture IA
Souvent associé à
AgenticAnthropicOpenAIMicrosoftInférence

Mesuré sur notre corpus de 50+ sources, fenêtre glissante de 30 jours. Part de voix = part des articles IA de la période mentionnant AWS. Voir le Baromètre IA complet

À retenir · 30 derniers jours

AWS occupe dans l'IA une position de fournisseur d'infrastructure plus que de créateur de modèles. La logique est simple : la plupart des entreprises qui déploient de l'IA ont besoin de puissance de calcul, de stockage et d'outils pour faire tourner des modèles en production. C'est ce terrain qu'Amazon cherche à tenir, via son cloud et ses services dédiés.

Concrètement, cela passe par Bedrock, sa plateforme qui donne accès à des modèles de plusieurs éditeurs (dont Anthropic, dans lequel Amazon a massivement investi), et par SageMaker, son atelier pour entraîner et héberger des modèles. S'y ajoutent des briques pour faire fonctionner des agents, gérer la confidentialité des données ou répartir les traitements entre régions. L'enjeu pour AWS n'est pas de gagner la course au meilleur modèle, mais de rester l'endroit où les autres font tourner les leurs.

Pour un professionnel, l'intérêt est là : comprendre AWS, c'est comprendre où et comment une grande partie de l'IA d'entreprise sera déployée, facturée et sécurisée. Les choix d'Amazon pèsent sur les coûts et la souveraineté des données.

Dans ce hub, on suit la position d'AWS dans l'écosystème IA : ses partenariats, ses services d'infrastructure et ce qu'ils changent pour ceux qui déploient l'IA en production.

Toute l'actualité AWS

Flux automatique. Articles classés par pertinence, agrégés en continu.

Premier avis de sinistre automatisé : Strands Agents et Amazon Bedrock AgentCore pour un traitement intelligent des déclarations
1AWS ML Blog OutilsOutil

Premier avis de sinistre automatisé : Strands Agents et Amazon Bedrock AgentCore pour un traitement intelligent des déclarations

Amazon Web Services a présenté un système d'automatisation de la déclaration de sinistre initiale (FNOL, ou "First Notice of Loss") combinant deux de ses technologies : le SDK open source Strands Agents et l'outil Amazon Bedrock AgentCore Browser Tool. Le dispositif s'appuie également sur Amazon Nova Act, un client capable d'interpréter des instructions en langage naturel pour piloter des interfaces web. Concrètement, Nova Act orchestre les interactions avec les portails de gestion de sinistres, ouvrir un dossier non traité, déclencher une analyse d'images, tandis que les agents construits avec Strands Agents appliquent les règles métier propres à l'assurance : interprétation des preuves, corrélation entre différents types de médias, évaluation de la complexité du dossier. Les modèles de fondation sont servis via Amazon Bedrock, et les sessions de navigation sont gérées dans des environnements Chrome isolés, avec enregistrement et visualisation en temps réel pour garantir la traçabilité. L'enjeu est considérable pour les compagnies d'assurance. À chaque déclaration de sinistre, les experts reçoivent un ensemble hétérogène d'informations non structurées : photos prises sur le terrain, vidéos panoramiques des dégâts, documents scannés, notes dictées ou enregistrées. Avant même de pouvoir exercer leur jugement, ils doivent naviguer dans des portails, vérifier l'exhaustivité des pièces justificatives et interpréter manuellement chaque élément. Les estimations sectorielles indiquent que cette phase de validation représente une part significative du temps d'un expert lors du traitement initial d'un dossier. Lors de pics de sinistres, catastrophes naturelles, vagues saisonnières, ces délais s'accumulent, créent des files d'attente et dégradent l'expérience client. Le système proposé délivre aux experts des dossiers pré-analysés, avec les preuves étiquetées et contextualisées, prêts pour la prise de décision plutôt que pour la validation. Cette initiative s'inscrit dans un mouvement plus large d'automatisation des processus assurantiels par l'IA générative, un secteur où les grands acteurs du cloud, AWS, Microsoft Azure, Google Cloud, se livrent une concurrence intense pour conquérir les équipes claims et underwriting. L'approche d'AWS est notable car elle ne cherche pas à remplacer l'expert humain mais à éliminer le travail répétitif d'écran, en préservant la supervision et l'auditabilité. Les données d'intake étiquetées deviennent également un actif opérationnel durable, utilisable pour affiner le routage des dossiers, détecter des patterns de fraude ou améliorer les workflows sur l'ensemble du cycle de vie des sinistres. La prochaine étape naturelle sera l'intégration avec des systèmes de gestion de sinistres existants comme Guidewire ou Duck Creek, où la valeur de l'automatisation multimodale sera pleinement testée à l'échelle.

UELes assureurs européens pourraient adopter ces outils pour automatiser le traitement initial des sinistres, mais la conformité RGPD et la souveraineté des données constituent des obstacles réglementaires à évaluer avant tout déploiement.

1 source
Créer un assistant de triage d'incidents basé sur des agents avec Amazon Q et New Relic
2AWS ML Blog 

Créer un assistant de triage d'incidents basé sur des agents avec Amazon Q et New Relic

Amazon Quick, la plateforme d'agents IA d'Amazon Web Services, vient de présenter une intégration native avec New Relic et Asana permettant d'automatiser la gestion d'incidents en production. Le principe : un ingénieur de garde envoie un simple prompt en langage naturel, par exemple "Le service checkout est lent et génère des erreurs serveur en production, vérifie les dernières 24 heures et génère un rapport de cause racine", et l'agent orchestre automatiquement cinq outils d'investigation New Relic en parallèle. Il identifie les alertes critiques, quantifie l'impact utilisateur, analyse les logs d'erreurs, détecte les transactions défaillantes, et traduit des questions en langage naturel vers le NRQL, le langage de requête propriétaire de New Relic. En sortie, l'agent produit un rapport de cause racine complet avec les liens vers les preuves, puis crée automatiquement une tâche dans le projet Asana "SRE Incident Triage" pour assurer la passation entre équipes. L'accès nécessite un abonnement Amazon Quick Professional avec des droits Author ou supérieurs. L'enjeu principal est la réduction du MTTR, le temps moyen de résolution d'incident, indicateur clé pour les équipes SRE. Lors des tests internes menés sur les propres applications de New Relic, l'agent a significativement compressé la phase de collecte des preuves, qui représente souvent la part la plus chronophage d'une intervention. Concrètement, cela réduit le risque de perte de connaissances lors des changements de garde, impose un standard d'investigation uniforme à toute la rotation on-call, et accélère la résolution effective. Pour les DSI et responsables ingénierie, la promesse est claire : moins de temps perdu à jongler entre des outils disparates sous pression, et une traçabilité immédiate de chaque incident. Cette intégration s'inscrit dans une tendance de fond : l'outillage des agents IA avec des connecteurs natifs vers les plateformes d'observabilité et de gestion de projet. New Relic, qui positionne son MCP Server comme pont entre ses données et les agents IA, rejoint ainsi un écosystème croissant autour du protocole MCP popularisé par Anthropic. Amazon Quick, de son côté, étend sa bibliothèque de connecteurs enterprise, avec New Relic et Asana déjà intégrés nativement. Le pattern décrit dans cet article, triage d'incidents, n'est qu'une illustration d'une capacité plus large : connecter n'importe quel flux de travail métier à un agent conversationnel. La prochaine étape logique serait d'étendre cette approche à d'autres outils d'observabilité comme Datadog ou Grafana, et à d'autres systèmes de ticketing comme Jira ou PagerDuty, à mesure que l'écosystème MCP se standardise.

OutilsOutil
1 source
Les clés de la flexibilité de l'IA en Europe : guide sur l'inférence interrégionale pour le traitement des données et l'accès aux modèles
3AWS ML Blog 

Les clés de la flexibilité de l'IA en Europe : guide sur l'inférence interrégionale pour le traitement des données et l'accès aux modèles

Amazon Web Services a introduit une fonctionnalité appelée Cross-Region Inference (CRIS) dans Amazon Bedrock, son service d'IA générative managé, permettant aux entreprises européennes de router automatiquement leurs requêtes d'inférence vers plusieurs régions AWS au sein de zones géographiques prédéfinies. Concrètement, lorsqu'une application envoie une requête à un modèle comme Claude d'Anthropic ou un modèle Amazon Nova, CRIS peut la rediriger dynamiquement vers la région disposant de la meilleure capacité disponible, tout en maintenant les données dans un périmètre géographique contrôlé. Pour l'Europe, AWS propose des profils EU CRIS dont toutes les régions de destination sont situées exclusivement au sein de l'Union européenne. Les données transmises restent chiffrées et circulent uniquement sur le réseau privé AWS, sans jamais transiter par l'internet public. Ce mécanisme répond à un problème concret que rencontrent les entreprises européennes : la saturation des capacités de calcul GPU en période de forte demande, qui se traduit par des latences élevées ou des erreurs de disponibilité. En distribuant les requêtes sur plusieurs régions, les applications deviennent plus résilientes aux pics de charge et aux pannes locales. Du point de vue réglementaire, les profils EU CRIS sont conçus pour faciliter la conformité au RGPD, puisque le traitement reste borné à l'UE, un critère déterminant pour les secteurs soumis à des exigences strictes de résidence des données comme la finance, la santé ou les services publics. AWS souligne également que certains modèles sont disponibles à tarif réduit via les profils globaux CRIS, ajoutant un argument économique à l'argument technique. La pression réglementaire européenne sur le traitement des données par des fournisseurs cloud américains s'est intensifiée ces dernières années, notamment après les décisions de la CJUE sur les transferts transatlantiques de données. Les grands hyperscalers comme AWS, Google Cloud et Microsoft Azure ont tous investi massivement dans des infrastructures européennes et des offres de souveraineté pour répondre à ces contraintes. CRIS s'inscrit dans cette logique : plutôt que de forcer les clients à choisir une seule région et à subir ses limitations de capacité, AWS propose une abstraction qui optimise automatiquement tout en respectant les frontières réglementaires. La prochaine étape logique sera l'extension de ces profils géographiques à d'autres zones comme le Moyen-Orient ou l'Asie-Pacifique, et l'intégration de contrôles plus fins permettant aux entreprises de définir elles-mêmes les régions autorisées selon leurs obligations contractuelles ou sectorielles.

UELa fonctionnalité EU CRIS d'AWS Bedrock permet aux entreprises européennes de maintenir leurs traitements d'inférence IA exclusivement dans les frontières de l'UE, facilitant la conformité RGPD pour les secteurs finance, santé et services publics soumis à des exigences strictes de résidence des données.

InfrastructureOpinion
1 source
Amazon Bedrock AgentCore permet d'héberger des agents de codage en toute sécurité
4AWS ML Blog 

Amazon Bedrock AgentCore permet d'héberger des agents de codage en toute sécurité

Amazon a lancé Bedrock AgentCore Runtime, un service cloud conçu pour héberger les agents de codage, Claude Code, Codex, Kiro, Cursor CLI, Gemini CLI ou tout autre outil similaire, sans que le développeur n'ait à garder son ordinateur portable allumé et ouvert. Chaque session obtient un microVM Linux isolé avec un espace de travail persistant, un shell réel et une exécution déterministe des commandes. Le service embarque également trois composantes clés : une couche d'identité qui fait agir l'agent au nom de l'utilisateur qui l'a déclenché, une passerelle MCP (Model Context Protocol) unique donnant accès à GitHub, Jira, Slack et aux services internes avec les vrais tokens stockés hors de portée de l'agent, et une intégration native à Amazon CloudWatch pour tracer chaque action effectuée. Amazon annonce que plusieurs agents concurrents, Claude Code, Codex, Kiro et Cursor, pourront être lancés simultanément sur le même dépôt, chacun dans son propre environnement isolé, et évalués sur la latence, le coût et le taux de réussite des tests. L'enjeu va bien au-delà du confort : héberger un agent de codage sur un laptop expose l'ensemble de l'environnement du développeur. L'agent partage le shell, le système de fichiers, les clés SSH, les credentials AWS stockés dans ~/.aws/credentials, les tokens npm, et le VPN actif. Un fichier README piégé suffit à déclencher une exécution malveillante avec accès complet aux secrets. La parallélisation pose un problème distinct : lancer deux agents via git worktree ne règle que la partie git, les deux processus se battent toujours pour le même localhost:5432, le même port :3000, le même trousseau SSH. Trois agents sur trois branches, c'est trois processus en compétition sur une seule machine. Enfin, fermer le couvercle du laptop tue la session : dépendances à moitié installées, refactoring en cours, suite de tests en attente, tout disparaît. Un chantier de 90 minutes ou une migration nocturne exige que l'écran reste allumé pendant toute la durée. La montée en puissance des agents de codage autonomes a rendu ce problème structurel. Ces outils peuvent désormais tenir des tâches longues, audit de codebase, migrations de schéma, refactoring multi-fichiers, qui dépassent largement la durée d'une session de travail classique. Les équipes qui veulent en tirer parti à l'échelle se heurtent aux limites du modèle "un agent par laptop ouvert". Amazon positionne AgentCore comme la réponse infrastructure à ce changement de régime : un environnement cloud dédié par agent, cloisonné par défaut, observable dès le départ, et déconnecté du cycle de vie de la machine du développeur. Le service s'inscrit dans une compétition plus large entre AWS, Google et Microsoft pour capter les workflows d'IA des équipes engineering, à mesure que les agents de codage passent du statut d'expérimentation à celui d'outil de production.

UELes équipes engineering européennes qui déploient des agents de codage autonomes peuvent désormais héberger leurs workflows sur une infrastructure cloud isolée et observable, sans dépendance au cycle de vie de leur machine locale.

InfrastructureOpinion
1 source
Inférence ML chiffrée de bout en bout avec Amazon SageMaker AI et le chiffrement homomorphe
5AWS ML Blog 

Inférence ML chiffrée de bout en bout avec Amazon SageMaker AI et le chiffrement homomorphe

Amazon Web Services propose une nouvelle approche pour exécuter des modèles de machine learning dans le cloud sans jamais exposer les données traitées, même au fournisseur d'infrastructure. La méthode repose sur le chiffrement homomorphe intégral (FHE, pour Fully Homomorphic Encryption), une technique cryptographique qui permet d'effectuer des calculs directement sur des données chiffrées, sans jamais les déchiffrer. Concrètement, un client envoie une requête chiffrée à un modèle hébergé sur Amazon SageMaker AI, le modèle produit une prédiction chiffrée, et seul le client peut déchiffrer le résultat final. La bibliothèque open source concrete-ml, compatible avec l'API scikit-learn, sert de couche de haut niveau pour entraîner et déployer ces modèles FHE sans avoir à coder les algorithmes cryptographiques à la main. L'enjeu est considérable pour plusieurs secteurs régulés. Dans le domaine médical, un assureur pourrait déployer un modèle prédictif sur des données diagnostiques de patients sans que ces données quittent le contrôle du médecin, en conformité avec les réglementations sur la vie privée. Dans le secteur énergétique, une entreprise pétrolière pourrait analyser des photos satellites de sites sensibles géopolitiquement sans les confier en clair à un tiers. Un opérateur télécom pourrait filtrer des e-mails clients pour détecter du spam sans violer les obligations de protection des communications personnelles. Dans tous ces cas, le cloud fournit la puissance de calcul, mais reste cryptographiquement aveugle au contenu traité, y compris Amazon lui-même, selon AWS. Cette publication fait suite à un premier article d'AWS qui démontrait le FHE appliqué à SageMaker en construisant manuellement un algorithme de régression linéaire via la bibliothèque bas niveau SEAL. L'approche présentée ici est plus généraliste : concrete-ml prend en charge plusieurs types de modèles standards et s'intègre directement dans les workflows SageMaker existants, via des conteneurs personnalisés. Le FHE se distingue également des environnements d'exécution confidentiels comme AWS Nitro Enclaves, où les données sont déchiffrées dans un enclave isolé avant traitement. Avec le FHE, aucun déchiffrement n'a lieu nulle part dans la chaîne. Le principal frein reste la performance, le FHE est significativement plus lent que le calcul en clair, ce qui limite pour l'instant son usage aux modèles relativement simples, mais la progression rapide des bibliothèques spécialisées laisse entrevoir des applications plus larges à moyen terme.

UECette technique répond directement aux exigences du RGPD en permettant aux entreprises européennes de sous-traiter des inférences ML à des clouds américains sans jamais exposer leurs données sensibles au fournisseur.

SécuritéTuto
1 source
Comment déployer des opérations IA autonomes à grande échelle sur Amazon Bedrock
6AWS ML Blog 

Comment déployer des opérations IA autonomes à grande échelle sur Amazon Bedrock

Amazon Web Services a dévoilé Amazon Bedrock Ops Alert, une solution de supervision automatisée en trois couches conçue pour les organisations qui déploient des applications d'IA générative à grande échelle. Utilisé par plus de 100 000 organisations dans le monde, d'entreprises naissantes aux multinationales, Amazon Bedrock fournit l'infrastructure sur laquelle reposent des centaines de workloads de production. La nouvelle solution surveille en continu les quotas de requêtes par minute (RPM) et de tokens par minute (TPM) alloués à chaque client, détecte les anomalies opérationnelles avant qu'elles n'impactent la production, ajuste dynamiquement les seuils d'alarme, et ouvre automatiquement des tickets de support AWS enrichis en contexte. Elle intègre également un mécanisme anti-doublons qui bloque la création d'un nouveau ticket si un cas non résolu de même nature est déjà ouvert, évitant ainsi de diluer l'attention des équipes d'ingénierie. Pour les équipes SRE spécialisées en IA, l'enjeu est considérable : gérer manuellement les quotas et escalades de support à mesure que l'adoption interne s'accélère est un travail chronophage qui détourne les ingénieurs de l'innovation. Bedrock Ops Alert réduit ce surcoût opérationnel en automatisant le triage, en fournissant des notifications contextualisées directement exploitables, et en raccourcissant le temps moyen de résolution des incidents. La solution permet aussi d'anticiper les besoins d'augmentation de quotas avant que les limitations ne se matérialisent en erreurs pour les utilisateurs finaux, un gain critique dans des environnements où plusieurs modèles de fondation tournent simultanément en production. Cette annonce s'inscrit dans une tendance plus large chez AWS : réduire la friction liée à l'échelle des workloads d'IA générative sans exiger systématiquement une augmentation de quotas. Amazon Bedrock propose déjà l'inférence inter-régions géographique et, plus récemment, l'inférence inter-régions mondiale (global cross-region inference), qui route automatiquement les requêtes vers les régions AWS commerciales les mieux disponibles dans le monde entier, offrant un accès à un pool de ressources nettement plus large et une réduction de coût d'environ 10 % par rapport à l'inférence géographique classique. Le prompt caching, autre fonctionnalité optionnelle, permet quant à lui de réduire la latence et les coûts en token en évitant de recalculer des portions de contexte identiques. Ensemble, ces mécanismes forment une réponse structurée d'AWS à la pression croissante que font peser des milliers d'organisations sur une infrastructure d'IA devenue critique pour leurs opérations quotidiennes.

UELes organisations françaises et européennes utilisant Amazon Bedrock pour leurs workloads d'IA en production peuvent réduire la charge opérationnelle de leurs équipes SRE grâce à cette solution d'automatisation du monitoring et de la gestion des quotas.

InfrastructureActu
1 source
Améliorez la précision des appels d'outils de vos agents avec SFT et DPO sur Amazon SageMaker AI
7AWS ML Blog 

Améliorez la précision des appels d'outils de vos agents avec SFT et DPO sur Amazon SageMaker AI

Amazon Web Services publie un guide technique détaillant comment améliorer la précision des appels d'outils dans les agents IA, en combinant deux techniques d'entraînement, le Supervised Fine-Tuning (SFT) et le Direct Preference Optimization (DPO), sur sa plateforme Amazon SageMaker AI. L'exemple concret porte sur Qwen3 1.7B, un petit modèle de langage, entraîné via des jobs SageMaker AI, un service entièrement géré prenant en charge les configurations multi-GPU et multi-nœuds à la demande. L'objectif est d'apprendre à un modèle à sélectionner le bon outil, dans le bon format, sans briser la chaîne d'actions d'un workflow automatisé. Quand un agent IA appelle le mauvais outil ou formate incorrectement ses paramètres, les conséquences sont directes : délais de traitement allongés, taux d'erreurs en hausse, coûts de support accrus et expérience utilisateur dégradée. Pour les organisations qui font passer leurs applications agentiques du pilote à la production, fiabiliser cette couche d'interaction avec les outils externes est devenu un prérequis non négociable. Le SFT permet d'enseigner au modèle le vocabulaire et les contraintes propres à chaque outil via des exemples explicites. Le DPO, lui, raffine ce comportement en intégrant des préférences directement dans la boucle d'entraînement, sous la forme de paires "réponse préférée / réponse rejetée", sans avoir besoin de fonctions de récompense ni de modèles de récompense distincts, ce qui réduit significativement les ressources et le temps d'entraînement par rapport au reinforcement learning classique. Le DPO s'appuie sur des travaux publiés en 2023 (arXiv:2305.18290) et s'intègre notamment via la bibliothèque HuggingFace TRL, qui prend en entrée des triplets prompt / réponse choisie / réponse rejetée. SageMaker AI ajoute une couche d'infrastructure managée : les clusters haute performance se lancent à la demande, s'arrêtent automatiquement en fin de job, et les métriques d'entraînement remontent vers MLflow intégré à SageMaker pour analyse ultérieure. Cette approche en deux temps, SFT pour la connaissance des outils, DPO pour l'alignement fin sur les comportements souhaités, trace une voie praticable pour les équipes qui veulent construire des agents robustes sans gérer elles-mêmes l'infrastructure d'entraînement. À mesure que les modèles plus petits gagnent en précision grâce à ces techniques, la frontière entre un LLM généraliste et un agent spécialisé fiable en production continue de se réduire.

LLMsTuto
1 source
Amazon Bedrock AgentCore Identity permet désormais de référencer ses propres secrets AWS Secrets Manager
8AWS ML Blog 

Amazon Bedrock AgentCore Identity permet désormais de référencer ses propres secrets AWS Secrets Manager

Amazon a annoncé une nouvelle fonctionnalité pour Amazon Bedrock AgentCore Identity qui permet désormais aux développeurs de référencer leurs propres secrets AWS Secrets Manager existants, plutôt que de laisser le service en créer automatiquement de nouveaux. Jusqu'à présent, AgentCore Identity gérait de façon autonome un coffre-fort de jetons qui créait et administrait un secret dans Secrets Manager pour chaque fournisseur d'identité externe configuré. Cette approche fonctionnait, mais elle privait les équipes de toute maîtrise sur la configuration de ces secrets : impossible d'y apposer des tags personnalisés, d'imposer une politique de rotation, ou d'appliquer un chiffrement via une clé KMS gérée par le client. La nouvelle capacité, disponible dès aujourd'hui, lève ces contraintes en permettant de fournir directement l'ARN d'un secret préconfiguré à la ressource de fournisseur d'identité. Concrètement, les organisations conservent désormais un contrôle total sur le cycle de vie de leurs secrets d'API utilisés par leurs agents IA : chiffrement avec une clé KMS maison, politique de rotation automatique, réplication, tags pour l'allocation des coûts ou la conformité, et politiques de ressources IAM granulaires. Quand la valeur d'un secret est mise à jour suite à une rotation, AgentCore Identity récupère automatiquement la nouvelle valeur à la prochaine lecture, sans qu'il soit nécessaire de recréer ou de modifier la configuration du fournisseur de credentials. Il est également possible de référencer un secret hébergé dans un autre compte AWS, dans la même région, et les secrets importés via des connecteurs externes Secrets Manager permettent l'intégration avec des gestionnaires de secrets tiers comme HashiCorp Vault. Cette annonce s'inscrit dans une tendance plus large : la montée en puissance des agents IA en production dans les entreprises, qui soulève des exigences de sécurité et de gouvernance de plus en plus strictes. Les équipes cloud des grandes organisations opèrent souvent dans des environnements régulés, avec des politiques SCP et RCP imposant un chiffrement obligatoire par clés gérées par le client, ou des audits de conformité exigeant une traçabilité précise par tags. En permettant à AgentCore de s'insérer dans les workflows de gestion des secrets déjà en place, AWS répond directement à ces contraintes sans obliger les entreprises à dupliquer leur infrastructure ou à contourner leurs propres politiques de sécurité. La prochaine étape naturelle sera probablement l'extension à des secrets cross-région, aujourd'hui encore absente.

UELes entreprises européennes opérant dans des secteurs régulés (finance, santé) pourront intégrer AgentCore dans leurs workflows de gestion des secrets conformes au RGPD et aux exigences de chiffrement imposées par leurs politiques internes ou réglementaires.

OutilsActu
1 source
Les modèles OpenAI et Codex sont désormais disponibles sur Amazon Bedrock
9AWS ML Blog 

Les modèles OpenAI et Codex sont désormais disponibles sur Amazon Bedrock

OpenAI et Amazon Web Services ont rendu officiellement disponibles, début juin 2026, GPT-5.5, GPT-5.4 et l'agent de code Codex sur Amazon Bedrock, un mois après l'annonce de leur partenariat élargi. Les trois modèles sont désormais accessibles en production via le catalogue Bedrock, avec une tarification identique à celle pratiquée directement par OpenAI, sans frais supplémentaires. GPT-5.5, le modèle le plus avancé de la gamme, excelle dans les tâches agentiques complexes : rédaction et débogage de code sur de grandes bases, analyse de données, génération de documents, et exécution autonome de séquences multi-étapes. Codex, l'agent de développement logiciel d'OpenAI, comptabilise plus de 5 millions d'utilisateurs hebdomadaires et est désormais accessible via l'application Codex, le CLI, ainsi que les intégrations IDE pour Visual Studio Code, JetBrains et Xcode, avec toute l'inférence routée par Bedrock. Pour les entreprises, cette disponibilité générale représente un changement opérationnel concret : les appels aux modèles OpenAI s'intègrent désormais dans les engagements AWS existants, comptent dans les crédits contractuels, et bénéficient des mécanismes de gouvernance déjà en place, notamment les permissions IAM, l'isolation réseau via VPC et PrivateLink, le chiffrement KMS et les journaux d'audit CloudTrail. Bedrock garantit par ailleurs une file d'attente isolée par client avec gestion automatique de la capacité, ce qui assure une performance prévisible même sous forte charge. Fait notable pour les secteurs réglementés : les prompts et réponses ne sont pas utilisés pour entraîner les modèles, et ne sont pas partagés avec OpenAI. Amgen, le géant pharmaceutique, a déjà exprimé son intérêt, son directeur technique Sean Bruich soulignant la qualité et la consistance de GPT-5.5 pour des contextes où la précision scientifique est critique. Ce déploiement s'inscrit dans une dynamique de consolidation entre les grands fournisseurs de cloud et les développeurs de modèles frontière. OpenAI cherche à multiplier les canaux de distribution pour ses modèles, en s'appuyant sur les infrastructures cloud existantes pour atteindre des clients enterprise déjà engagés avec AWS, plutôt que de les forcer à migrer vers une API directe. Pour Amazon, intégrer GPT-5.5 aux côtés de ses propres modèles Titan et des offres Anthropic et Mistral déjà disponibles sur Bedrock renforce le positionnement de la plateforme comme guichet unique du marché des modèles. L'enjeu sous-jacent est la rétention des dépenses cloud enterprise : en faisant compter l'usage d'OpenAI dans les engagements AWS, les deux sociétés créent une friction supplémentaire contre la migration vers Azure ou Google Cloud, où GPT-5.5 est également accessible.

UELes entreprises européennes sous contrat AWS peuvent désormais accéder aux modèles GPT-5.5 et Codex via Bedrock avec des garanties de conformité adaptées au RGPD (données non utilisées pour l'entraînement, isolation réseau VPC, chiffrement KMS), facilitant l'adoption dans les secteurs réglementés.

Amazon Bedrock AgentCore Gateway étend sa prise en charge du protocole MCP
10AWS ML Blog 

Amazon Bedrock AgentCore Gateway étend sa prise en charge du protocole MCP

Amazon a annoncé cette semaine une extension significative des capacités d'AgentCore Gateway, son service de passerelle centralisée pour le protocole MCP (Model Context Protocol) au sein d'Amazon Bedrock. Les nouvelles fonctionnalités couvrent notamment la prise en charge étendue des schémas d'outils MCP, l'intégration des primitives MCP prompts et ressources, la découverte dynamique de serveurs MCP à l'exécution, la gestion de sessions pour les interactions temps réel, un mécanisme d'élicitation permettant des demandes d'entrée en cours d'exécution, et un échange de jetons OAuth 2.0 pour l'authentification déléguée. Ces ajouts s'appliquent à un service qui sert déjà de point d'entrée unique entre les serveurs MCP d'une organisation et les clients qui les consomment, en centralisant la gestion des identifiants, l'observabilité et la connectivité sécurisée. L'enjeu est directement opérationnel pour les équipes engineering en entreprise. Sans passerelle centralisée, chaque serveur MCP déployé, qu'il gère les contrats pour l'équipe juridique, les données financières ou les incidents opérationnels, doit gérer indépendamment ses propres mécanismes d'authentification, de contrôle d'accès et de journalisation. Cela multiplie les délais d'approbation, fragmente la visibilité sur l'usage des outils et oblige les équipes sécurité à auditer chaque serveur séparément. AgentCore Gateway réduit ce fardeau en laissant chaque équipe se concentrer sur la logique métier de son serveur MCP, tandis que la passerelle prend en charge tout le reste : agrégation des capacités, politiques d'accès basées sur les ressources, isolation réseau via AWS PrivateLink, logs d'audit centralisés, et guardrails déterministes via AgentCore Policy. MCP, le protocole lancé par Anthropic fin 2024 pour standardiser la façon dont les agents IA interagissent avec des outils et services externes, a rapidement été adopté par les grands acteurs du cloud, dont AWS, Microsoft et Google. Amazon intègre AgentCore Gateway dans son écosystème Bedrock, qui concurrence directement Azure AI et Google Cloud Vertex AI dans la course aux infrastructures d'agents IA en entreprise. La montée en puissance des architectures multi-agents, où plusieurs modèles coopèrent en orchestrant des dizaines d'outils, rend ce type de couche de gouvernance centrale de plus en plus stratégique. Les prochaines étapes probables incluent une intégration plus poussée avec les outils d'identité AWS IAM et une extension du support aux agents tiers via les flux OAuth 2.0 maintenant disponibles dans la passerelle.

InfrastructureOpinion
1 source
Sécuriser les agents IA avec des intercepteurs Policy et Lambda dans la passerelle Amazon Bedrock AgentCore
11AWS ML Blog 

Sécuriser les agents IA avec des intercepteurs Policy et Lambda dans la passerelle Amazon Bedrock AgentCore

Amazon a enrichi son service Bedrock AgentCore Gateway de deux mécanismes de sécurité complémentaires destinés à contrôler le comportement des agents IA en entreprise. Le premier, appelé Policy, permet de définir des règles d'accès aux outils à l'aide de Cedar, un langage déclaratif d'Amazon qui évalue chaque requête selon un principal, une action et une ressource, puis délivre une décision déterministe d'autorisation ou de refus, automatiquement journalisée. Le second mécanisme, les intercepteurs Lambda, permet d'exécuter du code personnalisé avant ou après chaque appel d'outil, pour effectuer de la validation dynamique, de l'enrichissement de payload, des échanges de tokens ou du filtrage de réponses. Pour illustrer ces capacités, Amazon présente un agent de données baptisé "lakehouse data agent", conçu pour une compagnie d'assurance fictive. Cet agent permet à trois types d'utilisateurs, titulaires de contrats, experts en sinistres et administrateurs, d'interroger des données de réclamations stockées dans Amazon S3 Tables au format Apache Iceberg, via Amazon Athena et AWS Lake Formation. L'interface Streamlit authentifie les utilisateurs via Amazon Cognito et transmet des JWT à l'agent, qui expose cinq outils MCP distincts. Les métadonnées de rôles, les mappings IAM par tenant et la géographie des utilisateurs sont stockés dans Amazon DynamoDB. Ces nouvelles fonctionnalités répondent à un problème de gouvernance concret que rencontrent les grandes organisations déployant des agents IA à l'échelle. Contrairement aux applications traditionnelles qui exécutent une logique fixe, les agents pilotés par un LLM décident au moment de l'exécution quels outils invoquer, avec quels arguments et dans quel ordre. Il devient donc impossible d'auditer le graphe d'appels à l'avance. Sur des plateformes unifiées comptant des centaines d'agents et des milliers d'outils MCP répartis entre différentes équipes et unités métier, ce manque de contrôle crée un risque réel. La combinaison Cedar pour l'autorisation déterministe et Lambda pour la validation contextuelle dynamique, notamment basée sur la géographie de l'utilisateur, offre une architecture de sécurité en couches adaptée à cette réalité. Ce développement s'inscrit dans un mouvement plus large d'industrialisation de l'IA agentique au sein des entreprises, où les questions de sécurité et de conformité deviennent aussi critiques que la performance des modèles eux-mêmes. Le Model Context Protocol, promu initialement par Anthropic, s'impose progressivement comme standard d'interopérabilité entre agents et outils, et AWS prend position en intégrant nativement la gouvernance des outils MCP dans Bedrock. Lake Formation assure par ailleurs une sécurité au niveau des lignes et des colonnes directement à l'exécution des requêtes, garantissant que même un agent mal configuré ne puisse pas exfiltrer de données hors de son périmètre autorisé. La prochaine étape probable pour Amazon sera d'étendre ces mécanismes à des scénarios multi-agents, où la chaîne de confiance entre agents orchestrateurs et agents subalternes soulève des défis de sécurité encore plus complexes.

InfrastructureActu
1 source
Amazon Bedrock AgentCore : paiements par agents autonomes avec garde-fous intégrés
12AWS ML Blog 

Amazon Bedrock AgentCore : paiements par agents autonomes avec garde-fous intégrés

Amazon a annoncé en avant-première AgentCore Payments, une nouvelle fonctionnalité d'Amazon Bedrock développée en partenariat avec Coinbase Developer Platform et Stripe (via Privy), qui permet aux agents d'intelligence artificielle d'effectuer des transactions financières au nom de leurs utilisateurs. Disponible en préversion dans quatre régions, Virginie du Nord, Oregon, Francfort et Sydney, la solution repose sur un système de portefeuilles embarqués auto-custodiaux hébergés chez ces partenaires. Concrètement, chaque session de paiement est isolée, assortie d'un budget configurable et d'une durée de vie limitée (TTL), empêchant tout agent de dépenser librement au-delà du périmètre défini. Les informations sensibles, numéros de carte, codes CVV, clés d'API développeur, ne transitent jamais dans le contexte de l'agent, ce qui réduit considérablement la surface d'exposition en cas de compromission. Cette capacité répond à un verrou majeur dans le déploiement des agents autonomes : jusqu'ici, dès qu'une ressource web, un outil ou un endpoint MCP nécessitait un paiement, l'agent se retrouvait bloqué, incapable de finaliser la tâche sans intervention humaine. En intégrant la transaction directement dans l'infrastructure AWS, Amazon permet aux développeurs de construire des agents capables de mener à bien des missions complexes sans interruption. Les garde-fous sont conçus pour répondre aux trois risques principaux identifiés : les dépenses incontrôlées liées au comportement non-déterministe des grands modèles de langage, l'absence de délégation explicite de la part de l'utilisateur final, et la compromission des credentials développeur ou des tokens de portefeuille. Les limites de dépense sont appliquées au niveau de l'infrastructure, en dehors du modèle, ce qui les rend incontournables même si l'agent est manipulé ou mal configuré. Cette annonce s'inscrit dans une tendance de fond : les grandes plateformes cloud cherchent à industrialiser l'infrastructure nécessaire aux agents autonomes, au-delà des simples appels d'API. AWS positionne Bedrock AgentCore comme une couche de confiance entre les agents et les systèmes financiers réels, à un moment où la course à l'agentivité s'intensifie entre Amazon, Google et Microsoft. Le choix de Coinbase et Stripe comme partenaires n'est pas anodin : il permet de couvrir à la fois les paiements en crypto-monnaie et les paiements en monnaie fiduciaire, deux rails complémentaires selon les cas d'usage. La fonctionnalité reste en préversion, avec des API susceptibles d'évoluer avant la disponibilité générale, mais elle marque une étape concrète vers des agents capables d'agir pleinement en mandataires économiques de leurs utilisateurs, avec un cadre de responsabilité clairement défini.

UELa région Frankfurt est incluse dans les quatre régions de préversion, ouvrant l'accès aux développeurs européens, mais sans cadre réglementaire spécifique à l'UE mentionné pour encadrer les paiements délégués à des agents IA.

OutilsOutil
1 source
AgentOps : déployer des agents IA à grande échelle avec Amazon Bedrock AgentCore
13AWS ML Blog 

AgentOps : déployer des agents IA à grande échelle avec Amazon Bedrock AgentCore

Amazon Web Services a présenté AgentOps, une nouvelle discipline opérationnelle pour déployer, gérer et améliorer les agents IA en production, en s'appuyant sur sa plateforme Amazon Bedrock AgentCore. Publié début juin 2026, ce cadre de référence s'articule autour de quatre piliers : gouvernance et sécurité, construction et opérations, évaluation, et observabilité. Bedrock AgentCore permet de déployer des agents IA compatibles avec n'importe quel modèle de langage et n'importe quel framework open source, en passant du développement local à la production sans gérer d'infrastructure. AWS propose une architecture de référence complète couvrant l'ensemble du cycle de vie DevOps adapté aux agents : planification, développement, construction, test, déploiement et maintenance. Le besoin derrière AgentOps est concret : contrairement aux pipelines classiques, les agents IA prennent des décisions autonomes et non déterministes, ce qui rend le débogage difficile, les coûts imprévisibles et le contrôle qualité complexe. AgentOps répond à ces défis en traitant chaque agent, outil et configuration mémoire comme un artefact versionné avec son propre pipeline CI/CD. L'évaluation s'effectue à quatre niveaux : l'outil individuel, le tour de conversation, le résultat de session et le système global, aussi bien en développement qu'en production. L'observabilité couvre quatre couches de télémétrie pour tracer chaque décision d'agent, surveiller les baisses de qualité et mesurer le coût par interaction. Ce lancement s'inscrit dans une course industrielle autour de l'IA agentique, où AWS, Google, Microsoft et OpenAI cherchent à proposer des plateformes complètes pour industrialiser le déploiement d'agents. La complexité opérationnelle croissante, notamment la gestion des identités d'agents, des protocoles d'authentification inter-agents (A2A), du Model Context Protocol (MCP) et des mécanismes de contrôle humain (human-in-the-loop), pousse les entreprises à chercher des cadres structurés. Amazon Bedrock AgentCore se positionne comme une réponse cloud-native à ces enjeux, en intégrant nativement sécurité, registre d'outils, gestion de l'état et limites d'exécution. Les suites prévisibles incluent l'adoption de ces pratiques AgentOps dans les grandes organisations, ainsi qu'une pression croissante sur les équipes DevOps pour adapter leurs outils et processus à la nature non déterministe des systèmes agentiques.

UELes entreprises françaises et européennes déployant des agents IA sur AWS peuvent adopter ce cadre AgentOps pour structurer leurs pipelines CI/CD et leur observabilité, sans impact réglementaire spécifique à la France ou l'UE.

OutilsActu
1 source
Chargement des LLM accéléré et fenêtres de contexte élargies avec GPUDirect, Amazon FSx for Lustre et TurboQuant
14AWS ML Blog 

Chargement des LLM accéléré et fenêtres de contexte élargies avec GPUDirect, Amazon FSx for Lustre et TurboQuant

Amazon Web Services vient d'annoncer une combinaison technique qui pourrait transformer le déploiement de grands modèles de langage en production : l'utilisation conjointe d'Amazon FSx for Lustre, de NVIDIA GPUDirect Storage (GDS) et d'une nouvelle technique de quantification appelée TurboQuant. Concrètement, charger un modèle comme Llama 3.1 405B, soit environ 800 gigaoctets de poids en BF16, prend aujourd'hui entre 10 et 20 minutes avec une infrastructure classique. Avec GDS sur les nouvelles instances P6 et P6e d'AWS, propulsées par l'architecture NVIDIA Blackwell, ce délai tombe à quelques secondes. Le flagship P6e UltraServer concentre 72 GPU Blackwell dans un seul domaine NVLink, avec 13,4 téraoctets de mémoire HBM3e et 360 pétaflops de calcul en FP8. Le problème que résout cette approche est fondamental pour l'industrie de l'inférence à grande échelle. Dans le pipeline traditionnel, les poids du modèle transitent séquentiellement depuis le stockage vers la RAM CPU, sont désérialisés, éventuellement quantifiés, puis copiés un par un vers chaque GPU via le bus PCIe. Pendant tout ce temps, parfois vingt minutes, les GPU les plus chers de l'infrastructure restent inactifs. GPUDirect Storage court-circuite entièrement ce chemin : les checkpoints du modèle sont pré-découpés en fragments sur FSx for Lustre, et les huit GPU d'une instance lisent leurs fragments en parallèle directement dans leur mémoire HBM, sans jamais passer par le CPU ni le PCIe. L'impact est immédiat sur trois métriques critiques : la latence au premier token lors d'un démarrage à froid, la réactivité de l'autoscaling lors des pics de charge, et le coût d'infrastructure lié aux GPU qui attendent. Cette annonce s'inscrit dans une course à l'optimisation de l'inférence LLM qui s'est intensifiée depuis l'émergence de modèles à plusieurs centaines de milliards de paramètres. Des frameworks comme vLLM ont certes amélioré le chargement parallèle des poids depuis la version 0.19 et son moteur V1, mais les données continuent d'emprunter le CPU et le bus PCIe, une limitation structurelle que GDS supprime à la racine. AWS introduit simultanément TurboQuant, une technique de mise en cache KV qui permet d'augmenter significativement la taille des fenêtres de contexte disponibles sur ces instances. Ces deux avancées combinées positionnent AWS comme un acteur offensif sur le marché de l'infrastructure d'inférence, face à des concurrents comme Google Cloud et Azure qui développent leurs propres accélérateurs et solutions de stockage haute performance pour répondre aux mêmes contraintes.

UELes entreprises européennes déployant des LLMs à grande échelle sur AWS pourront réduire significativement leurs coûts d'infrastructure liés aux GPU inactifs au démarrage, avec un impact direct sur la compétitivité des services d'inférence en Europe.

InfrastructureOpinion
1 source
LangSmith sur AWS pour évaluer les agents LLM avancés
15AWS ML Blog 

LangSmith sur AWS pour évaluer les agents LLM avancés

AWS et LangChain ont publié conjointement un guide pratique sur l'évaluation des agents IA complexes en production, en s'appuyant sur l'outil LangSmith déployé sur l'infrastructure AWS. Co-rédigé par Karan Singh, directeur des partenariats chez LangChain, ce guide combine les travaux de LangChain et le guide publié par Anthropic sur la démystification des évaluations d'agents. Il présente cinq patterns d'évaluation, une méthode pour construire des tests hors ligne via pytest et LangSmith, ainsi qu'une configuration de monitoring en production. Le cas d'usage central est un agent "texte vers SQL" fonctionnant sur Amazon Bedrock, utilisant le modèle Amazon Nova 2 Lite, un modèle de raisonnement rapide et économique avec une fenêtre de contexte d'un million de tokens, capable de traiter texte, images, vidéos et documents, et bien adapté aux charges de travail agentiques. Le défi posé par l'évaluation des agents IA est fondamentalement différent de celui des LLMs classiques, pour trois raisons majeures : la non-déterminisme (le même agent peut réussir 90 % du temps et échouer dans 10 % des cas), la propagation d'erreurs (une faute à l'étape 3 peut fausser toutes les étapes suivantes, un agent SQL qui identifie mal le schéma construira un JOIN incorrect et produira une réponse erronée), et la créativité des solutions (les modèles frontières trouvent parfois des chemins valides non anticipés par les concepteurs de tests). Pour mesurer la fiabilité réelle, le guide introduit deux métriques clés : pass@k, qui mesure la probabilité d'au moins un succès en k tentatives, et pass^k, qui mesure la probabilité que toutes les k tentatives aboutissent, permettant ainsi de distinguer les agents capables d'improviser de ceux qui produisent des résultats cohérents et reproductibles. Ce guide s'inscrit dans une tendance de fond : à mesure que les agents IA passent des démonstrations aux déploiements réels, l'absence d'outils d'évaluation rigoureuse est devenue l'un des principaux freins à leur adoption industrielle. LangChain, qui développe l'un des frameworks d'orchestration les plus utilisés, et AWS, qui héberge une part croissante des charges de travail IA via Bedrock, se positionnent ensemble sur ce segment critique. LangSmith est disponible sur AWS Marketplace, ce qui simplifie son intégration dans les environnements cloud existants. Cette collaboration reflète une maturité croissante de l'écosystème : après une phase d'enthousiasme autour des agents autonomes, l'industrie se tourne désormais vers les questions de fiabilité, d'observabilité et de gouvernance, conditions indispensables à un déploiement à grande échelle.

OutilsOutil
1 source
Claude Opus 4.8 est désormais disponible sur AWS
16AWS ML Blog 

Claude Opus 4.8 est désormais disponible sur AWS

Anthropic a annoncé la disponibilité de Claude Opus 4.8, son modèle le plus avancé de la gamme Opus, sur Amazon Bedrock et sur la Claude Platform déployée sur AWS. Ce lancement permet aux équipes de développement d'intégrer le modèle directement dans leurs environnements AWS existants, tout en bénéficiant des garanties de sécurité entreprise, de résidence régionale des données et de la scalabilité d'infrastructure propres à Amazon. Pour les cas d'usage ne nécessitant pas de résidence régionale, le modèle est également accessible via la plateforme native d'Anthropic hébergée sur AWS. Techniquement, l'accès se fait via le SDK Anthropic avec l'identifiant de modèle us.anthropic.claude-opus-4-8, ou via les API Invoke et Converse d'Amazon Bedrock. Ce qui distingue Opus 4.8 de ses prédécesseurs, c'est sa capacité à maintenir un plan d'action sur plusieurs étapes successives, à suivre ce qui a été accompli et ce qui reste à faire, et surtout à se recorriger lorsqu'un blocage survient plutôt que de simplement s'arrêter sur une erreur. Pour les équipes qui automatisent des tâches longues et complexes, cette stabilité se traduit concrètement par moins de variance dans les sorties, moins de cycles de révision manuelle, et une supervision réduite des pipelines en production. En développement logiciel, le modèle est conçu pour naviguer dans de vraies bases de code, planifier avant d'éditer, et conserver le contexte sur des sessions prolongées. Les cas d'usage industriels ciblés incluent la recherche d'investissement et l'analyse de résultats financiers, la rédaction de contrats et de mémoires juridiques, la synthèse de littérature scientifique et de soumissions réglementaires en sciences du vivant, ainsi que l'analyse de menaces et la réponse à incident en cybersécurité. Ce lancement s'inscrit dans une stratégie de partenariat approfondi entre Anthropic et AWS, qui s'est notamment matérialisée par un investissement d'Amazon pouvant atteindre quatre milliards de dollars dans Anthropic. La disponibilité sur Bedrock est stratégique pour Anthropic, qui cherche à s'imposer comme fournisseur de référence pour les déploiements en entreprise, face à la concurrence directe d'OpenAI via Azure et de Google DeepMind via Vertex AI. Opus 4.8 représente le haut de gamme de la nouvelle génération Claude 4, une famille de modèles qui comprend également Sonnet 4.6 et Haiku 4.5, chacun positionné sur un équilibre différent entre performance et coût d'inférence. La prochaine étape pour Anthropic sera probablement d'élargir la disponibilité régionale du modèle sur Bedrock, et d'affiner ses capacités dans les domaines où la régulation de l'IA évolue rapidement.

UELes entreprises européennes peuvent déployer Claude Opus 4.8 sur Amazon Bedrock avec résidence régionale des données, facilitant la conformité RGPD pour les cas d'usage en production.

LLMsActu
1 source
Automatiser le triage des alertes anti-blanchiment avec Amazon Q et Snowflake Cortex AI
17AWS ML Blog 

Automatiser le triage des alertes anti-blanchiment avec Amazon Q et Snowflake Cortex AI

Amazon Web Services et Snowflake ont présenté une architecture conjointe permettant d'automatiser le traitement des alertes de lutte contre le blanchiment d'argent (LBA) dans les institutions financières. Lors de tests internes, le système construit sur Amazon Quick et Snowflake Cortex AI a réduit le temps d'investigation par alerte de 30 à 90 minutes à moins de 5 minutes. La solution repose sur le protocole MCP (Model Context Protocol), un standard ouvert qui permet à Amazon Quick Flows d'orchestrer des appels vers les agents Cortex de Snowflake sans connecteurs personnalisés, tout en maintenant une authentification OAuth. Concrètement, un analyste entre un identifiant d'alerte, et le système valide les données, interroge les transactions structurées via Cortex Analyst, fouille les documents de conformité via Cortex Search, puis génère automatiquement un rapport de disposition complet. L'enjeu est considérable pour les équipes de conformité des grandes banques : selon des études sectorielles, entre 90 et 95 % des alertes LBA sont des faux positifs. À raison de 30 à 90 minutes par alerte traitée manuellement, les départements compliance des établissements de taille moyenne à grande se retrouvent submergés de travail répétitif à faible valeur ajoutée. En automatisant la phase de triage, les deux plateformes permettent aux analystes de concentrer leur attention sur les cas réellement suspects, d'accélérer les délais réglementaires et de réduire les coûts opérationnels. La même logique d'orchestration peut s'appliquer à d'autres processus structurés similaires, comme le suivi des coûts cloud en FinOps, la gestion d'incidents pour les équipes SRE ou les enquêtes de conformité en général. Cette solution s'inscrit dans une tendance plus large de l'IA d'entreprise, qui évolue des simples assistants conversationnels vers des pipelines automatisés capables d'orchestrer plusieurs systèmes. Snowflake et AWS entretiennent déjà plus de 50 intégrations natives, incluant Amazon S3, AWS Glue, Amazon SageMaker et Amazon Bedrock. Amazon Quick, le service d'IA générative d'entreprise d'AWS, intègre désormais Quick Flows pour transformer des requêtes utilisateur en séquences d'appels standardisés sans code sur mesure. Le protocole MCP joue ici un rôle central en servant de langage commun entre les orchestrateurs et les agents spécialisés. À mesure que ces architectures se généralisent dans le secteur financier, la question n'est plus de savoir si l'IA peut automatiser la conformité, mais à quelle vitesse les institutions sauront déployer ces pipelines sur leurs propres infrastructures réglementées.

UELes banques et institutions financières européennes, soumises aux directives AMLD5 et AMLD6, pourraient déployer ce type de pipeline pour réduire leur charge de conformité et accélérer le traitement des alertes LBA réglementaires.

OutilsOutil
1 source
META découvre à son tour l’économie du compute
18FrenchWeb 

META découvre à son tour l’économie du compute

Meta Platforms envisage de commercialiser une partie de sa gigantesque infrastructure informatique, une rupture stratégique majeure pour l'entreprise fondée par Mark Zuckerberg. Depuis plus de quinze ans, le groupe utilisait ses data centers exclusivement en interne pour faire fonctionner Facebook, Instagram et WhatsApp, sans jamais vendre de capacités cloud à des tiers. L'explosion des besoins en intelligence artificielle change la donne : Meta disposerait désormais d'une surcapacité de compute suffisante pour envisager une offre commerciale externe. Ce pivot potentiel placerait Meta en concurrence directe avec Amazon Web Services, Microsoft Azure et Google Cloud, les trois géants qui dominent aujourd'hui le marché mondial du cloud, estimé à plusieurs centaines de milliards de dollars. Pour les entreprises qui développent des modèles d'IA, une quatrième alternative crédible serait une opportunité de diversification et de pression à la baisse sur les prix. Meta apporterait une infrastructure taillée pour les workloads IA les plus exigeants, notamment grâce à ses clusters de GPU massivement parallèles. Cette évolution s'inscrit dans une logique que l'histoire de la tech a déjà validée : AWS est né des excédents d'infrastructure d'Amazon, et est devenu sa division la plus rentable. Meta, qui investit des dizaines de milliards de dollars par an en capital expenditure, cherche à rentabiliser ces actifs autrement que par la seule publicité. La question reste de savoir si le groupe possède la culture commerciale B2B nécessaire pour rivaliser avec des acteurs qui ont dix à vingt ans d'avance sur ce marché.

UESi Meta lance une offre cloud commerciale, les entreprises et startups européennes disposeraient d'un quatrième fournisseur d'infrastructure IA majeur, renforçant leur capacité de négociation et potentiellement réduisant leurs coûts de compute.

💬 L'histoire AWS, Meta l'a visiblement relue attentivement. Quand tu as des clusters GPU calibrés pour entraîner des modèles à l'échelle de Facebook et Instagram, laisser ça tourner à vide serait absurde. Reste à voir si Zuckerberg a les équipes commerciales B2B pour vendre ça aux DSI, parce qu'entre avoir l'infra et savoir la packager pour des clients enterprise, il y a un vrai fossé de culture.

InfrastructureOpinion
1 source
Amazon Bedrock AgentCore : créer des agents IA pour le support métier
19AWS ML Blog 

Amazon Bedrock AgentCore : créer des agents IA pour le support métier

Works Human Intelligence (WHI), éditeur japonais du système RH intégré "COMPANY" utilisé par de grandes entreprises et organismes publics nippons, a collaboré avec le AWS Generative AI Innovation Center (GenAIIC) pour développer deux agents d'IA reposant sur Amazon Bedrock AgentCore. Le premier, le Commuting Allowance Agent, automatise la validation des demandes d'indemnités de transport lors d'événements comme les déménagements d'employés. Le second, le Browser Operation Agent, accède au système "COMPANY" au nom des clients pour vérifier des contenus, effectuer des opérations et collecter des preuves. Le résultat le plus marquant de cette collaboration est une réduction des coûts allant jusqu'à 97 %, combinée à une amélioration mesurable de l'efficacité opérationnelle des équipes support. Pour les départements RH de grandes organisations, la gestion quotidienne d'un système comme "COMPANY" génère un volume considérable de tâches répétitives : changements organisationnels, révisions des politiques salariales, mises à jour d'informations employés. L'automatisation via des agents d'IA permet de décharger les équipes opérationnelles de ces traitements routiniers, libérant du temps pour des missions à plus forte valeur ajoutée. La réduction de 97 % des coûts illustre concrètement ce que peut apporter une architecture bien conçue : WHI auto-hébergeait auparavant Langfuse pour surveiller ses agents, ce qui entraînait des coûts d'exploitation récurrents. La migration vers AgentCore Observability a supprimé cette charge. Pour l'industrie RH, ce cas démontre qu'il est possible de déployer des agents multi-tenants fiables, avec authentification via Amazon Cognito et gestion des tenants par Amazon DynamoDB, sans infrastructure monolithique difficile à faire évoluer. WHI avait initialement lancé un proof of concept avec LangGraph, Amazon ECS et AWS Fargate, mais la mise en disponibilité générale d'Amazon Bedrock AgentCore en cours de projet a conduit l'équipe à repenser l'architecture. Plutôt que de maintenir un ECS task monolithique où tous les composants s'exécutaient en bloc, la nouvelle architecture décompose les sous-agents pour les faire tourner individuellement sur l'AgentCore Runtime, ce qui facilite leur évolution future indépendante. Slack a été intégré comme point d'entrée, avec une authentification déclenchée au moment de chaque appel. WHI envisage également de remplacer l'agent superviseur actuel par Strands Agents à terme. Ce projet illustre une tendance croissante : les éditeurs de logiciels métier cherchent à enrichir leurs solutions avec des couches d'IA agentique en s'appuyant sur des services cloud managés pour absorber la complexité opérationnelle, plutôt que de maintenir leur propre outillage d'orchestration.

OutilsOutil
1 source
AWS SMGS transforme sa gestion commerciale avec un assistant conversationnel IA sur Amazon Bedrock AgentCore
20AWS ML Blog 

AWS SMGS transforme sa gestion commerciale avec un assistant conversationnel IA sur Amazon Bedrock AgentCore

Amazon Web Services a déployé en interne un assistant conversationnel basé sur l'intelligence artificielle, baptisé NarrateAI, pour transformer la façon dont les dirigeants de son organisation SMGS (Sales, Marketing and Global Services) accèdent aux données métier. Développé sur Amazon Bedrock AgentCore et accessible via l'interface Amazon Quick, l'outil permet à tous les niveaux hiérarchiques, du PDG aux équipes terrain, de poser des questions en langage naturel sur la performance commerciale et d'obtenir des réponses immédiatement exploitables. L'architecture repose sur deux couches distinctes : une couche de traitement par lots qui génère en amont des narratives personnalisées par utilisateur à partir de requêtes SQL paramétrées sur Amazon Redshift, et une couche temps réel qui répond aux questions de manière conversationnelle. AWS Lambda transforme les données extraites en JSON structuré, tandis que des templates Jinja les restituent en textes lisibles. Le recours à Bedrock AgentCore a permis de réduire le délai de déploiement de plusieurs mois à quelques semaines, en évitant de construire une infrastructure d'orchestration sur mesure. L'enjeu concret est significatif : les dirigeants AWS consacraient auparavant plusieurs heures à préparer manuellement leurs revues métier, en naviguant entre de multiples tableaux de bord et en réconciliant des sources de données disparates. NarrateAI supprime cette friction en livrant des analyses contextualisées à la demande, sans intermédiaire. Les équipes de reporting ne sont plus un goulot d'étranglement, et les décisions stratégiques peuvent être prises sur la base de données fraîches plutôt qu'en attendant des rapports consolidés. Pour une organisation de la taille d'AWS SMGS, qui opère à l'échelle mondiale sur des hiérarchies complexes, cette capacité à accéder instantanément à une vue unifiée de la performance représente un avantage opérationnel direct sur la réactivité des décisions commerciales. Ce projet s'inscrit dans une tendance de fond chez les grandes entreprises tech qui cherchent à remplacer la business intelligence traditionnelle, fondée sur des dashboards statiques, par des interfaces conversationnelles pilotées par des agents IA. Amazon Bedrock AgentCore, le service serverless d'AWS pour l'orchestration d'agents, est ici utilisé en interne avant d'être commercialisé auprès des clients, une stratégie classique chez AWS qui consiste à "dogfooder" ses propres services. La publication de ce retour d'expérience détaillé, incluant les patterns d'ingénierie et les choix architecturaux, vise clairement à convaincre les entreprises clientes d'adopter la même stack. Alors que les concurrents comme Microsoft et Google avancent eux aussi sur les agents IA d'entreprise, AWS positionne NarrateAI comme une vitrine de ce qu'il est possible de construire rapidement et en production avec Bedrock AgentCore.

OutilsOutil
1 source
Amazon Bedrock AgentCore au service des stratégies de vente par agents IA
21AWS ML Blog 

Amazon Bedrock AgentCore au service des stratégies de vente par agents IA

AWS a déployé en interne un assistant conversationnel baptisé Field Advisor, construit sur Amazon Bedrock AgentCore, pour résoudre un problème concret apparu dans ses propres équipes commerciales mondiales : la prolifération d'agents IA spécialisés sans coordination centrale. L'organisation AWS Sales utilisait plus de 20 agents distincts couvrant la gestion CRM, la planification de réunions, les recommandations produits, les analyses clients et les vérifications de conformité. Les représentants commerciaux devaient eux-mêmes choisir quel agent invoquer selon la tâche, gérer les changements de contexte entre systèmes fragmentés et assembler manuellement les résultats, une charge cognitive qui réduisait d'autant le temps passé avec les clients. Field Advisor agit comme une couche d'orchestration centrale : les commerciaux posent leurs questions en langage naturel, et le système route automatiquement les requêtes vers l'agent ou l'outil approprié, maintient le contexte conversationnel entre les interactions et livre une réponse unifiée via une interface unique. L'impact est concret pour les équipes de vente : Field Advisor s'intègre directement dans les outils déjà utilisés au quotidien, systèmes CRM, Slack, applications internes, évitant toute rupture de flux de travail. Le système inclut des mécanismes de validation humaine pour les opérations sensibles : avant de modifier des données CRM, il présente les changements proposés et attend une approbation explicite, ce qui préserve la fiabilité des données et la responsabilité des commerciaux. La mémoire persistante, combinant historique de session à court terme et mémoire sémantique à long terme, permet aux représentants de reprendre une conversation là où elle s'était arrêtée sans avoir à répéter le contexte à chaque interaction. L'ensemble de ces fonctionnalités réduit la charge opérationnelle et libère du temps pour les échanges à valeur ajoutée avec les clients. Ce projet illustre un défi structurel qui émerge dans de nombreuses grandes entreprises à mesure que l'adoption des agents IA s'accélère : la multiplication d'agents spécialisés crée paradoxalement une nouvelle complexité si aucune orchestration ne les unifie. AWS a choisi Bedrock AgentCore précisément pour ses capacités natives à l'échelle enterprise, environnements d'exécution isolés pour les opérations multi-locataires sécurisées, passerelle unifiée pour les outils et agents répartis sur plusieurs comptes AWS, propagation d'identité cohérente via OAuth et observabilité intégrée sur les flux complexes. En s'appuyant sur une infrastructure clé en main plutôt que sur du développement sur mesure, l'équipe d'ingénierie a pu concentrer ses efforts sur la logique métier plutôt que sur les fondations techniques. Field Advisor représente ainsi autant un cas d'usage commercial qu'une démonstration de la viabilité d'AgentCore comme substrat pour des déploiements agentiques en production à grande échelle.

OutilsOutil
1 source
Construire des systèmes multi-agents LangGraph serverless et scalables sur AWS avec Amazon Bedrock AgentCore
22AWS ML Blog 

Construire des systèmes multi-agents LangGraph serverless et scalables sur AWS avec Amazon Bedrock AgentCore

Amazon Web Services a présenté une architecture de référence pour déployer des systèmes multi-agents d'IA générative à grande échelle sur AWS, en combinant LangGraph, AWS Lambda, AWS Step Functions et les deux nouveaux services Amazon Bedrock AgentCore Memory et AgentCore Observability. L'approche repose sur une infrastructure entièrement serverless : les agents LangGraph sont packagés dans des conteneurs Docker exécutés sur Lambda, ce qui permet une montée en charge automatique sans gestion d'infrastructure. Pour illustrer le concept, AWS décrit un système concret de révision de campagnes marketing orchestrant trois agents spécialisés en parallèle, un agent "persona reviewer" qui évalue la résonance du contenu auprès de différents profils démographiques, un agent "validator" qui vérifie la conformité juridique et les chartes de marque, et un agent "finalizer" qui synthétise les retours en recommandations actionnables. Une interface React permet aux utilisateurs de télécharger leurs documents et de consulter les résultats en temps réel. Ce type d'architecture répond à un problème concret que rencontrent les entreprises en production : les agents IA performants en démo s'effondrent souvent sous la charge réelle, perdent le contexte entre les sessions et restent des boîtes noires difficiles à déboguer. AgentCore Memory résout la question de la mémoire en offrant à la fois un contexte conversationnel à court terme et une base de connaissances persistante entre sessions. AgentCore Observability capture quant à lui chaque invocation avec ses entrées et sorties LLM, la latence, et les métriques de chaîne d'outils sur l'ensemble des composants distribués. Pour les équipes en charge de systèmes critiques, c'est un changement de paradigme : il devient possible d'auditer exactement comment un agent a raisonné, quelle décision il a prise à quelle étape, et pourquoi. Cette publication s'inscrit dans une accélération visible chez AWS pour proposer une pile complète d'IA agentique cloud-native, face à la concurrence de Google (Vertex AI Agents) et Microsoft (Azure AI Foundry). LangGraph, développé par LangChain, s'impose progressivement comme standard de facto pour l'orchestration d'agents grâce à son modèle d'exécution en graphe orienté qui rend le flux de contrôle déterministe, parallélisable et conditionnel. L'intégration native avec Lambda et Step Functions est particulièrement stratégique pour les charges de travail "bursty" typiques des agents IA, où la demande est imprévisible et les coûts d'une infrastructure dédiée permanente seraient prohibitifs. La prochaine étape logique pour AWS sera d'étendre ces patterns à des workflows plus complexes impliquant des boucles de feedback humain et des agents à longue durée de vie, un segment encore largement inexploré en production.

InfrastructureActu
1 source
Créer des systèmes d'IA générative haute performance avec Strands Agents, NVIDIA NIM et Amazon Bedrock AgentCore
23AWS ML Blog 

Créer des systèmes d'IA générative haute performance avec Strands Agents, NVIDIA NIM et Amazon Bedrock AgentCore

AWS a publié un guide technique détaillant comment construire des systèmes d'agents d'IA générative haute performance en combinant trois technologies complémentaires : Strands Agents, le framework multi-agents d'AWS ; NVIDIA NIM, une plateforme d'inférence accélérée par GPU disponible via build.nvidia.com ; et Amazon Bedrock AgentCore, l'environnement d'exécution managé d'Amazon. L'architecture proposée repose sur un système de trois agents spécialisés fonctionnant en parallèle : un agent d'analyse des personas qui évalue le contenu marketing selon différentes audiences et produit des scores de résonance, un agent de validation qui vérifie la conformité légale et de marque, et un agent agrégateur qui consolide les recommandations. Le tout s'articule autour d'un frontend React qui interroge les résultats de manière asynchrone au fur et à mesure que les agents rendent leurs verdicts. Cette combinaison répond à trois problèmes concrets qui freinent le passage des prototypes IA vers la production : la latence d'inférence sous forte charge, la perte de contexte entre les interactions dans les environnements sans état, et le manque de visibilité sur l'exécution des agents. NVIDIA NIM apporte l'accélération GPU via des technologies comme CUDA et TensorRT-LLM, en exposant des API compatibles OpenAI sans adaptation spécifique au modèle. Bedrock AgentCore prend en charge la persistance de la mémoire partagée entre agents, les mécanismes de checkpoint et de récupération sur erreur, ainsi que l'observabilité intégrée. Strands gère l'orchestration parallèle, le contrôle de flux et l'agrégation des résultats. L'ensemble se déploie sous forme de conteneur Docker dans AgentCore Runtime, éliminant la gestion d'infrastructure à mesure que la charge augmente. Le cas d'usage présenté, la revue automatisée de campagnes marketing, n'est qu'un point d'entrée : la même architecture s'applique aux assistants virtuels, aux pipelines RAG et à l'automatisation de processus de validation complexes. Ce guide s'inscrit dans une compétition intense entre les grands fournisseurs cloud pour capter les workloads IA en production. AWS positionne Bedrock AgentCore comme la couche managée qui simplifie le déploiement d'agents à grande échelle, tandis que NVIDIA consolide sa présence dans la chaîne de valeur logicielle via NIM, bien au-delà de la simple vente de GPU. Strands Agents, framework open source lancé par AWS début 2025, cherche à s'imposer face à LangGraph ou AutoGen comme standard d'orchestration multi-agents. La multiplication de ces briques interopérables signale que les architectures agentiques entrent dans une phase d'industrialisation, où la fiabilité et l'observabilité comptent désormais autant que les capacités du modèle lui-même.

OutilsOutil
1 source
AgentWatch : surveillance proactive d'AWS avec des agents de veille
24AWS ML Blog 

AgentWatch : surveillance proactive d'AWS avec des agents de veille

AgentWatch est un agent de surveillance AWS dit "ambiant", développé par Amazon et déployé sur Amazon Bedrock, conçu pour transformer la façon dont les équipes DevOps gèrent l'infrastructure cloud. Plutôt que de réagir aux alertes CloudWatch après que les problèmes ont déjà affecté les utilisateurs, AgentWatch effectue des vérifications automatiques toutes les 15 minutes, analysant les métriques, journaux et alarmes CloudWatch sur plusieurs comptes AWS simultanément. Les rapports synthétiques sont envoyés directement sur Slack, et l'outil répond aux requêtes en langage naturel sur l'état de l'infrastructure. Le système repose sur trois modes d'interaction "human-in-the-loop" qui maintiennent une supervision humaine appropriée tout en maximisant l'automatisation. L'enjeu est considérable pour les équipes d'ingénierie cloud : selon le problème décrit par Amazon, les erreurs AWS Lambda s'accumulent inaperçues, les dégradations de performance EC2 passent sous le radar jusqu'aux signalements clients, et les ingénieurs d'astreinte souffrent de "fatigue aux alertes" en jonglant entre outils fragmentés. AgentWatch vise à éliminer ce cycle réactif en assurant une veille continue sans intervention humaine constante, libérant du temps pour l'innovation plutôt que la lutte contre les incidents. Concrètement, l'outil traduit des données dispersées, métriques, logs de dizaines de services, alarmes en cascade, en informations exploitables, n'impliquant les équipes humaines que lorsque leur jugement est véritablement nécessaire. Ce projet s'inscrit dans une tendance plus large de l'industrie vers les "agents ambiants", une nouvelle catégorie de systèmes IA événementiels et autonomes capables de traiter plusieurs flux de données en parallèle. Contrairement aux outils de monitoring traditionnels qui exigent des requêtes manuelles et une analyse humaine continue, ces agents opèrent en arrière-plan de façon persistante, à la manière d'un collaborateur invisible. Pour Amazon, c'est aussi une démonstration concrète des capacités d'Amazon Bedrock comme socle pour des applications d'IA opérationnelle en entreprise. La question des suites reste ouverte : l'adoption large de tels agents dans les environnements cloud complexes nécessitera de définir précisément les frontières entre décision automatisée et validation humaine, notamment pour les actions correctives à fort impact comme le redémarrage d'instances ou la modification de configurations critiques.

OutilsOutil
1 source
Intégration du serveur MCP AWS API avec Amazon Q via Amazon Bedrock AgentCore Runtime
25AWS ML Blog 

Intégration du serveur MCP AWS API avec Amazon Q via Amazon Bedrock AgentCore Runtime

Amazon Web Services a publié un tutoriel détaillant comment connecter Amazon Q, son assistant IA conversationnel, à l'ensemble de l'infrastructure cloud via une architecture combinant Amazon Bedrock AgentCore Runtime et le Model Context Protocol (MCP). Le dispositif s'appuie sur un serveur AWS API MCP pour transformer des requêtes en langage naturel en commandes AWS CLI exécutées directement dans l'environnement cloud. Concrètement, un ingénieur peut demander "Montre-moi toutes les instances EC2 actives dans us-east-1" et obtenir une réponse structurée sans mémoriser la syntaxe des API ni jongler entre plusieurs interfaces. L'authentification repose sur Amazon Cognito via un flux OAuth 2.0 et des tokens JWT, tandis que les commandes s'exécutent sous un rôle IAM à privilèges minimaux. La mise en place est estimée à 30 à 45 minutes, et le coût mensuel pour un utilisateur Enterprise effectuant environ 500 requêtes reste modeste. Ce type d'intégration répond à une friction bien documentée dans les équipes SRE et DevOps : les ingénieurs passent une part significative de leur temps à basculer entre la console AWS, la documentation CLI et les tableaux de bord des dizaines de services disponibles. Un diagnostic d'incident oblige à croiser manuellement les logs CloudWatch, l'état des instances EC2 et les politiques IAM dans des interfaces séparées. La planification de capacité nécessite des requêtes manuelles sur plusieurs services, et les audits de sécurité exigent des séquences d'appels API répétitives, longues à scripter. Avec cette architecture, une seule intégration réutilisable standardise l'accès de l'agent IA à tous les services AWS, tout en conservant une piste d'audit complète via CloudWatch pour les exigences de conformité. Cette solution s'inscrit dans la montée en puissance du Model Context Protocol, standard ouvert publié par Anthropic en novembre 2024 qui permet aux agents IA de se connecter à des outils externes de façon cohérente. AWS l'a intégré dans Bedrock AgentCore Runtime, sa couche d'orchestration pour agents IA, qui joue ici le rôle de passerelle sécurisée entre Amazon Q et le serveur MCP. L'utilisation d'Amazon Q requiert un abonnement Enterprise au niveau Professional minimum, ce qui cible en priorité les grandes organisations avec une infrastructure AWS significative. La démarche illustre une tendance plus large chez les hyperscalers : positionner leurs assistants IA internes comme interface unique pour opérer l'ensemble du stack cloud, réduisant la dépendance aux outils tiers tout en consolidant la chaîne de valeur autour de leurs propres services.

OutilsTuto
1 source
Créer des agents multi-locataires avec Amazon Bedrock AgentCore
26AWS ML Blog 

Créer des agents multi-locataires avec Amazon Bedrock AgentCore

Amazon a lancé Bedrock AgentCore, un service managé et serverless conçu pour permettre aux éditeurs de logiciels SaaS de déployer des applications agentiques en environnement multi-tenant sur AWS. Le service offre des primitives pour héberger des agents et des serveurs MCP (Model Context Protocol), avec une gestion intégrée des identités, de la mémoire, de l'observabilité et des évaluations. Le coeur de son architecture repose sur des microVMs isolées par session: chaque session client obtient son propre environnement d'exécution éphémère, avec un système de fichiers persistant propre, sans le coût ni la latence d'une machine virtuelle complète. Le contexte du tenant transite via des en-têtes HTTP personnalisés, portant l'identifiant du tenant, son niveau de service, ses préférences régionales et ses droits d'accès aux outils, ce qui permet à l'agent d'adapter dynamiquement son comportement sans logique de routage codée en dur. Cette approche répond directement au fossé qui sépare un prototype fonctionnel d'un déploiement en production dans un contexte SaaS. Les architectes d'applications agentiques devaient jusqu'ici résoudre manuellement six problèmes distincts: l'isolation des tenants, la propagation de leur identité, l'observabilité par tenant, l'isolation des données, l'attribution des coûts et la mitigation du "noisy neighbor" (un tenant monopolisant les ressources au détriment des autres). AgentCore propose trois patterns d'isolation, appelés Silo, Pool et Bridge, chacun offrant un compromis différent entre protection stricte et mutualisation des coûts. Pour les éditeurs gérant des centaines ou des milliers de clients sur une même plateforme, cette capacité à choisir un modèle d'isolation par segment tarifaire change concrètement l'équation économique et de conformité. Le lancement s'inscrit dans une course des grands fournisseurs cloud à imposer leurs infrastructures agentiques comme standard de facto pour la prochaine génération d'applications IA. AWS fait face à la concurrence directe de Google avec Vertex AI Agent Builder et de Microsoft avec Azure AI Agent Service, tous trois cherchant à capter les équipes d'ingénierie qui passent de l'expérimentation à la production. L'article publié par AWS est le premier d'une série, ce qui suggère que d'autres composants d'AgentCore (évaluation, fine-tuning par tenant, facturation granulaire) seront détaillés dans les prochaines semaines. La question centrale pour les équipes SaaS reste le degré de lock-in accepté en échange de la simplicité opérationnelle qu'offre un service pleinement managé.

UELes éditeurs SaaS européens construisant sur AWS peuvent exploiter les patterns d'isolation et les préférences régionales d'AgentCore pour satisfaire les exigences de résidence des données imposées par le RGPD.

OutilsOpinion
1 source
Amazon Bedrock AgentCore lève la limite de la fenêtre de contexte
27AWS ML Blog 

Amazon Bedrock AgentCore lève la limite de la fenêtre de contexte

Amazon Web Services a présenté une approche pour contourner la limite fondamentale des fenêtres de contexte des grands modèles de langage, en combinant Amazon Bedrock AgentCore Code Interpreter et le SDK Strands Agents. La technique repose sur les Recursive Language Models (RLM), introduits dans un article académique de Zhang et al. (arXiv:2512.24601), qui réorganisent radicalement la façon dont un modèle interagit avec des documents volumineux. Concrètement, plutôt que d'injecter l'intégralité d'un document dans le contexte du modèle, le système charge le document dans un environnement Python sandboxé persistant, puis orchestre des appels itératifs à des sous-modèles pour analyser des sections spécifiques. Les résultats intermédiaires restent stockés comme variables Python dans le sandbox, sans jamais encombrer la fenêtre de contexte du modèle racine. L'exemple illustratif est celui d'une analyse financière : comparer deux années de rapports annuels d'une même entreprise, soit 300 à 500 pages chacun, auxquels s'ajoutent les dépôts SEC et les rapports d'analystes, pour un total de plusieurs millions de caractères, impossible à traiter d'un seul tenant pour n'importe quel modèle existant. Cette avancée répond à deux échecs classiques des LLM face aux très longs documents. Le premier : la requête dépasse la fenêtre de contexte maximale et est simplement rejetée. Le second, plus insidieux : le document entre en contexte mais le modèle peine à tenir compte des informations situées en son milieu, un phénomène connu sous le nom de "lost in the middle". Les RLM contournent les deux en découpant le problème : un modèle racine génère du code Python pour naviguer et découper le document, tandis que des sous-LLM sont appelés ponctuellement pour les tâches de compréhension sémantique. Le résultat est une architecture sans limite théorique de taille de document, potentiellement transformatrice pour des secteurs comme la finance, le droit ou la recherche médicale, où l'analyse de corpus massifs est quotidienne. Le problème de la fenêtre de contexte n'est pas nouveau : les chercheurs et les ingénieurs y butent depuis l'émergence des LLM à grande échelle. Les solutions précédentes incluaient la recherche par similarité vectorielle (RAG), qui fragmente les documents en chunks et ne récupère que les passages pertinents, mais au prix d'une perte de cohérence globale. L'approche RLM se positionne comme une alternative plus puissante : le modèle racine explore activement le document comme un environnement, décide quelles sections méritent une analyse approfondie, et délègue ces tâches à des sous-modèles via une fonction llm_query() injectée dans le sandbox d'AgentCore. Ce dernier fonctionne en mode réseau PUBLIC, ce qui permet aux appels vers Amazon Bedrock de s'effectuer directement depuis l'environnement sandboxé. AWS s'appuie ici sur son infrastructure Bedrock pour proposer une solution intégrée, combinant orchestration, exécution de code et appels LLM dans un pipeline unifié, sans nécessiter d'infrastructure tierce.

UELes secteurs européens à forte charge documentaire (juridique, financier, médical) disposent d'une approche technique concrète pour traiter des corpus massifs sans être bloqués par les limites de contexte des LLM.

LLMsOutil
1 source
Créer des agents IA pour la business intelligence avec Amazon Bedrock AgentCore
28AWS ML Blog 

Créer des agents IA pour la business intelligence avec Amazon Bedrock AgentCore

OPLOG, entreprise turque spécialisée dans la logistique e-commerce pilotée par l'IA et la robotique, traite des millions de colis chaque mois en Turquie, au Royaume-Uni et en Allemagne pour des marques internationales et des marketplaces globales. Face à une fragmentation critique de ses données métier réparties entre HubSpot CRM, Microsoft Teams, Databricks et plusieurs autres systèmes indépendants, la société a développé une plateforme de business intelligence (BI) basée sur des agents IA déployés via Amazon Bedrock AgentCore. Concrètement, OPLOG a construit trois agents distincts à l'aide du Strands Agents SDK d'AWS, intégrés avec le modèle Claude Sonnet d'Anthropic et Amazon Bedrock Knowledge Bases pour la recherche par RAG. Les résultats mesurés sont nets : réduction de 35 % des cycles de vente, amélioration de 91 % de la complétude des données CRM, et réduction de 98 % du temps consacré à la recherche manuelle. L'impact opérationnel est significatif pour toute organisation B2B confrontée à des silos de données. Avant ce système, les équipes d'OPLOG passaient plusieurs heures par jour à extraire manuellement des rapports de systèmes disparates, à synthétiser l'information et à préparer des mises à jour. Les rapports hebdomadaires manquaient 60 % des opportunités commerciales, les deals ayant déjà évolué avant que l'analyse soit disponible. Désormais, trois agents autonomes prennent en charge ces tâches en temps réel : le Deal Analyzer Agent tourne selon un calendrier aligné sur l'activité commerciale et analyse les deals HubSpot récents pour vérifier leur conformité méthodologique, en remontant les résultats directement dans Microsoft Teams. Le Sales Coach Agent réagit aux webhooks HubSpot lorsqu'un deal change de stade, valide les champs requis selon le modèle commercial (B2C, B2B, ou mixte), et crée automatiquement des tâches pour les données manquantes. Un troisième agent, dont le détail n'est pas entièrement publié, complète le dispositif côté recherche de prospects. Ce déploiement s'inscrit dans une tendance de fond : les grandes plateformes cloud cherchent à faire des agents IA le nouveau standard de l'automatisation d'entreprise. Amazon Bedrock AgentCore, l'environnement d'exécution managé d'AWS pour agents IA, vise à simplifier ce type d'architecture en éliminant la gestion d'infrastructure tout en offrant scalabilité et traçabilité. Le choix de Claude Sonnet (Anthropic) comme moteur de raisonnement positionne AWS dans une logique de multi-partenariat avec les principaux labs IA. Pour des entreprises comme OPLOG, dont la croissance rapide dépasse les capacités des outils BI traditionnels, cette approche par agents spécialisés et indépendants offre une voie pragmatique vers l'automatisation sans refonte complète du système d'information.

UEOPLOG, présent en Allemagne et au Royaume-Uni, illustre une architecture d'agents IA applicable aux entreprises logistiques et B2B européennes pour automatiser leur BI et réduire les silos de données.

OutilsOutil
1 source
Créer un assistant de recrutement IA avec Amazon Bedrock
29AWS ML Blog 

Créer un assistant de recrutement IA avec Amazon Bedrock

Selon une enquête menée auprès de 748 responsables RH, les recruteurs consacrent en moyenne 17,7 heures par poste à pourvoir à des tâches administratives, soit plus de deux journées de travail par recrutement. Une étude SmartRecruiters de 2024 confirme cette réalité : 45 % des responsables de l'acquisition de talents passent plus de la moitié de leur temps sur des tâches automatisables. Pour répondre à ce problème, Amazon Web Services vient de publier une architecture de référence permettant de construire un assistant de recrutement alimenté par l'intelligence artificielle, reposant sur Amazon Bedrock. La solution s'appuie sur le modèle Amazon Nova Pro via l'API Bedrock Converse, AWS Lambda pour le traitement des requêtes, Amazon API Gateway pour le routage, Amazon DynamoDB et Amazon S3 pour le stockage, et Amazon Bedrock Guardrails pour les garde-fous éthiques, notamment l'anonymisation des données personnelles, la détection d'injections de prompts malveillants et le filtrage des contenus biaisés. Une interface web hébergée sur AWS Amplify, sécurisée via Amazon Cognito avec authentification par jetons JWT, permet aux recruteurs d'accéder à l'ensemble des fonctionnalités depuis un tableau de bord centralisé. Concrètement, l'outil automatise l'analyse des CV, calcule des scores de compatibilité multidimensionnels entre candidats et offres d'emploi, et génère des questions d'entretien personnalisées selon le profil de chaque candidat. L'objectif est de libérer les équipes RH des tâches répétitives qui dégradent la qualité des décisions : la surcharge administrative pousse aujourd'hui les recruteurs à effectuer un tri superficiel, favorisant les candidats dont les CV contiennent les bons mots-clés ou la meilleure mise en forme, plutôt que ceux présentant les véritables compétences requises. En déléguant ces étapes à l'IA, la solution cherche à recentrer l'attention humaine sur l'évaluation qualitative, là où elle apporte une réelle valeur ajoutée. Cette publication s'inscrit dans une intense compétition entre les grands fournisseurs de cloud pour imposer leurs plateformes d'IA dans les flux de travail des entreprises. Amazon Bedrock se positionne comme une infrastructure neutre, capable de faire tourner plusieurs modèles de fondation selon les besoins métier. AWS prend soin de préciser que l'architecture présentée est proposée à des fins d'apprentissage et non comme une solution directement déployable en production, invitant les entreprises à l'adapter à leurs propres exigences de conformité et de sécurité. La question de la responsabilité algorithmique dans le recrutement reste centrale : si ces outils peuvent réduire certains biais humains, ils risquent aussi d'en introduire de nouveaux s'ils ne sont pas rigoureusement audités, un défi que les garde-fous intégrés à Bedrock Guardrails ne suffisent pas à résoudre seuls.

UEL'AI Act classe les systèmes d'IA utilisés dans le recrutement comme systèmes à haut risque, imposant aux entreprises européennes qui adopteraient cette architecture des obligations strictes de transparence, d'audit algorithmique et d'enregistrement avant tout déploiement.

OutilsOutil
1 source
Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI
30Le Big Data 

Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI

Anthropic s'apprête à verser jusqu'à 1,25 milliard de dollars par mois à xAI, la société d'intelligence artificielle d'Elon Musk, pour accéder à sa puissance de calcul. L'accord, révélé dans un dépôt S-1 de SpaceX auprès de la SEC, porte sur l'achat de la totalité de la production du centre de données Colossus 1, situé près de Memphis, dans le Tennessee. Le contrat court jusqu'en mai 2029 et pourrait représenter jusqu'à 45 milliards de dollars de revenus cumulés pour xAI, les deux parties conservant toutefois une option de résiliation avec un préavis de 90 jours. L'accord fait suite à une première annonce, quelques semaines plus tôt, selon laquelle Anthropic avait sécurisé 300 mégawatts de capacité de calcul auprès de xAI, une décision déjà jugée surprenante par le marché. Pour Anthropic, l'accès garanti à des milliers de GPU sur plusieurs années répond à une contrainte structurelle : les modèles génératifs de nouvelle génération exigent des volumes de calcul massifs, aussi bien pour l'entraînement que pour l'inférence et les usages professionnels en temps réel. Alors que la demande des entreprises s'emballe plus vite que l'offre mondiale en puces avancées, verrouiller plusieurs années de capacité permet au créateur de Claude de réduire sa dépendance aux grands fournisseurs cloud traditionnels, Amazon Web Services, Microsoft Azure et Google Cloud. L'accord réduit également le risque de goulots d'étranglement à mesure qu'Anthropic étend ses déploiements dans les produits et workflows d'entreprises. Pour xAI, en revanche, ce contrat s'inscrit dans une stratégie de monétisation agressive de sa capacité excédentaire. Selon les documents de SpaceX, l'accord permet de rentabiliser des serveurs sous-utilisés, une situation qui coïncide avec un ralentissement rapporté de l'usage de Grok, l'assistant IA de xAI, ces derniers mois. Ce modèle positionne xAI dans la catégorie des "néoclouds" : des acteurs qui construisent d'abord une infrastructure pour leurs propres modèles, puis revendent la capacité disponible à d'autres entreprises du secteur, accélérant ainsi l'amortissement des coûts colossaux liés aux GPU Nvidia et aux centres de données énergivores. Paradoxalement, la transaction illustre aussi une évolution du marché : deux concurrents directs sur le segment des modèles génératifs coopèrent désormais sur l'infrastructure, signe que les investissements nécessaires à la course à l'IA dépassent ce que même les leaders du secteur peuvent absorber seuls.

InfrastructureOpinion
1 source
AWS s'associe à fal, startup IA générative pour la création de contenu média, et devient son fournisseur cloud privilégié
31VentureBeat AI 

AWS s'associe à fal, startup IA générative pour la création de contenu média, et devient son fournisseur cloud privilégié

fal, une startup californienne spécialisée dans la création de médias par intelligence artificielle générative, a annoncé avoir sélectionné Amazon Web Services (AWS) comme partenaire cloud privilégié. L'entreprise, valorisée à 4,5 milliards de dollars après une levée de fonds de 300 millions de dollars en Série D menée par Sequoia Capital, propose une plateforme unifiée donnant accès à plus de 1 000 modèles d'IA en production, des modèles propriétaires comme ChatGPT-Images-2.0 d'OpenAI ou Nano Banana Pro 2 de Google, jusqu'aux alternatives open source. Sa base d'utilisateurs dépasse les 2,5 millions de développeurs dans le monde, et ses clients entreprises incluent Canva, Adobe et Amazon MGM Studios. Les termes financiers de l'accord avec AWS n'ont pas été divulgués. Ce partenariat marque une étape importante dans la maturité du secteur de l'IA générative : l'enjeu n'est plus seulement de construire des modèles fondamentaux, mais de les déployer à grande échelle pour un usage commercial massif. fal joue un rôle comparable à celui de Stripe dans le paiement en ligne, abstraire toute la complexité d'infrastructure pour permettre aux développeurs de se concentrer uniquement sur l'expérience utilisateur. Grâce à AWS, la plateforme vise une disponibilité garantie à 99,99 %, avec la capacité d'absorber des millions d'appels API quotidiens. Pour les entreprises créatives et les équipes de développement, cela signifie un accès fiable et élastique à des capacités de génération d'images, vidéos, audio et contenu 3D, sans avoir à gérer soi-même des clusters GPU fragmentés. La montée en puissance de fal s'inscrit dans une transformation plus large de l'écosystème IA : à mesure que les modèles génératifs quittent le stade expérimental pour entrer en production, les infrastructures capables de tenir la charge deviennent un avantage concurrentiel déterminant. Avant ce partenariat, fal opérait sur plusieurs clouds simultanément, le fournisseur de stockage Tigris mentionnait une "flotte mondiale de GPU répartie sur de nombreux clouds", et la startup était également disponible sur le Google Cloud Marketplace depuis septembre 2025, sans que Google Cloud n'alimente pour autant son infrastructure GPU. En choisissant AWS comme couche de fiabilité et de distribution principale, fal se positionne pour capter la demande enterprise croissante en matière de génération de médias à l'échelle mondiale, dans un secteur où la course à l'infrastructure est désormais aussi stratégique que la course aux modèles.

UELes équipes techniques et créatives européennes bénéficient d'un accès simplifié à plus de 1 000 modèles de génération de médias à grande échelle, sans avoir à gérer elles-mêmes des clusters GPU fragmentés.

BusinessOpinion
1 source
Amazon Bedrock : mise en oeuvre des appels d'outils par programmation
32AWS ML Blog 

Amazon Bedrock : mise en oeuvre des appels d'outils par programmation

Amazon Bedrock propose désormais une approche appelée "Programmatic Tool Calling" (PTC), qui change fondamentalement la manière dont les grands modèles de langage interagissent avec des outils externes. Dans le schéma traditionnel, chaque appel d'outil nécessite un aller-retour complet vers le modèle : celui-ci formule un appel, reçoit le résultat, raisonne, formule le suivant, et ainsi de suite. Avec le PTC, le modèle n'est sollicité qu'une seule fois pour générer un bloc de code Python qui orchestre l'ensemble des appels d'outils. Ce code s'exécute dans un environnement bac à sable isolé, peut enchaîner des appels en parallèle grâce à asyncio, filtrer et agréger les données, et ne renvoie au modèle que le résultat final traité. Amazon Bedrock offre trois chemins d'implémentation : un sandbox Docker auto-hébergé sur ECS pour un contrôle maximal, une solution gérée via Amazon Bedrock AgentCore Code Interpreter, et un proxy compatible avec le SDK Anthropic pour les équipes habituées à cette interface. L'impact concret de cette approche est considérable en termes de latence, de coût et de précision. Prenons un exemple typique : "Quels membres de l'équipe ingénierie ont dépassé leur budget de déplacements au T3 ?" En mode traditionnel, le modèle effectuerait d'abord un appel pour obtenir la liste des 20 membres, puis 20 appels individuels pour récupérer leurs notes de frais, soit au moins 20 cycles d'inférence complets et plus de 2 000 lignes de données dans la fenêtre de contexte. Avec le PTC, un seul cycle d'inférence génère le code qui récupère tout en parallèle, filtre les dépenses de voyage approuvées, compare aux budgets individuels, et retourne uniquement la liste des personnes concernées. Les économies de tokens et de temps sont proportionnelles à la complexité du workflow. Ce paradigme émerge dans un contexte où les agents IA sont de plus en plus utilisés pour des tâches analytiques complexes, et où les coûts d'inférence restent un frein réel au déploiement à grande échelle. Le PTC n'est pas une innovation propre à AWS : le pattern sous-jacent, générer du code exécutable plutôt que d'orchestrer des appels séquentiels, est indépendant du fournisseur et commence à se diffuser chez plusieurs acteurs. Anthropic l'intègre déjà dans son propre SDK. Les cas d'usage privilégiés incluent le traitement de grands volumes de données, les calculs numériques précis, l'orchestration de processus multi-étapes, et les scénarios où la confidentialité des données brutes impose de ne pas les faire transiter par le contexte du modèle. La prochaine étape probable est la standardisation de ce pattern dans les frameworks d'agents comme LangChain ou LlamaIndex.

UELes développeurs européens utilisant Amazon Bedrock peuvent adopter cette approche pour réduire leurs coûts d'inférence et la latence de leurs agents IA analytiques.

OutilsOutil
1 source
Construction d'un serveur MCP sécurisé sur AWS pour une plateforme B2B d'un million d'entreprises
33InfoQ AI 

Construction d'un serveur MCP sécurisé sur AWS pour une plateforme B2B d'un million d'entreprises

Shadi Elyafi, ingénieur logiciel, a publié un retour d'expérience détaillé sur la construction d'un serveur MCP (Model Context Protocol) sécurisé sur AWS, destiné à exposer une plateforme d'intelligence B2B à un client LLM. La plateforme en question agrège les profils de plus d'un million d'entreprises, et l'objectif était de permettre à un utilisateur de formuler des requêtes en langage naturel du type « trouve des entreprises SaaS en Allemagne avec 50 à 200 employés » et d'obtenir des résultats directement dans son interface LLM, sans passer par une API classique. L'enjeu central de ce projet n'était pas fonctionnel mais sécuritaire : comment ouvrir un accès LLM à des données de production sensibles sans créer une passerelle dangereuse ? Un modèle de langage branché directement sur une base de données réelle peut, en théorie, être manipulé pour extraire des données non autorisées, contourner des filtres, ou générer des requêtes destructrices. La conception du serveur MCP devait donc intégrer des garde-fous robustes, une gestion fine des autorisations et une isolation claire entre la logique d'inférence et les données métier. Ce type d'architecture reflète une tendance croissante dans l'industrie : intégrer les outils MCP dans des environnements cloud d'entreprise pour donner aux LLM un accès structuré à des systèmes internes. Anthropic a défini le protocole MCP en fin 2024, et son adoption en contexte B2B s'accélère depuis. Les plateformes de données d'entreprise sont particulièrement concernées, car elles concentrent des informations concurrentielles à haute valeur, ce qui rend la question de la sécurisation de ces ponts LLM-production critique pour toute organisation qui souhaite tirer parti de l'IA générative en production.

OutilsOutil
1 source
L'action Cerebras double presque le premier jour, valorisant le fabricant de puces IA à 100 milliards de dollars
34VentureBeat AI 

L'action Cerebras double presque le premier jour, valorisant le fabricant de puces IA à 100 milliards de dollars

Cerebras Systems, le fabricant de puces basé dans la Silicon Valley, a fait une entrée fracassante au Nasdaq le 14 mai 2026 : l'action a ouvert à 350 dollars, soit presque le double du prix d'introduction fixé à 185 dollars, propulsant la capitalisation boursière de la société au-delà des 100 milliards de dollars dès les premières heures de cotation. L'entreprise a levé 5,55 milliards de dollars en vendant 30 millions d'actions, ce qui en fait la plus grande introduction en bourse technologique américaine depuis Uber en 2019. La demande des investisseurs a littéralement submergé les attentes initiales : Cerebras avait d'abord fixé une fourchette cible de 115 à 125 dollars, l'avait relevée à 150-160 dollars face à l'engouement, avant de fixer le prix final encore au-dessus de cette bande révisée. La société, dont le chiffre d'affaires a progressé de 76 % pour atteindre 510 millions de dollars en 2025, a annoncé son intention d'investir ces nouveaux capitaux dans l'expansion de son infrastructure cloud d'inférence. Ce succès boursier repose sur une architecture radicalement différente de celle de Nvidia. Le Wafer-Scale Engine WSE-3 de Cerebras est un processeur unique qui occupe un wafer de silicium entier, le disque de la taille d'une assiette à partir duquel sont normalement découpées des dizaines de puces classiques. Avec 4 000 milliards de transistors, 900 000 cœurs de calcul et 44 gigaoctets de mémoire embarquée, il est 58 fois plus grand que le B200 de Nvidia et offre 2 625 fois plus de bande passante mémoire. Cet avantage est décisif pour l'inférence d'IA, le processus qui consiste à faire tourner un modèle entraîné pour générer des réponses : chaque token produit nécessite de déplacer l'intégralité des poids du modèle entre mémoire et calcul, une opération strictement séquentielle où la bande passante est le facteur limitant. Cerebras revendique des vitesses d'inférence jusqu'à 15 fois supérieures aux solutions GPU concurrentes sur modèles open source, un chiffre confirmé par le cabinet d'analyse indépendant Artificial Analysis. Le parcours de Cerebras jusqu'à cette cotation a été tout sauf linéaire. Fondée en 2015 sur le pari que les charges de travail de l'IA seraient fondamentalement contraintes par les communications entre mémoire et calcul, la société a passé des années à résoudre un problème que l'industrie des semi-conducteurs avait tenté et abandonné à plusieurs reprises sur 75 ans d'histoire. Cerebras avait une première fois déposé son dossier d'introduction en bourse en septembre 2024, avant de se retirer face aux questions des régulateurs sur sa dépendance quasi totale à un seul client aux Émirats arabes unis. Le redépôt d'avril 2026 présentait un profil radicalement différent : des partenariats avec OpenAI et Amazon Web Services, un service d'inférence cloud en forte croissance, et une base de revenus diversifiée. La capitalisation atteinte dès le premier jour place désormais Cerebras parmi les fabricants de semi-conducteurs les plus valorisés au monde, dans un secteur où Nvidia règne encore en maître incontesté.

💬 100 milliards le premier jour, le marché n'attendait visiblement que ça. Ce qui m'intéresse plus que le chiffre boursier, c'est que leur pari de 2015 (l'inférence est bornée par la bande passante mémoire, pas par le compute) était juste, là où l'industrie avait abandonné ce problème depuis 75 ans. Les 15x sur l'inférence sont validés par des labos indépendants, c'est pas du marketing.

InfrastructureActu
1 source
Contrôlez la navigation de vos agents IA avec les politiques Chrome Enterprise sur Amazon Bedrock AgentCore
35AWS ML Blog 

Contrôlez la navigation de vos agents IA avec les politiques Chrome Enterprise sur Amazon Bedrock AgentCore

Amazon a annoncé le support des politiques d'entreprise Chrome et des certificats CA racine personnalisés dans Amazon Bedrock AgentCore Browser. Cette mise à jour permet aux organisations de configurer plus de 450 paramètres de navigateur via des fichiers JSON conformes au standard Chrome Enterprise, stockés dans Amazon S3 et appliqués à chaque session d'agent. Concrètement, les équipes peuvent désormais définir des listes blanches et noires d'URL, bloquer les téléchargements de fichiers, désactiver le gestionnaire de mots de passe ou contrôler le remplissage automatique de formulaires, le tout appliqué au niveau du navigateur, indépendamment de la logique ou des instructions de l'agent. Le support des certificats CA racine, stockés dans AWS Secrets Manager, permet en outre aux agents de se connecter aux services internes qui utilisent une autorité de certification privée, résolvant ainsi les erreurs de validation HTTPS qui bloquaient jusqu'ici l'accès aux infrastructures d'entreprise. L'enjeu est significatif pour les organisations qui déploient des agents IA autonomes sur le web. Un agent sans restriction de navigation peut accéder à des domaines non autorisés, stocker des identifiants dans le navigateur, télécharger des fichiers hors des flux de travail approuvés, voire exfiltrer des données sensibles. Le nouveau système introduit une séparation claire des responsabilités : les équipes de sécurité configurent les politiques au niveau du navigateur via l'API de plan de contrôle, tandis que les développeurs se concentrent sur la logique métier de l'agent, sans avoir à intégrer des décisions de conformité dans le code applicatif. Les politiques dites "managed", stockées côté service et non surchargeables, s'appliquent à toutes les sessions créées à partir d'un navigateur donné, alors que les politiques "recommended", définies au démarrage de session, jouent le rôle de préférences utilisateur et sont écrasées en cas de conflit. Cette évolution s'inscrit dans une tendance plus large : les agents IA accèdent de plus en plus à des interfaces web réelles pour exécuter des tâches, de la saisie de données à la recherche documentaire en passant par la gestion de portails métier. Cette capacité, aussi puissante soit-elle, ouvre des vecteurs d'attaque inédits, manipulation via des pages web malveillantes (prompt injection), exfiltration involontaire, navigation hors périmètre. En s'appuyant sur l'écosystème Chrome Enterprise, déjà utilisé par des millions d'entreprises pour gérer les navigateurs humains, Amazon évite de réinventer une couche de politique maison et offre aux DSI un cadre familier. L'intégration native avec S3 et Secrets Manager renforce l'alignement avec les architectures AWS existantes, ce qui devrait faciliter l'adoption dans les environnements régulés, finance, santé, administration, où le contrôle granulaire de l'accès aux données est non négociable.

UELes entreprises européennes opérant sur AWS dans des secteurs régulés (finance, santé, administration publique) peuvent désormais imposer des politiques de navigation granulaires à leurs agents IA, facilitant la conformité avec le RGPD et les exigences sectorielles de contrôle des accès aux données.

OutilsOpinion
1 source
AWS et Cisco AI Defense sécurisent les déploiements MCP et A2A pour les agents IA
36AWS ML Blog 

AWS et Cisco AI Defense sécurisent les déploiements MCP et A2A pour les agents IA

Cisco et AWS ont annoncé un partenariat pour sécuriser les déploiements d'agents IA en entreprise, ciblant en particulier deux protocoles devenus centraux dans l'industrie : le Model Context Protocol (MCP), lancé en novembre 2024, et le protocole Agent-to-Agent (A2A), introduit en avril 2025. Le MCP permet aux agents IA de se connecter à des sources de données et des API externes, tandis que l'A2A autorise des agents autonomes à communiquer entre eux sans intervention humaine. Les grandes entreprises gèrent aujourd'hui des dizaines, voire des centaines de serveurs MCP simultanément, et cette prolifération rapide a ouvert trois failles de sécurité majeures : absence de visibilité sur les outils déployés, incapacité des équipes de sécurité à réviser manuellement chaque composant au rythme des déploiements, et manque de journaux d'audit exigés par les cadres réglementaires. La réponse conjointe des deux groupes repose sur l'AI Registry, un projet open source soutenu par AWS, intégré à la plateforme Cisco AI Defense, qui automatise l'analyse de sécurité de chaque serveur MCP, agent IA et Agent Skill avant toute mise en production. L'impact concret est significatif pour les équipes de sécurité et les directions conformité. Actuellement, les processus de révision manuelle allongent chaque déploiement d'application IA de plusieurs semaines, créant un arriéré qui s'accumule à mesure que l'adoption de l'IA s'accélère. Avec ce système, dès qu'un nouveau composant est enregistré dans le registre centralisé, un scanner analyse automatiquement le code, les patterns de sécurité et les éventuelles vulnérabilités, puis génère un rapport détaillé. Si des problèmes sont détectés, le composant est immédiatement désactivé et marqué "security-pending", bloquant tout accès jusqu'à validation par un administrateur. Cette automatisation concerne aussi bien les serveurs MCP donnant accès à des bases de données que les agents A2A orchestrant des workflows complexes. Sur le plan réglementaire, les organisations s'exposaient auparavant à des sanctions sous les cadres SOX et RGPD faute de traçabilité suffisante sur les agents autonomes, une exposition que les équipes de conformité peinaient à quantifier. Cette initiative s'inscrit dans un contexte de montée en puissance rapide de l'IA agentique, qui transforme profondément les infrastructures d'entreprise. La prolifération non contrôlée de serveurs MCP et d'agents tiers représente un vecteur d'attaque croissant : du code malveillant ou des patterns non sécurisés peuvent s'introduire dans la chaîne d'approvisionnement logicielle sans qu'aucune revue manuelle ne puisse suivre le rythme. Akshay Bhargava, vice-président produit IA chez Cisco, souligne que ce partenariat vise à étendre la protection de niveau entreprise aux organisations de toute taille via les registres publics. Le marché de la sécurité pour l'IA agentique est encore naissant, et cette collaboration entre un géant du cloud et un leader du réseau envoie un signal fort : la gouvernance des agents IA devient un prérequis incontournable pour tout déploiement industriel sérieux.

UELes organisations européennes déployant des agents IA s'exposaient à des sanctions RGPD faute de traçabilité sur les agents autonomes ; cette solution automatise les journaux d'audit requis par la conformité européenne.

SécuritéActu
1 source
SAP Sapphire : l’entreprise autonome devient la nouvelle vision B2B de SAP
37Le Big Data 

SAP Sapphire : l’entreprise autonome devient la nouvelle vision B2B de SAP

Lors de SAP Sapphire 2026, l'éditeur allemand SAP a présenté sa nouvelle vision stratégique : transformer son ERP en une "entreprise autonome" capable d'exécuter des processus critiques de bout en bout grâce à l'IA. Le CEO Christian Klein a dévoilé trois piliers majeurs : SAP Autonomous Suite, qui déploie plus de 50 assistants Joule spécialisés coordonnant plus de 200 agents IA dans la finance, les achats, la supply chain, les RH et l'expérience client ; SAP Business AI Platform, qui fusionne SAP Business Technology Platform, SAP Business Data Cloud et SAP Business AI en un environnement unique ; et Joule Work, une interface orientée objectif accessible sur ordinateur, mobile et commandes vocales. Pour accélérer l'adoption, SAP annonce un fonds de 100 millions d'euros et une série de partenariats avec Anthropic, Amazon Web Services, Google Cloud, Microsoft, NVIDIA, Mistral AI et Cohere. Un cas concret a été mis en avant avec l'énergéticien RWE : des agents IA analysent des milliers d'incidents passés sur des éoliennes offshore pour identifier l'origine probable d'une panne et générer automatiquement des ordres de maintenance préremplis. L'enjeu central de cette annonce est de faire passer l'IA d'un rôle d'assistant à celui d'exécutant autonome au coeur des opérations d'entreprise. L'assistant dédié à la clôture financière illustre l'ambition : en automatisant les écritures comptables, les rapprochements et la correction d'erreurs, SAP promet de réduire un processus qui prenait plusieurs semaines à quelques jours seulement. Pour les grandes entreprises soumises à des exigences croissantes de productivité, de conformité réglementaire et de rapidité, c'est une promesse directement chiffrée en gains opérationnels. Le lancement de sept solutions Industry AI, avec des règles métiers et réglementaires propres à chaque secteur, signale que SAP ne vise plus seulement les directions IT mais les métiers eux-mêmes, qu'il s'agisse de l'énergie, de la logistique ou de la fabrication. Cette offensive s'inscrit dans une compétition frontale entre les grands éditeurs ERP pour la domination de l'IA d'entreprise, face à Oracle, Microsoft et Salesforce qui poursuivent des ambitions similaires. SAP capitalise sur sa position de référence dans les grandes organisations mondiales, où ses systèmes gèrent déjà les données les plus critiques : c'est précisément ce capital de confiance et de données que le groupe cherche à monétiser via l'IA autonome. Le SAP Knowledge Graph, couche qui structure les relations entre données, processus et entités métiers, est présenté comme le socle différenciateur qui donnera aux agents une compréhension contextuelle que des solutions génériques ne peuvent pas offrir. Les partenariats avec des fournisseurs de modèles souverains comme Mistral AI et Cohere indiquent également que SAP anticipe des exigences de conformité et de localisation des données, particulièrement fortes en Europe. La prochaine étape sera de valider ces promesses à grande échelle dans des déploiements réels, au-delà des cas pilotes présentés en conférence.

UESAP, leader européen des ERP, intègre Mistral AI dans sa plateforme et anticipe explicitement les exigences européennes de souveraineté et de localisation des données, avec un fonds de 100 millions d'euros ciblant l'adoption dans les grandes organisations, dont de nombreuses entreprises françaises et européennes déjà clientes.

💬 Les 50 assistants et les 200 agents, c'est du bruit. Ce qui compte, c'est le Knowledge Graph, cette couche qui structure 30 ans de données métiers dans des millions d'entreprises, et que personne d'autre ne peut reproduire du jour au lendemain. Le cas RWE sur les éoliennes, bon, c'est encore un pilote, mais c'est exactement là où SAP peut devenir difficile à contourner.

OutilsOutil
1 source
Amazon Finance automatise le traitement des demandes réglementaires grâce à l'IA générative sur AWS
38AWS ML Blog 

Amazon Finance automatise le traitement des demandes réglementaires grâce à l'IA générative sur AWS

Les équipes Finance Technology (FinTech) d'Amazon ont déployé un système automatisé de gestion des enquêtes réglementaires, construit sur Amazon Bedrock et plusieurs services AWS. Face à des milliers de documents à traiter, en formats PDF, Word, PowerPoint et CSV, et à des délais réglementaires stricts imposés par des autorités aux exigences très différentes selon les juridictions, les équipes ont développé une application basée sur la génération augmentée par récupération (RAG). Le coeur du système repose sur Amazon Bedrock Knowledge Bases couplé à Amazon OpenSearch Serverless pour le stockage vectoriel, Claude Sonnet 4.5 comme modèle de langage via l'API Converse Stream, et Amazon DynamoDB pour la gestion de l'historique des conversations. Chaque équipe FinTech maintient sa propre base de connaissances alimentée par ses documents spécifiques. Ce système change concrètement la façon dont des équipes internes traitent des demandes réglementaires complexes, qui nécessitent de croiser des milliers de précédents documentaires tout en maintenant le fil de conversations multi-tours sur plusieurs sessions. Avant cette solution, la fragmentation des connaissances entre différents systèmes d'infrastructure Amazon rendait la synthèse d'information lente et risquée. Désormais, les réponses sont contextuelles, s'appuient sur des données historiques précises, et s'affinent de manière itérative au fil des échanges. L'enjeu de conformité est central : une réponse inexacte ou basée sur une directive réglementaire obsolète peut exposer Amazon à des violations juridiques directes. La difficulté majeure que ce projet révèle est celle de l'observabilité des systèmes d'IA dans des contextes réglementés. Les équipes ont intégré OpenTelemetry et Langfuse en auto-hébergement pour monitorer en continu les décisions du modèle, détecter les hallucinations, c'est-à-dire les cas où le modèle génère des informations absentes des documents sources, et surveiller la dérive de précision dans le temps, inévitable à mesure que les prompts, les modèles et le corpus documentaire évoluent. Le choix de ne pas mettre en cache les réponses LLM est délibéré : les enquêtes réglementaires sont trop contextuelles pour bénéficier d'un cache, dont le taux d'utilisation serait trop faible pour justifier la complexité. Ce déploiement illustre une tendance croissante chez les grandes entreprises tech à internaliser leurs systèmes RAG sur des infrastructures cloud propriétaires, plutôt que de s'appuyer sur des solutions SaaS tierces, notamment pour garder le contrôle sur la traçabilité et la conformité des réponses générées.

UELes équipes techniques européennes confrontées aux enquêtes réglementaires (RGPD, AI Act) peuvent s'inspirer de cette architecture RAG multi-sources pour automatiser leur gestion de conformité.

OutilsActu
1 source
Conformité au règlement européen sur l'IA pour l'affinage de LLM sur Amazon SageMaker
39AWS ML Blog 

Conformité au règlement européen sur l'IA pour l'affinage de LLM sur Amazon SageMaker

Depuis le 2 août 2025, l'AI Act européen impose aux organisations qui affinent des grands modèles de langage (LLM) de mesurer précisément la quantité de calcul consommée, exprimée en opérations virgule flottante (FLOPs). L'enjeu est réglementaire : selon le volume de calcul utilisé, une entreprise peut basculer du statut d'utilisateur en aval, qui exploite un modèle existant, à celui de fournisseur de modèle à usage général (GPAI), avec des obligations légales beaucoup plus lourdes. Amazon Web Services a publié en réponse un outil open source, le Fine-Tuning FLOPs Meter, conçu pour s'intégrer directement dans les pipelines Amazon SageMaker AI. Le seuil de référence, dit "règle du tiers", est fixé à 3,3 x 10²² FLOPs par défaut, c'est-à-dire lorsque le calcul de pré-entraînement du modèle de base est inconnu ou inférieur à 10²³ FLOPs. Pour les modèles dont le pré-entraînement dépasse 10²³ FLOPs et dont le chiffre est documenté, le seuil devient 30 % du calcul original. À titre d'exemple concret, affiner Llama-3-70B, dont le pré-entraînement est estimé à au moins 1,5 x 10²⁴ FLOPs, déclenche un seuil de 4,5 x 10²³ FLOPs avant de devenir fournisseur GPAI. Ce changement réglementaire touche directement les équipes data et ML des entreprises européennes qui personnalisent des modèles pour des usages sectoriels, qu'il s'agisse de finance, de santé ou de services juridiques. Franchir le seuil oblige à fournir une documentation détaillée sur l'architecture du modèle, le processus d'entraînement et à respecter l'ensemble des obligations de transparence imposées aux fournisseurs GPAI, sous peine de sanctions. L'outil d'AWS permet de déterminer son statut de conformité avec un seul paramètre de configuration et génère automatiquement les documents d'audit nécessaires. Dans la pratique, la majorité des organisations appliquera le seuil par défaut, car les fournisseurs de modèles comme Meta ou Mistral ne publient pas toujours leurs FLOPs de pré-entraînement avec précision. L'AI Act, premier cadre réglementaire complet sur l'IA au monde, a progressivement élargi son périmètre depuis son adoption en 2024. La distinction entre utilisateur et fournisseur GPAI est au coeur des débats depuis que l'affinage à grande échelle s'est démocratisé grâce aux techniques comme LoRA ou QLoRA, qui permettent d'adapter des modèles de plusieurs dizaines de milliards de paramètres avec des ressources relativement modestes. Le seuil du tiers repose sur une analyse réglementaire selon laquelle consommer plus d'un tiers du calcul original transforme suffisamment le comportement du modèle pour créer, de fait, un nouveau système avec ses propres risques. Le positionnement d'AWS est stratégique : en intégrant la conformité directement dans son infrastructure managée, le cloud provider réduit la friction pour les entreprises européennes hésitant à adopter le fine-tuning par crainte des obligations légales.

UELes équipes ML des entreprises européennes qui affinent des LLMs doivent désormais mesurer leurs FLOPs pour déterminer si elles basculent au statut de fournisseur GPAI sous l'AI Act, avec des obligations de documentation et de transparence renforcées sous peine de sanctions.

💬 C'est le genre de truc qui va faire peur à plein d'équipes ML alors que la plupart n'ont rien à craindre : affiner un Llama-70B en LoRA sur quelques epochs, tu es encore très loin du seuil. Ce qui est malin chez AWS, c'est d'intégrer la conformité dans leur infra avant que les équipes légales des boîtes européennes leur bloquent le fine-tuning par précaution. Reste que si Meta ne publie pas ses FLOPs de pré-entraînement proprement, tout le monde travaille avec un seuil par défaut un peu arbitraire.

RégulationReglementation
1 source
Claude Platform arrive sur AWS Bedrock
40AWS ML Blog 

Claude Platform arrive sur AWS Bedrock

Anthropic a annoncé le 11 mai 2026 la disponibilité générale de Claude Platform on AWS, un nouveau service permettant aux clients Amazon Web Services d'accéder directement à la plateforme native d'Anthropic via leur compte AWS, sans avoir besoin de contrat séparé, de credentials distincts ni de relation de facturation indépendante. AWS devient ainsi le premier fournisseur cloud à proposer l'expérience native Claude Platform. Concrètement, les développeurs accèdent aux mêmes API et fonctionnalités que ceux qui passent directement par Anthropic : l'API Messages, Claude Managed Agents (en bêta), la recherche web, le connecteur MCP (en bêta), les Agent Skills (en bêta), l'exécution de code et l'API Files. L'authentification repose sur les credentials IAM existants d'AWS, la facturation s'effectue via AWS Marketplace à la consommation, et toute l'activité est tracée dans AWS CloudTrail. Ce lancement simplifie considérablement l'adoption de l'IA pour les équipes déjà ancrées dans l'écosystème AWS. Là où il fallait auparavant gérer des comptes distincts, des clés API séparées et des lignes budgétaires parallèles, tout se consolide désormais dans une seule console, un seul budget et un seul système d'audit. Les directions techniques et les équipes de conformité y trouvent un avantage immédiat : la traçabilité CloudTrail permet de superviser les usages de l'IA exactement comme n'importe quel autre service AWS. Pour les entreprises qui déploient des applications à grande échelle, la possibilité de segmenter les projets, les environnements et les équipes via des workspaces avec des politiques IAM granulaires représente un gain organisationnel significatif. Ce service s'inscrit dans une tendance de fond où les grands fournisseurs de modèles cherchent à réduire la friction d'adoption en s'intégrant dans les infrastructures cloud existantes plutôt qu'en imposant des écosystèmes parallèles. Anthropic propose déjà ses modèles Claude via Amazon Bedrock, mais Claude Platform on AWS va plus loin en donnant accès à la plateforme complète, y compris les fonctionnalités en bêta les plus récentes. Il convient de noter que le service est opéré par Anthropic et que les données sont traitées en dehors du périmètre de sécurité d'AWS, ce qui le positionne davantage pour les équipes sans exigences strictes de résidence régionale des données. La prochaine étape probable sera l'extension à d'autres fournisseurs cloud et l'intégration progressive des fonctionnalités bêta vers la disponibilité générale, consolidant ainsi la stratégie de distribution multicanal d'Anthropic.

UELes entreprises européennes hébergées sur AWS peuvent désormais accéder à Claude Platform directement depuis leur console AWS, mais les données étant traitées hors du périmètre sécurisé d'AWS, les acteurs soumis au RGPD devront vérifier la conformité avant toute adoption.

OutilsOutil
1 source
Claude sur AWS : toute la plateforme d'Anthropic
41Le Big Data 

Claude sur AWS : toute la plateforme d'Anthropic

Anthropic a annoncé ce 11 mai 2026 que l'intégralité de sa plateforme Claude est désormais accessible directement depuis Amazon Web Services, sous forme de disponibilité générale. Concrètement, les clients AWS peuvent désormais utiliser l'ensemble des fonctionnalités de l'API Claude, Claude Managed Agents pour déployer des agents IA à grande échelle, exécution de code Python via API, recherche web intégrée, et un système de Skills permettant à Claude d'apprendre des comportements ou méthodes de travail spécifiques, sans quitter leur environnement cloud habituel. L'intégration couvre l'authentification IAM, la facturation unifiée AWS, les audits via CloudTrail, et un accès immédiat aux nouvelles fonctionnalités au fil de leur sortie. Jusqu'ici, plusieurs capacités avancées de Claude restaient réservées à l'API native d'Anthropic. Pour les équipes techniques en entreprise, le gain est avant tout opérationnel : plus besoin de gérer des systèmes parallèles de connexion, de facturation ou de permissions. Cette simplification réduit la friction à l'adoption et abaisse la barrière d'entrée pour les organisations déjà investies dans AWS. Anthropic précise toutefois que le traitement des données sur cette plateforme s'effectue en dehors de l'infrastructure AWS classique, une nuance importante pour les entreprises soumises à des contraintes strictes de souveraineté ou de conformité. Pour celles-là, Anthropic maintient une offre distincte via Amazon Bedrock, où AWS reste l'opérateur principal et les données demeurent dans l'infrastructure Amazon, deux positionnements qui ciblent deux profils d'entreprises différents. Cette annonce s'inscrit dans une bataille industrielle plus large où les plateformes cloud sont devenues les principales portes d'entrée de l'IA générative. OpenAI pousse ChatGPT Enterprise, Google multiplie les intégrations Gemini dans son écosystème, Microsoft verrouille ses capacités IA dans Azure, et Anthropic devait muscler son jeu pour ne pas rester un fournisseur de modèles sans ancrage infrastructure. Le partenariat entre Anthropic et Amazon, qui s'est matérialisé par un investissement massif d'Amazon dans Anthropic ces dernières années, trouve ici une nouvelle expression concrète. En intégrant Claude profondément dans AWS, Anthropic gagne en distribution et en crédibilité enterprise, tandis qu'Amazon renforce l'attractivité de son cloud pour les projets IA. La prochaine étape sera de voir si cette intégration accélère effectivement l'adoption de Claude dans les grandes organisations, ou si la question non résolue de la localisation des données freinera les déploiements dans les secteurs les plus régulés.

UELes entreprises européennes sur AWS peuvent désormais accéder à l'ensemble de la plateforme Claude sans friction opérationnelle, mais le traitement des données hors infrastructure AWS standard soulève des questions de conformité pour les secteurs soumis aux exigences de souveraineté numérique de l'UE.

OutilsOpinion
1 source
Anthropic pourrait lever des fonds sur une valorisation record de 1000 milliards $
42Le Big Data 

Anthropic pourrait lever des fonds sur une valorisation record de 1000 milliards $

Anthropic prépare ce qui pourrait devenir la plus importante levée de fonds de l'histoire des entreprises technologiques privées. Selon le Financial Times et Reuters, la startup américaine envisage de lever jusqu'à 50 milliards de dollars dès l'été 2026, ce qui propulserait sa valorisation aux alentours de 900 milliards de dollars, voire au seuil symbolique de 1 000 milliards. Pour donner la mesure de cette trajectoire, le chiffre d'affaires annualisé d'Anthropic est passé de 1 milliard de dollars en janvier 2025 à 30 milliards en avril 2026, et devrait franchir le cap des 45 milliards dans les prochains mois, contre 9 milliards l'année précédente. Des fonds comme Lightspeed Venture Partners et General Catalyst seraient parmi les candidats à participer à l'opération. La startup, fondée en 2021 par d'anciens cadres d'OpenAI, est déjà soutenue financièrement par Amazon et Google. Cette valorisation potentielle placerait Anthropic devant OpenAI dans la hiérarchie des entreprises privées les mieux valorisées au monde, signalant un basculement dans la perception des investisseurs vis-à-vis de l'IA. Les fonds levés serviraient principalement à financer l'expansion de l'infrastructure cloud et des capacités de calcul nécessaires à l'entraînement des prochains modèles, dont le futur Mythos. Développer un modèle génératif de pointe exige des milliers de GPU spécialisés, des centres de données massifs et une consommation énergétique colossale, ce qui rend l'accès aux ressources matérielles aussi stratégique que la recherche elle-même. Cette dynamique pousse les investisseurs à traiter l'IA comme une infrastructure mondiale au même titre qu'Internet ou le cloud, justifiant des niveaux de capitalisation autrefois réservés aux géants industriels cotés en bourse. La montée en puissance d'Anthropic s'explique par plusieurs facteurs structurels. Sur le terrain professionnel, son assistant Claude gagne rapidement du terrain face à OpenAI, notamment auprès des développeurs via Claude Code, apprécié pour l'automatisation de tâches de programmation et d'analyse. L'entreprise bénéficie d'une réputation de fiabilité et de sécurité qui lui ouvre les portes des grandes entreprises. Pour sécuriser son accès aux puces et aux infrastructures nécessaires au déploiement de Mythos, Anthropic aurait signé des accords stratégiques avec Amazon Web Services, Google et le fabricant de semi-conducteurs Broadcom, cherchant à éviter les tensions d'approvisionnement qui paralysent déjà une partie du marché. La course aux ressources de calcul est désormais aussi déterminante pour l'avenir de l'IA que la qualité des modèles eux-mêmes.

UELa montée en puissance d'Anthropic comme concurrent crédible à OpenAI renforce la dépendance potentielle des entreprises et institutions européennes à des infrastructures d'IA américaines.

💬 30 milliards de revenus annualisés en quinze mois, c'est pas de la finance, c'est de la physique. Ce qui m'intéresse vraiment, c'est que Claude Code est cité comme moteur de croissance, et ça colle parfaitement avec ce que je vois au quotidien. La valorisation à 1 000 milliards suit, mais au fond c'est juste pour acheter des GPUs par milliers et de l'électricité, parce que c'est là que se joue la course maintenant.

BusinessActu
1 source
Amazon Bedrock AgentCore Payments : les agents IA peuvent désormais effectuer des transactions, avec Coinbase et Stripe
43AWS ML Blog 

Amazon Bedrock AgentCore Payments : les agents IA peuvent désormais effectuer des transactions, avec Coinbase et Stripe

Amazon a annoncé le 7 mai 2026 le lancement en préversion d'Amazon Bedrock AgentCore Payments, une nouvelle couche de fonctionnalités permettant aux agents d'intelligence artificielle d'accéder à des ressources payantes et de régler des transactions de manière autonome, en temps réel. Développée en partenariat avec Coinbase et Stripe, qui fournissent respectivement l'infrastructure de portefeuilles numériques et les rails de paiement, cette solution s'intègre nativement à la plateforme AgentCore d'AWS. Des entreprises comme Cox Automotive, Thomson Reuters et le PGA TOUR utilisent déjà AgentCore pour orchestrer des agents capables de raisonner et d'agir sur des flux de travail complexes. Avec cette annonce, ces mêmes agents peuvent désormais payer des flux de données en temps réel, des publications sous paywall, des serveurs MCP privés ou d'autres agents spécialisés, le tout au sein d'une seule boucle d'exécution. Les limites de dépenses sont configurées par session, et AgentCore gère l'authentification des identifiants, le cycle de vie des tokens et la négociation de protocoles de paiement comme x402, ACP ou MPP. Ce lancement représente un tournant concret pour les développeurs d'agents autonomes. Jusqu'ici, brancher un agent à des services payants exigeait de négocier des relations de facturation distinctes avec chaque fournisseur, de sécuriser les identifiants, de gérer la conformité réglementaire et d'écrire une logique d'orchestration sur mesure, soit plusieurs mois d'ingénierie avec des enjeux financiers réels à la clé. AgentCore Payments supprime cette friction : un agent de recherche financière peut payer à la volée un article de presse spécialisé ou un flux de données boursières, un agent de développement peut appeler un registre de packages privé ou un environnement d'exécution isolé sans que le développeur ait à câbler chaque relation commerciale manuellement. La gouvernance des dépenses et l'observabilité restent centralisées dans la même infrastructure que les autres actions de l'agent, ce qui réduit la surface d'erreur sur des flux qui, contrairement à une mauvaise réponse, déplacent de l'argent réel. Ce mouvement s'inscrit dans une tendance de fond : le déploiement à grande échelle d'agents capables non seulement de chercher et raisonner, mais aussi de consommer des services et d'effectuer des achats au nom des utilisateurs. Les premiers protocoles de paiement pour agents, notamment x402 d'Ethereum et d'autres standards émergents, restaient jusqu'ici expérimentaux et fragmentés. Amazon, en s'associant à Coinbase pour la couche crypto et à Stripe pour les paiements traditionnels, positionne AWS comme l'infrastructure centrale d'une économie agentique encore naissante. L'étape suivante annoncée est la capacité pour les agents de réserver des billets d'avion, des hôtels et d'effectuer des achats auprès de plateformes marchandes, ouvrant la voie à des agents commerciaux pleinement autonomes.

UELes développeurs européens devront composer avec les contraintes réglementaires (PSD2, RGPD) pour déployer des agents à capacité de paiement autonome, ce qui pourrait ralentir significativement l'adoption en Europe par rapport aux États-Unis.

💬 Brancher un paiement dans une boucle d'agent, jusqu'ici c'était plusieurs mois d'ingénierie rien que pour les credentials et la conformité. AWS compresse tout ça en une ligne de config, avec Stripe pour le classique et Coinbase pour la couche crypto, et c'est là que ça devient vraiment pratique pour qui orchestre des flux complexes. Reste que quand un agent se plante sur une réponse ça coûte rien, sur une transaction c'est une autre histoire.

OutilsOpinion
1 source
Sage et AWS veulent démocratiser l’IA agentique dans les PME
44Le Big Data 

Sage et AWS veulent démocratiser l’IA agentique dans les PME

Sage et AWS ont annoncé lors du salon Sage Future à San Francisco un renforcement significatif de leur partenariat stratégique, centré sur l'IA agentique à destination des petites et moyennes entreprises. L'accord porte sur quatre axes concrets : le développement de logiciels financiers cloud enrichis par l'IA, l'intégration des solutions Sage Developer sur Amazon Bedrock AgentCore, la distribution via AWS Marketplace, et l'accélération des migrations des outils de bureau vers le cloud. Concrètement, les agents IA de Sage automatiseront des tâches financières critiques : comptabilité fournisseurs, gestion de trésorerie, paie et rapports de conformité. Steve Hare, PDG de Sage, a résumé la philosophie du projet : "L'IA représente une opportunité majeure pour les PME, mais son adoption dépend avant tout de la confiance, des outils disponibles et de la simplicité d'intégration." Pour les PME, ce partenariat représente un changement de paradigme potentiellement significatif. Aujourd'hui, beaucoup d'entre elles s'appuient encore sur des logiciels financiers installés localement, difficiles à maintenir et inadaptés à l'IA moderne. L'enjeu n'est pas simplement de gagner du temps sur des tâches répétitives : il s'agit de permettre aux dirigeants d'accéder plus rapidement à des données financières fiables pour prendre de meilleures décisions. Via AWS Marketplace, les solutions de Sage pourront être déployées directement dans les environnements que les clients utilisent déjà, sans friction technique supplémentaire. Julia White, directrice marketing d'AWS, estime que les entreprises en croissance "ne devraient plus avoir à choisir entre simplicité et puissance technologique." Ce rapprochement s'inscrit dans une tendance de fond : selon l'International Data Corporation, les dépenses mondiales en IA devraient progresser de 31,9 % par an entre 2025 et 2029. Le marché sort de la phase expérimentale pour entrer dans un déploiement opérationnel à grande échelle, mais les PME restent à la traîne face aux coûts de modernisation et à la complexité des migrations cloud. En combinant l'expertise de Sage dans les logiciels financiers pour PME avec l'infrastructure d'AWS et la puissance de Bedrock AgentCore, les deux groupes cherchent à abaisser ces barrières. Le modèle ouvre également une opportunité aux éditeurs indépendants partenaires de Sage, qui pourront développer des applications compatibles avec AgentCore et les distribuer via la marketplace d'AWS sans reconstruire une infrastructure commerciale de zéro, ce qui pourrait accélérer l'émergence d'un écosystème d'outils financiers agentiques dédiés aux PME.

UESage étant largement déployé dans les PME françaises et européennes, ce partenariat pourrait accélérer la migration vers des logiciels comptables cloud avec IA agentique intégrée, réduisant concrètement les barrières techniques et financières pour les dirigeants de PME en France.

💬 Sage est déjà dans les compta de milliers de PME françaises, c'est ça qui rend l'annonce intéressante. Pas besoin de convaincre quelqu'un de changer d'outil, juste de lui glisser des agents dans ce qu'il utilise déjà. Reste à voir si la promesse "simple à intégrer" tient quand c'est le comptable d'une menuiserie de 12 personnes qui s'y colle.

OutilsOutil
1 source
Hapag-Lloyd utilise Amazon Bedrock pour transformer les retours clients en informations exploitables
45AWS ML Blog 

Hapag-Lloyd utilise Amazon Bedrock pour transformer les retours clients en informations exploitables

Hapag-Lloyd, l'un des leaders mondiaux du transport maritime de conteneurs, a déployé une solution d'analyse automatisée des retours clients basée sur Amazon Bedrock, le service d'IA générative d'AWS. L'armateur allemand, qui exploite une flotte de 313 porte-conteneurs représentant 2,5 millions d'EVP de capacité de transport, emploie environ 14 000 personnes dans son segment de lignes régulières et gère plus de 400 bureaux dans 140 pays. Son équipe d'ingénierie produit, répartie entre Hambourg et Gdańsk, pilote cette initiative dans le cadre d'une ambition plus large de devenir une entreprise dite "AI-native". Le système s'appuie sur Amazon Bedrock, LangChain et LangGraph, ainsi qu'Elasticsearch pour collecter les commentaires clients, en extraire le sentiment, identifier des thèmes récurrents et produire des synthèses exploitables. L'enjeu est d'abord opérationnel : avant cette solution, les chefs de produit exportaient manuellement des fichiers CSV toutes les deux semaines, parcouraient des centaines de commentaires et les catégorisaient à la main, un travail qui pouvait mobiliser plusieurs heures, parfois plusieurs jours, avant chaque réunion de revue produit. Désormais, l'ensemble de ce flux est automatisé, de l'ingestion des données à la production d'insights. Les équipes peuvent ainsi se concentrer sur la stratégie et l'innovation plutôt que sur l'analyse répétitive. Pour une entreprise qui relie plus de 600 ports via 133 lignes régulières mondiales et traite un volume massif d'interactions clients, la capacité à lire rapidement les signaux du terrain constitue un avantage concurrentiel direct sur la qualité de service et la réactivité produit. Cette transformation s'inscrit dans une dynamique plus large de l'industrie du shipping, où la digitalisation s'accélère sous la pression de la concurrence et des attentes croissantes des chargeurs. Hapag-Lloyd a construit sa capacité sur une stack technologique qu'il maîtrise en propre, ce qui lui a permis d'itérer rapidement vers des usages d'IA générative sans dépendance contraignante. Le choix d'Amazon Bedrock est également révélateur : le service donne accès via une API unifiée aux modèles d'Anthropic, Meta, Mistral, DeepSeek et d'autres, avec des garanties de sécurité et de confidentialité adaptées aux exigences d'un groupe coté en bourse. À mesure que d'autres armateurs et acteurs logistiques adoptent des approches similaires, la capacité à transformer le feedback client en décisions produit en temps quasi réel pourrait devenir un standard du secteur plutôt qu'un avantage différenciant.

UEHapag-Lloyd, armateur allemand coté en bourse avec ses équipes à Hambourg et Gdańsk, automatise l'analyse de ses retours clients via Amazon Bedrock, signalant l'accélération de l'IA générative dans la logistique maritime européenne.

OutilsOutil
1 source
Amazon Bedrock AgentCore Browser : actions au niveau du système d'exploitation
46AWS ML Blog 

Amazon Bedrock AgentCore Browser : actions au niveau du système d'exploitation

Amazon a annoncé cette semaine l'ajout des OS Level Actions à AgentCore Browser, son environnement de navigation isolé et sécurisé disponible dans la plateforme Bedrock. Cette nouvelle capacité est accessible via l'API InvokeBrowser sans configuration supplémentaire pour les sessions existantes comme pour les nouvelles. Elle expose huit actions réparties en trois catégories : contrôle de la souris (clics, positionnement), saisie clavier (touches, raccourcis) et capture visuelle (screenshot plein écran en PNG encodé base64). Le principe de fonctionnement repose sur une boucle action-screenshot-réaction : l'agent exécute une action, capture l'état de l'écran, l'envoie à un modèle de vision pour décider de la prochaine étape, et recommence. Chaque appel API transporte une seule action identifiée par son type et ses arguments, et renvoie un statut SUCCESS ou FAILED lié à la session via l'en-tête x-amzn-browser-session-id. Ce lancement répond à une limite structurelle des outils d'automatisation web actuels. Playwright et le Chrome DevTools Protocol (CDP) opèrent exclusivement dans la couche DOM du navigateur : ils ne voient pas, et ne peuvent donc pas interagir avec, tout ce que le système d'exploitation génère en dehors de cette couche. Les boîtes de dialogue natives comme les demandes d'impression (window.print()), les invites de sécurité Windows ou macOS, les sélecteurs de certificats ou encore les menus contextuels sont totalement invisibles pour CDP. Pour les agents dotés de vision, ce blocage était particulièrement frustrant : le modèle pouvait observer précisément ce qu'il fallait faire sur le screenshot, mais n'avait aucun mécanisme pour agir. Les OS Level Actions comblent exactement ce vide en donnant à l'agent un contrôle direct au niveau du bureau complet, pas seulement du contenu web. Cette annonce s'inscrit dans la montée en puissance des agents d'automatisation web déployés en production, où les workflows réels font surface à des états applicatifs imprévisibles que les tests ne reproduisent pas. La couche DOM est suffisante dans la majorité des scénarios, mais les cas limites, configuration OS spécifique, permissions utilisateur, applications hybrides web-natif, se produisent régulièrement à l'échelle. Amazon positionne AgentCore Browser comme une infrastructure complète pour les agents autonomes, capable de gérer aussi bien le web standard que les interfaces natives du système. L'intégration dans Bedrock suggère que cette fonctionnalité sera prochainement exploitée par des agents construits avec d'autres services de la plateforme, notamment les modèles Claude d'Anthropic disponibles via Bedrock, qui disposent déjà de capacités d'utilisation d'outils et de vision avancées.

OutilsOutil
1 source
Amazon Bedrock AgentCore Identity permet de sécuriser des agents IA sur Amazon ECS
47AWS ML Blog 

Amazon Bedrock AgentCore Identity permet de sécuriser des agents IA sur Amazon ECS

Amazon a lancé AgentCore Identity, un service intégré à Amazon Bedrock, conçu pour sécuriser l'accès des agents d'intelligence artificielle aux services externes. Disponible en tant que service autonome, il s'intègre aux principales plateformes de calcul d'AWS, Amazon ECS, Amazon EKS, AWS Lambda, ainsi qu'aux environnements on-premises. La solution s'appuie sur deux protocoles standards : OAuth 2.0 (RFC 6749) pour l'autorisation des actions, et OpenID Connect (OIDC) pour l'authentification des utilisateurs. Le flux retenu est l'Authorization Code Grant, dit « 3-legged OAuth » : l'utilisateur s'authentifie auprès d'un fournisseur d'identité comme Microsoft Entra ID, donne son consentement explicite, et l'application échange un code d'autorisation contre un jeton d'accès à portée limitée. Ce jeton est ensuite conservé dans le coffre-fort de tokens d'AgentCore Identity, lié à l'identité précise de l'utilisateur, créant ainsi une chaîne d'audit traçable de l'authentification jusqu'à l'action de l'agent. Ce mécanisme répond à un problème concret et croissant en production : comment empêcher un agent IA d'agir au-delà de ce que l'utilisateur a expressément autorisé. AgentCore Identity introduit un « session binding » applicatif qui protège contre les attaques CSRF et les attaques par substitution de navigateur, deux vecteurs courants dans les flux OAuth mal implémentés. Chaque token est scopé à une session utilisateur individuelle, suivant le principe du moindre privilège : l'agent ne peut accéder qu'aux ressources pour lesquelles le consentement a été donné. La séparation des responsabilités entre le workload agent et le service de session binding permet en outre de réduire la surface d'attaque et de centraliser la gestion du cycle de vie des tokens, sans que l'application principale n'ait à gérer ce risque directement. La mise en production de cette architecture illustre une tendance de fond dans l'industrie cloud : les agents IA autonomes ne peuvent plus fonctionner sur la base de credentials statiques ou de permissions trop larges. AWS propose ici une implémentation de référence déployée sur Amazon ECS derrière un Application Load Balancer, avec chiffrement HTTPS via AWS Certificate Manager et routage DNS via Amazon Route 53. Le code source complet est disponible sur GitHub. Pour les équipes qui construisent des agents agissant pour le compte d'utilisateurs réels, assistants, automatisations, workflows délégués, cette approche standardisée autour d'OIDC et OAuth 2.0 constitue désormais une baseline de sécurité incontournable, d'autant qu'elle s'appuie sur des fournisseurs d'identité existants plutôt que de réinventer une gestion des identités propriétaire.

UELes équipes européennes déployant des agents IA sur AWS disposent d'une baseline de sécurité standardisée qui facilite la conformité RGPD grâce au consentement explicite, à la traçabilité des accès et au principe du moindre privilège.

SécuritéOutil
1 source
Le procès Musk contre Altman, et l'IA au service de la démocratie
48MIT Technology Review 

Le procès Musk contre Altman, et l'IA au service de la démocratie

Le procès opposant Elon Musk à Sam Altman, fondateur d'OpenAI, est entré dans sa deuxième semaine devant un tribunal californien. Musk, qui a cofondé OpenAI en 2015 avant de quitter son conseil d'administration en 2018, accuse Altman de l'avoir induit en erreur sur la transformation de l'organisation à but non lucratif en entreprise commerciale. La journaliste Michelle Kim du MIT Technology Review, elle-même avocate, a suivi les audiences quotidiennement et rapporte que la première semaine a livré des détails inédits sur le fonctionnement interne d'OpenAI ainsi que sur la relation entre les deux hommes. En parallèle, le Pentagone a annoncé des contrats de grande ampleur avec Microsoft, Nvidia, Amazon Web Services et la start-up Reflection AI pour des travaux d'intelligence artificielle sur données classifiées, dans le cadre d'une ambition affichée de faire des forces américaines une puissance "IA en premier". Sur un autre front, Musk a conclu un accord avec la SEC, acceptant de payer une amende de 1,5 million de dollars pour avoir tardé à déclarer ses achats initiaux d'actions Twitter en 2022. Ces développements simultanés illustrent la tension croissante autour du contrôle de l'IA à plusieurs échelles. Le procès Musk-Altman soulève une question fondamentale pour toute l'industrie : peut-on engager des capitaux dans une organisation à but non lucratif et la voir se muer en entreprise valorisée à plusieurs centaines de milliards sans recours juridique ? L'issue du procès pourrait redéfinir les règles de gouvernance applicables aux futures transformations de structures similaires. Les contrats du Pentagone, qui excluent Anthropic, repositionnent Microsoft, Nvidia et AWS comme piliers de l'IA militaire américaine, un signal structurant pour l'ensemble du secteur. Pendant ce temps, un tribunal chinois a établi un précédent notable : une entreprise ne peut pas licencier des salariés au seul motif de les remplacer par des outils d'IA, une décision qui résonne dans un secteur mondial où la pression à l'automatisation ne cesse de s'intensifier. Ce cycle d'actualité dense reflète l'accélération des enjeux de gouvernance de l'IA sur tous les fronts à la fois. La genèse du procès remonte à la décision d'OpenAI, en 2019, de créer une entité commerciale pour lever des capitaux, une évolution que Musk conteste aujourd'hui en justice. Parallèlement, la Maison Blanche travaillerait à la création d'un groupe de travail chargé d'évaluer les modèles d'IA avant leur diffusion publique, signe que Washington cherche à encadrer un secteur qui échappe encore à toute régulation fédérale cohérente. Des chercheurs s'interrogent également sur l'émergence des "scientifiques artificiels", des systèmes d'IA capables de conduire des projets de recherche de manière autonome : une perspective aux possibilités immenses, mais qui soulève des inquiétudes sur l'appauvrissement de la diversité scientifique si ces outils convergent tous vers les mêmes priorités de recherche.

UELe précédent chinois interdisant les licenciements motivés uniquement par le remplacement par l'IA alimente directement le débat européen sur la protection des travailleurs face à l'automatisation, un angle encore insuffisamment couvert par l'AI Act.

RégulationReglementation
1 source
AgentCore Optimization : AWS lance une boucle d'amélioration des performances des agents
49AWS ML Blog 

AgentCore Optimization : AWS lance une boucle d'amélioration des performances des agents

Amazon a annoncé le lancement en préversion d'AgentCore Optimization, une nouvelle fonctionnalité intégrée à sa plateforme Amazon Bedrock AgentCore. Cette brique complète ce qu'Amazon appelle la boucle "observer, évaluer, améliorer" pour les agents IA en production. Concrètement, le système analyse automatiquement les traces de production, génère des recommandations d'optimisation pour les prompts système ou les descriptions d'outils, puis propose deux mécanismes de validation : l'évaluation par lot sur des jeux de données prédéfinis, et les tests A/B en conditions réelles via AgentCore Gateway, avec découpage du trafic en production à un pourcentage configurable et résultats assortis d'intervalles de confiance et de signification statistique. NTT DATA, partenaire annoncé lors du lancement, indique que des processus qui nécessitaient auparavant plusieurs semaines d'ajustement manuel de prompts peuvent désormais s'exécuter en cycles rapides et reproductibles. L'enjeu est de taille pour les équipes produit qui déploient des agents IA : la qualité d'un agent se dégrade silencieusement à mesure que les modèles évoluent, que le comportement des utilisateurs change, et que les prompts sont réutilisés dans des contextes imprévus. Jusqu'ici, la remédiation reposait entièrement sur l'intuition du développeur, lire des traces, formuler une hypothèse, réécrire le prompt, tester quelques cas, déployer, un cycle qui introduit souvent de nouveaux problèmes en corrigeant les anciens. AgentCore Optimization remplace cette boucle artisanale par un processus systématique fondé sur les données : les recommandations sont générées à partir des traces réelles et validées avant tout déploiement, éliminant la part de pari inhérente aux corrections en aveugle. Amazon Bedrock AgentCore, déjà utilisé par des milliers de développeurs pour construire des agents capables de raisonner et d'agir dans des workflows complexes, s'enrichit ainsi d'une couche d'amélioration continue qui manquait jusqu'à présent à l'écosystème. Les grandes équipes disposent certes d'équipes scientifiques dédiées et de benchmarks centralisés, mais ces dispositifs fonctionnent sur des cycles hebdomadaires ou mensuels, pendant que les agents dérivent en production chaque jour. En intégrant la traçabilité OpenTelemetry, les évaluateurs built-in (taux de succès, précision de sélection d'outils, sécurité), et la possibilité de simuler des jeux de données via un acteur LLM jouant le rôle de l'utilisateur final, Amazon positionne AgentCore comme une plateforme complète pour industrialiser l'optimisation des agents, une capacité qui pourrait devenir un critère de choix déterminant face à des concurrents comme Google Vertex AI ou Microsoft Azure AI Foundry.

UELes équipes européennes déployant des agents IA sur Amazon Bedrock peuvent désormais automatiser l'optimisation de leurs prompts et outils, réduisant des cycles d'ajustement manuel qui duraient plusieurs semaines à des itérations rapides et reproductibles.

OutilsOutil
1 source
Le Pentagone choisit ses nouveaux fournisseurs IA et exclut Anthropic… enfin presque
50Next INpact 

Le Pentagone choisit ses nouveaux fournisseurs IA et exclut Anthropic… enfin presque

Le Pentagone a signé fin avril 2026 des accords avec huit fournisseurs de modèles d'intelligence artificielle pour déployer leurs technologies dans des opérations militaires classifiées. Les entreprises retenues sont OpenAI, Google, Microsoft, Amazon Web Services, NVIDIA, Oracle, SpaceX via sa filiale xAI, et Reflection. Ces contrats couvrent deux niveaux de classification : l'IL6, équivalent du « secret défense », et l'IL7, réservé aux données encore plus sensibles liées aux opérations en cours. Concrètement, ces IA seront mobilisées pour l'analyse de renseignement, la planification d'opérations et l'aide à la prise de décision en temps réel. Une entreprise brille par son absence : Anthropic, pourtant l'un des acteurs les plus avancés du secteur, a été écarté de ces accords. Cette sélection marque une accélération majeure de l'intégration de l'IA dans l'appareil militaire américain, avec des implications industrielles et éthiques immédiates. Chez Google, l'accord signé le 27 avril a provoqué une fronde interne : plus de 560 employés ont adressé une lettre ouverte à Sundar Pichai, réclamant que l'entreprise refuse tout contrat impliquant des opérations classifiées. « La seule façon de garantir que Google ne soit pas associé à de tels dommages est de refuser tout travail sur des projets classifiés », écrivent les signataires. Kent Walker, président des affaires juridiques d'Alphabet, a répondu sans ambiguïté dans un mémo interne, affirmant que Google travaillait « avec fierté » avec le ministère de la Défense depuis ses débuts et que soutenir la sécurité nationale de manière « réfléchie et responsable » restait une priorité de l'entreprise. Le cas Anthropic illustre les tensions profondes entre les exigences du Pentagone et les garde-fous éthiques des labs d'IA. Le DoD utilisait pourtant les modèles Claude depuis 2024, dans des opérations sensibles : ils auraient notamment contribué à la capture de Nicolas Maduro le 3 janvier, et aux premières opérations militaires liées au conflit israélo-iranien. Mais Anthropic a posé des conditions, refusant notamment que sa technologie serve à la surveillance de masse de citoyens américains ou à des armes entièrement autonomes. Le DoD, peu enclin à se laisser imposer des contraintes par un fournisseur, a alors désigné Anthropic « fournisseur à risque », une première pour une entreprise américaine, assimilée à une menace pour la chaîne d'approvisionnement nationale. L'affaire s'est depuis enlisée devant les tribunaux. Le lancement de Mythos par Anthropic début avril semble avoir légèrement rouvert la porte : le directeur technique du DoD, Emil Michael, reconnaît qu'Anthropic reste un risque d'approvisionnement tout en laissant entendre que la situation pourrait évoluer.

UEL'accélération de l'IA militaire classifiée aux États-Unis risque de relancer les débats européens sur une doctrine IA-défense propre et sur les limites que l'AI Act pourrait imposer aux applications militaires des modèles d'IA.

💬 Anthropic dit non à la surveillance de masse et aux armes autonomes, et se retrouve officiellement sur liste noire du Pentagone. C'est sans doute le premier lab à perdre un gros contrat sur des principes éthiques, pas juste à en parler depuis une scène de conférence. Ça va leur coûter cher, et c'est pourtant le seul truc crédible qu'on ait vu depuis longtemps dans ce secteur.

BusinessReglementation
1 source

Suivre AWS en continu

Recevez chaque jour les articles essentiels du sujet. Pas de bruit, pas de spam.

Recevez l'essentiel de l'IA chaque jour