OutilsAWS ML Blog6sem· 2 min de lecture

Construire une solution d'observabilité d'entreprise pour Amazon QuickSight

Amazon Web Services propose une architecture de référence pour centraliser l'observabilité d'Amazon Q, sa plateforme d'IA générative d'entreprise. La solution, publiée par AWS, agrège les données opérationnelles issues de deux sources principales : les journaux CloudWatch Vended Logs, qui capturent les conversations, les retours utilisateurs, la consommation des agents et le stockage d'index, ainsi que les événements AWS CloudTrail, qui enregistrent toutes les actions effectuées par les utilisateurs et les services sur la plateforme. Ces données transitent via des filtres d'abonnement CloudWatch vers des flux Amazon Data Firehose, sont transformées par des fonctions AWS Lambda, puis stockées dans un data lake sécurisé sur Amazon S3. Le tout est chiffré au repos via une clé AWS KMS gérée par le client avec rotation automatique. Les équipes d'administration peuvent ensuite interroger ce lac de données avec Amazon Athena, visualiser les métriques dans un tableau de bord QuickSight, ou poser des questions en langage naturel à un agent conversationnel Amazon Q personnalisé. Le déploiement s'appuie sur AWS CDK et requiert Python 3.9 minimum, Node.js 20 et AWS CLI V2.

Pour les organisations qui déploient Amazon Q à grande échelle, cette solution répond à un besoin concret : obtenir une vue unifiée de l'adoption, de la satisfaction des utilisateurs, des coûts et de la gouvernance depuis un seul tableau de bord. Sans cela, les données sont éparpillées entre plusieurs services AWS et deviennent rapidement inexploitables à l'échelle de centaines ou milliers d'utilisateurs. La protection des données sensibles est intégrée dès la collecte via des politiques de masquage dans CloudWatch, capables de détecter et anonymiser automatiquement des clés privées, informations financières, données personnelles ou de santé. AWS Lake Formation apporte en complément un contrôle fin des accès au niveau des tables et des colonnes.

Amazon Q s'est imposé comme la réponse d'AWS au déploiement d'IA générative en entreprise, en intégrant dans un seul produit des espaces collaboratifs, des agents conversationnels, des flux automatisés, des outils de recherche et des capacités de business intelligence via QuickSight. Mais la croissance de ces déploiements a mis en évidence un angle mort : l'absence d'outil natif pour piloter l'usage à l'échelle. Cette architecture d'observabilité comble ce manque en s'appuyant entièrement sur des services AWS managés, sans infrastructure supplémentaire à maintenir. Elle s'inscrit dans une tendance plus large où les plateformes d'IA d'entreprise doivent désormais justifier leur ROI avec des métriques d'usage précises, répondre aux exigences d'audit réglementaire, et permettre aux directions métier de piloter les investissements IA en temps réel.

Dans nos dossiers

AWS

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost

Construire un pipeline complet d'observabilité et d'évaluation Langfuse pour le traçage, la gestion des prompts, le scoring et les expériences

Langfuse, plateforme open-source d'ingénierie LLM, propose un pipeline complet couvrant quatre dimensions critiques du développement d'applications à base de grands modèles de langage : le tracing des appels, la gestion centralisée des prompts, le scoring d'évaluation et les expérimentations sur datasets. Le tutoriel publié cette semaine détaille une implémentation complète, compatible aussi bien avec l'API OpenAI (notamment le modèle gpt-4o-mini) qu'avec un LLM déterministe simulé, permettant à tout développeur d'explorer chaque fonctionnalité sans dépendre d'un accès payant. L'intégration commence par la connexion au client Langfuse via des clés d'authentification publique et secrète (formats pk-lf- et sk-lf-), avec support des régions EU, US et des instances auto-hébergées. Le pipeline instrumente ensuite des fonctions Python simples puis un mini-pipeline RAG (Retrieval-Augmented Generation), en attachant à chaque appel LLM des métadonnées de trace, un modèle, des paramètres de température et des identifiants de prompt. Pour les équipes qui développent des produits IA en production, cette approche résout un problème central : la boîte noire des LLMs. Avec Langfuse, chaque génération devient observable, chaque prompt est versionné et centralisé, et chaque réponse peut recevoir un score d'évaluation automatique ou humain. Cela permet de détecter les régressions de qualité entre versions de prompts, de comparer les performances de différents modèles sur un même dataset, et de construire une boucle d'amélioration continue documentée. Les équipes produit et ML gagnent une visibilité structurée sur ce qui se passe réellement à l'intérieur de leurs pipelines, ce qui est aujourd'hui l'un des manques les plus critiques dans le déploiement d'applications LLM à l'échelle. Langfuse s'inscrit dans un écosystème en pleine structuration autour de l'observabilité LLM, aux côtés de solutions comme LangSmith (LangChain), Weights & Biases Weave ou Helicone. Sa différenciation principale repose sur son caractère open-source et la possibilité de l'auto-héberger, ce qui répond directement aux contraintes de conformité et de souveraineté des données des entreprises européennes. La montée en maturité de ces outils reflète un tournant dans l'industrie : les LLMs ne sont plus des prototypes à évaluer manuellement, mais des composants de production qui exigent la même rigueur d'ingénierie que n'importe quel service critique. L'intégration native avec le SDK OpenAI via un simple remplacement d'import facilite une adoption progressive, sans refonte d'architecture, ce qui devrait accélérer son adoption dans des stacks existantes.

UELangfuse étant open-source et auto-hébergeable, les entreprises européennes peuvent l'adopter en respectant leurs contraintes RGPD et de souveraineté des données, sans dépendre d'infrastructures américaines.

OutilsOutil

1 source

2InfoQ AI

Construction d'un serveur MCP sécurisé sur AWS pour une plateforme B2B d'un million d'entreprises

Shadi Elyafi, ingénieur logiciel, a publié un retour d'expérience détaillé sur la construction d'un serveur MCP (Model Context Protocol) sécurisé sur AWS, destiné à exposer une plateforme d'intelligence B2B à un client LLM. La plateforme en question agrège les profils de plus d'un million d'entreprises, et l'objectif était de permettre à un utilisateur de formuler des requêtes en langage naturel du type « trouve des entreprises SaaS en Allemagne avec 50 à 200 employés » et d'obtenir des résultats directement dans son interface LLM, sans passer par une API classique. L'enjeu central de ce projet n'était pas fonctionnel mais sécuritaire : comment ouvrir un accès LLM à des données de production sensibles sans créer une passerelle dangereuse ? Un modèle de langage branché directement sur une base de données réelle peut, en théorie, être manipulé pour extraire des données non autorisées, contourner des filtres, ou générer des requêtes destructrices. La conception du serveur MCP devait donc intégrer des garde-fous robustes, une gestion fine des autorisations et une isolation claire entre la logique d'inférence et les données métier. Ce type d'architecture reflète une tendance croissante dans l'industrie : intégrer les outils MCP dans des environnements cloud d'entreprise pour donner aux LLM un accès structuré à des systèmes internes. Anthropic a défini le protocole MCP en fin 2024, et son adoption en contexte B2B s'accélère depuis. Les plateformes de données d'entreprise sont particulièrement concernées, car elles concentrent des informations concurrentielles à haute valeur, ce qui rend la question de la sécurisation de ces ponts LLM-production critique pour toute organisation qui souhaite tirer parti de l'IA générative en production.

OutilsOutil

1 source

3AWS ML Blog

Amazon Bedrock AgentCore Observability : déboguer les agents en production

Amazon vient de détailler le fonctionnement d'AgentCore Observability, un outil intégré à sa plateforme Bedrock destiné à déboguer les agents d'intelligence artificielle en production. Contrairement aux applications traditionnelles qui génèrent des erreurs explicites, les agents IA échouent souvent en silence : ils peuvent retourner des réponses plausibles mais incorrectes, entrer dans des boucles de raisonnement infinies, ou sélectionner de mauvais outils sans déclencher la moindre alerte. AgentCore Observability répond à ce problème en exposant trois couches d'instrumentation : des métriques agrégées, des traces d'exécution pas à pas, et des journaux structurés. L'outil permet de suivre chaque étape de raisonnement de l'agent, d'inspecter les appels d'outils, et de localiser précisément où l'exécution dévie des attentes, même en l'absence d'erreur explicite. Le service s'appuie sur Amazon CloudWatch et nécessite l'activation de la fonctionnalité CloudWatch Transaction Search. L'enjeu est considérable pour les équipes qui déploient des agents en production : jusqu'ici, un monitoring classique pouvait afficher 100 % de succès d'exécution pendant que les utilisateurs recevaient de fausses informations. AWS identifie trois grandes familles de défaillances. Les problèmes de qualité regroupent les hallucinations, les erreurs factuelles, et les erreurs de raisonnement : un agent peut citer des politiques inexistantes ou répéter un calcul erroné. Dans les architectures multi-agents, ces erreurs se propagent en cascade lorsque la sortie d'un agent alimente l'entrée d'un autre. Les problèmes de fiabilité couvrent les échecs d'appels d'outils (erreurs 401, 403, 400), les pertes de contexte de session, et les workflows incomplets. Enfin, les problèmes d'efficacité affectent les coûts et les performances sans nécessairement compromettre l'exactitude : latence excessive, consommation de tokens gonflée par des réponses trop verbeuses ou des appels d'outils répétés faute de mise en cache. Ce lancement s'inscrit dans la course que mènent les grands fournisseurs cloud pour rendre les agents IA opérationnellement viables en entreprise. AWS, Microsoft Azure et Google Cloud investissent massivement dans des couches d'observabilité spécifiques aux LLMs, un segment qui n'existait pas il y a deux ans. La complexité croissante des architectures agentiques, où plusieurs modèles coopèrent et s'enchaînent, rend l'observabilité traditionnelle insuffisante. AgentCore Observability est présenté comme une première partie d'une série en deux volets : une seconde publication couvrira l'optimisation des performances et la gestion de la mémoire. La direction prise par AWS suggère que l'outillage autour des agents autonomes va devenir un différenciateur clé des plateformes cloud dans les prochains mois.

UELes entreprises européennes déployant des agents IA sur AWS Bedrock peuvent adopter immédiatement cet outil pour détecter les défaillances silencieuses en production, un manque opérationnel réel pour les équipes MLOps.

OutilsOutil

1 source

4AWS ML Blog

Amazon Quick : accélérer le chemin des données d'entreprise vers les décisions assistées par IA

Amazon vient d'annoncer cinq nouvelles fonctionnalités pour Amazon Quick, sa plateforme d'analyse de données propulsée par l'IA, pensées pour les grandes entreprises qui gèrent des dizaines de millions de lignes de données réparties sur de multiples domaines métier. La fonctionnalité phare, Dataset Q&A, permet à n'importe quel utilisateur de poser une question en langage naturel directement sur ses datasets et d'obtenir une réponse en quelques secondes, sans passer par un analyste ni attendre la création d'un tableau de bord sur mesure. Le système génère automatiquement du SQL, l'exécute sur l'intégralité des données sans échantillonnage, et renvoie un résultat chiffré accompagné d'une explication complète de la logique utilisée : requête SQL générée, filtres appliqués, hypothèses formulées, et résumé en langage courant pour les non-techniciens. Le programme AWS Technical Field Communities a déjà mis cette approche en pratique : la précision des requêtes a progressé de plus de 48 %, et le temps de résolution est passé de 90 minutes à moins de 5 minutes pour une communauté de plus de 15 000 membres. Ce que change Amazon Quick, c'est l'élimination du goulet d'étranglement humain qui ralentit habituellement la prise de décision en entreprise. Lorsqu'un dirigeant veut savoir comment évolue le taux de désabonnement d'un produit, la réponse nécessite aujourd'hui soit un tableau de bord préexistant, soit une requête manuelle par un analyste, soit l'attente d'un ticket résolu en heures, voire en jours. En rendant l'accès aux données aussi direct que poser une question, Amazon Quick réduit ce délai à quelques secondes tout en préservant la gouvernance : les politiques de sécurité au niveau des lignes et des colonnes déjà configurées s'appliquent automatiquement aux requêtes générées par l'IA, sans configuration supplémentaire. L'utilisateur ne voit que ce qu'il est autorisé à voir, peu importe la formulation de sa question. Amazon Quick s'inscrit dans une tendance de fond qui voit les grands fournisseurs cloud chercher à démocratiser l'accès aux données d'entreprise via des interfaces conversationnelles. Face à des concurrents comme Microsoft Fabric avec Copilot ou Google Looker Studio, Amazon mise sur la fiabilité et l'auditabilité des réponses, deux points critiques pour les grandes organisations soumises à des exigences réglementaires strictes. Le défi technique central n'est pas la génération de SQL, mais la résolution des ambiguïtés sémantiques : quand un utilisateur parle de "croissance", entend-il des transactions, des clients, du revenu ou des unités vendues ? La fonctionnalité d'enrichissement sémantique permet aux équipes data de codifier les définitions métier directement dans les métadonnées des datasets, afin que l'IA réponde selon le vocabulaire réel de l'organisation plutôt qu'une interprétation approximative des noms de colonnes.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic