Aller au contenu principal
PwC extrait des informations contractuelles grâce à l'annotation IA sur AWS
OutilsAWS ML Blog6sem· 2 min de lecture

PwC extrait des informations contractuelles grâce à l'annotation IA sur AWS

Source originale ↗·

PwC a développé une solution d'intelligence artificielle baptisée AIDA (AI-Driven Annotation), déployée sur les services cloud d'Amazon Web Services, pour automatiser l'analyse de contrats juridiques et commerciaux. Conçue en collaboration avec les équipes internes du cabinet, cette plateforme combine des modèles de langage de grande taille (LLM) avec des workflows d'extraction automatisés afin de transformer des documents non structurés en données consultables et réutilisables. Concrètement, AIDA offre trois fonctionnalités principales : l'extraction basée sur des modèles personnalisables, un système de questions-réponses en langage naturel à l'échelle d'un seul document, et une interrogation globale sur des milliers de contrats en parallèle. Dans les déploiements clients déjà réalisés, la solution a permis de réduire le temps de relecture manuelle des contrats jusqu'à 90 %, et un grand studio de cinéma et de télévision a vu son temps de recherche de droits chuter de 90 % également.

Pour les équipes juridiques, de conformité et d'achats, l'enjeu est considérable. Aujourd'hui, la majorité des entreprises s'appuient encore sur des recherches par mots-clés ou des systèmes de gestion contractuelle classiques, qui peinent à traiter des volumes importants de documents avec une précision constante. AIDA change cette équation en permettant à un utilisateur de poser une question en français ou en anglais sur une clause précise, et d'obtenir une réponse contextuelle assortie de citations directement liées aux passages sources. Cette capacité à interroger simultanément des milliers de contrats en langage naturel réduit les cycles de révision et accélère la prise de décision dans des secteurs comme l'immobilier, les médias ou les achats. Dans le secteur des médias et du divertissement par exemple, AIDA aide producteurs et distributeurs à identifier rapidement les droits de diffusion, de streaming ou de déclinaisons dérivées contenus dans des accords de licence complexes.

Cette initiative s'inscrit dans une tendance de fond qui voit les grands cabinets de conseil et d'audit accélérer leur propre transformation par l'IA générative. PwC, comme ses concurrents directs McKinsey, Deloitte ou EY, investit massivement dans des outils propriétaires pour automatiser les tâches à forte intensité documentaire, tout en maintenant une supervision humaine sur les sorties générées par l'IA, ce que la solution impose explicitement avant toute utilisation juridique ou commerciale. Le recours à AWS positionne AIDA dans l'écosystème cloud dominant des grandes entreprises, facilitant son intégration avec des systèmes existants comme les référentiels de documents ou les plateformes de gestion contractuelle. À mesure que les volumes de données contractuelles continuent de croître, ce type d'outil pourrait redéfinir la structure même des équipes juridiques en entreprise, en réorientant les professionnels vers des tâches d'analyse stratégique plutôt que de traitement documentaire.

Impact France/UE

PwC France et ses clients européens peuvent directement adopter AIDA pour automatiser l'analyse contractuelle, la solution supportant explicitement le français pour les équipes juridiques locales.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Amazon Finance automatise le traitement des demandes réglementaires grâce à l'IA générative sur AWS
1AWS ML Blog 

Amazon Finance automatise le traitement des demandes réglementaires grâce à l'IA générative sur AWS

Les équipes Finance Technology (FinTech) d'Amazon ont déployé un système automatisé de gestion des enquêtes réglementaires, construit sur Amazon Bedrock et plusieurs services AWS. Face à des milliers de documents à traiter, en formats PDF, Word, PowerPoint et CSV, et à des délais réglementaires stricts imposés par des autorités aux exigences très différentes selon les juridictions, les équipes ont développé une application basée sur la génération augmentée par récupération (RAG). Le coeur du système repose sur Amazon Bedrock Knowledge Bases couplé à Amazon OpenSearch Serverless pour le stockage vectoriel, Claude Sonnet 4.5 comme modèle de langage via l'API Converse Stream, et Amazon DynamoDB pour la gestion de l'historique des conversations. Chaque équipe FinTech maintient sa propre base de connaissances alimentée par ses documents spécifiques. Ce système change concrètement la façon dont des équipes internes traitent des demandes réglementaires complexes, qui nécessitent de croiser des milliers de précédents documentaires tout en maintenant le fil de conversations multi-tours sur plusieurs sessions. Avant cette solution, la fragmentation des connaissances entre différents systèmes d'infrastructure Amazon rendait la synthèse d'information lente et risquée. Désormais, les réponses sont contextuelles, s'appuient sur des données historiques précises, et s'affinent de manière itérative au fil des échanges. L'enjeu de conformité est central : une réponse inexacte ou basée sur une directive réglementaire obsolète peut exposer Amazon à des violations juridiques directes. La difficulté majeure que ce projet révèle est celle de l'observabilité des systèmes d'IA dans des contextes réglementés. Les équipes ont intégré OpenTelemetry et Langfuse en auto-hébergement pour monitorer en continu les décisions du modèle, détecter les hallucinations, c'est-à-dire les cas où le modèle génère des informations absentes des documents sources, et surveiller la dérive de précision dans le temps, inévitable à mesure que les prompts, les modèles et le corpus documentaire évoluent. Le choix de ne pas mettre en cache les réponses LLM est délibéré : les enquêtes réglementaires sont trop contextuelles pour bénéficier d'un cache, dont le taux d'utilisation serait trop faible pour justifier la complexité. Ce déploiement illustre une tendance croissante chez les grandes entreprises tech à internaliser leurs systèmes RAG sur des infrastructures cloud propriétaires, plutôt que de s'appuyer sur des solutions SaaS tierces, notamment pour garder le contrôle sur la traçabilité et la conformité des réponses générées.

UELes équipes techniques européennes confrontées aux enquêtes réglementaires (RGPD, AI Act) peuvent s'inspirer de cette architecture RAG multi-sources pour automatiser leur gestion de conformité.

OutilsActu
1 source
Sun Finance automatise l'extraction d'identifiants et la détection de fraude avec l'IA générative sur AWS
2AWS ML Blog 

Sun Finance automatise l'extraction d'identifiants et la détection de fraude avec l'IA générative sur AWS

Sun Finance, fintech lettone fondée en 2017, a déployé en janvier 2026 un pipeline de vérification d'identité entièrement repensé grâce à l'intelligence artificielle générative d'AWS. L'entreprise, active dans neuf pays, traite un dossier de prêt toutes les 0,63 secondes et réalise plus de 4 millions d'évaluations par mois. Sur son marché des microcrédits, quelque 80 000 demandes sont soumises chaque mois, dont 60 % aboutissaient jusqu'ici dans des files d'attente de révision manuelle. En partenariat avec l'AWS Generative AI Innovation Center, Sun Finance a reconstruit son pipeline en combinant Amazon Bedrock, Amazon Textract et Amazon Rekognition. Le projet a duré 107 jours ouvrés au total, du lancement le 26 août 2025 à la mise en production le 22 janvier 2026, incluant un gel de deux semaines pendant les fêtes. Résultat : la précision d'extraction des données documentaires est passée de 79,7 % à 90,8 %, le coût unitaire par document a chuté de 91 %, et le temps de traitement est tombé de 20 heures à moins de 5 secondes. L'impact est immédiat et quantifiable. En éliminant la majorité des interventions manuelles, Sun Finance libère environ trois équivalents temps plein dédiés à la vérification dans une seule région. La réduction du coût par dossier rend désormais rentable l'expansion vers des segments de microcrédits à faible valeur unitaire, jusqu'ici bloqués par les contraintes économiques. Pour les clients, le passage de plusieurs heures d'attente à une réponse quasi instantanée transforme radicalement l'expérience de demande de prêt. Sur le plan de la fraude, la détection automatisée par recherche de similarité vectorielle permet d'identifier les schémas répétitifs utilisés par des demandeurs malveillants qui soumettaient de multiples dossiers avec des images légèrement modifiées, environ 10 % des demandes quotidiennes étaient frauduleuses. La première version du système de vérification d'identité de Sun Finance datait de 2019, déjà bâtie sur Rekognition et Textract. L'expansion vers des marchés émergents a mis en évidence ses limites : les langues locales sont sous-représentées dans les corpus d'entraînement des OCR traditionnels, générant des erreurs fréquentes sur des documents bilingues. Parmi les 60 % de dossiers nécessitant une révision manuelle, 80 % étaient dus à des incohérences entre les données extraites et celles saisies par les clients, et dans 60 % de ces cas, la faute revenait à l'OCR, non à l'utilisateur. La solution actuelle, fondée sur une combinaison de reconnaissance de caractères spécialisée et de structuration par grand modèle de langage, surpasse chaque outil pris isolément. Ce projet illustre une tendance de fond dans la fintech : l'IA générative ne se substitue pas aux outils OCR classiques, elle les complète pour atteindre un niveau de fiabilité industrielle que ni l'un ni l'autre n'atteignent seuls.

UESun Finance, fintech lettone opérant dans neuf pays dont plusieurs en Europe, illustre concrètement comment des acteurs européens du crédit en ligne peuvent automatiser la vérification d'identité et réduire la fraude documentaire grâce à l'IA générative, avec des résultats mesurables (−91 % de coût unitaire, précision passée de 79,7 % à 90,8 %).

OutilsOutil
1 source
Des alertes isolées à l'intelligence contextuelle : analyse d'anomalies maritimes par agents autonomes et IA générative
3AWS ML Blog 

Des alertes isolées à l'intelligence contextuelle : analyse d'anomalies maritimes par agents autonomes et IA générative

Windward, spécialiste de l'intelligence maritime par IA, a développé en partenariat avec l'AWS Generative AI Innovation Center un système baptisé MAI Expert, présenté comme le premier agent IA génératif dédié à l'analyse maritime. Ce système automatise l'investigation des anomalies de comportement de navires en croisant des données AIS (Automatic Identification System), des signaux de télédétection, des flux d'actualités en temps réel et des modèles propriétaires. Concrètement, dès qu'une anomalie est détectée par le module Windward Early Detection -- pic d'activité inhabituel, mouvement inattendu, déviation de route -- le pipeline IA extrait les métadonnées de l'événement (horodatage, coordonnées, type d'anomalie, classe du navire) puis interroge automatiquement des sources externes diversifiées pour produire une évaluation de risque textuelle et contextualisée. L'architecture repose sur Amazon Bedrock pour les modèles de langage et AWS Step Functions pour l'orchestration des étapes d'analyse. Avant ce système, les analystes maritimes passaient des heures à collecter et corréler manuellement des données complexes pour comprendre chaque anomalie -- un travail qui exigeait une expertise pointue et ralentissait considérablement la prise de décision. MAI Expert réduit ce délai en automatisant la collecte de contexte: météo, actualités, alertes croisées, données propriétaires. Les agences de défense, services de renseignement, forces de l'ordre et acteurs commerciaux qui utilisent la plateforme Windward peuvent ainsi concentrer leur énergie sur l'interprétation stratégique plutôt que sur la recherche d'information. L'enjeu est direct: dans le domaine maritime, une réponse rapide à une menace peut conditionner la protection d'infrastructures critiques ou l'interception d'activités illicites. Windward s'inscrit dans une tendance de fond qui voit l'IA générative dépasser le simple rôle de résumé pour devenir un véritable agent d'investigation autonome. La coopération avec AWS illustre comment les acteurs spécialisés dans des domaines à forte contrainte opérationnelle -- sécurité maritime, défense, logistique -- cherchent à intégrer les grands modèles de langage dans des workflows métier complexes, sans sacrifier la précision ni la traçabilité des sources. La suite logique de ce développement sera d'élargir le nombre de sources interrogées, d'améliorer la fiabilité des évaluations de risque en contexte ambigu, et potentiellement d'étendre le modèle à d'autres domaines où la surveillance multi-sources est critique, comme la gestion des frontières ou la surveillance environnementale.

UELes agences européennes de surveillance maritime, gardes-côtes et services de renseignement pourraient s'appuyer sur ce type de système pour renforcer la surveillance des frontières maritimes de l'UE et la lutte contre les trafics illicites en mer.

OutilsOutil
1 source
Traiter des PDF et en extraire des insights : concevoir un pipeline intelligent avec les services IA générative d'AWS
4AWS ML Blog 

Traiter des PDF et en extraire des insights : concevoir un pipeline intelligent avec les services IA générative d'AWS

Amazon Web Services a dévoilé une architecture complète de traitement intelligent de documents reposant sur ses services d'IA générative, notamment Amazon Bedrock Data Automation (BDA). Ce service unifié permet d'extraire des informations structurées depuis des documents multimodaux, PDF, images, vidéos, fichiers audio, avec une capacité allant jusqu'à 3 000 pages et 500 Mo par requête API. Contrairement aux solutions OCR classiques qui se limitent à l'extraction de texte brut, BDA analyse le contexte, classe automatiquement chaque section d'un document dans la bonne catégorie, l'associe au bon modèle de traitement, et fournit des scores de confiance sur les données extraites. L'architecture s'appuie sur quatre couches intégrées : ingestion des fichiers via Amazon S3, extraction et stockage avec DynamoDB, couche d'intelligence sémantique via Amazon Bedrock Knowledge Base, et coordination agentique par des agents spécialisés hébergés sur Amazon Bedrock AgentCore Runtime, orchestrés par AWS Step Functions. Pour les organisations qui traitent chaque jour des millions de documents, contrats juridiques, dossiers médicaux, factures, déclarations d'assurance, cette solution répond à un goulot d'étranglement majeur : l'intervention humaine obligatoire dans les pipelines traditionnels. En automatisant la classification, la normalisation et la validation des données, BDA réduit les coûts opérationnels, accélère les délais de traitement et limite les erreurs de saisie. La capacité à relier plusieurs documents entre eux via une base de connaissances sémantique permet également des analyses croisées impossibles avec les approches OCR conventionnelles, ouvrant la voie à des cas d'usage comme l'audit automatisé de contrats ou l'analyse comparative de rapports financiers. Ce lancement s'inscrit dans une course que se livrent les grands fournisseurs cloud, AWS, Microsoft Azure et Google Cloud, pour proposer des pipelines documentaires clé en main à destination des entreprises. AWS positionne BDA comme une réponse directe aux limites des solutions point-à-point qui nécessitaient jusqu'ici d'assembler manuellement des modèles OCR, des LLM et des orchestrateurs distincts. En intégrant l'ensemble dans une API unifiée au sein de Bedrock, Amazon cherche à réduire la friction technique pour les équipes data et à accélérer l'adoption de l'IA générative dans des secteurs très réglementés comme la finance, la santé et le droit. Les prochaines évolutions attendues concernent l'élargissement des formats supportés et le renforcement des capacités d'analyse de graphiques et de visualisations complexes embarqués dans les documents.

UELes entreprises européennes des secteurs réglementés (finance, santé, droit) peuvent adopter BDA via AWS pour automatiser leurs pipelines documentaires, sous réserve de conformité RGPD quant au stockage des données dans les régions AWS européennes.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic