OutilsAWS ML Blog · 8 juin 2026, 19:31· 2 min de lecture

L'optimisation mathématique là où l'intuition échoue : des décisions à grande échelle

Face aux décisions d'entreprise trop complexes pour l'intuition humaine, optimiser des milliers de routes de livraison, coordonner des centaines de robots en usine sans collision, gérer les plannings d'un hôpital 24h/24 en respectant toutes les contraintes réglementaires, des organisations de premier plan se tournent vers l'optimisation mathématique, une branche spécialisée de l'IA distincte du machine learning. L'équipe scientifique du AWS Generative AI Innovation Center accompagne ces entreprises en combinant expertise en modélisation mathématique, informatique quantique et calcul haute performance, entièrement déployés sur l'infrastructure AWS. Parmi les cas concrets, le Fidelity Center for Applied Technology (FCAT) illustre bien l'enjeu : leurs modèles de machine learning produisaient déjà de solides prédictions pour les décisions d'investissement et la gestion du risque, mais manquaient d'interprétabilité. En collaborant avec l'Innovation Center, FCAT a intégré l'explicabilité directement dans la construction des modèles, sans sacrifier leur précision prédictive, et en produisant des cadres réutilisables pour les développements futurs.

Ce que l'optimisation mathématique apporte, que le machine learning ne peut pas fournir seul, c'est une réponse définitive et prouvablement optimale, et non une approximation probabiliste. Le machine learning est une IA inductive : il apprend des régularités à partir de milliers d'exemples pour produire des prédictions. L'optimisation est déductive : elle applique des principes mathématiques à un problème spécifique pour délivrer la meilleure décision possible compte tenu de toutes les contraintes réelles. Là où un algorithme prédictif dira "cet itinéraire est probablement efficace", l'optimisation répond "voici l'itinéraire optimal en intégrant chaque contrainte de votre système". Pour des opérations soumises à des limites physiques, des fenêtres horaires serrées ou des exigences réglementaires non négociables, cette différence est décisive.

L'essor de ces approches s'inscrit dans une transformation plus large de l'IA d'entreprise, qui cherche à dépasser la simple prédiction pour atteindre la prescription, dire non pas ce qui va se passer, mais ce qu'il faut faire. Les pipelines dits "predict-then-optimize" combinent les deux disciplines : le machine learning prédit la demande future, l'optimisation mathématique détermine ensuite le plan d'action optimal à partir de ces prévisions. AWS positionne son Innovation Center comme un accélérateur de cette convergence, en prenant en charge la complexité scientifique que peu d'entreprises peuvent internaliser. La compétition pour maîtriser ces outils s'intensifie dans la logistique, la finance, la santé et l'industrie manufacturière, secteurs où une décision sous-optimale à grande échelle se chiffre en millions, et où l'IA prescriptive commence à supplanter les règles métier manuelles comme standard opérationnel.

Dans nos dossiers

AWS

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AWS ML Blog

AgentOps : déployer des agents IA à grande échelle avec Amazon Bedrock AgentCore

Amazon Web Services a présenté AgentOps, une nouvelle discipline opérationnelle pour déployer, gérer et améliorer les agents IA en production, en s'appuyant sur sa plateforme Amazon Bedrock AgentCore. Publié début juin 2026, ce cadre de référence s'articule autour de quatre piliers : gouvernance et sécurité, construction et opérations, évaluation, et observabilité. Bedrock AgentCore permet de déployer des agents IA compatibles avec n'importe quel modèle de langage et n'importe quel framework open source, en passant du développement local à la production sans gérer d'infrastructure. AWS propose une architecture de référence complète couvrant l'ensemble du cycle de vie DevOps adapté aux agents : planification, développement, construction, test, déploiement et maintenance. Le besoin derrière AgentOps est concret : contrairement aux pipelines classiques, les agents IA prennent des décisions autonomes et non déterministes, ce qui rend le débogage difficile, les coûts imprévisibles et le contrôle qualité complexe. AgentOps répond à ces défis en traitant chaque agent, outil et configuration mémoire comme un artefact versionné avec son propre pipeline CI/CD. L'évaluation s'effectue à quatre niveaux : l'outil individuel, le tour de conversation, le résultat de session et le système global, aussi bien en développement qu'en production. L'observabilité couvre quatre couches de télémétrie pour tracer chaque décision d'agent, surveiller les baisses de qualité et mesurer le coût par interaction. Ce lancement s'inscrit dans une course industrielle autour de l'IA agentique, où AWS, Google, Microsoft et OpenAI cherchent à proposer des plateformes complètes pour industrialiser le déploiement d'agents. La complexité opérationnelle croissante, notamment la gestion des identités d'agents, des protocoles d'authentification inter-agents (A2A), du Model Context Protocol (MCP) et des mécanismes de contrôle humain (human-in-the-loop), pousse les entreprises à chercher des cadres structurés. Amazon Bedrock AgentCore se positionne comme une réponse cloud-native à ces enjeux, en intégrant nativement sécurité, registre d'outils, gestion de l'état et limites d'exécution. Les suites prévisibles incluent l'adoption de ces pratiques AgentOps dans les grandes organisations, ainsi qu'une pression croissante sur les équipes DevOps pour adapter leurs outils et processus à la nature non déterministe des systèmes agentiques.

UELes entreprises françaises et européennes déployant des agents IA sur AWS peuvent adopter ce cadre AgentOps pour structurer leurs pipelines CI/CD et leur observabilité, sans impact réglementaire spécifique à la France ou l'UE.

OutilsActu

1 source

2AWS ML Blog

L'IA multimodale appliquée à la recherche d'images aériennes à grande échelle

Vexcel, l'un des plus grands fournisseurs mondiaux d'imagerie aérienne, opère une flotte d'avions dédiés qui collecte des données haute résolution dans plus de 45 pays et territoires. Son catalogue comprend des orthomosaïques, des vues obliques à 360 degrés et des modèles d'élévation représentant des milliards de pixels. En partenariat avec le AWS Generative AI Innovation Center (GenAIIC), l'entreprise a développé une architecture de recherche sémantique reposant sur des embeddings multimodaux, la génération automatique de légendes par un grand modèle de langage, et une recherche vectorielle via Amazon Bedrock et Amazon OpenSearch Serverless. L'objectif : permettre à un utilisateur d'interroger cette immense bibliothèque d'images en langage naturel, sans entraîner de modèle de vision par ordinateur pour chaque nouveau cas d'usage. Les tests ont montré qu'Amazon Nova Multimodal Embeddings obtenait les meilleurs scores F1 sur l'ensemble des requêtes de référence évaluées. Ce système a depuis évolué en Vexcel Intelligence, un produit actuellement en phase de prévisualisation. L'enjeu est considérable pour tous les secteurs qui s'appuient sur des données géospatiales : assurance, immobilier, administration publique, infrastructures et agriculture. Jusqu'ici, localiser des piscines dans un quartier résidentiel, cartographier des panneaux solaires à l'échelle d'une ville ou détecter des graffitis sur des entrepôts obligeait soit à examiner manuellement chaque tuile d'image, soit à entraîner un modèle de vision dédié pour chaque question, avec les données étiquetées, le temps d'ingénierie et les cycles de ré-entraînement que cela implique. La recherche sémantique par vecteurs supprime cette étape : une requête en langage naturel produit des résultats en quelques secondes, sans redévelopper de pipeline spécifique pour chaque nouveau besoin client. C'est un changement de paradigme opérationnel qui compresse des semaines de travail en une simple interrogation. La recherche géospatiale pose des défis structurels absents de la recherche d'images classique : une même zone est représentée par plusieurs vues simultanées (nadir, oblique nord, est, sud, ouest), et les requêtes portent sur des objets physiques ancrés dans l'espace réel plutôt que sur des photographies isolées. Vexcel avait exploré trois approches préalables avant ce partenariat, dont un pipeline d'embeddings multimodaux tuilés avec légendes LLM qui montrait des résultats prometteurs mais soulevait des questions clés sur le choix du modèle, la fusion des vues multiples et la réelle valeur ajoutée des légendes textuelles. L'équipe a construit une méthodologie d'évaluation ancrée dans les données OpenStreetMap pour comparer quatre variables : modèle d'embedding, stratégie de fusion, approche de légendage et méthode de recherche. Vexcel Intelligence, désormais en prévisualisation, concrétise ces travaux et transforme des décennies de collecte aérienne en une base de connaissance interrogeable à la demande.

UELes assureurs, collectivités et acteurs de l'immobilier européens utilisant des données géospatiales aériennes pourraient adopter Vexcel Intelligence pour remplacer des pipelines de vision par ordinateur coûteux par une simple recherche en langage naturel.

OutilsOutil

1 source

3AWS ML Blog

Organiser la mémoire des agents à grande échelle : patterns de conception par namespace dans AgentCore Memory

Amazon a publié un guide technique détaillé sur la conception de namespaces dans AgentCore Memory, le système de mémoire à long terme intégré à Amazon Bedrock. La fonctionnalité, présentée dans un billet de blog officiel d'AWS, permet aux développeurs d'organiser les souvenirs de leurs agents IA sous forme de chemins hiérarchiques, similaires à des arborescences de fichiers. Concrètement, les préférences d'un utilisateur identifié comme customer-123 seront stockées sous /actor/customer-123/preferences/, tandis que les résumés de ses sessions individuelles seront rangés sous /actor/customer-123/session/session-789/summary/. Ces chemins sont générés automatiquement à partir de trois variables prédéfinies : {actorId} pour l'identifiant de l'utilisateur, {sessionId} pour la session en cours, et {memoryStrategyId} pour le type de stratégie mémoire utilisé. Le système prend en charge plusieurs stratégies superposées, notamment la mémoire sémantique pour les faits durables sur un utilisateur, et la mémoire de résumé pour les synthèses de sessions passées. L'enjeu est concret : sans organisation rigoureuse, les agents IA récupèrent du contexte non pertinent lors de leurs requêtes, ce qui dégrade la qualité des réponses et peut créer des failles de sécurité, notamment en exposant les souvenirs d'un utilisateur à un autre. Le système de namespaces résout ces deux problèmes à la fois. D'un côté, la structure hiérarchique permet une récupération à granularité variable : on peut interroger la mémoire d'une session précise, l'ensemble des préférences d'un utilisateur à travers toutes ses sessions, ou encore des données communes à tous les utilisateurs d'un même agent. De l'autre, AWS intègre des contrôles d'accès IAM natifs qui permettent de délimiter précisément qui peut lire ou écrire dans quelle portion de la mémoire, sans dupliquer le stockage physique. Les namespaces sont des partitions logiques au sein d'une même ressource mémoire, une approche que les équipes habituées aux clés de partition DynamoDB ou aux préfixes S3 reconnaîtront immédiatement. Ce guide s'inscrit dans une dynamique plus large : l'essor des agents IA en production crée une demande croissante pour des infrastructures mémoire robustes et sécurisées. Amazon Bedrock, qui concurrence directement les offres d'OpenAI, Google et Microsoft Azure dans l'espace des plateformes d'agents d'entreprise, cherche à se différencier par des primitives de bas niveau bien pensées. AgentCore Memory, présenté comme une brique fondamentale pour les agents à longue durée de vie, cible les équipes qui construisent des assistants client, des copilotes métier ou des agents autonomes nécessitant une continuité de contexte entre les sessions. La prochaine étape annoncée par AWS porte sur les patterns de récupération multi-niveaux et les stratégies d'isolation entre agents dans des architectures multi-tenants.

UEAmazon Bedrock étant déployé dans des régions AWS européennes, ces patterns de conception sont directement exploitables par les équipes françaises et européennes qui construisent des agents IA sur cette plateforme.

OutilsActu

1 source

4AWS ML Blog

PwC extrait des informations contractuelles grâce à l'annotation IA sur AWS

PwC a développé une solution d'intelligence artificielle baptisée AIDA (AI-Driven Annotation), déployée sur les services cloud d'Amazon Web Services, pour automatiser l'analyse de contrats juridiques et commerciaux. Conçue en collaboration avec les équipes internes du cabinet, cette plateforme combine des modèles de langage de grande taille (LLM) avec des workflows d'extraction automatisés afin de transformer des documents non structurés en données consultables et réutilisables. Concrètement, AIDA offre trois fonctionnalités principales : l'extraction basée sur des modèles personnalisables, un système de questions-réponses en langage naturel à l'échelle d'un seul document, et une interrogation globale sur des milliers de contrats en parallèle. Dans les déploiements clients déjà réalisés, la solution a permis de réduire le temps de relecture manuelle des contrats jusqu'à 90 %, et un grand studio de cinéma et de télévision a vu son temps de recherche de droits chuter de 90 % également. Pour les équipes juridiques, de conformité et d'achats, l'enjeu est considérable. Aujourd'hui, la majorité des entreprises s'appuient encore sur des recherches par mots-clés ou des systèmes de gestion contractuelle classiques, qui peinent à traiter des volumes importants de documents avec une précision constante. AIDA change cette équation en permettant à un utilisateur de poser une question en français ou en anglais sur une clause précise, et d'obtenir une réponse contextuelle assortie de citations directement liées aux passages sources. Cette capacité à interroger simultanément des milliers de contrats en langage naturel réduit les cycles de révision et accélère la prise de décision dans des secteurs comme l'immobilier, les médias ou les achats. Dans le secteur des médias et du divertissement par exemple, AIDA aide producteurs et distributeurs à identifier rapidement les droits de diffusion, de streaming ou de déclinaisons dérivées contenus dans des accords de licence complexes. Cette initiative s'inscrit dans une tendance de fond qui voit les grands cabinets de conseil et d'audit accélérer leur propre transformation par l'IA générative. PwC, comme ses concurrents directs McKinsey, Deloitte ou EY, investit massivement dans des outils propriétaires pour automatiser les tâches à forte intensité documentaire, tout en maintenant une supervision humaine sur les sorties générées par l'IA, ce que la solution impose explicitement avant toute utilisation juridique ou commerciale. Le recours à AWS positionne AIDA dans l'écosystème cloud dominant des grandes entreprises, facilitant son intégration avec des systèmes existants comme les référentiels de documents ou les plateformes de gestion contractuelle. À mesure que les volumes de données contractuelles continuent de croître, ce type d'outil pourrait redéfinir la structure même des équipes juridiques en entreprise, en réorientant les professionnels vers des tâches d'analyse stratégique plutôt que de traitement documentaire.

UEPwC France et ses clients européens peuvent directement adopter AIDA pour automatiser l'analyse contractuelle, la solution supportant explicitement le français pour les équipes juridiques locales.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic