Aller au contenu principal
OutilsAWS ML Blog3h· 2 min de lecture

Modèle de sélection simplifié dans Amazon Bedrock grâce au Model Profiler open source

Source originale ↗·

Amazon vient de rendre open source le Model Profiler, un outil qui centralise la comparaison des modèles disponibles sur Amazon Bedrock, sa plateforme de génération de texte gérée. Bedrock donne accès à plus de 100 modèles fondation de fournisseurs comme Anthropic, OpenAI, Meta, Mistral AI, Cohere et Amazon lui-même, mais comparer leurs capacités, tarifs, disponibilité régionale, taille de fenêtre de contexte et débit obligeait jusqu'ici à naviguer entre plusieurs pages de console, documentations et appels API régionaux distincts. Le Model Profiler agrège ces données dans une interface web unique, avec filtrage avancé, comparaisons côte à côte et fiches détaillées par modèle. En coulisses, un pipeline serverless entièrement automatisé collecte les informations depuis sept sources différentes, cinq API AWS et deux URL publiques, incluant les spécifications des modèles Bedrock, les tarifs on-demand et batch, les quotas de débit (tokens par minute et requêtes par minute) sur 33 régions, les profils d'inférence cross-région, ainsi que les tailles de fenêtre de contexte via la base LiteLLM et le statut de cycle de vie via la documentation AWS. Le pipeline repose sur AWS Step Functions et orchestre 17 fonctions Lambda réparties en quatre phases, avec un système de cache S3 inter-Lambda qui réduit le nombre d'appels API d'environ 480 à 29 par exécution, soit un taux de succès de cache de 97%. L'ensemble tourne quotidiennement à 6h UTC et se termine en 8 à 12 minutes.

Pour les équipes qui évaluent des modèles pour de nouveaux projets, cherchent à optimiser coûts et performances, ou migrent depuis d'autres systèmes d'IA, cet outil supprime une friction concrète: le temps perdu à croiser manuellement des documents épars pour prendre une décision éclairée. Comprendre les quotas est central dans ce choix. Le débit en tokens par minute (TPM) fixe le plafond de traitement, sachant que 1 000 tokens représentent environ 750 mots de texte, tandis que le nombre de requêtes par minute (RPM) limite les appels API indépendamment de leur taille, ces deux quotas variant selon le modèle et la région choisie. En rendant ces informations accessibles et à jour quotidiennement dans une seule interface, l'outil accélère la phase d'expérimentation et raccourcit le délai avant la mise en production.

Cette initiative s'inscrit dans une tendance plus large où les grands fournisseurs cloud cherchent à simplifier l'accès à des catalogues de modèles de plus en plus vastes et fragmentés en termes de tarification, de régions et de capacités techniques. Amazon mise ici sur l'open source et sur une architecture serverless réutilisable, déployable en moins de cinq minutes via un template AWS CloudFormation, dont la fréquence de mise à jour est configurable par une règle Amazon EventBridge. Le projet embarque également un système agentique d'auto-réparation, propulsé par Bedrock, capable de détecter des lacunes dans les données collectées et d'appliquer automatiquement des correctifs de configuration jugés sûrs. À mesure que le nombre de modèles disponibles sur Bedrock continue de croître, cet outil pourrait devenir une référence pour les équipes techniques cherchant à arbitrer rapidement entre coût, performance et couverture géographique sans dépendre exclusivement des interfaces officielles d'AWS.

Impact France/UE

Les entreprises europeennes utilisant Amazon Bedrock, disponible dans plusieurs regions UE, beneficient indirectement de cet outil de comparaison, mais aucune mesure ou entite francaise n'est concernee specifiquement.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AWS ML Blog 

Amazon Bedrock : comprendre le cycle de vie des modèles

Amazon Web Services a formalisé le cycle de vie des modèles de fondation (FM) disponibles sur sa plateforme Bedrock, en introduisant un cadre structuré en trois états distincts : Actif, Hérité (Legacy) et Fin de vie (EOL). Ce système vise à donner aux entreprises une visibilité suffisante pour planifier leurs migrations sans interruption de service. Concrètement, un modèle reste disponible au minimum 12 mois après son lancement, puis passe en état Legacy avec un préavis d'au moins 6 mois avant sa date de fin de vie. AWS a également introduit une nouvelle phase intermédiaire appelée "extended access" pour les modèles dont la fin de vie est postérieure au 1er février 2026 : après 3 mois en état Legacy, le modèle entre dans cette période d'accès étendu pendant laquelle les utilisateurs actifs peuvent continuer à l'utiliser au moins 3 mois supplémentaires. Durant cette fenêtre, les demandes d'augmentation de quota ne seront plus approuvées et les tarifs peuvent être ajustés par le fournisseur du modèle, avec notification préalable. Cet encadrement change concrètement la manière dont les équipes techniques doivent gérer leurs applications IA en production. Jusqu'ici, une fin de vie pouvait surprendre des équipes insuffisamment préparées, entraînant des pannes ou des migrations précipitées. Avec ce calendrier prévisible, les développeurs peuvent anticiper les transitions, tester les modèles de remplacement via la console Bedrock ou l'API, et adapter leur code sans urgence. L'état d'un modèle est désormais exposé directement dans les réponses API via le champ modelLifecycle, accessible lors d'appels GetFoundationModel ou ListFoundationModels. Il faut toutefois noter que les comptes inactifs en phase Legacy, c'est-à-dire n'ayant pas appelé le modèle pendant 15 jours ou plus, peuvent perdre l'accès prématurément. La migration vers un nouveau modèle reste une action manuelle : rien ne se fait automatiquement lorsqu'un modèle atteint sa date EOL. Cette politique s'inscrit dans un contexte où Amazon Bedrock multiplie les modèles disponibles, provenant de fournisseurs comme Anthropic, Meta, Mistral ou Cohere, chacun avec ses propres cycles de mise à jour. À mesure que ces modèles évoluent rapidement, l'accumulation de versions obsolètes pose des problèmes de maintenance et de sécurité pour AWS comme pour ses clients. En clarifiant les règles du jeu, AWS cherche à professionnaliser la gestion du cycle de vie des IA en entreprise, sur le modèle de ce que font déjà les plateformes cloud pour leurs APIs et services logiciels. La prochaine étape pour les équipes utilisant Bedrock sera d'intégrer ces états dans leurs processus de surveillance et d'alerte, afin de ne jamais être pris de court lors d'une transition de modèle.

UELes entreprises européennes utilisant Amazon Bedrock doivent intégrer ce nouveau cadre de cycle de vie dans leurs processus de gestion des applications IA en production pour éviter des interruptions de service.

OutilsOpinion
1 source
Amazon Bedrock : exploiter les données vidéo à grande échelle grâce aux modèles multimodaux
2AWS ML Blog 

Amazon Bedrock : exploiter les données vidéo à grande échelle grâce aux modèles multimodaux

Amazon Bedrock, la plateforme d'intelligence artificielle d'AWS, propose désormais une solution open source permettant d'analyser des vidéos à grande échelle grâce à des modèles multimodaux capables de traiter simultanément images et texte. Cette solution, disponible sur GitHub, s'articule autour de trois architectures distinctes, chacune adaptée à des cas d'usage et des compromis coût/performance différents. Elle répond à un besoin croissant des entreprises dans des secteurs aussi variés que la surveillance, la production médiatique, les réseaux sociaux ou les communications d'entreprise. Là où les approches traditionnelles de vision par ordinateur se limitaient à détecter des patterns prédéfinis — lentes, rigides et incapables de saisir le contexte sémantique — les nouveaux modèles fondationnels d'Amazon Bedrock changent la donne. La première approche, dite "frame-based", extrait des images à intervalles réguliers, élimine les doublons visuels grâce à des algorithmes de similarité (dont les embeddings multimodaux Nova d'Amazon en 256 dimensions, ou la détection de features OpenCV ORB), puis soumet ces frames à un modèle de compréhension d'image pendant que la piste audio est transcrite séparément via Amazon Transcribe. Ce workflow convient particulièrement à la surveillance de sécurité, au contrôle qualité industriel ou à la conformité réglementaire. Deux autres architectures complètent l'offre, chacune optimisée pour des scénarios différents comme l'analyse de scènes médiatiques, la détection de coupures publicitaires ou la modération de contenu sur les réseaux sociaux. L'ensemble du pipeline est orchestré par AWS Step Functions, garantissant une scalabilité et une fiabilité industrielle. L'analyse vidéo automatisée à grande échelle est devenue un enjeu stratégique majeur pour les organisations qui génèrent ou reçoivent des volumes massifs de contenus visuels. Jusqu'ici, ce travail reposait largement sur la révision manuelle ou des systèmes à règles figées, coûteux et peu adaptables. L'intégration de modèles multimodaux capables de comprendre le sens d'une scène, de répondre à des questions sur le contenu ou de détecter des événements nuancés représente un saut qualitatif important pour l'automatisation de workflows métier complexes.

OutilsOutil
1 source
Amazon Bedrock Data Automation : améliorer la précision de l'extraction de plans
3AWS ML Blog 

Amazon Bedrock Data Automation : améliorer la précision de l'extraction de plans

Amazon Web Services a enrichi son service Amazon Bedrock Data Automation (BDA) d'une fonctionnalité appelée "blueprint instruction optimization", conçue pour améliorer automatiquement la précision d'extraction de données structurées à partir de documents non structurés, factures, contrats, formulaires fiscaux ou dossiers d'inscription. Le principe repose sur des blueprints, des schémas personnalisables qui définissent les champs à extraire (numéro de commande, montant total, date, demandes spéciales) accompagnés d'instructions en langage naturel guidant le modèle. Jusqu'ici, lorsqu'un champ était mal extrait, les équipes devaient affiner manuellement ces instructions en boucle. Désormais, il suffit de fournir entre trois et dix documents d'exemple avec les valeurs attendues : BDA analyse les écarts entre ses résultats et la vérité terrain, puis reformule automatiquement les instructions de chaque champ en quelques minutes. Aucun fine-tuning de modèle séparé n'est nécessaire. L'impact est direct pour les équipes en charge de l'automatisation documentaire dans les entreprises. Traiter des documents provenant de centaines de fournisseurs différents posait un problème structurel : les libellés varient ("subtotal" vs "total"), les mises en page changent selon les périodes ou les partenaires, et la qualité des scans dégrade encore la reconnaissance. Ce cycle d'itération manuelle pouvait prendre plusieurs semaines par type de document. Avec cette optimisation automatisée, ce délai tombe à quelques minutes, ce qui réduit considérablement le coût de mise en production de pipelines de traitement intelligent de documents (IDP). Les organisations qui gèrent de grands volumes documentaires, assureurs, cabinets comptables, services achats, sont les premières bénéficiaires. Cette annonce s'inscrit dans la stratégie d'AWS visant à rendre l'automatisation documentaire accessible sans expertise en machine learning. Amazon Bedrock Data Automation, lancé pour unifier classification, extraction, normalisation et validation via une seule API, fait face à une concurrence croissante d'acteurs spécialisés comme Google Document AI ou Microsoft Azure Form Recognizer, ainsi que de solutions fondées sur des modèles de vision généralistes. En supprimant la nécessité de fine-tuner un modèle tout en automatisant le travail d'ingénierie des prompts, AWS réduit la barrière d'entrée pour les équipes métier. La prochaine étape logique serait d'étendre cette optimisation à des flux documentaires plus complexes impliquant plusieurs types de documents interconnectés, un enjeu central pour des secteurs comme la finance ou la santé.

UELes entreprises françaises et européennes gérant de grands volumes documentaires (assureurs, cabinets comptables, services achats) peuvent réduire leurs délais de mise en production de pipelines d'extraction documentaire de plusieurs semaines à quelques minutes, sans expertise en machine learning.

OutilsOutil
1 source
Amazon Bedrock Projects : gérer les coûts de l'IA
4AWS ML Blog 

Amazon Bedrock Projects : gérer les coûts de l'IA

Amazon a lancé une nouvelle fonctionnalité appelée Amazon Bedrock Projects, qui permet aux équipes techniques d'attribuer précisément les coûts d'inférence IA à des charges de travail spécifiques. Concrètement, chaque "projet" dans Bedrock constitue une frontière logique représentant une application, un environnement ou une expérimentation. Les développeurs associent des tags de ressources à ces projets et transmettent un identifiant de projet dans leurs appels API. Ces données remontent ensuite dans AWS Cost Explorer et AWS Data Exports, les outils de suivi financier d'Amazon Web Services, permettant de filtrer, regrouper et analyser les dépenses par dimension métier : application, équipe, environnement ou centre de coûts. La fonctionnalité est compatible avec les API OpenAI (Responses API et Chat Completions API), ce qui facilite l'intégration pour les équipes déjà habituées à ces standards. Les requêtes envoyées sans identifiant de projet sont automatiquement rattachées à un projet par défaut dans le compte AWS concerné. L'enjeu est direct pour les grandes organisations qui font tourner plusieurs applications IA en parallèle : sans attribution précise, impossible de savoir quelle équipe consomme quoi, ni d'effectuer des refacturations internes (chargebacks) ou d'investiguer des pics de dépenses inexpliqués. Bedrock Projects répond à ce besoin en donnant une visibilité granulaire sur la facture IA, département par département. Une équipe "CustomerExperience" peut ainsi être distinguée d'une équipe "DataScience", chacune avec son propre centre de coûts. Cela permet également de guider les décisions d'optimisation : identifier quels workloads sont disproportionnément coûteux par rapport à leur valeur métier, et agir en conséquence. Cette annonce s'inscrit dans une tendance plus large de maturité de la FinOps appliquée à l'IA. À mesure que les déploiements LLM passent du stade expérimental à la production à grande échelle, la gestion financière devient un enjeu stratégique autant que technique. AWS rejoint ainsi des préoccupations déjà bien présentes chez les DSI et les directeurs financiers, qui voient les budgets cloud IA gonfler rapidement sans toujours disposer des outils pour les piloter. La stratégie de tags recommandée par Amazon -- Application, Environment, Team, CostCenter -- reflète les pratiques standard de gouvernance cloud, mais appliquées désormais spécifiquement à la couche inférence. Les prochaines étapes logiques pourraient inclure des alertes budgétaires par projet ou des quotas d'utilisation, des mécanismes déjà existants dans AWS pour d'autres services et qui manquent encore à Bedrock Projects dans sa forme actuelle.

UELes organisations européennes utilisant AWS Bedrock peuvent désormais mieux contrôler et attribuer leurs coûts d'inférence IA, un enjeu croissant pour les DSI soumis à des contraintes budgétaires strictes.

OutilsActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic