OutilsAWS ML Blog6sem· 2 min de lecture

Amazon Nova 2 appliqué à la modération de contenu

Amazon a publié un guide détaillé sur l'utilisation de son modèle Nova 2 Lite pour la modération de contenus générés par les utilisateurs, en s'appuyant sur des techniques de prompting structuré plutôt que sur un entraînement personnalisé. Le système repose sur Amazon Bedrock et intègre le standard MLCommons AILuminate v1.1, une taxonomie de 12 catégories de risques organisées en trois groupes : risques physiques (crimes violents, automutilation), non-physiques (haine, atteinte à la vie privée) et contextuels (conseils spécialisés). Le pipeline fonctionne en quatre étapes : le contenu entrant est enveloppé dans un prompt avec des définitions de politique et des exemples, envoyé au modèle, puis la réponse indique si une violation est détectée, quelle catégorie est concernée, et une explication optionnelle. La configuration recommandée est une température de 0,7 et un top-p de 0,9, bien qu'une température à 0 soit possible pour des sorties déterministes. Amazon précise également que le mode raisonnement peut être désactivé pour les pipelines à fort débit, réduisant latence et coûts.

L'approche par prompting présente un avantage opérationnel majeur par rapport au fine-tuning : elle ne nécessite aucune donnée d'entraînement ni personnalisation du modèle. Mettre à jour une politique de modération revient simplement à modifier le prompt, sans réentraîner quoi que ce soit. Pour des équipes qui modèrent des millions de messages, forums ou commentaires, cela représente une réduction drastique du cycle de déploiement. Nova 2 Lite est présenté comme un modèle multimodal à faible coût et à inférence rapide, conçu précisément pour ces usages à haut volume. Amazon a benchmarké ses performances face à plusieurs modèles fondamentaux concurrents sur trois jeux de données publics, positionnant Nova 2 Lite comme une option compétitive pour les entreprises qui ne veulent pas internaliser des modèles lourds.

Cette publication s'inscrit dans une stratégie plus large d'Amazon pour imposer Bedrock comme infrastructure de référence pour les cas d'usage IA en production. La modération de contenu est un marché critique : les grandes plateformes (réseaux sociaux, marketplaces, forums) font face à des obligations légales croissantes en Europe et aux États-Unis pour retirer contenus illicites et discours haineux dans des délais stricts. Le standard AILuminate de MLCommons, un consortium industriel cofondé par Meta, Google et d'autres, cherche à établir des bases communes d'évaluation pour éviter que chaque acteur redéfinisse les critères de nocivité à sa guise. En ancrant son guide sur ce référentiel, Amazon positionne Nova 2 Lite non seulement comme un outil technique, mais comme une solution alignée sur les standards émergents de l'industrie, à un moment où la pression réglementaire sur la modération automatisée s'intensifie des deux côtés de l'Atlantique.

Impact France/UE

Les plateformes européennes soumises au DSA pourraient s'appuyer sur cette solution pour automatiser la modération de contenu et respecter les délais de retrait stricts imposés par la réglementation européenne.

Dans nos dossiers

AWS Meta IA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AWS ML Blog

Détection d'objets avec Amazon Nova 2 Lite

Amazon a intégré à son service Bedrock un nouveau modèle multimodal, Nova 2 Lite, capable de détecter des objets dans des images via de simples instructions en langage naturel. Concrètement, il suffit de spécifier les éléments à repérer, une "voiture", une "personne", un "défaut", et le modèle retourne les coordonnées précises de chaque objet sous forme de JSON structuré, avec des boîtes englobantes normalisées sur une échelle de 0 à 1 000. Le déploiement repose sur trois services AWS : Bedrock pour l'inférence, Lambda pour l'exécution serverless, et API Gateway pour exposer l'endpoint. Le coût est particulièrement bas : 0,0003 dollar pour mille tokens en entrée et 0,0025 dollar pour mille tokens en sortie, ce qui revient à environ 5,69 dollars pour 10 000 images. Une intégration complète prend entre 30 et 45 minutes, sans aucun entraînement de modèle nécessaire. L'intérêt principal est d'éliminer la barrière d'entrée de la vision par ordinateur traditionnelle. Jusqu'ici, mettre en place un système de détection d'objets exigeait des pipelines de données, une infrastructure d'entraînement, des ressources de calcul significatives et souvent une équipe dédiée de data scientists, un investissement prohibitif pour les petites structures. Nova 2 Lite rend cette capacité accessible à n'importe quel développeur Python maîtrisant boto3, sans expertise en machine learning. Les cas d'usage couverts sont concrets : contrôle qualité en fabrication pour repérer des défauts sur une chaîne de production, comptage de cultures en agriculture, suivi de colis en logistique. La précision repose sur le prompt engineering, la façon dont on formule la demande au modèle conditionne directement la qualité des détections. Cette annonce s'inscrit dans une tendance de fond : les grands modèles de fondation multimodaux absorbent progressivement des tâches qui relevaient auparavant de pipelines spécialisés entraînés sur mesure. Amazon positionne Nova 2 Lite comme une alternative crédible aux solutions de computer vision classiques comme AWS Rekognition ou des bibliothèques comme YOLO, en misant sur la flexibilité du langage naturel plutôt que sur des catégories prédéfinies. Le fait que les coordonnées soient retournées dans un format standardisé et que l'architecture soit entièrement serverless facilite l'intégration dans des workflows existants. La prochaine étape logique pour les équipes adoptant cette approche sera d'évaluer les limites de précision face à des cas complexes, occlusions, objets de petite taille, scènes encombrées, là où les modèles spécialisés conservent encore un avantage.

OutilsOutil

1 source

2AWS ML Blog

Génération SQL à partir de texte : une approche économique avec Amazon Nova Micro et Bedrock

Amazon Web Services propose une nouvelle approche pour déployer des modèles de langage spécialisés dans la génération de requêtes SQL à partir du langage naturel, en combinant l'optimisation LoRA (Low-Rank Adaptation) avec l'inférence serverless d'Amazon Bedrock. Le modèle ciblé est Amazon Nova Micro, un modèle fondation léger disponible sur Bedrock. La solution a été testée sur un volume de 22 000 requêtes mensuelles pour un coût de seulement 0,80 dollar par mois, contre des dépenses bien supérieures avec une infrastructure hébergée en permanence. Deux chemins d'implémentation distincts sont proposés : l'un via la personnalisation gérée d'Amazon Bedrock, l'autre via des jobs d'entraînement Amazon SageMaker AI pour un contrôle plus fin des hyperparamètres. Les deux options convergent vers le même pipeline de déploiement sur Bedrock en inférence à la demande. Le jeu de données utilisé pour la démonstration est sql-create-context, une combinaison des datasets WikiSQL et Spider comprenant plus de 78 000 exemples de questions en langage naturel associées à des requêtes SQL de complexité variable. L'enjeu principal est économique : les modèles fine-tunés nécessitent traditionnellement une infrastructure dédiée tournant en continu, même en l'absence de trafic, ce qui génère des coûts fixes importants. Le modèle pay-per-token d'Amazon Bedrock élimine ce gaspillage en ne facturant que les tokens réellement traités. Pour les entreprises avec des dialectes SQL maison ou des schémas métier très spécifiques, cette combinaison rend accessible la personnalisation des LLMs sans engager de budget infrastructure significatif. Les équipes techniques gagnent également en simplicité opérationnelle : pas de gestion de serveurs, pas de scaling manuel, pas de surveillance d'infrastructure GPU. La génération SQL par IA est un cas d'usage critique en entreprise, car elle permet à des utilisateurs non-techniques d'interroger des bases de données en langage naturel. Les modèles généralistes gèrent bien le SQL standard, mais échouent sur les dialectes propriétaires ou les schémas complexes propres à chaque organisation. Le fine-tuning résout ce problème, mais introduisait jusqu'ici un compromis coûteux. AWS positionne ici Bedrock comme une infrastructure mutualisée capable d'héberger des adaptateurs LoRA à la demande, une approche qui pourrait devenir un standard pour les déploiements d'IA spécialisée à faible volume. La maturité croissante des outils de personnalisation cloud laisse entrevoir une généralisation de ce modèle économique à d'autres tâches NLP d'entreprise.

UELes entreprises européennes hébergées sur AWS peuvent adopter cette architecture serverless pour réduire leurs coûts de déploiement de modèles SQL spécialisés, Bedrock étant disponible dans les régions EU.

OutilsOutil

1 source

3AWS ML Blog

Optimiser la recherche sémantique vidéo avec la distillation de modèles Amazon Nova sur Amazon Bedrock

Amazon Web Services a publié un tutoriel détaillé expliquant comment utiliser la technique de distillation de modèles sur Amazon Bedrock pour optimiser les systèmes de recherche sémantique vidéo. Le cœur du problème : les modèles de grande taille comme Claude Haiku d'Anthropic offrent une excellente précision pour interpréter l'intention de recherche des utilisateurs, mais ils allongent le temps de réponse à 2 à 4 secondes, représentant à eux seuls 75 % de la latence totale. La solution proposée consiste à transférer l'intelligence de routage d'un grand modèle dit "enseignant", Amazon Nova Premier, vers un modèle beaucoup plus léger dit "étudiant", Amazon Nova Micro. Le résultat : une réduction des coûts d'inférence de plus de 95 % et une baisse de la latence de 50 %, sans sacrifier la qualité de routage. L'enjeu est considérable pour les entreprises qui gèrent de larges catalogues vidéo. Lorsqu'un utilisateur tape "Olivia qui parle de son enfance dans la pauvreté", le système doit décider automatiquement quels aspects de la vidéo interroger en priorité : les métadonnées textuelles, la transcription audio, les données visuelles ou les informations structurées. Cette logique de routage devient rapidement complexe à l'échelle enterprise, où les attributs peuvent inclure les angles de caméra, le sentiment, les droits de diffusion ou des taxonomies métier propriétaires. Un modèle plus petit et distillé qui maîtrise cette tâche précise permet de traiter davantage de requêtes simultanément, à un coût marginal quasi nul, ce qui change fondamentalement l'équation économique des moteurs de recherche multimodaux. La distillation de modèles se distingue du fine-tuning supervisé classique par un avantage pratique majeur : elle ne nécessite pas de dataset entièrement étiqueté par des humains. Amazon Bedrock génère automatiquement jusqu'à 15 000 paires prompt-réponse en interrogeant le modèle enseignant, en appliquant des techniques de synthèse et d'augmentation de données. Dans ce pipeline, 10 000 exemples synthétiques ont été produits via Nova Premier, chargés sur Amazon S3, puis utilisés pour entraîner Nova Micro. Le modèle résultant est ensuite évalué via Amazon Bedrock Model Evaluation, comparé à la base Nova Micro et au Claude Haiku original. AWS a publié l'intégralité du notebook Jupyter, le script de génération des données et les utilitaires d'évaluation sur GitHub, rendant cette approche reproductible pour toute équipe souhaitant industrialiser la recherche vidéo à grande échelle.

OutilsTuto

1 source

4AWS ML Blog

Amazon Nova Act est désormais éligible à la conformité HIPAA

Amazon a annoncé que Nova Act, son service d'agents IA autonomes capables d'interagir avec des interfaces web, est désormais éligible HIPAA. Cette certification, publiée en mai 2026, permet aux organisations de santé et de sciences de la vie d'utiliser ces agents pour traiter des informations de santé protégées électroniquement (ePHI) en conformité avec la loi américaine sur la portabilité et la responsabilité en matière d'assurance maladie. Disponible dans la région AWS US East (Virginie du Nord), Nova Act permet de construire et gérer des flottes d'agents IA qui naviguent dans des navigateurs web, remplissent des formulaires, extraient des données et exécutent des workflows complexes en plusieurs étapes, en s'appuyant sur du code Python combiné à des instructions en langage naturel. Le service s'intègre au framework Strands Agents, à Amazon Bedrock AgentCore, CloudWatch et IAM. Concrètement, les établissements de santé, assureurs et prestataires de soins peuvent désormais automatiser des tâches chronophages comme la prise de rendez-vous, la vérification de couverture d'assurance, les autorisations préalables, le suivi des remboursements ou la coordination des référencements entre médecins, sans intervention humaine et sans sortir du cadre réglementaire HIPAA. L'enjeu est considérable : ces processus administratifs représentent une part massive des coûts opérationnels du secteur de la santé aux États-Unis. En réduisant la charge manuelle, Nova Act promet des délais de traitement plus courts pour les remboursements et une exécution plus cohérente des procédures de routine. L'agent peut également remonter une tâche à un superviseur humain lorsqu'il rencontre une situation ambiguë, ce qui maintient un niveau de contrôle nécessaire dans des environnements sensibles. La difficulté jusqu'ici tenait à la nature même des agents IA : contrairement aux modèles de langage qui se contentent de générer du texte, ces systèmes interagissent avec des systèmes réels et accèdent à des données vivantes, ce qui les soumettait à des exigences de conformité bien plus strictes. Amazon a obtenu cette éligibilité en intégrant Nova Act à sa liste de services HIPAA et en permettant aux clients de signer un accord de partenaire commercial (BAA) directement depuis la console AWS. Les organisations restent néanmoins responsables de la configuration de leurs propres contrôles de sécurité, notamment les politiques IAM, le chiffrement via AWS KMS et les journaux CloudTrail. Cette annonce s'inscrit dans une tendance plus large : après les modèles génératifs, c'est maintenant l'IA agentique qui entre dans les secteurs fortement réglementés, ouvrant la voie à une automatisation plus profonde dans la finance, le juridique et la santé.

UECette certification concerne uniquement la réglementation américaine HIPAA ; les organisations de santé européennes devront attendre une conformité équivalente au RGPD avant de pouvoir déployer Nova Act sur des données de santé sensibles.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic