Le réglage fin des modèles Amazon Nova pour une extraction précise des données d'e-mails
Voici l'article traduit et résumé en français :
Parcel Perform, plateforme d'expérience de livraison basée sur l'IA destinée aux entreprises d'ecommerce, a collaboré avec le AWS Generative AI Innovation Center (GenAIIC) pour résoudre un problème concret : extraire des données structurées à partir d'emails aux formats très divers, des simples notifications aux documents HTML complexes truffés d'éléments JavaScript. L'équipe a utilisé Amazon SageMaker AI pour affiner par fine-tuning les modèles Amazon Nova Micro et Nova Lite, en s'appuyant sur l'apprentissage supervisé (SFT) combiné à la technique PEFT (Parameter-Efficient Fine-Tuning) via LoRA (Low-Rank Adaptation), une méthode qui permet de personnaliser un modèle avec peu de données d'entraînement tout en limitant les ressources de calcul nécessaires. Selon Le Vy, responsable de l'équipe IA chez Parcel Perform, le modèle Nova Micro ainsi spécialisé a atteint jusqu'à 94,77 % de précision d'extraction sur le jeu de données de test, soit une amélioration de 16,6 points de pourcentage par rapport au modèle de référence, tout en réduisant la latence d'inférence de plus de 30 % et en divisant les coûts par deux par rapport à la solution précédemment utilisée par l'entreprise.
Ces gains ne sont pas anecdotiques pour une entreprise qui traite des millions de messages email par jour : les modèles génériques peinaient à distinguer des champs proches comme les numéros de commande et les numéros de suivi, produisaient des hallucinations, et le traitement d'emails au format HTML faisait exploser les coûts en tokens. En apprenant au modèle à reconnaître les schémas de données propres à Parcel Perform, le fine-tuning a permis de résoudre simultanément trois problèmes distincts, la précision, la latence et le coût, ce qui est rare puisque ces métriques s'améliorent rarement de concert. Résultat concret : la version optimisée de Nova Micro égale ou dépasse les performances de Nova Lite tout en coûtant moins cher, ce qui a permis à Parcel Perform de déployer la solution en production pour ses opérations logistiques.
Sur le plan technique, le workflow repose sur la préparation de données d'entraînement au format de conversation Amazon Bedrock, associant le contenu d'un email aux entités à en extraire, hébergées sur Amazon S3 avant le lancement du job de fine-tuning sur SageMaker AI à l'aide d'une configuration LoRA. Le modèle final est ensuite déployé sur Amazon Bedrock en inférence à la demande, facturée au token. Ce projet illustre une tendance plus large chez AWS : pousser les entreprises à personnaliser des modèles de taille réduite, via des "recettes" Nova au format YAML qui standardisent les hyperparamètres d'entraînement, plutôt que de s'appuyer sur des modèles génériques massifs, jugés plus coûteux et moins précis sur des tâches d'extraction très spécifiques au métier.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.



