Aller au contenu principal
OutilsAWS ML Blog13sem· 1 min de lecture

Lancez vos expériences de personnalisation Nova avec le SDK Nova Forge

Source originale ↗·

Amazon franchit une nouvelle étape dans la démocratisation de la personnalisation des grands modèles de langage avec le lancement du Nova Forge SDK, un outil conçu pour simplifier radicalement le fine-tuning des modèles Amazon Nova. Fini les configurations laborieuses de dépendances, de sélection d'images ou de recettes d'entraînement — le SDK centralise l'ensemble du pipeline de personnalisation en une interface unifiée, accessible même aux équipes sans expertise infrastructure poussée.

L'enjeu est considérable : la personnalisation des LLM reste aujourd'hui un frein majeur à leur adoption en entreprise. En intégrant nativement Amazon SageMaker AI, le Nova Forge SDK couvre l'intégralité du spectre de personnalisation, du fine-tuning supervisé classique jusqu'aux techniques avancées de renforcement (Reinforcement Fine-Tuning, ou RFT), sans rupture de plateforme. C'est un changement de paradigme pour les équipes data qui cherchent à adapter des modèles fondation à des cas d'usage métier précis.

Pour illustrer les capacités du SDK, Amazon a conduit une étude de cas sur la classification automatique de questions Stack Overflow en trois catégories de qualité : HQ (haute qualité), LQEDIT (basse qualité, éditée) et LQCLOSE (basse qualité, fermée). Le jeu de données utilisé contient 60 000 questions collectées entre 2016 et 2020, dont 4 700 ont été échantillonnées : 3 500 pour le fine-tuning supervisé, 500 pour l'évaluation, et 700 supplémentaires pour le RFT — augmentés des 3 500 exemples SFT pour éviter l'oubli catastrophique. Le processus suit quatre étapes séquentielles : évaluation de référence, SFT, RFT sur checkpoint SFT, puis déploiement sur un endpoint d'inférence SageMaker AI.

Le positionnement d'Amazon est clair : traiter la personnalisation comme un continuum sur l'échelle de scaling, et non comme une étape isolée. Avec des améliorations mesurables à chaque phase d'entraînement, le Nova Forge SDK s'adresse directement aux équipes cherchant à industrialiser leurs workflows de fine-tuning sans sacrifier la flexibilité technique — une réponse directe à la pression concurrentielle d'OpenAI, Google et Mistral sur le marché de la personnalisation LLM.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AWS ML Blog 

Nova Forge SDK : une solution simple pour personnaliser les modèles Nova pour l'IA en entreprise

Amazon lance le Nova Forge SDK, un outil unifié permettant aux entreprises de personnaliser les modèles LLM Nova sans les contraintes techniques habituelles (gestion des dépendances, configuration d'infrastructure). Le SDK couvre l'ensemble du cycle de personnalisation — préparation des données, entraînement, déploiement — et supporte toutes les options de customisation d'Amazon Bedrock et Amazon SageMaker AI, dont le SFT, RFT, DPO, LoRA et full rank. Il s'attaque notamment au problème du catastrophic forgetting en permettant aux équipes de partir de checkpoints précoces des modèles Nova et de fusionner leurs données propriétaires avec les datasets curés par Amazon.

UELes équipes data européennes utilisant des services cloud peuvent désormais personnaliser des modèles LLM via un SDK unifié sans expertise infrastructure spécifique.

OutilsOutil
1 source
2AWS ML Blog 

Créer des fonctions de récompense efficaces avec AWS Lambda pour personnaliser Amazon Nova

Amazon Web Services propose une méthode concrète pour personnaliser ses modèles de langage Amazon Nova grâce à AWS Lambda comme moteur d'évaluation. L'approche repose sur le Reinforcement Fine-tuning (RFT), une technique d'apprentissage par renforcement qui se distingue du traditionnel Supervised Fine-tuning (SFT) : là où le SFT exige des milliers d'exemples annotés avec des raisonnements détaillés, le RFT apprend à partir de signaux d'évaluation appliqués aux réponses finales du modèle. Concrètement, une fonction Lambda reçoit les réponses générées par Nova lors de l'entraînement, les évalue selon plusieurs critères (exactitude, sécurité, formatage, concision) et retourne un score numérique, généralement compris entre -1 et 1. Les scores élevés renforcent les comportements positifs ; les scores faibles les découragent. Ce cycle se répète des milliers de fois pour affiner progressivement le modèle, avec Amazon CloudWatch qui surveille la distribution des scores en temps réel. L'intérêt de cette architecture est double, technique et économique. Sur le plan technique, elle permet de définir des systèmes de récompense multi-dimensionnels qui capturent des critères de qualité nuancés, réduisant ainsi le risque de "reward hacking", ces situations où un modèle exploite des raccourcis pour maximiser son score sans réellement progresser sur les objectifs visés. Un cas typique serait une réponse de service client qui doit simultanément être précise, empathique, concise et conforme à l'identité de la marque : autant de critères difficiles à couvrir avec des exemples annotés. Sur le plan économique, Lambda s'adapte automatiquement à la charge d'entraînement sans qu'une équipe ait à gérer une infrastructure dédiée, rendant la personnalisation de modèles fondamentaux accessible à des développeurs sans expertise approfondie en machine learning. Cette publication s'inscrit dans une concurrence intense entre les grands fournisseurs cloud pour démocratiser la personnalisation des grands modèles de langage. Google, Microsoft et AWS se disputent les entreprises qui souhaitent adapter des modèles fondamentaux à leurs cas d'usage métier sans repartir de zéro. Amazon Nova, lancé fin 2024, représente l'offensive d'AWS sur ce marché avec une gamme de modèles positionnés sur le rapport performance/coût. En proposant une intégration native entre RFT, Lambda et CloudWatch, AWS cherche à réduire la friction technique qui freine encore l'adoption en entreprise. Deux variantes coexistent selon les besoins : RLVR (Reinforcement Learning via Verifiable Rewards) pour les tâches à réponses objectivement vérifiables comme du code ou des calculs, et RLAIF (Reinforcement Learning via AI Feedback) pour des évaluations plus subjectives. Les prochaines étapes logiques seront l'extension de ces outils à d'autres modèles Nova et une intégration plus poussée avec les pipelines MLOps existants sur AWS.

OutilsOutil
1 source
Personnalisation : comment l’IA devient un nouveau levier de performance pour les marques
3FrenchWeb 

Personnalisation : comment l’IA devient un nouveau levier de performance pour les marques

Soixante pour cent des consommateurs estiment vivre des expériences numériques peu ou pas personnalisées, malgré des années d'investissements marketing dans ce domaine. Ce fossé entre les ambitions des marques et la réalité perçue par leurs clients constitue l'angle central d'un webinaire organisé par FW.MEDIA, consacré au rôle croissant de l'intelligence artificielle dans les stratégies de personnalisation. L'événement réunit des acteurs du marketing digital autour d'une question centrale : comment l'IA peut-elle transformer concrètement les parcours client sans alourdir les opérations ? L'enjeu est significatif pour l'ensemble du secteur. La personnalisation à grande échelle reste coûteuse et complexe à opérationnaliser pour la plupart des marques, qui peinent à aller au-delà des segments larges ou des recommandations produits basiques. L'IA générative et les systèmes de recommandation avancés ouvrent la possibilité de personnaliser en temps réel des contenus, offres et interactions, ce qui pourrait réduire le taux d'attrition, améliorer les conversions et renforcer la fidélité client sans multiplier les ressources humaines nécessaires. Cette problématique s'inscrit dans un mouvement de fond où les outils d'IA deviennent accessibles aux équipes marketing non techniques. Alors que des plateformes comme Adobe, Salesforce ou HubSpot intègrent des fonctionnalités d'IA directement dans leurs produits, la question n'est plus de savoir si les marques adopteront ces technologies, mais à quelle vitesse et avec quelle maîtrise des données clients. La régulation européenne sur la protection des données personnelles (RGPD) reste un paramètre incontournable dans ce déploiement.

UELe RGPD contraint directement les marques européennes dans leurs déploiements d'IA de personnalisation, limitant les usages des données clients et imposant un cadre de conformité spécifique.

OutilsOutil
1 source
Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur
4AWS ML Blog 

Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur

Amazon a introduit une fonctionnalité de personnalisation de modèles sans serveur dans SageMaker AI, permettant aux équipes d'améliorer drastiquement les capacités d'appel d'outils des agents IA sans gérer d'infrastructure GPU. Dans un cas concret publié début avril 2026, des ingénieurs ont affiné le modèle Qwen 2.5 7B Instruct en utilisant la technique RLVR (Reinforcement Learning with Verifiable Rewards) et ont obtenu une amélioration de 57% du score de qualité des appels d'outils sur des scénarios inédits, c'est-à-dire des outils que le modèle n'avait jamais vus lors de l'entraînement. La méthode repose sur un principe simple : le modèle génère huit réponses candidates par prompt, une fonction de récompense vérifie lesquelles sont correctes, et l'algorithme GRPO (Group Relative Policy Optimization) renforce les comportements qui surpassent la moyenne du groupe. SageMaker AI prend en charge les familles de modèles Amazon Nova, Llama, Qwen et DeepSeek, avec un suivi des métriques via MLflow intégré. L'enjeu est concret : les agents IA en production échouent fréquemment lors des appels d'outils, qu'il s'agisse d'halluciner des fonctions inexistantes, de passer des paramètres incorrects, ou de déclencher une action là où ils devraient demander une clarification. Ces erreurs bloquent le déploiement en production et détruisent la confiance des utilisateurs. La nouvelle approche serverless d'Amazon supprime l'obstacle opérationnel majeur que représentait jusqu'ici le fine-tuning par renforcement : achat de GPU, orchestration mémoire entre les phases de rollout et d'entraînement, infrastructure de récompenses, gestion des checkpoints. Les équipes peuvent désormais se concentrer sur leurs données, leur modèle et leur fonction de récompense, le reste étant géré par la plateforme. Le fine-tuning supervisé classique (SFT) montre ses limites pour ce type de tâche : il nécessite des exemples étiquetés pour chaque comportement souhaité, mais peine à généraliser la prise de décision entre appeler un outil, demander des informations supplémentaires, ou refuser d'agir. RLVR contourne ce problème en exploitant la nature vérifiable des appels d'outils : soit le modèle a appelé la bonne fonction avec les bons paramètres, soit non. Cette objectivité binaire rend l'appel d'outils particulièrement adapté à l'apprentissage par renforcement. Amazon positionne cette offre dans un marché de l'IA agentique en forte croissance, où des acteurs comme Google (Vertex AI), Microsoft (Azure ML) et des startups spécialisées se disputent les équipes qui cherchent à industrialiser des agents fiables, avec un accès simplifié via SageMaker Studio et un compte AWS standard.

OutilsActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic