Aller au contenu principal
OutilsAWS ML Blog13sem· 1 min de lecture

Nova Forge SDK : une solution simple pour personnaliser les modèles Nova pour l'IA en entreprise

Source originale ↗·

Amazon lance le Nova Forge SDK, un outil destiné à simplifier radicalement la personnalisation des modèles de langage Amazon Nova pour les entreprises. Conçu pour abaisser les barrières techniques à l'entrée, ce kit de développement unifié couvre l'intégralité du cycle de vie de la customisation — de la préparation des données à l'entraînement et jusqu'au déploiement en production.

La personnalisation des LLMs est devenue un impératif pour les entreprises qui ne peuvent se satisfaire de réponses génériques face à leurs workflows propriétaires et leur terminologie métier spécifique. Jusqu'ici, ces projets exigeaient une infrastructure complexe, une gestion laborieuse des dépendances et un investissement technique considérable. Le Nova Forge SDK répond directement à ce frein en proposant des workflows intelligents avec des paramètres par défaut raisonnés, tout en laissant aux utilisateurs avancés un accès complet aux SDK sous-jacents.

L'outil s'articule autour de trois couches : une couche d'entrée (RuntimeManager) pour configurer le matériel, la plateforme et les permissions IAM ; une couche de customisation qui construit automatiquement les configurations de recettes et lance les jobs d'entraînement ; et une couche de sortie qui génère les artefacts finaux — logs CloudWatch, métriques ML Flow, logs TensorBoard — ainsi que le modèle entraîné, déployable sur Amazon SageMaker AI ou Amazon Bedrock. Le SDK supporte l'ensemble du spectre de customisation : SFT (Supervised Fine-Tuning), RFT (Reinforcement Fine-Tuning), DPO (Direct Preference Optimization), ainsi que les approches LoRA et full rank.

Un point technique notable est la prise en charge de la problématique du "catastrophic forgetting" — ce phénomène par lequel un modèle affiné sur des données spécialisées perd ses capacités générales de raisonnement et de suivi d'instructions. Nova Forge permet de démarrer depuis des checkpoints précoces du modèle et de mélanger les données propriétaires avec les datasets curatés par Amazon Nova, offrant ainsi un équilibre entre spécialisation métier et préservation des compétences fondamentales.

Impact France/UE

Les équipes data européennes utilisant des services cloud peuvent désormais personnaliser des modèles LLM via un SDK unifié sans expertise infrastructure spécifique.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AWS ML Blog 

Lancez vos expériences de personnalisation Nova avec le SDK Nova Forge

Amazon lance le Nova Forge SDK, un outil qui simplifie la personnalisation de grands modèles de langage (LLM) en éliminant les contraintes de gestion des dépendances et de configuration d'infrastructure. Le SDK supporte l'ensemble du spectre de personnalisation, du fine-tuning supervisé (SFT) au Reinforcement Fine-Tuning (RFT), en s'appuyant sur Amazon SageMaker AI et Amazon Nova Forge. Une étude de cas sur la classification de 60 000 questions Stack Overflow en trois catégories de qualité illustre comment le SDK permet d'entraîner et déployer des modèles personnalisés avec des jeux de données à partir de 3 500 exemples.

OutilsOutil
1 source
Les entreprises peuvent entraîner des modèles d'IA personnalisés depuis leurs workflows de production, sans équipe ML
2VentureBeat AI 

Les entreprises peuvent entraîner des modèles d'IA personnalisés depuis leurs workflows de production, sans équipe ML

Empromptu AI, une startup basée à San Francisco, a lancé jeudi une plateforme baptisée Alchemy Models, conçue pour transformer automatiquement les workflows de production d'entreprise en données d'entraînement pour des modèles d'IA personnalisés. Le principe est simple : chaque requête traitée par une application IA, chaque correction apportée par un expert métier à ses résultats, constitue un signal d'apprentissage. Jusqu'ici, ces données disparaissaient dans le vide. Alchemy les capte en continu via une infrastructure appelée Golden Data Pipelines, soumet les sorties de l'application à des experts internes pour validation, puis utilise ces données vérifiées pour lancer des cycles de fine-tuning successifs. Les modèles résultants, que la société appelle Expert Nano Models, sont de petits modèles spécialisés sur une tâche précise plutôt que sur le raisonnement général. L'entreprise est dirigée par Shanea Leven, qui a présenté la plateforme en exclusivité à VentureBeat. Les clients conservent la propriété intégrale des poids du modèle, qui sont portables et exportables moyennant frais. La plateforme est compatible avec Llama, Qwen et d'autres modèles de base. L'enjeu commercial est direct pour les entreprises qui s'appuient aujourd'hui sur des API de modèles fondamentaux : les coûts d'inférence augmentent avec l'usage, les données qui entraînent ces modèles profitent aux fournisseurs et non aux clients, et la personnalisation pour des tâches métier spécifiques reste limitée. Alchemy propose une sortie de cette dépendance en faisant de l'application elle-même la source de données d'entraînement, sans équipe ML ni étape séparée de collecte et d'étiquetage. Comme le résume Leven : "L'application IA que les clients construisent déjà nettoie les données." La gouvernance, les garde-fous et les contrôles de conformité sont intégrés au même pipeline, ce qui signifie que la traçabilité suit le processus d'entraînement. La contrainte principale reste le volume : les premiers déploiements tournent sur le modèle de base le temps que l'application accumule suffisamment de données de production pour déclencher un cycle de fine-tuning utile. Sur le marché du fine-tuning entreprise, Empromptu se positionne face à des acteurs établis comme OpenAI avec son API de fine-tuning et Amazon Web Services avec Bedrock Custom Models. Ces deux solutions imposent aux organisations d'apporter leurs propres jeux de données préparés séparément et de gérer le processus en dehors de leur stack applicatif, ce qui nécessite une équipe ML dédiée. La différenciation d'Alchemy repose sur l'intégration : le workflow applicatif est le pipeline d'entraînement, et non un projet distinct. La question de la soutenabilité économique et du délai avant le premier cycle de fine-tuning efficace reste ouverte, Leven elle-même reconnaissant sans détour que "l'entraînement du modèle prendra du temps". La startup s'adresse à un moment charnière où de nombreuses entreprises cherchent à protéger leur avantage compétitif face à la généralisation rapide des outils IA.

OutilsOutil
1 source
Personnalisation : comment l’IA devient un nouveau levier de performance pour les marques
3FrenchWeb 

Personnalisation : comment l’IA devient un nouveau levier de performance pour les marques

Soixante pour cent des consommateurs estiment vivre des expériences numériques peu ou pas personnalisées, malgré des années d'investissements marketing dans ce domaine. Ce fossé entre les ambitions des marques et la réalité perçue par leurs clients constitue l'angle central d'un webinaire organisé par FW.MEDIA, consacré au rôle croissant de l'intelligence artificielle dans les stratégies de personnalisation. L'événement réunit des acteurs du marketing digital autour d'une question centrale : comment l'IA peut-elle transformer concrètement les parcours client sans alourdir les opérations ? L'enjeu est significatif pour l'ensemble du secteur. La personnalisation à grande échelle reste coûteuse et complexe à opérationnaliser pour la plupart des marques, qui peinent à aller au-delà des segments larges ou des recommandations produits basiques. L'IA générative et les systèmes de recommandation avancés ouvrent la possibilité de personnaliser en temps réel des contenus, offres et interactions, ce qui pourrait réduire le taux d'attrition, améliorer les conversions et renforcer la fidélité client sans multiplier les ressources humaines nécessaires. Cette problématique s'inscrit dans un mouvement de fond où les outils d'IA deviennent accessibles aux équipes marketing non techniques. Alors que des plateformes comme Adobe, Salesforce ou HubSpot intègrent des fonctionnalités d'IA directement dans leurs produits, la question n'est plus de savoir si les marques adopteront ces technologies, mais à quelle vitesse et avec quelle maîtrise des données clients. La régulation européenne sur la protection des données personnelles (RGPD) reste un paramètre incontournable dans ce déploiement.

UELe RGPD contraint directement les marques européennes dans leurs déploiements d'IA de personnalisation, limitant les usages des données clients et imposant un cadre de conformité spécifique.

OutilsOutil
1 source
OpenAI lance Privacy Filter, un modèle open source de suppression des données personnelles dans les jeux de données d'entreprise
4VentureBeat AI 

OpenAI lance Privacy Filter, un modèle open source de suppression des données personnelles dans les jeux de données d'entreprise

OpenAI a publié Privacy Filter, un modèle open source spécialisé dans la détection et la suppression des informations personnelles identifiables (PII) avant qu'elles n'atteignent un serveur distant. Disponible sur Hugging Face sous licence Apache 2.0, cet outil repose sur 1,5 milliard de paramètres mais n'en active que 50 millions à chaque traitement, grâce à une architecture Sparse Mixture-of-Experts qui réduit considérablement la charge de calcul. Contrairement aux grands modèles de langage classiques qui lisent un texte de gauche à droite, Privacy Filter est un classificateur bidirectionnel de tokens : il analyse chaque phrase dans les deux sens simultanément, ce qui lui permet de mieux distinguer, par exemple, si le prénom "Alice" désigne une personne privée ou un personnage littéraire public. Le modèle gère une fenêtre de contexte de 128 000 tokens, suffisante pour traiter un document juridique entier en une seule passe, et s'appuie sur un décodeur de Viterbi contraint avec un schéma de balisage BIOES pour garantir la cohérence des entités redactées. Il détecte huit catégories de données sensibles : noms de personnes, coordonnées, identifiants numériques, URLs, numéros de compte, dates et identifiants secrets comme les clés API. L'enjeu concret est considérable pour les entreprises soumises au RGPD ou à la réglementation HIPAA dans le secteur de la santé. En déployant Privacy Filter directement sur leurs serveurs internes ou dans leur cloud privé, elles peuvent anonymiser les données localement avant de les envoyer vers un modèle plus puissant comme GPT-5 ou gpt-oss-120b, sans jamais exposer d'informations sensibles à l'extérieur. Ce modèle résout un problème structurel de l'adoption de l'IA en entreprise : le risque que des données confidentielles, médicales ou financières se retrouvent intégrées dans des pipelines d'inférence ou de fine-tuning hébergés dans le cloud. La possibilité de faire tourner le modèle sur un laptop standard ou directement dans un navigateur web abaisse encore davantage la barrière d'entrée. Cette publication s'inscrit dans un retour marqué d'OpenAI vers l'open source, après des années centrées sur des modèles propriétaires accessibles uniquement via ChatGPT et l'API. Début 2025, l'entreprise avait déjà lancé la famille gpt-oss, des modèles à poids ouverts orientés raisonnement, puis ouvert plusieurs outils d'orchestration agentique. Privacy Filter est un dérivé direct de cette famille gpt-oss, réentraîné pour la classification plutôt que la génération. Ce virage stratégique suggère qu'OpenAI cherche à consolider sa position dans l'écosystème développeur face à la concurrence de Meta (LLaMA), Mistral et Google, en proposant des briques d'infrastructure que les entreprises peuvent intégrer sans dépendance à ses services payants. La prochaine étape logique serait l'extension des catégories PII supportées et l'intégration native dans les frameworks agentiques déjà publiés.

UELes entreprises françaises et européennes soumises au RGPD peuvent déployer Privacy Filter en local pour anonymiser leurs données sensibles avant tout envoi vers un service cloud, réduisant directement leur risque de non-conformité réglementaire.

💬 C'est exactement le verrou qui bloquait l'adoption en entreprise depuis deux ans. Un modèle léger, déployable en local, qui filtre les données personnelles avant d'envoyer vers le cloud : sur le papier, c'est le genre de brique qu'on attendait. Et distribuer ça sous Apache 2.0, c'est malin : si ton pipeline s'appuie sur leurs outils gratuits, tu vas finir par appeler leurs modèles payants derrière.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic