Aller au contenu principal
OutilsAWS ML Blog3h· 2 min de lecture

Le titre traduit : « BoltzGen accélère la conception de protéines sur Amazon SageMaker AI »

Source originale ↗·

Amazon vient de déployer BoltzGen sur Amazon SageMaker AI, une solution qui automatise la gestion de l'infrastructure GPU nécessaire à la conception de protéines. BoltzGen est un modèle génératif basé sur la diffusion, capable de concevoir des protéines et des peptides se liant à des cibles biomoléculaires précises. Une campagne de conception typique enchaîne plusieurs étapes gourmandes en calcul GPU : génération du squelette protéique, repliement inverse, validation structurelle et classement des candidats. Sur une instance à 4 GPU (ml.g5.12xlarge), une campagne de 1 000 échantillons demande environ 375 heures de calcul, selon les données de référence du dépôt du projet. SageMaker AI prend en charge l'ensemble du cycle de vie de ces calculs : il provisionne les instances GPU, exécute BoltzGen dans un conteneur, écrit les résultats sur Amazon S3, puis libère les ressources une fois le traitement terminé. La facturation se fait à la seconde, sans coût lié à des GPU inactifs : une session de conception de deux heures sur ml.g4dn.xlarge revient à environ 1,50 dollar au tarif à la demande.

Cette automatisation change concrètement la donne pour les laboratoires de recherche académique, les start-up en biotechnologie, les équipes de R&D pharmaceutique et les programmes éducatifs qui travaillent sur la conception de protéines de liaison, l'ingénierie de protéines thérapeutiques ou l'architecture protéique de novo. Jusqu'ici, ces équipes devaient elles-mêmes construire des environnements CUDA, gérer le cycle de vie des instances GPU, bâtir des pipelines de données entre chaque étape et gérer les pannes lors de traitements longs. En déchargeant ces tâches d'infrastructure, SageMaker AI permet aux chercheurs de se concentrer sur l'itération des designs plutôt que sur l'exploitation technique. Le système offre aussi un mécanisme de mise en cache au niveau de chaque étape, avec une expiration de sept jours sur Amazon S3 : lorsqu'un chercheur ajuste ses paramètres de filtrage, l'étape de génération de designs, qui représente environ 90 % du coût de calcul total, n'a pas besoin d'être relancée.

Le déploiement propose deux modes d'exécution adaptés à différentes phases de recherche, de la validation rapide sur quelques candidats jusqu'au traitement par lots en production, avec la possibilité de paralléliser sur plusieurs GPU au sein d'une même instance ou sur plusieurs instances. Le choix d'instances va des GPU T4 les moins coûteux (ml.g4dn) aux GPU NVIDIA L40S (ml.g6e), offrant une flexibilité de coût selon le débit recherché. Techniquement, BoltzGen combine un processus de diffusion pour générer les structures de squelette avec un modèle de repliement inverse baptisé BoltzIF, qui produit les séquences d'acides aminés, avant validation par les prédictions de structure de Boltz2. L'implémentation complète, avec scripts d'installation et guide de démarrage rapide, est disponible sur le dépôt GitHub Boltzgen on SageMaker.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Amazon SageMaker Feature Store accélère les pipelines ML avec de nouvelles fonctionnalités
1AWS ML Blog 

Amazon SageMaker Feature Store accélère les pipelines ML avec de nouvelles fonctionnalités

Amazon Web Services a annoncé le 16 avril 2026 trois nouvelles fonctionnalités pour SageMaker Feature Store, son dépôt managé dédié au stockage et au partage de features pour les modèles de machine learning. Ces nouveautés sont disponibles dès la version 3.8.0 du SDK Python SageMaker. La première est une intégration native avec AWS Lake Formation, qui permet d'appliquer automatiquement des contrôles d'accès granulaires, au niveau colonne, ligne et cellule, dès la création d'un groupe de features, sans configuration manuelle préalable. La deuxième porte sur la gestion du cycle de vie des métadonnées Apache Iceberg, avec de nouveaux paramètres pour contrôler la rétention des snapshots et éviter l'accumulation de fichiers. La troisième est la modernisation du SDK lui-même : architecture modulaire, performances améliorées, suppression des dépendances lourdes comme PyTorch, pour une installation plus rapide dans des environnements plus légers. Ces changements répondent à deux problèmes opérationnels concrets que rencontrent les équipes ML en production. Sur la question des coûts d'abord : une équipe d'analytique retail citée par AWS a accumulé plus de 50 téraoctets de fichiers de métadonnées Iceberg en moins d'un an sur Amazon S3, générant des frais inattendus et substantiels. Les nouvelles propriétés de table permettent de définir des politiques de rétention directement à la création du groupe de features, ou de les appliquer rétroactivement sur des groupes existants. Sur la question des accès ensuite : les équipes infrastructure réclamaient un contrôle des permissions qui s'active automatiquement, sans passer par des configurations répétitives après coup. L'intégration Lake Formation répond précisément à cela, en vérifiant l'existence d'au moins un Data Lake Administrator dans le compte avant d'activer le contrôle d'accès. SageMaker Feature Store existe depuis 2020 comme composant central de la plateforme ML d'AWS, permettant de stocker des features calculées une fois et de les réutiliser à travers plusieurs modèles et équipes. L'adoption du format Apache Iceberg pour le stockage offline avait apporté des gains en termes de requêtes et de versioning, mais avait aussi introduit ce problème de prolifération de métadonnées qui n'était pas anticipé à grande échelle. La prise en charge complète dans le SDK v3, qui inclut la gestion du cycle de vie des groupes, les opérations sur les enregistrements, et l'ingestion depuis Pandas et Spark, signale qu'AWS consolide son infrastructure ML autour de cette version modernisée. Pour les équipes qui font tourner des pipelines de features en production à haute fréquence, ces ajustements peuvent représenter des économies significatives et une réduction de la friction opérationnelle.

UEImpact indirect pour les entreprises européennes opérant des pipelines ML en production, qui peuvent bénéficier de réductions de coûts de stockage et d'une gouvernance des accès simplifiée.

OutilsActu
1 source
Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur
2AWS ML Blog 

Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur

Amazon a introduit une fonctionnalité de personnalisation de modèles sans serveur dans SageMaker AI, permettant aux équipes d'améliorer drastiquement les capacités d'appel d'outils des agents IA sans gérer d'infrastructure GPU. Dans un cas concret publié début avril 2026, des ingénieurs ont affiné le modèle Qwen 2.5 7B Instruct en utilisant la technique RLVR (Reinforcement Learning with Verifiable Rewards) et ont obtenu une amélioration de 57% du score de qualité des appels d'outils sur des scénarios inédits, c'est-à-dire des outils que le modèle n'avait jamais vus lors de l'entraînement. La méthode repose sur un principe simple : le modèle génère huit réponses candidates par prompt, une fonction de récompense vérifie lesquelles sont correctes, et l'algorithme GRPO (Group Relative Policy Optimization) renforce les comportements qui surpassent la moyenne du groupe. SageMaker AI prend en charge les familles de modèles Amazon Nova, Llama, Qwen et DeepSeek, avec un suivi des métriques via MLflow intégré. L'enjeu est concret : les agents IA en production échouent fréquemment lors des appels d'outils, qu'il s'agisse d'halluciner des fonctions inexistantes, de passer des paramètres incorrects, ou de déclencher une action là où ils devraient demander une clarification. Ces erreurs bloquent le déploiement en production et détruisent la confiance des utilisateurs. La nouvelle approche serverless d'Amazon supprime l'obstacle opérationnel majeur que représentait jusqu'ici le fine-tuning par renforcement : achat de GPU, orchestration mémoire entre les phases de rollout et d'entraînement, infrastructure de récompenses, gestion des checkpoints. Les équipes peuvent désormais se concentrer sur leurs données, leur modèle et leur fonction de récompense, le reste étant géré par la plateforme. Le fine-tuning supervisé classique (SFT) montre ses limites pour ce type de tâche : il nécessite des exemples étiquetés pour chaque comportement souhaité, mais peine à généraliser la prise de décision entre appeler un outil, demander des informations supplémentaires, ou refuser d'agir. RLVR contourne ce problème en exploitant la nature vérifiable des appels d'outils : soit le modèle a appelé la bonne fonction avec les bons paramètres, soit non. Cette objectivité binaire rend l'appel d'outils particulièrement adapté à l'apprentissage par renforcement. Amazon positionne cette offre dans un marché de l'IA agentique en forte croissance, où des acteurs comme Google (Vertex AI), Microsoft (Azure ML) et des startups spécialisées se disputent les équipes qui cherchent à industrialiser des agents fiables, avec un accès simplifié via SageMaker Studio et un compte AWS standard.

OutilsActu
1 source
ComfyUI sur Amazon SageMaker : exécuter des workflows de traitement
3AWS ML Blog 

ComfyUI sur Amazon SageMaker : exécuter des workflows de traitement

Amazon Web Services a publié un guide technique détaillant comment exécuter des workflows ComfyUI sur Amazon SageMaker AI, via ses "processing jobs", pour automatiser la génération de contenu visuel à grande échelle. La solution repose sur AWS Cloud Development Kit (CDK) et des instances GPU accélérées avec une facturation à la seconde et arrêt automatique à la fin du job. En pratique, le dispositif permet de générer des centaines d'images haute qualité en un seul batch, à partir de workflows ComfyUI exportés au format JSON. AWS illustre également l'intégration du modèle Z-Image Turbo, un modèle texte-vers-image reposant sur une architecture Transformer à flux unique (S3DiT) de 6 milliards de paramètres, 30 couches, une taille cachée de 3 840 et 32 têtes d'attention, avec une technique de fusion précoce qui traite uniformément les tokens texte et image dans le même Transformer. Pour les équipes marketing et créatives des grandes entreprises, cette automatisation change concrètement les règles du jeu. Là où un designer devait itérer manuellement pour produire des visuels adaptés à chaque marché ou segment d'audience, il devient possible de générer en une heure des centaines de visuels cohérents avec la charte graphique, des voix synthétisées multilingues pour des campagnes publicitaires, ou des clips vidéo avec scripts et images générés par IA. La facturation à la seconde de SageMaker élimine le gaspillage de compute, tandis que l'architecture en file d'attente traite plusieurs demandes en parallèle sans intervention manuelle. L'enjeu commercial est direct : chaque heure gagnée en production de contenu peut être réinvestie dans le lancement d'une campagne supplémentaire ou le ciblage d'un nouveau segment d'audience. Cette initiative s'inscrit dans une tendance de fond : les hyperscalers intègrent de plus en plus les outils open-source de l'IA générative dans leurs plateformes cloud managées, pour capter les workflows déjà adoptés par les praticiens. ComfyUI s'est imposé comme standard de facto pour composer des pipelines d'IA générative complexes sans coder chaque étape, grâce à son interface visuelle modulaire et ses workflows versionnables. En le portant sur SageMaker, AWS vise les entreprises qui utilisent déjà ComfyUI en local mais peinent à le faire passer à l'échelle en production. La prise en charge de modèles comme Z-Image Turbo, avec son architecture decoder-only inspirée des grands modèles de langage, signale aussi que la frontière entre génération de texte et génération d'image continue de s'estomper sur le plan architectural, ouvrant la voie à des pipelines multimodaux encore plus intégrés.

OutilsOutil
1 source
Des workflows guidés par agents pour accélérer la personnalisation de modèles dans Amazon SageMaker AI
4AWS ML Blog 

Des workflows guidés par agents pour accélérer la personnalisation de modèles dans Amazon SageMaker AI

Amazon a lancé une expérience agentique intégrée dans SageMaker AI pour simplifier radicalement la personnalisation des modèles de langage. Jusqu'ici, adapter un modèle fondation à un cas d'usage métier exigeait de maîtriser des techniques comme le Supervised Fine-Tuning (SFT), le Direct Preference Optimization (DPO) ou le Reinforcement Learning Verifiable Rewards (RLVR), de naviguer entre des APIs fragmentées et des formats de données spécifiques à chaque modèle, et de gérer des cycles d'expérimentation qui s'étiraient sur plusieurs mois. Désormais, un développeur peut décrire son cas d'usage en langage naturel, et l'agent de codage prend en charge l'ensemble du parcours: définition du problème, préparation des données, sélection de la technique d'entraînement, évaluation de la qualité du modèle, puis déploiement vers Amazon Bedrock ou un endpoint SageMaker AI. Amazon Kiro, l'agent de développement logiciel d'Amazon, est préconfiguré par défaut dans l'environnement JupyterLab de SageMaker AI Studio, avec complétion de code, débogage assisté et support interactif. Les agents compatibles avec le protocole ACP (Agent Communication Protocol), dont Claude Code d'Anthropic, peuvent également être intégrés et bénéficier des mêmes fonctionnalités. La version 4.1 ou supérieure de SageMaker AI Distribution est requise, ainsi qu'un rôle IAM avec la politique gérée AmazonSageMakerFullAccess. Le coeur du dispositif repose sur des "Skills", des modules d'instructions préconçus et modulaires qui encapsulent l'expertise AWS et data science sur l'ensemble du cycle de personnalisation. Lorsqu'un développeur décrit son besoin, l'agent active automatiquement les Skills pertinents, qui le guident à travers la validation des données, la configuration des hyperparamètres et l'évaluation du modèle via des métriques LLM-as-a-Judge. Chaque étape génère des notebooks directement exécutables, entièrement modifiables et réutilisables dans des workflows existants. Un avantage opérationnel concret: les Skills réduisent la consommation de tokens tout en augmentant la précision des réponses, car l'agent dispose d'un contexte spécialisé plutôt que de connaissances génériques. Les organisations peuvent personnaliser ces Skills pour les aligner sur leurs standards de gouvernance, leurs outils internes et leurs pratiques d'équipe, résolvant ainsi un problème récurrent avec les assistants de codage généralistes qui ne reproduisent pas de manière fiable les conventions maison. L'annonce s'inscrit dans une dynamique plus large où la personnalisation des modèles devient le principal levier de différenciation concurrentielle, tous les acteurs ayant accès aux mêmes modèles fondations publics. Amazon positionne SageMaker AI comme une plateforme bout-en-bout pour les équipes qui veulent exploiter leurs données propriétaires sans assembler elles-mêmes une chaîne d'outils dispersés. La prise en charge du protocole ACP ouvre la voie à un écosystème d'agents tiers, signalant une stratégie d'interopérabilité plutôt que de verrouillage. Les prochaines étapes naturelles incluent l'extension de ce type d'expérience agentique à d'autres phases du cycle MLOps, comme la surveillance des modèles en production ou la gestion des dérives de données.

UELes équipes data européennes utilisant AWS SageMaker AI peuvent accélérer leurs projets de fine-tuning de modèles fondation sans expertise MLOps avancée, réduisant les délais de personnalisation sur données propriétaires.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic