Aller au contenu principal
Agents Jupyter: formation de grands modèles de langage à raisonner avec des notebooks
OutilsHuggingFace Blog34sem

Agents Jupyter: formation de grands modèles de langage à raisonner avec des notebooks

Résumé IASource uniqueImpact UE
Source originale ↗·

Les chercheurs ont développé des "agents Jupyter", qui sont des interfaces permettant aux grands modèles de langage de communiquer avec des notebooks interactifs. Ces agents facilitent l'interaction entre les modèles de langage et les utilisateurs pour effectuer des tâches de raisonnement, améliorant ainsi l'interaction et l'efficacité dans l'utilisation de ces modèles pour des activités nécessitant des processus de pensée complexes.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Créer des agents Strands avec les modèles SageMaker AI et MLflow
1AWS ML Blog 

Créer des agents Strands avec les modèles SageMaker AI et MLflow

Amazon Web Services a publié un guide technique détaillant la construction d'agents d'intelligence artificielle en combinant trois de ses outils : le SDK open source Strands Agents, les endpoints de modèles Amazon SageMaker AI, et la plateforme d'observabilité MLflow hébergée sur SageMaker Serverless. Le SDK Strands, à approche pilotée par le modèle, permet de créer un agent fonctionnel en quelques lignes de code en associant un modèle de langage, un prompt système et un ensemble d'outils. Les modèles sont déployés via SageMaker JumpStart, un hub machine learning qui permet d'évaluer et de sélectionner rapidement des modèles de fondation selon des critères de qualité et de responsabilité prédéfinis. L'intégration de MLflow permet ensuite de tracer les appels d'agents, de versionner les modèles et d'implémenter des tests A/B entre plusieurs variantes de modèles pour en évaluer les performances à l'aide de métriques objectives. Cette architecture répond à un besoin concret des grandes entreprises qui ne peuvent pas se contenter des services de modèles entièrement gérés : contrôle précis sur les instances de calcul, politiques de mise à l'échelle, configuration réseau compatible avec les architectures de sécurité existantes, et conformité en matière de résidence des données. Là où Amazon Bedrock simplifie l'accès aux modèles de fondation en masquant l'infrastructure, SageMaker AI laisse à l'organisation la maîtrise de l'endroit et de la manière dont l'inférence se produit, ce qui est décisif pour les secteurs réglementés comme la finance ou la santé. La couche MLflow ajoute une dimension industrielle : les équipes peuvent comparer les performances de différents modèles dans des conditions réelles, réduire les coûts en sélectionnant le modèle le plus efficace pour chaque tâche, et maintenir un historique d'expériences exploitable dans le temps. La publication de ce guide s'inscrit dans une course plus large pour capter les déploiements d'agents IA en production. AWS répond ainsi à la demande croissante des équipes MLOps qui veulent bénéficier de la commodité du cloud tout en conservant une maîtrise fine de l'infrastructure, une position souvent impossible avec les APIs gérées de type Bedrock ou OpenAI. Strands Agents, rendu open source par Amazon, concurrence directement des frameworks comme LangChain ou CrewAI, avec l'avantage d'une intégration native dans l'écosystème AWS. L'accent mis sur les tests A/B et l'évaluation continue des agents signale que le secteur entre dans une phase de maturité : il ne s'agit plus seulement de faire fonctionner un agent, mais de le mesurer, le comparer, et l'améliorer de façon systématique en production.

UECette architecture de déploiement d'agents avec contrôle fin sur la résidence des données répond aux exigences du RGPD, la rendant pertinente pour les secteurs réglementés européens comme la finance et la santé.

OutilsOutil
1 source
Luma Labs lance Uni-1 : le modèle Transformer autorégressif qui raisonne par intentions avant de générer des images
2MarkTechPost 

Luma Labs lance Uni-1 : le modèle Transformer autorégressif qui raisonne par intentions avant de générer des images

Luma Labs vient de lancer Uni-1, un modèle de génération d'images basé sur une architecture transformer autorégressif decoder-only, qui se distingue des modèles de diffusion classiques (comme Stable Diffusion ou Flux) en traitant texte et images comme une séquence unifiée de tokens. Avant de générer une image, le modèle effectue une phase de raisonnement pour comprendre les intentions spatiales et logiques de l'instruction, ce qui lui permet de surpasser Flux Max et Gemini sur les benchmarks RISEBench et ODinW-13. Accessible sur lumalabs.ai/uni-1 au tarif d'environ 0,10 $ par image, Uni-1 accepte des instructions en langage naturel sans nécessiter de prompt engineering élaboré.

OutilsActu
1 source
Du modèle à l'agent : la Responses API s'enrichit d'un environnement informatique
3OpenAI Blog 

Du modèle à l'agent : la Responses API s'enrichit d'un environnement informatique

OpenAI a développé un runtime d'agent en s'appuyant sur l'API Responses, un outil shell et des conteneurs hébergés, permettant d'exécuter des agents de manière sécurisée et scalable. Cette infrastructure donne aux agents la capacité de gérer des fichiers, des outils et un état persistant au sein d'un environnement informatique isolé. L'objectif est de faire évoluer les modèles vers de véritables agents autonomes capables d'effectuer des tâches complexes en environnement contrôlé.

OutilsOutil
1 source
4AWS ML Blog 

Lancez vos expériences de personnalisation Nova avec le SDK Nova Forge

Amazon lance le Nova Forge SDK, un outil qui simplifie la personnalisation de grands modèles de langage (LLM) en éliminant les contraintes de gestion des dépendances et de configuration d'infrastructure. Le SDK supporte l'ensemble du spectre de personnalisation, du fine-tuning supervisé (SFT) au Reinforcement Fine-Tuning (RFT), en s'appuyant sur Amazon SageMaker AI et Amazon Nova Forge. Une étude de cas sur la classification de 60 000 questions Stack Overflow en trois catégories de qualité illustre comment le SDK permet d'entraîner et déployer des modèles personnalisés avec des jeux de données à partir de 3 500 exemples.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour