Aller au contenu principal
Créer un espace de travail d'agents QwenPaw : compétences personnalisées, fournisseurs de modèles et API en streaming
OutilsMarkTechPost3h· 2 min de lecture

Créer un espace de travail d'agents QwenPaw : compétences personnalisées, fournisseurs de modèles et API en streaming

Source originale ↗·

Un tutoriel détaillé publié récemment présente QwenPaw, un environnement de travail destiné aux développeurs souhaitant construire et tester des assistants pilotés par des agents IA. Le guide explique pas à pas comment installer et initialiser QwenPaw dans un environnement Google Colab, configurer un répertoire de travail structuré, activer l'authentification sécurisée avec génération automatique d'un mot de passe aléatoire, et connecter des fournisseurs de modèles externes via les secrets Colab. L'architecture repose sur une organisation en répertoires distincts, espace de travail, secrets, journaux, et expose le service sur un port configurable (par défaut le 8088), avec la possibilité de rendre la console accessible publiquement via un tunnel Cloudflare.

Ce type d'environnement répond à un besoin concret des équipes de développement IA : disposer d'un espace intégré pour concevoir des agents, tester leurs compétences personnalisées (« skills »), et valider le comportement de l'API de chat en streaming, le tout sans sortir de l'environnement de développement. En permettant de connecter différents fournisseurs de modèles à la volée et d'exposer une interface console accessible via URL, QwenPaw réduit la friction entre la phase de prototypage et celle de mise en production. La prise en charge native du streaming d'API et d'un garde-fou sur les outils (QWENPAWTOOLGUARD_ENABLED) montre une attention particulière à la robustesse en environnement multi-agents, où les appels d'outils mal contrôlés peuvent rapidement devenir une source d'erreurs coûteuses.

QwenPaw s'inscrit dans l'écosystème grandissant des frameworks d'agents IA, qui cherchent à standardiser la façon dont les modèles de langage interagissent avec des outils, des bases de connaissances locales et des API externes. Son nom évoque une parenté avec les modèles Qwen, la famille de LLM développée par Alibaba/Tongyi, très utilisée dans les contextes où l'on cherche des alternatives aux modèles d'OpenAI ou Anthropic. Le fait que le tutoriel soit conçu pour fonctionner directement dans Google Colab, environnement d'exécution gratuit et largement adopté, suggère une volonté de rendre ce framework accessible à un public plus large, au-delà des équipes disposant d'infrastructure dédiée. La direction prise, avec des fonctionnalités comme le scan de compétences en mode « warn » et la gestion fine des permissions, laisse anticiper une montée en maturité vers des cas d'usage de production.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Créer des agents Strands avec les modèles SageMaker AI et MLflow
1AWS ML Blog 

Créer des agents Strands avec les modèles SageMaker AI et MLflow

Amazon Web Services a publié un guide technique détaillant la construction d'agents d'intelligence artificielle en combinant trois de ses outils : le SDK open source Strands Agents, les endpoints de modèles Amazon SageMaker AI, et la plateforme d'observabilité MLflow hébergée sur SageMaker Serverless. Le SDK Strands, à approche pilotée par le modèle, permet de créer un agent fonctionnel en quelques lignes de code en associant un modèle de langage, un prompt système et un ensemble d'outils. Les modèles sont déployés via SageMaker JumpStart, un hub machine learning qui permet d'évaluer et de sélectionner rapidement des modèles de fondation selon des critères de qualité et de responsabilité prédéfinis. L'intégration de MLflow permet ensuite de tracer les appels d'agents, de versionner les modèles et d'implémenter des tests A/B entre plusieurs variantes de modèles pour en évaluer les performances à l'aide de métriques objectives. Cette architecture répond à un besoin concret des grandes entreprises qui ne peuvent pas se contenter des services de modèles entièrement gérés : contrôle précis sur les instances de calcul, politiques de mise à l'échelle, configuration réseau compatible avec les architectures de sécurité existantes, et conformité en matière de résidence des données. Là où Amazon Bedrock simplifie l'accès aux modèles de fondation en masquant l'infrastructure, SageMaker AI laisse à l'organisation la maîtrise de l'endroit et de la manière dont l'inférence se produit, ce qui est décisif pour les secteurs réglementés comme la finance ou la santé. La couche MLflow ajoute une dimension industrielle : les équipes peuvent comparer les performances de différents modèles dans des conditions réelles, réduire les coûts en sélectionnant le modèle le plus efficace pour chaque tâche, et maintenir un historique d'expériences exploitable dans le temps. La publication de ce guide s'inscrit dans une course plus large pour capter les déploiements d'agents IA en production. AWS répond ainsi à la demande croissante des équipes MLOps qui veulent bénéficier de la commodité du cloud tout en conservant une maîtrise fine de l'infrastructure, une position souvent impossible avec les APIs gérées de type Bedrock ou OpenAI. Strands Agents, rendu open source par Amazon, concurrence directement des frameworks comme LangChain ou CrewAI, avec l'avantage d'une intégration native dans l'écosystème AWS. L'accent mis sur les tests A/B et l'évaluation continue des agents signale que le secteur entre dans une phase de maturité : il ne s'agit plus seulement de faire fonctionner un agent, mais de le mesurer, le comparer, et l'améliorer de façon systématique en production.

UECette architecture de déploiement d'agents avec contrôle fin sur la résidence des données répond aux exigences du RGPD, la rendant pertinente pour les secteurs réglementés européens comme la finance et la santé.

OutilsOutil
1 source
OpenAI met à jour Codex : les agents peuvent créer des espaces de travail interactifs via Sites et plugins par rôle
2VentureBeat AI 

OpenAI met à jour Codex : les agents peuvent créer des espaces de travail interactifs via Sites et plugins par rôle

OpenAI a annoncé mardi une mise à jour majeure de sa plateforme agentique Codex, avec l'introduction de plusieurs fonctionnalités destinées à conquérir le monde de l'entreprise : des plugins sectoriels, un outil d'édition ciblée baptisé "Annotations", et une fonctionnalité d'hébergement web rapide appelée "Sites". Cette évolution transforme délibérément Codex, jusqu'ici perçu comme un assistant spécialisé pour développeurs, en environnement de travail quotidien pour les professionnels non-techniques. Parmi les 5 millions d'utilisateurs hebdomadaires de la plateforme, les non-développeurs, analystes financiers, marketeurs, opérationnels, chercheurs, représentent désormais environ 20% de la base et adoptent l'outil trois fois plus vite que les ingénieurs traditionnels. La fonctionnalité Annotations résout un problème concret qui freinait l'adoption en entreprise : jusqu'ici, demander à l'IA de modifier un graphique ou un calcul dans un tableur forçait le modèle à réécrire l'intégralité du fichier, détruisant souvent la mise en forme et introduisant des erreurs. Annotations isole précisément le segment sélectionné par l'utilisateur, un bloc de cellules dans un modèle financier, par exemple, et exécute les modifications sans toucher aux formules, styles ou dépendances environnantes. En parallèle, OpenAI déploie six plugins métier qui agrègent 62 applications professionnelles et 110 compétences automatisées dès le départ : un plugin Data Analytics connecte Snowflake, Databricks et Tableau ; le plugin Creative Production intègre Figma, Canva et Shutterstock ; le plugin Sales synchronise Salesforce, HubSpot, Slack et Clay ; le plugin Finance bancaire agrège des flux institutionnels comme Moody's, FactSet, PitchBook et S&P pour automatiser la modélisation financière et la préparation de pitch books. Le calendrier de cette annonce n'est pas anodin : elle intervient précisément au moment où Microsoft, principal investisseur mais concurrent direct d'OpenAI, ouvre sa conférence annuelle Build à San Francisco, où plusieurs outils de productivité enterprise concurrents sont attendus. Elle suit aussi de près la progression rapide d'Anthropic sur ce même segment, via Claude et Claude Code, auprès des travailleurs du savoir. OpenAI cherche à positionner Codex comme la référence pour l'automatisation des tâches de col blanc, avant que le marché des agents IA d'entreprise ne se structure autour d'autres acteurs. La stratégie est claire : ne plus réserver l'IA agentique aux équipes techniques, mais en faire un couche opérationnelle transversale, accessible à chaque département sans intervention du service informatique.

UELes entreprises françaises et européennes peuvent désormais déployer Codex dans leurs workflows métier, finance, marketing, ventes, sans ressources techniques dédiées, ce qui accélère concrètement l'adoption de l'IA agentique dans les organisations non technologiques.

OutilsOutil
1 source
Construire un système d'agents modulaires à base de compétences pour LLM avec routage dynamique d'outils en Python
3MarkTechPost 

Construire un système d'agents modulaires à base de compétences pour LLM avec routage dynamique d'outils en Python

Un tutoriel publié récemment détaille comment construire en Python un système d'agents modulaires à base de compétences pour les grands modèles de langage, avec routage dynamique des outils. L'implémentation repose sur OpenAI (modèle GPT-4o-mini) et les bibliothèques open source Pydantic et Rich. L'architecture centrale s'articule autour de trois briques : une classe abstraite Skill qui encapsule chaque capacité (métadonnées, schéma JSON, logique d'exécution), un SkillRegistry qui joue le rôle de catalogue centralisé, et un orchestrateur qui sélectionne et enchaîne les compétences via le mécanisme de tool calling de l'API OpenAI. Chaque compétence est versionnée, auto-descriptive et expose automatiquement son schéma au format attendu par l'API, ce qui permet à un agent de l'invoquer sans configuration manuelle. L'intérêt de cette approche réside dans la séparation stricte entre la logique de chaque compétence et le raisonnement de l'agent. Concrètement, l'agent peut sélectionner la bonne compétence pour une tâche donnée, en composer plusieurs pour des workflows complexes, et charger de nouvelles capacités à chaud en cours d'exécution sans redémarrer le système. Un tableau de bord d'observabilité intégré trace le nombre d'appels et la latence moyenne de chaque compétence, ce qui facilite le débogage et l'optimisation en production. Pour les équipes qui construisent des agents LLM, cette modularité réduit la dette technique : ajouter une nouvelle capacité revient à écrire une classe isolée, sans toucher au reste du pipeline. Cette architecture s'inscrit dans une tendance plus large de structuration des systèmes agentiques, accélérée par la généralisation du tool calling dans les API des principaux fournisseurs (OpenAI, Anthropic, Google). La métaphore utilisée dans le tutoriel est explicite : le registre de compétences fonctionne comme une table de syscalls d'un système d'exploitation, l'agent étant le noyau qui dispatche les requêtes. Face à la multiplication des frameworks concurrents (LangChain, LlamaIndex, AutoGen), cette approche "from scratch" permet de comprendre les mécanismes sous-jacents et d'éviter les abstractions opaques. La prochaine étape logique de cette architecture est l'ajout de mémoire persistante et de planification multi-tours, deux fronts sur lesquels la recherche en agents LLM reste très active en 2025.

OutilsTuto
1 source
Nous Research lance Hermes Agent Profile Builder : identité, modèle, compétences et serveurs MCP dans un tableau de bord unique
4MarkTechPost 

Nous Research lance Hermes Agent Profile Builder : identité, modèle, compétences et serveurs MCP dans un tableau de bord unique

Nous Research a publié le Profile Builder pour son agent open source Hermes, une interface graphique intégrée au tableau de bord local du projet accessible depuis un navigateur à l'adresse 127.0.0.1:9119. Jusqu'ici, configurer un agent Hermes demandait plusieurs étapes en ligne de commande : définir une identité, choisir un modèle et un fournisseur, activer des compétences, connecter des serveurs MCP. Le Profile Builder regroupe toutes ces opérations dans un formulaire guidé en cinq étapes. Le premier champ définit le nom et la description de l'agent, le nom servant également d'alias de commande dans le terminal. Viennent ensuite le choix du modèle et du fournisseur parmi Nous Portal, OpenRouter, NVIDIA, OpenAI ou tout endpoint compatible OpenAI, puis l'activation des compétences intégrées, l'installation depuis un catalogue externe via le Skills Hub, et enfin l'ajout de serveurs MCP par URL ou par commande locale. Chaque configuration produit un profil isolé : un répertoire autonome contenant son propre fichier config.yaml, ses variables d'environnement, son fichier de personnalité SOUL.md, sa mémoire, ses sessions, ses tâches planifiées et sa base de données d'état. L'intérêt principal de cette approche est la possibilité de faire tourner plusieurs agents spécialisés sur une même machine sans qu'ils partagent le moindre état. Un agent dédié au code et un agent de veille documentaire restent rigoureusement cloisonnés : mémoire séparée, credentials distincts, verrous sur les tokens pour éviter les conflits d'accès. Concrètement, un développeur peut configurer un assistant de programmation couplé à un modèle de code, un serveur MCP pour le système de fichiers et des compétences Git, pendant qu'un second profil gère une veille automatisée avec des compétences d'extraction web. Le builder abaisse significativement le seuil d'entrée : là où la configuration CLI exigeait de connaître chaque commande dans le bon ordre, le formulaire guide l'utilisateur sans supposer de familiarité avec l'outillage interne. Hermes est l'agent auto-améliorant open source de Nous Research, disponible en CLI, en application desktop et sur des plateformes de messagerie. Les compétences de l'agent reposent sur des fichiers SKILL.md dont seules les descriptions courtes sont chargées par défaut, le contenu complet n'étant consulté qu'en cas de besoin, ce qui évite d'alourdir les requêtes. Les serveurs MCP, conformes au protocole Model Context Protocol, permettent d'exposer des outils externes, qu'il s'agisse de services HTTP distants ou de processus stdio locaux. Le Profile Builder n'écrase pas le CLI, il en reproduit la logique dans une interface plus accessible : les deux chemins écrivent dans les mêmes fichiers de profil. Cette sortie s'inscrit dans une tendance plus large où les projets d'agents open source cherchent à réduire la friction de configuration pour toucher un public plus large que les seuls développeurs familiers de la ligne de commande.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic