Aller au contenu principal
OutilsMarkTechPost3h· 2 min de lecture

Créer un agent IA style nanobot dans Google Colab : appel d'outils, mémoire de session, compétences et serveurs MCP

Source originale ↗·

Un tutoriel publié récemment décrit comment construire de zéro un agent IA personnel dans Google Colab, en s'inspirant de l'architecture de Nanobot, un framework d'agents léger. Le projet reconstruit brique par brique les composants fondamentaux d'un agent moderne : abstraction du fournisseur LLM, enregistrement d'outils (tool calling), mémoire de session, hooks de cycle de vie, compétences modulaires (skills) et un serveur d'outils au format MCP (Model Context Protocol). L'intégralité du code tourne dans un notebook Colab, sans clé API obligatoire grâce à un fournisseur simulé (MockProvider) qui reproduit le comportement d'un vrai modèle de langage de façon déterministe, permettant d'observer la boucle agentique en fonctionnement réel sans dépense ni connexion réseau.

L'intérêt pédagogique est considérable pour les développeurs qui veulent comprendre ce qui se passe réellement sous le capot des frameworks populaires comme LangChain ou LlamaIndex. Au lieu d'utiliser une boîte noire externe, ce tutoriel expose comment les messages, les appels d'outils, les résultats et les réponses du modèle s'articulent dans une boucle d'inférence concrète. Le fait de pouvoir s'y connecter à n'importe quel fournisseur compatible OpenAI (OpenRouter, DeepSeek, Together AI, vLLM, LM Studio, Ollama) via une couche d'abstraction unique le rend immédiatement opérationnel en production. Pour les équipes qui construisent des agents internes sans vouloir dépendre d'un SDK propriétaire, ce type d'architecture minimaliste représente une alternative solide, maintenable et compréhensible.

Ce tutoriel s'inscrit dans une dynamique plus large autour de la standardisation des agents IA. Le protocole MCP (Model Context Protocol), popularisé par Anthropic fin 2024, s'est imposé comme référence pour exposer des outils à un agent de façon modulaire, et de nombreux projets cherchent aujourd'hui à l'implémenter sans dépendre des SDK officiels. Nanobot lui-même est conçu pour rester léger et portable, à l'opposé des frameworks lourds qui accumulent les dépendances. La tendance va clairement vers des agents plus petits, plus explicites, plus faciles à auditer : les développeurs indépendants et les petites équipes veulent pouvoir lire et comprendre chaque ligne de la boucle d'inférence plutôt que de faire confiance à des abstractions opaques. Ce genre de ressource pédagogique, qui reconstruit l'essentiel en quelques centaines de lignes de Python pur, répond directement à ce besoin croissant de maîtrise et de transparence dans les systèmes d'IA autonomes.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Concevoir un runtime d'agents style OpenHarness : outils, mémoire, permissions, compétences et coordination multi-agents
1MarkTechPost 

Concevoir un runtime d'agents style OpenHarness : outils, mémoire, permissions, compétences et coordination multi-agents

Un tutoriel publié récemment propose de reconstruire de zéro un environnement d'exécution d'agents IA baptisé OpenHarness, en Python, afin de comprendre concrètement le fonctionnement interne d'un tel système. Le guide couvre l'intégralité des composants fondamentaux : appel d'outils typés, gestion des permissions, hooks de cycle de vie, mémoire persistante, compétences modulaires (skills), compaction de contexte, logique de réessai, suivi des coûts et coordination multi-agents. Le code fourni est entièrement exécutable sans clé API ni infrastructure complexe, ce qui en fait un terrain d'expérimentation accessible. L'implémentation s'appuie sur des structures de données légères comme ToolCall, AssistantTurn et Message, et intègre un module CostMeter qui convertit les tokens consommés en coût estimé en dollars, en s'appuyant sur un barème tarifaire par modèle incluant des références à claude-sonnet-4 (3,00 dollars par million de tokens en entrée, 15,00 dollars en sortie) et GPT-4.1 (2,00 dollars en entrée, 8,00 dollars en sortie). L'intérêt principal de cette approche est pédagogique mais aussi pratique : en exposant l'intégralité de la boucle de contrôle, l'auteur montre exactement comment le harness reçoit une tâche, laisse le modèle choisir l'action suivante, valide et exécute les appels d'outils, récupère les observations et itère jusqu'à la complétion. Cette transparence permet aux développeurs de modifier chaque maillon de la chaîne, notamment pour adapter les règles de permissions, injecter de la mémoire entre les tours, ou orchestrer plusieurs agents en parallèle. Pour les équipes qui construisent des applications sur des LLM, comprendre ce niveau d'abstraction évite de traiter les frameworks existants comme des boîtes noires et de subir leurs limitations sans pouvoir y remédier. Ce tutoriel s'inscrit dans une tendance plus large d'outillage autour des agents IA autonomes, accélérée par la montée en puissance des modèles capables d'utiliser des outils de façon fiable. Des frameworks comme LangChain, LlamaIndex ou le SDK Agents d'Anthropic proposent des abstractions similaires, mais leur complexité croissante pousse une partie de la communauté à revenir à des implémentations minimalistes et lisibles. La publication d'OpenHarness comme exercice de reconstruction illustre ce besoin de maîtrise du substrat technique, à mesure que les agents passent du prototype à la production et que les questions de coût, de sécurité et de contrôle deviennent centrales.

OutilsOutil
1 source
Guide complet du pipeline d'agents nanobot : outils, mémoire, sous-agents et planification cron
2MarkTechPost 

Guide complet du pipeline d'agents nanobot : outils, mémoire, sous-agents et planification cron

Le framework nanobot, développé par le laboratoire HKUDS de l'Université de Hong Kong, s'impose comme l'une des solutions les plus légères pour construire des agents IA personnels complets. Rédigé en environ 4 000 lignes de Python, il embarque l'ensemble du pipeline agent : boucle de raisonnement, exécution d'outils, persistance mémoire, chargement de compétences (skills), gestion de sessions, délégation à des sous-agents et planification via cron. Un tutoriel publié récemment propose d'en reconstruire chaque sous-système à la main, en utilisant le modèle gpt-4o-mini d'OpenAI comme moteur LLM, afin de comprendre précisément leur fonctionnement plutôt que de simplement les utiliser en boîte noire. Le tutoriel progresse étape par étape : depuis une simple boucle d'appel d'outil jusqu'à un pipeline de recherche multi-étapes capable de lire et d'écrire des fichiers, de stocker des mémoires à long terme, et de déléguer des tâches à des agents parallèles fonctionnant en arrière-plan. Ce type de ressource pédagogique a une valeur pratique immédiate pour les développeurs qui souhaitent construire des agents IA sans dépendre de frameworks lourds comme LangChain ou AutoGen, dont la complexité et l'opacité sont souvent citées comme obstacles à la maintenance et à la compréhension. Nanobot mise sur la lisibilité du code source pour permettre aux équipes techniques de personnaliser chaque composant : outils sur mesure, architectures d'agents propres, logiques de scheduling adaptées. Pour un développeur solo ou une petite équipe, pouvoir déployer un agent personnel — capable d'effectuer des recherches, de mémoriser des contextes entre sessions et de lancer des tâches planifiées — en s'appuyant sur moins de 5 000 lignes de code auditables représente un changement d'échelle significatif. Nanobot s'inscrit dans une tendance plus large de miniaturisation des frameworks agentiques, portée par la maturité croissante des API LLM et la volonté de réduire la dette technique dans les projets IA. Alors que les grandes plateformes comme OpenAI ou Anthropic poussent leurs propres solutions d'orchestration, des projets open source légers comme nanobot, smolagents (HuggingFace) ou DSPy cherchent à garder le contrôle dans les mains des développeurs. HKUDS, connu pour ses travaux sur les systèmes de recommandation et les graphes de connaissances, confirme ici une diversification vers l'ingénierie agentique appliquée. Les prochaines évolutions du framework pourraient intégrer une compatibilité multi-modèles élargie, notamment vers les LLM open source via Ollama, et un système de partage de skills entre utilisateurs.

OutilsTuto
1 source
Créer un agent autonome à mémoire hybride avec architecture modulaire et appel d'outils via OpenAI
3MarkTechPost 

Créer un agent autonome à mémoire hybride avec architecture modulaire et appel d'outils via OpenAI

Un tutoriel technique récemment publié décrit la construction pas à pas d'un agent autonome à mémoire hybride, en s'appuyant sur l'API OpenAI et quelques bibliothèques Python open source. Le système combine deux mécanismes de recherche en mémoire : la recherche sémantique par vecteurs, via le modèle d'embedding text-embedding-3-small d'OpenAI, et la recherche par mots-clés via l'algorithme BM25, implémenté par la bibliothèque rank_bm25. Pour le raisonnement et la génération de texte, l'agent s'appuie sur gpt-4o-mini. L'architecture repose sur des interfaces abstraites Python (MemoryBackend, LLMProvider, Tool) qui séparent strictement chaque couche du système. Les résultats des deux moteurs de recherche sont ensuite fusionnés via la méthode Reciprocal Rank Fusion (RRF), une technique qui combine les classements plutôt que les scores bruts afin de produire des résultats plus robustes et équilibrés. Ce type d'architecture représente un gain concret pour les développeurs qui souhaitent doter leurs agents d'une mémoire à long terme sans recourir à des bases de données vectorielles externes comme Pinecone ou Weaviate. En stockant les souvenirs sous forme de blocs de texte avec leurs embeddings directement en mémoire vive, et en reconstruisant l'index BM25 à chaque ajout, l'agent peut retrouver des informations pertinentes même lorsqu'une requête utilise des termes exacts absents du vocabulaire sémantique, un angle mort fréquent des systèmes purement vectoriels. Pour les équipes qui développent des assistants IA, des agents de recherche ou des chatbots d'entreprise, cette approche hybride offre un compromis entre précision sémantique et rappel lexical, deux qualités rarement réunies dans un seul système léger. La mémoire persistante des agents autonomes reste l'un des grands défis non résolus du développement IA. Les grands modèles comme GPT-4o souffrent d'une fenêtre de contexte limitée et oublient ce qui dépasse quelques dizaines de milliers de tokens. Les architectures RAG (Retrieval-Augmented Generation) ont émergé pour compenser cette limite, mais la plupart des implémentations courantes misent soit sur la recherche vectorielle, soit sur les mots-clés, rarement les deux. Ce tutoriel s'inscrit dans une tendance portée par des frameworks comme LangChain, LlamaIndex ou MemGPT, qui poussent vers des agents dotés d'une mémoire modulaire et interrogeable. La prochaine étape naturelle est l'intégration d'une base de données persistante (SQLite, PostgreSQL) pour survivre aux redémarrages, et d'un mécanisme de compression sélective pour gérer la croissance de la mémoire dans le temps.

OutilsTuto
1 source
Nous Research lance Hermes Agent Profile Builder : identité, modèle, compétences et serveurs MCP dans un tableau de bord unique
4MarkTechPost 

Nous Research lance Hermes Agent Profile Builder : identité, modèle, compétences et serveurs MCP dans un tableau de bord unique

Nous Research a publié le Profile Builder pour son agent open source Hermes, une interface graphique intégrée au tableau de bord local du projet accessible depuis un navigateur à l'adresse 127.0.0.1:9119. Jusqu'ici, configurer un agent Hermes demandait plusieurs étapes en ligne de commande : définir une identité, choisir un modèle et un fournisseur, activer des compétences, connecter des serveurs MCP. Le Profile Builder regroupe toutes ces opérations dans un formulaire guidé en cinq étapes. Le premier champ définit le nom et la description de l'agent, le nom servant également d'alias de commande dans le terminal. Viennent ensuite le choix du modèle et du fournisseur parmi Nous Portal, OpenRouter, NVIDIA, OpenAI ou tout endpoint compatible OpenAI, puis l'activation des compétences intégrées, l'installation depuis un catalogue externe via le Skills Hub, et enfin l'ajout de serveurs MCP par URL ou par commande locale. Chaque configuration produit un profil isolé : un répertoire autonome contenant son propre fichier config.yaml, ses variables d'environnement, son fichier de personnalité SOUL.md, sa mémoire, ses sessions, ses tâches planifiées et sa base de données d'état. L'intérêt principal de cette approche est la possibilité de faire tourner plusieurs agents spécialisés sur une même machine sans qu'ils partagent le moindre état. Un agent dédié au code et un agent de veille documentaire restent rigoureusement cloisonnés : mémoire séparée, credentials distincts, verrous sur les tokens pour éviter les conflits d'accès. Concrètement, un développeur peut configurer un assistant de programmation couplé à un modèle de code, un serveur MCP pour le système de fichiers et des compétences Git, pendant qu'un second profil gère une veille automatisée avec des compétences d'extraction web. Le builder abaisse significativement le seuil d'entrée : là où la configuration CLI exigeait de connaître chaque commande dans le bon ordre, le formulaire guide l'utilisateur sans supposer de familiarité avec l'outillage interne. Hermes est l'agent auto-améliorant open source de Nous Research, disponible en CLI, en application desktop et sur des plateformes de messagerie. Les compétences de l'agent reposent sur des fichiers SKILL.md dont seules les descriptions courtes sont chargées par défaut, le contenu complet n'étant consulté qu'en cas de besoin, ce qui évite d'alourdir les requêtes. Les serveurs MCP, conformes au protocole Model Context Protocol, permettent d'exposer des outils externes, qu'il s'agisse de services HTTP distants ou de processus stdio locaux. Le Profile Builder n'écrase pas le CLI, il en reproduit la logique dans une interface plus accessible : les deux chemins écrivent dans les mêmes fichiers de profil. Cette sortie s'inscrit dans une tendance plus large où les projets d'agents open source cherchent à réduire la friction de configuration pour toucher un public plus large que les seuls développeurs familiers de la ligne de commande.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic