Concevoir un runtime d'agents style OpenHarness : outils, mémoire, permissions, compétences et coordination multi-agents
Un tutoriel publié récemment propose de reconstruire de zéro un environnement d'exécution d'agents IA baptisé OpenHarness, en Python, afin de comprendre concrètement le fonctionnement interne d'un tel système. Le guide couvre l'intégralité des composants fondamentaux : appel d'outils typés, gestion des permissions, hooks de cycle de vie, mémoire persistante, compétences modulaires (skills), compaction de contexte, logique de réessai, suivi des coûts et coordination multi-agents. Le code fourni est entièrement exécutable sans clé API ni infrastructure complexe, ce qui en fait un terrain d'expérimentation accessible. L'implémentation s'appuie sur des structures de données légères comme ToolCall, AssistantTurn et Message, et intègre un module CostMeter qui convertit les tokens consommés en coût estimé en dollars, en s'appuyant sur un barème tarifaire par modèle incluant des références à claude-sonnet-4 (3,00 dollars par million de tokens en entrée, 15,00 dollars en sortie) et GPT-4.1 (2,00 dollars en entrée, 8,00 dollars en sortie).
L'intérêt principal de cette approche est pédagogique mais aussi pratique : en exposant l'intégralité de la boucle de contrôle, l'auteur montre exactement comment le harness reçoit une tâche, laisse le modèle choisir l'action suivante, valide et exécute les appels d'outils, récupère les observations et itère jusqu'à la complétion. Cette transparence permet aux développeurs de modifier chaque maillon de la chaîne, notamment pour adapter les règles de permissions, injecter de la mémoire entre les tours, ou orchestrer plusieurs agents en parallèle. Pour les équipes qui construisent des applications sur des LLM, comprendre ce niveau d'abstraction évite de traiter les frameworks existants comme des boîtes noires et de subir leurs limitations sans pouvoir y remédier.
Ce tutoriel s'inscrit dans une tendance plus large d'outillage autour des agents IA autonomes, accélérée par la montée en puissance des modèles capables d'utiliser des outils de façon fiable. Des frameworks comme LangChain, LlamaIndex ou le SDK Agents d'Anthropic proposent des abstractions similaires, mais leur complexité croissante pousse une partie de la communauté à revenir à des implémentations minimalistes et lisibles. La publication d'OpenHarness comme exercice de reconstruction illustre ce besoin de maîtrise du substrat technique, à mesure que les agents passent du prototype à la production et que les questions de coût, de sécurité et de contrôle deviennent centrales.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




