OutilsMarkTechPost12sem· 1 min de lecture

Une implémentation de code pour concevoir un moteur de compétences auto-évolutif avec OpenSpace : apprentissage de compétences, efficacité des tokens et intelligence collective

OpenSpace, un moteur de compétences auto-évolutif développé par le laboratoire HKUDS (Université de Hong Kong), propose une nouvelle approche pour rendre les agents IA plus intelligents et économiques. Le principe : chaque tâche exécutée enrichit une base de connaissances partagée, permettant à l'agent de réutiliser des compétences acquises pour résoudre des problèmes similaires sans recalculer depuis zéro.

L'enjeu économique est central. L'utilisation des modèles de langage comme GPT-4o génère des coûts proportionnels au nombre de tokens consommés. En capitalisant sur des compétences déjà apprises — stockées dans une base SQLite locale — OpenSpace évite de solliciter le LLM pour des raisonnements redondants. Cette logique de réutilisation constitue une réponse directe aux coûts d'inférence qui pèsent sur les déploiements d'agents IA à grande échelle.

Les chiffres avancés sont significatifs : sur le benchmark GDPVal, qui couvre 50 tâches professionnelles réelles, OpenSpace affiche une amélioration du revenu simulé de 4,2x et une réduction de la consommation de tokens de 46 %. Le système repose sur trois modes d'évolution — FIX, DERIVED et CAPTURED — et trois déclencheurs automatiques qui maintiennent la base de compétences à jour. Une dimension communautaire est également prévue via la plateforme open-space.cloud, où les agents peuvent partager leurs compétences évoluées.

À terme, cette architecture d'intelligence collective pourrait transformer la façon dont les organisations mutualisent leur capital cognitif IA. Plutôt que chaque agent repart de zéro, un écosystème partagé de compétences testées et validées pourrait s'imposer comme standard, notamment pour les entreprises cherchant à maîtriser leurs coûts d'API tout en améliorant la cohérence de leurs pipelines automatisés.

Dans nos dossiers

Agents IA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost

Une implémentation de code illustrant l'orchestration multi-agents en essaim de ClawTeam avec les appels de fonctions OpenAI

ClawTeam est un framework open-source d'intelligence collective multi-agents développé par HKUDS, permettant à un agent leader de décomposer des objectifs complexes en sous-tâches confiées à des agents spécialisés autonomes. Le système repose sur un tableau de tâches partagé avec résolution automatique des dépendances et une messagerie inter-agents pour la coordination en temps réel. Ce tutoriel implémente ces concepts via l'API OpenAI (modèle gpt-4o-mini) et est conçu pour fonctionner directement dans Google Colab, sans infrastructure locale.

OutilsOutil

1 source

2MarkTechPost

openJiuwen publie 'JiuwenClaw', un agent IA auto-évolutif pour la gestion de tâches

La communauté openJiuwen a publié JiuwenClaw, un agent IA conçu pour exécuter des tâches complexes de bout en bout, sans perdre le fil en cours de route. Contrairement aux agents conversationnels classiques qui traitent chaque modification comme une nouvelle requête indépendante, JiuwenClaw maintient un état d'exécution continu : il gère les interruptions, les réordonnancementset les ajouts de tâches sans perdre le contexte accumulé. Concrètement, dans un scénario bureautique sous Excel, l'agent peut enchaîner organisation de tableau, déduplication, ajout de synthèse et changement de format de sortie — en suivant les intentions de l'utilisateur, et non en recommençant à zéro à chaque nouvelle instruction. Pour la création de contenu, il conserve plusieurs couches de contexte : il distingue une modification structurelle d'un ajustement de ton, préserve le style entre les itérations, et s'appuie sur le brouillon existant plutôt que de régénérer. Ce que JiuwenClaw tente de résoudre est un problème structurel qui plombe la majorité des agents IA actuels : l'amnésie contextuelle. La plupart des systèmes paraissent intelligents en conversation mais s'effondrent dès que la tâche dure plus de quelques échanges. Pour les professionnels — rédacteurs, analystes, développeurs — cela se traduit par une friction constante : reformuler, réexpliquer, reprendre depuis le début. L'agent introduit également une approche d'automatisation navigateur radicalement différente : au lieu d'opérer dans un navigateur virtuel isolé, il prend directement le contrôle du navigateur local de l'utilisateur, avec ses cookies, ses sessions actives et son identité. Cela permet de contourner les protections anti-bot et les CAPTCHAs qui rendent inutilisables la quasi-totalité des agents web en conditions réelles. Techniquement, JiuwenClaw repose sur deux innovations architecturales clés. La première est un système de mémoire hiérarchique à trois couches — une couche d'identité stable, une couche de contexte long terme, et une couche de trajectoire dynamique — qui permet à l'agent d'accumuler des préférences et du contexte au fil du temps, à la manière d'un collaborateur qui apprend. La seconde est une compression intelligente du contexte : une technologie propriétaire qui élimine les informations redondantes tout en conservant les éléments clés, évitant ainsi les explosions de tokens et réduisant significativement les coûts d'usage. JiuwenClaw s'inscrit dans une tendance de fond où les équipes de recherche cherchent à dépasser le paradigme "chat" pour construire des agents véritablement opérationnels. La compétition dans ce segment — aux côtés de projets comme AutoGPT, Devin ou les agents Anthropic — s'intensifie, mais peu ont jusqu'ici démontré une fiabilité satisfaisante sur des tâches longues et évolutives.

OutilsOutil

1 source

3MarkTechPost

Comment construire une intelligence de code au niveau dépôt avec Repowise : analyse de graphe, détection de code mort et contexte IA

Repowise est un outil d'analyse de code qui propose une approche nouvelle pour comprendre la structure interne d'un dépôt logiciel à l'échelle du projet entier. Dans ce tutoriel pratique, les auteurs l'appliquent à itsdangerous, une bibliothèque Python de référence maintenue par Pallets, afin de démontrer comment configurer l'outil, connecter un modèle de langage (Claude Sonnet 4.5 d'Anthropic ou GPT-4o mini d'OpenAI selon les clés API disponibles), puis lancer le pipeline d'indexation qui génère un ensemble d'artefacts dans un répertoire .repowise/. L'outil peut également fonctionner en mode --index-only, sans LLM, pour les environnements sans accès à une API externe. Une fois initialisé, Repowise produit un graphe de dépendances entre fichiers et modules, qu'il analyse ensuite avec des algorithmes de théorie des graphes issus de la bibliothèque NetworkX, dont PageRank pour identifier les nœuds les plus influents et la détection de communautés pour regrouper les fichiers par cluster fonctionnel. Ce type d'intelligence repository-level répond à un problème concret que rencontrent les équipes de développement sur les bases de code volumineuses : savoir quels fichiers sont critiques, lesquels sont obsolètes, et comment les modifications en cascade se propagent. La détection de code mort, paramétrée ici avec un seuil de confiance à 0,7, permet d'identifier automatiquement les fichiers supprimables sans risque. La fonctionnalité de maintenance cascade_budget limite à 10 le nombre de fichiers touchés en cascade lors d'une modification, ce qui aide à estimer l'effort réel d'un refactoring avant de le commencer. La génération automatique d'un fichier CLAUDE.md, format de documentation structurée utilisé nativement par Claude Code d'Anthropic, facilite l'intégration du contexte architectural dans les workflows assistés par IA, en donnant au modèle une carte du projet plutôt qu'un tas de fichiers bruts. L'émergence d'outils comme Repowise s'inscrit dans une tendance plus large : donner aux LLMs une compréhension structurelle du code plutôt qu'une lecture séquentielle naïve. Là où les assistants classiques lisent fichier par fichier, une approche par graphes permet de raisonner sur les dépendances, la centralité et les clusters de responsabilité. Le protocole MCP (Model Context Protocol), sur lequel s'appuie Repowise pour exposer ses outils en CLI, est l'un des standards en cours d'adoption dans l'écosystème des agents de code. Le fait que l'outil génère directement un CLAUDE.md exploitable par Claude Code suggère une intégration croissante entre les outils d'analyse statique et les agents IA, une convergence qui pourrait redéfinir la façon dont les développeurs documentent et maintiennent les grandes bases de code à l'ère des assistants intelligents.

💬 Analyser un dépôt via un graphe de dépendances pour repérer le code mort et estimer l'impact d'un refactoring avant de le lancer, c'est exactement ce qu'il manque sur les grandes codebases. Ce qui m'intéresse le plus, c'est la génération auto du CLAUDE.md : si tu travailles avec Claude Code au quotidien, avoir une carte architecturale du projet plutôt qu'un tas de fichiers à parcourir un par un, ça change vraiment la façon dont le modèle raisonne. Reste à voir si ça tient sur 500k lignes, mais le concept est là.

OutilsOutil

1 source

4MarkTechPost

Créer et faire évoluer un agent OpenAI sur mesure avec A-Evolve : benchmarks, compétences et mémoire

A-Evolve est un framework open source conçu pour faire évoluer automatiquement des agents d'intelligence artificielle en modifiant itérativement leur architecture interne — leurs prompts, leurs compétences, leur mémoire — afin d'améliorer leurs performances sur des tâches définies. Un tutoriel détaillé, exécutable sur Google Colab, montre comment construire de bout en bout un pipeline d'évolution complet en s'appuyant sur GPT-4o-mini d'OpenAI comme moteur de raisonnement. Le processus commence par le clonage du dépôt GitHub A-EVO-Lab/a-evolve, la configuration d'un espace de travail structuré en couches (prompts, skills, memory, tools), et la définition d'un fichier manifeste qui spécifie les parties du système autorisées à évoluer. L'agent démarre avec un prompt système minimaliste, puis est soumis à un benchmark personnalisé comprenant des tâches de transformation de texte — calculs de sommes au format JSON, génération d'acronymes, tri de tokens — pour mesurer objectivement ses progrès à chaque génération. Ce type d'approche représente un changement de paradigme dans la façon dont les équipes construisent et maintiennent des agents IA. Plutôt que d'ajuster manuellement les prompts ou d'affiner un modèle par fine-tuning coûteux, A-Evolve automatise le cycle d'amélioration : l'agent tente des tâches, reçoit un retour structuré sous forme de scores, et un moteur d'évolution applique des mutations ciblées à son espace de travail pour corriger ses failles. Pour les développeurs et les équipes produit, cela signifie des agents qui s'améliorent de façon reproductible et traçable, sans intervention humaine à chaque itération. La philosophie est proche de l'optimisation évolutionnaire appliquée aux systèmes LLM : survivent les configurations qui performent le mieux sur le benchmark défini. A-Evolve s'inscrit dans une tendance plus large autour des agents "auto-améliorants", un sujet qui mobilise plusieurs laboratoires de recherche depuis 2024. Des travaux comme Self-Play Fine-Tuning (SPIN) chez UCLA ou les expériences d'auto-raffinement chez DeepMind ont posé les bases théoriques ; A-Evolve propose ici une implémentation pratique et accessible, orientée ingénierie plutôt que recherche fondamentale. Le framework est publié sous licence ouverte sur GitHub par l'organisation A-EVO-Lab, ce qui laisse la porte ouverte à des contributions communautaires. Les prochaines évolutions attendues concernent l'élargissement des stratégies de mutation (aujourd'hui limitées aux prompts et aux compétences codées) et l'intégration de benchmarks plus complexes, notamment des tâches de raisonnement multi-étapes ou d'interaction avec des APIs externes.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic