Xiaomi HarnessX réécrit sa propre infrastructure IA en cours de tâche, avec des gains plus marqués pour les petits modèles
Des chercheurs de Xiaomi ont publié HarnessX, un framework qui permet à des agents IA de réécrire automatiquement leur propre infrastructure logicielle en cours d'exécution. Dans le jargon des systèmes agentiques, le "harness" désigne l'ensemble du code qui entoure le modèle de langage : les prompts, les connecteurs d'outils, la gestion de la mémoire et les flux de contrôle qui dictent comment un agent observe son environnement, raisonne et agit. HarnessX traite ce harness comme un objet modulaire et autonome, capable de s'améliorer lui-même à partir des données d'exécution collectées. Sur 15 combinaisons modèle-benchmark testées en applications d'entreprise réelles (ingénierie logicielle, interaction web), le gain de performance moyen atteint +14,5 %. Pour le modèle open-weight Qwen3.5-9B de 9 milliards de paramètres, les progrès sur des tâches de planification incarnée culminent à +44 %.
Ces résultats remettent en question une conviction centrale de l'industrie : que la performance d'un agent passe avant tout par la montée en puissance du modèle sous-jacent. HarnessX démontre que l'infrastructure logicielle qui entoure un modèle constitue un levier au moins aussi puissant, et que les modèles compacts peuvent bénéficier davantage d'une évolution de leur harness que d'un remplacement par un modèle plus grand. Pour les entreprises, cela ouvre une voie concrète vers des agents plus capables sans les coûts de calcul associés aux grands modèles, et sans les cycles de développement manuel qui rendent aujourd'hui l'ingénierie de harness si coûteuse en temps.
Le problème que HarnessX cherche à résoudre est structurel. Les harnesses actuels sont écrits à la main et restent statiques : tout changement de modèle, d'outil ou de domaine métier exige une réécriture manuelle. Leurs composants sont souvent entremêlés de façon à ce que modifier l'un casse silencieusement un autre. Enfin, les traces d'exécution générées lors des tests sont généralement jetées plutôt qu'utilisées pour améliorer le système. HarnessX répond à ces trois points en décomposant le harness en "processeurs" indépendants branchés sur des points de cycle de vie précis, permettant de les échanger, ajouter ou retirer sans toucher au modèle. Cette approche de "fonderie de harness unifiée" positionne Xiaomi dans une compétition croissante autour de l'outillage agentique, où des acteurs comme LangChain, LlamaIndex ou les équipes internes de Google et Meta cherchent eux aussi à industrialiser la couche logicielle qui détermine, de plus en plus, ce qu'un agent IA est réellement capable d'accomplir.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




