
Cisco AI présente FAPO : optimisation des prompts par pipeline, attribution des erreurs par étape et orchestration Claude Code
Cisco AI a dévoilé FAPO, pour Fully Automated Prompt Optimization, un système d'optimisation automatisée des pipelines LLM orchestré par des agents Claude Code. Le principe est simple : l'utilisateur fournit un jeu de données et une première ébauche de prompt, et FAPO prend en charge le reste, évaluation, classification des erreurs, proposition de variantes, validation et itération, jusqu'à atteindre un seuil de précision cible. Le projet est publié en open source sous licence Apache 2.0 et supporte également Codex comme agent d'optimisation alternatif. Dans les évaluations internes de Cisco, FAPO surpasse GEPA, l'optimiseur de prompts de référence, sur 15 des 18 combinaisons modèle-benchmark testées, avec un gain moyen de 14,1 points de pourcentage. Sur les benchmarks HoVer et IFBench, où FAPO a escaladé jusqu'à modifier la structure du pipeline, l'écart atteint +33,8 points de pourcentage sur six paires comparées.
Ce que FAPO change concrètement, c'est la façon dont les équipes d'ingénierie déboguent des pipelines multi-étapes. Jusqu'ici, lorsqu'un pipeline LLM renvoie une mauvaise réponse, identifier quelle étape a fauté exige d'inspecter manuellement les sorties intermédiaires, un travail fastidieux et peu fiable. FAPO introduit une attribution d'échec au niveau de chaque étape, classant les pannes en quatre catégories : défaillances de récupération, défaillances en cascade, défaillances de format, et défaillances de raisonnement. Cette granularité permet au système de cibler précisément ce qui doit changer. L'optimisation procède par paliers croissants, d'abord les formulations de prompts, puis les paramètres comme la température ou le retrieval_k, enfin la topologie du pipeline lui-même, par exemple en ajoutant un nœud de réflexion ou en adoptant un pattern ReAct. Chaque proposition est validée par un agent indépendant, avec des garde-fous contre le surapprentissage : inspection limitée au jeu d'entraînement, fichiers de variantes immuables, et un ensemble de test réservé à une évaluation finale en une seule passe.
Ce lancement s'inscrit dans une dynamique plus large d'industrialisation de l'ingénierie des prompts. Small wording changes can swing accuracy by 20 percent, note Cisco, un constat qui illustre à quel point l'optimisation manuelle reste fragile et non scalable. FAPO est construit autour d'un moteur central nommé Hephaestus, agnostique au domaine, qui exécute des chaînes modélisées comme des graphes d'état LangGraph. L'architecture multi-tenant permet d'optimiser plusieurs tâches en parallèle sans interférence. Les trois fournisseurs supportés nativement sont OpenAI, Baseten et SageMaker. En positionnant Claude Code comme chef d'orchestre de ce cycle fermé, Cisco propose une vision où l'agent IA ne génère plus seulement du code, mais optimise activement d'autres systèmes IA, une étape vers des pipelines capables de s'améliorer de façon autonome.
Ce que FAPO résout vraiment, c'est pas l'écriture de prompts, c'est le débogage de pipeline multi-étapes, un truc que tout le monde fait à la main aujourd'hui avec des logs à fouiller. Classer les pannes en quatre types (récupération, cascade, format, raisonnement) et cibler précisément quelle étape corriger, c'est le genre de granularité qu'on n'avait pas dans les outils open source. Les +14 points sur les benchmarks Cisco, bon, c'est interne, faut rester prudent, mais la direction est claire.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




