
Sakana AI lance Sakana Fugu : un modèle d'orchestration qui répartit les tâches entre un ensemble interchangeable de LLMs frontier
Sakana AI a lancé le 15 juin 2026 Sakana Fugu, un système d'orchestration multi-agents qui se présente comme un modèle unique. Le principe : l'utilisateur envoie une requête à un seul point d'accès compatible avec l'API d'OpenAI, et Fugu décide en coulisses s'il traite la tâche seul ou s'il coordonne un ensemble de modèles spécialisés. Le système existe en deux variantes, Fugu, optimisé pour la rapidité sur des tâches courantes comme la revue de code ou les chatbots, et Fugu Ultra, conçu pour les problèmes complexes en plusieurs étapes. Sur les benchmarks publiés, Fugu Ultra affiche 73,7 % sur SWE Bench Pro contre 69,2 % pour Claude Opus 4.8, 93,2 % sur LiveCodeBench contre 87,8 % pour Opus, et 50,0 % sur Humanity's Last Exam contre 49,8 %. L'orchestrateur se classe premier sur 10 des 11 benchmarks testés, dépassant individuellement chacun des modèles qu'il coordonne, dont des instances de Gemini 3.1 Pro et GPT 5.5.
Ce résultat illustre un principe contre-intuitif : un système qui apprend à déléguer peut surpasser les modèles auxquels il délègue. Pour les équipes de développement, cela signifie qu'il est possible d'accéder à des performances de pointe sans gérer soi-même la complexité d'une architecture multi-agents. Fugu expose également un mécanisme d'opt-out : certains agents peuvent être exclus du pool pour répondre à des exigences de confidentialité ou de conformité réglementaire, ce qui le rend utilisable dans des environnements contraints. La version Ultra, en revanche, ne propose pas cette flexibilité, son pool d'agents est fixe.
Sakana AI, studio de recherche fondé en 2023 à Tokyo par d'anciens chercheurs de Google Brain, s'appuie ici sur deux articles présentés à ICLR 2026 : Trinity, qui assigne dynamiquement des rôles de Penseur, Travailleur ou Vérificateur à chaque agent selon le contexte, et Conductor, entraîné par renforcement pour découvrir des stratégies de coordination en langage naturel. La motivation déclarée pour l'architecture multi-fournisseurs est explicitement politique : l'équipe cite les récents contrôles à l'export sur les modèles Fable et Mythos d'Anthropic comme exemple du risque de dépendance à un seul acteur. En routant autour des restrictions d'accès, Fugu se positionne comme une infrastructure résiliente. Testé en bêta auprès de près de 500 utilisateurs, il a notamment permis à un agent d'améliorer automatiquement la recette d'entraînement d'un petit modèle GPT sur 123 expériences successives, un cas d'usage qui préfigure une automatisation profonde de la recherche en IA elle-même.
Le mécanisme d'opt-out permettant d'exclure certains agents du pool pour des raisons de conformité rend Fugu potentiellement adopté par des entreprises européennes soumises au RGPD ou à l'AI Act.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




