OutilsAI News2h· 2 min de lecture

Réduire la dépendance aux fournisseurs grâce aux modèles multi-agents Sakana AI Fugu

Sakana AI, société japonaise spécialisée dans l'intelligence artificielle, a lancé Fugu, un système d'orchestration multi-agents conçu pour éliminer la dépendance à un fournisseur unique. Accessible via un endpoint compatible OpenAI, Fugu fonctionne comme un chef d'orchestre invisible : il analyse chaque requête et décide soit de la traiter directement, soit de mobiliser un ensemble de modèles spécialisés travaillant en coordination. La gestion de la sélection des modèles, de la délégation des tâches, de la vérification et de la synthèse des résultats s'effectue en arrière-plan. Les équipes techniques interagissent avec ce qui ressemble à un modèle unique, sans se préoccuper de l'infrastructure sous-jacente. Fugu est proposé en deux versions : une version standard, optimisée pour la faible latence et les tâches quotidiennes comme la revue de code, et une version Ultra, destinée aux analyses complexes telles que la reproduction d'articles académiques, les investigations bibliographiques ou l'analyse de brevets. Environ 500 utilisateurs ont participé à une bêta prolongée axée sur des workflows computationnels multi-étapes.

L'enjeu central de Fugu est la résilience face aux risques géopolitiques et réglementaires. Des contrôles à l'exportation récents touchant des modèles d'Anthropic ont démontré qu'un accès à une architecture fondamentale précise peut disparaître du jour au lendemain selon les décisions de politique étrangère. En construisant un système dont le pool d'agents est entièrement interchangeable, Sakana AI permet de réorienter dynamiquement le trafic autour de tout fournisseur restreint ou dégradé, garantissant la continuité du service. Les entreprises soumises à des contraintes strictes de gouvernance des données peuvent également exclure manuellement certains modèles sous-jacents du circuit de routage. Selon Sakana AI, Fugu Ultra affiche des performances comparables aux meilleurs modèles fermés, dont Fable 5 et Mythos Preview, sur des benchmarks scientifiques, d'ingénierie et de raisonnement, sans exposer les entreprises au risque de concentration ou aux contrôles à l'exportation propres à ces modèles.

Les tests en conditions réelles ont validé l'approche sur deux fronts majeurs. En cybersécurité, des équipes ont confié à Fugu Ultra des cycles complets d'évaluation de sécurité : à partir d'une seule instruction, le moteur d'orchestration a mené de façon autonome la phase de reconnaissance, effectué des vérifications de type XSS et injection SQL, et réalisé des audits d'authentification, sans jamais déclencher d'actions destructives contre l'infrastructure cible. Il a conclu chaque engagement par un rapport de vulnérabilités structuré, avec preuves et étapes de reproduction à destination des équipes humaines. Sur le terrain du développement logiciel, Fugu Ultra a été intégré dans des pipelines de revue de code où il a systématiquement surpassé les modèles monolithiques dans la détection de failles logiques et de vulnérabilités de sécurité. Un ingénieur participant a résumé la tendance : "Pour la revue de code, Fugu Ultra est nettement meilleur que GPT-5.5."

Impact France/UE

Les entreprises européennes soumises aux exigences de souveraineté numérique ou à l'AI Act pourraient s'appuyer sur ce type de système multi-agents pour réduire leur dépendance à un fournisseur unique et se prémunir contre les interruptions liées aux contrôles à l'exportation.

Dans nos dossiers

OpenAI Anthropic Claude Mythos Claude Fable 5

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1VentureBeat AI

Sans Claude Fable 5 : Sakana atteint les performances de pointe avec son système multi-modèles Fugu

Sakana AI a lancé Fugu, un système d'orchestration multi-agents accessible via une API compatible OpenAI, conçu pour égaler les performances des modèles d'IA les plus avancés sans dépendre d'un fournisseur unique. Fondée par David Ha, ancien directeur de recherche chez Google Brain, la startup propose deux déclinaisons : Fugu, optimisé pour les tâches courantes à faible latence et intégrable directement dans des environnements de développement comme Codex, et Fugu Ultra, destiné aux travaux complexes tels que la recherche en IA, l'analyse en cybersécurité ou les investigations de brevets, facturé 5 dollars le million de tokens en entrée et 30 dollars en sortie. Le système fonctionne comme un chef d'orchestre : face à une requête, il la décompose en sous-tâches, les délègue à un ensemble de modèles spécialisés, vérifie leurs résultats, puis synthétise la réponse finale. Fugu est lui-même un LLM entraîné à appeler d'autres LLMs, y compris des instances de lui-même de façon récursive, selon les équipes de Sakana. Le lancement intervient dans un contexte précis : le 12 juin 2026, Anthropic a révoqué l'accès public à ses deux modèles les plus puissants, Claude Mythos 5 et Claude Fable 5, sous la pression d'un décret américain de contrôle des exportations. Pour Ha, cet événement illustre un risque systémique majeur pour les entreprises et les gouvernements qui s'appuient sur un seul fournisseur d'IA. "L'accès aux meilleurs modèles peut disparaître du jour au lendemain", a-t-il écrit sur X. Fugu répond à ce problème en s'appuyant sur un pool de modèles entièrement interchangeable, dont la composition exacte reste propriétaire, rendant le système résilient face aux restrictions géopolitiques ou commerciales soudaines. Ce projet s'inscrit dans une tendance plus large qui fait de l'orchestration intelligente de modèles la prochaine frontière de l'IA, au-delà de la seule course à la taille des paramètres. Fugu repose sur deux travaux de recherche publiés par Sakana en 2026, TRINITY et Conductor, qui formalisent des stratégies de coordination apprises plutôt que des workflows codés à la main. En affichant des performances comparables ou supérieures à Fable et Mythos sur des benchmarks d'agents tiers, Sakana cherche à convaincre entreprises et États que la résilience collective vaut mieux que la dépendance à un modèle monolithique. Dans un contexte géopolitique de plus en plus fragmenté, la startup, désormais clairement tournée vers le marché entreprise, pourrait s'imposer comme un acteur clé de l'infrastructure IA critique mondiale.

UELes entreprises et institutions européennes exposées aux restrictions d'exportation américaines sur les modèles IA disposent avec Fugu d'une alternative d'orchestration multi-modèles résiliente, réduisant leur dépendance à un fournisseur unique.

OutilsOpinion

1 source

2VentureBeat AI

Claude Managed Agents d'Anthropic offre aux entreprises un guichet unique mais soulève un risque de dépendance fournisseur

Anthropic a lancé la semaine dernière une nouvelle plateforme baptisée Claude Managed Agents, destinée aux entreprises souhaitant déployer des agents IA sans se confronter aux complexités techniques habituelles de l'orchestration. Selon Anthropic, la plateforme permet de passer d'un déploiement en semaines ou en mois à quelques jours seulement, en gérant nativement la définition des tâches, des outils et des garde-fous, ainsi que l'exécution des graphes d'état, le routage, la gestion des permissions et le traçage de bout en bout. Des données directionnelles de VentureBeat portant sur plusieurs dizaines d'entreprises au premier trimestre 2026 montrent par ailleurs que l'adoption des API d'orchestration native d'Anthropic est passée de 0 % à 5,7 % entre janvier et février, sur des panels respectifs de 56 et 70 organisations de plus de 100 employés. Microsoft Copilot Studio et Azure AI Studio restaient en tête avec 38,6 % des répondants en février, suivis d'OpenAI à 25,7 %. L'enjeu concret pour les entreprises est double. D'un côté, Claude Managed Agents promet de supprimer la couche d'orchestration externe, sandboxing, checkpointing, gestion des credentials, traçabilité, en l'absorbant directement dans le modèle. C'est un gain de vitesse et de simplicité réel pour des équipes déjà saturées par la multiplication des agents. De l'autre, cela implique de confier les données de session à une base gérée par Anthropic et de laisser l'exécution des agents se dérouler dans un environnement que l'entreprise ne contrôle pas pleinement. Le comportement des agents devient plus difficile à garantir, et les organisations s'exposent à des instructions contradictoires si leur seul levier de contrôle reste le prompting contextuel. Cette sortie s'inscrit dans une course à l'orchestration qui s'intensifie à mesure que les entreprises industrialisent leurs workflows agentiques. Anthropic, porté notamment par l'essor de Claude Code au cours de l'année écoulée, tente ainsi d'élargir son empreinte au-delà de la fourniture de modèles fondamentaux pour devenir le runtime de référence des agents d'entreprise. La stratégie ressemble à celle des grandes plateformes SaaS : créer un écosystème suffisamment intégré pour devenir difficile à quitter. C'est précisément ce que beaucoup d'entreprises espéraient éviter en adoptant l'IA, après avoir déjà subi les effets du lock-in avec leurs fournisseurs logiciels traditionnels. La question qui se pose désormais est de savoir si la promesse de simplicité et de rapidité justifie cette dépendance accrue à un fournisseur unique, et si les concurrents comme Microsoft ou OpenAI proposeront rapidement des alternatives comparables.

UELes entreprises européennes qui adoptent Claude Managed Agents s'exposent à un risque de dépendance fournisseur accru, sans cadre contractuel ou réglementaire spécifique encadrant la souveraineté des données de session confiées à Anthropic.

OutilsOpinion

1 source

3MarkTechPost

Créer un espace de travail d'agents QwenPaw : compétences personnalisées, fournisseurs de modèles et API en streaming

Un tutoriel détaillé publié récemment présente QwenPaw, un environnement de travail destiné aux développeurs souhaitant construire et tester des assistants pilotés par des agents IA. Le guide explique pas à pas comment installer et initialiser QwenPaw dans un environnement Google Colab, configurer un répertoire de travail structuré, activer l'authentification sécurisée avec génération automatique d'un mot de passe aléatoire, et connecter des fournisseurs de modèles externes via les secrets Colab. L'architecture repose sur une organisation en répertoires distincts, espace de travail, secrets, journaux, et expose le service sur un port configurable (par défaut le 8088), avec la possibilité de rendre la console accessible publiquement via un tunnel Cloudflare. Ce type d'environnement répond à un besoin concret des équipes de développement IA : disposer d'un espace intégré pour concevoir des agents, tester leurs compétences personnalisées (« skills »), et valider le comportement de l'API de chat en streaming, le tout sans sortir de l'environnement de développement. En permettant de connecter différents fournisseurs de modèles à la volée et d'exposer une interface console accessible via URL, QwenPaw réduit la friction entre la phase de prototypage et celle de mise en production. La prise en charge native du streaming d'API et d'un garde-fou sur les outils (QWENPAWTOOLGUARD_ENABLED) montre une attention particulière à la robustesse en environnement multi-agents, où les appels d'outils mal contrôlés peuvent rapidement devenir une source d'erreurs coûteuses. QwenPaw s'inscrit dans l'écosystème grandissant des frameworks d'agents IA, qui cherchent à standardiser la façon dont les modèles de langage interagissent avec des outils, des bases de connaissances locales et des API externes. Son nom évoque une parenté avec les modèles Qwen, la famille de LLM développée par Alibaba/Tongyi, très utilisée dans les contextes où l'on cherche des alternatives aux modèles d'OpenAI ou Anthropic. Le fait que le tutoriel soit conçu pour fonctionner directement dans Google Colab, environnement d'exécution gratuit et largement adopté, suggère une volonté de rendre ce framework accessible à un public plus large, au-delà des équipes disposant d'infrastructure dédiée. La direction prise, avec des fonctionnalités comme le scan de compétences en mode « warn » et la gestion fine des permissions, laisse anticiper une montée en maturité vers des cas d'usage de production.

💬 Le QWENPAWTOOLGUARD_ENABLED, c'est le genre de détail qui dit que les auteurs ont déjà mis les mains dans des pipelines multi-agents foireux. Que ça tourne directement dans Colab c'est malin, ça ouvre le truc aux équipes qui n'ont pas de GPU en local. Reste à voir ce que ça vaut une fois sorti du sandbox.

OutilsTuto

1 source

4IEEE Spectrum AI

IEEE lance un cours de formation en ligne sur les grands modèles de langage

L'IEEE, l'organisation internationale des ingénieurs en électronique et en informatique, lance un programme de formation en ligne intitulé "Large Language Models Demystified", disponible sur son réseau d'apprentissage IEEE Learning Network. Développé en partenariat avec l'IEEE Computer Society, ce cursus de cinq cours s'adresse aux professionnels techniques qui souhaitent comprendre non seulement comment utiliser les modèles de langage, mais comment les concevoir et les intégrer dans des systèmes réels. Le programme couvre l'évolution des architectures transformer, les mécanismes d'attention, l'optimisation des modèles et des exercices pratiques. Ce lancement intervient alors que le marché des LLM est estimé à une croissance annuelle de 33 % jusqu'en 2030, selon le cabinet MarketsandMarkets, ce qui signifie que la maîtrise de ces technologies passe rapidement d'une compétence de niche à une exigence fondamentale pour tout professionnel du numérique. L'enjeu dépasse largement l'usage grand public des assistants conversationnels. Pour les ingénieurs et développeurs, les LLM sont devenus des composants architecturaux à part entière : ils identifient des vulnérabilités dans du code source, transforment des discussions de projet en spécifications techniques formalisées, et automatisent des tâches répétitives qui mobilisaient auparavant des heures de travail humain. Mais utiliser ces systèmes sans en comprendre la logique interne génère des risques concrets. Le phénomène des "hallucinations", où un modèle produit du code ou des faits d'apparence correcte mais fondamentalement erronés, représente un risque de fiabilité majeur en production. Des techniques comme la génération augmentée par récupération (RAG), qui force le modèle à consulter une base de données vérifiée avant de répondre, ou le déploiement d'instances privées pour protéger le code propriétaire des données d'entraînement publiques, sont désormais des compétences attendues des équipes techniques. Ce mouvement s'inscrit dans une transformation plus profonde de la profession d'ingénieur logiciel. L'architecture transformer, qui a remplacé le traitement séquentiel des données par des mécanismes d'attention parallèle capables d'ingérer des corpus massifs simultanément, a rendu possible une nouvelle génération d'outils de développement. Les API permettent aujourd'hui de connecter directement un LLM à des bases de données internes ou à des environnements d'exécution de code, dépassant largement la simple interface de chat. Face à cette mutation rapide, l'écart se creuse entre ceux qui utilisent l'IA comme un outil opaque et ceux qui savent en contrôler les paramètres, en sécuriser les accès et en garantir la cohérence des résultats. La formation proposée par l'IEEE vise précisément à combler ce fossé, en offrant aux professionnels une compréhension de fond qui transforme l'expérimentation en approche d'ingénierie rigoureuse.

UELes ingénieurs et développeurs français et européens peuvent suivre cette formation IEEE pour structurer leur maîtrise des architectures LLM, compétence de plus en plus exigée par les employeurs du secteur numérique en Europe.

💬 Honnêtement, c'est plus intéressant que ça en a l'air. L'IEEE sort le grand jeu avec ce programme de formation sur les grands modèles de langage, "Large Language Models Demystified". On parle pas juste d'utiliser ces outils, mais aussi de les concevoir et de les intégrer vraiment. C'est crucial, avec le marché des LLM qui grimpe à 33% par an jusqu'en 2030, on passe d'une compétence de spécialiste à une nécessité pour tout pro du numérique. Mais attention, utiliser ces modèles sans les comprendre crée des risques concrets : ces "hallucinations", c'est fondamentalement faux mais qui peut sembler correct. Techniques comme le RAG ou le déploiement d'instances privées, c'est devenu indispensable pour sécuriser le code et les données. L'IEEE met le doigt sur un vrai besoin : transformer l'expérimentation en ingénierie rigoureuse avec ces outils de plus en plus centraux dans notre boulot d'ingés logiciels.

OutilsTuto

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic