OutilsVentureBeat AI2h· 2 min de lecture

Sans Claude Fable 5 : Sakana atteint les performances de pointe avec son système multi-modèles Fugu

Sakana AI a lancé Fugu, un système d'orchestration multi-agents accessible via une API compatible OpenAI, conçu pour égaler les performances des modèles d'IA les plus avancés sans dépendre d'un fournisseur unique. Fondée par David Ha, ancien directeur de recherche chez Google Brain, la startup propose deux déclinaisons : Fugu, optimisé pour les tâches courantes à faible latence et intégrable directement dans des environnements de développement comme Codex, et Fugu Ultra, destiné aux travaux complexes tels que la recherche en IA, l'analyse en cybersécurité ou les investigations de brevets, facturé 5 dollars le million de tokens en entrée et 30 dollars en sortie. Le système fonctionne comme un chef d'orchestre : face à une requête, il la décompose en sous-tâches, les délègue à un ensemble de modèles spécialisés, vérifie leurs résultats, puis synthétise la réponse finale. Fugu est lui-même un LLM entraîné à appeler d'autres LLMs, y compris des instances de lui-même de façon récursive, selon les équipes de Sakana.

Le lancement intervient dans un contexte précis : le 12 juin 2026, Anthropic a révoqué l'accès public à ses deux modèles les plus puissants, Claude Mythos 5 et Claude Fable 5, sous la pression d'un décret américain de contrôle des exportations. Pour Ha, cet événement illustre un risque systémique majeur pour les entreprises et les gouvernements qui s'appuient sur un seul fournisseur d'IA. "L'accès aux meilleurs modèles peut disparaître du jour au lendemain", a-t-il écrit sur X. Fugu répond à ce problème en s'appuyant sur un pool de modèles entièrement interchangeable, dont la composition exacte reste propriétaire, rendant le système résilient face aux restrictions géopolitiques ou commerciales soudaines.

Ce projet s'inscrit dans une tendance plus large qui fait de l'orchestration intelligente de modèles la prochaine frontière de l'IA, au-delà de la seule course à la taille des paramètres. Fugu repose sur deux travaux de recherche publiés par Sakana en 2026, TRINITY et Conductor, qui formalisent des stratégies de coordination apprises plutôt que des workflows codés à la main. En affichant des performances comparables ou supérieures à Fable et Mythos sur des benchmarks d'agents tiers, Sakana cherche à convaincre entreprises et États que la résilience collective vaut mieux que la dépendance à un modèle monolithique. Dans un contexte géopolitique de plus en plus fragmenté, la startup, désormais clairement tournée vers le marché entreprise, pourrait s'imposer comme un acteur clé de l'infrastructure IA critique mondiale.

Impact France/UE

Les entreprises et institutions européennes exposées aux restrictions d'exportation américaines sur les modèles IA disposent avec Fugu d'une alternative d'orchestration multi-modèles résiliente, réduisant leur dépendance à un fournisseur unique.

Dans nos dossiers

OpenAI Anthropic Claude Mythos Claude Fable 5

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AI News

Réduire la dépendance aux fournisseurs grâce aux modèles multi-agents Sakana AI Fugu

Sakana AI, société japonaise spécialisée dans l'intelligence artificielle, a lancé Fugu, un système d'orchestration multi-agents conçu pour éliminer la dépendance à un fournisseur unique. Accessible via un endpoint compatible OpenAI, Fugu fonctionne comme un chef d'orchestre invisible : il analyse chaque requête et décide soit de la traiter directement, soit de mobiliser un ensemble de modèles spécialisés travaillant en coordination. La gestion de la sélection des modèles, de la délégation des tâches, de la vérification et de la synthèse des résultats s'effectue en arrière-plan. Les équipes techniques interagissent avec ce qui ressemble à un modèle unique, sans se préoccuper de l'infrastructure sous-jacente. Fugu est proposé en deux versions : une version standard, optimisée pour la faible latence et les tâches quotidiennes comme la revue de code, et une version Ultra, destinée aux analyses complexes telles que la reproduction d'articles académiques, les investigations bibliographiques ou l'analyse de brevets. Environ 500 utilisateurs ont participé à une bêta prolongée axée sur des workflows computationnels multi-étapes. L'enjeu central de Fugu est la résilience face aux risques géopolitiques et réglementaires. Des contrôles à l'exportation récents touchant des modèles d'Anthropic ont démontré qu'un accès à une architecture fondamentale précise peut disparaître du jour au lendemain selon les décisions de politique étrangère. En construisant un système dont le pool d'agents est entièrement interchangeable, Sakana AI permet de réorienter dynamiquement le trafic autour de tout fournisseur restreint ou dégradé, garantissant la continuité du service. Les entreprises soumises à des contraintes strictes de gouvernance des données peuvent également exclure manuellement certains modèles sous-jacents du circuit de routage. Selon Sakana AI, Fugu Ultra affiche des performances comparables aux meilleurs modèles fermés, dont Fable 5 et Mythos Preview, sur des benchmarks scientifiques, d'ingénierie et de raisonnement, sans exposer les entreprises au risque de concentration ou aux contrôles à l'exportation propres à ces modèles. Les tests en conditions réelles ont validé l'approche sur deux fronts majeurs. En cybersécurité, des équipes ont confié à Fugu Ultra des cycles complets d'évaluation de sécurité : à partir d'une seule instruction, le moteur d'orchestration a mené de façon autonome la phase de reconnaissance, effectué des vérifications de type XSS et injection SQL, et réalisé des audits d'authentification, sans jamais déclencher d'actions destructives contre l'infrastructure cible. Il a conclu chaque engagement par un rapport de vulnérabilités structuré, avec preuves et étapes de reproduction à destination des équipes humaines. Sur le terrain du développement logiciel, Fugu Ultra a été intégré dans des pipelines de revue de code où il a systématiquement surpassé les modèles monolithiques dans la détection de failles logiques et de vulnérabilités de sécurité. Un ingénieur participant a résumé la tendance : "Pour la revue de code, Fugu Ultra est nettement meilleur que GPT-5.5."

UELes entreprises européennes soumises aux exigences de souveraineté numérique ou à l'AI Act pourraient s'appuyer sur ce type de système multi-agents pour réduire leur dépendance à un fournisseur unique et se prémunir contre les interruptions liées aux contrôles à l'exportation.

OutilsOutil

1 source

2MarkTechPost

Perplexity intègre Deep Research dans son agent informatique, en distribuant les sous-tâches sur plus de 20 modèles de pointe

Perplexity a intégré sa fonctionnalité Deep Research à son système d'orchestration multi-modèles baptisé Computer, une évolution majeure annoncée en juin 2026. Là où l'ancienne version exécutait une séquence fixe de recherches, la nouvelle décompose automatiquement chaque question complexe en sous-tâches, qu'elle distribue ensuite à plus de 20 modèles d'IA en parallèle. Le moteur de raisonnement central est Claude Opus 4.6, tandis que des sous-agents spécialisés, dont Gemini, prennent en charge des pans spécifiques de l'analyse. Le résultat n'est plus un simple résumé : Deep Research dans Computer produit des rapports complets avec citations vérifiées, des présentations et des tableurs interactifs, entièrement générés et modifiables au sein de l'environnement Computer. Une capacité distinctive, baptisée Search as Code, permet au modèle d'écrire lui-même le code qui pilote la recherche, exécutant des milliers d'appels de récupération en parallèle dans un environnement sandbox, avec filtrage, déduplication et reclassement des sources à la volée. Les gains de performance publiés par Perplexity illustrent l'ampleur du bond. Sur le benchmark BrowseComp d'OpenAI, qui teste la capacité à retrouver des informations difficiles à localiser par navigation web, le score passe de 40,7 % à 83,8 %, soit plus du doublement. Sur Humanity's Last Exam, un test d'expertise académique pluridisciplinaire conçu par le Center for AI Safety et Scale AI, le taux grimpe de 36,4 % à 50,5 %. Ces chiffres positionnent la nouvelle version comme l'une des solutions de recherche agentique les plus performantes du marché. Concrètement, un professionnel peut demander une comparaison des marges bénéficiaires des grands fabricants de puces IA sur cinq ans, une cartographie des différences entre le RGPD européen et les lois américaines sur la vie privée, ou une synthèse des essais cliniques sur l'impact cardiovasculaire des médicaments amaigrissants, et recevoir en retour un livrable structuré, prêt à l'emploi. Computer avait été lancé fin février 2026 comme plateforme cloud de coordination d'agents IA. L'intégration de Deep Research s'inscrit dans une course effrénée entre les acteurs de la recherche augmentée par l'IA, où Perplexity affronte directement Google, OpenAI et Anthropic sur le terrain de la recherche agentique complexe. La fonctionnalité est disponible pour les abonnés Perplexity Max, mais les développeurs peuvent y accéder de façon programmatique via l'Agent API en mode pay-as-you-go, avec un preset deep-research intégré au SDK officiel et une compatibilité avec le SDK OpenAI via l'endpoint POST /v1/responses. L'ouverture aux développeurs signal que Perplexity positionne cette infrastructure non comme un produit grand public isolé, mais comme une couche de recherche que d'autres applications pourront exploiter directement, ce qui pourrait redéfinir la manière dont les outils professionnels intègrent l'accès à l'information.

UELes professionnels et développeurs européens disposent d'un accès API à une couche de recherche agentique capable de traiter des sujets réglementaires comme le RGPD, sans impact institutionnel ou réglementaire direct sur la France ou l'UE.

OutilsOutil

1 source

3AWS ML Blog

Créer des systèmes d'IA générative haute performance avec Strands Agents, NVIDIA NIM et Amazon Bedrock AgentCore

AWS a publié un guide technique détaillant comment construire des systèmes d'agents d'IA générative haute performance en combinant trois technologies complémentaires : Strands Agents, le framework multi-agents d'AWS ; NVIDIA NIM, une plateforme d'inférence accélérée par GPU disponible via build.nvidia.com ; et Amazon Bedrock AgentCore, l'environnement d'exécution managé d'Amazon. L'architecture proposée repose sur un système de trois agents spécialisés fonctionnant en parallèle : un agent d'analyse des personas qui évalue le contenu marketing selon différentes audiences et produit des scores de résonance, un agent de validation qui vérifie la conformité légale et de marque, et un agent agrégateur qui consolide les recommandations. Le tout s'articule autour d'un frontend React qui interroge les résultats de manière asynchrone au fur et à mesure que les agents rendent leurs verdicts. Cette combinaison répond à trois problèmes concrets qui freinent le passage des prototypes IA vers la production : la latence d'inférence sous forte charge, la perte de contexte entre les interactions dans les environnements sans état, et le manque de visibilité sur l'exécution des agents. NVIDIA NIM apporte l'accélération GPU via des technologies comme CUDA et TensorRT-LLM, en exposant des API compatibles OpenAI sans adaptation spécifique au modèle. Bedrock AgentCore prend en charge la persistance de la mémoire partagée entre agents, les mécanismes de checkpoint et de récupération sur erreur, ainsi que l'observabilité intégrée. Strands gère l'orchestration parallèle, le contrôle de flux et l'agrégation des résultats. L'ensemble se déploie sous forme de conteneur Docker dans AgentCore Runtime, éliminant la gestion d'infrastructure à mesure que la charge augmente. Le cas d'usage présenté, la revue automatisée de campagnes marketing, n'est qu'un point d'entrée : la même architecture s'applique aux assistants virtuels, aux pipelines RAG et à l'automatisation de processus de validation complexes. Ce guide s'inscrit dans une compétition intense entre les grands fournisseurs cloud pour capter les workloads IA en production. AWS positionne Bedrock AgentCore comme la couche managée qui simplifie le déploiement d'agents à grande échelle, tandis que NVIDIA consolide sa présence dans la chaîne de valeur logicielle via NIM, bien au-delà de la simple vente de GPU. Strands Agents, framework open source lancé par AWS début 2025, cherche à s'imposer face à LangGraph ou AutoGen comme standard d'orchestration multi-agents. La multiplication de ces briques interopérables signale que les architectures agentiques entrent dans une phase d'industrialisation, où la fiabilité et l'observabilité comptent désormais autant que les capacités du modèle lui-même.

OutilsOutil

1 source

4Pandaily

Tesla Chine intègre le modèle d'IA Doubao dans son système embarqué

Tesla China a finalisé le dépôt réglementaire de son système vocal embarqué le 20 avril 2026, ouvrant la voie à l'intégration du modèle d'intelligence artificielle Doubao de ByteDance dans ses véhicules vendus en Chine. Selon des informations relayées par AI Daily, la page officielle de Tesla China avait déjà révélé dans ses "Conditions d'utilisation de l'assistant vocal embarqué" que la Model Y L serait équipée à la fois du modèle Doubao et de DeepSeek, tous deux accessibles via Volcano Engine, la plateforme cloud de ByteDance. La répartition des rôles est précise : Doubao prend en charge les commandes vocales courantes, réglage de la navigation, contrôle de la lecture multimédia, ajustements climatiques et consultation du manuel propriétaire, tandis que DeepSeek alimente des fonctionnalités conversationnelles plus avancées, permettant des échanges de nature plus générale avec le véhicule. Cette intégration marque une étape concrète dans la localisation de l'expérience Tesla en Chine, marché qui représente une part critique de ses ventes mondiales. En adoptant deux modèles d'IA développés par des acteurs chinois majeurs, Tesla reconnaît implicitement que les LLM occidentaux ne suffisent pas à répondre aux attentes des consommateurs locaux, qu'il s'agisse de la langue, des usages culturels ou des exigences réglementaires. Pour les utilisateurs, cela se traduit par un assistant embarqué nettement plus capable et mieux adapté aux conditions de conduite chinoises. Cette décision s'inscrit dans un contexte de concurrence intense sur le marché automobile chinois, où des constructeurs locaux comme BYD, NIO ou Li Auto intègrent depuis plusieurs années des assistants IA avancés directement dans leurs plateformes. Tesla, longtemps en retard sur ce volet en Chine, avait déjà engagé des discussions avec Baidu pour la cartographie et les services connectés. Le choix de Doubao, modèle phare de ByteDance aux centaines de millions d'utilisateurs, et de DeepSeek, devenu en quelques mois une référence mondiale en matière d'efficience des LLM, reflète la volonté de Tesla de s'aligner rapidement sur les standards locaux pour ne pas perdre de terrain face à une industrie nationale en pleine accélération technologique.

OutilsActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic