OutilsVentureBeat AI · 15 juin 2026, 22:30· 2 min de lecture

Sakana AI lance un agent 'ultra deep research' : des rapports de plus de 100 pages en 8 heures

La startup japonaise Sakana AI, basée à Tokyo, a lancé son premier produit commercial, Sakana Marlin, un agent de recherche autonome destiné aux entreprises. Présenté comme un "directeur stratégique virtuel", Marlin ne génère pas de réponses en quelques secondes comme les chatbots classiques : il tourne en boucle de raisonnement pendant jusqu'à huit heures d'affilée pour produire des rapports stratégiques de plus de cent pages, accompagnés de diapositives exécutives, d'annexes et de références bibliographiques. Le produit est disponible immédiatement sur le site de l'entreprise, avec une tarification à l'usage, et cible exclusivement les grandes entreprises, les institutions financières et les think tanks. L'utilisateur soumet un sujet de recherche, échange brièvement avec le système pour affiner le périmètre, puis laisse Marlin travailler seul. Sakana a publié des exemples de rapports générés, portant notamment sur des scénarios de blocage du détroit d'Ormuz, la cartographie des réglementations mondiales sur l'IA, ou encore le retour des "bond vigilantes" sur les marchés obligataires.

Ce lancement marque un tournant dans la manière dont les grandes organisations envisagent l'IA. Depuis deux ans, l'industrie a été dominée par la course à la vitesse : générer un texte, un résumé ou du code en quelques millisecondes. Marlin renverse cette logique en pariant sur la profondeur plutôt que la rapidité. Pour une multinationale ou un fonds d'investissement, la valeur ne réside plus dans la réactivité, mais dans la capacité à synthétiser des sources hétérogènes, à croiser des données, à formuler des hypothèses et à les tester automatiquement, le tout sans intervention humaine. C'est un glissement de paradigme : l'IA cesse d'être un assistant réactif pour devenir un analyste autonome capable de mener une investigation stratégique complète en une journée de travail.

Sakana AI a été fondée par des anciens de Google Brain, dont David Ha et Llion Jones, co-auteur du papier fondateur "Attention is All You Need". L'entreprise a construit Marlin sur deux avancées internes majeures : l'Adaptive Branching Monte Carlo Tree Search (AB-MCTS), une technique de raisonnement inspirée des moteurs d'échecs qui explore des milliers de chemins possibles avant de choisir la meilleure piste, et "The AI Scientist", un projet de recherche publié dans Nature qui avait automatisé le processus de découverte scientifique de bout en bout. Marlin est la traduction commerciale de ces travaux de laboratoire. Sakana n'a pas précisé quels modèles de langage il utilise en coulisses. Dans un marché où OpenAI, Perplexity et Google proposent déjà des fonctions de "deep research", Sakana se différencie par l'échelle temporelle et la profondeur de sortie, positionnant Marlin non pas comme un concurrent des chatbots grand public, mais comme un outil de conseil stratégique automatisé à destination des décideurs.

Dans nos dossiers

Perplexity AI OpenAI

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost

Sakana AI commercialise AB-MCTS avec Sakana Marlin, un agent capable de créer des rapports de 100 pages avec diapositives

Sakana AI, la startup tokyoïte fondée par d'anciens chercheurs de Google DeepMind, a lancé cette semaine son premier produit commercial : Sakana Marlin, un agent de recherche autonome destiné aux entreprises. Contrairement à un chatbot classique qui répond en quelques secondes, Marlin fonctionne sur des sessions pouvant durer jusqu'à huit heures. L'utilisateur soumet un sujet ou une question stratégique, et l'agent planifie des hypothèses, explore des sources, vérifie ses conclusions de manière autonome, puis produit un rapport structuré de 60 à 100 pages accompagné d'un jeu de diapositives généré par IA. Chaque session mobilise des centaines, voire des milliers d'appels à des modèles de langage. La beta fermée d'avril 2026 a permis à environ 300 professionnels de tester l'outil sur des tâches réelles : formulation de stratégie, étude de marché, analyse de risques et veille concurrentielle. Sakana a également noué des partenariats avec MUFG et reçu un investissement stratégique de Citigroup. L'impact potentiel est significatif pour les équipes stratégiques et les directions générales. Marlin se positionne comme un "Virtual CSO" (Chief Strategy Officer) virtuel, capable de compresser en quelques heures un travail d'analyse qui nécessiterait normalement plusieurs semaines à une équipe entière. Les rapports produits incluent un corps principal, des références bibliographiques et des annexes, avec 60 à 80 sources citées par session. Pour les grandes entreprises confrontées à des décisions complexes dans des délais serrés, ce type d'outil pourrait transformer la façon dont la veille stratégique est produite et consommée, en déplaçant une partie du travail analytique des consultants ou analystes internes vers des agents automatisés. La technologie sous-jacente repose sur AB-MCTS, un algorithme de recherche arborescente adaptatif développé par Sakana à partir de travaux de recherche publiés dans une étude intitulée "Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search". À chaque étape du raisonnement, l'algorithme choisit entre deux stratégies : élargir l'exploration en générant un nouveau candidat, ou approfondir une piste prometteuse déjà identifiée. Une variante multi-modèles peut en outre router certaines étapes vers différents LLMs selon leur pertinence, une approche qui, dans les expériences d'ARC-AGI-2 menées par Sakana, a permis de résoudre 27,5 % des tâches en combinant o4-mini, Gemini 2.5 Pro et DeepSeek-R1, contre 23 % pour o4-mini seul. Marlin s'appuie également sur les travaux du projet AI Scientist de Sakana, publié dans la revue Nature, qui avait démontré la capacité d'un agent à conduire une découverte scientifique autonome de bout en bout.

UELes équipes stratégiques des grandes entreprises françaises et européennes pourraient adopter ce type d'agent pour automatiser la veille concurrentielle et les analyses de marché, réduisant potentiellement la demande en analystes et consultants internes.

OutilsOutil

1 source

2Le Big Data

Une seule API, des rapports complets : la révolution Deep Research est là

Google a officiellement lancé le 21 avril 2026 deux nouveaux agents d'analyse accessibles via l'API Gemini : Deep Research et Deep Research Max. Alimentés par le modèle Gemini 3.1 Pro, ces agents transforment une simple requête en rapport d'analyse structuré, en enchaînant automatiquement la collecte de données, le recoupement de sources et la mise en forme des résultats. Deep Research cible les usages interactifs qui privilégient la rapidité, tandis que Deep Research Max adopte une approche plus exhaustive, multipliant les sources et affinant ses conclusions pour une précision accrue. L'API génère également des infographies et des graphiques directement intégrés aux rapports, rendant les données exploitables sans passer par des outils tiers. Des acteurs spécialisés comme FactSet, S&P Global et PitchBook participent déjà à l'écosystème, confirmant l'ancrage industriel de la démarche. Ce lancement change concrètement la façon dont les entreprises peuvent mobiliser l'IA pour l'analyse. Jusqu'ici, les outils de recherche automatisée se limitaient à récupérer des réponses ponctuelles ; l'API Deep Research orchestre un véritable processus d'investigation autonome. Elle connecte le web ouvert aux bases de données internes via le Model Context Protocol, permettant aux organisations d'intégrer leurs données propriétaires dans le flux d'analyse sans les exposer à l'extérieur. L'accès au web peut même être désactivé entièrement, ce qui ouvre la porte aux secteurs soumis à des contraintes de confidentialité strictes, finance, santé, droit. Les utilisateurs conservent par ailleurs un contrôle précis : ils peuvent ajuster le plan de recherche avant son exécution et suivre les étapes en temps réel, ce qui renforce la traçabilité des résultats produits. Cette évolution s'inscrit dans une course technologique qui s'est accélérée depuis que les grands laboratoires ont compris que la valeur des LLM ne réside pas seulement dans la génération de texte, mais dans leur capacité à raisonner sur des corpus complexes et hétérogènes. OpenAI avait ouvert la voie avec son propre produit Deep Research début 2025 ; Google répond aujourd'hui avec une offre directement exposée en API, ciblant les développeurs et les équipes analytiques plutôt que les seuls utilisateurs finaux. Les domaines visés, études de marché, sciences de la vie, analyse financière, sont précisément ceux où le coût de production d'un rapport de qualité est élevé et où la vitesse d'analyse constitue un avantage concurrentiel direct. La prochaine étape sera de mesurer si la qualité des rapports produits tient face aux standards des analystes humains dans ces secteurs exigeants.

UELes entreprises françaises des secteurs finance, santé et droit peuvent intégrer cette API d'analyse autonome dans leurs systèmes propriétaires via le Model Context Protocol, sans exposer leurs données à des services externes.

OutilsOutil

1 source

3Le Big Data

La fin des réponses rapides ? Cet agent de recherche approfondie prend 8 heures pour répondre

Sakana AI, la start-up tokyoïte fondée en 2023 par Llion Jones et David Ha, a lancé le 15 juin 2026 un agent de recherche autonome baptisé Marlin, présenté comme un "directeur de la stratégie virtuel". Contrairement aux outils d'IA générative qui misent sur la réactivité, Marlin prend jusqu'à huit heures pour produire des rapports stratégiques dépassant cent pages. L'utilisateur soumet un sujet et un périmètre, puis l'agent prend le relais : il formule des hypothèses, collecte des données, recoupe les sources et cartographie les causalités. À la sortie, il génère des options stratégiques, des slides, des annexes et un rapport complet. La technologie sous-jacente repose sur AB-MCTS, une recherche arborescente Monte Carlo adaptative inspirée des moteurs d'échecs : le système explore plusieurs pistes en parallèle, abandonne les impasses et approfondit les hypothèses prometteuses. L'architecture s'appuie sur TreeQuest, publié sous licence Apache 2.0. Marlin coordonne plusieurs modèles d'IA selon les tâches, sans en révéler les noms ni les fournisseurs. La tarification s'articule autour de crédits à 98 yens l'unité, un plan Pro à 150 000 yens par mois et une offre entreprise à 400 000 yens. Marlin s'adresse aux entreprises, fonds financiers et groupes de réflexion qui consacrent aujourd'hui des semaines à la recherche préalable aux décisions stratégiques. L'outil automatise la phase la plus laborieuse du conseil : la collecte, la synthèse et la mise en perspective de données complexes. Les exemples cités lors du lancement illustrent l'ambition : analyse d'un blocus théorique du détroit d'Ormuz, cartographie de la réglementation mondiale de l'IA, étude du retour des "justiciers des obligations". Une beta fermée impliquant environ 300 professionnels depuis avril 2026 a généré des retours positifs, un consultant affirmant que l'outil "a dépassé ses attentes". Sakana précise que les données clients ne servent pas à entraîner les modèles sans consentement explicite, un point de confidentialité crucial pour les usages stratégiques sensibles. Llion Jones a coécrit l'article fondateur sur les Transformers chez Google en 2017 ; David Ha est passé par Google Brain et Stability AI. Ensemble, ils ont construit Sakana autour d'une philosophie biomimétique : plutôt qu'un modèle géant unique, des modèles spécialisés qui coopèrent, à l'image des bancs de poissons ou des colonies de fourmis. Cette approche a séduit Nvidia, Google, MUFG, Citi et Salesforce, portant la valorisation de la société au-delà de 2,6 milliards de dollars. Marlin constitue leur premier produit commercial, après ALE-Agent et RL Conductor. Il s'inscrit dans une tendance plus large de l'IA "lente et profonde", en rupture avec la course à la réponse instantanée. La vraie question qui demeure : dans un monde saturé de synthèses automatiques, qui lira réellement cent pages générées par une machine, même brillantes ?

UELes cabinets de conseil et fonds d'investissement européens pourraient s'intéresser à Marlin pour automatiser leur veille stratégique, mais l'outil reste en bêta fermée avec une tarification en yens sans offre adaptée au marché européen.

OutilsOutil

1 source

4The Decoder

Google lance des agents Deep Research et Deep Research Max pour automatiser la recherche complexe

Google DeepMind a lancé Deep Research Max, un nouvel agent IA reposant sur Gemini 2.5 Pro, capable de mener des recherches autonomes sur le web et dans des sources de données propriétaires. Pour la première fois, les développeurs peuvent connecter des flux financiers et d'autres sources spécialisées via le Model Context Protocol (MCP). L'agent accompagne une version standard, Deep Research, déjà disponible dans les produits Google, tandis que la variante Max vise davantage les usages professionnels et techniques. L'enjeu est considérable pour les secteurs où l'analyse de données complexes est chronophage : finance, droit, recherche académique, conseil stratégique. En automatisant la collecte et la synthèse d'informations issues de sources hétérogènes, y compris des bases propriétaires inaccessibles au grand public, ces agents pourraient transformer le travail d'analyste ou de chercheur. La possibilité de brancher des flux financiers en temps réel via MCP représente une ouverture concrète vers des cas d'usage enterprise jusqu'ici difficiles à couvrir avec des LLM généralistes. Google s'inscrit ici dans une course intense aux agents de recherche autonomes : OpenAI a lancé son propre Deep Research début 2025, et Perplexity propose des fonctionnalités similaires. Le Model Context Protocol, initialement développé par Anthropic, s'impose progressivement comme standard d'interopérabilité entre agents IA et sources de données tierces, ce qui explique l'adoption par Google. Les benchmarks avancés restent peu transparents sur leur méthodologie, un point de vigilance récurrent dans ce secteur où les annonces marketing précèdent souvent les preuves indépendantes.

UELes entreprises européennes des secteurs finance, droit et conseil stratégique peuvent tester cet agent pour automatiser l'analyse de sources propriétaires via MCP.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic