Aller au contenu principal
OutilsVentureBeat AI9h· 2 min de lecture

Sakana AI lance un agent 'ultra deep research' : des rapports de plus de 100 pages en 8 heures

Source originale ↗·

La startup japonaise Sakana AI, basée à Tokyo, a lancé son premier produit commercial, Sakana Marlin, un agent de recherche autonome destiné aux entreprises. Présenté comme un "directeur stratégique virtuel", Marlin ne génère pas de réponses en quelques secondes comme les chatbots classiques : il tourne en boucle de raisonnement pendant jusqu'à huit heures d'affilée pour produire des rapports stratégiques de plus de cent pages, accompagnés de diapositives exécutives, d'annexes et de références bibliographiques. Le produit est disponible immédiatement sur le site de l'entreprise, avec une tarification à l'usage, et cible exclusivement les grandes entreprises, les institutions financières et les think tanks. L'utilisateur soumet un sujet de recherche, échange brièvement avec le système pour affiner le périmètre, puis laisse Marlin travailler seul. Sakana a publié des exemples de rapports générés, portant notamment sur des scénarios de blocage du détroit d'Ormuz, la cartographie des réglementations mondiales sur l'IA, ou encore le retour des "bond vigilantes" sur les marchés obligataires.

Ce lancement marque un tournant dans la manière dont les grandes organisations envisagent l'IA. Depuis deux ans, l'industrie a été dominée par la course à la vitesse : générer un texte, un résumé ou du code en quelques millisecondes. Marlin renverse cette logique en pariant sur la profondeur plutôt que la rapidité. Pour une multinationale ou un fonds d'investissement, la valeur ne réside plus dans la réactivité, mais dans la capacité à synthétiser des sources hétérogènes, à croiser des données, à formuler des hypothèses et à les tester automatiquement, le tout sans intervention humaine. C'est un glissement de paradigme : l'IA cesse d'être un assistant réactif pour devenir un analyste autonome capable de mener une investigation stratégique complète en une journée de travail.

Sakana AI a été fondée par des anciens de Google Brain, dont David Ha et Llion Jones, co-auteur du papier fondateur "Attention is All You Need". L'entreprise a construit Marlin sur deux avancées internes majeures : l'Adaptive Branching Monte Carlo Tree Search (AB-MCTS), une technique de raisonnement inspirée des moteurs d'échecs qui explore des milliers de chemins possibles avant de choisir la meilleure piste, et "The AI Scientist", un projet de recherche publié dans Nature qui avait automatisé le processus de découverte scientifique de bout en bout. Marlin est la traduction commerciale de ces travaux de laboratoire. Sakana n'a pas précisé quels modèles de langage il utilise en coulisses. Dans un marché où OpenAI, Perplexity et Google proposent déjà des fonctions de "deep research", Sakana se différencie par l'échelle temporelle et la profondeur de sortie, positionnant Marlin non pas comme un concurrent des chatbots grand public, mais comme un outil de conseil stratégique automatisé à destination des décideurs.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost 

Sakana AI commercialise AB-MCTS avec Sakana Marlin, un agent capable de créer des rapports de 100 pages avec diapositives

Sakana AI, la startup tokyoïte fondée par d'anciens chercheurs de Google DeepMind, a lancé cette semaine son premier produit commercial : Sakana Marlin, un agent de recherche autonome destiné aux entreprises. Contrairement à un chatbot classique qui répond en quelques secondes, Marlin fonctionne sur des sessions pouvant durer jusqu'à huit heures. L'utilisateur soumet un sujet ou une question stratégique, et l'agent planifie des hypothèses, explore des sources, vérifie ses conclusions de manière autonome, puis produit un rapport structuré de 60 à 100 pages accompagné d'un jeu de diapositives généré par IA. Chaque session mobilise des centaines, voire des milliers d'appels à des modèles de langage. La beta fermée d'avril 2026 a permis à environ 300 professionnels de tester l'outil sur des tâches réelles : formulation de stratégie, étude de marché, analyse de risques et veille concurrentielle. Sakana a également noué des partenariats avec MUFG et reçu un investissement stratégique de Citigroup. L'impact potentiel est significatif pour les équipes stratégiques et les directions générales. Marlin se positionne comme un "Virtual CSO" (Chief Strategy Officer) virtuel, capable de compresser en quelques heures un travail d'analyse qui nécessiterait normalement plusieurs semaines à une équipe entière. Les rapports produits incluent un corps principal, des références bibliographiques et des annexes, avec 60 à 80 sources citées par session. Pour les grandes entreprises confrontées à des décisions complexes dans des délais serrés, ce type d'outil pourrait transformer la façon dont la veille stratégique est produite et consommée, en déplaçant une partie du travail analytique des consultants ou analystes internes vers des agents automatisés. La technologie sous-jacente repose sur AB-MCTS, un algorithme de recherche arborescente adaptatif développé par Sakana à partir de travaux de recherche publiés dans une étude intitulée "Wider or Deeper? Scaling LLM Inference-Time Compute with Adaptive Branching Tree Search". À chaque étape du raisonnement, l'algorithme choisit entre deux stratégies : élargir l'exploration en générant un nouveau candidat, ou approfondir une piste prometteuse déjà identifiée. Une variante multi-modèles peut en outre router certaines étapes vers différents LLMs selon leur pertinence, une approche qui, dans les expériences d'ARC-AGI-2 menées par Sakana, a permis de résoudre 27,5 % des tâches en combinant o4-mini, Gemini 2.5 Pro et DeepSeek-R1, contre 23 % pour o4-mini seul. Marlin s'appuie également sur les travaux du projet AI Scientist de Sakana, publié dans la revue Nature, qui avait démontré la capacité d'un agent à conduire une découverte scientifique autonome de bout en bout.

UELes équipes stratégiques des grandes entreprises françaises et européennes pourraient adopter ce type d'agent pour automatiser la veille concurrentielle et les analyses de marché, réduisant potentiellement la demande en analystes et consultants internes.

OutilsOutil
1 source
Une seule API, des rapports complets : la révolution Deep Research est là
2Le Big Data 

Une seule API, des rapports complets : la révolution Deep Research est là

Google a officiellement lancé le 21 avril 2026 deux nouveaux agents d'analyse accessibles via l'API Gemini : Deep Research et Deep Research Max. Alimentés par le modèle Gemini 3.1 Pro, ces agents transforment une simple requête en rapport d'analyse structuré, en enchaînant automatiquement la collecte de données, le recoupement de sources et la mise en forme des résultats. Deep Research cible les usages interactifs qui privilégient la rapidité, tandis que Deep Research Max adopte une approche plus exhaustive, multipliant les sources et affinant ses conclusions pour une précision accrue. L'API génère également des infographies et des graphiques directement intégrés aux rapports, rendant les données exploitables sans passer par des outils tiers. Des acteurs spécialisés comme FactSet, S&P Global et PitchBook participent déjà à l'écosystème, confirmant l'ancrage industriel de la démarche. Ce lancement change concrètement la façon dont les entreprises peuvent mobiliser l'IA pour l'analyse. Jusqu'ici, les outils de recherche automatisée se limitaient à récupérer des réponses ponctuelles ; l'API Deep Research orchestre un véritable processus d'investigation autonome. Elle connecte le web ouvert aux bases de données internes via le Model Context Protocol, permettant aux organisations d'intégrer leurs données propriétaires dans le flux d'analyse sans les exposer à l'extérieur. L'accès au web peut même être désactivé entièrement, ce qui ouvre la porte aux secteurs soumis à des contraintes de confidentialité strictes, finance, santé, droit. Les utilisateurs conservent par ailleurs un contrôle précis : ils peuvent ajuster le plan de recherche avant son exécution et suivre les étapes en temps réel, ce qui renforce la traçabilité des résultats produits. Cette évolution s'inscrit dans une course technologique qui s'est accélérée depuis que les grands laboratoires ont compris que la valeur des LLM ne réside pas seulement dans la génération de texte, mais dans leur capacité à raisonner sur des corpus complexes et hétérogènes. OpenAI avait ouvert la voie avec son propre produit Deep Research début 2025 ; Google répond aujourd'hui avec une offre directement exposée en API, ciblant les développeurs et les équipes analytiques plutôt que les seuls utilisateurs finaux. Les domaines visés, études de marché, sciences de la vie, analyse financière, sont précisément ceux où le coût de production d'un rapport de qualité est élevé et où la vitesse d'analyse constitue un avantage concurrentiel direct. La prochaine étape sera de mesurer si la qualité des rapports produits tient face aux standards des analystes humains dans ces secteurs exigeants.

UELes entreprises françaises des secteurs finance, santé et droit peuvent intégrer cette API d'analyse autonome dans leurs systèmes propriétaires via le Model Context Protocol, sans exposer leurs données à des services externes.

OutilsOutil
1 source
Google lance des agents Deep Research et Deep Research Max pour automatiser la recherche complexe
3The Decoder 

Google lance des agents Deep Research et Deep Research Max pour automatiser la recherche complexe

Google DeepMind a lancé Deep Research Max, un nouvel agent IA reposant sur Gemini 2.5 Pro, capable de mener des recherches autonomes sur le web et dans des sources de données propriétaires. Pour la première fois, les développeurs peuvent connecter des flux financiers et d'autres sources spécialisées via le Model Context Protocol (MCP). L'agent accompagne une version standard, Deep Research, déjà disponible dans les produits Google, tandis que la variante Max vise davantage les usages professionnels et techniques. L'enjeu est considérable pour les secteurs où l'analyse de données complexes est chronophage : finance, droit, recherche académique, conseil stratégique. En automatisant la collecte et la synthèse d'informations issues de sources hétérogènes, y compris des bases propriétaires inaccessibles au grand public, ces agents pourraient transformer le travail d'analyste ou de chercheur. La possibilité de brancher des flux financiers en temps réel via MCP représente une ouverture concrète vers des cas d'usage enterprise jusqu'ici difficiles à couvrir avec des LLM généralistes. Google s'inscrit ici dans une course intense aux agents de recherche autonomes : OpenAI a lancé son propre Deep Research début 2025, et Perplexity propose des fonctionnalités similaires. Le Model Context Protocol, initialement développé par Anthropic, s'impose progressivement comme standard d'interopérabilité entre agents IA et sources de données tierces, ce qui explique l'adoption par Google. Les benchmarks avancés restent peu transparents sur leur méthodologie, un point de vigilance récurrent dans ce secteur où les annonces marketing précèdent souvent les preuves indépendantes.

UELes entreprises européennes des secteurs finance, droit et conseil stratégique peuvent tester cet agent pour automatiser l'analyse de sources propriétaires via MCP.

OutilsOutil
1 source
Google lance des agents Deep Research capables d'explorer le web et vos données privées
4VentureBeat AI 

Google lance des agents Deep Research capables d'explorer le web et vos données privées

Google a dévoilé lundi une mise à jour majeure de ses agents de recherche autonomes, en lançant deux nouvelles versions de son outil Deep Research dans l'API Gemini : Deep Research et Deep Research Max. Construits sur le modèle Gemini 2.5 Pro, ces agents permettent pour la première fois aux développeurs de combiner des données issues du web ouvert avec des informations internes à l'entreprise via un seul appel API. Ils intègrent également la génération native de graphiques et d'infographies directement dans les rapports produits, ainsi que la connexion à des sources de données tierces grâce au protocole MCP (Model Context Protocol). Les deux agents sont disponibles dès aujourd'hui en prévisualisation publique dans les offres payantes de l'API Gemini. Sur le plan des performances, Google annonce des scores de 93,3 % sur le benchmark DeepSearchQA et 54,6 % sur HLE pour la version Max, selon un message du PDG Sundar Pichai publié sur X. Les deux agents répondent à des besoins différents selon une logique de compromis entre vitesse et exhaustivité. Deep Research, la version standard, est optimisée pour des usages interactifs à faible latence : elle convient aux interfaces utilisateurs qui doivent répondre à des questions analytiques complexes en quasi-temps réel, comme un tableau de bord financier. Deep Research Max, à l'inverse, mobilise un calcul étendu à l'inférence pour produire des analyses plus profondes et mieux sourcées, conçues pour des workflows asynchrones en arrière-plan. C'est l'outil pour une équipe d'analystes qui lance une série de rapports de due diligence avant de quitter le bureau et les récupère entièrement traités le lendemain matin. C'est surtout la prise en charge du protocole MCP qui constitue le saut qualitatif le plus significatif : elle permet aux agents d'interroger des bases de données privées, des référentiels documentaires internes et des services de données spécialisés, transformant Deep Research d'un outil de veille web en quelque chose qui s'approche d'un analyste de données universel. Ce lancement s'inscrit dans une course qui s'intensifie entre les grands acteurs de l'IA pour proposer des systèmes capables de conduire de manière autonome des recherches multi-sources, un travail qui mobilise traditionnellement des heures, voire des jours, d'analyse humaine. Google positionne cette infrastructure comme l'épine dorsale des workflows de recherche en entreprise, notamment dans la finance, les sciences du vivant et l'intelligence de marché. La première version de Deep Research avait été lancée en décembre 2025 via l'Interactions API, et le produit aurait « gagné beaucoup de terrain en trois mois », selon Logan Kilpatrick, responsable des relations développeurs chez Google AI. Ce déploiement accéléré signale que Google entend faire de son API Gemini une plateforme centrale pour les applications d'agents d'entreprise, un segment où OpenAI, Anthropic et Microsoft se disputent également une position dominante.

UELes entreprises européennes intégrant leurs données internes via MCP devront vérifier la conformité RGPD avant d'adopter cette API.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic