Aller au contenu principal
La fin des réponses rapides ? Cet agent de recherche approfondie prend 8 heures pour répondre
OutilsLe Big Data3h· 2 min de lecture

La fin des réponses rapides ? Cet agent de recherche approfondie prend 8 heures pour répondre

Source originale ↗·

Sakana AI, la start-up tokyoïte fondée en 2023 par Llion Jones et David Ha, a lancé le 15 juin 2026 un agent de recherche autonome baptisé Marlin, présenté comme un "directeur de la stratégie virtuel". Contrairement aux outils d'IA générative qui misent sur la réactivité, Marlin prend jusqu'à huit heures pour produire des rapports stratégiques dépassant cent pages. L'utilisateur soumet un sujet et un périmètre, puis l'agent prend le relais : il formule des hypothèses, collecte des données, recoupe les sources et cartographie les causalités. À la sortie, il génère des options stratégiques, des slides, des annexes et un rapport complet. La technologie sous-jacente repose sur AB-MCTS, une recherche arborescente Monte Carlo adaptative inspirée des moteurs d'échecs : le système explore plusieurs pistes en parallèle, abandonne les impasses et approfondit les hypothèses prometteuses. L'architecture s'appuie sur TreeQuest, publié sous licence Apache 2.0. Marlin coordonne plusieurs modèles d'IA selon les tâches, sans en révéler les noms ni les fournisseurs. La tarification s'articule autour de crédits à 98 yens l'unité, un plan Pro à 150 000 yens par mois et une offre entreprise à 400 000 yens.

Marlin s'adresse aux entreprises, fonds financiers et groupes de réflexion qui consacrent aujourd'hui des semaines à la recherche préalable aux décisions stratégiques. L'outil automatise la phase la plus laborieuse du conseil : la collecte, la synthèse et la mise en perspective de données complexes. Les exemples cités lors du lancement illustrent l'ambition : analyse d'un blocus théorique du détroit d'Ormuz, cartographie de la réglementation mondiale de l'IA, étude du retour des "justiciers des obligations". Une beta fermée impliquant environ 300 professionnels depuis avril 2026 a généré des retours positifs, un consultant affirmant que l'outil "a dépassé ses attentes". Sakana précise que les données clients ne servent pas à entraîner les modèles sans consentement explicite, un point de confidentialité crucial pour les usages stratégiques sensibles.

Llion Jones a coécrit l'article fondateur sur les Transformers chez Google en 2017 ; David Ha est passé par Google Brain et Stability AI. Ensemble, ils ont construit Sakana autour d'une philosophie biomimétique : plutôt qu'un modèle géant unique, des modèles spécialisés qui coopèrent, à l'image des bancs de poissons ou des colonies de fourmis. Cette approche a séduit Nvidia, Google, MUFG, Citi et Salesforce, portant la valorisation de la société au-delà de 2,6 milliards de dollars. Marlin constitue leur premier produit commercial, après ALE-Agent et RL Conductor. Il s'inscrit dans une tendance plus large de l'IA "lente et profonde", en rupture avec la course à la réponse instantanée. La vraie question qui demeure : dans un monde saturé de synthèses automatiques, qui lira réellement cent pages générées par une machine, même brillantes ?

Impact France/UE

Les cabinets de conseil et fonds d'investissement européens pourraient s'intéresser à Marlin pour automatiser leur veille stratégique, mais l'outil reste en bêta fermée avec une tarification en yens sans offre adaptée au marché européen.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Sakana AI lance un agent 'ultra deep research' : des rapports de plus de 100 pages en 8 heures
1VentureBeat AI 

Sakana AI lance un agent 'ultra deep research' : des rapports de plus de 100 pages en 8 heures

La startup japonaise Sakana AI, basée à Tokyo, a lancé son premier produit commercial, Sakana Marlin, un agent de recherche autonome destiné aux entreprises. Présenté comme un "directeur stratégique virtuel", Marlin ne génère pas de réponses en quelques secondes comme les chatbots classiques : il tourne en boucle de raisonnement pendant jusqu'à huit heures d'affilée pour produire des rapports stratégiques de plus de cent pages, accompagnés de diapositives exécutives, d'annexes et de références bibliographiques. Le produit est disponible immédiatement sur le site de l'entreprise, avec une tarification à l'usage, et cible exclusivement les grandes entreprises, les institutions financières et les think tanks. L'utilisateur soumet un sujet de recherche, échange brièvement avec le système pour affiner le périmètre, puis laisse Marlin travailler seul. Sakana a publié des exemples de rapports générés, portant notamment sur des scénarios de blocage du détroit d'Ormuz, la cartographie des réglementations mondiales sur l'IA, ou encore le retour des "bond vigilantes" sur les marchés obligataires. Ce lancement marque un tournant dans la manière dont les grandes organisations envisagent l'IA. Depuis deux ans, l'industrie a été dominée par la course à la vitesse : générer un texte, un résumé ou du code en quelques millisecondes. Marlin renverse cette logique en pariant sur la profondeur plutôt que la rapidité. Pour une multinationale ou un fonds d'investissement, la valeur ne réside plus dans la réactivité, mais dans la capacité à synthétiser des sources hétérogènes, à croiser des données, à formuler des hypothèses et à les tester automatiquement, le tout sans intervention humaine. C'est un glissement de paradigme : l'IA cesse d'être un assistant réactif pour devenir un analyste autonome capable de mener une investigation stratégique complète en une journée de travail. Sakana AI a été fondée par des anciens de Google Brain, dont David Ha et Llion Jones, co-auteur du papier fondateur "Attention is All You Need". L'entreprise a construit Marlin sur deux avancées internes majeures : l'Adaptive Branching Monte Carlo Tree Search (AB-MCTS), une technique de raisonnement inspirée des moteurs d'échecs qui explore des milliers de chemins possibles avant de choisir la meilleure piste, et "The AI Scientist", un projet de recherche publié dans Nature qui avait automatisé le processus de découverte scientifique de bout en bout. Marlin est la traduction commerciale de ces travaux de laboratoire. Sakana n'a pas précisé quels modèles de langage il utilise en coulisses. Dans un marché où OpenAI, Perplexity et Google proposent déjà des fonctions de "deep research", Sakana se différencie par l'échelle temporelle et la profondeur de sortie, positionnant Marlin non pas comme un concurrent des chatbots grand public, mais comme un outil de conseil stratégique automatisé à destination des décideurs.

OutilsOutil
1 source
Sarang Kulkarni : les enseignements du développement d'agents de recherche approfondie en production
2InfoQ AI 

Sarang Kulkarni : les enseignements du développement d'agents de recherche approfondie en production

Sarang Kulkarni, architecte chez Thoughtworks, a présenté lors de l'Arc of AI Conference 2026 les enseignements tirés du déploiement en production de systèmes d'agents de recherche approfondie. Ces systèmes, appelés Deep Research Agentic Systems, sont des agents IA capables de conduire des investigations en plusieurs étapes sur des questions complexes : ils combinent raisonnement dynamique, récupération d'information en chaîne (multi-hop retrieval) et génération de rapports analytiques structurés, allant bien au-delà des chatbots classiques. Ces architectures multi-agents représentent un saut qualitatif pour les entreprises qui ont besoin d'automatiser des tâches de veille, d'analyse concurrentielle ou de recherche documentaire. Là où un LLM standard répond à une question en une passe, un agent de recherche profonde décompose le problème, interroge plusieurs sources, valide ses hypothèses et synthétise un rapport cohérent. Le retour d'expérience de Thoughtworks, cabinet de conseil technologique présent dans le monde entier, est particulièrement précieux car il aborde les réalités du déploiement en production : latence, fiabilité, coûts opérationnels et maintenance des workflows. L'intervention de Kulkarni s'inscrit dans une tendance de fond : après l'engouement pour les LLMs, l'industrie entre dans une phase d'industrialisation des agents IA. Des acteurs comme Google avec Deep Research, Perplexity ou OpenAI ont popularisé le concept, mais les pratiques de déploiement en entreprise restent peu documentées. Les conférences spécialisées comme Arc of AI 2026 deviennent des espaces clés pour partager ce savoir tacite, avant que les standards de l'ingénierie agentique ne se cristallisent.

UELes entreprises européennes déployant des agents IA en production peuvent s'appuyer sur ce retour d'expérience de Thoughtworks pour anticiper les défis de latence, fiabilité et coûts opérationnels.

OutilsOutil
1 source
Les meilleures API de recherche et récupération de données pour construire des agents IA en 2026 : outils, compromis et offres gratuites
3MarkTechPost 

Les meilleures API de recherche et récupération de données pour construire des agents IA en 2026 : outils, compromis et offres gratuites

La recherche web et la récupération de contenu sont devenues en 2026 des infrastructures critiques pour tout développeur construisant des agents IA. Un panorama des principales API Search et Fetch disponibles ce printemps révèle deux acteurs à retenir : TinyFish et Tavily. TinyFish propose des points d'accès dédiés aux agents, disponibles gratuitement avec des limites généreuses : 5 requêtes par minute pour la recherche (api.search.tinyfish.ai) et 25 requêtes par minute pour la récupération de pages (api.fetch.tinyfish.ai), sans carte bancaire requise. Sa latence médiane pour la recherche est inférieure à 0,5 seconde, ce qui le rend compatible avec les boucles d'outils en temps réel. La plateforme déploie sa propre flotte Chromium pour effectuer un rendu complet de chaque URL, y compris les applications JavaScript dynamiques et les pages protégées contre les robots, retournant ensuite du contenu propre en Markdown, JSON ou HTML. Tavily, de son côté, propose un plan gratuit incluant 1 000 crédits API par mois, avec des offres payantes à partir de 30 dollars par mois (4 000 crédits) jusqu'à 220 dollars par mois (38 000 crédits), ainsi qu'une option à la demande à 0,008 dollar par crédit. Ce qui distingue ces outils de la génération précédente tient à leur conception orientée agents : là où les solutions classiques injectaient du HTML brut, avec scripts, publicités et bannières de cookies, dans les fenêtres de contexte des LLM, TinyFish filtre tout ce bruit en amont. Le résultat est une consommation de tokens par page nettement inférieure, et donc un coût par appel LLM réduit. Pour les entreprises utilisant des agents à grande échelle, cet écart n'est pas marginal. TinyFish s'intègre directement dans les environnements que les développeurs utilisent déjà : Claude Code, Cursor, Codex, LangChain, CrewAI, n8n, Dify et Vercel Skills. Une configuration MCP s'installe en un seul fichier JSON ; une CLI (npm install -g @tiny-fish/cli) écrit les résultats directement sur le système de fichiers sans passer par la fenêtre de contexte du modèle, limitant ainsi l'utilisation des tokens. Tavily, quant à lui, est reconnu pour ses intégrations profondes avec LangChain et LlamaIndex, les frameworks les plus répandus dans l'écosystème RAG. Ces évolutions s'inscrivent dans un mouvement plus large : la maturation rapide de l'outillage autour des agents IA en production. En 2024, la pratique dominante consistait à envelopper les données brutes des SERP Google et à les passer directement à un modèle de langage. En 2026, cette approche est dépassée, remplacée par des API conçues dès le départ pour les contraintes spécifiques des agents : latence, efficacité des tokens, stabilité du rendu et compatibilité avec les frameworks d'orchestration. TinyFish et Tavily illustrent une tendance dans laquelle l'infrastructure de récupération d'information devient aussi déterminante que le choix du modèle LLM lui-même. Les prochaines lignes de différenciation porteront probablement sur la fraîcheur des index, la gestion des contenus derrière authentification et l'intégration native avec les standards d'agents émergents comme le protocole MCP.

OutilsOutil
1 source
Google repense sa barre de recherche pour la première fois en 25 ans
4VentureBeat AI 

Google repense sa barre de recherche pour la première fois en 25 ans

Google a annoncé mardi, lors de sa conférence annuelle I/O, la refonte la plus importante de son moteur de recherche depuis son lancement il y a plus de vingt-cinq ans. Liz Reid, vice-présidente et directrice de Search chez Google, a qualifié le changement de "plus grande mise à niveau de notre icônique champ de recherche depuis ses débuts". Concrètement, le rectangle blanc familier dans lequel des milliards d'utilisateurs tapent leurs requêtes chaque jour devient une interface multimodale et conversationnelle : il accepte désormais du texte, des images, des PDF, des vidéos, et même des onglets ouverts dans Chrome comme points d'entrée directs. La barre s'élargit dynamiquement pour accueillir des questions longues et détaillées. Google déploie également un système de suggestion de requêtes propulsé par l'IA qui dépasse la simple complétion automatique, en aidant activement les utilisateurs à formuler des questions complexes. En parallèle, la firme fusionne ses deux fonctionnalités phares, AI Overviews et AI Mode, en une expérience unifiée disponible dès mardi sur mobile et desktop dans tous les pays où AI Mode est accessible. Ce changement touche directement le produit qui génère la très grande majorité des revenus d'Alphabet. Jusqu'ici, un utilisateur devait choisir entre la page de résultats classique et l'interface conversationnelle d'AI Mode, deux expériences séparées. Désormais, une même recherche peut débuter par une question courte, afficher un résumé IA accompagné de liens traditionnels, puis se prolonger en dialogue avec des questions de suivi, sans changer d'écran ni de contexte. Pour des centaines de millions d'utilisateurs quotidiens, cela supprime une friction cognitive réelle : plus besoin de décider quel mode utiliser, l'IA s'intègre naturellement au flux habituel. Ce virage marque l'aboutissement d'une évolution accélérée depuis l'irruption de ChatGPT fin 2022, qui avait mis Google sous pression en popularisant une alternative radicalement différente à la recherche par mots-clés. La firme avait répondu en lançant AI Overviews en 2023, puis AI Mode lors du I/O 2025, deux ajouts qui coexistaient maladroitement avec l'interface historique. La décision de tout unifier autour d'un champ de recherche repensé traduit une conviction désormais assumée : l'avenir de Google Search n'est plus une liste de liens bleus, mais une conversation ouverte avec un système d'IA adossé à l'ensemble du web. La conférence I/O 2026 a également introduit de nouveaux modèles Gemini, un agent personnel baptisé Spark et un panier d'achat intelligent, mais la refonte du champ de recherche reste l'annonce la plus structurante pour la trajectoire à long terme du groupe.

UEDes centaines de millions d'utilisateurs européens verront leur expérience de recherche quotidienne transformée, avec des implications directes pour le référencement naturel des entreprises françaises et européennes.

💬 Trois ans que Google bricolait des rustines IA sur une interface vieille de 25 ans, et là ils cassent tout. C'est le genre de décision qui se prend quand t'as peur, pas quand t'es confiant, et ChatGPT a clairement fait son effet. Bon, le résultat semble solide, mais les éditeurs qui vivent du trafic organique, eux, ils vont morfler.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic