Sarang Kulkarni : les enseignements du…

La fin des réponses rapides ? Cet agent de recherche approfondie prend 8 heures pour répondre

43

1Le Big Data

La fin des réponses rapides ? Cet agent de recherche approfondie prend 8 heures pour répondre

Sakana AI, la start-up tokyoïte fondée en 2023 par Llion Jones et David Ha, a lancé le 15 juin 2026 un agent de recherche autonome baptisé Marlin, présenté comme un "directeur de la stratégie virtuel". Contrairement aux outils d'IA générative qui misent sur la réactivité, Marlin prend jusqu'à huit heures pour produire des rapports stratégiques dépassant cent pages. L'utilisateur soumet un sujet et un périmètre, puis l'agent prend le relais : il formule des hypothèses, collecte des données, recoupe les sources et cartographie les causalités. À la sortie, il génère des options stratégiques, des slides, des annexes et un rapport complet. La technologie sous-jacente repose sur AB-MCTS, une recherche arborescente Monte Carlo adaptative inspirée des moteurs d'échecs : le système explore plusieurs pistes en parallèle, abandonne les impasses et approfondit les hypothèses prometteuses. L'architecture s'appuie sur TreeQuest, publié sous licence Apache 2.0. Marlin coordonne plusieurs modèles d'IA selon les tâches, sans en révéler les noms ni les fournisseurs. La tarification s'articule autour de crédits à 98 yens l'unité, un plan Pro à 150 000 yens par mois et une offre entreprise à 400 000 yens. Marlin s'adresse aux entreprises, fonds financiers et groupes de réflexion qui consacrent aujourd'hui des semaines à la recherche préalable aux décisions stratégiques. L'outil automatise la phase la plus laborieuse du conseil : la collecte, la synthèse et la mise en perspective de données complexes. Les exemples cités lors du lancement illustrent l'ambition : analyse d'un blocus théorique du détroit d'Ormuz, cartographie de la réglementation mondiale de l'IA, étude du retour des "justiciers des obligations". Une beta fermée impliquant environ 300 professionnels depuis avril 2026 a généré des retours positifs, un consultant affirmant que l'outil "a dépassé ses attentes". Sakana précise que les données clients ne servent pas à entraîner les modèles sans consentement explicite, un point de confidentialité crucial pour les usages stratégiques sensibles. Llion Jones a coécrit l'article fondateur sur les Transformers chez Google en 2017 ; David Ha est passé par Google Brain et Stability AI. Ensemble, ils ont construit Sakana autour d'une philosophie biomimétique : plutôt qu'un modèle géant unique, des modèles spécialisés qui coopèrent, à l'image des bancs de poissons ou des colonies de fourmis. Cette approche a séduit Nvidia, Google, MUFG, Citi et Salesforce, portant la valorisation de la société au-delà de 2,6 milliards de dollars. Marlin constitue leur premier produit commercial, après ALE-Agent et RL Conductor. Il s'inscrit dans une tendance plus large de l'IA "lente et profonde", en rupture avec la course à la réponse instantanée. La vraie question qui demeure : dans un monde saturé de synthèses automatiques, qui lira réellement cent pages générées par une machine, même brillantes ?

UELes cabinets de conseil et fonds d'investissement européens pourraient s'intéresser à Marlin pour automatiser leur veille stratégique, mais l'outil reste en bêta fermée avec une tarification en yens sans offre adaptée au marché européen.

OutilsOutil

1 source

La présentation : l'approche multi-agents, développer une automatisation fiable et contrôlable du développement logiciel

34

2InfoQ AI

La présentation : l'approche multi-agents, développer une automatisation fiable et contrôlable du développement logiciel

Itamar Friedman, cofondateur et dirigeant reconnu dans l'écosystème des outils de développement assistés par IA, a présenté une conférence intitulée "The Multi-Agent Approach: Building Reliable and Controllable Software Development Automation", destinée aux architectes logiciels et aux responsables d'ingénierie. Il y expose comment dépasser le plafond de productivité observé avec les outils d'IA actuels grâce à des systèmes multi-agents adaptatifs. Sa proposition consiste à sortir du simple modèle d'autocomplétion de code pour construire des flux de travail résilients, capables de tester le code de façon autonome, de réaliser des revues de code intelligentes et d'arbitrer les décisions entre plusieurs agents lorsqu'ils entrent en désaccord. Cette approche répond à une limite bien connue des assistants de codage actuels: au delà d'un certain niveau de complexité, l'ajout de puissance de calcul ou de nouveaux modèles ne suffit plus à améliorer la fiabilité des suggestions. En structurant le travail autour de plusieurs agents spécialisés, chacun responsable d'une étape du cycle de développement, les équipes peuvent automatiser des tâches plus sensibles, comme les tests ou la validation de code, sans sacrifier le contrôle humain sur les décisions critiques. Pour les organisations qui cherchent à industrialiser l'usage de l'IA dans leurs pipelines de développement, cela ouvre la voie à une automatisation plus profonde du cycle de vie logiciel, au delà des gains de productivité individuels déjà obtenus avec les assistants de code classiques. Friedman insiste sur la nécessité de gouverner la communication entre agents et de bâtir un cycle de développement piloté par le contexte, capable de monter en charge à l'échelle d'une organisation entière. Cette question illustre un enjeu plus large de l'industrie: alors que les entreprises multiplient les agents IA dans leurs chaînes d'outils, la coordination, la traçabilité des décisions et la robustesse face aux erreurs deviennent des défis aussi importants que la performance brute des modèles sous-jacents.

OutilsOutil

1 source

Des agents IA en production pour la conformite financiere : les lecons de Stripe

48

3AWS ML Blog

Des agents IA en production pour la conformite financiere : les lecons de Stripe

Stripe, le géant américain des paiements en ligne, a déployé en production un système d'agents IA dédié à la conformité financière, développé sur Amazon Web Services avec Amazon Bedrock. L'entreprise traite 1 400 milliards de dollars de volume de paiements annuels dans 50 pays, en servant des millions d'entreprises allant des startups aux 62 % des sociétés du Fortune 500. Pour gérer les risques de fraude et respecter les obligations réglementaires à cette échelle, ses équipes de conformité devaient examiner des milliers de transactions chaque jour. Le système d'agents, conçu selon un cadre ReAct, a permis de réduire de 26 % le temps de traitement des dossiers, tout en obtenant un taux de satisfaction de 96 % auprès des analystes internes. Les décisions finales restent systématiquement entre les mains d'experts humains. Ce déploiement illustre un problème structurel que rencontrent toutes les grandes institutions financières : les analystes qualifiés passaient jusqu'à 80 % de leur temps à naviguer entre des systèmes fragmentés pour rassembler des documents, au lieu de réaliser des évaluations de risque à haute valeur ajoutée. L'agent IA automatise cette phase de pré-investigation et d'agrégation documentaire, libérant les équipes pour les jugements complexes. À l'échelle mondiale, le coût de la conformité financière est estimé à 206 milliards de dollars par an. L'approche de Stripe permettrait d'identifier 95 % des attaques par test de carte en temps réel et de réduire de 20 % les frictions inutiles pour les clients légitimes, tout en conservant la traçabilité intégrale exigée par les régulateurs grâce à des journaux d'audit immuables. La croissance rapide de Stripe, qui représente aujourd'hui environ 1,3 % du PIB mondial numérique, a rendu intenable une mise à l'échelle des équipes de conformité proportionnelle au volume de transactions. L'entreprise a opté pour une architecture en trois composantes : décomposition des tâches et orchestration des révisions, cadre d'agents ReAct, et services d'infrastructure dédiés. Une attention particulière a été portée à l'optimisation des coûts via le prompt caching et à la gouvernance, avec des workflows d'approbation configurables et des points de contrôle humains à chaque étape critique. Ce modèle, co-développé par les équipes de Stripe et d'AWS, est présenté comme une référence pour les organisations souhaitant industrialiser la conformité sans sacrifier la qualité ni l'auditabilité, dans un contexte où les régulateurs financiers du monde entier renforcent leurs exigences en matière de traçabilité des décisions assistées par IA.

UELes établissements financiers européens soumis aux obligations KYC/AML et aux futures exigences de traçabilité de l'AI Act peuvent s'appuyer sur ce retour d'expérience pour évaluer l'automatisation de leur conformité via des agents IA.

OutilsOutil

1 source

Des agents en essaim : présentation d'une approche ludique et rentable

42

4InfoQ AI

Des agents en essaim : présentation d'une approche ludique et rentable

Adrian Cockcroft, ancien architecte en chef d'Amazon Web Services et figure reconnue de l'ingénierie cloud, a présenté une conférence intitulée « Diriger un essaim d'agents pour le plaisir et le profit », dans laquelle il expose sa vision de ce qu'il appelle le développement « AI-native ». S'appuyant sur des expériences concrètes menées avec des outils comme Cursor et Claude Flow, il décrit une approche de niveau « directeur » : plutôt que d'écrire du code ligne par ligne, l'ingénieur orchestre des essaims d'agents autonomes qui exécutent les tâches en parallèle. Ses expérimentations couvrent notamment le BDD (développement piloté par le comportement), les serveurs MCP et le portage de code entre langages de programmation. Cette transition du cloud-native vers l'AI-native représente un changement de paradigme majeur pour l'industrie du logiciel. Elle implique que la valeur ajoutée de l'ingénieur se déplace de l'écriture du code vers la conception de plateformes capables de coordonner des agents IA. Pour les équipes de développement, cela signifie repenser les workflows, les outils de revue et la façon dont on mesure la productivité. Cockcroft est l'une des voix les plus influentes à théoriser ce basculement, après avoir contribué à populariser les microservices et l'architecture cloud à grande échelle chez Netflix puis AWS. L'émergence d'outils comme Claude Flow ou les serveurs MCP d'Anthropic crée l'infrastructure nécessaire à cette orchestration multi-agents. La question qui s'ouvre désormais est de savoir quelles compétences humaines resteront irremplaçables dans un pipeline où les agents gèrent l'essentiel de l'exécution technique.

OutilsOutil

1 source

Sarang Kulkarni : les enseignements du développement d'agents de recherche approfondie en production

À lire aussi

La fin des réponses rapides ? Cet agent de recherche approfondie prend 8 heures pour répondre

La présentation : l'approche multi-agents, développer une automatisation fiable et contrôlable du développement logiciel

Des agents IA en production pour la conformite financiere : les lecons de Stripe

Des agents en essaim : présentation d'une approche ludique et rentable