OutilsMarkTechPost1h· 3 min de lecture

WebBrain : un agent de navigation IA open-source et local qui lit les pages et automatise des tâches sur Chrome et Firefox

WebBrain est un agent de navigation open source, gratuit et disponible pour Chrome et Firefox, développé par Emre Sokullu sous licence MIT, avec son code source publié sur GitHub. L'extension s'installe dans le panneau latéral du navigateur, en Manifest V3 avec l'API sidePanel sur Chrome et en Manifest V2 avec sidebar_action sur Firefox, et chaque onglet conserve son propre historique de conversation. Elle propose deux modes : le mode Ask, en lecture seule, qui analyse les pages via des scripts de contenu classiques, et le mode Act, capable de cliquer, taper, faire défiler et naviguer, en pilotant la page via le protocole Chrome DevTools et l'API chrome.debugger, ce qui permet de générer des événements reconnus comme fiables par les sites modernes et d'atteindre les iframes cross-origin et le shadow DOM. Les températures sont fixées pour plus de prévisibilité : 0,15 en mode Act, 0,3 en mode Ask et 0 pour les descriptions de captures d'écran. L'outil est disponible en anglais, espagnol, français, turc et chinois, détecte automatiquement la langue du navigateur, ne collecte aucune donnée externe et n'intègre ni télémétrie ni compte utilisateur. Point clé : en connectant WebBrain à un modèle local, aucune donnée de page ne quitte la machine de l'utilisateur, une option rare parmi les agents de navigation IA.

Cette approche locale-first change la donne pour la confidentialité des données dans un secteur où la plupart des agents IA de navigateur transitent systématiquement par des API cloud. Les utilisateurs professionnels manipulant des informations sensibles, comptes bancaires, dossiers clients ou données internes d'entreprise, peuvent ainsi automatiser des tâches répétitives comme l'extraction de données depuis des catalogues, le remplissage de formulaires ou le résumé d'articles, sans exposer ces informations à un tiers. WebBrain a aussi été pensé pour limiter les coûts en tokens sur les sessions longues : les captures d'écran sont redimensionnées et compressées en JPEG avant traitement, et l'historique de conversation est tronqué en commençant par les éléments les plus anciens lorsque la fenêtre de contexte se remplit. Il est également possible d'associer un modèle texte économique pour la planification à un modèle de vision distinct pour l'analyse des captures d'écran, une flexibilité qui réduit encore la facture pour les utilisateurs de modèles cloud.

Le développement de WebBrain répond à un problème de sécurité identifié dans les agents de navigation : les pages web peuvent dissimuler des injections de prompt destinées à détourner le comportement de l'agent. Face à ce risque, l'outil démarre toujours en mode Ask en lecture seule, demande une confirmation avant toute action jugée conséquente (ces alertes pouvant être désactivées dans les paramètres) et impose une règle stricte pour toute mutation de données : créer, envoyer, soumettre ou acheter passe obligatoirement par l'interface visible du site plutôt que par des appels directs aux API REST ou GraphQL, sauf dérogation ponctuelle via la commande /allow-api en cas d'échec de l'interface. La lecture de contenu, elle, bénéficie de règles plus souples via les outils fetchurl et researchurl puisqu'elle ne modifie rien à distance. WebBrain se positionne ainsi entre les simples extensions IA de navigateur et les frameworks d'agents complets, dans un marché où la question de la confiance et du contrôle utilisateur devient centrale à mesure que ces outils gagnent en autonomie sur des tâches concrètes comme la recherche, le remplissage de formulaires ou l'automatisation multi-étapes.

Dans nos dossiers

Agents IA Open weight & Open source

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost

Hugging Face lance ml-intern, un agent IA open source qui automatise l'après-entraînement des LLM

Hugging Face a publié ml-intern, un agent d'intelligence artificielle open-source conçu pour automatiser de bout en bout le post-entraînement des grands modèles de langage (LLM). Construit sur le framework smolagents de la société, l'outil est capable de réaliser de manière autonome des revues de littérature scientifique sur arXiv, de découvrir des jeux de données sur le Hub Hugging Face, d'exécuter des scripts d'entraînement et d'évaluer itérativement les résultats, le tout sans intervention humaine. Lors d'une démonstration officielle, l'agent a pris le modèle de base Qwen3-1.7B, qui obtenait initialement environ 10 % sur le benchmark GPQA de raisonnement scientifique, et l'a porté à 32 % en moins de 10 heures sur un seul GPU H100, franchissant la barre des 27,5 % en seulement trois heures. Ce résultat dépasse celui de Claude Code d'Anthropic, actuellement à 22,99 % sur cette même tâche, et se rapproche du record actuel de 33 % obtenu avec le modèle Gemma-3-4B, deux fois plus grand. L'impact de ml-intern est direct pour les équipes de recherche en machine learning : il automatise un cycle de travail qui mobilise habituellement plusieurs ingénieurs pendant plusieurs jours. L'agent gère la génération de données synthétiques lorsque les jeux de données existants sont insuffisants, comme dans un test médical où il a produit des exemples d'entraînement ciblant des cas limites en langage médical et en réponse d'urgence multilingue. Il implémente également des techniques avancées comme le Group Relative Policy Optimization (GRPO), une variante du RLHF moins gourmande en mémoire que le PPO standard, en surveillant les courbes de récompense et en lançant des ablations pour identifier les composants efficaces. L'ensemble du suivi expérimental repose sur Trackio, un outil natif au Hub présenté comme alternative open-source à Weights & Biases. Cette publication s'inscrit dans une tendance de fond : l'automatisation du travail des chercheurs en IA par des agents eux-mêmes entraînés à raisonner sur des pipelines ML. Le benchmark PostTrainBench, développé par l'université de Tübingen et le Max Planck Institute, a servi de cadre d'évaluation standardisé, contraignant les agents à post-entraîner un modèle de base en moins de 10 heures. En positionnant ml-intern comme supérieur à Claude Code sur cette tâche précise, Hugging Face signale une ambition claire : faire de son écosystème, du Hub aux outils d'entraînement, une plateforme autonome et intégrée capable de rivaliser avec les solutions propriétaires d'Anthropic ou de Google. La disponibilité en open-source de l'agent ouvre la voie à des adaptations communautaires rapides, et le benchmark PostTrainBench devrait s'imposer comme référence pour évaluer les prochaines générations de ces outils.

UEHugging Face, entreprise française cofondatrice de l'écosystème open-source IA européen, renforce son positionnement face aux solutions propriétaires américaines en offrant aux équipes de recherche françaises et européennes un agent gratuit capable d'automatiser le post-entraînement de LLMs sans dépendance cloud.

OutilsOutil

1 source

2MarkTechPost

openJiuwen publie 'JiuwenClaw', un agent IA auto-évolutif pour la gestion de tâches

La communauté openJiuwen a publié JiuwenClaw, un agent IA conçu pour exécuter des tâches complexes de bout en bout, sans perdre le fil en cours de route. Contrairement aux agents conversationnels classiques qui traitent chaque modification comme une nouvelle requête indépendante, JiuwenClaw maintient un état d'exécution continu : il gère les interruptions, les réordonnancementset les ajouts de tâches sans perdre le contexte accumulé. Concrètement, dans un scénario bureautique sous Excel, l'agent peut enchaîner organisation de tableau, déduplication, ajout de synthèse et changement de format de sortie — en suivant les intentions de l'utilisateur, et non en recommençant à zéro à chaque nouvelle instruction. Pour la création de contenu, il conserve plusieurs couches de contexte : il distingue une modification structurelle d'un ajustement de ton, préserve le style entre les itérations, et s'appuie sur le brouillon existant plutôt que de régénérer. Ce que JiuwenClaw tente de résoudre est un problème structurel qui plombe la majorité des agents IA actuels : l'amnésie contextuelle. La plupart des systèmes paraissent intelligents en conversation mais s'effondrent dès que la tâche dure plus de quelques échanges. Pour les professionnels — rédacteurs, analystes, développeurs — cela se traduit par une friction constante : reformuler, réexpliquer, reprendre depuis le début. L'agent introduit également une approche d'automatisation navigateur radicalement différente : au lieu d'opérer dans un navigateur virtuel isolé, il prend directement le contrôle du navigateur local de l'utilisateur, avec ses cookies, ses sessions actives et son identité. Cela permet de contourner les protections anti-bot et les CAPTCHAs qui rendent inutilisables la quasi-totalité des agents web en conditions réelles. Techniquement, JiuwenClaw repose sur deux innovations architecturales clés. La première est un système de mémoire hiérarchique à trois couches — une couche d'identité stable, une couche de contexte long terme, et une couche de trajectoire dynamique — qui permet à l'agent d'accumuler des préférences et du contexte au fil du temps, à la manière d'un collaborateur qui apprend. La seconde est une compression intelligente du contexte : une technologie propriétaire qui élimine les informations redondantes tout en conservant les éléments clés, évitant ainsi les explosions de tokens et réduisant significativement les coûts d'usage. JiuwenClaw s'inscrit dans une tendance de fond où les équipes de recherche cherchent à dépasser le paradigme "chat" pour construire des agents véritablement opérationnels. La compétition dans ce segment — aux côtés de projets comme AutoGPT, Devin ou les agents Anthropic — s'intensifie, mais peu ont jusqu'ici démontré une fiabilité satisfaisante sur des tâches longues et évolutives.

OutilsOutil

1 source

3AWS ML Blog

Contrôlez la navigation de vos agents IA avec les politiques Chrome Enterprise sur Amazon Bedrock AgentCore

Amazon a annoncé le support des politiques d'entreprise Chrome et des certificats CA racine personnalisés dans Amazon Bedrock AgentCore Browser. Cette mise à jour permet aux organisations de configurer plus de 450 paramètres de navigateur via des fichiers JSON conformes au standard Chrome Enterprise, stockés dans Amazon S3 et appliqués à chaque session d'agent. Concrètement, les équipes peuvent désormais définir des listes blanches et noires d'URL, bloquer les téléchargements de fichiers, désactiver le gestionnaire de mots de passe ou contrôler le remplissage automatique de formulaires, le tout appliqué au niveau du navigateur, indépendamment de la logique ou des instructions de l'agent. Le support des certificats CA racine, stockés dans AWS Secrets Manager, permet en outre aux agents de se connecter aux services internes qui utilisent une autorité de certification privée, résolvant ainsi les erreurs de validation HTTPS qui bloquaient jusqu'ici l'accès aux infrastructures d'entreprise. L'enjeu est significatif pour les organisations qui déploient des agents IA autonomes sur le web. Un agent sans restriction de navigation peut accéder à des domaines non autorisés, stocker des identifiants dans le navigateur, télécharger des fichiers hors des flux de travail approuvés, voire exfiltrer des données sensibles. Le nouveau système introduit une séparation claire des responsabilités : les équipes de sécurité configurent les politiques au niveau du navigateur via l'API de plan de contrôle, tandis que les développeurs se concentrent sur la logique métier de l'agent, sans avoir à intégrer des décisions de conformité dans le code applicatif. Les politiques dites "managed", stockées côté service et non surchargeables, s'appliquent à toutes les sessions créées à partir d'un navigateur donné, alors que les politiques "recommended", définies au démarrage de session, jouent le rôle de préférences utilisateur et sont écrasées en cas de conflit. Cette évolution s'inscrit dans une tendance plus large : les agents IA accèdent de plus en plus à des interfaces web réelles pour exécuter des tâches, de la saisie de données à la recherche documentaire en passant par la gestion de portails métier. Cette capacité, aussi puissante soit-elle, ouvre des vecteurs d'attaque inédits, manipulation via des pages web malveillantes (prompt injection), exfiltration involontaire, navigation hors périmètre. En s'appuyant sur l'écosystème Chrome Enterprise, déjà utilisé par des millions d'entreprises pour gérer les navigateurs humains, Amazon évite de réinventer une couche de politique maison et offre aux DSI un cadre familier. L'intégration native avec S3 et Secrets Manager renforce l'alignement avec les architectures AWS existantes, ce qui devrait faciliter l'adoption dans les environnements régulés, finance, santé, administration, où le contrôle granulaire de l'accès aux données est non négociable.

UELes entreprises européennes opérant sur AWS dans des secteurs régulés (finance, santé, administration publique) peuvent désormais imposer des politiques de navigation granulaires à leurs agents IA, facilitant la conformité avec le RGPD et les exigences sectorielles de contrôle des accès aux données.

OutilsOpinion

1 source

4Le Big Data

Anthropic dévoile des agents IA pour automatiser les tâches financières

Anthropic a dévoilé le 5 mai 2026 une suite de dix agents IA spécialisés dans l'automatisation des tâches financières complexes. Construits sur Claude Opus 4.7, ces agents ciblent les banques, sociétés de gestion d'actifs et équipes finance d'entreprise. Ils couvrent un spectre large : préparation de pitchs commerciaux, analyse de résultats d'entreprises, suivi de marchés, modélisation financière, rapprochement comptable, clôture mensuelle, audit d'états financiers et vérification KYC. Chaque agent combine des compétences métiers, des connecteurs de données et des sous-agents spécialisés. Sur le benchmark Finance Agent de Vals AI, Anthropic revendique un score de 64,37 % pour Claude Opus 4.7, ce qui en ferait le modèle le plus performant du marché sur les usages financiers selon l'entreprise. En parallèle, Anthropic intègre nativement Claude à Microsoft 365 via des modules complémentaires pour Excel, PowerPoint et Word, avec une extension Outlook annoncée prochainement. Une fonctionnalité appelée Dispatch permet également d'assigner des tâches à distance par message ou commande vocale, l'agent poursuivant alors le travail en arrière-plan sur les fichiers locaux. L'enjeu opérationnel est considérable pour les services financiers, où une part significative du temps des analystes est absorbée par des tâches répétitives à faible valeur ajoutée. L'intégration native avec Microsoft 365 est particulièrement stratégique : Claude peut construire un modèle financier dans Excel, le transférer automatiquement dans PowerPoint et générer une présentation qui se met à jour en temps réel quand les données changent. Dans Word, il peut adapter des notes de crédit aux standards internes d'une institution. La continuité contextuelle entre applications, argument central d'Anthropic, élimine la friction habituelle : les analystes n'ont plus à réexpliquer leur travail lorsqu'ils changent d'outil. Pour les institutions qui souhaiteraient personnaliser les agents, Anthropic permet d'adapter les modèles aux règles de conformité, politiques de risque ou méthodes d'évaluation propres à chaque organisation. Cette offensive s'inscrit dans une compétition féroce entre les grands laboratoires d'IA pour s'implanter durablement dans les workflows des services financiers, secteur perçu comme l'un des plus rentables pour les déploiements à grande échelle. Anthropic s'appuie sur des connecteurs vers les plateformes de données de référence du secteur, FactSet, S&P Capital IQ, PitchBook, Morningstar, LSEG, pour crédibiliser son offre face à des acteurs comme OpenAI ou Microsoft Copilot, déjà bien installés dans les grandes institutions. D'après le Wall Street Journal, la demande des institutions financières pour des outils IA pleinement intégrés dans les processus métiers est en forte croissance, et Anthropic cherche à se positionner non plus comme un fournisseur de modèle, mais comme une véritable plateforme opérationnelle. Le déploiement en quelques jours promis par l'entreprise reste à vérifier à l'échelle, mais le signal envoyé au marché est clair : Claude vise désormais le cœur des opérations financières.

UELes institutions financières européennes (banques, sociétés de gestion d'actifs) peuvent accéder à ces agents via Microsoft 365, mais devront évaluer leur conformité avec l'AI Act et les réglementations sectorielles avant tout déploiement à grande échelle.

💬 C'est le virage qu'on attendait : Anthropic arrête d'être un fournisseur de modèle pour devenir une plateforme métier à part entière. L'intégration dans M365, avec Claude qui garde le fil entre Excel, PowerPoint et Word sans qu'on lui réexplique tout à chaque changement d'outil, c'est là que ça peut vraiment mordre face à Copilot. Le 64,37% sur le benchmark Finance, bon, c'est leur propre terrain de jeu, faut attendre les vrais déploiements pour voir si ça tient.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic