Aller au contenu principal
Webwright : l'agent web de Microsoft qui bat GPT-5.4
OutilsMarkTechPost1sem

Webwright : l'agent web de Microsoft qui bat GPT-5.4

Résumé IASource uniqueImpact UETake éditorial
Source originale ↗·

Microsoft Research a publié Webwright, un framework open source pour agents web dont l'architecture tranche radicalement avec les approches existantes. Là où la plupart des agents pilotent un navigateur action par action en analysant des captures d'écran ou du texte DOM, Webwright fournit à l'agent un terminal. Celui-ci rédige du code Playwright pour automatiser les interactions, exécute des commandes bash, inspecte des logs et affine ses scripts de manière itérative. Playwright est une bibliothèque d'automatisation de navigateur, également développée par Microsoft, compatible avec Chromium, Firefox et WebKit. L'architecture repose sur trois composants volontairement légers : un Runner (environ 150 lignes de code), une interface de modèle (550 lignes) et un environnement terminal (300 lignes), sans orchestration multi-agents ni hiérarchie de planification. Sur le benchmark Odysseys, Webwright atteint 60,1% de réussite contre seulement 33,5% pour GPT-5.4 en configuration classique. Sur Online-Mind2Web, qui couvre 300 tâches sur 136 sites courants, GPT-5.4 sous Webwright plafonne à 86,67% de précision globale, tandis que Claude Opus 4.7 obtient 84,7% au global mais devance GPT-5.4 sur les tâches difficiles à 100 étapes : 80,5% contre 76,6%.

Ce changement de paradigme a des implications concrètes pour l'automatisation web. En traitant le navigateur comme un outil scriptable plutôt qu'un état à maintenir en temps réel, l'agent peut exprimer des interactions complexes (sélectionner une date, remplir un formulaire entier) en quelques lignes de code réutilisables, à la façon d'un script RPA. Le code, les logs et les captures d'écran s'accumulent dans un workspace local, rendant chaque exécution entièrement traçable et reproductible. Microsoft Research a par ailleurs résolu deux problèmes techniques récurrents dans ce domaine : la tendance des agents à déclarer prématurément une tâche terminée, et l'explosion du contexte sur les longues trajectoires. Pour le premier, l'agent doit générer une configuration de réflexion critique, relancer un script final dans un dossier vierge et valider lui-même la réussite avant d'émettre le signal de complétion. Pour le second, l'historique est automatiquement compacté en un résumé synthétique toutes les 20 étapes.

Cette publication s'inscrit dans une tendance plus large : les grands modèles de langage, devenus capables de rédiger et déboguer du code complexe, sont désormais utilisés comme agents de programmation plutôt que comme automates de clics. La contrainte action-par-action était héritée d'une époque où les capacités de raisonnement restaient limitées. Webwright s'appuie sur Playwright, outil open source largement adopté dans l'industrie, pour offrir une base fiable. Le lab AI Frontiers de Microsoft Research positionne ainsi ce framework comme une alternative sérieuse aux solutions existantes, notamment grâce à sa sobriété architecturale : moins de 1 000 lignes de code au total pour l'ensemble des composants principaux. Alors qu'Anthropic, OpenAI et Google s'affrontent sur ces benchmarks avec leurs modèles respectifs, l'émergence de frameworks standardisés comme Webwright pourrait progressivement déplacer la compétition du modèle lui-même vers la qualité du harness d'exécution.

Impact France/UE

Framework open source librement accessible aux développeurs et entreprises européens pour automatiser des tâches web complexes, mais sans impact réglementaire ou stratégique direct sur la France ou l'UE.

💬 Le point de vue du dev

Donner un terminal à l'agent au lieu de le forcer à cliquer action par action, ça semblait évident, mais personne n'avait vraiment poussé l'idée jusqu'au bout. GPT-5.4 passe de 33% à 60% sur Odysseys avec ce seul changement, et tout le framework tient en moins de 1000 lignes. Ce genre d'architecture sobre, ça donne envie de réécrire tes vieux scrapers maison.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Scout, l'Autopilot à base d'agents de Microsoft pour l'ensemble de M365
1AI News 

Scout, l'Autopilot à base d'agents de Microsoft pour l'ensemble de M365

Microsoft a présenté Scout lors de sa conférence Build 2026 cette semaine, le positionnant comme le premier représentant d'une nouvelle catégorie d'agents autonomes qu'il nomme "Autopilots". Testé en interne par des employés de Microsoft avant d'être étendu à un groupe restreint de clients et d'organisations membres du programme Frontier, Scout opère au sein de l'écosystème Microsoft 365 : Outlook, OneDrive, SharePoint et Teams. L'agent planifie des réunions, signale des messages prioritaires, génère des événements de calendrier et anticipe les échéances en bloquant des créneaux dans l'agenda d'un utilisateur pour dégager du temps de travail concentré. Il apprend progressivement les habitudes et préférences de chaque utilisateur pour affiner ses priorités. Techniquement, Scout repose sur OpenClaw, un projet open source développé en un week-end par Peter Steinberger, et Microsoft s'est engagé à contribuer en retour à ce projet. L'annonce a été rédigée par Omar Shahine, vice-président de Microsoft Scout, vétéran de Redmond dont le parcours inclut les divisions Windows Live, OneDrive et Mac Office. Pour accéder à Scout, les entreprises doivent être inscrites au programme Frontier, disposer d'une configuration Intune, d'une licence GitHub Copilot active et soumettre une attestation d'acceptation explicite. Scout représente une évolution significative dans la manière dont les outils de productivité intègrent l'automatisation. Contrairement à un simple assistant réactif, un Autopilot possède sa propre identité numérique, ce qui permet à plusieurs agents de coexister avec des règles de gouvernance distinctes : une instance personnelle et une instance professionnelle peuvent fonctionner en parallèle avec des droits différenciés selon le contexte. Pour les équipes informatiques, l'intégration via Microsoft Entra permet de vérifier l'identité des agents et de s'assurer qu'ils respectent les politiques de sécurité internes. La protection des données s'appuie sur Microsoft Purview, les identifiants liés aux identités machines étant masqués dans les journaux de diagnostics. Les actions jugées sensibles par l'algorithme requièrent systématiquement une validation humaine, ce qui préserve un contrôle sur les décisions à fort impact. La notion d'Autopilot s'inscrit dans la course que se livrent les grandes plateformes pour intégrer des agents réellement autonomes dans les flux de travail professionnels. Microsoft, qui a massivement investi dans l'IA générative depuis son partenariat avec OpenAI, cherche à différencier sa suite Copilot en y ajoutant une couche d'agentivité persistante et contextuelle. En bâtissant Scout sur une base open source et en promettant d'y contribuer, l'entreprise adopte une posture d'ouverture inhabituelle dans ce segment très compétitif. La prochaine étape sera l'élargissement progressif du programme Frontier et l'extension des capacités de Scout au-delà de Microsoft 365 vers d'autres surfaces applicatives, à mesure que les essais en conditions réelles permettront d'affiner la gestion des risques de sécurité identifiés lors des tests internes.

UELes entreprises françaises et européennes utilisant Microsoft 365 devront évaluer les implications de gouvernance et de conformité (RGPD, AI Act) liées à l'adoption d'agents autonomes dotés d'une identité numérique propre.

OutilsOutil
1 source
Scout : le nouveau OpenClaw de Microsoft qui automatise tout
2Le Big Data 

Scout : le nouveau OpenClaw de Microsoft qui automatise tout

Microsoft a présenté Scout lors de sa conférence Build 2026, un nouvel assistant IA autonome intégré directement dans l'environnement Microsoft 365. Conçu pour aller bien au-delà du chatbot classique, Scout peut accéder aux e-mails, calendriers et services Microsoft afin d'exécuter des tâches automatiquement : organiser des réunions, préparer des ordres du jour, gérer des tâches administratives courantes. L'outil est actuellement disponible via le programme Frontier de Microsoft, mais nécessite un abonnement GitHub Copilot pour y accéder. Contrairement aux assistants ponctuels, Scout apprend les habitudes de travail de chaque utilisateur au fil du temps : il est personnalisable, peut recevoir un prénom choisi par l'utilisateur, et s'ajuste selon les retours réguliers qu'on lui transmet. Les utilisateurs pourront également créer leurs propres compétences et scénarios d'automatisation pour l'adapter à des besoins métier très spécifiques. L'enjeu pour Microsoft est considérable. Avec des centaines de millions de professionnels qui utilisent quotidiennement la suite Microsoft 365, intégrer un agent capable d'anticiper les besoins et d'agir sans attendre d'instruction représente un changement de paradigme dans la productivité au bureau. Ce n'est plus l'assistant qui répond aux questions, mais celui qui prend des initiatives : surveiller un calendrier surchargé, détecter un conflit de planning, préparer un briefing avant une réunion. Pour les entreprises, les gains de temps potentiels sont réels, mais la question du contrôle se pose immédiatement. Microsoft affirme avoir intégré plusieurs mécanismes de sécurité : un système de vérification continue du respect des règles définies par l'utilisateur et l'organisation, ainsi qu'un journal d'audit enregistrant chaque action significative. Plus un agent gagne en autonomie, plus les conséquences d'une erreur peuvent être lourdes, ce qui rend ces garde-fous essentiels à la crédibilité du produit. Scout s'inscrit dans une tendance de fond qui s'est accélérée depuis le début 2026, portée notamment par OpenClaw, le projet qui a popularisé l'idée d'agents IA agissant de manière vraiment autonome sans attendre d'instructions humaines explicites. Microsoft reprend explicitement cette architecture conceptuelle et l'adapte à son écosystème propriétaire, une stratégie déjà utilisée avec succès pour GitHub Copilot. La bataille dans l'industrie IA ne porte plus sur les chatbots les plus fluides, mais sur les agents les plus capables d'agir dans le monde réel. Google, Amazon et des dizaines de startups travaillent sur des approches similaires. Ce que Scout tente de résoudre, c'est le problème de la confiance : convaincre les utilisateurs professionnels de déléguer une partie de leur organisation quotidienne à un système automatisé, avec suffisamment de transparence et de contrôle pour que cette délégation soit acceptable.

UEL'intégration d'agents autonomes accédant aux e-mails et calendriers dans Microsoft 365, suite utilisée par des millions de professionnels européens, soulève des questions concrètes de conformité RGPD pour les entreprises françaises et européennes.

💬 C'est le genre de truc qu'on attendait depuis deux ans. Microsoft reprend l'idée des agents autonomes, l'ancre dans 365 où les données sont déjà là, et du coup ça tient mieux que les démos sur terminal vide qu'on nous sert depuis 2024. Reste que laisser un agent gérer tes mails et ton calendrier, ça demande un niveau de confiance que la plupart des boîtes françaises ne sont pas encore prêtes à accorder.

OutilsOutil
1 source
GPT-5.5 débarque dans Microsoft 365 : la fin du travail manuel approche?
3Le Big Data 

GPT-5.5 débarque dans Microsoft 365 : la fin du travail manuel approche?

Depuis le 27 avril 2026, GPT-5.5 Thinking, la dernière version du modèle d'OpenAI, est déployé au sein de Microsoft 365 Copilot. Le modèle est disponible dans Copilot Chat, Word, Excel et PowerPoint, ainsi que dans Copilot Studio. Cette intégration ne se limite pas au moteur de génération de texte : Microsoft lance simultanément ChatGPT Images 2.0, un outil de création visuelle directement accessible dans PowerPoint, avec une extension prochaine à Copilot Chat. L'ensemble repose sur une couche contextuelle baptisée Work IQ, qui ajuste les réponses de l'IA en fonction du contexte de travail de l'utilisateur, de ses fichiers, de ses habitudes et de ses tâches en cours. Ce déploiement marque un saut qualitatif pour Copilot, qui passe d'un assistant réactif à un outil capable de structurer des tâches complexes en plusieurs étapes logiques, d'anticiper les besoins et de produire des résultats plus complets et mieux argumentés. Pour les entreprises abonnées à Microsoft 365, cela signifie concrètement que la rédaction de rapports, l'analyse de données dans Excel ou la construction de présentations dans PowerPoint peuvent désormais être prises en charge de bout en bout par l'IA, sans recours à des outils tiers. La suppression de cette friction entre plusieurs plateformes représente un gain de productivité direct, mais renforce aussi la dépendance à l'écosystème fermé de Microsoft. Cette intégration s'inscrit dans une course à l'arme IA dans les logiciels de productivité qui oppose Microsoft à Google (Workspace avec Gemini) et à des acteurs émergents comme Notion ou Slack. OpenAI, dont Microsoft est le principal investisseur avec plus de 13 milliards de dollars engagés, positionne GPT-5.5 comme un modèle de raisonnement avancé, distinct des versions précédentes par sa capacité à enchaîner des étapes de réflexion plutôt que de simplement générer du texte. La dimension Work IQ, en personnalisant les sorties selon le contexte professionnel, vise à répondre à la critique récurrente faite aux copilotes IA : leur manque de pertinence situationnelle. Si ces promesses tiennent à l'usage, la frontière entre l'assistant et le collaborateur autonome continue de se déplacer, redessinant progressivement les compétences attendues des travailleurs du savoir.

UELes entreprises françaises et européennes abonnées à Microsoft 365 accèdent désormais à GPT-5.5 directement dans Word, Excel et PowerPoint, ce qui renforce leur dépendance à l'écosystème Microsoft/OpenAI et soulève des enjeux de souveraineté numérique au regard du RGPD.

OutilsOutil
1 source
Un badge d’accès dopé à l’IA : le gadget de Microsoft qui voit, écoute et accompagne les salariés
4Le Big Data 

Un badge d’accès dopé à l’IA : le gadget de Microsoft qui voit, écoute et accompagne les salariés

Microsoft a présenté lors de sa conférence Build un prototype de badge d'entreprise dopé à l'intelligence artificielle, baptisé Project Solara. Cet objet, conçu comme un compagnon de terrain connecté à Copilot, embarque un écran tactile, une caméra latérale, un microphone, un capteur d'empreintes digitales, du Wi-Fi et de la 5G. Steven Bathiche, expert technique chez Microsoft, a démontré sur scène comment demander à Copilot de repérer des prises de vue, de les retoucher et de les envoyer directement à une équipe. Un second prototype, lui destiné à rester sur un bureau, intègre des capteurs de présence à ultra-large bande capables de détecter l'approche de l'utilisateur, et se synchronise avec le PC principal via Bluetooth pour permettre de basculer des tâches entre les deux appareils. L'ambition de Microsoft est claire : faire sortir ses agents d'IA des interfaces logicielles pour les ancrer dans le monde physique, doté d'yeux, d'oreilles et d'une connexion permanente. La cible prioritaire n'est pas le cadre devant son écran, mais les travailleurs de première ligne, infirmières, employés de magasin, techniciens de terrain, pour qui un assistant capable de lire une scène en temps réel représente un gain concret. Le badge tire sa force du format lui-même : c'est un objet déjà accepté, voire ignoré, dans la plupart des organisations, ce qui facilite son adoption. Mais cette même discrétion soulève des questions immédiates sur la vie privée : un badge avec caméra et micro porté en permanence au travail franchit rapidement la ligne entre outil d'assistance et dispositif de surveillance. Cette annonce s'inscrit dans une stratégie plus large que Microsoft déploie depuis plusieurs années : après les PC Copilot, les agents logiciels autonomes et l'intégration de l'IA dans Microsoft 365, l'entreprise cherche à coloniser tous les points de contact du quotidien professionnel. Le mouvement n'est pas isolé, lunettes connectées, pendentifs IA et autres wearables fleurissent chez des concurrents comme Meta ou des startups spécialisées. Microsoft mise ici sur le monde de l'entreprise plutôt que sur le grand public, avec des secteurs comme la santé ou la distribution en ligne de mire. Le projet reste à ce stade un concept sans date de commercialisation annoncée, mais il signale une direction : si les agents d'IA doivent devenir vraiment utiles hors des bureaux, ils auront besoin d'un support physique. Microsoft parie que ce support pourrait se porter autour du cou.

UELe port permanent d'un badge caméra-micro en entreprise se heurterait directement au RGPD et au droit du travail français, qui encadrent strictement la surveillance des salariés et imposent un consentement explicite pour toute collecte de données biométriques ou audio sur le lieu de travail.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour