
MolmoWeb, l'agent web entièrement open source d'AI2, navigue sur internet à partir de captures d'écran
L'Allen Institute for AI (AI2) vient de lancer MolmoWeb, un agent web entièrement open source capable de naviguer sur internet en s'appuyant uniquement sur des captures d'écran. Contrairement aux approches traditionnelles qui analysent le code HTML des pages, MolmoWeb perçoit le web comme un humain — visuellement — et interagit avec les interfaces sans accès au DOM sous-jacent.
Cette approche est notable car elle ouvre la voie à des agents capables d'opérer sur n'importe quel site, y compris ceux dont le code est obfusqué ou les interfaces hautement dynamiques. L'enjeu est de taille pour le secteur : les agents web autonomes représentent l'une des applications les plus concrètes de l'IA générative, avec des débouchés directs en automatisation de tâches, assistance numérique et robotique logicielle.
Malgré des architectures compactes de 4 et 8 milliards de paramètres, les modèles MolmoWeb surpassent plusieurs systèmes propriétaires nettement plus grands sur les benchmarks standards de navigation web. Ce rapport performance/taille illustre les progrès réalisés dans l'entraînement ciblé d'agents visuels. L'intégralité des poids, du code et des données d'entraînement est publiée en open source, dans la continuité de la démarche d'AI2 avec la famille Molmo lancée fin 2024.
Cette publication renforce la position d'AI2 comme acteur clé de l'open source en IA, face aux approches fermées de Google, OpenAI ou Anthropic sur le terrain des agents web. La transparence totale du modèle permettra à la communauté de l'auditer, de l'affiner et potentiellement de le déployer dans des environnements souverains sans dépendance à des API tierces.
Les chercheurs et développeurs européens peuvent adopter MolmoWeb sans dépendre de services propriétaires américains, réduisant ainsi les coûts et les contraintes de souveraineté numérique.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




