L'agent d'utilisation informatique d'AI2 peut…

L'Allen Institute for AI (AI2) franchit une nouvelle étape dans l'automatisation des tâches numériques avec le lancement d'un agent open source capable d'utiliser un ordinateur et d'exécuter des actions en ligne de manière autonome. Ce type d'agent, dit de "computer use", représente une évolution significative dans la catégorie des assistants IA capables d'interagir directement avec des interfaces graphiques et des services web.

Ce positionnement open source distingue l'initiative d'AI2 des approches propriétaires adoptées par des acteurs comme Anthropic — dont le modèle Claude propose une fonctionnalité similaire — ou OpenAI. En rendant l'agent accessible à la communauté, AI2 mise sur la transparence et la reproductibilité, des valeurs centrales de l'institut fondé par Paul Allen. L'enjeu est de taille : les agents capables d'agir sur un ordinateur ouvrent la voie à une automatisation bien plus large que les simples chatbots, avec des implications directes pour la productivité en entreprise.

L'agent d'AI2 peut accomplir des tâches autonomes en ligne — navigation web, interaction avec des applications, exécution de séquences d'actions — sans intervention humaine à chaque étape. L'institut reconnaît cependant que le système présente certaines limitations, sans en préciser la nature exacte dans cette annonce. Ces contraintes sont typiques des agents de première génération dans cette catégorie : fiabilité variable selon les interfaces, gestion imparfaite des cas limites, et risques liés à l'exécution d'actions irréversibles.

La publication en open source de cet agent s'inscrit dans une dynamique plus large où la recherche académique cherche à contrebalancer la concentration des capacités d'IA avancées dans les mains de quelques grandes entreprises technologiques. Les développeurs et chercheurs pourront désormais auditer, modifier et améliorer le système, ce qui devrait accélérer les progrès dans ce domaine encore émergent.

L'agent d'utilisation informatique d'AI2 peut exécuter des actions en ligne

À lire aussi

Claude peut désormais créer des graphiques et visualisations interactifs directement dans le chat

Du modèle à l'agent : la Responses API s'enrichit d'un environnement informatique

Évaluer les agents IA en pratique : benchmarks, frameworks et leçons tirées de l'expérience

Des agents en essaim : présentation d'une approche ludique et rentable