Aller au contenu principal
L'agent d'utilisation informatique d'AI2 peut exécuter des actions en ligne
OutilsAI Business6sem

L'agent d'utilisation informatique d'AI2 peut exécuter des actions en ligne

Résumé IASource uniqueImpact UE
Source originale ↗·

L'Allen Institute for AI (AI2) franchit une nouvelle étape dans l'automatisation des tâches numériques avec le lancement d'un agent open source capable d'utiliser un ordinateur et d'exécuter des actions en ligne de manière autonome. Ce type d'agent, dit de "computer use", représente une évolution significative dans la catégorie des assistants IA capables d'interagir directement avec des interfaces graphiques et des services web.

Ce positionnement open source distingue l'initiative d'AI2 des approches propriétaires adoptées par des acteurs comme Anthropic — dont le modèle Claude propose une fonctionnalité similaire — ou OpenAI. En rendant l'agent accessible à la communauté, AI2 mise sur la transparence et la reproductibilité, des valeurs centrales de l'institut fondé par Paul Allen. L'enjeu est de taille : les agents capables d'agir sur un ordinateur ouvrent la voie à une automatisation bien plus large que les simples chatbots, avec des implications directes pour la productivité en entreprise.

L'agent d'AI2 peut accomplir des tâches autonomes en ligne — navigation web, interaction avec des applications, exécution de séquences d'actions — sans intervention humaine à chaque étape. L'institut reconnaît cependant que le système présente certaines limitations, sans en préciser la nature exacte dans cette annonce. Ces contraintes sont typiques des agents de première génération dans cette catégorie : fiabilité variable selon les interfaces, gestion imparfaite des cas limites, et risques liés à l'exécution d'actions irréversibles.

La publication en open source de cet agent s'inscrit dans une dynamique plus large où la recherche académique cherche à contrebalancer la concentration des capacités d'IA avancées dans les mains de quelques grandes entreprises technologiques. Les développeurs et chercheurs pourront désormais auditer, modifier et améliorer le système, ce qui devrait accélérer les progrès dans ce domaine encore émergent.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Claude peut désormais créer des graphiques et visualisations interactifs directement dans le chat
1The Decoder 

Claude peut désormais créer des graphiques et visualisations interactifs directement dans le chat

Anthropic lance une nouvelle fonctionnalité bêta pour Claude : la génération de graphiques, diagrammes et visualisations interactifs directement dans la conversation. Cette capacité permet aux utilisateurs d'obtenir des représentations visuelles de données sans quitter l'interface de chat.

OutilsOutil
1 source
Du modèle à l'agent : la Responses API s'enrichit d'un environnement informatique
2OpenAI Blog 

Du modèle à l'agent : la Responses API s'enrichit d'un environnement informatique

OpenAI a développé un runtime d'agent en s'appuyant sur l'API Responses, un outil shell et des conteneurs hébergés, permettant d'exécuter des agents de manière sécurisée et scalable. Cette infrastructure donne aux agents la capacité de gérer des fichiers, des outils et un état persistant au sein d'un environnement informatique isolé. L'objectif est de faire évoluer les modèles vers de véritables agents autonomes capables d'effectuer des tâches complexes en environnement contrôlé.

OutilsOutil
1 source
Évaluer les agents IA en pratique : benchmarks, frameworks et leçons tirées de l'expérience
3InfoQ AI 

Évaluer les agents IA en pratique : benchmarks, frameworks et leçons tirées de l'expérience

Cet article présente des méthodes concrètes pour évaluer les agents IA en conditions réelles, combinant benchmarks, pipelines d'évaluation automatisés et revue humaine. Il aborde la mesure de la fiabilité, du taux de succès sur les tâches, et du comportement multi-étapes des agents qui planifient et utilisent des outils. L'auteur, Amit Kumar Padhy, souligne les défis spécifiques liés à l'évaluation de systèmes opérant sur plusieurs tours d'interaction.

OutilsOutil
1 source
Des agents en essaim : présentation d'une approche ludique et rentable
4InfoQ AI 

Des agents en essaim : présentation d'une approche ludique et rentable

Adrian Cockcroft, ancien architecte en chef d'Amazon Web Services et figure reconnue de l'ingénierie cloud, a présenté une conférence intitulée « Diriger un essaim d'agents pour le plaisir et le profit », dans laquelle il expose sa vision de ce qu'il appelle le développement « AI-native ». S'appuyant sur des expériences concrètes menées avec des outils comme Cursor et Claude Flow, il décrit une approche de niveau « directeur » : plutôt que d'écrire du code ligne par ligne, l'ingénieur orchestre des essaims d'agents autonomes qui exécutent les tâches en parallèle. Ses expérimentations couvrent notamment le BDD (développement piloté par le comportement), les serveurs MCP et le portage de code entre langages de programmation. Cette transition du cloud-native vers l'AI-native représente un changement de paradigme majeur pour l'industrie du logiciel. Elle implique que la valeur ajoutée de l'ingénieur se déplace de l'écriture du code vers la conception de plateformes capables de coordonner des agents IA. Pour les équipes de développement, cela signifie repenser les workflows, les outils de revue et la façon dont on mesure la productivité. Cockcroft est l'une des voix les plus influentes à théoriser ce basculement, après avoir contribué à populariser les microservices et l'architecture cloud à grande échelle chez Netflix puis AWS. L'émergence d'outils comme Claude Flow ou les serveurs MCP d'Anthropic crée l'infrastructure nécessaire à cette orchestration multi-agents. La question qui s'ouvre désormais est de savoir quelles compétences humaines resteront irremplaçables dans un pipeline où les agents gèrent l'essentiel de l'exécution technique.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour