Google intègre le contrôle d'écran directement dans Gemini 3.5 Flash
Google a intégré nativement la fonctionnalité "Computer Use" directement dans Gemini 3.5 Flash, son modèle rapide disponible via l'API Gemini. Cette capacité permet au modèle de percevoir l'écran d'un ordinateur, d'un navigateur ou d'un appareil mobile, et d'en prendre le contrôle de façon autonome pour accomplir des tâches. Sur le benchmark de référence OSWorld, qui évalue la capacité des modèles à naviguer et interagir avec des interfaces graphiques réelles, Gemini 3.5 Flash obtient un score de 78,4, le plaçant au même niveau que GPT-5.5 d'OpenAI.
Pour les développeurs, cette intégration ouvre la voie à des agents capables d'automatiser des workflows complexes sans infrastructure supplémentaire : tests logiciels, automatisation de tâches bureautiques, navigation web pilotée par l'IA. En inscrivant le contrôle d'ordinateur directement dans le modèle plutôt que comme une surcouche externe, Google réduit la friction technique et rend ces capacités accessibles à un plus grand nombre d'équipes, y compris celles sans expertise spécialisée en IA agentique.
La fonctionnalité "Computer Use" a été popularisée en octobre 2024 par Anthropic avec Claude, avant qu'OpenAI ne propose des capacités similaires avec GPT-4o. Google entre maintenant dans cette course avec un avantage différenciant : l'intégration native dans un modèle déjà massivement adopté pour sa rapidité et son faible coût. L'enjeu est considérable, car la capacité à orchestrer des agents autonomes opérant des logiciels existants représente l'une des prochaines frontières économiques de l'IA générative, et les trois grands acteurs se disputent désormais ce segment à armes presque égales.
Les développeurs et entreprises françaises et européennes peuvent intégrer des capacités d'automatisation agentique directement via l'API Gemini 3.5 Flash, sans infrastructure supplémentaire, abaissant la barrière technique à l'adoption des agents IA.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




