OutilsGoogle AI Blog13sem· 1 min de lecture

Nouvelles options pour équilibrer coût et fiabilité dans l'API Gemini

Google a annoncé l'introduction de deux nouveaux niveaux d'inférence dans son API Gemini : Flex et Priority. Ces deux paliers visent à offrir aux développeurs un contrôle plus fin sur l'arbitrage entre coût et latence lors de l'appel aux modèles Gemini via l'API.

Le niveau Flex est conçu pour les charges de travail tolérantes aux délais, permettant de réduire significativement les coûts en échange d'une latence plus élevée. Le niveau Priority, à l'inverse, garantit des réponses rapides pour les applications temps réel qui nécessitent une fiabilité immédiate, au prix d'un tarif plus élevé. Cette flexibilité permet aux entreprises d'optimiser leurs dépenses selon la criticité de chaque requête.

Cette évolution s'inscrit dans la concurrence féroce entre les fournisseurs d'API d'IA générative, où Google affronte OpenAI, Anthropic et d'autres acteurs. La gestion des coûts d'inférence est devenue un enjeu central pour les équipes techniques qui déploient des applications à grande échelle, et proposer des niveaux de service différenciés est désormais une pratique standard dans l'industrie pour attirer aussi bien les startups soucieuses de leurs budgets que les grandes entreprises exigeant des performances maximales.

Dans nos dossiers

Gemini OpenAI Anthropic

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Decoder

Google adopte l'Interactions API comme interface par défaut pour ses modèles et agents Gemini

Google DeepMind a officialisé l'Interactions API comme nouvelle interface par défaut pour ses modèles et agents Gemini. Ce changement architectural remplace l'ancienne API generateContent, jusqu'ici l'interface standard pour interroger les modèles Gemini via le Google AI Studio et les SDK associés. La nouvelle interface repose sur un schéma simplifié structuré autour d'étapes typées, abandonnant l'organisation précédente basée sur des rôles. Désormais, toutes les nouvelles fonctionnalités destinées aux agents seront exclusivement disponibles via cette API. Ce basculement a des conséquences directes pour les développeurs qui ont construit des applications ou des pipelines sur l'API generateContent : ils devront migrer vers le nouveau schéma pour accéder aux futures capacités. L'approche par étapes typées vise à rendre l'intégration plus claire et moins ambiguë, notamment pour les scénarios agentiques complexes où plusieurs actions s'enchaînent. En gelant les nouvelles fonctionnalités sur l'ancienne API, Google crée une pression de migration qui devrait accélérer l'adoption du nouveau standard. Ce choix s'inscrit dans une tendance de fond chez les grands fournisseurs de modèles : aligner l'interface de programmation sur les besoins des systèmes agentiques, qui nécessitent une gestion fine des états, des outils et des flux d'exécution. Google, qui fait face à une concurrence intense d'OpenAI et Anthropic sur le segment des agents IA, cherche à offrir une base technique plus cohérente pour les développeurs. L'Interactions API représente ainsi moins un simple changement d'interface qu'une réorientation stratégique de la plateforme Gemini vers les usages agentiques de nouvelle génération.

UELes développeurs européens ayant intégré l'API generateContent de Gemini dans leurs applications devront planifier une migration vers l'Interactions API pour continuer à accéder aux nouvelles fonctionnalités agentiques de Google.

OutilsOutil

1 source

2Blog du Modérateur

Claude Code lance l’auto mode, pour équilibrer l’autonomie de l’IA et la sécurité

Anthropic a lancé une nouvelle fonctionnalité pour Claude Code appelée « auto mode », permettant aux développeurs de laisser l'agent exécuter des tâches de manière autonome sans validation manuelle à chaque étape. Le système soumet chaque action à un classifieur IA interne avant de l'exécuter, ce qui permet de filtrer automatiquement les opérations risquées ou non souhaitées. Cette approche représente un compromis entre efficacité et sécurité : les développeurs gagnent en productivité en évitant les interruptions constantes, tout en conservant un filet de sécurité automatisé. Le classifieur IA agit comme gardien, évaluant le niveau de risque de chaque action avant qu'elle ne soit appliquée sur le système. L'auto mode s'inscrit dans la tendance croissante des éditeurs d'outils d'IA à proposer des agents plus autonomes, un enjeu majeur alors que ces assistants accèdent de plus en plus à des environnements de production sensibles.

OutilsOutil

1 source

3Blog du Modérateur

Google déploie enfin des outils pour contrôler les coûts de l’API Gemini

Google a déployé des outils de contrôle budgétaire pour son API Gemini, permettant de définir des limites de dépenses par projet. Le service intègre désormais un système de paliers tarifaires et des tableaux de bord dédiés au suivi des coûts et de l'usage. Ces fonctionnalités répondent à une demande des développeurs souhaitant mieux maîtriser leur consommation de l'API.

UELes développeurs européens utilisant l'API Gemini peuvent désormais configurer des plafonds de dépenses et suivre leur consommation en temps réel.

OutilsOutil

1 source

4The Verge AI

Gemini peut désormais contrôler votre téléphone : les nouvelles fonctionnalités clés

Google a dévoilé une série de nouvelles fonctionnalités pour son assistant Gemini lors d'un événement Android organisé en amont de sa conférence annuelle Google I/O. Présentées par Ben Greenwood, directeur des expériences Android chez Google, ces nouveautés visent à intégrer Gemini plus profondément dans l'usage quotidien du smartphone : l'assistant s'invite désormais dans Chrome sur Android, dans les suggestions de remplissage automatique, et peut interagir directement au sein des applications tierces. Google en profite pour lancer une nouvelle marque, Gemini Intelligence, destinée à regrouper les fonctionnalités les plus avancées de l'assistant sur les appareils Android haut de gamme. L'enjeu principal de cette mise à jour est de transformer Gemini en un véritable agent capable d'agir à la place de l'utilisateur sur son téléphone, pas seulement de répondre à des questions. En s'intégrant aux applications et au remplissage automatique, Gemini peut potentiellement exécuter des tâches complexes sans que l'utilisateur ait besoin de naviguer manuellement entre les écrans. Cela représente un saut qualitatif dans l'assistance mobile, particulièrement pour les utilisateurs qui délèguent de plus en plus leurs tâches numériques à l'IA. Cette annonce s'inscrit dans une compétition acharnée entre Google et Apple, qui prépare sa propre refonte d'Apple Intelligence pour iOS 19. En réservant Gemini Intelligence aux appareils Android les plus récents, Google adopte une stratégie similaire à celle d'Apple, utilisant l'IA comme argument de vente pour pousser les utilisateurs vers le renouvellement de leurs appareils. Les détails complets seront probablement précisés lors de Google I/O dans les prochains jours.

UELes utilisateurs européens d'Android pourront bénéficier de ces nouvelles capacités agentiques de Gemini, sous réserve de conformité avec le RGPD et le Digital Markets Act qui encadrent l'intégration d'assistants IA dans les systèmes d'exploitation.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic