Aller au contenu principal
Nouvelles options pour équilibrer coût et fiabilité dans l'API Gemini
OutilsGoogle AI Blog5h

Nouvelles options pour équilibrer coût et fiabilité dans l'API Gemini

1 source couvre ce sujet·Source originale ↗·

Google a annoncé l'introduction de deux nouveaux niveaux d'inférence dans son API Gemini : Flex et Priority. Ces deux paliers visent à offrir aux développeurs un contrôle plus fin sur l'arbitrage entre coût et latence lors de l'appel aux modèles Gemini via l'API.

Le niveau Flex est conçu pour les charges de travail tolérantes aux délais, permettant de réduire significativement les coûts en échange d'une latence plus élevée. Le niveau Priority, à l'inverse, garantit des réponses rapides pour les applications temps réel qui nécessitent une fiabilité immédiate, au prix d'un tarif plus élevé. Cette flexibilité permet aux entreprises d'optimiser leurs dépenses selon la criticité de chaque requête.

Cette évolution s'inscrit dans la concurrence féroce entre les fournisseurs d'API d'IA générative, où Google affronte OpenAI, Anthropic et d'autres acteurs. La gestion des coûts d'inférence est devenue un enjeu central pour les équipes techniques qui déploient des applications à grande échelle, et proposer des niveaux de service différenciés est désormais une pratique standard dans l'industrie pour attirer aussi bien les startups soucieuses de leurs budgets que les grandes entreprises exigeant des performances maximales.

À lire aussi

Microsoft étend son offre IA avec de nouveaux modèles vocaux et visuels
1AI Business 

Microsoft étend son offre IA avec de nouveaux modèles vocaux et visuels

Microsoft franchit une nouvelle étape dans le développement de ses propres modèles d'intelligence artificielle en annonçant des systèmes dédiés à la voix et à l'image, allant au-delà des grands modèles de langage textuels sur lesquels la firme de Redmond s'est largement appuyée jusqu'ici. Cette initiative marque une volonté affichée de maîtriser l'ensemble de la chaîne des capacités d'IA, plutôt que de sous-traiter ces briques à des partenaires externes. L'enjeu est considérable pour l'industrie : en développant ses propres modèles vocaux et visuels, Microsoft réduit sa dépendance vis-à-vis d'OpenAI, dont il est le principal investisseur et distributeur via Azure. Cela lui permettrait de proposer des solutions plus intégrées, moins coûteuses et plus personnalisables pour ses clients entreprises, tout en gardant la main sur la roadmap technologique de ses produits phares comme Copilot. Cette évolution s'inscrit dans une tendance plus large de verticalisation de l'IA au sein des grandes plateformes technologiques : Google, Apple et Amazon ont chacun suivi une trajectoire similaire. La relation entre Microsoft et OpenAI, longtemps présentée comme un partenariat exclusif, montre ainsi ses limites stratégiques à mesure que l'IA devient un avantage concurrentiel central. La course à la souveraineté sur les modèles fondamentaux ne fait que commencer.

UELes entreprises françaises et européennes utilisant Azure pourraient accéder à des modèles vocaux et visuels plus intégrés et compétitifs, réduisant leur dépendance indirecte à OpenAI.

OutilsOpinion
1 source
Google Vids s'enrichit de l'IA avec les modèles Veo et Lyria, et des avatars pilotables
2Ars Technica AI 

Google Vids s'enrichit de l'IA avec les modèles Veo et Lyria, et des avatars pilotables

Google a annoncé une mise à jour majeure de son outil de création vidéo Google Vids, intégrant ses derniers modèles d'IA générative, dont Veo 3.1 pour la vidéo et Lyria pour l'audio. Le modèle Veo 3.1, déployé en premier sur Gemini fin 2025, promet des améliorations significatives en termes de réalisme et de cohérence visuelle. L'outil propose désormais des avatars IA directables — des personnages numériques contrôlables qui peuvent apparaître dans les vidéos générées — ainsi qu'une intégration facilitée avec YouTube pour le partage de contenus. Les vidéos produites durent huit secondes et sont rendues en résolution 720p. L'accès à ces fonctionnalités reste plafonné selon le niveau d'abonnement : les utilisateurs sans abonnement IA n'obtiennent que 10 générations vidéo par mois, les abonnés AI Pro en ont 50, tandis que les clients du plan AI Ultra — personnel ou entreprise, le plus coûteux de Google — bénéficient de 1 000 générations mensuelles. Ce modèle économique positionne Google Vids comme un outil grand public et professionnel à la fois, ciblant des usages concrets comme la création de flyers animés, de vidéos de présentation commerciale ou de cartes de vœux vidéo. Cette mise à jour intervient dans un contexte de vive concurrence sur le marché de la vidéo générative, où OpenAI a récemment restreint ses ambitions dans ce domaine. Google, au contraire, accélère le déploiement de Veo dans ses produits grand public, après l'avoir d'abord présenté comme un outil destiné aux cinéastes professionnels. Le glissement vers des cas d'usage plus accessibles illustre la stratégie de Google pour monétiser ses capacités d'IA via Google One et Workspace, tout en cherchant à ancrer ses modèles dans les habitudes quotidiennes des utilisateurs face à des concurrents comme Adobe, Canva ou Runway.

UELes utilisateurs européens de Google Workspace et Google One peuvent accéder aux nouvelles fonctionnalités vidéo de Google Vids selon leur niveau d'abonnement, avec des implications tarifaires directes pour les professionnels et entreprises.

OutilsOutil
1 source
Passer de ChatGPT à Gemini sans repartir de zéro
3ZDNET AI 

Passer de ChatGPT à Gemini sans repartir de zéro

Google a lancé une fonctionnalité permettant aux utilisateurs de ChatGPT de migrer leur historique de conversations, leurs préférences et leurs souvenirs personnalisés directement vers Gemini, sans repartir de zéro. Concrètement, la procédure passe par les paramètres de Gemini, où une option d'importation permet de connecter son compte OpenAI et de transférer les données stockées, y compris les instructions personnalisées et les mémos que l'assistant avait mémorisés au fil du temps. Ce type de portabilité représente un changement significatif dans la manière dont les assistants IA cherchent à fidéliser ou à attirer des utilisateurs. Jusqu'ici, changer d'outil signifiait tout réapprendre à son assistant : habitudes de travail, ton préféré, contexte professionnel. En supprimant ce frein, Google abaisse concrètement le coût du changement pour les millions d'utilisateurs de ChatGPT, notamment les abonnés Plus qui ont construit une base de mémoire sur plusieurs mois. La bataille pour la rétention des utilisateurs d'IA s'intensifie alors qu'OpenAI, Google et Anthropic se disputent les mêmes professionnels et créateurs. Google avait déjà intégré Gemini dans Workspace, mais la portabilité des données personnalisées constitue un argument nouveau. Cette fonctionnalité pourrait aussi pousser OpenAI à proposer des options d'export plus complètes, et alimenter le débat réglementaire autour de l'interopérabilité des données entre plateformes d'IA.

UELa portabilité des données entre plateformes d'IA s'inscrit dans les débats réglementaires européens sur l'interopérabilité, notamment dans le cadre du Digital Markets Act et de l'AI Act.

💬 Google qui joue la carte de la portabilité, c'est un coup bien pensé. Ça fait des mois qu'on sait que la vraie valeur d'un assistant, c'est pas le modèle, c'est tout ce qu'on lui a appris sur nous. Reste à voir si les souvenirs importés survivent vraiment au transfert, ou si c'est juste un argument marketing pour faire parler d'un Gemini qui peine encore à convaincre sans béquilles.

OutilsOutil
1 source
ChatGPT arrive dans Apple CarPlay ! Voici comment l’IA va changer vos trajets
4Le Big Data 

ChatGPT arrive dans Apple CarPlay ! Voici comment l’IA va changer vos trajets

OpenAI a lancé le 2 avril 2026 l'intégration de ChatGPT dans Apple CarPlay, rendue possible par la mise à jour iOS 26.4. Cette nouvelle catégorie d'applications, baptisée "assistants conversationnels vocaux", ouvre pour la première fois la plateforme automobile d'Apple à des IA tierces — et OpenAI en est le premier bénéficiaire. Concrètement, ChatGPT s'affiche comme une application standard dans l'interface CarPlay via l'iPhone connecté. Une fois lancée, l'interaction est entièrement vocale : aucun texte, aucune image n'apparaît à l'écran. Le conducteur pose ses questions à voix haute et reçoit des réponses audio, qu'il s'agisse de brainstorming, de rédaction, de résumés ou de simples conversations. Le chatbot ne contrôle aucune fonction du véhicule et n'interfère pas avec Siri, qui conserve l'accès aux réglages système et commandes natives d'Apple. Cette intégration marque un tournant dans la manière dont les intelligences artificielles génératives s'imposent dans des environnements jusqu'ici verrouillés. Apple, réputée pour la rigidité de son écosystème, accepte pour la première fois qu'un assistant conversationnel concurrent à Siri soit accessible nativement depuis le tableau de bord. Pour les utilisateurs, cela signifie un accès à une IA de haut niveau pendant les trajets longs ou les embouteillages, sans manipulation de l'écran. Pour l'industrie, c'est un signal fort : les assistants vocaux génériques, capables de raisonner et de produire du contenu, commencent à supplanter les assistants à commandes limitées dans les usages quotidiens, y compris en mobilité. Cette ouverture d'Apple intervient dans un contexte de compétition accrue entre les grandes plateformes pour contrôler l'interface humain-machine dans l'habitacle. Google intègre depuis plusieurs années Gemini dans Android Auto, et les constructeurs automobiles multiplient les partenariats avec des IA (Mercedes avec ChatGPT, Volkswagen avec son propre assistant). En assouplissant ses règles pour iOS 26.4, Apple répond à une pression croissante des utilisateurs et des développeurs. Des limites subsistent toutefois : ChatGPT dans CarPlay ne dispose pas de mot de réveil, ce qui oblige le conducteur à lancer manuellement l'application — une friction notable en conduite. Un contournement existe via Siri, mais reste peu intuitif. Selon les rumeurs circulant autour d'iOS 27, Apple pourrait permettre de définir son assistant vocal par défaut, ce qui changerait radicalement la donne pour OpenAI comme pour ses concurrents.

UELes conducteurs européens utilisant un iPhone et Apple CarPlay peuvent désormais accéder à ChatGPT en mode vocal durant leurs trajets, sans action réglementaire spécifique à la France ou à l'UE.

💬 Apple qui laisse un concurrent direct de Siri entrer dans CarPlay, c'est du jamais vu. La friction reste réelle (pas de mot de réveil, donc tu lances l'appli toi-même en conduisant), mais c'est la première brèche dans un écosystème qui était verrouillé à double tour. Si iOS 27 permet de définir son assistant vocal par défaut, là ça change vraiment quelque chose pour tout le monde.

OutilsOutil
1 source