
Le Gemini 3.5 Flash de Google emboite le pas à Anthropic et OpenAI en augmentant sensiblement le prix de ses nouveaux modèles
Google a lancé Gemini 3.5 Flash, une nouvelle version de son modèle léger censée représenter un bond qualitatif significatif par rapport à la génération précédente. Mais selon des tests de benchmark récents, ce progrès a un prix : le modèle coûte 5,5 fois plus cher à faire tourner que son prédécesseur. Plus surprenant encore, sur les tâches dites "agentiques", où le modèle doit enchaîner plusieurs étapes d'action autonome, la facture dépasse même celle du Gemini 3.1 Pro, un modèle pourtant positionné dans la gamme supérieure, de 75 %. La raison : Gemini 3.5 Flash nécessite davantage d'étapes d'interaction que tous les concurrents testés.
Cette hausse des coûts n'est pas anodine pour les développeurs et les entreprises qui intègrent ces modèles dans leurs produits. Les applications agentiques, qui multiplient les appels au modèle pour accomplir des tâches complexes, sont précisément celles qui connaissent la croissance la plus rapide. Un modèle plus cher à l'usage peut transformer radicalement l'économie d'un produit, notamment pour les startups qui construisent sur ces API.
Google n'est pas un cas isolé : Anthropic et OpenAI ont suivi la même trajectoire, leurs modèles récents étant sensiblement plus coûteux que leurs prédécesseurs. La tendance reflète une réalité économique inévitable : les investissements colossaux consentis dans l'infrastructure et la recherche doivent commencer à se rentabiliser. L'ère des modèles performants et bon marché semble marquer le pas, et l'industrie entre dans une phase où la puissance se paie au prix fort.
Les startups et développeurs européens qui construisent sur ces API doivent réévaluer l'économie de leurs produits agentiques face à une hausse structurelle des coûts d'inférence.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




