5 stratégies pour maîtriser les coûts liés à l'IA en entreprise
Le PDG de Snowflake, Sridhar Ramaswamy, a reconnu publiquement lundi, lors de la conférence annuelle de son entreprise à San Francisco, que les dépenses en intelligence artificielle représentent une source d'inquiétude croissante, même pour les plus grands acteurs du secteur. Snowflake, cliente d'Anthropic, d'OpenAI et d'autres fournisseurs, fait partie des entreprises qui ont développé des stratégies concrètes pour maîtriser ces coûts. Parmi les méthodes les plus répandues, les routeurs de modèles permettent d'orienter automatiquement chaque tâche vers le modèle le moins cher adapté à la situation : Snowflake et Palo Alto Networks ont conçu leurs propres routeurs, et une startup du BTP a utilisé Claude d'Anthropic pour construire le sien, sans que l'outil ne favorise les modèles Anthropic pour autant. L'éditeur de logiciels UiPath a quant à lui réduit de plus de 90 % les coûts de certaines tâches grâce au prompt engineering, en limitant simplement la phase de "réflexion" du modèle avant exécution, selon son directeur de la sécurité Scott Roberts. D'autres entreprises fixent des plafonds de tokens par employé ou réservent les modèles avancés aux profils techniques : chez Zscaler, les ingénieurs logiciels accèdent à OpenAI Codex, mais pas les équipes commerciales ou juridiques.
Ces arbitrages traduisent une prise de conscience généralisée : l'accès illimité aux modèles les plus puissants peut générer des factures incontrôlables sans garantir un retour sur investissement proportionnel. Le vice-président de Zscaler Dhawal Sharma résume la philosophie émergente : "utiliser un très grand modèle pour résoudre un problème simple est un mauvais usage des ressources." Chez Novo Nordisk, l'analyse de données issues d'essais cliniques via Claude d'Anthropic a conduit les équipes à réaliser que la version standard du modèle suffisait dans de nombreux cas, ouvrant la voie à des économies substantielles. Plus largement, certaines entreprises choisissent de revenir à des logiciels traditionnels, plus adaptés aux tâches structurées et répétitives, plutôt que de systématiser le recours à l'IA.
Cette rationalisation intervient alors que les fournisseurs de modèles continuent d'augmenter leurs tarifs, alimentant un débat intense sur la rentabilité réelle de l'IA en entreprise. Les directions informatiques se retrouvent à arbitrer entre la demande des équipes métiers, désireuses d'accéder aux outils les plus performants, et la nécessité de contenir les budgets. Des solutions tierces comme OpenRouter, qui proposent du routage à la demande, commencent à structurer un marché naissant de l'optimisation des coûts IA. À mesure que la concurrence s'intensifie entre fournisseurs, une baisse mécanique des prix est attendue, mais d'ici là, les entreprises qui maîtrisent l'ingénierie des coûts IA pourraient transformer cette contrainte en avantage compétitif durable.
Novo Nordisk (Danemark) est cité comme exemple d'entreprise européenne rationalisant ses coûts IA pour l'analyse de données d'essais cliniques, une tendance directement pertinente pour les DSI européens confrontés aux mêmes pressions budgétaires.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




