BusinessThe Information AI · 2 juin 2026, 20:31· 2 min de lecture

5 stratégies pour maîtriser les coûts liés à l'IA en entreprise

Le PDG de Snowflake, Sridhar Ramaswamy, a reconnu publiquement lundi, lors de la conférence annuelle de son entreprise à San Francisco, que les dépenses en intelligence artificielle représentent une source d'inquiétude croissante, même pour les plus grands acteurs du secteur. Snowflake, cliente d'Anthropic, d'OpenAI et d'autres fournisseurs, fait partie des entreprises qui ont développé des stratégies concrètes pour maîtriser ces coûts. Parmi les méthodes les plus répandues, les routeurs de modèles permettent d'orienter automatiquement chaque tâche vers le modèle le moins cher adapté à la situation : Snowflake et Palo Alto Networks ont conçu leurs propres routeurs, et une startup du BTP a utilisé Claude d'Anthropic pour construire le sien, sans que l'outil ne favorise les modèles Anthropic pour autant. L'éditeur de logiciels UiPath a quant à lui réduit de plus de 90 % les coûts de certaines tâches grâce au prompt engineering, en limitant simplement la phase de "réflexion" du modèle avant exécution, selon son directeur de la sécurité Scott Roberts. D'autres entreprises fixent des plafonds de tokens par employé ou réservent les modèles avancés aux profils techniques : chez Zscaler, les ingénieurs logiciels accèdent à OpenAI Codex, mais pas les équipes commerciales ou juridiques.

Ces arbitrages traduisent une prise de conscience généralisée : l'accès illimité aux modèles les plus puissants peut générer des factures incontrôlables sans garantir un retour sur investissement proportionnel. Le vice-président de Zscaler Dhawal Sharma résume la philosophie émergente : "utiliser un très grand modèle pour résoudre un problème simple est un mauvais usage des ressources." Chez Novo Nordisk, l'analyse de données issues d'essais cliniques via Claude d'Anthropic a conduit les équipes à réaliser que la version standard du modèle suffisait dans de nombreux cas, ouvrant la voie à des économies substantielles. Plus largement, certaines entreprises choisissent de revenir à des logiciels traditionnels, plus adaptés aux tâches structurées et répétitives, plutôt que de systématiser le recours à l'IA.

Cette rationalisation intervient alors que les fournisseurs de modèles continuent d'augmenter leurs tarifs, alimentant un débat intense sur la rentabilité réelle de l'IA en entreprise. Les directions informatiques se retrouvent à arbitrer entre la demande des équipes métiers, désireuses d'accéder aux outils les plus performants, et la nécessité de contenir les budgets. Des solutions tierces comme OpenRouter, qui proposent du routage à la demande, commencent à structurer un marché naissant de l'optimisation des coûts IA. À mesure que la concurrence s'intensifie entre fournisseurs, une baisse mécanique des prix est attendue, mais d'ici là, les entreprises qui maîtrisent l'ingénierie des coûts IA pourraient transformer cette contrainte en avantage compétitif durable.

Impact France/UE

Novo Nordisk (Danemark) est cité comme exemple d'entreprise européenne rationalisant ses coûts IA pour l'analyse de données d'essais cliniques, une tendance directement pertinente pour les DSI européens confrontés aux mêmes pressions budgétaires.

Dans nos dossiers

Anthropic OpenAI Codex

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AI News

KPMG dévoile sa stratégie d'agents IA pour améliorer les marges des entreprises

Malgré des budgets IA en forte hausse, seules 11 % des grandes entreprises mondiales ont atteint un stade de déploiement d'agents IA produisant des résultats à l'échelle de l'organisation, selon le premier baromètre trimestriel Global AI Pulse de KPMG, publié début 2026. L'enquête révèle que les entreprises prévoient en moyenne de dépenser 186 millions de dollars sur les douze prochains mois en intelligence artificielle — 245 millions pour la région Asie-Pacifique, 207 millions pour les États-Unis, 157 millions pour la zone EMEA. Pourtant, 64 % des répondants déclarent obtenir des résultats « significatifs », un qualificatif que KPMG juge trompeur : entre des gains de productivité marginaux et une transformation opérationnelle capable de peser sur les marges, l'écart reste, pour la majorité, considérable. Le vrai enseignement du rapport est la fracture entre les « leaders IA » — les organisations qui déploient des agents autonomes capables de coordonner des tâches entre fonctions, de prendre des décisions sans validation humaine à chaque étape, et d'identifier des anomalies en quasi-temps réel — et tout le reste. Parmi ces leaders, 82 % disent obtenir de la valeur concrète de l'IA, contre 62 % pour les autres entreprises. Cet écart de 20 points cache une différence de philosophie radicale : les retardataires ont superposé des outils IA (copilotes, résumés automatiques) à leurs processus existants sans les repenser, générant des améliorations ponctuelles. Les leaders ont fait l'inverse — ils ont d'abord redessiné leurs processus, puis déployé les agents pour les opérer. En ingénierie informatique, 75 % des leaders utilisent des agents pour accélérer le développement logiciel, contre 64 % pour leurs pairs ; en opérations et supply chain, l'écart est de 64 % contre 55 %. Ce ne sont pas des différences d'adoption d'outils, mais de réarchitecture profonde. Ce rapport s'inscrit dans un mouvement de fond : depuis 2023, les grandes entreprises ont massivement investi dans des modèles de langage, mais la pression monte pour justifier ces dépenses auprès des conseils d'administration. Steve Chase, directeur mondial de l'IA chez KPMG International, résume : « Dépenser plus pour l'IA n'est pas synonyme de créer de la valeur. » La vraie question posée par ces 186 millions de budget moyen n'est pas leur montant, mais leur affectation : quelle part va à l'infrastructure opérationnelle nécessaire pour extraire de la valeur des modèles eux-mêmes, plutôt qu'aux seules licences et à la puissance de calcul ? Sur un horizon de trois à cinq ans, la réponse à cette question pourrait devenir la principale variable de compétitivité dans plusieurs secteurs industriels.

UELa zone EMEA affiche un budget IA moyen de 157 millions de dollars, inférieur aux États-Unis (207 M$) et à l'Asie-Pacifique (245 M$), signalant un risque de décrochage compétitif pour les entreprises européennes si elles ne passent pas à une logique de réarchitecture des processus.

BusinessActu

1 source

2Le Big Data

Fujitsu intègre OpenAI à sa stratégie IA pour les entreprises japonaises

Le 27 mai 2026, Fujitsu a officialisé un partenariat stratégique avec OpenAI pour intégrer ChatGPT Enterprise et Codex à ses services destinés aux entreprises japonaises. Le géant technologique, qui compte parmi les plus grands groupes IT du pays, prévoit de déployer ces outils aussi bien en interne que dans ses offres clients. Les équipes de développement logiciel, de gestion de projets, d'opérations et de livraison de services seront les premières concernées. Fujitsu cible en priorité trois secteurs : l'industrie manufacturière, la santé et la pharmacie, des domaines soumis à une pression croissante sur l'efficacité opérationnelle et l'automatisation des processus. Ce partenariat répond à une question devenue centrale pour les grandes entreprises : comment faire de l'IA une véritable infrastructure métier plutôt qu'une vitrine technologique ? Pour y répondre, Fujitsu s'appuie sur son modèle FDE (Forward Deployed Engineer), une méthode de travail qui associe étroitement experts sectoriels, ingénieurs et clients pour identifier rapidement des cas d'usage exploitables. En combinant cette approche terrain avec les modèles d'OpenAI, le groupe vise à réduire le fossé persistant entre démonstrations technologiques et création réelle de valeur. L'objectif affiché est de construire un modèle de collaboration entre employés et agents IA capable de standardiser des tâches complexes et d'accélérer les cycles de décision. La cybersécurité constitue un second axe prioritaire : face à la multiplication des menaces et à la complexité des infrastructures critiques, Fujitsu entend développer des dispositifs de cyberdéfense hybrides où humains et IA travaillent conjointement pour améliorer la détection et la vitesse de réponse aux incidents. Ce rapprochement s'inscrit dans un contexte japonais particulier : le vieillissement démographique accéléré et la pénurie structurelle de talents techniques font de l'automatisation intelligente un enjeu économique de premier ordre pour les industriels du pays. Fujitsu dispose d'une implantation historique profonde dans le tissu industriel japonais, ce qui lui confère un avantage réel pour déployer des solutions à grande échelle. Du côté d'OpenAI, ce partenariat confirme une stratégie d'expansion agressive vers les marchés enterprise en Asie, après des accords similaires avec des acteurs majeurs en Europe et aux États-Unis. L'alliance illustre aussi une tendance de fond : les éditeurs d'IA générative ne cherchent plus à vendre des modèles bruts, mais à s'ancrer dans des écosystèmes sectoriels via des partenaires locaux disposant de la légitimité et de la connaissance métier que les modèles seuls ne peuvent pas apporter.

💬 Le contexte japonais, ça change la lecture. Pénurie structurelle de talents, démographie qui s'effondre : les industriels là-bas n'ont pas cinq ans devant eux pour tâtonner avec l'IA. Ce qui m'intéresse dans ce deal, c'est le modèle FDE, cette méthode d'embarquer des ingénieurs directement chez les clients pour trouver les cas d'usage qui tiennent en prod, pas ceux qui brillent en démo.

BusinessOpinion

1 source

3Le Big Data

IA en entreprise : sans méthode, les coûts dépassent les bénéfices

Tristan Duranté, cofondateur du cabinet Studeria et spécialiste de l'intelligence artificielle appliquée, alerte sur un décalage croissant entre l'équipement des entreprises françaises en outils d'IA générative et leur capacité réelle à en tirer des bénéfices mesurables. Selon lui, les logiciels dotés d'intelligence artificielle se sont diffusés dans la quasi-totalité des fonctions de l'entreprise, de la rédaction à la recherche documentaire en passant par l'automatisation des tâches administratives, mais cette diffusion technologique n'a pas été accompagnée d'une transformation équivalente des méthodes de travail. Beaucoup d'organisations, notamment des PME, multiplient les essais de solutions différentes sans revoir leurs processus internes, ce qui limite l'exploitation réelle des investissements consentis dans la recherche et l'innovation. L'expert pointe aussi la montée de ce qu'il appelle la « shadow AI », c'est-à-dire l'usage par les salariés d'outils d'intelligence artificielle non validés ni encadrés par leur employeur, un phénomène favorisé par la simplicité d'accès aux assistants conversationnels et aux générateurs de contenus. Ce constat a des implications concrètes pour les directions d'entreprise qui accumulent abonnements et licences sans stratégie de données définie en amont. Tristan Duranté résume la situation en soulignant qu'« accumuler des licences technologiques sans stratégie de données préalable ne garantit aucun retour sur investissement ». En clair, les dépenses en outils d'IA s'accumulent tandis que les gains de productivité restent difficiles à quantifier, faute de gouvernance claire sur l'usage des données et sur la cohérence des pratiques entre équipes. La généralisation de la shadow AI ajoute un risque supplémentaire, celui de la confidentialité des données sensibles de l'entreprise et du non-respect d'obligations réglementaires, à un moment où les cadres juridiques autour de l'intelligence artificielle se précisent en Europe. Pour les dirigeants, l'enjeu n'est donc plus seulement de s'équiper, mais de structurer l'adoption de ces outils pour que les investissements se traduisent réellement en performance. Ce diagnostic s'inscrit dans un contexte où les projets d'intelligence artificielle en entreprise restent encore majoritairement pilotés par les équipes techniques, alors que les usages concernent tout autant les ressources humaines, les fonctions commerciales, le marketing ou les services administratifs, ces métiers étant les premiers concernés par les processus que l'IA vise à transformer. Tristan Duranté plaide pour la diffusion d'une véritable culture de l'intelligence artificielle à l'échelle de toute l'organisation, ce qui suppose un travail préalable sur la qualité des données, une révision des procédures internes et des formations adaptées à chaque métier plutôt qu'à la seule direction informatique. Selon lui, les entreprises qui engagent dès maintenant cette montée en compétences prendront une avance durable, alors que les usages de l'intelligence artificielle sont appelés à devenir de plus en plus structurants dans les années à venir pour l'ensemble des secteurs économiques.

UEConcerne directement les PME et entreprises françaises, confrontées à un manque de gouvernance des données face à un cadre réglementaire européen sur l'IA qui se précise.

BusinessOpinion

1 source

4Le Big Data

Mistral rejoint Harvey pour les usages IA en entreprise

Harvey, la plateforme d'intelligence artificielle dédiée au secteur juridique, a officialisé le 26 mai 2026 un partenariat avec Mistral AI pour intégrer les modèles de la startup française à son environnement multi-modèles. Ce lancement cible en priorité les clients européens de Harvey, dont la plateforme permet déjà aux cabinets d'avocats et directions juridiques d'automatiser des tâches complexes : analyse contractuelle, recherche documentaire, synthèse de dossiers, assistance à la rédaction. L'ajout de Mistral enrichit ce dispositif en proposant une couche supplémentaire de personnalisation, notamment grâce aux capacités multilingues de la startup française, sa gestion des contextes longs et son efficacité d'exécution sur de grands volumes de documents multi-juridictions. Harvey précise que ce déploiement accompagne l'ouverture récente de son bureau parisien et le renforcement de ses investissements en France et dans l'Union européenne. Ce partenariat répond à une évolution profonde des attentes des grandes entreprises vis-à-vis de l'IA générative. Transparence des modèles, localisation des données, conformité réglementaire et gouvernance ne sont plus des options mais des critères décisifs, en particulier dans des secteurs sensibles comme le droit. Les modèles Mistral sont reconnus pour leur approche "open-weight", qui offre une visibilité accrue sur le fonctionnement et l'évaluation des systèmes, un atout de poids pour des organisations soumises à des obligations strictes en matière de sécurité et de conformité. Harvey ne cherche pas à remplacer un fournisseur d'IA par un autre : sa plateforme est conçue pour sélectionner automatiquement le modèle le plus adapté à chaque tâche, construisant ainsi une architecture résiliente et performante pour ses clients entreprises. Ce mouvement s'inscrit dans un contexte plus large de souveraineté technologique en Europe, où les acteurs locaux comme Mistral gagnent rapidement en crédibilité face aux géants américains. Les entreprises européennes ne se contentent plus de chercher les modèles les plus puissants : elles veulent savoir où transitent leurs données, quels modèles les traitent et dans quelles conditions ces systèmes sont déployés. Harvey, dont la plateforme multi-modèles inclut déjà des solutions de plusieurs grands fournisseurs, positionne Mistral comme la réponse naturelle aux exigences du marché européen. Le partenariat marque ainsi une étape dans la stratégie d'expansion européenne de l'éditeur américain, tout en consolidant la place de Mistral comme acteur incontournable de l'IA d'entreprise sur le Vieux Continent.

UELe déploiement de Mistral chez Harvey cible directement les clients européens du secteur juridique, renforçant la souveraineté technologique de l'UE en offrant aux cabinets d'avocats et directions juridiques européens un modèle français conforme RGPD et AI Act pour traiter leurs données sensibles.

💬 Mistral dans le juridique, c'était couru d'avance. Un cabinet d'avocats qui traite des dossiers clients via GPT-4 sur des serveurs américains, ça fait frémir les RSSI, donc là l'argument souveraineté pèse vraiment. Harvey a pigé que pour exister en Europe, il fallait jouer cette carte.

BusinessOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic