Le routage entre modèles selon le coût : cinq approches
Face à la hausse des prix des modèles d'IA les plus avancés et à une tendance chez les employés à systématiquement choisir les modèles les plus chers pour la moindre tâche, un nouvel outil gagne en popularité dans les entreprises : le routeur de modèles. Plutôt que de laisser chaque utilisateur sélectionner manuellement un modèle, souvent coûteux, pour répondre à ses questions ou générer du code, ces routeurs analysent la requête et l'orientent automatiquement vers le modèle le plus adapté, en fonction de la complexité réelle de la tâche. Ces solutions prennent des formes variées : produits autonomes vendus par des éditeurs spécialisés, fonctionnalités intégrées par les fournisseurs de cloud, ou encore applications développées en interne par les équipes informatiques elles-mêmes. Des entreprises comme Snowflake et Palo Alto Networks ont confirmé avoir réalisé des économies substantielles en remplaçant, pour certaines tâches, des modèles de pointe par des alternatives moins onéreuses.
L'enjeu est direct : des tâches simples comme résumer des emails ou effectuer une recherche dans des documents peuvent souvent être traitées par des modèles open source ou des versions propriétaires plus anciennes, pour une fraction du coût des modèles les plus récents et les plus puissants. En automatisant ce choix, les routeurs permettent aux entreprises de réduire leurs factures liées à l'IA sans sacrifier significativement la qualité des réponses obtenues, un arbitrage devenu crucial à mesure que les usages internes de l'IA générative se multiplient et que les coûts associés grimpent en conséquence.
Cette dynamique s'inscrit dans un mouvement plus large de maturation du marché de l'IA en entreprise : après une première phase d'adoption tous azimuts des modèles les plus performants, les directions financières et techniques cherchent désormais à rationaliser ces dépenses. Le phénomène de sur-utilisation des modèles chers, parfois qualifié familièrement de "tokenmaxxing", pousse les entreprises à repenser leur architecture d'accès à l'IA. Les fournisseurs de cloud et les éditeurs spécialisés voient dans les routeurs un nouveau segment de marché prometteur, alors que la pression sur les coûts de calcul devrait continuer de s'intensifier avec la diffusion massive des agents IA en entreprise.
Les entreprises europeennes font face aux memes pressions sur les couts de l'IA generative et peuvent adopter ces routeurs pour rationaliser leurs depenses, meme si aucun acteur francais ou europeen n'est cite.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.



