Des ingénieurs Amazon distilleraient les modèles Anthropic pour réduire les coûts avant la nouvelle tarification par token
Des ingénieurs d'Amazon sont en train de distiller les modèles d'Anthropic pour en créer des versions plus légères et moins coûteuses, destinées à un usage interne. Cette initiative intervient avant un changement de modèle tarifaire prévu pour l'an prochain : Amazon paiera alors ses accès aux modèles d'Anthropic à la consommation de tokens, et non plus à l'heure de calcul. Selon les informations rapportées par The Decoder, cette transition pourrait faire grimper significativement la facture pour le géant du e-commerce, qui utilise massivement ces modèles dans ses propres outils et services.
La distillation de modèles est une technique qui consiste à entraîner un modèle plus compact à imiter le comportement d'un modèle plus grand, en reproduisant ses sorties plutôt que ses paramètres internes. Le résultat est un modèle moins puissant mais nettement moins gourmand en ressources. Pour Amazon, qui déploie des capacités d'IA à grande échelle en interne, réduire le coût par requête représente un enjeu financier considérable. La société explore également des alternatives, dont les modèles d'OpenAI, ce qui suggère une volonté de ne pas se retrouver trop dépendante d'un seul fournisseur.
Cette situation révèle une tension croissante entre les grands hyperscalers et leurs fournisseurs de modèles. Amazon a investi plus de quatre milliards de dollars dans Anthropic depuis 2023, faisant du partenariat l'un des plus importants de l'industrie. Mais l'intérêt stratégique et les impératifs économiques divergent : quand les coûts d'utilisation deviennent trop élevés, même les partenaires investisseurs cherchent à contourner la dépendance. Cette dynamique pourrait accélérer la tendance des grandes entreprises tech à développer ou adapter leurs propres modèles en interne.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.



