IA : qu’est-ce que l’« adversarial distillation » que ANTHROPIC reproche à ALIBABA ?
Anthropic a adressé en juin 2026 une lettre formelle à Alibaba, révélée par Bloomberg, accusant le géant chinois d'avoir orchestré entre avril et juin 2026 une campagne d'« adversarial distillation » contre son modèle Claude. Cette technique consiste à soumettre massivement des requêtes à un modèle cible afin de collecter ses réponses, puis d'utiliser ces paires question-réponse pour entraîner un modèle concurrent, en extrayant ainsi les capacités du modèle original sans licence ni accord. Concrètement, Alibaba aurait fait générer à Claude des milliers de sorties structurées pour alimenter l'entraînement de ses propres LLM.
L'enjeu est considérable : les grands modèles de langage représentent des investissements de plusieurs centaines de millions de dollars. Si une entreprise peut en distiller les capacités à moindre coût, elle contourne des années de recherche et des milliards dépensés en calcul. Pour Anthropic, cette pratique constitue une violation directe de ses conditions d'utilisation et potentiellement une atteinte à la propriété intellectuelle. Elle fragilise aussi le modèle économique des labos occidentaux qui misent sur des API commerciales pour financer leur R&D de sécurité.
Ce conflit s'inscrit dans une tension géopolitique plus large autour des modèles frontier : Alibaba a publié en 2025-2026 plusieurs versions de sa série Qwen qui talonnent ou dépassent Claude sur certains benchmarks. La question de savoir comment les tribunaux américains qualifieront l'adversarial distillation, vol de données d'entraînement, violation contractuelle ou concurrence déloyale, est désormais posée, sans précédent juridique clair à ce stade.
Les entreprises et labos européens développant ou commercialisant des LLMs via API pourraient être contraints de renforcer leurs CGU et mécanismes de détection face à cette pratique, selon l'issue juridique aux États-Unis.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




