Le classement qu'on ne peut pas manipuler, financé par les entreprises qu'il évalue
Arena (anciennement LM Arena) s'est imposé comme le classement public de référence pour les grands modèles de langage, influençant les levées de fonds, les lancements et les cycles de communication des entreprises IA. Paradoxe notable : ce classement "impossible à manipuler" est financé par les entreprises mêmes qu'il évalue. En seulement sept mois, la startup issue de l'UC Berkeley est devenue l'arbitre incontournable de la compétition entre LLMs frontier.
Les modèles européens comme ceux de Mistral sont soumis à un classement américain financé par leurs concurrents directs, créant un risque de biais structurel défavorable aux acteurs européens dans la course aux LLMs frontier.