Claude Sonnet 5 d'Anthropic réduit l'écart avec la gamme Opus, plus chère
Voici la traduction/résumé en français (3 paragraphes, sans titres) :
Anthropic a dévoilé Claude Sonnet 5, la dernière évolution de sa gamme de modèles de langage. Selon l'entreprise, ce nouveau modèle surpasse son prédécesseur, Sonnet 4.6, sur l'ensemble des benchmarks utilisés pour l'évaluer. Fait notable, Sonnet 5 devance même Opus 4.8, le modèle haut de gamme et plus coûteux de la même famille, sur le test GDPval-AA v2, qui évalue les compétences en travail de connaissance : il y obtient un score de 1 618 points. Anthropic précise également que Sonnet 5 affiche des résultats nettement inférieurs, sur les tâches liées à la cybersécurité, à ceux des modèles que le gouvernement américain a actuellement interdits pour ce type d'usage.
Cette annonce a une portée qui dépasse la simple mise à jour technique. En rattrapant, voire en dépassant sur certains critères, un modèle plus onéreux, Sonnet 5 permet aux entreprises et développeurs d'obtenir des performances de premier plan à moindre coût, ce qui pourrait redistribuer les usages entre les différentes gammes de modèles d'Anthropic. La mention explicite des scores en cybersécurité n'est pas anodine : elle intervient alors que les autorités américaines examinent de près les capacités offensives de l'intelligence artificielle et envisagent de restreindre l'accès à certains modèles jugés trop performants dans ce domaine.
Ce positionnement s'inscrit dans un contexte plus large de compétition entre laboratoires d'IA, où chaque nouvelle génération de modèle cherche à combiner puissance et maîtrise des risques. En insistant sur le fait que Sonnet 5 reste loin des seuils jugés problématiques par Washington, Anthropic cherche à démontrer sa capacité à proposer des modèles à la fois performants et conformes aux exigences réglementaires émergentes, dans un débat toujours en cours sur l'encadrement des IA les plus avancées.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




