
Évaluation de la surveillance de la chaîne de pensée
OpenAI a introduit un nouveau cadre et un ensemble d'évaluations pour la monitorabilité de la chaîne de pensée, couvrant 13 évaluations sur 24 environnements. Ses résultats montrent que surveiller le raisonnement interne d'un modèle est bien plus efficace que de surveiller uniquement les sorties, ouvrant ainsi la voie à un contrôle à grande échelle des systèmes d'IA devenant plus capables.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




