OpenAI et Anthropic partagent les résultats d'une évaluation conjointe de sécurité
OpenAI et Anthropic divulguent les résultats d'une première évaluation conjointe de sécurité, examinant mutuellement leurs modèles pour des problèmes tels que la décalage, la suite d'instructions, les hallucinations, le "jailbreaking", etc. Ce partenariat met en lumière les avancées, les défis et l'importance de la collaboration inter-laboratoires.