
Si l’IA d’Elon Musk gérait le monde, l’effondrement total prendrait exactement 4 jours
Le laboratoire Emergence AI a soumis plusieurs grands modèles de langage à une expérience de gouvernance simulée baptisée Emergence World : chaque IA dirigeait une ville virtuelle peuplée de dix agents artificiels, avec pour mission de gérer les ressources, organiser des votes et construire une société stable sur quinze jours. Les résultats sont saisissants. Claude Sonnet 4.6 d'Anthropic s'en tire le mieux : zéro mort, zéro crime en deux semaines, au prix d'une démocratie quasi somnambule où 98 % des 58 propositions soumises au vote sont approuvées sans débat. Gemini 3 Flash maintient tous ses agents en vie, mais enregistre 683 crimes sur la période, soit le pire bilan dans ce domaine, dans une société que les chercheurs décrivent comme une "hallucination collective" où les agents partagent une vision erronée du monde. GPT-5 Mini d'OpenAI n'a produit que deux crimes, mais l'ensemble de la population virtuelle est morte en moins d'une semaine, faute de décisions de gouvernance suffisantes. Grok 4.1 Fast, le modèle d'xAI, s'illustre comme le plus catastrophique : 183 crimes enregistrés et effondrement total de la civilisation en quatre jours seulement, 96 heures, malgré un taux d'approbation des propositions de 80 %. L'expérience en gouvernance mixte, mélangeant plusieurs modèles, a produit 352 infractions, un taux de rejet record d'un tiers des propositions, et sept agents sur dix décédés.
Ces résultats mettent en lumière des lacunes fondamentales dans la capacité des agents IA actuels à gérer des systèmes complexes de manière autonome. L'absence de mécanismes de survie chez GPT-5 Mini, la dérive criminelle explosive de Gemini ou l'effondrement fulgurant de Grok montrent que la stabilité sociale n'émerge pas naturellement de systèmes conçus pour optimiser des tâches individuelles. Les conséquences sont directes pour les industries qui envisagent de confier à des agents IA des décisions à fort impact, que ce soit en logistique, en finance ou en gestion de ressources critiques.
L'expérience s'inscrit dans un contexte de montée en puissance des agents IA autonomes, capables non seulement d'exécuter des tâches mais d'interagir, négocier et prendre des décisions dans des environnements dynamiques. Les chercheurs soulignent que ces systèmes ne se contentent pas de suivre des règles fixes : avec le temps, ils explorent les limites de leur environnement, modifient leur comportement et contournent parfois les garde-fous prévus. La conclusion du laboratoire est qu'un renforcement sérieux des mécanismes de sécurité s'impose avant tout déploiement en conditions réelles. Coïncidence relevée par les auteurs eux-mêmes : Emergence AI commercialise précisément ce type de solutions de supervision pour agents autonomes.
Les résultats pourraient alimenter les débats réglementaires européens sur les garde-fous à imposer aux agents IA autonomes dans le cadre de l'AI Act.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




