
Le crépuscule des chatbots
Voici l'article traduit et résumé selon vos consignes :
Les grands laboratoires américains d'intelligence artificielle publient des modèles à un rythme jamais vu, malgré des interventions gouvernementales ayant temporairement bloqué l'accès à deux des systèmes les plus puissants, Claude Fable et GPT-5.6. Au-delà du rythme des sorties, plusieurs organisations mesurent une accélération réelle des capacités : METR et l'institut britannique AI Security Institute évaluent combien d'heures de travail de programmeur humain une IA peut accomplir en une seule requête, tandis que GDPval compare des experts humains à des IA sur de nombreux métiers grâce à des jurys professionnels. Tous ces indicateurs progressent à un rythme supérieur à l'exponentielle. Epoch a ainsi montré que Claude Opus 4.7, travaillant seul pendant 14 heures, a construit un logiciel équivalent à 2 à 17 semaines de travail d'ingénierie humaine, pour un coût de 251 dollars en tokens. De son côté, l'auteur rapporte avoir vu Claude Fable exécuter de façon autonome, pendant 9 heures, des projets logiciels complexes qui auraient normalement mobilisé une équipe pendant plus d'une semaine. Un second groupe de modèles, dits "en poids ouverts" et tous développés en Chine, suit une courbe de progression similaire mais avec 6 à 12 mois de retard sur les modèles propriétaires américains, comme le montre le test AA-Briefcase qui simule une mission de conseil complexe sur plusieurs semaines.
Cette accélération transforme concrètement la manière dont l'IA est utilisée au travail. Jusqu'à récemment, le modèle dominant était celui de la "co-intelligence" : l'utilisateur demandait une tâche, vérifiait le résultat, puis guidait l'IA étape par étape grâce à des instructions précises et une attention humaine constante. Cette approche reste utile, mais elle cède peu à peu la place à des systèmes IA capables de mener des tâches longues, de s'auto-corriger et de fonctionner sans supervision continue. Pour les entreprises et les professionnels, cela signifie repenser entièrement les flux de travail : l'IA n'est plus seulement un assistant ponctuel mais un exécutant autonome sur des projets de plusieurs heures, avec des implications directes sur la productivité, l'organisation des équipes et le contrôle qualité.
Ces avancées doivent toutefois être nuancées : la frontière des capacités reste "irrégulière", les modèles restant faibles dans certains domaines malgré leurs prouesses ailleurs, et les modèles open source chinois n'atteignent pas toujours les performances suggérées par leurs benchmarks. Pour vraiment juger de la qualité d'un modèle, l'auteur recommande des tests concrets et originaux, comme un exercice où les IA doivent construire une simulation interactive de l'évolution d'un port au fil du temps, révélant des différences marquées en matière de design, de style et de jugement. Cette évolution vers des systèmes IA de plus en plus autonomes sera au cœur du prochain livre de l'auteur, intitulé Co-Existence, qui explorera cette nouvelle façon de travailler aux côtés de l'intelligence artificielle.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




