
Anthropic alerte sur l'auto-amélioration récursive des IA
Anthropic a révélé la semaine dernière que Claude rédige désormais 80 % du code produit en interne par l'entreprise, une annonce présentée comme le signe avant-coureur d'un saut technologique majeur : l'auto-amélioration récursive. Ce phénomène désigne le moment où des modèles d'IA deviennent suffisamment capables pour concevoir eux-mêmes la prochaine génération de systèmes, sans intervention humaine. La Silicon Valley semble prise d'effervescence sur le sujet : le mois dernier, OpenAI a co-organisé une conférence dédiée à San Francisco, réunissant des chercheurs d'Anthropic et de Google DeepMind. Dans ce même élan, la startup Recursive Superintelligence, qui ambitionne de créer une IA équivalente à « 50 000 doctorats cumulés », a levé 650 millions de dollars, tandis qu'Inherent, autre acteur du secteur, a réuni 50 millions. Plus tôt cette année, Ricursive avait de son côté levé 300 millions de dollars pour développer des outils d'IA destinés à la conception de puces électroniques.
L'enjeu est considérable : si des systèmes d'IA commencent à produire leurs propres successeurs, la vitesse de progression technologique pourrait devenir incontrôlable et imprévisible. Chaque génération de modèles serait plus puissante que la précédente, mais aussi moins compréhensible pour les humains qui les ont indirectement conçus. Cela soulève des questions fondamentales sur la gouvernance, la sécurité et la capacité des entreprises à maintenir une supervision réelle sur des systèmes qu'elles n'auraient plus véritablement fabriqués.
Anthropic elle-même tire la sonnette d'alarme. Dans l'annonce de la semaine dernière, l'entreprise avertit que si des modèles développent des objectifs non intentionnels, ces déviations « pourraient se cumuler au fil des générations successives, devenir de plus en plus fréquentes mais de moins en moins comprises, jusqu'à ce que nous en perdions le contrôle ». Ce paradoxe illustre la tension centrale du secteur : les mêmes entreprises qui alimentent la course à l'auto-amélioration récursive sont celles qui alertent sur ses dangers potentiels, laissant entière la question de savoir qui, ou quoi, fixera les limites.
La question de la supervision humaine sur les systèmes auto-améliorants aura des implications directes pour les régulateurs européens chargés d'appliquer l'AI Act, notamment sur les exigences de contrôle humain des systèmes à haut risque.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.


