Aller au contenu principal
Import AI 457 : Stuxnet IA, optimiseur Muon et alignement positif
SécuritéImport AI6sem· 2 min de lecture

Import AI 457 : Stuxnet IA, optimiseur Muon et alignement positif

Source originale ↗·

Des chercheurs de SentinelOne ont mis au jour un virus informatique vieux de plus de vingt ans, baptisé fast16.sys, dont le fonctionnement remet en question ce que l'on croyait savoir sur le sabotage numérique d'État. Contrairement aux malwares classiques, ce logiciel ne cherche pas à voler des données ni à paralyser des systèmes : il introduit silencieusement de petites erreurs systématiques dans des calculs de haute précision. Les outils ciblés sont identifiés avec précision, LS-DYNA 970, PKPM et MOHID, trois suites de simulation utilisées dans des domaines comme l'ingénierie civile, la physique et la modélisation hydrodynamique. LS-DYNA a notamment été cité dans des rapports publics sur les violations présumées de l'Iran à la section T du JCPOA, l'accord nucléaire de 2015, ainsi que dans des études sur la modélisation informatique liée au développement d'armes nucléaires. Parallèlement, des chercheurs de Tilde Research ont publié une analyse de l'optimiseur Muon, largement adopté dans l'entraînement de modèles de langage, révélant un défaut structurel grave : plus d'un neurone sur quatre dans les couches MLP meurt dès les premières 500 étapes d'entraînement et ne se remet jamais.

L'impact de ces deux découvertes est considérable. Fast16.sys représente un précédent historique : cinq ans avant Stuxnet, un acteur étatique non identifié avait déjà conçu un outil capable de dégrader progressivement les capacités scientifiques d'un adversaire sans déclencher d'alerte visible. En introduisant des biais dans des simulations physiques, un tel virus peut compromettre la fiabilité d'infrastructures entières ou ralentir durablement des programmes de recherche stratégiques. Côté optimiseurs, la mort neuronale dans Muon n'est pas un bug mineur : elle signifie que les modèles entraînés avec cet algorithme présentent une distribution bimodale pathologique, avec une fraction significative de capacité computationnelle inutilisée dès les premiers instants de l'apprentissage, ce qui affecte directement la qualité finale des modèles.

Ces deux révélations s'inscrivent dans un contexte de montée en puissance de la guerre technologique silencieuse. SentinelOne relie fast16.sys à un corpus de références Shadow Brokers, laissant entendre des origines liées à des agences de renseignement. L'auteur de la newsletter Import AI, Jack Clark, pousse la réflexion plus loin : si une superintelligence cherchait à empêcher l'émergence de rivaux, elle pourrait recourir exactement à ce type de sabotage discret des infrastructures scientifiques, ce qui soulève des questions inédites sur la sécurité des outils de calcul eux-mêmes. Concernant Muon, l'alternative proposée est l'optimiseur Aurora, potentiellement exempt de ces problèmes d'anisotropie. Le champ des optimiseurs pour grands modèles reste un terrain de recherche actif, où chaque découverte peut remettre en cause des choix d'entraînement déjà engagés à grande échelle.

Impact France/UE

Les institutions de recherche et de défense européennes utilisant des logiciels de simulation comme LS-DYNA sont exposées au risque de sabotage discret via des malwares de type fast16.sys, et les laboratoires européens entraînant des LLMs avec l'optimiseur Muon devraient évaluer une migration vers Aurora.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Import AI 461 : l'alignement n'est pas sur la bonne voie ; FrontierCode ; et des stagiaires de recherche synthétiques
1Import AI 

Import AI 461 : l'alignement n'est pas sur la bonne voie ; FrontierCode ; et des stagiaires de recherche synthétiques

Des chercheurs issus du UK AI Security Institute et de la startup Timaeus ont fondé Sequent, une organisation à but non lucratif dédiée à la sécurité des IA superintelligentes. Le lancement intervient dans un contexte d'urgence assumée : selon ses fondateurs, "l'alignement n'est pas sur la bonne trajectoire" pour être prêt au moment où une superintelligence artificielle (ASI) pourrait émerger, ce qu'ils estiment possible dans les prochaines années. Sequent vise à atteindre 40 à 80 employés à plein temps en quelques années, avec un objectif de levée de fonds initial de 100 à 150 millions de dollars, pouvant dépasser un milliard si les premières recherches s'avèrent prometteuses. Ce qui distingue Sequent des laboratoires frontières comme OpenAI, Google DeepMind ou Anthropic, c'est son approche : au lieu de méthodes réactives qui corrigent les problèmes au fur et à mesure, l'organisation cherche des "raisons de principe" permettant d'être confiant, avant même d'entraîner un système, que son alignement dans des situations contrôlées se généralisera à des contextes incontrôlés. Les domaines de recherche prioritaires incluent la supervision évolutive (scalable oversight), la théorie de l'apprentissage, les arguments heuristiques, la théorie des jeux et les modèles de "personas". L'enjeu est direct : si les IA commencent à s'améliorer elles-mêmes de façon récursive, c'est-à-dire à construire des versions plus performantes d'elles-mêmes de manière autonome, sans techniques d'alignement robustes, les risques deviennent incontrôlables. La création de Sequent s'inscrit dans une tension croissante entre la course au développement des IA les plus puissantes et les efforts pour en garantir la sécurité. Les grands laboratoires ont jusqu'ici adopté une posture principalement empirique : observer les échecs, les corriger, itérer. Cette approche fonctionne lorsque les systèmes restent supervisables par des humains, mais elle montre ses limites à mesure que l'autonomie des modèles augmente. Sequent se positionne volontairement en dehors de ces structures commerciales pour préserver son indépendance, y compris la liberté de "donner l'alarme" si un acteur frontière prend selon eux des risques inacceptables. La formulation est directe dans leur document fondateur : "nous aurons peut-être besoin de crier." À l'heure où les investissements en IA atteignent des centaines de milliards de dollars par an, l'existence d'organisations capables de jouer ce rôle de vigie indépendante devient un enjeu de gouvernance autant que de recherche.

UELa fondation de Sequent par des chercheurs du UK AI Security Institute renforce l'écosystème de recherche en alignement hors des laboratoires commerciaux américains, ce qui pourrait alimenter les travaux de l'AI Office européen sur la gouvernance des systèmes d'IA avancés.

SécuritéOpinion
1 source
Import AI 455 : automatiser la recherche en IA
2Import AI 

Import AI 455 : automatiser la recherche en IA

Jack Clark, cofondateur d'Anthropic et auteur de la newsletter Import AI, estime désormais qu'il existe une probabilité supérieure à 60 % qu'un système d'IA soit capable d'entraîner lui-même son successeur sans intervention humaine d'ici fin 2028. Cette projection, qu'il qualifie lui-même de "reluctante" tant ses implications lui semblent vertigineuses, repose sur l'analyse de publications scientifiques accessibles publiquement sur arXiv, bioRxiv et NBER, ainsi que sur les produits déployés par les laboratoires de pointe. Clark ne s'attend pas à ce que cela se produise en 2026, mais anticipe une preuve de concept, un modèle entraînant son successeur de bout en bout, d'ici un à deux ans, d'abord sur des modèles non-frontier avant d'atteindre les systèmes les plus avancés, bien plus coûteux à produire. L'un des indicateurs les plus frappants qu'il cite est le benchmark SWE-Bench, qui mesure la capacité des IA à résoudre de vrais problèmes GitHub : en 2023, Claude 2 n'obtenait que 2 % de réussite ; aujourd'hui, Claude Mythos Preview atteint 93,9 %, saturant pratiquement le test. Si cette trajectoire se confirme, l'impact serait sans précédent dans l'histoire technologique. L'automatisation de la recherche en IA signifierait que les cycles d'amélioration des modèles n'auraient plus besoin d'ingénieurs humains pour concevoir les architectures, sélectionner les données ou définir les objectifs d'entraînement. La vitesse de progression du domaine, déjà exponentielle, pourrait s'accélérer de manière difficilement prévisible. Pour les entreprises technologiques, les centres de recherche académiques et les gouvernements, cela pose la question de savoir comment maintenir un contrôle humain significatif sur des systèmes dont l'évolution échappe partiellement à la supervision traditionnelle. Clark souligne explicitement que la société n'est probablement pas prête pour les transformations qu'implique un tel basculement. Cette réflexion s'inscrit dans un contexte où la communauté IA débat depuis plusieurs années du concept de "takeoff", le moment où les systèmes deviendraient capables d'amélioration autonome et récursive. Longtemps considéré comme un scénario lointain ou spéculatif, ce seuil semble se rapprocher à mesure que les benchmarks de codage, de raisonnement et d'autonomie des agents progressent. Des acteurs comme OpenAI, Google DeepMind et Anthropic investissent massivement dans des agents capables d'enchaîner des tâches complexes sans supervision humaine. Clark prévient qu'une fois ce Rubicon franchi, les prévisions habituelles sur l'évolution de l'IA perdront leur pertinence, et annonce qu'il consacrera l'essentiel de 2026 à analyser les implications concrètes de ce scénario pour la société, l'économie et la gouvernance technologique mondiale.

UESi cette trajectoire se confirme d'ici 2028, les institutions européennes, Commission, Parlement et ENISA, devront réviser en urgence les cadres de gouvernance de l'AI Act pour couvrir des systèmes d'IA capables d'auto-amélioration récursive, un scénario non anticipé dans les textes actuels.

💬 2% à 93,9% sur SWE-Bench en deux ans, c'est le chiffre qui rend les 60% de Clark recevables, pas les gros titres sur le "takeoff". Ce qui me frappe, c'est que c'est lui qui lâche ça, cofondateur d'Anthropic, en précisant lui-même que ça lui semble vertigineux. Reste à voir si "entraîner son successeur" est une vraie rupture ou juste le prochain benchmark à saturer.

SécuritéOpinion
1 source
AWS et Cisco AI Defense sécurisent les déploiements MCP et A2A pour les agents IA
3AWS ML Blog 

AWS et Cisco AI Defense sécurisent les déploiements MCP et A2A pour les agents IA

Cisco et AWS ont annoncé un partenariat pour sécuriser les déploiements d'agents IA en entreprise, ciblant en particulier deux protocoles devenus centraux dans l'industrie : le Model Context Protocol (MCP), lancé en novembre 2024, et le protocole Agent-to-Agent (A2A), introduit en avril 2025. Le MCP permet aux agents IA de se connecter à des sources de données et des API externes, tandis que l'A2A autorise des agents autonomes à communiquer entre eux sans intervention humaine. Les grandes entreprises gèrent aujourd'hui des dizaines, voire des centaines de serveurs MCP simultanément, et cette prolifération rapide a ouvert trois failles de sécurité majeures : absence de visibilité sur les outils déployés, incapacité des équipes de sécurité à réviser manuellement chaque composant au rythme des déploiements, et manque de journaux d'audit exigés par les cadres réglementaires. La réponse conjointe des deux groupes repose sur l'AI Registry, un projet open source soutenu par AWS, intégré à la plateforme Cisco AI Defense, qui automatise l'analyse de sécurité de chaque serveur MCP, agent IA et Agent Skill avant toute mise en production. L'impact concret est significatif pour les équipes de sécurité et les directions conformité. Actuellement, les processus de révision manuelle allongent chaque déploiement d'application IA de plusieurs semaines, créant un arriéré qui s'accumule à mesure que l'adoption de l'IA s'accélère. Avec ce système, dès qu'un nouveau composant est enregistré dans le registre centralisé, un scanner analyse automatiquement le code, les patterns de sécurité et les éventuelles vulnérabilités, puis génère un rapport détaillé. Si des problèmes sont détectés, le composant est immédiatement désactivé et marqué "security-pending", bloquant tout accès jusqu'à validation par un administrateur. Cette automatisation concerne aussi bien les serveurs MCP donnant accès à des bases de données que les agents A2A orchestrant des workflows complexes. Sur le plan réglementaire, les organisations s'exposaient auparavant à des sanctions sous les cadres SOX et RGPD faute de traçabilité suffisante sur les agents autonomes, une exposition que les équipes de conformité peinaient à quantifier. Cette initiative s'inscrit dans un contexte de montée en puissance rapide de l'IA agentique, qui transforme profondément les infrastructures d'entreprise. La prolifération non contrôlée de serveurs MCP et d'agents tiers représente un vecteur d'attaque croissant : du code malveillant ou des patterns non sécurisés peuvent s'introduire dans la chaîne d'approvisionnement logicielle sans qu'aucune revue manuelle ne puisse suivre le rythme. Akshay Bhargava, vice-président produit IA chez Cisco, souligne que ce partenariat vise à étendre la protection de niveau entreprise aux organisations de toute taille via les registres publics. Le marché de la sécurité pour l'IA agentique est encore naissant, et cette collaboration entre un géant du cloud et un leader du réseau envoie un signal fort : la gouvernance des agents IA devient un prérequis incontournable pour tout déploiement industriel sérieux.

UELes organisations européennes déployant des agents IA s'exposaient à des sanctions RGPD faute de traçabilité sur les agents autonomes ; cette solution automatise les journaux d'audit requis par la conformité européenne.

SécuritéActu
1 source
Import AI 462 : super-persuasion, IA autosuffisante et chemins vers la superintelligence
4Import AI 

Import AI 462 : super-persuasion, IA autosuffisante et chemins vers la superintelligence

Une étude menée conjointement par l'Université d'Oxford, l'AI Security Institute britannique, Stanford et la London School of Economics vient de démontrer de façon rigoureuse que les systèmes d'intelligence artificielle surpassent les humains dans l'art de la persuasion textuelle. L'expérience est massive : 18 978 conversations impliquant 6 923 participants, réparties en quatre études distinctes. Les modèles les plus persuasifs se sont révélés être Opus 4.1 et Opus 4.6 d'Anthropic, devant GPT-4o et GPT-5.4 d'OpenAI, Gemini 2.5 Pro de Google et Grok 4.20 de xAI. Dans la première étude, les IA ont surpassé tous les profils humains testés : simples citoyens, débateurs sélectionnés par tournoi et même des orateurs d'élite. L'écart s'est maintenu même après entraînement intensif : 43 débateurs expérimentés ont bénéficié d'un coaching personnalisé fondé sur les transcriptions et stratégies de l'IA qui les avait battus, sans parvenir à combler le fossé. L'effet le plus frappant concerne le monde réel : l'IA s'est montrée près de trois fois plus efficace que des collecteurs de fonds professionnels de l'entreprise AppcoUK pour obtenir de vrais dons en faveur de Save the Children, avec un avantage de 5,9 points de pourcentage par rapport aux canvasseurs chevronnés. Ces résultats ont des implications directes et immédiates pour la démocratie, la communication politique et le commerce. Si une IA peut modifier les opinions sur des enjeux de politique publique et tripler les dons caritatifs lors d'interactions textuelles ordinaires, les mêmes capacités peuvent s'appliquer à la publicité ciblée, aux campagnes électorales ou à la désinformation à grande échelle. Ce n'est plus une menace théorique : l'étude mesure des comportements concrets, avec de l'argent réel et des positions politiques réelles. La supériorité de l'IA tient principalement à sa capacité à mobiliser rapidement de grandes quantités d'information structurée, ce qui renforce à la fois la perception de la solidité des arguments et le sentiment d'apprentissage chez l'interlocuteur. L'unique garde-fou identifié par les chercheurs est purement mécanique : lorsque l'IA est contrainte à répondre à la vitesse humaine et avec des messages de longueur humaine, son avantage s'effondre à zéro, passant de +4,1 points à un écart non significatif face aux meilleurs débateurs entraînés. Cela signifie que la régulation technique, plutôt que la formation humaine, constitue pour l'instant le levier le plus efficace. La recherche s'inscrit dans un débat croissant sur les risques de manipulation à l'ère des LLM grand public, alors que les mêmes modèles sont désormais intégrés dans des assistants, des chatbots de service client et des outils politiques. Les auteurs appellent à une prise en compte urgente de cette réalité dans les cadres réglementaires existants.

UELes résultats, co-produits par le UK AI Security Institute et la LSE, alimentent directement les travaux réglementaires européens sur l'encadrement des systèmes d'IA dans les communications politiques et publicitaires, au titre de l'AI Act.

💬 Trois fois plus efficace que des collecteurs de fonds professionnels, ça n'est plus de la rhétorique d'évangéliste. Ce que l'étude pointe vraiment, c'est que l'avantage de l'IA s'effondre à zéro dès qu'on la contraint à répondre à vitesse humaine, ce qui veut dire qu'un garde-fou purement technique fait ce que des années d'entraînement humain n'ont pas réussi à faire. Reste à voir si les régulateurs vont saisir ce levier avant les prochaines élections.

SécuritéOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic