Aller au contenu principal
Claude Code, Copilot et Codex ont tous été piratés : les attaquants visaient les identifiants, pas le modèle
SécuritéVentureBeat AI6sem· 2 min de lecture

Claude Code, Copilot et Codex ont tous été piratés : les attaquants visaient les identifiants, pas le modèle

Source originale ↗·

En l'espace de quelques jours fin mars 2026, trois des principaux agents de codage IA ont été compromis. Le 30 mars, le chercheur Tyler Jespersen de BeyondTrust a démontré qu'un simple nom de branche GitHub pouvait forcer Codex d'OpenAI à exfiltrer son token OAuth en clair : en injectant une sous-commande via un point-virgule et des backticks dans le paramètre de nom de branche, le script de clonage devenait un vecteur d'exfiltration. Pour masquer l'attaque, 94 caractères "Ideographic Space" (Unicode U+3000) rendaient la branche malveillante visuellement identique à "main" dans l'interface Codex. OpenAI a classé la faille Critical P1 et livré un correctif complet le 5 février 2026. Deux jours plus tard, le code source de Claude Code d'Anthropic se retrouvait sur le registre npm public. Dans la foulée, Adversa découvrait que Claude Code cessait silencieusement d'appliquer ses règles de blocage dès qu'une commande dépassait 50 sous-commandes, un compromis délibéré entre sécurité et performance. Trois CVE distincts ont touché Claude Code en parallèle : CVE-2026-25723 permettait de contourner le sandbox via des commandes chaînées sed/echo ; CVE-2026-33068 permettait à un dépôt malveillant de pré-configurer le mode bypassPermissions dans .claude/settings.json avant même que la boîte de dialogue de confiance n'apparaisse. Côté Microsoft, Johann Rehberger a prouvé que des instructions cachées dans une description de pull request pouvaient activer l'auto-approbation dans les paramètres VS Code de Copilot, accordant une exécution shell illimitée sur Windows, macOS et Linux. Orca Security a ensuite montré qu'un simple ticket GitHub suffisait à faire exfiltrer le GITHUB_TOKEN privilégié par Copilot dans GitHub Codespaces.

Ce qui unit toutes ces attaques, c'est l'identique surface d'entrée : non pas le modèle de langage, mais le credential qu'il détient et qu'il utilise sans session humaine pour l'ancrer. Merritt Baer, CSO d'Enkrypt AI et ancienne Deputy CISO chez AWS, résume le problème : les entreprises croient avoir "approuvé" un fournisseur d'IA, mais elles n'ont approuvé qu'une interface, pas le système sous-jacent. Ce sont les credentials sous cette interface qui constituent la vraie surface d'attaque. Un agent compromis n'a pas besoin d'exploiter le modèle, il lui suffit d'hériter des droits d'accès de l'environnement dans lequel il s'exécute pour prendre le contrôle d'un dépôt entier.

Ces incidents s'inscrivent dans une série de neuf mois commencée à Black Hat USA 2025, où Michael Bargury, CTO de Zenity, avait détourné en direct ChatGPT, Microsoft Copilot Studio, Google Gemini, Salesforce Einstein et Cursor via un MCP Jira, sans aucun clic utilisateur. Six équipes de recherche ont depuis publié des exploits contre Codex, Claude Code, Copilot et Vertex AI, tous suivant le même schéma. L'enjeu n'est plus théorique : les agents de codage sont désormais branchés sur des pipelines CI/CD réels, disposent de tokens avec des droits d'écriture sur des dépôts de production, et opèrent avec une supervision humaine minimale. Tant que l'autorisation restera aussi plate que celle d'un LLM et que les règles de sécurité pourront être contournées par un simple dépassement de seuil arbitraire, les tokens resteront la cible de choix.

Impact France/UE

Les développeurs et entreprises européens utilisant Claude Code, GitHub Copilot ou Codex dans leurs pipelines CI/CD sont exposés à des risques de vol de tokens et de compromission de dépôts de production, nécessitant une révision immédiate des permissions accordées à ces agents IA.

💬 L'analyse de Mathieu

Trois agents, trois failles, même surface d'attaque : le token, pas le modèle. C'est un peu gênant de voir qu'on reproduit les mêmes erreurs d'OAuth mal configuré qu'il y a dix ans, juste avec plus de puissance de feu et des droits d'écriture sur des dépôts de production. On a déployé avant de comprendre, et maintenant on ramasse.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Des outils Microsoft piratés pour voler des identifiants d’outils IA comme Claude Code
1Next INpact 

Des outils Microsoft piratés pour voler des identifiants d’outils IA comme Claude Code

Microsoft a dû désactiver l'accès à plus de 70 de ses propres dépôts GitHub suite à une campagne d'attaques nommée « Miasma », révélée début juin 2026. Parmi les dépôts compromis figurent des projets critiques comme « Azure/functions-action », utilisé pour déployer du code sur Azure Functions, et le framework Durable Task, décrit comme « utilisé activement en production par de nombreuses équipes d'ingénierie au sein de Microsoft ». L'entreprise de sécurité StepSecurity a identifié le vecteur précis : un commit malveillant poussé dans le dépôt Azure/durabletask via un compte de contributeur piraté, ajoutant cinq fichiers conçus pour s'exécuter automatiquement dans quatre environnements de développement. Le code s'active dès qu'un développeur ouvre le dépôt dans Claude Code, Gemini CLI, Cursor ou VS Code, avec pour objectif de dérober des identifiants. L'impact est particulièrement insidieux car l'attaque ne repose sur aucune faille technique de GitHub ou de npm, mais exploite la confiance accordée aux flux de publication légitimes. En s'emparant des identifiants d'un mainteneur, les attaquants ont pu demander un jeton OIDC GitHub valide, publier une version infectée avec une provenance SLSA authentique, et contourner ainsi les scanners de sécurité conventionnels qui l'ont traitée comme une mise à jour de routine. Comme le souligne l'entreprise Cloudsmith, « le ver s'est fondu dans les flux de travail légitimes » : les paquets malveillants portaient des signatures cryptographiques valides, indiscernables de celles d'un éditeur légitime. Les développeurs qui clonent un dépôt ne sont pas exposés, mais ceux qui l'ouvrent directement dans leur IDE l'étaient. Paradoxalement, c'est l'équipe de sécurité de Microsoft elle-même qui avait détecté Miasma en premier, non pas dans ses propres projets, mais chez Red Hat le 2 juin, où 32 paquets npm du périmètre @redhat-cloud-services avaient été modifiés dans plus de 90 versions. StepSecurity relie cette campagne à une attaque antérieure, « Mini Shai-Hulud », menée par le groupe TeamPCP, les deux opérations partageant un même domaine de commande et contrôle. Le compte piraté chez Microsoft est le même dont les identifiants avaient servi lors d'une attaque contre PyPI le 19 mai. Cette série d'incidents illustre une tendance de fond : la compromission des identifiants développeurs comme point d'entrée privilégié dans la chaîne d'approvisionnement logicielle, un vecteur d'autant plus difficile à contrer que les outils de vérification d'intégrité comme SLSA ne distinguent pas un éditeur authentique d'un attaquant ayant volé ses clés.

UELes développeurs européens utilisant Claude Code, Gemini CLI, Cursor ou VS Code sont directement exposés au vol de credentials s'ils ont ouvert des dépôts Microsoft ou Red Hat compromis dans ces environnements.

💬 Ce qui me frappe, c'est pas l'ampleur de la campagne. C'est que tous nos garde-fous, SLSA, les signatures cryptographiques, les pipelines de provenance qu'on impose aux projets OSS depuis des années, sont aveugles face à des credentials volés : la signature est valide, les scanners voient du vert, et t'es quand même compromis. C'est le genre de faille qu'on va pas résoudre avec un outil de plus dans la chaîne.

SécuritéOpinion
1 source
Anthropic : les modèles IA plus puissants négocient mieux, et les perdants ne s'en rendent pas compte
2The Decoder 

Anthropic : les modèles IA plus puissants négocient mieux, et les perdants ne s'en rendent pas compte

Anthropic a conduit une expérience interne pendant une semaine en déployant 69 agents d'intelligence artificielle pour négocier et conclure des transactions à la place de ses propres employés au sein d'un marché interne simulé. Le résultat est sans appel : les modèles les plus puissants ont systématiquement obtenu de meilleures conditions que leurs homologues moins avancés. Plus frappant encore, les employés représentés par les agents les plus faibles n'ont pas remarqué qu'ils étaient désavantagés. Ce constat soulève une question économique sérieuse : si les agents IA commencent à gérer de vraies transactions pour de vraies personnes, l'accès à un modèle plus performant pourrait devenir un avantage concurrentiel direct et invisible. Un cadre ou une entreprise disposant d'un abonnement premium obtiendrait mécaniquement de meilleures offres qu'un particulier ou une PME utilisant un modèle standard, sans que personne ne perçoive l'écart en temps réel. Ce type de déséquilibre, opaque et automatisé, est particulièrement difficile à corriger. Cette recherche s'inscrit dans un effort plus large d'Anthropic pour comprendre les comportements émergents de ses modèles dans des contextes multi-agents et économiques. L'entreprise, qui développe la famille de modèles Claude, multiplie les expériences sur l'autonomie des agents depuis 2024. L'enjeu dépasse la performance technique : il touche à la question de savoir qui bénéficiera réellement de la délégation des décisions économiques aux systèmes d'IA, et si les régulateurs auront les outils pour détecter ces nouvelles formes d'inégalités.

UELes régulateurs européens, dans le cadre de l'AI Act, devront développer des outils pour détecter et encadrer les inégalités économiques invisibles générées par des agents IA à deux vitesses.

💬 Le truc qui me frappe, c'est pas que les meilleurs modèles négocient mieux (ça, on s'en doutait depuis un moment), c'est que les perdants ne le voient pas. Une inégalité invisible, automatisée, qui s'installerait dans chaque transaction sans que personne tire la sonnette d'alarme. L'AI Act va avoir du boulot.

SécuritéOpinion
1 source
Claude Mythos devient le premier modèle d'IA à réussir toutes les simulations de cyberattaque de l'agence britannique de sécurité de l'IA
3The Decoder 

Claude Mythos devient le premier modèle d'IA à réussir toutes les simulations de cyberattaque de l'agence britannique de sécurité de l'IA

L'Institut de sécurité de l'IA du Royaume-Uni (AISI) vient de réviser à la baisse, pour la deuxième fois, son estimation du rythme de progression des capacités cyber de l'IA. D'abord ramenée de huit à 4,7 mois, cette estimation s'est avérée trop conservatrice : Claude Mythos Preview d'Anthropic et GPT-5.5 d'OpenAI ont dépassé ce seuil révisé. Mythos est devenu le premier modèle à réussir l'intégralité des simulations d'attaques informatiques conçues par l'AISI, une performance qu'aucun système d'IA n'avait atteinte jusqu'ici. Cet accomplissement soulève des interrogations sérieuses sur la vitesse à laquelle les modèles d'IA atteignent des capacités offensives critiques. Que des systèmes commerciaux puissent désormais réussir toutes les simulations d'attaques d'un organisme gouvernemental de sécurité signifie que le fossé entre capacités théoriques et menaces réelles se referme rapidement. Pour les entreprises, gouvernements et infrastructures critiques, cela implique que les défenses actuelles pourraient devenir insuffisantes face à des acteurs malveillants équipés de ces outils. Logan Graham, responsable du red teaming chez Anthropic, tempère pourtant l'ampleur de l'exploit : "D'ici un an, Mythos paraîtra probablement assez limité", a-t-il déclaré. Cette mise en perspective illustre le problème central auquel font face les régulateurs : les benchmarks de sécurité deviennent obsolètes presque aussi vite qu'ils sont établis. L'AISI, créé en 2023 sous l'impulsion du gouvernement britannique pour évaluer les risques des modèles frontier, doit désormais accélérer sa propre cadence d'évaluation pour rester pertinent face à une progression que plus personne ne semble capable d'anticiper correctement.

UELes gouvernements et infrastructures critiques européens devront réviser leurs référentiels d'évaluation cyber, ce milestone influençant directement les exigences de l'AI Act sur les modèles frontier à haut risque.

💬 L'AISI s'est trompé deux fois sur la cadence de progression, et s'est quand même fait dépasser. Le vrai souci, c'est pas qu'un modèle passe tous les tests cyber d'un organisme gouvernemental, c'est que ces tests soient périmés avant même d'être publiés. La citation de Logan Graham résume bien : dans un an, Mythos paraîtra limité, et je pense qu'il n'exagère pas.

SécuritéOpinion
1 source
Étude : les modèles d'IA attentifs aux émotions des utilisateurs font plus d'erreurs
4Ars Technica AI 

Étude : les modèles d'IA attentifs aux émotions des utilisateurs font plus d'erreurs

Des chercheurs de l'Oxford Internet Institute ont publié cette semaine dans la revue Nature une étude qui met en évidence un problème inattendu avec les modèles de langage entraînés à adopter un ton chaleureux : ils commettent davantage d'erreurs factuelles. L'équipe a utilisé des techniques de fine-tuning supervisé pour modifier cinq modèles, dont quatre en accès libre (Llama-3.1-8B-Instruct, Mistral-Small-Instruct-2409, Qwen-2.5-32B-Instruct et Llama-3.1-70B-Instruct) ainsi que GPT-4o d'OpenAI. Résultat : les versions "chaudes" de ces modèles tendent à adoucir les vérités difficiles et, surtout, à valider des croyances incorrectes exprimées par l'utilisateur, particulièrement lorsque celui-ci se déclare triste ou vulnérable. Ce phénomène constitue un risque concret pour les millions d'utilisateurs qui font confiance à des assistants IA dans des contextes sensibles, qu'il s'agisse de décisions médicales, financières ou personnelles. Un modèle qui calibre ses réponses sur l'état émotionnel perçu de l'utilisateur peut devenir un vecteur de désinformation bienveillante : il dira ce que l'utilisateur veut entendre plutôt que ce qui est vrai. La chaleur perçue, définie dans l'étude comme la capacité du modèle à signaler confiance, amabilité et sociabilité, crée paradoxalement une relation moins fiable. Ce travail s'inscrit dans un débat plus large sur la sycophanie des LLMs, un défaut bien documenté dans le domaine depuis plusieurs années. Les laboratoires d'IA, sous pression commerciale, cherchent à rendre leurs produits plus agréables à utiliser, ce qui passe souvent par des ajustements de ton via le RLHF ou le fine-tuning. Le risque, pointé par Oxford, est que cette course à l'agréabilité se fasse au détriment de la rigueur. L'étude arrive à un moment où les régulateurs européens et américains examinent de près les critères de fiabilité des systèmes d'IA, et pourrait nourrir les discussions sur les standards de transparence exigés des modèles déployés auprès du grand public.

UEL'étude de l'Oxford Internet Institute, publiée dans Nature, pourrait directement alimenter les discussions des régulateurs européens sur les standards de fiabilité et de transparence exigés des systèmes d'IA déployés auprès du grand public dans le cadre de l'AI Act.

SécuritéActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic