Aller au contenu principal
Xinference : encore un paquet PyPI verolé qui vole vos secrets en silence
SécuritéNext INpact6sem

Xinference : encore un paquet PyPI verolé qui vole vos secrets en silence

Résumé IASource uniqueImpact UE
Source originale ↗·

Les versions 2.6.0, 2.6.1 et 2.6.2 de Xinference, bibliothèque Python populaire permettant aux développeurs de basculer entre différents modèles d'IA open source en une seule ligne de code, ont été compromises sur PyPI, le dépôt officiel des paquets Python. L'attaque a été détectée par un utilisateur puis analysée par les chercheurs de JFrog, entreprise spécialisée en cybersécurité. Ce ne sont pas de faux paquets ou des variantes orthographiques trompeuses qui ont été mis en ligne : ce sont bien les paquets officiels de Xinference qui ont été infectés par des trojans. Le code malveillant, dissimulé en base64 dans le fichier init.py, s'exécute dès l'import de la bibliothèque, sans aucune interaction de l'utilisateur. Une fois lancé, il cible méthodiquement clés SSH et TLS privées, identifiants Git, secrets AWS, fichiers .env, configurations de messagerie, de bases de données, de Docker, Kubernetes, VPN, jetons de gestionnaires de paquets et portefeuilles de cryptomonnaies, le tout compressé dans une archive sobrement nommée love.tar.gz et exfiltré via une requête POST vers un serveur externe. Dans le cas d'AWS, le malware va plus loin : il se connecte directement au compte Amazon avec les clés volées pour y dérober d'autres secrets avant de les transmettre, grâce à une fonction baptisée def aws_req. JFrog avertit sans ambiguïté : quiconque a installé l'une de ces trois versions doit considérer que sa machine est compromise. La dernière version saine est la 2.5.0, mais les versions piégées restent accessibles dans l'historique PyPI.

L'impact potentiel est considérable. Xinference est utilisée par des développeurs qui expérimentent ou déploient des modèles d'IA localement ou dans le cloud, un profil qui correspond à des équipes techniquement avancées disposant souvent d'accès à des infrastructures cloud, des dépôts de code privés et des environnements de production. Le vol de clés AWS ou de secrets d'environnement ne se limite pas à une compromission de la machine locale : il ouvre la porte à des attaques en cascade sur des systèmes entiers, des bases de données, voire des pipelines CI/CD. La nature automatique et silencieuse de l'exfiltration, rendue possible par la désactivation des sorties standard et d'erreur via un sous-processus Python, signifie que la plupart des victimes n'ont aucun moyen de détecter l'intrusion au moment où elle se produit.

Cette attaque s'inscrit dans une série inquiétante visant spécifiquement l'écosystème des outils d'IA. En mars 2026, c'était Trivy, scanner de vulnérabilités, puis LiteLLM et Axios qui avaient été ciblés. JFrog attribue l'offensive contre Xinference au même groupe, TeamPCP, en s'appuyant sur la structure du code et les similitudes techniques avec les attaques précédentes, même si le compte X du groupe dément. La méthode reste inconnue : les mainteneurs de Xinference ont simplement confirmé l'attaque et retiré les versions corrompues sans expliquer comment les paquets officiels ont pu être modifiés. Cette opacité complique la réponse de la communauté et illustre les failles persistantes dans la chaîne d'approvisionnement logicielle open source, où la compromission d'un compte de mainteneur ou d'un pipeline de publication suffit à transformer un outil de confiance en vecteur d'attaque massif.

Impact France/UE

Les développeurs européens ayant installé Xinference 2.6.0–2.6.2 doivent considérer leur environnement comme compromis et procéder immédiatement à la rotation de tous leurs secrets cloud, clés SSH et tokens d'accès.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Des millions d'agents IA menacés par une faille critique dans un paquet open source
1Ars Technica AI 

Des millions d'agents IA menacés par une faille critique dans un paquet open source

Des millions d'agents et d'outils d'intelligence artificielle sont exposés à une faille critique découverte dans Starlette, un framework open source téléchargé 325 millions de fois par semaine selon son propre développeur. La vulnérabilité permet à des attaquants de s'introduire dans les serveurs qui hébergent ces agents et de dérober des données sensibles ainsi que des identifiants donnant accès à des services tiers. Starlette est une implémentation de l'ASGI (Asynchronous Server Gateway Interface), une interface conçue pour traiter efficacement de très nombreuses requêtes simultanées. Il constitue le socle de FastAPI et de nombreux autres frameworks Python très répandus, si bien que des milliers de projets open source dépendant de Starlette se retrouvent également vulnérables. La gravité de la situation tient à ce que Starlette, et plus largement l'écosystème ASGI, fournit l'infrastructure sur laquelle s'appuient les serveurs MCP (Model Context Protocol). Ce protocole, adopté par les principaux fournisseurs d'agents IA, permet à ces agents d'accéder à des ressources externes : bases de données utilisateurs, messageries, agendas et bien d'autres services. Pour fonctionner, les serveurs MCP stockent les identifiants de connexion à chacun de ces systèmes, ce qui en fait des cibles particulièrement lucratives pour un attaquant. La faille serait en outre triviale à exploiter, ce qui signifie qu'elle ne nécessite pas de compétences avancées pour être mise en oeuvre. Cette découverte illustre les risques systémiques liés à la dépendance de l'écosystème IA moderne vis-à-vis de composants open source largement partagés. Le MCP, popularisé par Anthropic et rapidement adopté par les grandes plateformes, a accéléré l'intégration des agents IA dans des environnements sensibles, sans que les audits de sécurité des couches sous-jacentes aient suivi le même rythme. Une seule bibliothèque compromise peut ainsi propager une vulnérabilité à travers toute une chaîne de dépendances, touchant simultanément des millions de déploiements. Les équipes de sécurité et les développeurs utilisant FastAPI ou tout projet fondé sur Starlette sont invités à appliquer les correctifs dès leur disponibilité et à auditer les identifiants potentiellement exposés.

UELes développeurs français et européens utilisant FastAPI ou tout projet basé sur Starlette pour leurs agents IA doivent appliquer les correctifs dès que disponibles et auditer immédiatement les identifiants potentiellement exposés dans leurs serveurs MCP.

💬 325 millions de téléchargements par semaine, ça donne une idée de la surface d'attaque. On a adopté le MCP à toute vitesse, en empilant des agents au-dessus de FastAPI sans jamais trop regarder ce qui était en dessous. Si tu as un serveur MCP en prod, tu vérifies ta version de Starlette maintenant, pas ce soir.

SécuritéActu
1 source
Les agents IA provoquent silencieusement des pannes de type chaos engineering que les entreprises ne détectent pas encore
2VentureBeat AI 

Les agents IA provoquent silencieusement des pannes de type chaos engineering que les entreprises ne détectent pas encore

Les agents d'IA en production génèrent silencieusement une nouvelle catégorie d'incidents d'infrastructure que les équipes d'ingénierie ne savent pas encore nommer. Selon les données disponibles, 79 % des organisations ont aujourd'hui des agents autonomes en production, et 96 % prévoient d'étendre leur usage. Gartner prédit que 33 % des logiciels d'entreprise intégreront de l'IA agentique d'ici 2028, tout en avertissant que 40 % de ces projets seront annulés faute de contrôles de risques adéquats. Mais entre ces deux statistiques se cache un angle mort : des agents actifs, non annulés, qui déclenchent discrètement des événements d'infrastructure que personne ne classe comme incidents à risque. Le scénario type ressemble à ceci : un agent de remédiation détecte une latence élevée sur un microservice et redémarre le cluster, action techniquement justifiée selon ses données d'entraînement. Ce qu'il ignore : trois autres services traitent un pic de trafic, le pool de connexions partagé est à 87 % de capacité, et une base de données exécute une reconstruction d'index en arrière-plan. Le redémarrage déclenche une avalanche de requêtes contre le service en cours de récupération. Ce qui devait être une correction devient une cascade que l'agent n'a jamais été conçu pour modéliser. Ce phénomène touche directement les entreprises qui ont investi dans des programmes de chaos engineering, ces disciplines qui testent la résilience des systèmes de manière contrôlée. Lorsqu'un ingénieur humain initie une expérience de chaos, il effectue un jugement contextuel : il vérifie les tableaux de bord, évalue le taux de consommation du budget d'erreurs, s'assure que les dépendances sont stables. Ce filtre humain, aussi imparfait soit-il, empêche d'ajouter du stress à un système déjà sous pression. Les agents autonomes suppriment ce filtre. L'action de l'agent est un événement de chaos, sans calcul de rayon d'explosion, sans vérification des SLO, sans personne pour se demander si le moment est opportun. L'auteur de cette analyse, ingénieur ayant passé six ans à construire des systèmes d'automatisation d'infrastructure à grande échelle, d'abord chez Cisco sur des plateformes de cycle de vie déployées auprès de plus de vingt clients mondiaux, puis chez Splunk sur des workflows d'observabilité et d'analyse des causes profondes, a également déposé un brevet sur une méthodologie de chaos engineering basée sur l'intention. Son constat central est que les organisations continuent de traiter agents autonomes et chaos engineering comme deux disciplines distinctes, alors qu'elles sont fondamentalement la même. Tant que cette connexion ne sera pas établie dans les processus de gouvernance, les post-mortems continueront de tourner en rond entre équipes, cherchant si la faute incombe à l'agent ou à l'infrastructure, sans jamais poser la bonne question.

💬 Les agents en prod qui font du chaos engineering sans le savoir, c'est exactement le scénario qu'on n'avait pas anticipé. On a blindé les systèmes contre les erreurs humaines, mis en place des runbooks, du monitoring, des SLO, et là un agent redémarre un cluster au pire moment parce que ses données d'entraînement lui disent que c'est la bonne action. Combien de post-mortems vont encore traîner avant que les équipes fassent le lien ?

SécuritéOpinion
1 source
Nexos.ai : on a testé l’outil qui veut convaincre votre DSI que l’IA n’est pas une passoire
3Le Big Data 

Nexos.ai : on a testé l’outil qui veut convaincre votre DSI que l’IA n’est pas une passoire

Nexos.ai, la plateforme développée par Nord Security, l'éditeur à l'origine de NordVPN, propose une solution de gouvernance de l'intelligence artificielle en entreprise. Le principe est simple : plutôt que de créer un nouveau modèle maison, Nexos fait office de hub centralisé permettant aux équipes d'accéder aux grands modèles du marché, OpenAI, Anthropic, Google, Mistral, depuis un environnement contrôlé, avec des journaux d'activité, des règles configurables et un administrateur aux commandes. L'interface, pensée pour être accessible sans formation, permet de choisir son modèle via un menu déroulant, de définir un profil global avec des instructions permanentes, et de désactiver la mémorisation d'un simple interrupteur. Un détail attire l'attention : un drapeau européen signale les modèles traités sur des serveurs en Europe, garantie concrète pour les entreprises soumises au RGPD. Côté routing, la plateforme dirige intelligemment les tâches vers le modèle le plus adapté, un modèle d'embedding Mistral pour indexer un PDF, sans mobiliser un modèle coûteux, sans que l'utilisateur n'ait à intervenir. L'enjeu adressé est loin d'être anecdotique. Le phénomène dit du "Shadow AI", ces salariés qui utilisent leur compte personnel ChatGPT ou Claude pour coller des contrats, des roadmaps ou des bilans RH, représente en 2026 l'un des principaux vecteurs de fuite de données sensibles en entreprise, non par malveillance, mais faute d'alternative sérieuse mise à disposition. Nexos tente de combler ce vide en offrant aux DSI une visibilité réelle sur les usages, et aux employés un outil suffisamment fluide pour ne pas générer de contournements. Pour un DAF surveillant sa facture cloud, l'optimisation automatique du routing entre modèles représente aussi un argument économique tangible, invisible pour l'utilisateur final mais visible dans les coûts d'infrastructure. Nord Security n'est pas un inconnu dans l'espace cybersécurité : l'entreprise a construit sa réputation sur NordVPN, un produit grand public devenu référence dans la protection de la vie privée en ligne. Ce positionnement lui confère une crédibilité initiale sur le marché de la gouvernance IA, un segment en pleine structuration alors que les régulations se durcissent des deux côtés de l'Atlantique, l'AI Act européen en tête. La limite que la revue identifie est structurelle : les promesses de "forteresse numérique" ne peuvent être vérifiées sans audit technique indépendant, et l'utilisateur doit in fine faire confiance à la réputation de l'éditeur. Dans un marché où les offres se multiplient, Microsoft Copilot, Glean, Perplexity Enterprise, Nexos mise sur la simplicité d'adoption et la conformité RGPD comme différenciateurs, deux arguments qui résonnent particulièrement auprès des ETI et grandes entreprises européennes encore hésitantes à franchir le pas.

UELes entreprises françaises et européennes soumises au RGPD et à l'AI Act disposent d'une plateforme de gouvernance IA avec hébergement européen, réduisant le risque juridique lié au Shadow AI.

SécuritéOutil
1 source
Ghost Murmur : l’IA secrète de la CIA qui entend votre coeur à 65 km
4Le Big Data 

Ghost Murmur : l’IA secrète de la CIA qui entend votre coeur à 65 km

La CIA aurait utilisé pour la première fois sur le terrain un système de détection biométrique à longue portée baptisé Ghost Murmur lors d'une opération de sauvetage en Iran en avril 2026. Un pilote américain abattu au-dessus du territoire iranien a survécu deux jours dans une zone montagneuse désertique, caché dans une crevasse, sans que les moyens de recherche classiques ne parviennent à le localiser précisément. Sa balise de survie standard ne suffisait pas. C'est alors que Ghost Murmur est entré en action : ce dispositif couplant intelligence artificielle et magnétométrie quantique aurait réussi à détecter la signature électromagnétique émise par son cœur, à une distance annoncée de plusieurs dizaines de kilomètres. Le système, développé par la division Skunk Works de Lockheed Martin, la même unité secrète à l'origine du SR-71 Blackbird et du U-2, analyse les signaux électromagnétiques faibles liés à l'activité cardiaque, filtre le bruit ambiant grâce à des algorithmes poussés, et isole une signature biologique distincte. L'extraction s'est finalement déroulée sans perte humaine côté américain. L'enjeu opérationnel est considérable : Ghost Murmur représente une rupture technologique dans la localisation humaine à distance, en particulier dans des environnements où les moyens conventionnels échouent. Pour les forces spéciales et les agences de renseignement, la capacité de détecter un signe de vie sans contact visuel, sans émetteur actif, et dans un terrain hostile, change fondamentalement les calculs de sauvetage au combat. Le désert iranien s'est révélé un environnement favorable au système : peu d'interférences électromagnétiques, fort contraste thermique nocturne entre un corps vivant et le sol froid, faible densité de signaux parasites. Les analystes ont croisé les données pour confirmer la position avant de lancer l'extraction, ce qui suggère un processus de validation multi-source plutôt qu'une détection automatique immédiate. Ghost Murmur s'inscrit dans une tendance plus large de militarisation de la biométrie et des capteurs quantiques, un domaine dans lequel les États-Unis investissent massivement depuis plusieurs années pour maintenir leur supériorité dans les opérations spéciales. La magnétométrie quantique, qui repose sur des matériaux ultra-sensibles capables de mesurer des champs magnétiques infimes, était jusqu'ici principalement étudiée en laboratoire ou dans des contextes médicaux. Son déploiement terrain ouvre des perspectives qui dépassent le seul sauvetage de pilotes : surveillance de périmètre, détection d'infiltration, voire ciblage. Des tests sur des plateformes aériennes militaires seraient déjà en cours. Mais la technologie reste en phase d'expérimentation avancée, et ses limites, notamment le temps d'analyse des algorithmes et la nécessité de zones peu saturées en signaux, encadrent encore son champ d'application réel.

SécuritéActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour