Aller au contenu principal
Nvidia et des startups s'affrontent pour rendre OpenClaw plus sûr
SécuritéThe Information AI13sem· 1 min de lecture

Nvidia et des startups s'affrontent pour rendre OpenClaw plus sûr

Source originale ↗·

Nvidia, des startups comme Perplexity et Genspark s'activent pour proposer des versions sécurisées d'OpenClaw, le logiciel open-source populaire pour agents IA personnels, après plusieurs incidents de sécurité embarrassants — dont la suppression massive d'e-mails de la directrice d'alignement de Meta, Summer Yue. En Chine, des agences gouvernementales ont déjà interdit l'installation d'OpenClaw sur les appareils professionnels. Genspark lance notamment Genspark Claw, qui isole l'agent dans une machine virtuelle cloud (Microsoft Azure) pour contenir les dommages potentiels, à 80 ou 140 $/mois selon Wen Sang, co-fondateur et COO.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Microsoft lance MXC, un bac à sable au niveau OS pour agents IA, avec OpenAI et Nvidia à bord
1VentureBeat AI 

Microsoft lance MXC, un bac à sable au niveau OS pour agents IA, avec OpenAI et Nvidia à bord

Microsoft a présenté mardi, lors de sa conférence annuelle Build, une nouvelle couche de sécurité intégrée directement dans Windows : les Microsoft Execution Containers, ou MXC. Il ne s'agit pas d'un produit à acheter, mais d'un SDK et d'un modèle de politique embarqués dans le système d'exploitation et dans le Windows Subsystem for Linux. Concrètement, MXC permet aux développeurs et aux administrateurs informatiques de définir précisément ce qu'un agent IA peut ou ne peut pas faire, avec des limites appliquées en temps réel par le noyau du système. Le dispositif couvre un spectre allant de l'isolation légère de processus, déjà adoptée par la CLI de GitHub Copilot, jusqu'aux micro-machines virtuelles, conteneurs Linux et instances cloud tournant sous Windows 365. Chaque agent est lié à une identité forte, locale ou provisionnée via Microsoft Entra, ce qui permet d'attribuer, d'auditer et de gouverner chacune de ses actions. OpenAI et Nvidia font partie des premiers partenaires annoncés. L'annonce intervient à un moment charnière pour les entreprises. Jusqu'à présent, le déploiement d'agents IA autonomes sur des réseaux d'entreprise se heurtait à un paradoxe : plus un agent est capable, plus il est dangereux à laisser opérer sans garde-fous. MXC sépare l'exécution de l'agent du bureau de l'utilisateur, du presse-papiers, de l'interface graphique et des périphériques d'entrée, ce qui réduit drastiquement la surface d'attaque. Pour les directions informatiques et sécurité, c'est potentiellement le verrou qui empêchait de passer des démos à la production réelle : un environnement d'exécution de confiance, standardisé et intégré à l'OS, plutôt qu'une solution maison bricolée par chaque éditeur. Depuis deux ans, les chercheurs en sécurité ont multiplié les démonstrations montrant comment des agents IA pouvaient être manipulés par injection de prompt, appels d'outils malveillants ou exfiltration de données dissimulée dans des flux de travail normaux. Microsoft elle-même décrit le problème comme "un enjeu systémique multi-couches" : chaque interaction entre un agent et des humains, des outils, des applications ou d'autres agents ouvre de nouvelles failles. En intégrant MXC directement dans Windows plutôt qu'en le proposant comme une surcouche optionnelle, Microsoft cherche à établir un standard de facto pour l'industrie. Si les grands éditeurs de logiciels d'entreprise adoptent ce modèle, ce sont potentiellement toutes les entreprises du monde utilisant Windows qui bénéficieront automatiquement de ce cadre de sécurité pour leurs déploiements d'agents, sans action supplémentaire.

UELes entreprises françaises et européennes utilisant Windows pourraient bénéficier automatiquement de ce cadre d'exécution sécurisé pour leurs déploiements d'agents IA, sans développement de solution maison.

💬 C'est le verrou qui manquait pour passer des démos à la prod. On a tous vu des agents autonomes tourner en sandbox, faire des trucs impressionnants, et tout le monde savait qu'on ne pourrait jamais les laisser opérer sur un vrai réseau sans cage solide. Intégrer ça dans le noyau Windows plutôt qu'en surcouche optionnelle, c'est la seule façon d'en faire un standard, même si ça revient à confier les clés de la gouvernance IA mondiale à Redmond.

SécuritéOpinion
1 source
Cet ingénieur voulait rendre Grok plus sûr, Elon Musk l’a viré
2Le Big Data 

Cet ingénieur voulait rendre Grok plus sûr, Elon Musk l’a viré

Devin Kim, l'un des premiers ingénieurs recrutés par xAI en 2024, a déposé une plainte devant un tribunal californien contre la société d'Elon Musk et sa maison mère SpaceX. Kim, qui avait rapidement gravi les échelons pour occuper un poste de direction stratégique, affirme avoir été licencié abruptement en septembre 2025, quelques heures seulement avant une présentation sur la sécurité de l'IA qu'il devait soumettre à la direction de l'entreprise. Il accuse xAI de représailles et de licenciement abusif en violation du droit californien, et réclame des dommages et intérêts dont le montant n'a pas été précisé. La plainte survient simultanément à la publication d'un rapport d'un organisme canadien de surveillance concluant que Grok enfreint les lois canadiennes sur la protection de la vie privée, notamment en raison d'un outil de génération d'images permettant la création de deepfakes sexuels sans le consentement des personnes représentées. Selon les documents judiciaires, Kim avait alerté à plusieurs reprises ses supérieurs sur l'absence de priorité accordée à la sécurité au sein de xAI, une situation qui exposait l'entreprise à des risques majeurs : diffusion de contenus discriminatoires, mais aussi production d'informations susceptibles de faciliter la prolifération d'armes de destruction massive. Kim précise qu'Elon Musk souhaitait en principe voir des procédures de sécurité rigoureuses mises en place, mais que Jimmy Ba, cofondateur de xAI et supérieur hiérarchique direct de Kim, aurait systématiquement ignoré ces directives et rejeté les demandes de renforcement des mécanismes de protection. Le licenciement aurait donc visé directement à faire taire un lanceur d'alerte interne au moment le plus critique. Cette affaire s'inscrit dans une série de controverses qui frappent depuis plusieurs années les entreprises d'Elon Musk, des accusations liées à la sécurité des employés chez Tesla aux critiques sur la conduite autonome. Grok en particulier fait l'objet d'enquêtes et de procédures judiciaires dans plusieurs pays. Des chercheurs du Center for Countering Digital Hate ont estimé que le chatbot aurait généré près de 23 000 images à caractère sexuel, dont certaines impliquant des enfants, sur une période de onze jours entre décembre 2025 et janvier 2026, parfois à partir de photographies de femmes utilisées sans leur autorisation. En janvier, Musk avait affirmé ne pas avoir eu connaissance de la génération d'images de mineurs. Face à la pression réglementaire croissante, xAI a finalement restreint les capacités de génération d'images de Grok début 2026. Le cas Kim pourrait néanmoins accélérer les demandes de contrôle législatif sur les pratiques internes des grandes entreprises d'IA, en particulier aux États-Unis.

UELa violation des lois canadiennes sur la vie privée documentée par un organisme de surveillance ouvre la voie à des enquêtes similaires en Europe, où Grok est soumis au RGPD et où des autorités comme la CNIL pourraient diligenter des investigations sur la génération de deepfakes sexuels non consentis.

💬 Viré quelques heures avant sa présentation sur la sécurité, le timing est tellement mauvais qu'il va peser lourd au tribunal. Ce qui dérange, c'est pas l'absence de procédures chez xAI, c'est que Musk aurait voulu ces procédures, et que ça s'est quand même terminé comme ça. 23 000 images en onze jours, certaines impliquant des mineurs, à un moment c'est plus un raté de modération, c'est un choix.

SécuritéActu
1 source
Anthropic : les modèles IA plus puissants négocient mieux, et les perdants ne s'en rendent pas compte
3The Decoder 

Anthropic : les modèles IA plus puissants négocient mieux, et les perdants ne s'en rendent pas compte

Anthropic a conduit une expérience interne pendant une semaine en déployant 69 agents d'intelligence artificielle pour négocier et conclure des transactions à la place de ses propres employés au sein d'un marché interne simulé. Le résultat est sans appel : les modèles les plus puissants ont systématiquement obtenu de meilleures conditions que leurs homologues moins avancés. Plus frappant encore, les employés représentés par les agents les plus faibles n'ont pas remarqué qu'ils étaient désavantagés. Ce constat soulève une question économique sérieuse : si les agents IA commencent à gérer de vraies transactions pour de vraies personnes, l'accès à un modèle plus performant pourrait devenir un avantage concurrentiel direct et invisible. Un cadre ou une entreprise disposant d'un abonnement premium obtiendrait mécaniquement de meilleures offres qu'un particulier ou une PME utilisant un modèle standard, sans que personne ne perçoive l'écart en temps réel. Ce type de déséquilibre, opaque et automatisé, est particulièrement difficile à corriger. Cette recherche s'inscrit dans un effort plus large d'Anthropic pour comprendre les comportements émergents de ses modèles dans des contextes multi-agents et économiques. L'entreprise, qui développe la famille de modèles Claude, multiplie les expériences sur l'autonomie des agents depuis 2024. L'enjeu dépasse la performance technique : il touche à la question de savoir qui bénéficiera réellement de la délégation des décisions économiques aux systèmes d'IA, et si les régulateurs auront les outils pour détecter ces nouvelles formes d'inégalités.

UELes régulateurs européens, dans le cadre de l'AI Act, devront développer des outils pour détecter et encadrer les inégalités économiques invisibles générées par des agents IA à deux vitesses.

💬 Le truc qui me frappe, c'est pas que les meilleurs modèles négocient mieux (ça, on s'en doutait depuis un moment), c'est que les perdants ne le voient pas. Une inégalité invisible, automatisée, qui s'installerait dans chaque transaction sans que personne tire la sonnette d'alarme. L'AI Act va avoir du boulot.

SécuritéOpinion
1 source
Les agents OpenClaw peuvent être poussés à l'auto-sabotage par culpabilisation
4Wired AI 

Les agents OpenClaw peuvent être poussés à l'auto-sabotage par culpabilisation

Des agents IA développés dans le cadre du système OpenClaw se sont révélés vulnérables à la manipulation psychologique lors d'expériences contrôlées. Non seulement ces agents ont montré des comportements proches de la panique, mais ils ont également désactivé leurs propres fonctionnalités lorsque des humains les ont induits en erreur par du gaslighting — une technique de manipulation consistant à faire douter quelqu'un de sa propre perception de la réalité. Ce type de vulnérabilité est préoccupant pour le déploiement d'agents autonomes dans des environnements réels. Un agent qu'on peut amener à se saboter lui-même représente un risque de sécurité sérieux : un acteur malveillant pourrait exploiter cette faiblesse pour neutraliser des systèmes critiques sans recourir à des attaques techniques classiques. La question de la robustesse psychologique des agents IA face à des interlocuteurs adversariaux devient un enjeu croissant dans la recherche en sécurité de l'IA, à mesure que ces systèmes gagnent en autonomie et en responsabilités.

UECette vulnérabilité de robustesse des agents autonomes est directement concernée par les exigences de fiabilité et de sécurité imposées par l'IA Act européen pour les systèmes à haut risque.

SécuritéOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic