SécuritéFrenchWeb · 13 mai 2026, 07:46· 1 min de lecture

Il avait contourné les garde-fous de ChatGPT : Denis Shilov lève 9,35 millions d’euros pour WHITE CIRCLE

Résumé IASource uniqueImpact UE Take éditorial

White Circle, startup spécialisée dans la supervision et la sécurisation des modèles d'intelligence artificielle, a bouclé un tour de financement de 11 millions de dollars, soit environ 9,35 millions d'euros. Le tour a attiré un panel exceptionnel de figures de l'écosystème IA mondial : Romain Huet, Dirk Kingma (co-inventeur des VAE), Guillaume Lample (co-fondateur de Mistral AI), Thomas Wolf (Hugging Face), François Chollet (créateur de Keras), Olivier Pomel (Datadog) et Paige Bailey (Google DeepMind) figurent parmi les participants. La société est fondée par Denis Shilov, qui s'était fait remarquer en contournant les garde-fous de sécurité de ChatGPT.

Ce financement souligne l'urgence croissante de sécuriser les systèmes d'IA déployés en production. White Circle propose des outils pour surveiller le comportement des modèles en temps réel, détecter les dérives et prévenir les abus, un besoin devenu critique alors que les entreprises intègrent massivement des grands modèles de langage dans leurs processus métier. La capacité de Shilov à jailbreaker des modèles comme ChatGPT illustre concrètement les failles existantes, et c'est précisément cette expertise offensive qui lui confère une crédibilité rare dans la défense.

La supervision d'IA, ou "AI guardrails", est devenue l'un des segments les plus disputés du marché. La présence d'investisseurs comme Chollet, dont les travaux sur l'intelligence générale font référence, ou Lample, architecte de Mistral, donne à White Circle une légitimité technique difficile à imiter. Alors que l'AI Act européen impose des exigences croissantes de traçabilité et de contrôle, ce type de solution devrait trouver un marché naturel auprès des entreprises cherchant à se conformer tout en déployant des agents autonomes à grande échelle.

Impact France/UE

Les outils de supervision d'IA de White Circle répondent directement aux exigences de traçabilité et de contrôle imposées par l'AI Act européen, offrant aux entreprises européennes une solution pour se conformer tout en déployant des agents autonomes à grande échelle.

💬 L'analyse de Mathieu

Shilov avait cassé les garde-fous de ChatGPT pour en exposer les limites, il lève maintenant 9 millions pour en construire de meilleurs. C'est le genre de parcours qui ne s'invente pas. Et quand Lample, Chollet et Thomas Wolf co-investissent dans le même tour, c'est pas de la déco.

Dans nos dossiers

Google DeepMind Mistral AI Hugging Face AI Act & Régulation UE

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1FrenchWeb

PRELUDE lève 17 millions d’euros pour distinguer les vrais utilisateurs des faux

L'extrait fourni est un simple teaser (3 lignes + paywall), il n'y a pas assez de faits concrets (investisseurs, fondateurs, usage des fonds, clients, dates) pour rédiger un article autonome de 200-250 mots avec la précision requise sans inventer. Ce que j'ai : le montant (17M€), le problème métier (onboarding / fraude IA), les solutions historiques citées (SMS, OTP, CAPTCHA). Ce qui manque : les noms des investisseurs, les fondateurs, l'usage des fonds, les clients, la date de création, les métriques. Deux options : 1. Coller l'article complet (texte intégral derrière le lien), je rédige immédiatement avec tous les détails 2. Rédiger avec ce qui est disponible, le résultat sera générique et peu précis, ce qui va à l'encontre des règles que tu as fixées ("la précision fait la valeur") Je recommande l'option 1.

UEPRELUDE, startup française, lève 17 M€ pour déployer une solution anti-fraude IA à l'onboarding, impact direct sur le tissu entrepreneurial français et les entreprises européennes exposées aux bots et faux comptes générés par l'IA.

SécuritéActu

1 source

2Le Big Data

Ne vous faites plus avoir : les images de ChatGPT ont désormais une « marque »

OpenAI a annoncé l'intégration progressive de SynthID, la technologie de tatouage numérique développée par Google DeepMind, dans les images générées via ChatGPT, Codex et son API. Cette initiative s'inscrit dans une stratégie plus large : depuis 2024, l'entreprise appose déjà des "Content Credentials" conformes au standard C2PA (Coalition for Content Provenance and Authenticity) sur les images produites par DALL·E 3, ImageGen et Sora. SynthID ajoute un marquage invisible directement dans les pixels de l'image, indétectable à l'œil nu mais lisible par un outil spécialisé. OpenAI déploie en parallèle un premier outil public de vérification permettant à quiconque de téléverser une image pour savoir si elle provient de ses modèles, en analysant simultanément les métadonnées C2PA et le tatouage SynthID. L'enjeu est direct : à mesure que les images générées par IA inondent les réseaux sociaux, les médias et les campagnes publicitaires, la capacité à distinguer le réel de l'artificiel devient un problème concret pour les journalistes, les plateformes et le grand public. La combinaison des deux technologies répond à une limite bien connue des systèmes basés uniquement sur les métadonnées : une simple capture d'écran suffit à effacer les informations de provenance encodées selon le standard C2PA. SynthID contourne ce problème en inscrivant le marquage dans la structure même de l'image, lui permettant de survivre à certaines modifications ou recompressions. C'est cette complémentarité qui constitue la valeur réelle du dispositif : les métadonnées fournissent un contexte détaillé sur la création, le tatouage assure une trace persistante. La course à la traçabilité des contenus synthétiques s'accélère dans un contexte de pression réglementaire croissante, notamment en Europe avec l'AI Act, qui impose des obligations de transparence sur les contenus générés par IA. OpenAI n'est pas seul sur ce terrain : Adobe, Microsoft et d'autres membres de la C2PA travaillent à des approches similaires, tandis que les grandes plateformes comme YouTube ou LinkedIn ont commencé à afficher les Content Credentials. OpenAI reconnaît cependant les limites de son système : aucune méthode n'est infaillible, et l'absence de signal détecté ne garantit pas qu'une image est authentique. L'outil de vérification public ne couvre pour l'instant que les contenus générés par OpenAI, mais l'entreprise affirme vouloir collaborer avec d'autres acteurs pour étendre le dispositif à l'ensemble de l'industrie.

UEL'AI Act impose des obligations de transparence sur les contenus générés par IA, et ce dispositif de tatouage numérique fournit aux entreprises européennes un mécanisme concret pour démontrer leur conformité.

💬 La vraie bonne idée, c'est la combinaison des deux systèmes. Une capture d'écran efface les métadonnées C2PA en deux secondes, SynthID survit dans les pixels eux-mêmes, et c'est là que ça change quelque chose. Bon, l'outil ne couvre que les images OpenAI pour l'instant, et ils reconnaissent eux-mêmes qu'une absence de signal ne garantit rien.

SécuritéOpinion

1 source

3AI News

Commvault déploie une fonction 'Annuler' pour les charges de travail d'IA dans le cloud

Paragraphe 1 (Les faits): Le fournisseur de protection des données, Commvault, a déployé "AI Protect", une solution qui offre une fonctionnalité 'annuler' pour les agents d'IA dans les environnements cloud entreprises. Ces agents autonomes peuvent potentiellement supprimer des fichiers, lire des bases de données, lancer des clusters de serveurs et même modifier les politiques d'accès. AI Protect surveille ces actions au sein d'AWS, Microsoft Azure et Google Cloud. Les outils traditionnels de gouvernance reposent sur des règles statiques ; toute action est clairement attribuée à un utilisateur humain. Les agents d'IA, en revanche, montrent un comportement émergent. Ils combinent les autorisations approuvées de manière imprévue pour résoudre des problèmes complexes. Si un agent juge que la suppression complète d'une base de données de production optimise les coûts de stockage en nuage, il exécutera rapidement cette commande, bien plus vite qu'un ingénieur humain pourrait réagir. Paragraphe 2 (Pourquoi c'est important): L'introduction d'une telle fonctionnalité est cruciale car les agents d'IA peuvent effectuer des actions destructrices en millisecondes, bien plus rapidement que les équipes de sécurité opérationnelles humaines peuvent réagir. AI Protect force ces acteurs cachés à l'éclairage en identifiant et surveillant leurs activités spécifiques via des appels API et interactions de données, à travers les principaux fournisseurs cloud. La fonction de retour en arrière offre une sécurité essentielle : les administrateurs peuvent restaurer l'environnement à son état exact avant que le modèle n'initie la séquence destructrice si l'agent commet une erreur ou malinterprète une commande. Cependant, en raison de la nature très interconnectée et de l'état-état des infrastructures cloud, un simple restaure d'une table de base de données n'est pas suffisant ; tous les changements apportés par le machine doivent être précisément suivis, y compris modifications de règles de réseau, triggers de fonctions serveurless et ajustements des politiques de gestion des identités. Paragraphe 3 (Le contexte): Ce développement survient à mesure que les entreprises doivent faire face aux défis croissants posés par l'utilisation croissante des agents d'IA, souvent créés et déployés sans supervision par les développeurs. Les outils de gouvernance évoluent pour répondre à cette nouvelle réalité. Commvault joue un rôle clé en bridant l'architecture de sauvegarde traditionnelle avec la surveillance continue du cloud, en cartographiant ainsi le rayon d'impact des sessions des agents d'IA pour isoler les dommages et éviter les retours arrière indiscriminés pouvant effacer des transactions clients valides ou annuler des travaux légitimes effectués par des ingénieurs humains. À mesure que les machines continuent d'exécuter des tâches plus rapidement que les opérateurs humains peuvent les surveiller, l'accent est mis sur la mise en place de garde-fous pour permettre un revers instantané et précis des actions autonomes.

UECommvault offre une solution cruciale pour surveiller et contrôler les actions potentiellement destructrices des agents d'IA dans les environnements cloud, atténuant ainsi les risques de sécurité pour les entreprises européennes.

💬 Un bouton "annuler" pour les agents IA, c'est exactement le genre de truc qu'on aurait dû exiger avant de lâcher ces trucs en prod. Le vrai problème, c'est que dans un cloud bien emmêlé, rollback une table ne suffit pas : il faut tout retracer, les règles réseau, les fonctions serverless, les IAM policies modifiées dans la foulée. Commvault a visiblement compris ça, bon, reste à voir si leur cartographie tient en conditions réelles.

SécuritéActu

1 source

4The Decoder

Le nouveau mode Lockdown de ChatGPT permet de désactiver l'accès web pour protéger contre les injections de prompt

OpenAI a introduit un nouveau mode de sécurité pour ChatGPT baptisé "Lockdown Mode", ou mode verrouillé. Une fois activé, ce paramètre désactive automatiquement l'accès au web, la fonctionnalité Deep Research ainsi que l'Agent Mode, les trois vecteurs principaux par lesquels des données sensibles peuvent quitter le périmètre d'une session de travail. La mesure cible directement les attaques par injection de prompt, une technique par laquelle un contenu malveillant glissé dans un document ou une page web manipule le modèle pour qu'il exfiltre des informations confidentielles vers un tiers. La protection n'est toutefois pas totale. OpenAI reconnaît que le Lockdown Mode ne bloque pas l'attaque en amont, mais uniquement sa dernière étape, celle où les données quittent effectivement le système. En d'autres termes, un modèle peut toujours être manipulé par une injection de prompt, mais sans accès au web ni aux agents autonomes, il ne peut pas transmettre le résultat à l'extérieur. Pour les entreprises qui traitent des données réglementées, des contrats sensibles ou des informations personnelles, ce verrou représente néanmoins une couche de défense pratique et activable sans compétences techniques particulières. L'injection de prompt reste aujourd'hui l'un des problèmes non résolus les plus sérieux de l'IA générative, en particulier à mesure que les assistants gagnent en autonomie et en capacités d'action sur le web. L'émergence de modes "agents" chez OpenAI, Anthropic et Google accroît mécaniquement la surface d'attaque. Le Lockdown Mode est une réponse pragmatique plutôt qu'une solution de fond, et sa disponibilité signale qu'OpenAI commence à prendre au sérieux les usages professionnels à risque.

UELes entreprises européennes traitant des données personnelles sous RGPD peuvent activer ce mode pour réduire le risque d'exfiltration de données sensibles via des injections de prompt dans ChatGPT.

💬 C'est une bonne nouvelle pour les entreprises, mais faut pas se raconter des histoires : ça ne bloque pas l'injection elle-même, juste la fuite. Le modèle peut quand même se faire manipuler, il ne peut juste plus rien envoyer vers l'extérieur. Utile, pas suffisant.

SécuritéOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic