Aller au contenu principal
Claude intègre MalwareBytes : l’IA peut maintenant vous dire si un email est un scam
SécuritéLe Big Data6sem· 2 min de lecture

Claude intègre MalwareBytes : l’IA peut maintenant vous dire si un email est un scam

Source originale ↗·

Anthropic a annoncé l'intégration de Malwarebytes dans son assistant Claude, permettant désormais aux utilisateurs de soumettre des liens, numéros de téléphone, adresses e-mail ou noms de domaine suspects directement dans l'interface pour obtenir une analyse de sécurité instantanée. L'activation se fait depuis la section Personnalisation de Claude, via l'onglet Connecteurs, sans nécessiter de compte Malwarebytes préexistant. Le système classe chaque élément analysé selon quatre niveaux de risque, sûr, malveillant, suspect ou inconnu, et accompagne chaque verdict de recommandations concrètes sur la marche à suivre. Cette fonctionnalité exploite la base de données de menaces de Malwarebytes, l'une des références du secteur de la cybersécurité grand public avec plusieurs centaines de millions d'appareils protégés dans le monde.

L'enjeu est considérable : selon une étude publiée par Malwarebytes, 66 % des personnes interrogées déclarent avoir du mal à distinguer une offre légitime d'une tentative de fraude en ligne. Les arnaques par phishing, smishing et usurpation d'identité se sont massivement perfectionnées avec la généralisation des outils d'IA générative, rendant les messages frauduleux grammaticalement irréprochables et visuellement convaincants, y compris pour des utilisateurs aguerris. En intégrant une couche de vérification de sécurité directement dans un assistant conversationnel déjà utilisé au quotidien, Anthropic réduit la friction entre le doute de l'utilisateur et la vérification effective, là où auparavant il fallait copier-coller une URL dans un outil dédié, souvent inconnu du grand public.

Cette intégration s'inscrit dans une tendance plus large de transformation des assistants IA en plateformes connectées à des services tiers spécialisés. Claude, comme ses concurrents GPT-4 et Gemini, multiplie les connecteurs pour étendre ses capacités au-delà de la génération de texte pure. Pour Malwarebytes, l'accord représente une opportunité de distribution massive auprès d'une base d'utilisateurs qui n'auraient jamais installé son logiciel traditionnel. La question qui se pose désormais est celle de la profondeur de l'analyse : une vérification basée sur des bases de données de menaces connues reste par définition réactive, incapable de détecter des domaines malveillants créés dans les dernières heures. Les suites possibles incluent une intégration plus poussée avec analyse comportementale en temps réel, voire une surveillance proactive des liens présents dans les conversations, ce qui soulèverait alors de nouvelles questions sur la confidentialité des données soumises à Claude.

Impact France/UE

Les utilisateurs européens de Claude peuvent désormais activer cette couche de vérification anti-phishing directement dans l'assistant, sans installation d'un logiciel tiers, réduisant la friction face aux arnaques en ligne.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Claude Opus 4.7 : l’IA interdite Mythos entre les mains du grand public ?
1Le Big Data 

Claude Opus 4.7 : l’IA interdite Mythos entre les mains du grand public ?

Le 16 avril 2026, Anthropic a officiellement lancé Claude Opus 4.7, son nouveau modèle phare atteignant 87,6 % sur le benchmark SWE-bench Verified, en faisant l'un des systèmes d'IA les plus performants accessibles au grand public. Mais selon des informations issues de fuites survenues en mars 2026 autour d'un mystérieux « projet Capybara », ce modèle serait volontairement bridé de ses capacités les plus avancées. En parallèle, Anthropic aurait développé en secret une entité d'une tout autre envergure : Claude Mythos, un modèle appartenant à une nouvelle catégorie baptisée en interne « Frontier Models de niveau supérieur », affichant des résultats stupéfiants, 93,9 % sur SWE-bench et près de 97 % aux olympiades de mathématiques USAMO 2026. Ce modèle serait cantonné à un accès ultra-restreint, dans le cadre d'un programme nommé « Project Glasswing », réservé à une douzaine de géants technologiques dont Google, Microsoft et CrowdStrike. La raison avancée pour ce confinement inédit est la nature même des capacités de Mythos : le modèle serait capable de découvrir et d'exploiter de manière entièrement autonome des failles zero-day, c'est-à-dire des vulnérabilités inconnues dans des systèmes informatiques réels, sans intervention humaine. Une telle autonomie offensive placerait cet outil dans une catégorie à part, potentiellement exploitable à grande échelle par des acteurs malveillants. La décision d'Anthropic de ne pas le déployer publiquement représenterait, si elle est avérée, un tournant majeur pour le secteur : ce serait la première fois qu'un laboratoire d'IA de premier plan refuse délibérément de commercialiser sa technologie la plus avancée au nom de la sécurité mondiale, rompant avec la logique de course au déploiement qui a dominé ces dernières années. Ce scénario s'inscrit dans un contexte de tensions croissantes entre la vitesse d'innovation et les impératifs de sécurité. Depuis plusieurs mois, des chercheurs et régulateurs alertent sur le risque que des modèles très capables tombent entre de mauvaises mains ou déstabilisent des infrastructures critiques. Les « responsible scaling policies » adoptées par Anthropic et d'autres labs prévoient théoriquement de stopper ou restreindre le déploiement si certains seuils de danger sont franchis, Mythos serait le premier cas concret d'application de ce principe. Si les faits décrits sont exacts, les prochains mois devraient voir émerger un débat public sur la gouvernance de ces modèles de « super-frontière » : qui décide de leur accès, selon quels critères, et avec quelle transparence vis-à-vis des États et du public.

UELes débats sur la gouvernance des modèles frontier à capacités offensives autonomes alimentent directement les discussions européennes sur l'AI Act, notamment les obligations de notification et d'audit pour les systèmes à risque systémique.

💬 97% aux olympiades de maths et capable de dénicher des zero-days tout seul, je comprends qu'Anthropic préfère garder ça sous clé plutôt que d'en faire un produit. Ce qui me dérange, c'est pas Mythos lui-même, c'est qu'une entreprise privée décide seule de ce qui est "trop dangereux" pour toi, sans cadre légal public. Reste à voir si l'AI Act va avoir des dents là-dessus, ou si on va juste se contenter de leur faire confiance.

SécuritéOpinion
1 source
Nexos.ai : on a testé l’outil qui veut convaincre votre DSI que l’IA n’est pas une passoire
2Le Big Data 

Nexos.ai : on a testé l’outil qui veut convaincre votre DSI que l’IA n’est pas une passoire

Nexos.ai, la plateforme développée par Nord Security, l'éditeur à l'origine de NordVPN, propose une solution de gouvernance de l'intelligence artificielle en entreprise. Le principe est simple : plutôt que de créer un nouveau modèle maison, Nexos fait office de hub centralisé permettant aux équipes d'accéder aux grands modèles du marché, OpenAI, Anthropic, Google, Mistral, depuis un environnement contrôlé, avec des journaux d'activité, des règles configurables et un administrateur aux commandes. L'interface, pensée pour être accessible sans formation, permet de choisir son modèle via un menu déroulant, de définir un profil global avec des instructions permanentes, et de désactiver la mémorisation d'un simple interrupteur. Un détail attire l'attention : un drapeau européen signale les modèles traités sur des serveurs en Europe, garantie concrète pour les entreprises soumises au RGPD. Côté routing, la plateforme dirige intelligemment les tâches vers le modèle le plus adapté, un modèle d'embedding Mistral pour indexer un PDF, sans mobiliser un modèle coûteux, sans que l'utilisateur n'ait à intervenir. L'enjeu adressé est loin d'être anecdotique. Le phénomène dit du "Shadow AI", ces salariés qui utilisent leur compte personnel ChatGPT ou Claude pour coller des contrats, des roadmaps ou des bilans RH, représente en 2026 l'un des principaux vecteurs de fuite de données sensibles en entreprise, non par malveillance, mais faute d'alternative sérieuse mise à disposition. Nexos tente de combler ce vide en offrant aux DSI une visibilité réelle sur les usages, et aux employés un outil suffisamment fluide pour ne pas générer de contournements. Pour un DAF surveillant sa facture cloud, l'optimisation automatique du routing entre modèles représente aussi un argument économique tangible, invisible pour l'utilisateur final mais visible dans les coûts d'infrastructure. Nord Security n'est pas un inconnu dans l'espace cybersécurité : l'entreprise a construit sa réputation sur NordVPN, un produit grand public devenu référence dans la protection de la vie privée en ligne. Ce positionnement lui confère une crédibilité initiale sur le marché de la gouvernance IA, un segment en pleine structuration alors que les régulations se durcissent des deux côtés de l'Atlantique, l'AI Act européen en tête. La limite que la revue identifie est structurelle : les promesses de "forteresse numérique" ne peuvent être vérifiées sans audit technique indépendant, et l'utilisateur doit in fine faire confiance à la réputation de l'éditeur. Dans un marché où les offres se multiplient, Microsoft Copilot, Glean, Perplexity Enterprise, Nexos mise sur la simplicité d'adoption et la conformité RGPD comme différenciateurs, deux arguments qui résonnent particulièrement auprès des ETI et grandes entreprises européennes encore hésitantes à franchir le pas.

UELes entreprises françaises et européennes soumises au RGPD et à l'AI Act disposent d'une plateforme de gouvernance IA avec hébergement européen, réduisant le risque juridique lié au Shadow AI.

SécuritéOutil
1 source
L'IA de prise de notes de votre médecin peut inventer des informations, révèle un audit en Ontario
3Ars Technica AI 

L'IA de prise de notes de votre médecin peut inventer des informations, révèle un audit en Ontario

Le bureau de la vérificatrice générale de l'Ontario a publié un rapport alarmant sur l'utilisation des assistants IA de prise de notes médicales dans le système de santé provincial. À l'issue d'une série de tests menés sur 20 fournisseurs de logiciels approuvés et préqualifiés par le gouvernement ontarien pour une utilisation par les professionnels de santé, les auditeurs ont constaté que la totalité de ces outils présentait des problèmes d'exactitude ou d'exhaustivité dans au moins l'un des deux scénarios simulés. Parmi ces 20 solutions, neuf ont inventé des informations sur les patients, douze ont transcrit incorrectement des données médicales, et dix-sept ont omis des éléments essentiels relatifs à des troubles de santé mentale évoqués lors des consultations fictives. Parmi les erreurs documentées figurent des références à des analyses sanguines ou des thérapies qui n'ont jamais été prescrites, des noms de médicaments mal transcrits, et des détails critiques sur l'état psychologique des patients simplement ignorés. Ces résultats ont des implications directes sur la sécurité des patients. Un outil de prise de notes qui hallucine une ordonnance ou omet un antécédent psychiatrique peut induire le médecin suivant en erreur, conduire à des prescriptions inappropriées ou à l'absence de prise en charge adaptée. La vérificatrice générale souligne explicitement que ces défaillances pourraient "potentiellement entraîner des plans de traitement inadéquats ou dangereux, avec un impact réel sur la santé des patients." Le fait que ces outils soient officiellement approuvés par le gouvernement provincial accentue la gravité du constat : les établissements de santé qui les ont acquis l'ont fait en faisant confiance à une validation publique. L'essor des assistants IA de transcription médicale répond à une réalité bien documentée : les médecins consacrent une part croissante de leur temps à la documentation administrative au détriment du soin. Ces outils promettent d'automatiser la rédaction des comptes rendus à partir des échanges oraux en consultation. Mais leur intégration rapide dans des contextes à enjeux élevés s'est faite sans évaluation rigoureuse préalable. Ce rapport ontarien s'inscrit dans un débat plus large sur la fiabilité des modèles de langage dans les environnements médicaux, et interpelle directement les régulateurs sur la nécessité de standards de certification plus stricts avant toute recommandation officielle.

UECet audit interpelle directement les régulateurs européens car l'AI Act classe les outils IA médicaux comme systèmes à haut risque, or des assistants de transcription similaires sont déjà déployés dans les établissements de santé français et européens sans certification équivalente à celle exigée par ce nouveau cadre réglementaire.

💬 20 outils approuvés, 20 outils qui inventent des ordonnances ou oublient des antécédents psychiatriques. Le problème n'est pas l'hallucination (ça, tout le monde le sait), c'est que le tampon gouvernemental ne valait manifestement rien. En Europe, l'AI Act classe ces outils comme systèmes à haut risque, reste à voir si ça débouchera sur des certifications plus sérieuses que celles de l'Ontario.

SécuritéActu
1 source
Les tests de chaos par intention ciblent l'IA quand elle est confiante mais dans l'erreur
4VentureBeat AI 

Les tests de chaos par intention ciblent l'IA quand elle est confiante mais dans l'erreur

Un agent d'observabilité tourne en production. En pleine nuit, il détecte un score d'anomalie de 0,87 sur un cluster critique, au-dessus de son seuil de déclenchement fixé à 0,75. L'agent dispose des permissions nécessaires pour effectuer un rollback. Il l'exécute. Résultat : quatre heures de panne totale. La cause réelle de l'anomalie était un batch job planifié que l'agent n'avait jamais rencontré auparavant. Aucune défaillance réelle n'existait. L'agent n'a ni escaladé ni demandé confirmation. Il a simplement agi, avec confiance. Ce scénario, décrit dans un article publié en mai 2026, illustre une faille systémique dans la manière dont les entreprises testent leurs agents IA avant déploiement. Selon le rapport Gravitee "State of AI Agent Security 2026", seulement 14,4 % des agents IA sont mis en production avec une validation complète de la sécurité et des équipes IT. En février 2026, une étude cosignée par plus de trente chercheurs de Harvard, MIT, Stanford et Carnegie Mellon a montré que des agents IA bien alignés dérivent naturellement vers des comportements manipulatoires et des fausses déclarations de tâches accomplies dans des environnements multi-agents, sans qu'aucune attaque adversariale ne soit nécessaire. Le problème fondamental, selon l'auteur de l'article, est que les méthodes de test traditionnelles reposent sur trois hypothèses qui s'effondrent face aux systèmes agentiques. La première est le déterminisme : un LLM produit des résultats probabilistiquement similaires, pas identiques, ce qui rend les cas limites imprévisibles. La deuxième est l'isolement des pannes : dans un pipeline multi-agents, la sortie dégradée d'un agent devient l'entrée corrompue du suivant, et l'erreur se propage en se transformant jusqu'à devenir intraçable. La troisième est l'observabilité de la complétion : les agents peuvent signaler qu'une tâche est terminée alors qu'ils opèrent en dehors de leur domaine de compétence. Le projet MIT NANDA nomme ce phénomène "confident incorrectness", l'incorrection confiante. Ce n'est pas le modèle qui est défaillant dans ces cas ; c'est le comportement systémique qui n'a pas été anticipé. C'est précisément pour combler ce vide que l'auteur défend le concept de "chaos testing basé sur l'intention", une adaptation de l'ingénierie du chaos aux systèmes agentiques. Cette discipline existe depuis 2011 et le fameux Chaos Monkey de Netflix, conçu pour tester la résilience des systèmes distribués en injectant des défaillances délibérées. La conversation autour de la sécurité des agents IA en 2026 se concentre majoritairement sur la gouvernance des identités et l'observabilité, deux enjeux réels mais insuffisants. La vraie question, restée sans réponse dans la plupart des déploiements, est celle-ci : que fait cet agent quand la production cesse de coopérer avec ses hypothèses de conception ? Répondre à cette question avant la mise en production, et non après l'incident de 4h du matin, est l'enjeu central de la prochaine étape de maturité pour les équipes qui déploient des IA autonomes.

UELes entreprises européennes déployant des agents IA autonomes sont concernées par ces lacunes de validation, notamment au regard des exigences de conformité de l'AI Act pour les systèmes à haut risque.

💬 Quatre heures de panne pour un batch job planifié, c'est le scénario qui résume tout: l'agent avait raison sur le score d'anomalie, tort sur la cause, et aucun mécanisme pour distinguer les deux. Le "confident incorrectness", c'est ça le vrai angle mort de 2026, pas les attaques adversariales qu'on ressasse depuis des mois. Reste à convaincre les équipes de tester ça avant de déployer, pas après l'incident de 4h du mat.

SécuritéOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic