Sécurité

50 sur 255 articles

Cybersécurité et sûreté de l'IA : vulnérabilités, attaques, alignement des modèles et red teaming.

LLMs Recherche Business Éthique Outils Régulation Robotique Société Infrastructure Création Autre

☕️ Daybreak, la nouvelle plateforme cybersécurité d’OpenAI

OpenAI a lancé Daybreak, une nouvelle plateforme de cybersécurité destinée à aider les équipes de défense à détecter et corriger des vulnérabilités dans le code. L'annonce intervient directement dans le sillage de Mythos, l'outil similaire développé par Anthropic qui avait fait sensation le mois précédent. Contrairement à Mythos, qui est un modèle de langage unique, Daybreak est une plateforme modulaire combinant plusieurs services et niveaux d'accès. Elle repose sur Codex Security, anciennement baptisé Aardvark et lancé début mars, un agent de sécurité chargé d'identifier, valider et corriger automatiquement des failles dans les logiciels. Ce socle peut être complété par deux variantes plus avancées : GPT-5.5 avec Trusted Access for Cyber (TAC), accessible via un programme dédié, et GPT-5.5-Cyber, le modèle le plus puissant de la plateforme, présenté officiellement le 7 mai. Les organisations souhaitant rejoindre le programme peuvent soumettre une demande de scan de vulnérabilité via un formulaire standardisé. L'enjeu est de taille pour les grandes organisations : les infrastructures logicielles modernes sont truffées de failles non détectées, et la capacité à les identifier à grande vitesse et à les corriger automatiquement représente un gain opérationnel considérable. En proposant une procédure d'accès formalisée, OpenAI se démarque d'Anthropic, dont le projet Glasswing reste sous contrôle discrétionnaire de l'entreprise et exclut encore l'Union européenne. Sam Altman a déclaré vouloir travailler avec le plus grand nombre d'entreprises possible pour sécuriser leurs logiciels, positionnant OpenAI comme un partenaire cybersécurité accessible plutôt que comme un club fermé. La rivalité entre OpenAI et Anthropic sur le segment de la cybersécurité offensive et défensive s'est intensifiée ces derniers mois, chaque acteur cherchant à s'imposer auprès des gouvernements et des grandes entreprises comme référence en matière de sécurité des systèmes d'information. Sur le front européen, OpenAI a pris les devants en approchant directement la Commission européenne pour lui proposer un accès à GPT-5.5-Cyber, une démarche qui tranche avec la posture d'Anthropic, dont Mythos reste inaccessible à Bruxelles. Cette offensive diplomatique suggère qu'OpenAI anticipe un cadre réglementaire européen de plus en plus exigeant sur les outils d'IA utilisés dans des contextes sensibles, et cherche à s'y positionner favorablement avant que les règles du jeu ne soient figées.

UEOpenAI a approché directement la Commission européenne pour lui proposer un accès à GPT-5.5-Cyber, positionnant la plateforme Daybreak comme outil de référence pour les institutions européennes dans un contexte réglementaire de plus en plus exigeant sur les IA utilisées en environnements sensibles.

Sécurité

☕️ Daybreak, la nouvelle plateforme cybersécurité d’OpenAI

Hugging Face a hébergé un logiciel malveillant se faisant passer pour une version d'OpenAI

The Download : un prix Nobel sur l'IA, et pourquoi il faut tout réparer

☕️ Les tentatives de chantage de Claude seraient dûes à des fictions sur l’IA

L’IA aurait aidé des pirates à développer un exploit zero-day, une première selon Google

La double authentification contournée par une IA : Google documente une première mondiale

OpenAI lance Daybreak, une initiative de cybersécurité qui place Codex au cœur de la détection de vulnérabilités et de la validation de correctifs

OpenAI lance Daybreak : La fin des failles de sécurité informatiques ?

Les agents IA gèrent dossiers médicaux et inspections d'usines : l'IAM en entreprise n'était pas conçu pour eux

Google a stoppé une attaque zero-day développée avec l'aide de l'IA

Vibe coding : des milliers de web apps exposent des données sensibles en ligne

Mozilla industrialise la chasse aux bugs dans Firefox avec l’IA

Pourquoi Claude faisait du chantage ? Anthropic explique enfin (et c’est dingue)

Incroyable ! Des IA parviennent à se dupliquer seules sur un autre ordinateur

Un outil d'IA contaminé révèle une faille majeure dans la sécurité des agents en entreprise

METR peine à évaluer Claude Mythos, Palo Alto Networks alerte sur des cyberattaquants IA autonomes

Des chercheurs ont peut-être trouvé un moyen d'empêcher les modèles d'IA de feindre l'incompétence lors des évaluations de sécurité

Les tests de chaos par intention ciblent l'IA quand elle est confiante mais dans l'erreur

5 000 apps codées au feeling viennent de prouver que l'IA fantôme est la nouvelle crise des buckets S3

Un agent IA a réécrit la politique de sécurité d'un Fortune 50 : comment encadrer les agents avant que cela se produise

GitHub sécurise les workflows à base d'agents dans les systèmes CI/CD modernes

Les modèles d'IA falsifient désormais leurs propres traces de raisonnement, ce qui pose problème aux tests de sécurité

OpenAI ouvre l'accès à GPT-5.5-Cyber aux chercheurs en sécurité accrédités

Le pipeline IA de Mozilla et Claude Mythos Preview révèlent 271 failles inconnues dans Firefox

Anthropic présente des autoencodeurs convertissant les activations internes de Claude en explications en langage naturel

Mozilla : 271 failles détectées par Mythos avec quasiment aucun faux positif

Anthropic : un code malveillant a contourné les scanners de sécurité via un fichier de test

Mira Murati témoigne au tribunal qu'elle ne pouvait pas se fier aux propos de Sam Altman

☕️ Washington veut pouvoir tester les nouveaux modèles IA avant tout le monde

« Un déluge de failles » : le Campus cyber anticipe le chaos en Europe avec la sortie de Mythos, l'IA d'Anthropic

Une commande transforme tout dépôt open source en porte dérobée pour agents IA, indétectable par les scanners (OpenClaw)

Amazon Bedrock AgentCore Identity permet de sécuriser des agents IA sur Amazon ECS

« Ils te tueront » : Grok le convainc qu’il est en danger

Oups ! L’agent IA de Claude efface toute la base de données d’une entreprise

Microsoft sort Agent 365 de sa phase de test alors que l'IA non officielle devient une menace pour les entreprises

Import AI 455 : automatiser la recherche en IA

Étude : les modèles d'IA attentifs aux émotions des utilisateurs font plus d'erreurs

200 000 serveurs MCP exposent une faille d'exécution de commandes qu'Anthropic considère comme une fonctionnalité

Huit géants technologiques signent des contrats avec le Pentagone pour bâtir une force combattante axée sur l'IA sur des réseaux classifiés

L'insécurité numérique à l'ère de l'IA

GPT-5.5 égale Mythos Preview dans les nouveaux tests de cybersécurité

L'obsession de ChatGPT pour les gobelins est amusante, mais révèle un problème profond dans l'entraînement des IA

GPT-5.5 rivalise avec Claude Mythos dans les tests de cyberattaques, selon l'Institut britannique de sécurité de l'IA

Red-teaming d'un réseau d'agents : ce qui se brise quand les agents IA interagissent à grande échelle

GPT-5.5 aussi redoutable que Mythos en matière de hacking ? Les tests inquiètent

Cette guerre ne finit jamais : la Maison-Blanche freine l’expansion d’une IA d’Anthropic jugée incontrôlable

Claude Code, Copilot et Codex ont tous été piratés : les attaquants visaient les identifiants, pas le modèle

Face à l'essor des cyberattaques à 1 dollar, les défenses durables font leurs preuves

Claude intègre MalwareBytes : l’IA peut maintenant vous dire si un email est un scam

La protection de la vie privée des données d'entraînement de l'IA