LLMsOpenAI Blog · 28 janv. 2026, 01:00· 1 min de lecture

Garder vos données en sécurité lorsqu'un agent AI clique sur un lien

OpenAI a mis en place des mesures de sécurité intégrées pour protéger les données des utilisateurs lorsqu'un agent IA clique sur un lien, empêchant ainsi l'exfiltration de données via les URLs et l'injection de prompts. Ces protocoles limitent les risques de fuites d'informations sensibles et de manipulation des systèmes par des attaques ciblées.

Dans nos dossiers

OpenAI Agents IA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1VentureBeat AI

Cohere publie en open source un agent de code fonctionnant sur un seul H100

Cohere a lancé mardi North Mini Code, un modèle de codage agentique open source de 30 milliards de paramètres au format mixture-of-experts (MoE), avec seulement 3 milliards de paramètres actifs par token. Disponible sur Hugging Face sous licence Apache 2.0, il supporte une fenêtre de contexte de 256 000 tokens et une génération maximale de 64 000 tokens. Sa particularité technique : il tourne sur un seul GPU H100, et Nick Frosst, cofondateur de Cohere, l'a même démontré en fonctionnement sur un Mac Studio via MLX avec 20 Go de RAM. Le modèle a été entraîné via deux phases de fine-tuning supervisé suivies d'apprentissage par renforcement sur plus de 70 000 tâches vérifiables issues d'environ 5 000 dépôts, dédupliqués par rapport à SWE-Bench. Cohere revendique des performances supérieures aux modèles open source jusqu'à quatre fois plus grands, dont des modèles à 120 milliards de paramètres. North Mini Code représente une alternative concrète aux modèles propriétaires pour les équipes d'ingénierie qui veulent déployer des pipelines de codage agentique en interne, sans dépendre d'API externes. Le modèle gère l'orchestration de sous-agents, la cartographie d'architecture, la revue de code sur de larges bases de code multi-fichiers et le travail en environnement terminal. Selon les mesures indépendantes d'Artificial Analysis, il atteint 210 tokens par seconde avec un temps au premier token de 0,25 seconde, contre une médiane de 1,95 seconde pour sa catégorie. Face à Mistral Devstral Small 2 (24 milliards de paramètres dense), Cohere revendique un débit de sortie 2,8 fois supérieur et une latence inter-token réduite de 30 % dans des conditions matérielles identiques. Ces chiffres positionnent le modèle comme une option sérieuse pour des charges de production à volume élevé. Il existe néanmoins un point de vigilance notable : lors des tests de l'Intelligence Index d'Artificial Analysis, North Mini Code a généré 75 millions de tokens en sortie pour compléter l'évaluation, contre une médiane de 25 millions pour les modèles comparables. Cette verbosité excessive peut tripler les coûts d'inférence dans des pipelines agentiques intensifs, là où chaque appel enchaîne plusieurs étapes. Cohere a par ailleurs entraîné le modèle sur trois scaffolds d'agents distincts (SWE-Agent, Mini-SWE-Agent et OpenCode) plutôt qu'un seul, gagnant 10 points de pourcentage sur l'évaluation OpenCode tout en maintenant les performances sur SWE-Agent. Le modèle s'inscrit dans un marché en rapide consolidation face à GitHub Copilot, Cursor et les derniers modèles Mistral, où la capacité à s'auto-héberger sur du matériel standard devient un avantage différenciant majeur pour les entreprises soucieuses de contrôle et de coût.

UELe modèle open source sous licence Apache 2.0 offre aux équipes d'ingénierie européennes une option concrète d'auto-hébergement pour des pipelines de codage agentique, réduisant la dépendance aux API propriétaires américaines dans un contexte de sensibilité croissante à la souveraineté des données.

LLMsOpinion

1 source

2OpenAI Blog

Présentation de la Mode Lockdown et des étiquettes de Risque Élevé dans ChatGPT

OpenAI présente le mode Lockdown et les étiquettes « Risque élevé » dans ChatGPT pour renforcer la défense contre les injections de prompts et l'exfiltration de données via l'IA. Ces fonctionnalités visent à aider les organisations à mieux identifier et atténuer les menaces liées à l'utilisation malveillante du modèle.

LLMsOutil

1 source

3Latent Space

Anthropic relance Claude Fable 5 avec des garde-fous de sécurité renforcés

Anthropic a relancé Claude Fable 5 le 1er juillet 2026, après une journée d'indisponibilité qui avait provoqué une forte demande contenue chez les utilisateurs. L'entreprise a précisé que certaines requêtes, notamment liées à la cybersécurité, pourraient désormais être redirigées vers Opus 4.8 en raison de nouveaux garde-fous, et que les classificateurs de sécurité biologie/chimie restent pour l'instant trop larges dans leur détection. Les limites de débit (rate limits) ont été réinitialisées pour tous les utilisateurs une fois le modèle de nouveau disponible. L'écosystème d'outils a immédiatement intégré ce retour : Cursor indique que Fable 5 domine ses évaluations internes mais reste le modèle le plus coûteux par tâche, Devin l'a déployé sur ses versions Cloud, Desktop et CLI, et Perplexity l'a rétabli comme modèle d'orchestration. Sur le plan des benchmarks, Fable 5 obtient 16,10% sur le Remote Labor Index selon les données relayées par kimmonismus, tandis qu'Artificial Analysis situe Sonnet 5 en deuxième position sur AA-Briefcase, avec toutefois davantage de tours d'échange et un rapport coût-performance moins favorable aux niveaux d'effort les plus bas. Le fait marquant n'est pas tant le retour du modèle que la manière dont les développeurs s'adaptent aux contraintes des modèles de pointe. Plusieurs d'entre eux, dont l'utilisateur Theo, décrivent désormais une architecture multi-modèles plutôt qu'une dépendance à un seul système : Fable 5 est réservé au raisonnement et à la planification de haut niveau, tandis que l'implémentation, la vérification et les tâches d'usage d'ordinateur sont déléguées à d'autres modèles, ce qui améliorerait sensiblement le taux de succès des pull requests de bout en bout. Omar Sar et Mikhail Parakhin partagent une analyse proche : plutôt que de construire un pré-classificateur de tâches simples pour router les requêtes, mieux vaut concevoir directement des stratégies combinant plusieurs modèles, car un routage fiable exige souvent d'avoir déjà résolu la tâche elle-même. Cette évolution reflète une maturation du marché des agents de code, où la robustesse prime désormais sur la dépendance à un fournisseur unique. En parallèle, le laboratoire chinois Z.ai a lancé ZCode, un environnement de développement officiel dédié à son modèle ouvert GLM-5.2, avec prise en charge du BYOK (bring your own key), disponibilité multiplateforme et un quota de requêtes renforcé pour les abonnés à son offre de codage. LangChain a publié des guides d'intégration de GLM-5.2 dans des flux de code, et son fondateur Harrison Chase note que des développeurs en font déjà leur modèle quotidien. Sur le benchmark APEX-SWE, GLM-5.2 devient le premier modèle ouvert à dominer une catégorie, avec 55,3% de réussite au premier essai sur les tâches d'intégration, Kimi K2.7 le suivant de près ; des voix comme scaling01 tempèrent néanmoins l'idée que les modèles ouverts auraient dépassé les modèles occidentaux, tout en reconnaissant un écart de performance en code qui se réduit rapidement. Côté infrastructure, vLLM a intégré le décodage spéculatif DSpark pour les modèles DeepSeek, atteignant environ 250 tokens par seconde sur huit GPU B300, et des accélérations comparables ont été rapportées pour GLM-5.2 et Qwen3-32B, signe que la course à l'inférence rapide s'intensifie autant que celle des capacités.

💬 Le retour de Fable 5, je m'en fiche un peu, ce qui compte c'est ce que la panne a révélé : plus personne de sérieux ne mise tout sur un seul modèle. Fable 5 pour réfléchir, un autre pour coder, un troisième pour vérifier, c'est déjà la norme chez les devs qui livrent en prod, et ça fait grimper le taux de succès des pull requests. Le fantasme du routage automatique intelligent, lui, en prend un coup : comme le dit Omar Sar, pour router une tâche il faut déjà l'avoir résolue soi-même.

LLMsActu

1 source

4Ars Technica AI

Anthropic restreint l'accès à Mythos, son nouveau modèle d'IA en cybersécurité

Anthropic a officiellement lancé Claude Mythos Preview, un modèle d'intelligence artificielle spécialisé dans la cybersécurité, en le réservant à un cercle restreint d'organisations triées sur le volet. Parmi les premiers accès figurent des géants technologiques comme Amazon, Apple et Microsoft, ainsi que des acteurs de la sécurité informatique tels que Broadcom, Cisco et CrowdStrike. La start-up de San Francisco a annoncé ce mardi être également en discussions avec le gouvernement américain concernant un éventuel déploiement dans le secteur public. Ce lancement contrôlé signale qu'Anthropic joue désormais dans la cour des outils offensifs et défensifs de cybersécurité, un marché stratégique et sensible. En limitant l'accès à des organisations vérifiées, la société cherche à éviter que le modèle ne soit détourné à des fins malveillantes, une préoccupation centrale pour les IA capables d'analyser des vulnérabilités ou d'automatiser des attaques. Le partenariat avec des entreprises comme CrowdStrike suggère une orientation vers la détection de menaces et la réponse aux incidents. Ce lancement intervient dans un contexte embarrassant pour Anthropic : des descriptions détaillées du modèle Mythos et d'autres documents internes avaient été découverts le mois dernier dans un cache de données publiquement accessible, révélant l'existence du projet avant toute annonce officielle. Cette fuite avait forcé la main de l'entreprise. Plus largement, la course aux modèles spécialisés en cybersécurité s'intensifie, avec Microsoft, Google et des startups comme Protect AI qui développent également leurs propres solutions, faisant de ce segment l'un des plus disputés de l'IA appliquée.

LLMsActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic