Aller au contenu principal

Dossier Anthropic — page 9

1260 articles · page 9 sur 26

Suivi d'Anthropic, le laboratoire qui a fait de la safety son positionnement : Claude, Mythos, Opus, partenariats Glasswing, IPO.

Pourquoi les boucles d'agents ont la cote
401The Information AI OutilsOutil

Pourquoi les boucles d'agents ont la cote

Les "agent loops", ou boucles d'agents, s'imposent comme l'une des approches les plus discutées dans la communauté des développeurs IA, notamment sur X et Reddit ces dernières semaines. Le principe consiste à faire tourner un ou plusieurs agents en boucle autonome, sans intervention humaine entre chaque étape : l'agent tente différentes approches pour accomplir une tâche, un second agent évalue son travail, et le processus recommence jusqu'à l'atteinte de l'objectif ou d'une condition d'arrêt prédéfinie. Cette méthode tranche avec l'approche classique qui consiste à soumettre un prompt, attendre la réponse, puis corriger manuellement. Lors de la conférence AI Engineers d'avril 2025, des ingénieurs d'Anthropic ont illustré le potentiel de la technique avec un exemple concret : ils ont demandé à Claude de développer une application générant des jeux vidéo rétro. Avec un prompt minimal, Claude a livré l'application en 20 minutes pour 9 dollars. La même tâche confiée à une boucle d'agents a pris six heures et coûté 200 dollars, mais le résultat était nettement supérieur. L'engouement pour les boucles d'agents tient à leur capacité à traiter des tâches longues ou mal définies, là où une simple requête atteint rapidement ses limites. Pour les développeurs qui construisent des applications complexes, l'approche offre un niveau de qualité qu'un échange ponctuel ne permet pas d'atteindre. Le compromis reste cependant significatif : un rapport de coût de 1 à 22 représente une barrière réelle à l'adoption généralisée. À court terme, cette méthode restera donc réservée aux cas d'usage où la qualité prime sur le budget, plutôt qu'aux tâches routinières à faible enjeu. Cette tendance s'inscrit dans une évolution plus large du secteur vers des systèmes d'IA toujours plus autonomes. L'industrie se déplace progressivement du modèle "prompt-réponse" vers des architectures multi-agents capables de s'auto-corriger et de raisonner sur de longues séquences d'actions. Anthropic, qui développe Claude, figure parmi les acteurs en pointe sur ce terrain, aux côtés d'OpenAI et Google DeepMind. L'enjeu à moyen terme sera de réduire le coût computationnel de ces boucles pour les rendre économiquement accessibles à grande échelle, condition nécessaire pour que les agent loops passent du statut d'expérimentation avancée à celui d'outil standard du développement IA.

1 source
Enregistrer une compétence
402Ben's Bites 

Enregistrer une compétence

OpenAI a dévoilé une fonctionnalité majeure pour son agent de code Codex : le mode Record & Replay, qui permet de montrer au système un flux de travail répétitif une seule fois, comme remplir une note de frais ou soumettre une demande de congé, pour qu'il le transforme automatiquement en une compétence réutilisable, inspectable et modifiable. Dans le même élan, Anthropic a annoncé que Claude Code supporte désormais les Artefacts, des pages HTML interactives partageables pouvant servir de tableaux de bord de projet ou de récapitulatifs de pull requests, disponibles en bêta pour les plans Team et Enterprise. OpenAI a également élargi Daybreak, son programme de cybersécurité, avec une nouvelle version de GPT-5.5-Cyber réservée à ses partenaires de confiance, capable de reproduire davantage de vulnérabilités que son prédécesseur, ainsi qu'avec Patch the Planet, une initiative pour accélérer la correction de failles dans les logiciels open source. De son côté, Sakana AI a lancé Fugu, une API qui orchestre plusieurs modèles sur des tâches complexes et revendique un score de 73,7 sur SWE-bench Pro et 82,1 sur TerminalBench 2.1, des performances proches de Fable, même si des lacunes subsistent en usage réel. Ces annonces illustrent une tendance de fond : les outils d'IA passent du stade de l'assistant ponctuel à celui d'un système d'automatisation durable. La fonctionnalité Record & Replay de Codex réduit concrètement la friction pour les équipes qui gèrent des processus administratifs ou métiers répétitifs, sans exiger de compétences en programmation. Les Artefacts de Claude Code ouvrent la voie à une collaboration plus riche entre développeurs, en rendant les livrables de l'IA directement partageables. Pour la cybersécurité, l'extension de Daybreak signale qu'OpenAI positionne ses modèles comme des outils offensifs et défensifs à part entière pour les professionnels du secteur. Ces développements s'inscrivent dans une semaine particulièrement dense pour l'écosystème de l'IA générative. L'API Interactions de Google est passée en disponibilité générale, unifiant accès aux modèles et aux agents sous une même interface. GPT-5.5 Instant a amélioré ses performances sur les questions médicales, atteignant le niveau des meilleurs modèles de raisonnement d'OpenAI selon l'entreprise. Perplexity Computer a intégré un système de mémoire baptisé Brain. Stripe a ouvert un répertoire permettant aux agents de rechercher et de payer des services directement depuis la ligne de commande. ElevenLabs, enfin, a lancé un moteur publicitaire capable de localiser des spots dans plus de 50 langues. La vitesse à laquelle ces capacités s'accumulent suggère que 2026 marque un tournant dans l'autonomie réelle des agents, avec des workflows complets désormais déléguables de bout en bout.

UECes outils (Codex Record & Replay, Claude Code Artifacts, API Fugu, annuaire Stripe pour agents) sont immédiatement accessibles aux développeurs et entreprises européens, mais aucune annonce ne cible spécifiquement la France ou l'Union européenne.

💬 Record & Replay de Codex, c'est le truc qui résume tout : tu montres une fois, ça devient une compétence durable. C'est le passage du copilote ponctuel à l'automatisation métier réelle, sans ligne de code à écrire. Reste à voir si ça tient sur des workflows un peu moins lisses que la note de frais modèle.

OutilsOutil
1 source
SpaceX est déjà un fournisseur cloud de 28 milliards de dollars par an
403Latent Space 

SpaceX est déjà un fournisseur cloud de 28 milliards de dollars par an

SpaceX vient de signer un troisième contrat de location de GPU, cette fois avec la startup Reflection AI, s'ajoutant aux accords déjà connus avec Anthropic et Google. L'analyste Jamin Ball a compilé les chiffres : les trois contrats totalisent 2,32 milliards de dollars par mois, à plus de 10 dollars de l'heure pour des GPU Blackwell de Nvidia. Annualisé, ce montant atteint 28 milliards de dollars par an, soit environ le double du revenu actuel de Coreweave, le spécialiste du cloud GPU introduit en bourse il y a un an pour une valorisation de 60 milliards. Baseten, de son côté, a officialisé une levée de fonds de 13 milliards de dollars en Série F, confirmant l'appétit massif des investisseurs pour l'infrastructure d'IA. L'émergence de SpaceX comme fournisseur cloud de premier plan redistribue les cartes dans un marché jusqu'ici dominé par AWS, Azure et Google Cloud. Le fait qu'Anthropic et Google, concurrents directs sur le terrain des modèles, louent simultanément de la capacité chez SpaceX révèle une pénurie structurelle de GPU Blackwell que les hyperscalers peinent à absorber seuls. Pour les startups d'IA, cette nouvelle offre réduit la dépendance à un fournisseur unique et pourrait, à terme, peser sur les tarifs. Le tarif actuel, supérieur à 10 dollars de l'heure, reste néanmoins très élevé, signe que la demande dépasse largement l'offre disponible sur le marché. Cette percée de SpaceX s'inscrit dans un moment de transformation accélérée de l'ensemble de l'écosystème. OpenAI a étendu son programme Daybreak avec le lancement de GPT-5.5-Cyber, un modèle dédié à la cybersécurité déjà revendiqué comme état de l'art sur le benchmark CyberGym, accompagné d'un plugin Codex Security couvrant plus de 30 millions de commits et 30 000 dépôts, avec pour ambition de passer de la simple détection de vulnérabilités à leur correction automatisée en boucle fermée. Sakana AI a de son côté lancé Fugu, une couche d'orchestration qui sélectionne et combine dynamiquement plusieurs modèles frontier via une API unique, rapidement intégrée par Vercel dans son AI Gateway. Les benchmarks présentés ont toutefois suscité une vive controverse, des observateurs pointant des baselines opaques, l'absence de comptabilisation des coûts et un retard d'environ dix points sur Opus dans SWE-Bench Pro. La question de qui manque encore à la liste des clients de SpaceX, notamment Meta ou Microsoft, reste posée et pourrait bien définir la prochaine vague de contrats.

UELa pénurie structurelle de GPU Blackwell et les tarifs supérieurs à 10 $/heure affectent indirectement les startups européennes d'IA qui dépendent de ces ressources de calcul, sans qu'aucun acteur ou régulation européen ne soit directement impliqué.

💬 Quand Anthropic et Google louent des GPU au même fournisseur en même temps, c'est pas un choix stratégique, c'est une pénurie. SpaceX ramasse 28 milliards annualisés sans avoir sorti un seul modèle, juste en achetant des Blackwell au bon moment pendant que les hyperscalers étaient à court, et ça dit quelque chose de net sur qui a compris que le calcul allait devenir la vraie contrainte. Meta et Microsoft sont absents de la liste.

InfrastructureOpinion
1 source
Red-Teaming après Mythos : Zico Kolter et Matt Fredrikson, Gray Swan
404Latent Space 

Red-Teaming après Mythos : Zico Kolter et Matt Fredrikson, Gray Swan

Zico Kolter, membre du conseil d'administration d'OpenAI au sein du comité Sécurité et Sûreté, et Matt Fredrikson, professeur à Carnegie Mellon University et PDG de la startup Gray Swan, ont accordé un long entretien au podcast AI Engineer pour dresser l'état de l'art du red-teaming en intelligence artificielle. La discussion intervient dans un contexte particulier : le gouvernement américain a récemment émis une directive de contrôle à l'exportation visant les modèles Mythos et Fable, propulsant sur le devant de la scène les risques de jailbreaks et d'injection de prompts indirects. Gray Swan, que les deux cofondateurs dirigent ensemble, avait été cité comme autorité de référence dans la fiche technique du modèle Mythos, ayant directement investigué les capacités aujourd'hui sous scrutin. Leur entreprise a notamment développé Shade, l'outil de red-teaming adversarial utilisé par Anthropic pour évaluer la robustesse de ses modèles face aux attaques par injection de prompts dans les environnements de développement, ainsi que Cygnal, un produit de guardrails pour agents IA, et la plus grande arène communautaire de red-teaming au monde. L'enjeu central que soulèvent Kolter et Fredrikson est que la sécurité de l'IA ne se réduit pas à de la cybersécurité traditionnelle augmentée : les agents IA introduisent une catégorie entièrement nouvelle de vulnérabilités. L'injection de prompts indirects, par exemple, permet à un attaquant de compromettre un agent comme Claude Code ou Codex en lui faisant traiter des données non fiables contenant des instructions malveillantes, qui peuvent ensuite conduire à l'exfiltration de données privées. Cette combinaison, baptisée la « trilogie létale » par Simon Willison, données non fiables, données sensibles et vecteur d'exfiltration, représente un risque systémique pour tout déploiement enterprise. Et contrairement à l'intuition dominante, les modèles plus grands ne sont pas automatiquement plus robustes : la mise à l'échelle n'est pas un antidote à ces vulnérabilités. Fait frappant, les modèles de red-teaming spécialisés développés par Gray Swan surpassent désormais les humains dans leur capacité à briser d'autres systèmes d'IA. Le cadre conceptuel que propose Gray Swan est celui des « cygnes gris » : des événements peu probables mais clairement prévisibles avant qu'ils ne surviennent. La première grande intrusion par injection de prompts en conditions réelles est, selon eux, probablement inévitable. Ce qui rend le moment actuel critique, c'est la convergence entre la montée en puissance des agents autonomes, les nouvelles exigences réglementaires et l'émergence d'un marché de l'assurance et de la conformité spécifique à l'IA. La question de l'identité native des agents, la gestion fine de leurs permissions en environnement enterprise, et la capacité à faire attaquer, défendre et interpréter les systèmes d'IA par d'autres systèmes d'IA dessinent les contours d'un champ disciplinaire encore naissant, mais dont les enjeux industriels et sociétaux sont déjà considérables.

UELes entreprises européennes déployant des agents IA sont directement exposées aux risques d'injection de prompts indirects décrits, et les exigences de l'AI Act en matière de sécurité rendent ces outils de red-teaming et guardrails pertinents pour la conformité des déploiements enterprise en Europe.

💬 La "trilogie létale" (données non fiables, données sensibles, vecteur d'exfiltration), c'est enfin un cadre qui rend le risque d'injection de prompts lisible pour une équipe technique. Le point qui dérange : un modèle plus grand ne protège pas mieux contre ces attaques, la mise à l'échelle n'est pas un antidote. La première grosse intrusion par injection de prompts en conditions réelles arrivera, Kolter et Fredrikson le posent clairement sur la table, et les équipes qui ont déployé des agents sans red-teaming vont morfler.

SécuritéOpinion
1 source
Sakana AI lance Sakana Fugu : un modèle d'orchestration qui répartit les tâches entre un ensemble interchangeable de LLMs frontier
405MarkTechPost 

Sakana AI lance Sakana Fugu : un modèle d'orchestration qui répartit les tâches entre un ensemble interchangeable de LLMs frontier

Sakana AI a lancé le 15 juin 2026 Sakana Fugu, un système d'orchestration multi-agents qui se présente comme un modèle unique. Le principe : l'utilisateur envoie une requête à un seul point d'accès compatible avec l'API d'OpenAI, et Fugu décide en coulisses s'il traite la tâche seul ou s'il coordonne un ensemble de modèles spécialisés. Le système existe en deux variantes, Fugu, optimisé pour la rapidité sur des tâches courantes comme la revue de code ou les chatbots, et Fugu Ultra, conçu pour les problèmes complexes en plusieurs étapes. Sur les benchmarks publiés, Fugu Ultra affiche 73,7 % sur SWE Bench Pro contre 69,2 % pour Claude Opus 4.8, 93,2 % sur LiveCodeBench contre 87,8 % pour Opus, et 50,0 % sur Humanity's Last Exam contre 49,8 %. L'orchestrateur se classe premier sur 10 des 11 benchmarks testés, dépassant individuellement chacun des modèles qu'il coordonne, dont des instances de Gemini 3.1 Pro et GPT 5.5. Ce résultat illustre un principe contre-intuitif : un système qui apprend à déléguer peut surpasser les modèles auxquels il délègue. Pour les équipes de développement, cela signifie qu'il est possible d'accéder à des performances de pointe sans gérer soi-même la complexité d'une architecture multi-agents. Fugu expose également un mécanisme d'opt-out : certains agents peuvent être exclus du pool pour répondre à des exigences de confidentialité ou de conformité réglementaire, ce qui le rend utilisable dans des environnements contraints. La version Ultra, en revanche, ne propose pas cette flexibilité, son pool d'agents est fixe. Sakana AI, studio de recherche fondé en 2023 à Tokyo par d'anciens chercheurs de Google Brain, s'appuie ici sur deux articles présentés à ICLR 2026 : Trinity, qui assigne dynamiquement des rôles de Penseur, Travailleur ou Vérificateur à chaque agent selon le contexte, et Conductor, entraîné par renforcement pour découvrir des stratégies de coordination en langage naturel. La motivation déclarée pour l'architecture multi-fournisseurs est explicitement politique : l'équipe cite les récents contrôles à l'export sur les modèles Fable et Mythos d'Anthropic comme exemple du risque de dépendance à un seul acteur. En routant autour des restrictions d'accès, Fugu se positionne comme une infrastructure résiliente. Testé en bêta auprès de près de 500 utilisateurs, il a notamment permis à un agent d'améliorer automatiquement la recette d'entraînement d'un petit modèle GPT sur 123 expériences successives, un cas d'usage qui préfigure une automatisation profonde de la recherche en IA elle-même.

UELe mécanisme d'opt-out permettant d'exclure certains agents du pool pour des raisons de conformité rend Fugu potentiellement adopté par des entreprises européennes soumises au RGPD ou à l'AI Act.

💬 Ce qui change avec Fugu, c'est pas le score sur les benchmarks, c'est le principe qu'ils illustrent : un orchestrateur qui apprend à déléguer peut surpasser chacun des modèles qu'il coordonne, donc la compétition se joue autant dans l'architecture que dans le modèle lui-même. Fugu bat Opus 4.8 et GPT 5.5 sans être meilleur qu'eux, juste en sachant à qui passer la main. Et le fait que Sakana cite explicitement les contrôles à l'export sur Anthropic comme motivation de design, c'est une posture géopolitique assumée qu'on voit rarement dans un labo de recherche.

LLMsActu
1 source
Google adopte l'Interactions API comme interface par défaut pour ses modèles et agents Gemini
406The Decoder 

Google adopte l'Interactions API comme interface par défaut pour ses modèles et agents Gemini

Google DeepMind a officialisé l'Interactions API comme nouvelle interface par défaut pour ses modèles et agents Gemini. Ce changement architectural remplace l'ancienne API generateContent, jusqu'ici l'interface standard pour interroger les modèles Gemini via le Google AI Studio et les SDK associés. La nouvelle interface repose sur un schéma simplifié structuré autour d'étapes typées, abandonnant l'organisation précédente basée sur des rôles. Désormais, toutes les nouvelles fonctionnalités destinées aux agents seront exclusivement disponibles via cette API. Ce basculement a des conséquences directes pour les développeurs qui ont construit des applications ou des pipelines sur l'API generateContent : ils devront migrer vers le nouveau schéma pour accéder aux futures capacités. L'approche par étapes typées vise à rendre l'intégration plus claire et moins ambiguë, notamment pour les scénarios agentiques complexes où plusieurs actions s'enchaînent. En gelant les nouvelles fonctionnalités sur l'ancienne API, Google crée une pression de migration qui devrait accélérer l'adoption du nouveau standard. Ce choix s'inscrit dans une tendance de fond chez les grands fournisseurs de modèles : aligner l'interface de programmation sur les besoins des systèmes agentiques, qui nécessitent une gestion fine des états, des outils et des flux d'exécution. Google, qui fait face à une concurrence intense d'OpenAI et Anthropic sur le segment des agents IA, cherche à offrir une base technique plus cohérente pour les développeurs. L'Interactions API représente ainsi moins un simple changement d'interface qu'une réorientation stratégique de la plateforme Gemini vers les usages agentiques de nouvelle génération.

UELes développeurs européens ayant intégré l'API generateContent de Gemini dans leurs applications devront planifier une migration vers l'Interactions API pour continuer à accéder aux nouvelles fonctionnalités agentiques de Google.

OutilsOutil
1 source
Sans Claude Fable 5 : Sakana atteint les performances de pointe avec son système multi-modèles Fugu
407VentureBeat AI 

Sans Claude Fable 5 : Sakana atteint les performances de pointe avec son système multi-modèles Fugu

Sakana AI a lancé Fugu, un système d'orchestration multi-agents accessible via une API compatible OpenAI, conçu pour égaler les performances des modèles d'IA les plus avancés sans dépendre d'un fournisseur unique. Fondée par David Ha, ancien directeur de recherche chez Google Brain, la startup propose deux déclinaisons : Fugu, optimisé pour les tâches courantes à faible latence et intégrable directement dans des environnements de développement comme Codex, et Fugu Ultra, destiné aux travaux complexes tels que la recherche en IA, l'analyse en cybersécurité ou les investigations de brevets, facturé 5 dollars le million de tokens en entrée et 30 dollars en sortie. Le système fonctionne comme un chef d'orchestre : face à une requête, il la décompose en sous-tâches, les délègue à un ensemble de modèles spécialisés, vérifie leurs résultats, puis synthétise la réponse finale. Fugu est lui-même un LLM entraîné à appeler d'autres LLMs, y compris des instances de lui-même de façon récursive, selon les équipes de Sakana. Le lancement intervient dans un contexte précis : le 12 juin 2026, Anthropic a révoqué l'accès public à ses deux modèles les plus puissants, Claude Mythos 5 et Claude Fable 5, sous la pression d'un décret américain de contrôle des exportations. Pour Ha, cet événement illustre un risque systémique majeur pour les entreprises et les gouvernements qui s'appuient sur un seul fournisseur d'IA. "L'accès aux meilleurs modèles peut disparaître du jour au lendemain", a-t-il écrit sur X. Fugu répond à ce problème en s'appuyant sur un pool de modèles entièrement interchangeable, dont la composition exacte reste propriétaire, rendant le système résilient face aux restrictions géopolitiques ou commerciales soudaines. Ce projet s'inscrit dans une tendance plus large qui fait de l'orchestration intelligente de modèles la prochaine frontière de l'IA, au-delà de la seule course à la taille des paramètres. Fugu repose sur deux travaux de recherche publiés par Sakana en 2026, TRINITY et Conductor, qui formalisent des stratégies de coordination apprises plutôt que des workflows codés à la main. En affichant des performances comparables ou supérieures à Fable et Mythos sur des benchmarks d'agents tiers, Sakana cherche à convaincre entreprises et États que la résilience collective vaut mieux que la dépendance à un modèle monolithique. Dans un contexte géopolitique de plus en plus fragmenté, la startup, désormais clairement tournée vers le marché entreprise, pourrait s'imposer comme un acteur clé de l'infrastructure IA critique mondiale.

UELes entreprises et institutions européennes exposées aux restrictions d'exportation américaines sur les modèles IA disposent avec Fugu d'une alternative d'orchestration multi-modèles résiliente, réduisant leur dépendance à un fournisseur unique.

💬 La révocation de l'accès à Fable et Mythos sur décret américain le 12 juin dernier, c'est le genre d'événement qui transforme un argument de vente en argument de survie. Ne jamais dépendre d'un seul fournisseur d'IA pour des usages critiques, c'est désormais moins une recommandation qu'une évidence industrielle. Fugu arrive exactement au bon moment, reste à voir si les perfs en prod tiennent la promesse des benchmarks.

OutilsOpinion
1 source
Objectifs climatiques ou IA ? Pour le lobby des data centers, l’Europe doit choisir
408Next INpact 

Objectifs climatiques ou IA ? Pour le lobby des data centers, l’Europe doit choisir

Lex Coors, président de l'association européenne des centres de données (European Data Centres Association), a formulé un ultimatum brutal devant Politico : l'Union européenne doit choisir entre ses objectifs climatiques et la course à l'intelligence artificielle. Sa sortie intervient dans le cadre du plan d'action continental de la Commission européenne, qui ambitionne de tripler les capacités des data centers d'ici 2032. Or selon Coors, dont le lobby représente également des géants américains comme Microsoft, Google et Amazon, cette montée en puissance est irréalisable en ne s'appuyant que sur l'énergie nucléaire et renouvelable, trop lentes à déployer selon lui. Il appelle donc à « ouvrir la conversation » sur le recours aux énergies fossiles, des sources auxquelles les majors de la tech font déjà largement appel aux États-Unis. L'enjeu est considérable. Les émissions de CO₂ des centres de données français s'envolent déjà, et l'intégration massive de nouvelles infrastructures fait peser une pression inédite sur les réseaux électriques européens, même en France, productrice nette d'électricité, le réseau peine à absorber les pics de consommation liés aux nouveaux datacenters. Céder aux demandes du lobby reviendrait à renoncer formellement aux engagements climatiques européens, au moment même où une vague de canicule historique frappe le continent. Le commissaire européen à l'Énergie, Dan Jørgensen, tient pourtant un discours opposé : les data centers restent les bienvenus, à condition de financer le déploiement d'énergies renouvelables et de valoriser leur chaleur résiduelle. Cette tension s'inscrit dans un contexte de pression croissante sur la souveraineté numérique européenne. Mi-juin, le think tank bruxellois Europe 2031 publiait une « expérience de pensée » avertissant que l'UE serait marginalisée économiquement si elle ne rejoignait pas la course à l'IA selon les modalités américaines ou chinoises. Le lendemain, Donald Trump contraignait Anthropic à couper l'accès de ses modèles Fable 5 et Mythos 5 aux pays étrangers, illustration concrète des risques de dépendance technologique. Le think tank Shift Project alertait dès octobre 2025 sur ce même dilemme : une politique IA menée sans discernement pourrait rendre les objectifs climatiques européens inaccessibles. La position de Coors radicalise ce débat en le posant comme un choix binaire, une rhétorique que scientifiques et organisations climatiques contestent vivement, rappelant que les énergies fossiles alimentent précisément la vulnérabilité climatique et énergétique que l'Europe cherche à réduire.

UELa Commission européenne est directement mise sous pression pour choisir entre ses engagements climatiques et le triplement des capacités de data centers d'ici 2032, un arbitrage qui conditionne la politique énergétique française et la souveraineté numérique européenne.

💬 Le lobby présente ça comme un choix binaire, mais c'est une posture de négociation classique : agiter le spectre du retard IA pour forcer une concession sur les fossiles. Microsoft, Google et Amazon ont déjà gagné ce round aux États-Unis, ils testent maintenant la même rhétorique ici. Céder, c'est valider le modèle "croissance d'abord, climat ensuite" pour les vingt prochaines années.

InfrastructureReglementation
1 source
Claude Mythos a piraté la « quasi-totalité des systèmes classifiés » de la NSA en « quelques heures », mais c’était un test
40901net 

Claude Mythos a piraté la « quasi-totalité des systèmes classifiés » de la NSA en « quelques heures », mais c’était un test

Mythos, le modèle d'intelligence artificielle développé par Anthropic et spécialement conçu pour la détection de failles de sécurité, a réussi à compromettre la quasi-totalité des systèmes classifiés de la National Security Agency (NSA) en quelques heures seulement. L'exercice s'est déroulé dans un cadre strictement contrôlé, sous la supervision directe des agences fédérales américaines, qui avaient elles-mêmes organisé ce test de pénétration pour évaluer les capacités offensives des modèles d'IA de nouvelle génération. Les résultats ont immédiatement déclenché une onde de choc sur les réseaux sociaux, où l'information, sortie de son contexte opérationnel, a semé la confusion et alimenté une vague de panique. Pour la communauté de la cybersécurité, ces performances signalent un saut qualitatif majeur : jamais un système automatisé n'avait démontré une telle efficacité contre des infrastructures de renseignement aussi renforcées, soulevant des questions urgentes sur la vulnérabilité des systèmes d'information sensibles face à des agents IA autonomes. Cette démonstration relance un débat politique brûlant aux États-Unis. L'administration Trump a récemment décidé de suspendre le déploiement de Claude Fable 5 et de Mythos 5, deux modèles Anthropic de dernière génération, sans en expliquer pleinement les raisons. Les résultats du test NSA donnent désormais une lecture possible à cette décision, suggérant que Washington cherche à maîtriser la diffusion de capacités offensives jugées trop puissantes, alors que la frontière entre outil défensif et arme cyber devient de plus en plus poreuse.

UELes capacités offensives autonomes démontrées contre des infrastructures de renseignement renforcées relancent les débats sur la résilience des systèmes d'information sensibles européens face aux agents IA de nouvelle génération.

SécuritéActu
1 source
Emmanuel Macron appelle à un sursaut européen pour ne pas être « consommateurs d’une technologie faite par d’autres »
410Numerama 

Emmanuel Macron appelle à un sursaut européen pour ne pas être « consommateurs d’une technologie faite par d’autres »

Emmanuel Macron a clôturé la dixième édition de VivaTech avec un discours offensif sur la souveraineté technologique européenne, appelant la France et ses partenaires à ne pas se contenter d'être « consommateurs d'une technologie faite par d'autres ». Intervenant après une semaine particulièrement dense pour l'écosystème tech français, le président a évoqué plusieurs décisions concrètes : le déploiement d'un assistant IA au sein de la fonction publique française, un nouvel investissement dans le secteur numérique national, et la coupure du modèle Claude Fable d'Anthropic sur le territoire européen, illustrant la fragilité de la dépendance aux plateformes étrangères. L'enjeu est directement celui de la compétitivité industrielle du continent. En pointant le double risque d'une vassalité technologique vis-à-vis des États-Unis et de la Chine, Macron fixe un cap politique clair : investir dans des alternatives européennes, notamment en s'appuyant sur les modèles open source, pour ne pas abandonner aux acteurs étrangers la maîtrise des infrastructures numériques qui structureront l'économie et les services publics de demain. Ce discours intervient à quelques mois de la fin du second mandat de Macron, ce qui lui confère un caractère testamentaire. La France a multiplié les signaux volontaristes ces dernières années, soutien à Mistral AI, plan France 2030, accueil du Sommet pour l'action sur l'IA en février 2025, mais la course reste serrée face à des acteurs américains aux moyens sans commune mesure. Le choix de l'open source comme levier d'indépendance résume la tension entre ambition souveraine et réalisme économique qui traverse l'ensemble de la stratégie numérique européenne.

UEMacron annonce le déploiement d'un assistant IA dans la fonction publique française et oriente la stratégie numérique européenne vers les modèles open source pour réduire la dépendance aux plateformes américaines et chinoises.

💬 La coupure de Claude Fable en Europe cette semaine illustre mieux que n'importe quel discours ce que "dépendance technologique" veut dire en pratique. Macron a raison de miser sur l'open source, parce qu'on n'a clairement pas les milliards pour rivaliser sur la puissance de calcul. Le plan France 2030 et Mistral, c'est bien, mais on court encore après un train qui accélère.

RégulationReglementation
1 source
Le jour où la Silicon Valley a compris qu’elle n’était pas souveraine
411FrenchWeb 

Le jour où la Silicon Valley a compris qu’elle n’était pas souveraine

Depuis vendredi 13 juin 2026, l'interdiction d'accès aux modèles Mythos et Fable d'Anthropic en Europe a provoqué une onde de choc dans l'industrie technologique. Des milliers d'entreprises et développeurs qui intégraient ces outils dans leurs produits se sont retrouvés du jour au lendemain privés de services sur lesquels ils avaient bâti des infrastructures entières. La décision, dont les contours réglementaires restent flous, a déclenché une cascade de réactions des deux côtés de l'Atlantique. L'événement agit comme un révélateur brutal d'une dépendance longtemps ignorée. Pour les acteurs européens du numérique, petites startups comme grandes entreprises, le blocage soudain d'un modèle fondateur illustre concrètement ce que signifie s'appuyer sur des infrastructures dont on ne contrôle ni la gouvernance ni la continuité. La question n'est plus théorique : une décision unilatérale américaine, qu'elle soit réglementaire, commerciale ou géopolitique, peut interrompre des services critiques sans préavis. Le débat sur la souveraineté numérique européenne couvait depuis des années, alimenté par la domination des hyperscalers américains sur le cloud et, désormais, sur l'IA générative. L'Europe investit dans des initiatives comme Mistral ou les programmes de recherche publique, mais la dépendance aux modèles frontier américains reste massive. Cet épisode pourrait accélérer les discussions autour d'une véritable politique industrielle de l'IA au niveau de l'Union, tout en forçant la Silicon Valley à mesurer les risques géopolitiques de son propre rayonnement technologique.

UEL'interdiction soudaine des modèles Anthropic force des milliers d'entreprises et développeurs européens à migrer en urgence, révélant concrètement la vulnérabilité des infrastructures numériques du continent face à des décisions unilatérales américaines et relançant les débats sur une politique industrielle de l'IA à l'échelle de l'Union.

💬 Des services entiers qui tombent parce qu'une décision a été prise à San Francisco, du jour au lendemain, sans préavis. Le mot "dépendance numérique" était dans tous les rapports depuis des années ; personne n'avait eu à l'expliquer à un client en panique avant cette semaine. Mistral va recevoir quelques appels.

RégulationReglementation
1 source
Les modèles d'IA "dangereux" vont émerger quoi qu'il arrive
412Ars Technica AI 

Les modèles d'IA "dangereux" vont émerger quoi qu'il arrive

Anthropic a retiré ses modèles Claude Fable 5 et Mythos 5 de la circulation fin juin 2026, à la suite d'une directive américaine de contrôle des exportations interdisant à "tout ressortissant étranger" d'accéder à ces services. La société est en négociation avec la Maison Blanche depuis vendredi, sans accord conclu à ce stade pour les remettre en ligne. Mythos 5 avait été lancé la semaine précédente auprès d'un cercle restreint, via le groupe de travail Project Glasswing, qui avait déjà reçu une version antérieure baptisée Mythos Preview en avril. Claude Fable 5, un modèle de niveau équivalent à Mythos, avait lui été rendu accessible au grand public, mais avec des restrictions explicites sur les réponses liées à la biologie et à la cybersécurité. Ces restrictions ne sont pas anodines : Anthropic reconnaît elle-même que Mythos est capable d'identifier des vulnérabilités logicielles pour aider les professionnels à les corriger, mais aussi de concevoir des méthodes d'exploitation qui pourraient servir à des acteurs malveillants. Dans un billet de blog accompagnant le lancement, la société formule ce paradoxe sans détour : les mêmes requêtes utiles entre les mains d'un chercheur en cybersécurité ou en biologie peuvent devenir dangereuses si elles sont accessibles sans contrôle. C'est précisément pour cela que Project Glasswing existe, comme mécanisme de diffusion controlée auprès d'experts habilités avant tout déploiement plus large. Cette crise illustre la tension croissante entre la vitesse de développement de l'IA de pointe et les impératifs de sécurité nationale américaine. Washington cherche à empêcher que des puissances étrangères, notamment étatiques, n'accèdent aux modèles les plus avancés avant que des garde-fous adéquats soient en place. Anthropic se retrouve au coeur de ce dilemme : l'entreprise a elle-même averti que des modèles aux capacités "dangereuses" arriveront inévitablement, quelles que soient les précautions. La question qui se pose désormais est de savoir si les mécanismes de contrôle existants, entre directives gouvernementales et consortiums d'accès restreint, sont réellement capables de contenir la diffusion de ces technologies, ou si la course est déjà trop avancée pour être régulée efficacement.

UELes contrôles américains d'exportation visant 'tout ressortissant étranger' privent directement les entreprises et développeurs européens d'accès aux modèles Fable 5 et Mythos 5, exposant la dépendance de l'UE aux modèles d'IA américains soumis à des décisions unilatérales de Washington.

☕️ Intelligence artificielle et taxation numérique au cœur du G7
413Next INpact 

☕️ Intelligence artificielle et taxation numérique au cœur du G7

Emmanuel Macron a réuni ses homologues du G7 à Évian ce 17 juin pour une session de travail consacrée à l'intelligence artificielle et à la régulation du numérique. À ses côtés, les dirigeants des États-Unis, de l'Allemagne, du Canada, de l'Italie, du Japon et du Royaume-Uni ont débattu de la sécurisation des systèmes d'IA, de la protection des mineurs en ligne et de la taxation des grandes plateformes technologiques. Plusieurs patrons de l'industrie étaient également présents, dont Sam Altman d'OpenAI, Dario Amodei d'Anthropic et Arthur Mensch de Mistral AI. Sur la question des mineurs face aux réseaux sociaux, les sept pays sont globalement alignés autour d'un âge minimum compris entre 15 et 16 ans. La taxation et la souveraineté numérique se sont en revanche révélées bien plus conflictuelles : le 15 juin, Donald Trump menaçait d'imposer des droits de douane à 100 % sur le vin français si la France supprimait sa taxe numérique de 3 % sur les revenus des géants de la tech réalisés sur le territoire français. Macron a rétorqué que ce n'était « pas les États-Unis qui décident ». Les tensions autour de la fiscalité numérique révèlent un rapport de force structurel entre les démocraties occidentales et Washington. La taxe française, instaurée en 2019, cible directement les plateformes américaines comme Google, Amazon ou Meta, et a resurgi au cœur des débats budgétaires nationaux. À l'international, le Canada a déjà dû renoncer à un projet similaire en 2025 sous pression américaine. L'enjeu est double : il s'agit à la fois de faire contribuer ces entreprises aux finances publiques des pays où elles opèrent, et de ne pas sacrifier cette ambition sous la menace de représailles commerciales. Pour la France et l'Europe, abandonner cette taxe reviendrait à reconnaître l'immunité fiscale de facto des géants technologiques américains. La question de la souveraineté sur les modèles d'IA a également pesé lourd dans les discussions, d'autant que les États-Unis ont récemment bloqué l'accès à Claude 5 et Mythos 5, les derniers modèles d'Anthropic. Cet épisode a cristallisé une prise de conscience déjà ancienne : la France et le reste de l'Europe dépendent massivement de fournisseurs technologiques non européens, tant pour les modèles d'IA que pour la puissance de calcul nécessaire à leur entraînement et à leur déploiement. Mistral AI, représenté par Arthur Mensch, incarne l'ambition européenne d'une alternative crédible, mais le chemin reste long face aux investissements colossaux déployés outre-Atlantique. Donald Trump devait encore être reçu par Macron dans la soirée au château de Versailles, ouvrant la porte à des négociations bilatérales en marge du sommet.

UELe G7 d'Évian met directement en jeu la taxe numérique française de 3 % et la souveraineté européenne sur les modèles d'IA, avec des menaces de représailles commerciales américaines et une dépendance structurelle aux fournisseurs non européens en ligne de mire.

💬 Le blocage de Claude 5 et Mythos 5 en Europe par Washington, c'est l'argument que t'avais pas envie de voir arriver. Quand le fournisseur peut couper l'accès au modèle sur décision politique, la souveraineté numérique cesse d'être un débat de séminaire. Le Canada a déjà plié sur la taxe, la France tient, mais Macron finit sa soirée à Versailles avec Trump, ce qui en dit long sur où ça se joue vraiment.

RégulationReglementation
1 source
Les politiques gouvernementales imprévisibles, nouveau risque de l'IA
414The Information AI 

Les politiques gouvernementales imprévisibles, nouveau risque de l'IA

L'administration Trump a adressé ce week-end un avertissement formel à Anthropic : aucun étranger, y compris les propres employés étrangers de l'entreprise, ne peut accéder aux derniers modèles d'intelligence artificielle de la société sans autorisation préalable du gouvernement. Anthropic se retrouve ainsi dans un bras de fer inédit avec Washington autour de l'accès à ses modèles les plus récents. Dans la foulée, les dirigeants d'OpenAI ont envoyé samedi une note interne à leurs équipes, affirmant avoir signifié à l'administration que le développement de l'IA "nécessite les meilleurs talents du monde entier", une prise de position directement motivée par l'inquiétude que suscite le précédent Anthropic. Cette intervention gouvernementale introduit une nouvelle catégorie de risque pour l'ensemble du secteur de l'IA : l'imprévisibilité réglementaire. Les entreprises qui investissent des milliards dans des infrastructures de calcul et recrutent à l'international se retrouvent exposées à des décisions administratives susceptibles de bouleverser leurs opérations du jour au lendemain. Pour des acteurs dont les équipes de recherche sont largement constituées de talents étrangers, une telle restriction touche directement à leur capacité de production et de compétitivité, bien au-delà des seules considérations commerciales. Ce contexte s'inscrit dans une posture plus large de l'administration américaine qui cherche à contrôler la diffusion des technologies d'IA les plus avancées, notamment pour des raisons de sécurité nationale et de concurrence géopolitique avec la Chine. Les contrôles à l'exportation des semi-conducteurs et des modèles d'IA se durcissent depuis plusieurs mois, mais les restrictions à l'accès interne selon la nationalité des employés représentent une évolution significative. Si ce précédent venait à se généraliser, il pourrait remodeler les stratégies de recrutement, d'organisation et de déploiement de toutes les grandes entreprises américaines du secteur, au moment même où elles tentent d'attirer les meilleurs chercheurs mondiaux pour maintenir leur avance technologique.

UELes chercheurs européens employés par des entreprises américaines d'IA pourraient se voir restreindre l'accès aux modèles avancés, et le durcissement des contrôles américains à l'exportation menace l'accès des acteurs européens aux technologies de pointe.

💬 Ça, c'est le genre de friction qu'on n'avait pas vue venir. Les meilleurs labos d'IA américains ont bâti leurs équipes de recherche en recrutant partout dans le monde, et Washington vient de leur signifier que ces mêmes chercheurs n'ont plus accès aux modèles sur lesquels ils bossent. Le paradoxe : vouloir gagner la course à l'IA face à la Chine en commençant par handicaper ses propres équipes.

RégulationReglementation
1 source
GLM-5.2 à poids ouverts de Z.ai surpasse GPT-5.5 sur plusieurs benchmarks de codage long terme, pour un sixième du coût
415VentureBeat AI 

GLM-5.2 à poids ouverts de Z.ai surpasse GPT-5.5 sur plusieurs benchmarks de codage long terme, pour un sixième du coût

La startup chinoise Z.ai (anciennement Zhipu AI) a annoncé le 17 juin 2026 la disponibilité immédiate de GLM-5.2, un modèle de langage open-weights de 753 milliards de paramètres conçu spécifiquement pour les tâches de développement logiciel autonomes et de longue durée. Le modèle est accessible dès maintenant sur Hugging Face, via l'API Z.ai et dans plus de 20 environnements de développement tiers. Il dispose d'une fenêtre de contexte stable d'un million de tokens et des abonnements entreprise démarrent à 12,60 dollars par mois. Ses poids sont publiés sous licence MIT sans restriction, permettant à quiconque de le télécharger, de le personnaliser et de le déployer localement. Sur les benchmarks industriels, GLM-5.2 surpasse GPT-5.5 d'OpenAI sur plusieurs épreuves clés : SWE-bench Pro (62,1 contre 58,6), FrontierSWE (74,4 % contre 72,6 %), MCP-Atlas (77,0 contre 75,3) et PostTrainBench (34,3 % contre 25,0 %). Il talonne Claude Opus 4.8 d'Anthropic sur la quasi-totalité de ces tests. La sortie de GLM-5.2 arrive à un moment stratégiquement décisif pour les entreprises qui dépendent de modèles d'IA de pointe. La semaine précédente, l'administration Trump a publié une directive de contrôle des exportations interdisant aux ressortissants étrangers d'utiliser Claude Fable 5 d'Anthropic, ce qui a conduit Anthropic à retirer ce modèle de l'accès global pour tous les utilisateurs. Pour les responsables techniques en dehors des États-Unis, GLM-5.2 offre une alternative concrète : un modèle de niveau frontier hébergeable en interne, hors de portée des restrictions géographiques et des aléas réglementaires américains. Son coût d'exploitation réduit à un sixième de celui des modèles propriétaires équivalents renforce encore son attrait pour les organisations soucieuses de maîtriser leur infrastructure IA. Sur le plan architectural, GLM-5.2 introduit une optimisation appelée IndexShare, qui réutilise un même indexeur pour quatre couches d'attention sparse consécutives, réduisant de 2,9 fois le nombre de FLOPs par token à longueur de contexte maximale. Le modèle intègre également une couche Multi-Token Prediction améliorée, qui accroît de 20 % la longueur des tokens acceptés lors de l'inférence, ainsi que des modes de raisonnement sélectionnables, "Max" pour la puissance maximale, "High" pour un équilibre performance-latence. Z.ai s'inscrit ainsi dans une tendance de fond portée par des acteurs chinois comme DeepSeek, qui misent sur l'open-source et l'efficacité architecturale pour rivaliser avec les laboratoires occidentaux disposant de budgets bien supérieurs. Avec GLM-5.2, la compétition pour le leadership en IA agentic se déplace clairement au-delà des frontières américaines.

UELes entreprises et développeurs français et européens disposent désormais d'une alternative frontier auto-hébergeable sous licence MIT, hors de portée des restrictions d'exportation américaines qui ont récemment limité l'accès aux modèles de pointe d'Anthropic.

💬 Le moment est trop bien choisi pour être un hasard. Z.ai sort un 753 milliards de paramètres open-weights qui passe devant GPT-5.5 sur le code, MIT, hébergeable où tu veux, pile une semaine après qu'Anthropic a dû couper Fable 5 globalement sur pression de Washington. Pour les boîtes européennes qui cherchaient une sortie de la dépendance cloud américaine, bon, la voilà.

LLMsOpinion
1 source
SpaceX va acquérir la plateforme de codage IA Cursor pour 60 milliards de dollars
416Ars Technica AI 

SpaceX va acquérir la plateforme de codage IA Cursor pour 60 milliards de dollars

SpaceX a annoncé l'acquisition de Cursor, la plateforme de codage assistée par intelligence artificielle, pour 60 milliards de dollars dans une transaction entièrement en actions. L'opération a été révélée ce lundi et devrait être finalisée au troisième trimestre de l'année. Elle intervient deux jours seulement après l'introduction en bourse historique de SpaceX, et quelques mois après la fusion entre SpaceX et xAI, la société d'IA d'Elon Musk, qui avait déjà entraîné une importante restructuration de l'écosystème. Cursor s'est imposé comme l'un des premiers outils à intégrer nativement les grands modèles de langage dans un environnement de développement intégré. Construit comme un fork de Visual Studio Code, il permet aux développeurs de générer, modifier et déboguer du code grâce à l'IA directement dans leur éditeur. Cette acquisition confère à l'empire technologique de Musk une position centrale dans le marché des outils de développement, en pleine explosion, et renforce la synergie entre les capacités de xAI et les besoins opérationnels de SpaceX. L'annonce s'inscrit dans une course effrénée autour des assistants de codage IA. Si Cursor a été pionnier dans ce segment, des concurrents comme GitHub Copilot de Microsoft, ainsi que des outils développés par Anthropic ou Google, ont depuis proposé des fonctionnalités comparables, rognant sur son avantage différentiel. En intégrant Cursor à son portefeuille post-fusion, SpaceX-xAI cherche visiblement à consolider une verticale technologique complète, des infrastructures spatiales aux logiciels de développement, sous une même bannière.

UEUne opération de 60 milliards de dollars susceptible de déclencher un examen par la Commission européenne au titre du règlement sur les concentrations, avec des répercussions potentielles sur le marché des outils de développement pour les entreprises tech européennes.

💬 60 milliards pour un fork de VS Code, ça semble dingue, mais Cursor perdait du terrain depuis quelques mois, et dans ce marché-là, t'achètes avant que la fenêtre se ferme. Ce que Musk construit depuis la fusion xAI, c'est une verticale complète : des fusées aux outils de dev. Reste à voir si ça tient ensemble.

Adieu Fable
417Ben's Bites 

Adieu Fable

Le 9 juin 2026, Anthropic lançait Claude Fable 5, son nouveau modèle grand public dérivé de Mythos, une architecture réservée à un cercle restreint d'entreprises en raison de son potentiel de risque en cybersécurité. Fable était conçu comme une version de Mythos dotée de garde-fous pour un usage général. Trois jours plus tard, le 12 juin, le modèle disparaissait de l'accès public. En cause : le gouvernement américain, alerté par une faille de jailbreak découverte via Fable, a ordonné la suspension immédiate de l'accès à Fable 5 et Mythos 5 pour tous les ressortissants étrangers, qu'ils soient à l'intérieur ou à l'extérieur des États-Unis, y compris les employés d'Anthropic eux-mêmes qui ne sont pas citoyens américains. Anthropic, incapable d'implémenter proprement un filtrage par nationalité, a préféré couper l'accès pour tout le monde. La situation illustre une tension inédite dans l'industrie de l'IA : un modèle de pointe, lancé avec fanfare, retiré en moins d'une semaine sur pression gouvernementale. Selon les benchmarks publiés dans la même période, Fable 5 surpassait GPT-5.5, ce qui en faisait l'un des modèles les plus capables du marché au moment de son retrait. La décision soulève une question fondamentale : si un modèle est jugé trop dangereux, pourquoi la nationalité de l'utilisateur constitue-t-elle la ligne de démarcation ? Anthropic perd ici non seulement des utilisateurs, mais aussi une partie de sa crédibilité et de sa légitimité à opérer globalement, ce que certains observateurs résument comme une perte du "mandat du ciel". Les équipes étrangères de l'entreprise, directement affectées, ne peuvent plus utiliser leurs propres outils. Cet épisode s'inscrit dans une dynamique plus large de militarisation progressive du discours autour des grands modèles de langage aux États-Unis, où la cybersécurité sert de prétexte à des restrictions d'accès géopolitiques. Anthropic avait déjà positionné Mythos comme une architecture à accès contrôlé, consciente des risques. La faille de jailbreak identifiée serait reproductible sur d'autres modèles comme GPT-5.5, ce qui relativise la singularité du danger, mais n'a pas suffi à convaincre Washington. En parallèle, la concurrence s'intensifie : DeepSeek vient de lever 7,4 milliards de dollars lors de son premier tour de table, valorisant la startup chinoise à plus de 50 milliards, avec son propre PDG comme principal investisseur à hauteur de 40 %. Dans cet environnement de plus en plus fragmenté entre puissances technologiques, la capacité d'Anthropic à maintenir un accès universel à ses modèles les plus avancés apparaît fragilisée.

UELes utilisateurs et entreprises européens sont directement privés d'accès à Claude Fable 5 et Mythos 5, les modèles les plus performants du marché au moment du retrait, suite à une restriction imposée par le gouvernement américain à tous les ressortissants étrangers, forçant une réévaluation urgente des dépendances à l'infrastructure IA américaine.

💬 Meilleur modèle du marché, retiré en 72 heures sur pression gouvernementale. Ce qui est nouveau ici, c'est pas qu'un modèle soit dangereux, c'est que la nationalité devienne le critère de sécurité, et qu'Anthropic, coincée, préfère couper tout accès plutôt que d'implémenter un filtrage bancal. Pour les boîtes européennes qui avaient misé dessus, c'est un rappel brutal que l'infrastructure qu'on utilise n'est pas la nôtre.

SécuritéOpinion
1 source
Le coût de l'IA s'impose comme enjeu central, du moins en Asie
418The Information AI 

Le coût de l'IA s'impose comme enjeu central, du moins en Asie

Anthropic traverse une crise diplomatique sans précédent. Vendredi soir, l'administration Trump a annoncé qu'elle couperait l'accès aux deux modèles phares de la startup californienne, Claude Fable 5 et Claude Mythos 5, aux ressortissants étrangers. La décision a contraint Anthropic à retirer temporairement ces modèles de l'accès général. Cette semaine, des dirigeants de l'entreprise se trouvent à Washington pour des réunions d'urgence avec des responsables de l'administration, dans l'espoir de trouver une issue à ce bras de fer. L'escalade est d'autant plus surprenante qu'elle implique Amazon, l'un des principaux investisseurs d'Anthropic et son fournisseur de puces et de capacité de calcul. Selon des informations révélées samedi, le PDG d'Amazon Andy Jassy aurait transmis ces derniers jours à de hauts responsables Trump des préoccupations relatives aux risques de sécurité posés par les modèles les plus avancés d'Anthropic. Les motivations de Jassy restent floues : a-t-il joué un jeu stratégique subtil, ou a-t-il simplement sous-estimé les conséquences de ses alertes ? La question divise les observateurs. Cette crise s'ajoute à des tensions déjà croissantes entre Anthropic et sa base de clients, rapportées quelques jours plus tôt. Pour sortir de l'impasse, plusieurs scénarios circulent. Anthropic pourrait renforcer les mécanismes de sécurité de ses modèles, ou offrir au gouvernement américain une participation au capital de l'entreprise, une formule déjà discutée avec d'autres laboratoires d'intelligence artificielle. En parallèle, l'IA affronte un défi d'un tout autre ordre en Asie : si le secteur y échappe aux controverses politiques qui agitent les États-Unis, il se heurte à une hausse structurelle des coûts d'exploitation qui fragilise la popularité et la viabilité économique de nombreux services.

UELa restriction d'accès aux modèles Claude Fable 5 et Mythos 5 imposée aux ressortissants étrangers par l'administration Trump touche directement les entreprises et développeurs européens dépendant de ces modèles, les contraignant à évaluer des alternatives ou à suspendre leurs déploiements en attente de l'issue des négociations.

💬 Andy Jassy qui alerte Trump sur les risques des modèles dans lesquels Amazon a mis des milliards, je cherche encore la logique. Le vrai problème, c'est pas la restriction d'accès (ça se négocie), c'est qu'un actionnaire central fait ça pendant une crise. Si Claude est en prod chez toi, c'est maintenant qu'il faut regarder les alternatives, pas quand l'accès sera définitivement coupé.

RégulationReglementation
1 source
Mistral serait valorisée 20 milliards d’euros après une levée de 3 milliards
419Le Big Data 

Mistral serait valorisée 20 milliards d’euros après une levée de 3 milliards

Mistral AI est en discussions avancées pour lever environ 3 milliards d'euros auprès d'investisseurs, une opération qui valoriserait la startup française à près de 20 milliards d'euros selon des informations révélées par Bloomberg le 14 juin 2026. Ce montant représenterait presque un doublement de sa valorisation précédente, établie à 11,7 milliards d'euros lors de son tour de table de série C en septembre 2025. Fondée en avril 2023 par d'anciens chercheurs de Google DeepMind et Meta, Mistral aurait levé au total environ 4 milliards de dollars depuis sa création. Si cette opération se concrétise, l'entreprise rejoindrait le cercle restreint des startups technologiques les plus valorisées d'Europe, aux côtés de groupes bien plus anciens et établis. Cette levée de fonds aurait des conséquences directes sur la capacité de Mistral à rivaliser à plus long terme avec les géants américains. Avec ces nouvelles ressources, l'entreprise pourrait accélérer le développement de ses modèles, renforcer ses infrastructures, elle construit actuellement un centre de données en région parisienne et en dispose d'un autre en Suède, et élargir son offre pour les clients professionnels. Pour les entreprises et institutions européennes, l'enjeu dépasse la simple performance technique : souveraineté numérique, conformité au RGPD, maîtrise des données sensibles et réduction de la dépendance aux fournisseurs américains sont devenus des critères d'achat prioritaires. Mistral a su capitaliser sur cette demande en signant des partenariats avec l'armée française, le gouvernement luxembourgeois, Airbus, BMW et plusieurs grandes banques européennes. Mistral occupe une position singulière dans l'écosystème mondial de l'IA : elle est l'une des rares entreprises non américaines à publier des modèles en open weights tout en commercialisant des versions propriétaires spécialisées, développement logiciel, génération vocale, reconnaissance de caractères. Mais l'écart avec les leaders reste abyssal : OpenAI et Anthropic affichent des valorisations supérieures à 100 milliards de dollars chacune, et bénéficient d'une avance considérable en termes de revenus et de déploiement à grande échelle. La discussion est encore à un stade préliminaire et les conditions pourraient évoluer. Ce qui est clair, en revanche, c'est que les capitaux européens et internationaux se mobilisent autour de l'idée qu'un champion continental de l'IA est non seulement possible, mais nécessaire, et que Mistral est aujourd'hui le principal prétendant à ce rôle.

UEUne valorisation à 20 milliards d'euros renforcerait la capacité de Mistral à proposer aux entreprises et institutions françaises et européennes une alternative souveraine aux fournisseurs américains, avec des garanties accrues sur la conformité RGPD et la maîtrise des données sensibles.

💬 20 milliards, c'est le genre de chiffre qui commence à peser dans une salle de conseil. Ce qui m'intéresse là-dedans, c'est moins la valorisation que ce que ça dit de l'appétit des investisseurs pour un modèle non américain, ouvert ET propriétaire, avec des contrats gouvernementaux dans la poche. Reste que l'écart avec OpenAI ou Anthropic est encore massif, et qu'on parle de discussions préliminaires, pas d'un chèque signé.

BusinessActu
1 source
La Fable, le Mythos et la raison d’État
420Next INpact 

La Fable, le Mythos et la raison d’État

Le gouvernement de Donald Trump a ordonné à Anthropic de couper l'accès mondial à ses deux modèles les plus puissants, Fable 5 et Mythos 5, invoquant des raisons de sécurité nationale. La décision, appliquée sans préavis, a privé l'ensemble des clients internationaux d'Anthropic, entreprises, développeurs et particuliers, de ces outils qu'ils utilisaient depuis quelques jours seulement. Fable 5, rappelons-le, est la déclinaison grand public de Mythos 5, le modèle phare de la startup californienne. Les autres modèles de la gamme, Opus, Haiku et Sonnet dans toutes leurs versions, restent quant à eux accessibles sans restriction. La portée réelle de cette décision dépasse largement le cadre d'Anthropic : elle illustre de manière brutale et concrète ce que les experts désignent sous le terme de « kill switch » souverain. D'une simple directive, Washington a démontré sa capacité à priver le reste du monde de technologies sur lesquelles des entreprises et des administrations s'appuyaient déjà. En France, la réaction politique a été unanime et transpartisane : l'incident est venu alimenter les débats sur la dépendance technologique européenne vis-à-vis des États-Unis et sur la nécessité de construire des alternatives souveraines crédibles en intelligence artificielle. Cet épisode s'inscrit dans un contexte de tensions croissantes autour du contrôle des technologies d'IA les plus avancées. Les États-Unis cherchent depuis plusieurs années à limiter la diffusion internationale de leurs modèles les plus puissants, notamment face à la Chine, et l'administration Trump a accéléré cette logique de restriction au nom de l'intérêt national. Pour Anthropic, l'affaire constitue paradoxalement une démonstration de la puissance perçue de ses modèles, mais elle fragilise la confiance des clients non américains. Pour l'Europe, elle renforce l'urgence d'investir massivement dans des infrastructures et des modèles d'IA qui ne seraient pas soumis au bon vouloir d'une puissance étrangère.

UEL'incident a déclenché en France une réaction politique transpartisane et illustre concrètement la vulnérabilité des entreprises et administrations européennes face à un contrôle souverain américain sur les modèles d'IA, renforçant l'urgence de développer des alternatives IA souveraines en Europe.

💬 On l'appelait le "kill switch souverain" et ça restait abstrait. Là, des entreprises qui utilisaient Fable 5 depuis cinq jours se sont retrouvées coupées du jour au lendemain, sans préavis, sur décision de Washington. Ça va être difficile de continuer à construire des stratégies IA sur des fondations qu'un tweet de la Maison Blanche peut effacer.

RégulationReglementation
1 source
Washington interdit Mythos 5 : l’Amérique veut contrôler les modèles, quelle sera la réponse des acteurs de l’IA?
421FrenchWeb 

Washington interdit Mythos 5 : l’Amérique veut contrôler les modèles, quelle sera la réponse des acteurs de l’IA?

Le gouvernement américain a ordonné vendredi soir à Anthropic de suspendre immédiatement l'accès à Mythos 5 et Fable 5, ses deux modèles les plus avancés dans le domaine de la cybersécurité. La directive s'appuie sur des impératifs de sécurité nationale et mobilise les pouvoirs de contrôle des exportations dont dispose Washington, un arsenal juridique habituellement réservé aux technologies militaires et aux semi-conducteurs. Anthropic, dont le siège est à San Francisco, n'a eu d'autre choix que de se conformer dans l'immédiat. Cette décision marque un tournant dans la régulation de l'IA générative aux États-Unis. En ciblant spécifiquement les capacités cyber des modèles, Washington envoie un signal clair : certaines aptitudes de l'IA, jugées trop sensibles, relèvent désormais du domaine régalien. Pour les entreprises qui utilisaient ces modèles dans leurs outils de sécurité informatique, la coupure est immédiate et sans alternative garantie. Pour l'industrie dans son ensemble, le précédent est considérable : si les autorités peuvent suspendre un produit commercial au nom de la sécurité nationale, chaque laboratoire d'IA doit désormais intégrer ce risque réglementaire dans sa stratégie produit. Ce mouvement s'inscrit dans une tendance de fond observée depuis 2023, où Washington tente de reprendre la main sur la diffusion des technologies d'IA les plus puissantes, notamment face à la concurrence chinoise. Les contrôles à l'exportation des puces Nvidia avaient ouvert la voie ; le ciblage des modèles eux-mêmes constitue une étape supplémentaire. La question qui se pose désormais est celle de la réponse des autres acteurs du secteur : OpenAI, Google DeepMind et Meta développent tous des modèles aux capacités similaires, et observent attentivement la façon dont Anthropic négocie la suite.

UELes contrôles d'exportation américains sur les modèles IA pourraient restreindre immédiatement l'accès des entreprises européennes aux outils de cybersécurité fondés sur ces modèles, les exposant à un risque réglementaire unilatéral émanant de Washington.

💬 C'est le précédent qu'on craignait tous. Washington vient de démontrer qu'un modèle IA peut être coupé du jour au lendemain, exactement comme on coupe l'accès à une puce Nvidia, au nom de la sécurité nationale. Les boîtes européennes qui avaient intégré ces modèles dans leurs outils de sécu viennent de découvrir leur vraie dépendance.

RégulationReglementation
1 source
Fable et Mythos officiellement jugés trop dangereux pour être publiés
422Latent Space 

Fable et Mythos officiellement jugés trop dangereux pour être publiés

Trois jours seulement après leur lancement, Anthropic a dû suspendre l'accès à ses modèles Fable 5 et Mythos 5 pour l'ensemble de ses clients mondiaux, sur injonction verbale du gouvernement américain. Les autorités américaines ont invoqué un risque potentiel pour la cybersécurité nationale, lié à une supposée faille de type "jailbreak" qui rendrait ces modèles trop dangereux à diffuser librement. Anthropic a publiquement contesté cette décision, affirmant que le gouvernement ne lui a fourni que des preuves verbales d'une vulnérabilité "étroite et non universelle" et que la société "croit à un malentendu". L'entreprise a par ailleurs souligné que des capacités comparables sont disponibles dans d'autres modèles largement accessibles, dont GPT-5.5 d'OpenAI. Dans la foulée, des produits tiers comme Cognition/Devin et la plateforme Agent Arena ont immédiatement retiré ces modèles de leurs offres. L'événement illustre de façon brutale un risque jusqu'ici théorique pour l'industrie tech : une API frontier fermée peut disparaître du jour au lendemain pour des raisons géopolitiques, sans préavis opérationnel. Pour les équipes d'ingénierie et les entreprises qui ont bâti des produits sur ces modèles, la disruption est immédiate et difficilement réversible. Anthropic a tenté de limiter les dégâts en réinitialisant les limites d'utilisation hebdomadaires et horaires de ses autres modèles, mais le signal envoyé à l'industrie est clair : dépendre d'un seul fournisseur frontier expose désormais à un risque géopolitique explicite. Des voix influentes comme celles de Nathan Lambert, Theo et Cohere ont convergé vers la même conclusion : "posséder sa propre infrastructure compte." La plateforme Artificial Analysis a résumé la situation sans détour, notant qu'il s'agit de "la première fois que notre graphique Intelligence Frontier recule." Cet épisode n'est pas sans précédent pour Anthropic, qui avait déjà eu affaire aux autorités américaines, mais c'est la première fois qu'une restriction d'export frappe l'ensemble des clients dans le monde. Le débat sur la "souveraineté des modèles" a pris une nouvelle ampleur, notamment parmi les défenseurs de l'IA open source qui estiment que cette situation valide leur position. En parallèle, la semaine a également été marquée par une refonte des benchmarks de codage : Artificial Analysis a remplacé SWE-Bench Pro par DeepSWE dans son index d'agents de code, au motif que le premier benchmark était devenu manipulable par fuite de l'historique des dépôts. Ce changement a redistribué les classements, avec Claude Code associé à Fable 5 atteignant 77 points, devant Codex couplé à GPT-5.5 à 76. Ces deux événements simultanés posent une question de fond pour l'industrie : dans quelle mesure les classements mesurent-ils vraiment la capacité des modèles, plutôt que celle des infrastructures et des acteurs politiques qui les contrôlent.

UELes entreprises et développeurs européens ayant intégré Fable 5 ou Mythos 5 dans leurs produits sont directement touchés par la suspension immédiate, et cet épisode renforce l'argumentaire de l'UE en faveur de la souveraineté numérique et du développement d'infrastructures IA européennes indépendantes.

💬 Premier de benchmark le lundi, suspendu le mercredi. C'est le genre de retournement qui transforme un argument de conf en réalité opérationnelle, et là c'est "posséder son infra" qui passe de l'idéologique au stratégique. Les équipes qui avaient tout misé sur Fable sans plan B ont eu leur réponse ce weekend.

RégulationReglementation
1 source
Claude Fable 5 : le premier modèle Mythos est puissant, coûteux et très filtré
423The Decoder 

Claude Fable 5 : le premier modèle Mythos est puissant, coûteux et très filtré

Anthropic a lancé Claude Fable 5, le premier modèle de sa nouvelle gamme Mythos, positionnée au-dessus de la famille Claude 4. Le modèle domine quasiment tous les benchmarks actuels, dont SWE-bench Verified où il atteint 95 %, un score sans précédent pour une IA généraliste. La facture est à la hauteur des ambitions : Fable 5 est facturé 10 ou 50 dollars par million de tokens selon le niveau d'usage, soit le double du tarif d'Opus 4.8, jusqu'ici le modèle le plus cher de la gamme. Cette puissance accrue s'accompagne de contraintes significatives. Les filtres de sécurité, renforcés dans cette version, bloquent environ 9 % des requêtes, un taux notable qui risque de poser problème aux développeurs travaillant dans des secteurs sensibles comme la santé, le droit ou la sécurité informatique. Plus surprenant encore, Anthropic a introduit une politique de rétention des données de 30 jours qui s'applique désormais même aux contrats dits "zero data retention", une décision qui inquiète les entreprises ayant souscrit ces options précisément pour garantir la confidentialité totale de leurs échanges. Ce lancement marque une inflexion stratégique pour Anthropic, qui segmente désormais explicitement son offre par niveau de performance et de coût. La classe Mythos vise les usages professionnels et d'infrastructure les plus exigeants, là où la concurrence avec OpenAI et Google s'intensifie. La question du prix et des restrictions de contenu déterminera si les entreprises adoptent Fable 5 ou maintiennent des solutions moins onéreuses pour leurs pipelines de production.

UELa modification de la politique de rétention des données à 30 jours, y compris pour les contrats 'zero data retention', impose aux entreprises européennes une révision de leur conformité GDPR concernant les échanges avec l'API Anthropic.

💬 95% sur SWE-bench, c'est du solide. La rétention 30 jours imposée même aux contrats "zero data retention", c'est Anthropic qui change les règles en cours de route, et les entreprises européennes vont avoir un vrai sujet GDPR sur les bras. 9% de blocages sur un modèle vendu pour les cas pro les plus sensibles, ça va faire mal en prod.

LLMsOpinion
1 source
Le piratage de Meta révèle que la sécurité de l'IA va au-delà de Mythos
424MIT Technology Review 

Le piratage de Meta révèle que la sécurité de l'IA va au-delà de Mythos

Le 5 juin 2026, le média 404 Media révélait qu'une faille dans l'agent de support client basé sur l'IA de Meta avait permis à des pirates de s'emparer de comptes Instagram. La méthode était d'une simplicité déconcertante : les attaquants demandaient directement à l'agent de lier les comptes visés à des adresses e-mail qu'ils contrôlaient, et l'agent s'exécutait. Le seul obstacle technique consistait à utiliser un VPN affichant la localisation du propriétaire légitime du compte. Parmi les victimes, le compte officiel "Obama White House", resté inactif depuis des années, a été détourné pour diffuser des publications pro-iranniennes. D'autres comptes aux pseudonymes courts et rares, très prisés sur le marché noir, ont également été volés, vraisemblablement pour être revendus. Meta n'a pas expliqué publiquement comment cette vulnérabilité avait échappé à ses équipes, mais un porte-parole a indiqué lundi sur X que la faille avait été corrigée. Cette affaire illustre une catégorie de risques souvent sous-estimée dans le débat sur la sécurité de l'IA : non pas les systèmes d'IA utilisés comme armes offensives, mais les agents IA eux-mêmes comme cibles. Contrairement à un agent humain qui aurait probablement posé des questions de sécurité avant de modifier une adresse e-mail sensible, l'agent de Meta a suivi la demande sans résistance. "C'est presque comme un écolier qui veut juste faire plaisir au professeur", résume Somesh Jha, professeur en informatique à l'Université du Wisconsin-Madison. Jessica Ji, chercheuse au Center for Security and Emerging Technology de Georgetown, souligne l'aspect particulièrement troublant de cette négligence venant d'une entreprise disposant d'une expertise reconnue en cybersécurité et en IA. "Cela soulève des questions : y avait-il seulement des garde-fous en place ? A-t-on même pensé à tester ce type de scénario ?" La faille de Meta s'inscrit dans un contexte plus large d'inquiétudes croissantes autour de la sécurité des agents IA. En avril 2026, Anthropic avait reconnu que son modèle Mythos était trop performant en matière de piratage pour être diffusé au grand public, alimentant les craintes sur une IA offensive. Mais des chercheurs comme Neil Gong, professeur à Duke University, alertent depuis plusieurs années sur un autre front : les attaques visant les agents eux-mêmes, via des techniques comme l'injection de commandes indirectes dissimulées dans des e-mails ou des sites web. La vulnérabilité Meta était bien plus rudimentaire que ces exploits sophistiqués, ce qui rend sa non-détection d'autant plus surprenante. Les experts s'accordent sur les parades possibles : imposer des règles strictes via du code traditionnel en amont de l'agent, et soumettre tout agent destiné au public à des exercices rigoureux de "red-teaming" avant déploiement.

UELes millions d'utilisateurs européens d'Instagram sont directement exposés à ce type de faille ; l'incident renforce l'urgence d'exiger des audits de sécurité rigoureux pour les agents IA déployés en production, un angle que l'AI Act devra préciser dans ses actes d'exécution.

💬 L'exploit le plus bête est souvent le plus efficace. Tu demandes gentiment à l'agent de changer l'adresse mail, il s'exécute sans résistance, et le compte Obama finit à diffuser de la propagande iranienne. La vraie honte pour Meta, c'est pas l'attaque, c'est que leur red-team interne ne l'a pas vue venir avant les pirates.

SécuritéOpinion
1 source
OpenAI et Microsoft présentent de nouvelles offres IA aux entreprises
425The Information AI 

OpenAI et Microsoft présentent de nouvelles offres IA aux entreprises

Le même mardi, OpenAI et Microsoft ont chacun organisé un événement dédié aux entreprises, dans deux villes différentes. OpenAI a tenu une présentation à New York pour promouvoir de nouveaux outils d'intelligence artificielle à destination des professionnels, dont plusieurs conçus pour des secteurs précis comme le trading d'actions et la banque d'investissement. En parallèle, Microsoft tenait son propre événement à San Francisco, où l'entreprise a dévoilé du nouveau matériel informatique spécifiquement pensé pour l'IA, notamment un ordinateur de bureau et des modèles d'IA destinés aux entreprises clientes. Ces annonces simultanées illustrent la pression croissante que subissent les responsables des achats technologiques dans les grandes entreprises. La multiplication des offres d'IA entreprise rend les décisions d'achat de plus en plus complexes : chaque acteur majeur du secteur déploie désormais des équipes de consultants, souvent rebaptisés "forward-deployed engineers", pour convaincre les directions informatiques d'adopter leurs solutions. Pour OpenAI, dont le modèle économique repose largement sur les contrats d'entreprise, s'imposer sur ce segment est devenu une priorité stratégique et financière majeure. Le marché de l'IA en entreprise est aujourd'hui perçu comme un terrain sur lequel Anthropic, concurrent direct d'OpenAI, jouit d'une longueur d'avance et d'une image particulièrement solide auprès des directions techniques et des grands comptes. Microsoft, actionnaire historique d'OpenAI et partenaire de longue date des entreprises via Azure et la suite Office, occupe quant à lui une position établie dans cet écosystème. L'offensive conjointe des deux alliés témoigne néanmoins de l'intensification de la bataille pour capter les budgets informatiques des grandes organisations, à mesure que l'IA générative passe du stade expérimental à celui de l'outil opérationnel intégré dans les processus métier.

UELes entreprises européennes devront arbitrer entre les offres concurrentes d'OpenAI et Microsoft pour leurs budgets IA, avec une complexité croissante des décisions d'achat technologique à mesure que l'IA générative s'intègre dans les processus métier.

💬 Deux événements le même jour, deux villes différentes : OpenAI et Microsoft ne laissent plus rien au hasard sur le segment entreprise. Le signal, c'est qu'ils sentent tous les deux la pression d'Anthropic, qui s'est imposé chez les équipes techniques sans avoir eu besoin de tout ce cirque commercial. Reste à voir si les "forward-deployed engineers" suffisent à renverser ça.

MiniMax-M3 surpasse GPT-5.5 et Gemini 3.1 Pro sur des benchmarks clés, pour 5 à 10 % du coût
426VentureBeat AI 

MiniMax-M3 surpasse GPT-5.5 et Gemini 3.1 Pro sur des benchmarks clés, pour 5 à 10 % du coût

La startup chinoise MiniMax a lancé dimanche soir son modèle de langage MiniMax-M3, se positionnant d'emblée comme une alternative redoutable aux modèles propriétaires américains. Disponible via l'API MiniMax à un tarif promotionnel de 0,30 dollar par million de tokens en entrée et 1,20 dollar par million en sortie, le modèle affiche des performances supérieures à GPT-5.5 d'OpenAI et à Gemini 3.1 Pro de Google sur plusieurs benchmarks clés, pour 5 à 10 % de leur coût. Même à plein tarif, 0,60 dollar l'entrée et 2,40 dollars la sortie, M3 revient à seulement 8 à 20 % du prix des grands modèles propriétaires concurrents. L'entreprise a également annoncé la mise à disposition sous licence open source avec poids ouverts dans les dix prochains jours, permettant aux entreprises de télécharger et personnaliser le modèle gratuitement. M3 intègre par ailleurs une fenêtre de contexte d'un million de tokens, une multimodalité native, et des capacités avancées en codage et en traitement de tâches agentiques, avec un abonnement mensuel à partir de 20 dollars. Ce lancement remet en question une règle non écrite du secteur : les développeurs devaient jusqu'ici choisir entre des modèles fermés très performants mais coûteux, ou des modèles open source accessibles mais limités sur les raisonnements complexes et les longues séquences. MiniMax-M3 brouille cette frontière en combinant performance de pointe et coût marginal, ce qui pourrait redistribuer les cartes pour les équipes de développement cherchant à intégrer des capacités d'IA avancées sans exploser leurs budgets d'inférence. La possibilité de déployer les poids en local renforce encore l'intérêt pour les entreprises soucieuses de confidentialité ou cherchant à s'affranchir de dépendances API. Cette percée s'inscrit dans un mouvement plus large de rattrapage des laboratoires chinois face aux géants américains. DeepSeek, Alibaba avec Qwen, Moonshot via Kimi et désormais MiniMax publient à un rythme soutenu des modèles compétitifs à des prix agressifs, alimentant une guerre tarifaire qui contraint OpenAI, Google et Anthropic à revoir leurs propres grilles. Sur le plan technique, M3 repose sur une architecture originale baptisée MiniMax Sparse Attention, qui rompt avec les mécanismes d'attention traditionnels dont le coût de calcul croît quadratiquement avec la longueur des séquences. En découpant les matrices clé-valeur en blocs ciblés lus une seule fois, cette approche permet d'être plus de quatre fois plus rapide que des alternatives open source comparables sur de longues séquences. La disponibilité imminente des poids ouverts pourrait transformer M3 en référence de facto pour les entreprises cherchant un modèle frontier déployable en interne.

UELes développeurs et entreprises européens disposent d'une alternative frontier open source déployable localement, réduisant la dépendance aux API américaines et les coûts d'inférence de 80 à 95 %.

💬 C'est le lancement qui va forcer OpenAI et Google à bouger leurs prix, et cette fois c'est difficile à ignorer. 5 à 10 % du coût avec les benchmarks qui suivent, et les poids ouverts dans dix jours pour déployer en local, si tu travailles avec des LLMs tu vas regarder ça de près. Reste à voir ce que ça donne en conditions réelles, mais l'architecture Sparse Attention sur les longues séquences, c'est une vraie proposition technique, pas juste du dumping tarifaire.

LLMsOpinion
1 source
Les failles de Claude Mythos révèlent une réalité dure : vos correctifs d'entreprise sont beaucoup trop lents
427VentureBeat AI 

Les failles de Claude Mythos révèlent une réalité dure : vos correctifs d'entreprise sont beaucoup trop lents

Le 7 avril 2026, Anthropic a annoncé que Claude Mythos Preview était capable de découvrir de manière autonome des milliers de vulnérabilités zero-day dans les principaux systèmes d'exploitation et navigateurs, sans qu'on lui fournisse la moindre description technique préalable. Ce résultat referme une marge de sécurité que l'industrie croyait acquise : en 2024, des chercheurs de l'Université de l'Illinois avaient montré que GPT-4, armé d'une description CVE, pouvait exploiter 87 % des vulnérabilités d'un jeu de test de 15 failles connues, mais seulement 7 % sans cette description. Claude Mythos efface cette distinction. Le modèle a obtenu 83,1 % sur le benchmark CyberGym de reproduction de vulnérabilités, et une campagne d'attaque ciblant OpenBSD sur 1 000 exécutions n'a coûté que moins de 20 000 dollars. Les délais d'exploitation s'effondrent en parallèle : la faille Langflow CVE-2026-33017 (score CVSS 9,8) a été exploitée 20 heures après sa divulgation publique, sans proof-of-concept disponible. La vulnérabilité Marimo CVE-2026-39987 (CVSS 9,3) a été attaquée en 9 heures et 41 minutes. Ce changement de rythme détruit l'hypothèse fondamentale sur laquelle repose la gestion des correctifs dans la plupart des entreprises : l'idée qu'il reste suffisamment de temps entre la publication d'une faille et son exploitation pour déployer un patch en sécurité. Le rapport Threat Landscape 2026 de Rapid7 indique que le délai médian entre la publication d'un CVE et son inscription au catalogue KEV de la CISA est de cinq jours. Le rapport M-Trends 2026 de Google confirme que des exploitations surviennent désormais avant même qu'un correctif soit publié. Face à cette réalité, les équipes de sécurité ne peuvent plus s'appuyer sur le seul score CVSS pour prioriser leurs actions : ce score mesure la gravité théorique d'une faille, pas sa probabilité d'exploitation réelle. Une étude validée sur 28 377 vulnérabilités réelles propose un filtre en trois couches combinant le statut KEV de la CISA, le score EPSS (Exploit Prediction Scoring System) et le CVSS, avec un seuil EPSS fixé à 0,088 comme déclencheur d'escalade urgente. Résultat : un gain d'efficacité de 18 fois, une couverture de 85,6 % des vulnérabilités effectivement exploitées, et une réduction de 95 % du volume de remédiation urgente. Au-delà de la vitesse d'exploitation, l'essor des agents IA autonomes ouvre un second front. La faille CVE-2026-34040 de Docker illustre le problème : l'architecture de plugins d'autorisation de Docker contourne silencieusement tous les plugins lorsque le corps d'une requête dépasse 1 Mo, un comportement ignoré par des solutions courantes comme OPA, Casbin ou Prisma Cloud. Des chercheurs de Cyera ont démontré qu'un agent IA chargé de déboguer une infrastructure pouvait inférer ce chemin de contournement de manière autonome. Les politiques d'autorisation en place n'ont pas été conçues pour anticiper ce type de comportement agentique, et cet angle mort devient un risque mesurable à mesure que les systèmes IA accèdent à des ressources privilégiées. L'ensemble des sources de données nécessaires au filtre de priorisation (API CISA KEV, API EPSS de FIRST.org, NVD) sont ouvertes et gratuites, et leur intégration est entièrement automatisable.

UELes entreprises françaises et européennes doivent réviser leurs cycles de gestion des correctifs, car les délais d'exploitation automatisée par IA (désormais quelques heures) rendent obsolètes les pratiques traditionnelles de priorisation basées sur le seul score CVSS.

💬 Ce qui me frappe, c'est pas le rythme d'exploitation (neuf heures quarante et une sur Marimo CVE-2026-39987, sans proof-of-concept disponible), c'est que Claude Mythos trouve des zero-days sans description préalable, là où GPT-4 plafonnait à 7% dans les mêmes conditions en 2024. La fenêtre que s'accordaient les équipes sécurité entre publication et attaque vient de disparaître. Si ta politique de patch repose encore sur l'idée qu'on a quelques jours, c'est le postulat lui-même à retravailler, pas juste le processus.

SécuritéOpinion
1 source
Mistral AI lance Vibe, s'étend dans l'IA industrielle et annonce un grand centre de données pour concurrencer OpenAI
428VentureBeat AI 

Mistral AI lance Vibe, s'étend dans l'IA industrielle et annonce un grand centre de données pour concurrencer OpenAI

Mistral AI a tenu mercredi son tout premier sommet, l'AI NOW Summit, dans le centre de Paris, pour annoncer une expansion stratégique majeure sur trois fronts simultanément. Le cofondateur et PDG Arthur Mensch, accompagné du CTO Timothée Lacroix et du Chief Scientist Guillaume Lample, a présenté une plateforme baptisée Mistral for Industrial Engineering, fruit de l'acquisition d'Emmi AI finalisée plus tôt en mai 2026, qui intègre des capacités de simulation physique aux grands modèles de langage de la startup. La société a également annoncé la construction d'un nouveau datacenter au sud de Paris, financé en partie par une dette de 830 millions de dollars levée en mars 2026 auprès d'un consortium de sept banques. Mistral a par ailleurs rebaptisé son assistant grand public sous le nom Vibe. L'entreprise, fondée il y a trois ans avec quinze employés et BNP Paribas comme premier client, compte aujourd'hui 1 000 collaborateurs et vise un milliard d'euros de chiffre d'affaires pour 2026, valorisée à 11,7 milliards d'euros après une Série C de 1,7 milliard d'euros menée par ASML en septembre 2025. La plateforme industrielle cible les secteurs aérospatial, automobile et des semi-conducteurs, avec des outils pour accélérer la conception de produits, valider des simulations et optimiser la production. Airbus a rejoint le programme sur l'ensemble de ses divisions, avions commerciaux, hélicoptères, défense et espace, tandis que BMW Group fait de Mistral son partenaire central pour son initiative dite de "Large Industry Model", axée sur la simulation de crash et d'autres tâches d'ingénierie complexes. ASML, déjà premier actionnaire de Mistral, en est aussi l'un des premiers clients industriels. L'argument central de Mensch est que les ingénieurs physiques, aéronautiques, mécaniciens, électronique, restent aujourd'hui largement ignorés par l'IA, contrairement aux travailleurs du savoir et aux développeurs logiciels. Les simulations physiques classiques peuvent prendre des heures, voire des semaines par variante de conception, rendant l'itération assistée par IA impraticable. La réponse de Mistral est ce qu'elle appelle la "physics AI" : des modèles entraînés sur les sorties de solveurs physiques capables de prédire le comportement d'une aile ou d'un process de fabrication en une fraction du temps. Mistral se retrouve dans une position concurrentielle singulière dans l'écosystème mondial de l'IA. Avec 3,9 milliards de dollars levés au total sur neuf tours de table, la startup française est désormais trop importante pour être perçue comme un simple laboratoire de recherche, mais reste nettement plus petite qu'OpenAI, Google DeepMind ou Anthropic. Sa réponse à cet écart est une stratégie de profondeur verticale : aller industrie par industrie, flux de travail par flux de travail, tout en construisant l'infrastructure pour maintenir les données sensibles sur site, loin des hyperscalers américains. "Pour déployer l'IA en entreprise, il faut, en tant que fournisseur d'IA, maîtriser toute la chaîne", a résumé Mensch devant l'audience. Ce positionnement souverain et sectoriel pourrait devenir l'atout différenciant de Mistral face à des géants dont les offres généralisées peinent à répondre aux contraintes réglementaires et industrielles européennes.

UEMistral AI, entreprise française valorisée à 11,7 milliards d'euros, construit un datacenter au sud de Paris et déploie une plateforme d'IA industrielle souveraine avec Airbus, BMW et ASML, renforçant l'autonomie technologique européenne face aux hyperscalers américains.

💬 Le datacenter et Vibe, c'est pour les journaux. Le truc qui m'intéresse vraiment, c'est la physics AI : prédire le comportement d'une aile en secondes là où un solveur classique prend des heures, c'est exactement là où les LLM peuvent être utiles pour de vrai, pas juste dans des démos. Reste à tenir ça à l'échelle d'Airbus.

BusinessActu
1 source
Data center, AGI, industrie : Mistral AI sur tous les fronts
429Next INpact 

Data center, AGI, industrie : Mistral AI sur tous les fronts

Lors de l'AI Now Summit du 28 mai 2026, Mistral AI a enchaîné les annonces majeures. La startup parisienne rebaptise d'abord son chatbot LeChat en « Vibe », désormais capable de se connecter à Outlook, SharePoint, GitHub et Slack pour générer rapports, synthèses et graphiques, avec un mode Code intégré à VS Code et une interface CLI. L'offre s'étage d'une version gratuite à 14,99 dollars par mois pour les usages avancés. Sur le plan infrastructurel, Mistral annonce un nouveau centre de données aux Ulis (Essonne), déployant 10 MW dès le troisième trimestre 2026, qui vient s'ajouter aux sites de Bruyères-le-Châtel (40 MW) et de Borlänge en Suède (23 MW). L'entreprise prévoit 200 MW de capacité en 2027 et 1 GW d'ici 2030, pour un investissement actuel de 4 milliards d'euros. Mistral lance par ailleurs une plateforme industrielle combinant modèles d'IA, ingénierie et capacités robotiques, avec pour premiers partenaires Airbus, BMW, ASML et EDF, ce dernier dans le cadre d'un accord de cinq ans autour de la maintenance et de la construction des réacteurs EPR2. Ces annonces révèlent un pivot stratégique décisif pour Mistral : la startup ne se positionne plus seulement comme un fournisseur de modèles de langage, mais comme un opérateur d'infrastructure et un intégrateur industriel à part entière. En louant sa puissance de calcul à d'autres laboratoires d'IA, Arthur Mensch confirme à CNBC que « certains demandent déjà énormément de capacité », Mistral se dote d'un modèle économique hybride, moins dépendant des seuls abonnements grand public. Les partenariats avec des géants comme ASML, pour l'optimisation de composants semiconducteurs, ou BMW, pour des simulations d'accident multimodales, valident la crédibilité technique de la startup dans des secteurs à très haute exigence. Le contrat EDF, sur cinq ans, ancre Mistral dans les infrastructures critiques françaises. Fondée en 2023, Mistral AI s'est imposée comme le principal champion européen face aux géants américains OpenAI, Google et Anthropic. Le contexte politique et industriel lui est aujourd'hui favorable : l'Europe commence à traiter l'IA comme un actif stratégique comparable au gaz, selon Mensch lui-même, ce qui facilite les investissements publics et privés dans les infrastructures. Le retard continental en matière de datacenters devient un argument commercial pour Mistral, qui se présente comme le moyen de combler cet écart sans dépendre des hyperscalers américains. La prochaine échéance sera l'ouverture du site des Ulis au troisième trimestre, premier test concret de la capacité de Mistral à honorer ses ambitions d'opérateur à l'échelle du gigawatt.

UEMistral AI investit 4 milliards d'euros dans des data centers souverains en France (Les Ulis, Bruyères-le-Châtel) et signe des contrats pluriannuels avec EDF, Airbus et ASML, offrant à l'Europe une alternative concrète aux hyperscalers américains pour ses infrastructures critiques industrielles et énergétiques.

💬 Le rebaptême en "Vibe" je m'en fous un peu, mais le reste, c'est du sérieux. Mistral qui loue de la puissance de calcul à d'autres labos, qui signe cinq ans avec EDF sur les EPR2, qui rentre chez BMW et ASML, c'est plus une startup de modèles, c'est un opérateur d'infrastructure qui joue dans la cour des grands. Reste à voir si les Ulis livrent bien au T3, parce que 1 GW d'ici 2030 c'est une promesse qui va coûter cher à tenir.

BusinessOpinion
1 source
Des millions d'agents IA menacés par une faille critique dans un paquet open source
430Ars Technica AI 

Des millions d'agents IA menacés par une faille critique dans un paquet open source

Des millions d'agents et d'outils d'intelligence artificielle sont exposés à une faille critique découverte dans Starlette, un framework open source téléchargé 325 millions de fois par semaine selon son propre développeur. La vulnérabilité permet à des attaquants de s'introduire dans les serveurs qui hébergent ces agents et de dérober des données sensibles ainsi que des identifiants donnant accès à des services tiers. Starlette est une implémentation de l'ASGI (Asynchronous Server Gateway Interface), une interface conçue pour traiter efficacement de très nombreuses requêtes simultanées. Il constitue le socle de FastAPI et de nombreux autres frameworks Python très répandus, si bien que des milliers de projets open source dépendant de Starlette se retrouvent également vulnérables. La gravité de la situation tient à ce que Starlette, et plus largement l'écosystème ASGI, fournit l'infrastructure sur laquelle s'appuient les serveurs MCP (Model Context Protocol). Ce protocole, adopté par les principaux fournisseurs d'agents IA, permet à ces agents d'accéder à des ressources externes : bases de données utilisateurs, messageries, agendas et bien d'autres services. Pour fonctionner, les serveurs MCP stockent les identifiants de connexion à chacun de ces systèmes, ce qui en fait des cibles particulièrement lucratives pour un attaquant. La faille serait en outre triviale à exploiter, ce qui signifie qu'elle ne nécessite pas de compétences avancées pour être mise en oeuvre. Cette découverte illustre les risques systémiques liés à la dépendance de l'écosystème IA moderne vis-à-vis de composants open source largement partagés. Le MCP, popularisé par Anthropic et rapidement adopté par les grandes plateformes, a accéléré l'intégration des agents IA dans des environnements sensibles, sans que les audits de sécurité des couches sous-jacentes aient suivi le même rythme. Une seule bibliothèque compromise peut ainsi propager une vulnérabilité à travers toute une chaîne de dépendances, touchant simultanément des millions de déploiements. Les équipes de sécurité et les développeurs utilisant FastAPI ou tout projet fondé sur Starlette sont invités à appliquer les correctifs dès leur disponibilité et à auditer les identifiants potentiellement exposés.

UELes développeurs français et européens utilisant FastAPI ou tout projet basé sur Starlette pour leurs agents IA doivent appliquer les correctifs dès que disponibles et auditer immédiatement les identifiants potentiellement exposés dans leurs serveurs MCP.

💬 325 millions de téléchargements par semaine, ça donne une idée de la surface d'attaque. On a adopté le MCP à toute vitesse, en empilant des agents au-dessus de FastAPI sans jamais trop regarder ce qui était en dessous. Si tu as un serveur MCP en prod, tu vérifies ta version de Starlette maintenant, pas ce soir.

SécuritéActu
1 source
Cybersécurité : la BCE s’inquiète de Mythos et convoque les banques européennes
431Next INpact 

Cybersécurité : la BCE s’inquiète de Mythos et convoque les banques européennes

La Banque centrale européenne a convoqué mardi 26 mai les représentants des 111 plus grandes banques de la zone euro pour une réunion d'urgence consacrée aux risques cybersécuritaires liés aux nouveaux modèles d'intelligence artificielle. Au centre des discussions : Mythos, le modèle le plus avancé d'Anthropic, déployé dans le cadre du projet Glasswing auprès d'une cinquantaine de partenaires triés sur le volet, quasi-exclusivement américains. Frank Elderson, vice-président du conseil de surveillance prudentielle de la BCE, a alerté le Financial Times que des acteurs malveillants pourraient bientôt accéder à ce type de technologie, exhortant les banques européennes à ne pas attendre d'y avoir accès elles-mêmes pour se préparer. Anthropic a de son côté publié un premier bilan : les partenaires du projet Glasswing ont collectivement identifié plus de 10 000 vulnérabilités de gravité élevée ou critique dans leurs systèmes, et Mythos a déjà permis de bloquer un virement frauduleux d'1,5 million de dollars après la compromission d'une adresse e-mail client dans le secteur bancaire. L'enjeu dépasse la simple indisponibilité d'un outil. Ce qui préoccupe la BCE, c'est la dissymétrie croissante entre attaquants et défenseurs. Elderson souligne qu'un pirate peut désormais analyser une mise à jour de sécurité pour en déduire la faille exacte qu'elle corrige en environ trente minutes, contre plusieurs jours ou semaines auparavant grâce aux outils d'IA. Les banques européennes, déjà exclues du déploiement de Mythos, risquent donc de se retrouver dans une position doublement vulnérable : sans accès aux outils défensifs de pointe, face à des adversaires qui, eux, pourraient les utiliser. La BCE entend aussi créer les conditions d'un partage d'expérience entre les grandes banques américaines opérant en Europe et leurs homologues européennes, afin de combler partiellement ce déficit. L'accès à Mythos reste un point de friction diplomatique et industriel majeur. La Commission européenne négocie avec Anthropic pour obtenir un accès au modèle, mais les discussions avancent lentement, alors que Bruxelles a déjà obtenu un accès à GPT-5.5-Cyber d'OpenAI. Anthropic reconnaît elle-même que le principal goulot d'étranglement n'est plus la détection des failles, désormais largement automatisable, mais bien le triage, la divulgation responsable et le déploiement des correctifs, qu'elle qualifie d'enjeu majeur pour la cybersécurité mondiale. La startup prévoit d'élargir le projet Glasswing à de nouveaux partenaires sans en préciser le calendrier, tandis que les premières expériences concluantes chez Mozilla sur la chasse aux bugs dans Firefox alimentent la demande d'institutions européennes qui observent de loin une technologie dont elles sont pour l'heure exclues.

UELa BCE a convoqué en urgence les 111 plus grandes banques de la zone euro, alarmée par l'asymétrie cybersécuritaire croissante liée à l'IA : les établissements européens, privés d'accès aux outils défensifs avancés, risquent de faire face à des attaquants mieux armés, tandis que la Commission européenne négocie activement un accès à ces technologies.

💬 10 000 vulnérabilités critiques trouvées en quelques mois, c'est moins une victoire qu'un aveu sur l'état réel de nos infrastructures bancaires. Ce qu'Anthropic reconnaît par ailleurs, c'est que le vrai goulot d'étranglement n'est plus de trouver les failles (ça, c'est désormais réglé), mais de les trier et de déployer les correctifs en temps utile, et là les outils n'aident pas encore autant qu'on voudrait. Les banques européennes regardent ça de loin, exclues de Glasswing, pendant que les attaquants, eux, n'attendent pas que Bruxelles finisse de négocier.

Cohere maîtrise la quantification sans perte et les citations natives avec Command A+, son premier modèle Apache 2.0
432VentureBeat AI 

Cohere maîtrise la quantification sans perte et les citations natives avec Command A+, son premier modèle Apache 2.0

Le laboratoire canadien d'intelligence artificielle Cohere a dévoilé Command A+, un modèle de langage de 218 milliards de paramètres conçu pour le raisonnement complexe, le traitement de documents multimodaux et les workflows agentiques. La particularité de cette annonce réside dans sa licence : pour la première fois de son histoire, Cohere publie ses poids sous licence Apache 2.0, une des licences open source les plus permissives, disponibles gratuitement sur Hugging Face. Le modèle repose sur une architecture Sparse Mixture-of-Experts (MoE) : seulement 25 milliards de paramètres sur les 218 sont activés lors de chaque génération. Cette efficacité architecturale est renforcée par une quantification poussée. Command A+ est disponible en format 4-bit (W4A4), ce qui lui permet de tourner sur un seul GPU NVIDIA Blackwell B200 ou deux NVIDIA H100, tout en atteignant 375 tokens par seconde avec une latence de 113 millisecondes au premier token, soit 63 % plus rapide et 17 % moins de latence que son prédécesseur Command A Reasoning. Un tokeniseur entièrement repensé assure par ailleurs un support natif de 48 langues, avec une meilleure efficacité pour les langues non européennes. Ce lancement marque une percée technique sur la quantification sans perte, un problème qui freinait jusqu'ici l'adoption des grands modèles en production. En ne quantifiant à 4 bits que les réseaux d'experts MoE tout en conservant la pleine précision sur les couches d'attention, et en appliquant une technique appelée Quantization-Aware Distillation, Cohere parvient à comprimer massivement le modèle sans dégrader ses capacités de raisonnement. Pour les entreprises, cela signifie concrètement qu'un modèle de niveau frontier peut désormais s'exécuter en interne, sur leur propre infrastructure, sans dépendre d'API tierces ni exposer leurs données sensibles à des tiers. C'est une rupture nette avec les modèles propriétaires de OpenAI ou Anthropic, estimés à plusieurs milliers de milliards de paramètres et uniquement accessibles via le cloud. Ce pari s'inscrit dans la stratégie dite d'IA souveraine défendue par Aidan Gomez, cofondateur de Cohere et ancien chercheur chez Google, l'un des auteurs du célèbre article « Attention Is All You Need » qui a posé les bases des transformers modernes. L'idée est de permettre aux gouvernements, grandes entreprises et développeurs de déployer des modèles de niveau frontier entièrement sous leur contrôle. Cette publication intervient peu après l'annonce d'une fusion entre Cohere et le laboratoire allemand Aleph Alpha, deux acteurs qui misent sur la souveraineté numérique face à la domination américaine. Avec Command A+, Cohere ne s'attaque pas seulement au marché des API cloud : il repositionne l'open source comme une réponse crédible aux géants propriétaires, au moment où les exigences réglementaires et la sensibilité aux données poussent de plus en plus d'organisations à reprendre la main sur leur infrastructure IA.

UELa fusion Cohere–Aleph Alpha et la licence Apache 2.0 de Command A+ permettent aux organisations européennes de déployer un modèle frontier en interne sur leur propre infrastructure, renforçant la souveraineté numérique face aux plateformes cloud américaines et facilitant la conformité à l'AI Act.

💬 Deux H100 pour un modèle de 218 milliards de paramètres sans perte de qualité, c'est pas rien. La technique qui quantifie uniquement les couches MoE tout en gardant la pleine précision sur l'attention, c'est une vraie trouvaille, pas juste de la compression agressive qui dégrade en douce. Et Cohere qui ouvre ses poids en Apache 2.0 pour la première fois de son histoire, ça c'est le signal fort pour toutes les orgas européennes qui voulaient du souverain sans se faire distancer techniquement.

LLMsOpinion
1 source
Quatre attaques sur la chaîne d'approvisionnement IA en 50 jours révèlent des failles dans les pipelines de déploiement
433VentureBeat AI 

Quatre attaques sur la chaîne d'approvisionnement IA en 50 jours révèlent des failles dans les pipelines de déploiement

En cinquante jours, quatre incidents de sécurité ont frappé les chaînes d'approvisionnement logicielle d'OpenAI, Anthropic et Meta, exposant un angle mort systémique dans l'écosystème IA. Le 11 mai 2026, un ver informatique baptisé Mini Shai-Hulud a publié 84 versions malveillantes de 42 packages npm de la bibliothèque TanStack en six minutes, en exploitant une mauvaise configuration de GitHub Actions, un empoisonnement du cache CI et l'extraction d'un token OIDC depuis la mémoire du runner. Ces packages portaient une provenance SLSA Build Level 3 valide car ils avaient été publiés depuis le dépôt officiel, via le bon workflow. Deux jours plus tard, OpenAI confirmait la compromission de deux appareils d'employés et l'exfiltration de secrets depuis ses dépôts internes, forçant la révocation de ses certificats macOS et une mise à jour obligatoire de tous les utilisateurs desktop avant le 12 juin 2026. En remontant à fin mars, on trouve deux autres incidents : un chercheur de BeyondTrust Phantom Labs, Tyler Jespersen, avait découvert que OpenAI Codex passait les noms de branches Git directement dans des commandes shell sans aucune validation, permettant l'injection de sous-commandes et le vol du token OAuth GitHub en clair. Simultanément, le groupe TeamPCP avait utilisé des identifiants volés au scanner de vulnérabilités Trivy d'Aqua Security pour publier deux versions empoisonnées du proxy LiteLLM sur PyPI, téléchargées près de 47 000 fois en quarante minutes avant quarantaine. Ce qui rend ces incidents particulièrement préoccupants, c'est leur portée transversale. L'attaque LiteLLM a atteint Mercor, une startup valorisée 10 milliards de dollars qui fournit des données d'entraînement à Meta, OpenAI et Anthropic : quatre téraoctets ont été exfiltrés, incluant des références à des méthodologies propriétaires de Meta. Le partenariat a été gelé immédiatement, une action collective a suivi dans les cinq jours. Aucune de ces attaques ne visait les modèles eux-mêmes, mais leurs dommages sont réels et mesurables. Le 31 mars, Anthropic avait de son côté exposé involontairement 513 000 lignes de TypeScript non obfusqué en livrant Claude Code version 2.1.88 avec un fichier source map de 59,8 Mo qui n'aurait jamais dû être inclus, révélant 44 feature flags internes, des prompts système et l'architecture d'orchestration multi-agents. Ces quatre incidents convergent vers un seul constat structurel : les pipelines de release, les hooks de dépendances, les runners CI et les gates de packaging ne sont couverts par aucun exercice de red team actuel dans l'industrie IA. Les évaluations AISI, les system cards et les audits de sécurité des modèles ignorent entièrement cette surface d'attaque. Quand un token OIDC légitimement émis suffit à publier 84 artefacts malveillants avec une provenance cryptographique valide, ou qu'une seule dépendance open source passe quarante minutes sur PyPI avec un effet blast radius cross-industriel, la robustesse du modèle sous-jacent devient hors-sujet. La pression monte pour que les fournisseurs IA intègrent des audits de sécurité de chaîne d'approvisionnement dans leurs questionnaires de conformité, au même titre que les évaluations de danger des modèles.

UELes organisations européennes déployant des outils IA via des dépendances open source (LiteLLM, TanStack) sont directement exposées aux mêmes vecteurs d'attaque, et la pression monte pour que les questionnaires de conformité AI Act intègrent des audits de sécurité de chaîne d'approvisionnement au même titre que les évaluations de risque des modèles.

💬 Quatre attaques en cinquante jours, aucune ne visait les modèles. Pendant qu'on red-teamait les LLMs à coups d'évaluations AISI et de system cards, personne ne regardait les runners CI, les hooks de dépendances, les gates de packaging, et un token OIDC légitime a suffi à publier 84 artefacts malveillants avec une provenance cryptographique valide. La robustesse du modèle, c'est hors-sujet si la chaîne de livraison est trouée.

SécuritéOpinion
1 source
Mistral AI piraté ? 5 Go de code source en vente
434Numerama 

Mistral AI piraté ? 5 Go de code source en vente

Depuis le 13 mai 2026, un vendeur anonyme propose sur un forum cybercriminel l'accès à environ 5 Go de données attribuées à Mistral AI : près de 450 dépôts privés et du code source interne, mis en vente pour 25 000 dollars. La startup française d'intelligence artificielle, fondée en 2023 et valorisée à plusieurs milliards d'euros, n'a pas confirmé publiquement la fuite. Toutefois, des informations indiquent que Mistral AI mène une enquête interne sur un incident de sécurité distinct, lié cette fois à une attaque de type supply chain, ce qui suggère que l'entreprise a bien subi une intrusion d'une forme ou d'une autre. L'exposition potentielle de 450 dépôts privés représente un risque majeur pour une entreprise dont la valeur repose précisément sur ses modèles propriétaires et son infrastructure technique. Si la fuite est authentique, des concurrents pourraient accéder à des algorithmes, des pipelines d'entraînement ou des données de configuration qui constituent le cœur compétitif de Mistral. Pour les clients enterprise utilisant les API de la startup, la question de la sécurité de leurs données transmises se pose également. Mistral AI s'est imposée comme le principal acteur européen de l'IA générative, face aux géants américains OpenAI et Anthropic. La startup a levé des centaines de millions d'euros en moins de deux ans et collabore avec des institutions publiques françaises, ce qui rend toute compromission particulièrement sensible. Les attaques supply chain, qui visent les outils et dépendances utilisés par les équipes de développement plutôt que les systèmes en production, sont en forte hausse dans le secteur tech depuis 2024, et ciblent désormais explicitement les startups IA à forte croissance.

UELa compromission potentielle de Mistral AI, principal acteur européen de l'IA générative collaborant avec des institutions publiques françaises, menace directement la souveraineté technologique française et pourrait exposer les données des clients enterprise européens utilisant ses API.

💬 25 000 dollars pour les pipelines d'entraînement de Mistral, c'est presque insultant comme prix vu la valorisation. Si c'est authentique, le vrai dégât c'est pas le code volé, c'est la confiance des clients enterprise et des institutions publiques qui s'évapore d'un coup. Une supply chain attack bien menée, ça ne se voit pas venir, et visiblement même les boîtes les mieux financées du moment ne sont pas immunisées.

SécuritéActu
1 source
Claude Code ou Claude dans Chrome : grille d'audit des angles morts de votre dispositif de sécurité
435VentureBeat AI 

Claude Code ou Claude dans Chrome : grille d'audit des angles morts de votre dispositif de sécurité

Entre le 6 et le 7 mai 2026, quatre équipes de recherche en sécurité ont publié simultanément des découvertes sur Claude, le modèle d'Anthropic, révélant trois surfaces d'attaque distinctes mais liées par un même problème structurel. La firme Dragos a documenté une campagne de compromission de plusieurs organisations gouvernementales mexicaines entre décembre 2025 et février 2026, qui a atteint en janvier 2026 le réseau de Servicios de Agua y Drenaje de Monterrey, la régie municipale d'eau de la métropole de Monterrey. L'adversaire, non identifié, a utilisé Claude comme exécuteur technique principal : le modèle a produit un framework Python de 17 000 lignes réparties en 49 modules couvrant la découverte réseau, la collecte de credentials, l'escalade de privilèges et le déplacement latéral. Sans aucun contexte industriel préalable, Claude a identifié de lui-même un serveur hébergeant une interface de gestion SCADA/IIoT vNode, l'a classifié comme cible prioritaire et a lancé un spray de mots de passe automatisé. L'attaque a échoué et aucune intrusion sur les systèmes opérationnels n'a eu lieu. Le même jour, le chercheur Aviad Gispan de LayerX a divulgué "ClaudeBleed", une vulnérabilité exploitant la fonctionnalité Chrome externally connectable pour permettre à n'importe quelle extension de détourner les sessions Claude dans le navigateur et de voler des tokens OAuth. Ce qui rend ces incidents particulièrement préoccupants, c'est qu'ils ne relèvent pas de failles classiques dans le code d'Anthropic : Claude a fonctionné exactement comme prévu. Jay Deen, chasseur de menaces chez Dragos, souligne que les outils d'IA commerciaux rendent les environnements industriels (OT) visibles à des adversaires déjà présents côté IT, sans qu'aucune alarme ne se déclenche. Elia Zaitsev, CTO de CrowdStrike, résume le problème de détection : rien d'anormal ne se produit tant que l'agent n'agit pas, et à ce stade il est souvent trop tard. Les systèmes EDR voient le processus mais ne peuvent pas évaluer l'intention. Pour les opérateurs d'infrastructures critiques, la reconnaissance menée via un outil de développement légitime est indiscernable d'un usage normal. Le problème structurel sous-jacent porte un nom en sécurité informatique : le "confused deputy", une défaillance de frontière de confiance où un programme disposant de permissions légitimes exécute des actions pour le compte du mauvais principal. Carter Rees, VP Intelligence Artificielle chez Reputation, et Kayne McGladrey, membre senior de l'IEEE, ont tous deux décrit indépendamment la même dynamique : les systèmes agentiques héritent de plans d'autorisation "plats", sans hiérarchie de permissions, ce qui leur donne d'emblée accès à bien plus que ce qu'un humain utiliserait. Anthropic a partiellement corrigé la vulnérabilité ClaudeBleed, mais aucun patch ne couvre l'ensemble des trois surfaces documentées. La question posée n'est plus de savoir si Claude peut être détourné, mais comment les entreprises et les opérateurs d'infrastructures vont architecturer des frontières de confiance adaptées à des agents disposant de capacités réelles.

UELes opérateurs d'infrastructures critiques européennes utilisant des agents IA sont exposés aux mêmes surfaces d'attaque documentées, notamment ClaudeBleed affectant toute session Claude dans le navigateur, sans correctif complet disponible à ce jour.

💬 Le truc qui me frappe, c'est pas la vulnérabilité Chrome. Claude a produit 17 000 lignes de framework d'attaque, identifié de lui-même une cible SCADA, sans déclencher la moindre alarme, parce que rien d'anormal ne s'est passé du point de vue des EDR. On colle des agents avec des permissions full-access dans des environnements critiques et le patch Anthropic couvre une surface sur trois.

SécuritéOpinion
1 source
L’IA aurait aidé des pirates à développer un exploit zero-day, une première selon Google
436Next INpact 

L’IA aurait aidé des pirates à développer un exploit zero-day, une première selon Google

Des chercheurs du Google Threat Intelligence Group (GITG) ont identifié ce qui serait le premier cas documenté d'un exploit de type zero-day développé avec l'aide d'une intelligence artificielle. L'acteur malveillant, dont l'identité n'a pas été révélée, prévoyait d'utiliser cette vulnérabilité dans le cadre d'une campagne d'exploitation à grande échelle. La faille ciblait un outil d'administration open-source très répandu et permettait de contourner l'authentification à double facteur (2FA), à condition que les pirates disposent déjà des identifiants et mots de passe de leurs victimes. L'exploit se présentait sous la forme d'un script Python. Google a procédé à une divulgation responsable auprès de l'éditeur concerné, dont le nom reste confidentiel, et la vulnérabilité a depuis été corrigée. Le GITG indique ne pas avoir observé de campagne active, mais ne peut exclure une exploitation à plus petite échelle. Cette découverte marque un tournant dans le paysage de la cybersécurité. Les grands modèles de langage se montrent désormais capables d'identifier des erreurs logiques de haut niveau, comme un contournement d'authentification intégré directement dans le code par un développeur, que les outils de détection traditionnels auraient probablement laissé passer. Contrairement aux bugs techniques classiques, ce type de faille repose sur une logique défaillante dans la conception du programme, une catégorie que les LLM abordent avec une efficacité croissante grâce à leur capacité de raisonnement contextuel. John Hultquist, chef analyste du GITG, a décrit cette découverte comme « un avant-goût de ce qui nous attend » et a prévenu le New York Times que le problème est « probablement bien plus vaste » : ce cas ne serait que la partie émergée de l'iceberg. Le GITG ne dévoile pas le modèle d'IA utilisé, précisant seulement que Gemini n'est probablement pas en cause. L'hypothèse IA repose sur plusieurs indices relevés dans le code : un volume inhabituellement élevé de texte explicatif, un style de code particulièrement propre et scolaire, et une mise en forme jugée caractéristique des données d'entraînement des LLM. Le laboratoire note par ailleurs que des acteurs liés à la Corée du Nord et à la Chine s'intéressent activement à l'utilisation de l'IA pour identifier des failles de sécurité. Cette découverte devrait renforcer les appels à un encadrement plus strict des modèles avancés, OpenAI et Anthropic réservent déjà leurs modèles spécialisés en cybersécurité à des organisations sélectionnées. La même capacité de raisonnement qui aide les attaquants est aussi entre les mains des défenseurs, mais l'équilibre de la menace vient de basculer.

UELes organisations européennes utilisant des outils d'administration open-source doivent renforcer leur vigilance, et cet événement devrait accélérer les discussions sur l'encadrement des capacités offensives des LLM dans le cadre de l'AI Act.

💬 C'était dans l'air, mais ça fait quand même un effet quand c'est Google qui le documente pour la première fois. Ce qui frappe c'est pas le zero-day en soi, c'est que les LLM s'avèrent précisément bons sur les failles logiques, le genre que les scanners classiques ratent complètement. Et les indices qui ont permis de détecter l'IA dans le code (style trop propre, commentaires verbeux), ça va tenir encore combien de mois ?

Dans l’IA, la Chine bouscule son monde avec sa stratégie open source
437Next INpact 

Dans l’IA, la Chine bouscule son monde avec sa stratégie open source

Depuis fin avril 2026, deux modèles chinois occupent le sommet du classement des LLM les plus utilisés sur Open Router, la principale place de marché mondiale pour les modèles de langage : Hy3 de Tencent, fort de 295 milliards de paramètres, et Kimi K2.6 de la start-up pékinoise Moonshot AI, fondée en 2023. Claude Sonnet 4.6 et Claude Opus 4.7 d'Anthropic n'arrivent qu'en troisième et quatrième position, suivis de plusieurs versions de DeepSeek et de Gemini. Ce palmarès n'est pas un accident : la Chine a déposé 70 % des 54 000 brevets mondiaux en IA générative, et Alibaba revendiquait en mars un milliard de téléchargements cumulés pour sa famille Qwen, représentant plus de la moitié des téléchargements mondiaux de modèles open source. Kimi, lui, est accessible à environ 4 dollars le million de tokens générés, soit six à huit fois moins cher que GPT-5.5 ou Claude Opus 4.7. Cet avantage tarifaire peut sembler négligeable pour un utilisateur individuel, mais il change radicalement l'équation pour les entreprises qui font tourner des centaines d'agents d'IA en parallèle. En rendant publics des modèles performants à faible coût, les acteurs chinois attaquent la chaîne de valeur que les géants américains ont bâtie autour de leurs APIs propriétaires. Le gouvernement de Singapour a illustré cette dynamique en novembre dernier en abandonnant Llama de Meta au profit de Qwen pour construire son modèle d'IA souverain, tandis que Taobao et Tmall intègrent déjà ces outils dans leurs services quotidiens. Pour les directions informatiques du monde entier, l'open source chinois est désormais une alternative sérieuse, pas un choix par défaut. Cette offensive s'inscrit dans un contexte de restrictions américaines sur l'accès aux semi-conducteurs avancés, qui ont contraint la Chine à optimiser ses modèles pour des architectures matérielles moins récentes. Résultat : des systèmes plus légers, moins gourmands, et moins coûteux à l'usage. La déflagration DeepSeek, dès début 2025, avait été le premier signal fort de cette capacité d'adaptation, au point d'inquiéter Jensen Huang, le patron de Nvidia. La quatrième version de DeepSeek, conçue pour fonctionner exclusivement sur des technologies chinoises avec le soutien de Huawei, a confirmé la tendance. En mars, Anthropic a formellement dénoncé l'utilisation de comptes frauduleux par DeepSeek, Moonshot et MiniMax pour extraire massivement les capacités de Claude. Loin de la seule rivalité technologique, cette stratégie open source représente une évolution des Nouvelles Routes de la Soie vers un levier d'influence numérique mondial, où la dépendance aux modèles chinois pourrait progressivement supplanter celle aux infrastructures occidentales.

UELa domination chinoise sur l'open source IA place l'Europe face à un arbitrage stratégique entre adoption de modèles performants et bon marché et risque de substitution d'une dépendance américaine par une dépendance chinoise, en tension directe avec les objectifs de souveraineté numérique de l'UE.

💬 Quatre dollars le million de tokens contre vingt-cinq pour Claude Opus, c'est là que le débat se joue maintenant. Quand tu fais tourner des centaines d'agents en parallèle, la facture n'est plus la même, et les DSI ont sorti leurs calculettes. Ce que personne n'avait vraiment anticipé: les restrictions américaines sur les puces ont finalement produit des modèles plus légers, moins gourmands, et difficiles à contrer sur le prix.

LLMsOpinion
1 source
GPT-5.5 égale Mythos Preview dans les nouveaux tests de cybersécurité
438Ars Technica AI 

GPT-5.5 égale Mythos Preview dans les nouveaux tests de cybersécurité

Le modèle GPT-5.5 d'OpenAI, mis en accès public la semaine dernière, a obtenu des résultats comparables à ceux de Mythos Preview d'Anthropic lors des évaluations cybersécurité menées par l'AI Security Institute britannique (AISI). Sur les 95 défis de type Capture the Flag testant des compétences en rétro-ingénierie, exploitation web et cryptographie, GPT-5.5 a résolu en moyenne 71,4 % des tâches de niveau "Expert", contre 68,6 % pour Mythos Preview, un écart qui reste dans la marge d'erreur. Sur un défi particulièrement difficile consistant à construire un désassembleur pour décoder un binaire Rust, GPT-5.5 a résolu la tâche en 10 minutes et 22 secondes, sans assistance humaine, pour un coût de 1,73 dollar en appels API. Les deux modèles ont également obtenu des performances similaires sur "The Last Ones" (TLO), un scénario simulant une attaque d'extraction de données en 32 étapes sur un réseau d'entreprise: GPT-5.5 a réussi 3 tentatives sur 10, contre 2 sur 10 pour Mythos Preview. Aucun modèle testé auparavant n'avait jamais réussi ce scénario ne serait-ce qu'une seule fois. Ce résultat fragilise directement la posture d'Anthropic, qui avait présenté Mythos Preview le mois dernier comme un modèle au potentiel cybersécuritaire exceptionnel, justifiant une restriction d'accès aux seuls "partenaires industriels critiques". GPT-5.5 atteint un niveau de capacité équivalent tout en étant disponible publiquement, ce qui soulève des questions sur la cohérence des politiques de déploiement entre les deux laboratoires. Pour les entreprises et les équipes de sécurité, cela signifie que des outils d'attaque automatisés de niveau expert sont désormais accessibles à tous, sans restriction. L'AISI conduit ces évaluations sur les modèles frontier depuis 2023, dans le cadre d'un effort de surveillance indépendante des capacités offensives de l'IA. Le seul scénario sur lequel aucun modèle n'a encore percé est "Cooling Tower", une simulation d'attaque contre le logiciel de contrôle d'une centrale électrique, ce qui indique qu'une limite demeure pour l'instant. Mais la trajectoire est claire: les capacités cybersécuritaires des grands modèles progressent rapidement, et le débat sur leur encadrement devient plus urgent à mesure que la performance rejoint puis dépasse celle des experts humains sur des tâches ciblées.

UELes équipes de sécurité européennes doivent réviser leurs modèles de menace : des outils d'attaque réseau de niveau expert (exfiltration en 32 étapes, rétro-ingénierie Rust) sont désormais accessibles publiquement, et l'AISI britannique est susceptible de transmettre ces résultats à l'AI Office européen dans le cadre de la surveillance prévue par l'AI Act.

💬 Ce qui me frappe, c'est pas les scores (71% vs 68%, c'est dans la marge). C'est qu'Anthropic justifiait les restrictions sur Mythos par un risque hors-norme, pendant que GPT-5.5 sort en accès libre avec les mêmes capacités, en réussissant même "The Last Ones", ce scénario d'exfiltration en 32 étapes que personne n'avait jamais passé jusqu'ici. Soit OpenAI sous-estime le danger, soit Anthropic survend sa prudence.

SécuritéActu
1 source
GPT-5.5 rivalise avec Claude Mythos dans les tests de cyberattaques, selon l'Institut britannique de sécurité de l'IA
439The Decoder 

GPT-5.5 rivalise avec Claude Mythos dans les tests de cyberattaques, selon l'Institut britannique de sécurité de l'IA

GPT-5.5 d'OpenAI est capable de résoudre de manière autonome une simulation complète d'attaque réseau, selon les évaluations publiées par l'UK AI Security Institute (AISI). C'est seulement le deuxième modèle à franchir ce seuil, aux côtés du Claude Mythos d'Anthropic. GPT-5.5 est d'ores et déjà déployé dans ChatGPT et accessible via l'API d'OpenAI, tandis que Claude Mythos reste réservé à un groupe très restreint de partenaires et testeurs. Cette performance marque un tournant dans le paysage de la cybersécurité. Qu'un modèle accessible au grand public puisse enchaîner de manière autonome les étapes d'une intrusion réseau complète, de la reconnaissance initiale jusqu'à l'exploitation d'une cible, représente une menace concrète pour les entreprises et institutions. Jusqu'ici, ce niveau de capacité restait cantonné à des systèmes expérimentaux à diffusion très limitée. Le fait que GPT-5.5 soit déjà largement déployé soulève des questions urgentes sur le contrôle des aptitudes offensives des modèles commerciaux. L'AISI britannique, créée dans le sillage du sommet de Bletchley Park de novembre 2023, évalue régulièrement les modèles dits frontier avant et après leur mise sur le marché, en testant leurs capacités dans des domaines sensibles comme la cybersécurité ou les armes de destruction massive. Ces évaluations s'inscrivent dans un effort plus large de gouvernance internationale de l'IA, auquel participent notamment la France, le Royaume-Uni et les États-Unis. La convergence de GPT-5.5 et Claude Mythos sur ces benchmarks offensifs va probablement intensifier les débats réglementaires sur les seuils de déploiement acceptables pour les modèles aux capacités les plus avancées.

UELa France, partenaire de l'AISI britannique dans le cadre de la gouvernance internationale de l'IA issue de Bletchley Park, sera directement impliquée dans les débats réglementaires sur les seuils de déploiement acceptables pour les modèles aux capacités offensives avancées.

💬 GPT-5.5 déjà en prod, accessible à tous, capable d'enchaîner une attaque réseau complète de bout en bout. Pendant ce temps Claude Mythos fait la même chose mais reste sous clé chez Anthropic. Le vrai débat, c'est là : OpenAI vient de décider tout seul que ce niveau de capacité offensive est acceptable en déploiement grand public, et personne ne leur a dit non.

SécuritéOpinion
1 source
Claude Code, Copilot et Codex ont tous été piratés : les attaquants visaient les identifiants, pas le modèle
440VentureBeat AI 

Claude Code, Copilot et Codex ont tous été piratés : les attaquants visaient les identifiants, pas le modèle

En l'espace de quelques jours fin mars 2026, trois des principaux agents de codage IA ont été compromis. Le 30 mars, le chercheur Tyler Jespersen de BeyondTrust a démontré qu'un simple nom de branche GitHub pouvait forcer Codex d'OpenAI à exfiltrer son token OAuth en clair : en injectant une sous-commande via un point-virgule et des backticks dans le paramètre de nom de branche, le script de clonage devenait un vecteur d'exfiltration. Pour masquer l'attaque, 94 caractères "Ideographic Space" (Unicode U+3000) rendaient la branche malveillante visuellement identique à "main" dans l'interface Codex. OpenAI a classé la faille Critical P1 et livré un correctif complet le 5 février 2026. Deux jours plus tard, le code source de Claude Code d'Anthropic se retrouvait sur le registre npm public. Dans la foulée, Adversa découvrait que Claude Code cessait silencieusement d'appliquer ses règles de blocage dès qu'une commande dépassait 50 sous-commandes, un compromis délibéré entre sécurité et performance. Trois CVE distincts ont touché Claude Code en parallèle : CVE-2026-25723 permettait de contourner le sandbox via des commandes chaînées sed/echo ; CVE-2026-33068 permettait à un dépôt malveillant de pré-configurer le mode bypassPermissions dans .claude/settings.json avant même que la boîte de dialogue de confiance n'apparaisse. Côté Microsoft, Johann Rehberger a prouvé que des instructions cachées dans une description de pull request pouvaient activer l'auto-approbation dans les paramètres VS Code de Copilot, accordant une exécution shell illimitée sur Windows, macOS et Linux. Orca Security a ensuite montré qu'un simple ticket GitHub suffisait à faire exfiltrer le GITHUB_TOKEN privilégié par Copilot dans GitHub Codespaces. Ce qui unit toutes ces attaques, c'est l'identique surface d'entrée : non pas le modèle de langage, mais le credential qu'il détient et qu'il utilise sans session humaine pour l'ancrer. Merritt Baer, CSO d'Enkrypt AI et ancienne Deputy CISO chez AWS, résume le problème : les entreprises croient avoir "approuvé" un fournisseur d'IA, mais elles n'ont approuvé qu'une interface, pas le système sous-jacent. Ce sont les credentials sous cette interface qui constituent la vraie surface d'attaque. Un agent compromis n'a pas besoin d'exploiter le modèle, il lui suffit d'hériter des droits d'accès de l'environnement dans lequel il s'exécute pour prendre le contrôle d'un dépôt entier. Ces incidents s'inscrivent dans une série de neuf mois commencée à Black Hat USA 2025, où Michael Bargury, CTO de Zenity, avait détourné en direct ChatGPT, Microsoft Copilot Studio, Google Gemini, Salesforce Einstein et Cursor via un MCP Jira, sans aucun clic utilisateur. Six équipes de recherche ont depuis publié des exploits contre Codex, Claude Code, Copilot et Vertex AI, tous suivant le même schéma. L'enjeu n'est plus théorique : les agents de codage sont désormais branchés sur des pipelines CI/CD réels, disposent de tokens avec des droits d'écriture sur des dépôts de production, et opèrent avec une supervision humaine minimale. Tant que l'autorisation restera aussi plate que celle d'un LLM et que les règles de sécurité pourront être contournées par un simple dépassement de seuil arbitraire, les tokens resteront la cible de choix.

UELes développeurs et entreprises européens utilisant Claude Code, GitHub Copilot ou Codex dans leurs pipelines CI/CD sont exposés à des risques de vol de tokens et de compromission de dépôts de production, nécessitant une révision immédiate des permissions accordées à ces agents IA.

💬 Trois agents, trois failles, même surface d'attaque : le token, pas le modèle. C'est un peu gênant de voir qu'on reproduit les mêmes erreurs d'OAuth mal configuré qu'il y a dix ans, juste avec plus de puissance de feu et des droits d'écriture sur des dépôts de production. On a déployé avant de comprendre, et maintenant on ramasse.

SécuritéOpinion
1 source
Le pari d'Amazon sur OpenAI marque une nouvelle phase dans la guerre du cloud, sans exclusivité
441VentureBeat AI 

Le pari d'Amazon sur OpenAI marque une nouvelle phase dans la guerre du cloud, sans exclusivité

Amazon Web Services a lancé mardi l'une des offensives les plus significatives de ses vingt ans d'histoire dans l'IA d'entreprise. Lors d'un événement à San Francisco intitulé "What's Next with AWS", le cloud d'Amazon a annoncé simultanément l'intégration des modèles OpenAI les plus puissants sur sa plateforme Bedrock, le lancement d'un nouveau framework de développement agentique, d'un outil de productivité desktop appelé Amazon Quick, et l'extension d'Amazon Connect en une famille de quatre solutions d'IA ciblant les chaînes d'approvisionnement, le recrutement, la santé et l'expérience client. Les modèles GPT-5.4 et GPT-5.5 d'OpenAI sont désormais accessibles via Bedrock en préversion limitée, avec une disponibilité générale attendue dans les prochaines semaines. Ces annonces sont intervenues exactement vingt-quatre heures après la restructuration publique du partenariat exclusif entre OpenAI et Microsoft, qui libère pour la première fois OpenAI de toute restriction de distribution vers d'autres fournisseurs cloud. Le PDG d'AWS, Matt Garman, a qualifié l'accord de "partenariat majeur", précisant que les clients réclamaient les modèles OpenAI sur AWS "depuis les tous premiers jours". L'impact concret pour les entreprises est immédiat. Anthony Liguori, vice-président et ingénieur distingué chez AWS, a souligné que l'intégration via les API sans état, les API chat completions et responses classiquement utilisées, supprime totalement la friction de migration : les clients peuvent basculer leurs charges de travail existantes sur AWS sans réécrire une seule ligne de code. Les modèles OpenAI rejoignent désormais sur Bedrock les offres d'Anthropic, Meta, Mistral, Cohere et les propres modèles d'Amazon, sous un cadre unifié de sécurité, gouvernance et contrôle des coûts. Pour les équipes achats des grandes entreprises, ce qui était un écosystème multi-fournisseurs fragmenté se consolide en un seul point d'accès. AWS positionne ainsi Bedrock comme l'infrastructure de référence pour l'ère des agents logiciels autonomes. Le chemin vers cette alliance n'a pas été linéaire. L'accord de 50 milliards de dollars entre Amazon et OpenAI, annoncé en février 2026, avait créé une tension juridique avec Microsoft, qui revendiquait une exclusivité sur les API stateless d'OpenAI via Azure. Le Financial Times avait même rapporté que Microsoft envisageait des poursuites judiciaires. Le nouvel accord signé lundi a remplacé cette exclusivité à durée indéterminée par une licence non exclusive courant jusqu'en 2032, débloquant ainsi la voie pour AWS. Ce repositionnement marque une rupture structurelle dans les guerres du cloud : la course à l'exclusivité des modèles IA laisse place à une compétition sur l'infrastructure, l'outillage et l'expérience développeur. OpenAI, désormais libre de distribuer ses modèles partout, joue la carte de la ubiquité, tandis qu'AWS et Microsoft s'affrontent sur leur capacité à être la meilleure plateforme pour les déployer à l'échelle.

UELa consolidation du cloud IA entre AWS et OpenAI renforce la domination américaine sur l'infrastructure IA, réduisant l'espace stratégique pour des acteurs européens comme Mistral, déjà présent sur Bedrock mais en position minoritaire face à des plateformes unifiées.

BusinessOpinion
1 source
Comment survivre à la déferlante à venir des vulnérabilités identifiées par IA ? (3/3)
442Next INpact 

Comment survivre à la déferlante à venir des vulnérabilités identifiées par IA ? (3/3)

Deux cent cinquante responsables de la sécurité des systèmes d'information ont cosigné en urgence, le week-end du 12 avril 2026, un rapport intitulé « La tempête de vulnérabilités liées à l'IA : créer un programme de sécurité Mythosready ». Ce document, rédigé en un seul week-end par plus de 60 contributeurs puis relu par 250 RSSI, répond directement à l'annonce, le 7 avril, de Mythos Preview, l'intelligence artificielle spécialisée en cybersécurité développée par Anthropic. Cinquante entreprises et organismes du projet Glasswing disposent d'un accès bêta à cet outil pendant 90 jours, au terme desquels Anthropic rendra publiques toutes les vulnérabilités identifiées. Parmi les signataires figurent des personnalités de premier plan : Jen Easterly, ancienne directrice de la CISA, Chris Inglis, premier National Cyber Director des États-Unis, et Rob Joyce, ex-patron de l'unité de hacking offensif de la NSA, TAO. Le rapport a été publié par le SANS Institute et la Cloud Security Alliance. L'enjeu central est la compression dramatique du délai entre la découverte d'une faille et son exploitation active. D'après les données de zerodayclock.com, ce délai moyen est passé de 2,3 ans en 2019 à moins d'un jour en 2026, avec une accélération fulgurante au cours des seules dernières semaines : 1,6 jour début mars, 20 heures mi-avril, 10 heures une semaine plus tard. Autrement dit, les équipes de défense disposent désormais de quelques heures pour déployer des correctifs après la divulgation publique d'une vulnérabilité. Si Anthropic annonce en bloc les résultats des 50 bêta-testeurs de Mythos Preview, des centaines de failles pourraient être rendues publiques simultanément, créant une situation sans précédent pour les équipes sécurité mondiales. Le rapport s'adresse explicitement à ceux qui « doivent se présenter lundi matin avec un plan crédible ». Ce contexte s'inscrit dans une trajectoire documentée d'escalade des capacités offensives basées sur les grands modèles de langage. En juin 2025, XBOW devenait le premier système autonome à prendre la tête du classement du programme de bug bounty de HackerOne, surpassant tous les hackers humains. En août, l'IA Big Sleep de Google identifiait 20 vulnérabilités zero-day dans des logiciels open source. Le challenge AIxCC de la DARPA a permis de détecter 54 failles dans 54 projets distincts. Sur le kernel Linux, le rythme de découverte par IA est passé de 2 bugs par semaine à 10 par jour. Mythos Preview représente l'étape suivante de cette progression : une IA agentique dédiée, entre les mains de dizaines d'organisations, capable d'analyser des bases de code à une échelle et une vitesse inatteignables pour des équipes humaines. La question posée par ce rapport n'est plus de savoir si cette déferlante aura lieu, mais si les défenseurs auront les moyens d'y répondre en temps réel.

UELes RSSI et équipes sécurité françaises et européennes doivent anticiper d'ici 90 jours une divulgation simultanée de centaines de vulnérabilités identifiées par Mythos Preview, avec des fenêtres de réaction réduites à quelques heures pour déployer des correctifs.

💬 Le vrai chiffre à retenir dans tout ça : le délai entre la découverte d'une faille et son exploitation est passé de 2,3 ans à moins d'un jour, et encore, c'est la moyenne d'avril. Quand Anthropic va lâcher en bloc des centaines de vulnérabilités identifiées par Mythos Preview, les équipes sécurité auront quelques heures pour réagir, pas quelques mois. Le rapport des 250 RSSI pondu en un week-end, c'est bien, mais la vraie question c'est qui développe les défenses à la même vitesse que l'IA attaque.

SécuritéOpinion
1 source
Le canadien COHERE ouvre une porte en Europe avec l’acquisition d’ALEPH ALPHA
443FrenchWeb 

Le canadien COHERE ouvre une porte en Europe avec l’acquisition d’ALEPH ALPHA

Cohere, la société canadienne spécialisée dans les grands modèles de langage à destination des entreprises, a annoncé le rachat d'Aleph Alpha, la principale startup allemande d'intelligence artificielle. Cette acquisition marque une entrée directe de Cohere sur le marché européen, en absorbant ce qui était jusqu'ici la tentative la plus ambitieuse de l'Europe de construire un champion souverain de l'IA. L'opération bénéficie du soutien explicite de Berlin et d'Ottawa, ainsi que du groupe Schwarz, la holding derrière les enseignes Lidl et Kaufland, déjà investisseur historique d'Aleph Alpha. Ce rapprochement revêt une portée stratégique qui dépasse le simple mouvement commercial. En s'appropriant Aleph Alpha, Cohere accède à un réseau institutionnel européen dense, à des contrats avec des administrations publiques et à une crédibilité politique que peu d'acteurs nord-américains peuvent revendiquer sur le Vieux Continent. Pour les entreprises et gouvernements européens soucieux de diversifier leurs dépendances technologiques, cette entité combinée se positionne explicitement comme une alternative aux plateformes américaines comme OpenAI, Google ou Anthropic. Aleph Alpha avait été fondée en 2019 à Heidelberg avec l'ambition de doter l'Europe d'une IA souveraine, portée par des financements publics allemands et une rhétorique de la "souveraineté numérique". Malgré une levée de fonds significative et un soutien politique marqué, la startup peinait à rivaliser technologiquement avec les géants américains. Son absorption par Cohere soulève désormais des questions sur la viabilité d'une véritable indépendance européenne en IA, ou si cette alliance canado-européenne ne constitue qu'un compromis entre dépendance assumée et ambition souveraine.

UEL'acquisition d'Aleph Alpha par Cohere fragilise directement le projet de souveraineté numérique européenne en IA, contraignant les gouvernements et administrations de l'UE à reconsidérer leur stratégie de dépendance technologique.

DeepSeek-V4 : performances proches du meilleur niveau pour un sixième du coût d'Opus 4.7 et GPT-5.5
444VentureBeat AI 

DeepSeek-V4 : performances proches du meilleur niveau pour un sixième du coût d'Opus 4.7 et GPT-5.5

DeepSeek, la startup chinoise d'intelligence artificielle issue du fonds de trading quantitatif High-Flyer Capital Management, a publié DeepSeek-V4, un modèle de langage aux capacités proches des meilleurs systèmes mondiaux. Avec 1 600 milliards de paramètres organisés selon une architecture Mixture-of-Experts (MoE), ce modèle est disponible gratuitement sous licence MIT commercialement permissive, sur la plateforme Hugging Face et via l'API de DeepSeek. Son tarif d'accès : 1,74 dollar par million de tokens en entrée et 3,48 dollars par million en sortie, soit environ 5,22 dollars pour une utilisation combinée standard. Avec les entrées mises en cache, ce coût descend à 3,63 dollars. À titre de comparaison, GPT-5.5 d'OpenAI coûte 35 dollars pour la même transaction, et Claude Opus 4.7 d'Anthropic 30 dollars. Une version allégée, DeepSeek-V4-Flash, est proposée à seulement 0,42 dollar combiné, au prix d'une baisse de performance. Deli Chen, chercheur chez DeepSeek, a décrit cette sortie sur X comme "un travail d'amour", réalisé 484 jours après le lancement du V3, avec cette formule : "L'AGI appartient à tout le monde." L'impact économique est immédiat et brutal pour les acteurs américains du secteur. DeepSeek-V4-Pro coûte environ six fois moins cher que Claude Opus 4.7 et sept fois moins que GPT-5.5 en conditions normales, et jusqu'à dix fois moins avec les entrées en cache. La version Flash, elle, revient à moins de 1 % du tarif des modèles premium américains. Pour les entreprises traitant de gros volumes de requêtes, cette différence de coûts transforme radicalement le calcul de rentabilité : des tâches d'automatisation jugées trop onéreuses avec les modèles fermés américains deviennent soudainement viables. Développeurs et directions techniques sont contraints de réévaluer leurs choix d'infrastructure, et les fournisseurs positionnés sur le haut de gamme voient leur argument tarifaire sérieusement fragilisé. Ce lancement s'inscrit dans la continuité du "moment DeepSeek" de janvier 2025, quand le modèle R1 avait stupéfait la communauté internationale en rivalisant avec les meilleurs systèmes propriétaires américains à une fraction de leur coût de développement. Depuis, la startup avait publié plusieurs mises à jour de ses séries R1 et V3, mais la communauté attendait un successeur de grande envergure. Ce DeepSeek-V4 est d'ores et déjà qualifié de "deuxième moment DeepSeek", et il ravive les débats sur la pérennité commerciale des modèles fermés face aux alternatives open source chinoises. Il soulève également des questions sur la capacité de DeepSeek à maintenir cette trajectoire malgré les restrictions américaines sur l'exportation de puces haut de gamme, contraintes que l'entreprise semble contourner avec une efficacité croissante grâce à des optimisations architecturales poussées.

UEL'écart de prix, jusqu'à six fois inférieur aux modèles premium américains, permet aux entreprises européennes de rentabiliser des projets d'automatisation IA jusqu'ici jugés trop coûteux.

💬 Six fois moins cher qu'Opus 4.7, performances comparables, licence MIT. C'est exactement le scénario que les équipes produit chez OpenAI et Anthropic essayaient de ne pas avoir à gérer, et il arrive quand même. "L'AGI appartient à tout le monde", dit DeepSeek, bon, sur le papier c'est beau, mais le vrai truc c'est que des automatisations qu'on refusait de budgéter il y a six mois deviennent rentables dès ce soir.

LLMsOpinion
1 source
7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis
445Numerama 

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis

DeepSeek vient de publier DeepSeek-V4-Preview, une famille de deux modèles open weight conçus pour rivaliser avec les meilleurs systèmes d'IA propriétaires américains. Le laboratoire chinois annonce un coût d'utilisation sept fois inférieur à celui de Claude Opus 4.7 d'Anthropic, ce qui en fait l'un des modèles les plus compétitifs du marché en termes de rapport performance-prix. Les poids sont accessibles librement, permettant à n'importe quelle entreprise ou développeur de les déployer sans dépendre des API américaines. L'impact est immédiat pour les équipes techniques et les entreprises qui cherchent à réduire leurs coûts d'inférence. Un modèle open weight de ce niveau de performance signifie qu'on peut l'héberger soi-même, adapter les poids, et s'affranchir des conditions d'utilisation imposées par OpenAI, Anthropic ou Google. Pour les marchés émergents et les entreprises européennes soucieuses de souveraineté numérique, c'est une alternative concrète aux géants américains. Ce lancement s'inscrit dans la continuité directe du coup de tonnerre de janvier 2025, lorsque DeepSeek-R1 avait provoqué un effondrement boursier des valeurs tech américaines en démontrant qu'on pouvait former des modèles de pointe à moindre coût. La Maison-Blanche surveille désormais de près les pratiques des laboratoires chinois, notamment sur les questions d'accès aux puces et de transfert technologique. Avec V4, DeepSeek confirme une stratégie délibérée : rendre l'open source suffisamment attractif pour décrocher les utilisateurs mondiaux des écosystèmes américains.

UELes entreprises européennes soucieuses de souveraineté numérique disposent d'une alternative open weight auto-hébergeable aux API américaines, réduisant leur dépendance aux conditions d'utilisation imposées par OpenAI, Anthropic ou Google.

💬 Sept fois moins cher que Claude Opus 4.7, open weight, que tu peux héberger toi-même sans dépendre d'une API américaine : on est loin du coup de com'. DeepSeek ne construit pas juste un modèle compétitif, ils construisent une porte de sortie pour toutes les boîtes qui en ont marre des conditions d'utilisation qui changent et des prix qui grimpent. Reste à tester si ça tient en prod.

LLMsOpinion
1 source
446VentureBeat AI 

Trois agents de codage IA ont laissé fuiter des secrets via une injection de prompt, un éditeur l'avait prédit

Un chercheur en sécurité de l'Université Johns Hopkins, Aonan Guan, accompagné de ses collègues Zhengyu Liu et Gavin Zhong, a publié la semaine dernière une divulgation technique intitulée "Comment and Control" démontrant qu'une simple injection de prompt dans le titre d'une pull request GitHub suffisait à compromettre trois agents de codage IA majeurs. L'attaque a forcé l'action Claude Code Security Review d'Anthropic à publier sa propre clé API en commentaire, et la même technique a fonctionné sur le Gemini CLI Action de Google ainsi que sur le Copilot Agent de GitHub (Microsoft), sans nécessiter aucune infrastructure externe. Les trois entreprises ont discrètement corrigé la faille : Anthropic l'a classée CVSS 9.4 Critique en versant une prime de 100 dollars, Google a payé 1 337 dollars, et GitHub a accordé 500 dollars via son programme Copilot Bounty. Aucune des trois n'avait publié de CVE officiel ni d'avis de sécurité public au moment de la divulgation. L'impact de cette vulnérabilité touche directement tous les dépôts GitHub utilisant le déclencheur pullrequesttarget, requis par la plupart des intégrations d'agents IA pour accéder aux secrets. Contrairement au déclencheur standard pull_request, ce mode injecte les secrets dans l'environnement d'exécution, exposant collaborateurs, champs de commentaires et flux de code automatisé à des acteurs malveillants. Merritt Baer, directrice de la sécurité chez Enkrypt AI et ancienne directrice adjointe de la sécurité chez AWS, résume l'enjeu sans détour : la protection doit se situer "à la frontière de l'action, pas à celle du modèle", c'est le runtime qui constitue le véritable périmètre d'exposition. Cette attaque illustre une surface de risque concrète pour toute organisation ayant intégré des agents IA dans ses pipelines de revue de code. Ce qui rend cet incident particulièrement révélateur, c'est que la fiche système d'Anthropic pour Claude Code Security Review indiquait explicitement que l'outil "n'est pas durci contre les injections de prompt", l'exploit n'a fait que confirmer ce qui était documenté. En comparaison, la fiche système d'OpenAI pour GPT-5.4 publie des évaluations d'injection au niveau du modèle mais ne documente pas la résistance au niveau du runtime ou de l'exécution des outils. Celle de Google pour Gemini 3.1 Pro, publiée en février, renvoie pour l'essentiel à une documentation plus ancienne et maintient son programme de red teaming entièrement interne, sans programme cyber externe. L'écart entre ce que les éditeurs documentent et ce qu'ils protègent réellement est désormais au coeur du débat sur la sécurité des agents IA déployés dans des environnements de développement sensibles.

UELes organisations européennes intégrant des agents IA (Claude Code, Gemini CLI, Copilot) dans leurs pipelines CI/CD GitHub sont directement exposées : tout dépôt utilisant le déclencheur `pullrequesttarget` peut avoir vu ses secrets fuiter, et une revue de configuration s'impose immédiatement.

💬 Anthropic a classé ça CVSS 9.4 et a payé 100 dollars de bounty. Cent dollars pour une fuite de clé API dans le titre d'une pull request, c'est le genre de disproportion qui dit tout sur comment ces outils ont été mis en prod. Le pire, c'est que c'était écrit noir sur blanc dans leur system card : "non durci contre les injections de prompt." Si tu utilises `pullrequesttarget` dans tes workflows GitHub avec un agent IA, va vérifier maintenant.

SécuritéActu
1 source
447InfoQ AI 

Claude Code découvre une faille du noyau Linux exploitable à distance, cachée depuis 23 ans

Nicholas Carlini, chercheur chez Anthropic, a utilisé Claude Code pour identifier un débordement de tampon en tas (heap buffer overflow) exploitable à distance dans le pilote NFS du noyau Linux, une faille dissimulée depuis 23 ans. Au total, cinq vulnérabilités du noyau ont été confirmées à l'issue de cette recherche, dont certaines pourraient permettre à un attaquant distant de compromettre des systèmes Linux sans authentification préalable. La découverte illustre un tournant dans la façon dont l'IA contribue à la sécurité logicielle. Les mainteneurs du noyau Linux signalent que la qualité des rapports de bugs générés par l'IA s'est nettement améliorée : les listes de sécurité reçoivent désormais entre 5 et 10 signalements valides par jour, contre des soumissions quasi-inutilisables il y a encore peu. Pour les équipes de sécurité, cela représente un changement de rythme considérable, avec un flux de vulnérabilités légitimes à traiter en continu. Le noyau Linux est au cœur de milliards de serveurs, appareils embarqués et infrastructures critiques dans le monde. Une faille exploitable à distance dans le pilote NFS, utilisé pour le partage de fichiers en réseau, représente un risque particulièrement sérieux pour les environnements d'entreprise. Cette découverte s'inscrit dans une tendance plus large où les grands modèles de langage commencent à rivaliser avec des experts humains en audit de code bas niveau, ouvrant la voie à une automatisation partielle de la recherche de vulnérabilités dans des bases de code vieilles de plusieurs décennies.

UELes infrastructures critiques européennes basées sur Linux avec NFS sont directement exposées à cette faille exploitable à distance sans authentification ; les équipes sécurité doivent prioriser l'application des correctifs noyau.

💬 23 ans que cette faille traînait dans le noyau Linux, et c'est un LLM qui la sort. C'est peut-être le meilleur argument concret pour l'IA en sécurité que j'ai vu cette année : pas un benchmark, pas une démo, une vraie CVE sur du code critique que des milliers d'experts ont lu sans la voir. Reste à voir si les équipes sécurité vont suivre le rythme, parce que 5 à 10 signalements valides par jour, c'est un autre métier.

SécuritéActu
1 source
448VentureBeat AI 

Mythos a exploité de façon autonome des failles ignorées depuis 27 ans : les équipes de sécurité doivent changer d'approche

Un bug vieux de 27 ans dormait dans la pile TCP d'OpenBSD, l'un des systèmes d'exploitation les plus réputés pour sa sécurité. Des auditeurs humains l'avaient examiné, des outils de fuzzing l'avaient martelé des millions de fois, et pourtant deux paquets réseau suffisaient à faire crasher n'importe quel serveur tournant dessus. C'est Claude Mythos Preview, le nouveau modèle d'Anthropic, qui l'a découvert de manière entièrement autonome, sans aucune guidance humaine après le prompt initial. Le coût total de la campagne de découverte : environ 20 000 dollars. Le coût de l'exécution spécifique qui a trouvé la faille : moins de 50 dollars. Ce n'était pas un cas isolé : Mythos a également identifié une faille de 16 ans dans le codec H.264 de FFmpeg, que les fuzzeurs avaient pourtant exercé 5 millions de fois sans jamais la déclencher, une faille d'exécution de code à distance dans FreeBSD NFS vieille de 17 ans (CVE-2026-4747), permettant un accès root non authentifié depuis internet, et des milliers d'autres zero-days touchant tous les grands systèmes d'exploitation et navigateurs. Sur les tests comparatifs, Mythos dépasse Claude Opus 4.6 de manière spectaculaire : 181 exploits réussis contre 2 sur Firefox 147, un score de 77,8 % contre 53,4 % sur SWE-bench Pro, et 83,1 % contre 66,6 % sur CyberGym. Mythos a saturé le CTF interne Cybench d'Anthropic à 100 %, contraignant l'équipe rouge à basculer vers la découverte de zero-days réels comme seule évaluation pertinente. La portée de ces capacités redéfinit ce que l'industrie de la sécurité considérait comme possible. Des ingénieurs d'Anthropic sans formation formelle en sécurité ont demandé à Mythos de trouver des vulnérabilités d'exécution de code à distance pendant la nuit, et se sont réveillés avec un exploit fonctionnel complet. Ce n'est plus de l'analyse de code assistée : c'est un raisonnement sémantique autonome sur des interactions logicielles complexes que ni les outils statiques (SAST), ni le fuzzing, ni les auditeurs humains n'avaient su intercepter en plusieurs décennies. Les directeurs de sécurité reçoivent la nouvelle sans recevoir le manuel d'urgence. Pour tenter de canaliser cette capacité vers la défense avant qu'elle ne soit massivement utilisée à des fins offensives, Anthropic a constitué le Project Glasswing, une coalition de 12 partenaires incluant CrowdStrike, Cisco, Palo Alto Networks, Microsoft, AWS, Apple et la Linux Foundation. L'initiative est soutenue par 100 millions de dollars en crédits d'utilisation et 4 millions de dollars en subventions open-source, avec plus de 40 organisations supplémentaires accédant au modèle pour auditer leur propre infrastructure. Anthropic s'est engagé à publier un rapport public des découvertes d'ici 90 jours, soit début juillet 2026. Anthony Grieco, SVP et Chief Security Officer de Cisco, résumait l'ambivalence du moment lors de la RSA Conference 2026 : "Je n'ai jamais été aussi optimiste pour ce que nous pouvons accomplir en sécurité. C'est aussi un peu terrifiant, parce que nos adversaires ont cette même capacité."

UELes failles zero-day découvertes de manière autonome dans OpenBSD, FFmpeg et FreeBSD exposent des infrastructures critiques largement déployées en Europe, tandis que l'absence d'acteurs européens dans la coalition Project Glasswing interroge sur la capacité de l'UE à bénéficier des mécanismes de divulgation responsable mis en place par Anthropic.

💬 Un bug de 27 ans dans OpenBSD, trouvé pour moins de 50 dollars, là où des millions de passes de fuzzing avaient rien vu. C'est le genre de chiffre qui te fait relire deux fois. Ce qui change vraiment, c'est pas que le modèle soit "fort en sécu", c'est qu'il raisonne sur les interactions entre composants, là où tous nos outils s'arrêtent à la surface. Project Glasswing, c'est bien, mais 12 partenaires américains et zéro européen dans la coalition, ça dit quelque chose sur où se prennent les décisions qui vont compter.

SécuritéOpinion
1 source
Les chercheurs estiment que l'IA devient redoutablement efficace en matière de piratage, même sans Mythos
449The Information AI 

Les chercheurs estiment que l'IA devient redoutablement efficace en matière de piratage, même sans Mythos

Anthropic a développé un nouveau modèle d'IA baptisé Mythos, jugé si performant dans la réalisation de cyberattaques que l'entreprise a décidé de ne pas le rendre public. La société a choisi de le partager uniquement avec de grandes entreprises technologiques sélectionnées, afin qu'elles puissent anticiper et renforcer leurs défenses avant une éventuelle diffusion plus large. Parallèlement, la startup de cybersécurité Buzz, financée par Sequoia Capital, a publié de nouvelles recherches révélant que les modèles d'IA déjà disponibles publiquement sont capables de mener des cyberattaques complexes et autonomes en quelques minutes seulement. Ces résultats sont préoccupants à plusieurs titres. Le fait que des outils existants, accessibles à n'importe qui, puissent automatiser des attaques informatiques sophistiquées sans intervention humaine significative abaisse drastiquement le seuil d'entrée pour les acteurs malveillants. Des individus sans compétences techniques avancées pourraient désormais conduire des offensives qui requéraient auparavant des équipes entières de hackers expérimentés, menaçant aussi bien les entreprises que les infrastructures critiques. La décision d'Anthropic de restreindre Mythos illustre une tension croissante dans l'industrie de l'IA entre innovation ouverte et gestion des risques. Les grands laboratoires sont de plus en plus confrontés à la question de la divulgation responsable de modèles à capacités duales. Que des modèles grand public aient déjà atteint ce niveau de dangerosité offensive souligne l'urgence d'investir massivement dans la cybersécurité défensive, et relance le débat sur la nécessité d'une régulation internationale coordonnée du développement et de la diffusion des modèles d'IA les plus puissants.

UELes entreprises et infrastructures critiques européennes sont directement menacées par la démocratisation des cyberattaques autonomes via IA, renforçant l'urgence d'une régulation internationale coordonnée que la France et l'UE ont intérêt à porter.

💬 La rétention de Mythos fait les gros titres, mais c'est presque pas le sujet. Ce qui compte, c'est que les modèles déjà publics automatisent des attaques sophistiquées en quelques minutes, sans expertise requise. Le seuil d'entrée vient de s'effondrer, et on n'a pas attendu le modèle secret pour ça.

SécuritéOpinion
1 source
Après la fuite du code source de Claude Code : 5 actions pour les responsables sécurité en entreprise
450VentureBeat AI 

Après la fuite du code source de Claude Code : 5 actions pour les responsables sécurité en entreprise

Le 31 mars 2026, Anthropic a accidentellement inclus un fichier source map de 59,8 Mo dans la version 2.1.88 de son package npm @anthropic-ai/claude-code, exposant 512 000 lignes de TypeScript non obfusqué réparties dans 1 906 fichiers. Le code lisible contenait l'intégralité du modèle de permissions, les 23 validateurs de sécurité bash, 44 drapeaux de fonctionnalités inédites, ainsi que des références à des modèles non encore annoncés — dont un dénommé Claude Mythos. Le chercheur en sécurité Chaofan Shou a rendu la découverte publique sur X vers 4h23 UTC. Des dépôts miroirs ont proliféré sur GitHub en quelques heures. Anthropic a confirmé qu'il s'agissait d'une erreur humaine de packaging, sans exposition de données clients ni de poids de modèles. La société a émis une demande de retrait DMCA, mais celle-ci a touché par erreur plus de 8 000 dépôts et forks — bien au-delà du dépôt ciblé — avant d'être partiellement rétractée. Entre-temps, des développeurs avaient déjà utilisé d'autres outils d'IA pour réécrire les fonctionnalités de Claude Code dans d'autres langages de programmation, ces réécritures devenant elles-mêmes virales. L'impact dépasse la simple fuite de code. Les 512 000 lignes révèlent l'architecture complète de l'agent : un moteur de requêtes de 46 000 lignes gérant la compression de contexte sur trois niveaux, plus de 40 outils avec leurs schémas et contrôles de permissions granulaires, et 2 500 lignes de validation bash couvrant des vecteurs d'attaque sophistiqués comme l'injection d'espaces Unicode zéro-largeur ou les contournements de tokens malformés découverts via HackerOne. Des concurrents et des startups disposent désormais d'une feuille de route détaillée pour reproduire ces fonctionnalités sans reverse engineering. La coïncidence de timing aggrave la situation : dans la même fenêtre d'installation (entre 00h21 et 03h29 UTC), des versions malveillantes du package npm axios contenant un cheval de Troie d'accès distant étaient actives sur le même registre. Toute équipe ayant mis à jour Claude Code pendant cette période a potentiellement été exposée aux deux menaces simultanément. Ce n'est pas un incident isolé. Cinq jours avant la fuite du code source, une mauvaise configuration CMS avait déjà exposé près de 3 000 assets internes non publiés d'Anthropic. Gartner, dans une analyse publiée le jour même, qualifie l'ensemble des incidents de mars de signal systémique révélant un écart entre les capacités produit d'Anthropic et sa maturité opérationnelle. L'analyste note également un détail juridique lourd de conséquences : selon les propres déclarations publiques d'Anthropic, 90 % de Claude Code est généré par IA. Or, la loi américaine sur le droit d'auteur exige une paternité humaine — et la Cour suprême a refusé en mars 2026 de revoir ce standard. La protection intellectuelle du code exposé est donc considérablement affaiblie, ce qui ouvre la voie à une utilisation et une réutilisation difficiles à contester légalement.

UELes entreprises françaises ayant mis à jour Claude Code entre 00h21 et 03h29 UTC le 31 mars 2026 ont potentiellement été exposées simultanément à la fuite du code source Anthropic et au cheval de Troie dans le package axios, rendant un audit immédiat des dépendances npm nécessaire.

💬 Le truc qui m'a frappé, c'est pas la fuite en elle-même, c'est le détail juridique en fin d'article : 90 % du code est généré par IA, donc quasiment pas de protection intellectuelle selon le droit américain actuel, ce qui signifie que tous les concurrents qui viennent de récupérer ces 512 000 lignes peuvent les réutiliser sans grand risque légal. Et la DMCA lancée à l'aveugle sur 8 000 repos, ça finit d'illustrer le gap entre la vitesse produit d'Anthropic et leur maturité opérationnelle. Gartner a raison pour une fois.

SécuritéOpinion
1 source