Aller au contenu principal
Ce que c'est de travailler avec Mythos
LLMsOne Useful Thing6h

Ce que c'est de travailler avec Mythos

Résumé IASource uniqueImpact UE
Source originale ↗·

Claude 5 Fable, le premier modèle de la classe Mythos d'Anthropic à être rendu public, a fait l'objet d'un test approfondi par un chercheur ayant bénéficié d'un accès anticipé. Contrairement à la plupart des discussions qui se sont concentrées sur les implications pour la cybersécurité, ce test a couvert un spectre beaucoup plus large de cas d'usage. Les résultats sont frappants : Fable surpasse systématiquement tous les autres modèles publics testés jusqu'ici, sur des tâches aussi variées que la rédaction académique, la création littéraire ou le développement logiciel. Le modèle est capable de travailler de manière autonome jusqu'à une douzaine d'heures sur des spécifications complexes de plusieurs pages. À titre d'illustration, il a produit, à partir d'un seul prompt, un article de sciences sociales qualifié de "le plus sophistiqué jamais vu par une IA", ainsi qu'un poème épique de dix pages dont chaque mot commence par la lettre "s". Il a également développé plusieurs jeux vidéo complets à partir de descriptions vagues, en générant tous les éléments graphiques uniquement par le calcul mathématique, sans aucune image externe.

Ce bond qualitatif n'est pas qu'une question de performances sur des benchmarks. Ce qui change fondamentalement, c'est la nature de l'interaction entre l'humain et l'outil : il suffit de formuler une intention pour qu'elle se matérialise. Le cas d'une carte isochrone illustre parfaitement ce saut. Ces cartes, inventées en 1881 pour visualiser les temps de trajet depuis Londres, n'avaient jamais pu être correctement générées par un modèle d'IA en raison de leur complexité : elles nécessitent de croiser des milliers de données de trajets (avion, train, voiture, marche) avec une multitude de micro-décisions. Fable a non seulement accompli cette tâche, mais en lançant lui-même plusieurs sous-agents (dont des instances de Claude Sonnet) pour collecter les données, il a récupéré plus de 2 200 vols spécifiques ainsi que les horaires de trains réels, produisant une carte fonctionnelle et esthétiquement soignée dans le style de la carte originale de 1881.

Cette capacité à orchestrer d'autres IA de manière autonome marque une rupture avec les modèles précédents et soulève des questions plus larges. Anthropic positionne la classe Mythos comme une nouvelle génération de modèles "agents", capables de piloter des projets longs et complexes sans supervision constante. Le fait que Fable soit bridé sur les thématiques de cybersécurité suggère qu'Anthropic anticipe des risques d'usage malveillant à un niveau inédit. Pour les professionnels, chercheurs et développeurs, ce modèle représente moins un assistant amélioré qu'un collaborateur autonome capable de planifier, chercher, déléguer et livrer. La question n'est plus de savoir si l'IA peut faire le travail, mais de comprendre ce que cela change à la manière dont on travaille.

Impact France/UE

Les développeurs et chercheurs français et européens disposent d'un nouveau modèle agentique capable de piloter des projets complexes de manière autonome sur plusieurs heures, ce qui pourrait transformer les pratiques de travail dans les secteurs tech, académique et créatif en Europe.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Qu'est-ce que la dérive de tokenisation et comment y remédier ?
1MarkTechPost 

Qu'est-ce que la dérive de tokenisation et comment y remédier ?

Un modèle de langage peut produire des résultats parfaits à un instant donné, puis se dégrader sans que rien n'ait changé dans les données ou le code. La cause, souvent invisible, se trouve dans la tokenisation : avant tout traitement, un modèle convertit le texte en identifiants numériques appelés tokens, et de minuscules variations de formatage, un espace en début de mot, un saut de ligne, une ponctuation différente, peuvent générer des séquences de tokens entièrement distinctes. Ce phénomène porte un nom : la dérive de tokenisation, ou tokenization drift. Une démonstration concrète avec le tokeniseur GPT-2 (le même schéma Byte-Pair Encoding utilisé par GPT-4, LLaMA et Mistral) l'illustre parfaitement : aucune des sept paires de mots testés, "classify" avec ou sans espace initial, ne produit le même identifiant de token. Mieux encore, " classify" avec espace est encodé en un seul token (36509), tandis que "classify" sans espace devient deux tokens distincts (4871 et 1958). Le modèle ne voit pas seulement un identifiant différent : il reçoit une séquence de longueur différente, ce qui modifie le calcul de l'attention sur l'ensemble du contexte suivant. L'impact dépasse la simple curiosité technique. Lors du fine-tuning par instructions, les modèles apprennent non seulement des tâches, mais aussi la structure dans laquelle ces tâches leur sont présentées : séparateurs spécifiques, préfixes, motifs de formatage. Quand un prompt s'écarte de ces schémas appris, le modèle ne se retrouve plus dans sa distribution familière. Le résultat n'est pas une erreur franche mais quelque chose de plus insidieux : un modèle qui fait de son mieux sur des entrées qu'il n'a jamais été optimisé à traiter. Pour les équipes en production, cela signifie des régressions inexpliquées, des comportements non reproductibles entre environnements, et des bugs difficiles à diagnostiquer car aucun composant visible n'a changé. La solution proposée passe par une boucle légère d'optimisation des prompts : mesurer la dérive entre formats alternatifs via une métrique de distance dans l'espace des tokens, puis sélectionner le format qui maintient les entrées dans la distribution la plus stable. Cette approche s'appuie sur des outils accessibles, NumPy, scikit-learn pour une réduction PCA, seaborn pour la visualisation, et ne nécessite aucun ré-entraînement du modèle. Le sujet s'inscrit dans une réflexion plus large sur la fragilité des systèmes LLM face à des variations superficielles : la robustesse d'un pipeline d'IA ne dépend pas seulement de la qualité du modèle ou des données, mais aussi de la cohérence avec laquelle les entrées sont formatées à chaque étape, de la conception du prompt jusqu'au déploiement en production.

LLMsTuto
1 source
Anthropic lance Claude Fable 5 et Mythos 5, avec des progrès majeurs en programmation et en science
2The Decoder 

Anthropic lance Claude Fable 5 et Mythos 5, avec des progrès majeurs en programmation et en science

Anthropic a dévoilé deux nouveaux modèles d'intelligence artificielle, Claude Fable 5 et Mythos 5, qui surpassent significativement la génération Opus actuelle, notamment en programmation et en recherche scientifique. Fable 5 s'est illustré de manière spectaculaire en réalisant en une seule journée une migration de code pour l'entreprise de paiements Stripe, une tâche qui aurait nécessité deux mois de travail à une équipe entière de développeurs. Mythos 5, de son côté, a démontré une capacité autonome à concevoir des candidats médicamenteux, mais reste pour l'instant inaccessible au public en raison de ses aptitudes jugées dangereuses en cybersécurité offensive. Ces deux modèles redéfinissent ce que l'on entend par agent autonome dans le secteur technologique. La performance de Fable 5 sur la migration Stripe représente un changement de paradigme pour les équipes d'ingénierie : des tâches autrefois réservées à des équipes entières pendant des semaines peuvent désormais être déléguées à un système IA en quelques heures, avec des implications directes sur les coûts et l'organisation du travail. Pour l'industrie pharmaceutique, les capacités de Mythos 5 ouvrent des perspectives considérables dans la découverte de médicaments, en accélérant des processus de recherche qui prennent habituellement des années. Ces annonces s'inscrivent dans une course intense entre les grands laboratoires d'IA, où Anthropic cherche à rivaliser avec OpenAI et Google DeepMind sur le terrain des modèles dits frontier. La décision de restreindre l'accès à Mythos 5 illustre une tension croissante entre la puissance des nouveaux modèles et les risques qu'ils engendrent : même leurs créateurs hésitent désormais à les rendre publics. Cette prudence d'Anthropic, laboratoire historiquement centré sur la sécurité, signale que les capacités des modèles les plus avancés franchissent des seuils préoccupants, et que la question de leur déploiement responsable va s'imposer comme enjeu central de l'industrie dans les mois à venir.

UELes équipes tech européennes peuvent dès maintenant tester Fable 5 pour automatiser des tâches d'ingénierie complexes, tandis que la restriction de Mythos 5 pour risques cybersécurité offensifs va alimenter les débats européens sur l'AI Act et l'encadrement des modèles frontier.

LLMsOpinion
1 source
Anthropic démocratise Mythos avec Claude Fable 5, son modèle grand public le plus puissant à ce jour
3VentureBeat AI 

Anthropic démocratise Mythos avec Claude Fable 5, son modèle grand public le plus puissant à ce jour

Anthropic a lancé le 9 juin 2026 deux nouveaux modèles d'intelligence artificielle, Claude Fable 5 et Claude Mythos 5, marquant la première mise à disposition grand public de capacités dites "Mythos-class" jusqu'alors réservées aux partenaires du programme restreint Project Glasswing, annoncé deux mois plus tôt. Claude Fable 5 constitue la version accessible au grand public et surpasse tous les modèles Claude précédemment disponibles sur des tâches de développement logiciel, de travail intellectuel, de vision, de recherche scientifique et de longues séquences d'actions autonomes. Claude Mythos 5, lui, est une version améliorée du Mythos Preview, accessible uniquement aux partenaires cybersécurité de Project Glasswing et à une sélection de chercheurs en biologie. Les deux modèles sont facturés 10 dollars par million de tokens en entrée et 50 dollars par million en sortie, soit moins de la moitié du prix du Mythos Preview, mais ils demeurent les modèles les plus chers parmi les grands acteurs mondiaux de l'IA. Ce lancement introduit une architecture de sécurité inédite pour rendre les capacités Mythos accessibles sans les risques associés. Pour les requêtes jugées sensibles, notamment en cybersécurité, biologie, chimie ou distillation de modèles, Fable 5 redirige automatiquement vers Claude Opus 4.8 en notifiant l'utilisateur. Anthropic indique que plus de 95% des sessions Fable s'exécutent entièrement sur le modèle Fable sans ce repli, et que plus de 1 000 heures de tests adversariaux internes et externes n'ont révélé aucun contournement universel. Pour les développeurs, Fable 5 est disponible via l'API sous l'identifiant claude-fable-5 et sur les plans Enterprise à la consommation. Les abonnés Pro, Max, Team et Enterprise bénéficient d'un accès gratuit jusqu'au 22 juin 2026, date à laquelle le modèle basculera sur un système de crédits d'utilisation, Anthropic promettant de le réintégrer le plus vite possible dans les abonnements standards. Ce lancement s'inscrit dans une course aux capacités avancées qui divise désormais clairement le marché entre modèles grand public et modèles réservés à des usages à risque élevé. Anthropic avait ouvert Project Glasswing il y a deux mois pour permettre à des partenaires triés sur le volet d'accéder à des capacités cybersécurité offensives sous contrôle strict, une approche qui fait débat dans le secteur. Avec Fable 5, la société tente de commercialiser ces capacités à grande échelle tout en maintenant des garde-fous techniques. La concurrence est intense: DeepSeek, Google Gemini, xAI Grok et OpenAI GPT-5 couvrent désormais un spectre de prix allant de 0,42 à 35 dollars pour l'entrée et la sortie combinées, rendant le positionnement tarifaire d'Anthropic à 60 dollars le million de tokens cumulés difficile à justifier sans performances nettement supérieures sur les benchmarks les plus exigeants.

UELes développeurs et entreprises européens peuvent accéder à Claude Fable 5 via l'API dès maintenant, avec un accès gratuit jusqu'au 22 juin 2026 pour les abonnés payants, avant un basculement vers un système de crédits dont le tarif élevé (60 $ par million de tokens cumulés) pourrait freiner l'adoption au sein des startups et PME du continent.

LLMsOpinion
1 source
Anthropic dévoile Mythos, son modèle d’IA chasseur de failles… réservé à certains
4Next INpact 

Anthropic dévoile Mythos, son modèle d’IA chasseur de failles… réservé à certains

Anthropic a officialisé l'existence de Claude Mythos, un modèle d'intelligence artificielle spécialisé dans la cybersécurité, via le lancement du projet Glasswing. L'annonce est intervenue après plusieurs semaines de rumeurs et la fuite d'un billet de blog qui avait déjà éventé la surprise. Présenté comme plus capable qu'Opus, le modèle phare de la start-up californienne jusqu'alors, Mythos a été conçu pour détecter et exploiter des failles dans des logiciels avec une précision inédite. Son accès est strictement limité à un cercle de partenaires triés sur le volet : AWS, Apple, Google, Microsoft, NVIDIA, Cisco, Broadcom et la fondation Linux font partie des entreprises qui bénéficient d'un aperçu du modèle dans le cadre de Glasswing, un nom inspiré des papillons aux ailes transparentes. Anthropic reconnaît elle-même que Mythos est potentiellement trop dangereux pour une diffusion publique, ses capacités offensives en cybersécurité pouvant constituer une menace réelle si elles tombaient entre de mauvaises mains. En le réservant à de grands acteurs institutionnels et technologiques capables de l'encadrer, l'entreprise entend le transformer en outil défensif : sécuriser des logiciels critiques plutôt qu'en compromettre. Pour les entreprises partenaires, l'enjeu est considérable, car un modèle capable de scanner automatiquement des bases de code à la recherche de vulnérabilités inconnues représente un avantage stratégique majeur face aux attaques croissantes ciblant les infrastructures numériques mondiales. Cette annonce s'inscrit dans un contexte tendu pour Anthropic, frappée simultanément par une autre fuite involontaire concernant Claude Code, attribuée là encore à une "erreur humaine". La coïncidence de ces deux événements nourrit les interrogations sur la gestion interne de l'information chez la startup, fondée en 2021 par d'anciens d'OpenAI. La stratégie de communication autour de Mythos, d'abord entretenue dans le flou avant d'être officialisée sous une forme très contrôlée, intervient alors qu'Anthropic se prépare à une introduction en bourse et cherche à affirmer sa position face à OpenAI dans une compétition de plus en plus féroce. Limiter volontairement l'accès à son modèle le plus puissant, tout en le présentant comme potentiellement dangereux, est une manière de soigner à la fois son image de responsabilité et son aura technologique auprès des investisseurs et du grand public.

UEL'émergence d'un modèle IA dédié à la détection de vulnérabilités logicielles accentue la pression concurrentielle sur les acteurs européens de la cybersécurité et soulève des questions sur l'accès des infrastructures critiques européennes à ces capacités défensives de pointe.

LLMsOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour