Dossier Anthropic — page 9

1260 articles · page 9 sur 26

Suivi d'Anthropic, le laboratoire qui a fait de la safety son positionnement : Claude, Mythos, Opus, partenariats Glasswing, IPO.

401The Information AI OutilsOutil

Pourquoi les boucles d'agents ont la cote

Les "agent loops", ou boucles d'agents, s'imposent comme l'une des approches les plus discutées dans la communauté des développeurs IA, notamment sur X et Reddit ces dernières semaines. Le principe consiste à faire tourner un ou plusieurs agents en boucle autonome, sans intervention humaine entre chaque étape : l'agent tente différentes approches pour accomplir une tâche, un second agent évalue son travail, et le processus recommence jusqu'à l'atteinte de l'objectif ou d'une condition d'arrêt prédéfinie. Cette méthode tranche avec l'approche classique qui consiste à soumettre un prompt, attendre la réponse, puis corriger manuellement. Lors de la conférence AI Engineers d'avril 2025, des ingénieurs d'Anthropic ont illustré le potentiel de la technique avec un exemple concret : ils ont demandé à Claude de développer une application générant des jeux vidéo rétro. Avec un prompt minimal, Claude a livré l'application en 20 minutes pour 9 dollars. La même tâche confiée à une boucle d'agents a pris six heures et coûté 200 dollars, mais le résultat était nettement supérieur. L'engouement pour les boucles d'agents tient à leur capacité à traiter des tâches longues ou mal définies, là où une simple requête atteint rapidement ses limites. Pour les développeurs qui construisent des applications complexes, l'approche offre un niveau de qualité qu'un échange ponctuel ne permet pas d'atteindre. Le compromis reste cependant significatif : un rapport de coût de 1 à 22 représente une barrière réelle à l'adoption généralisée. À court terme, cette méthode restera donc réservée aux cas d'usage où la qualité prime sur le budget, plutôt qu'aux tâches routinières à faible enjeu. Cette tendance s'inscrit dans une évolution plus large du secteur vers des systèmes d'IA toujours plus autonomes. L'industrie se déplace progressivement du modèle "prompt-réponse" vers des architectures multi-agents capables de s'auto-corriger et de raisonner sur de longues séquences d'actions. Anthropic, qui développe Claude, figure parmi les acteurs en pointe sur ce terrain, aux côtés d'OpenAI et Google DeepMind. L'enjeu à moyen terme sera de réduire le coût computationnel de ces boucles pour les rendre économiquement accessibles à grande échelle, condition nécessaire pour que les agent loops passent du statut d'expérimentation avancée à celui d'outil standard du développement IA.

Dossier Anthropic — page 9

Pourquoi les boucles d'agents ont la cote

Enregistrer une compétence

SpaceX est déjà un fournisseur cloud de 28 milliards de dollars par an

Red-Teaming après Mythos : Zico Kolter et Matt Fredrikson, Gray Swan

Sakana AI lance Sakana Fugu : un modèle d'orchestration qui répartit les tâches entre un ensemble interchangeable de LLMs frontier

Google adopte l'Interactions API comme interface par défaut pour ses modèles et agents Gemini

Sans Claude Fable 5 : Sakana atteint les performances de pointe avec son système multi-modèles Fugu

Objectifs climatiques ou IA ? Pour le lobby des data centers, l’Europe doit choisir

Claude Mythos a piraté la « quasi-totalité des systèmes classifiés » de la NSA en « quelques heures », mais c’était un test

Emmanuel Macron appelle à un sursaut européen pour ne pas être « consommateurs d’une technologie faite par d’autres »

Le jour où la Silicon Valley a compris qu’elle n’était pas souveraine

Les modèles d'IA "dangereux" vont émerger quoi qu'il arrive

☕️ Intelligence artificielle et taxation numérique au cœur du G7

Les politiques gouvernementales imprévisibles, nouveau risque de l'IA

GLM-5.2 à poids ouverts de Z.ai surpasse GPT-5.5 sur plusieurs benchmarks de codage long terme, pour un sixième du coût

SpaceX va acquérir la plateforme de codage IA Cursor pour 60 milliards de dollars

Adieu Fable

Le coût de l'IA s'impose comme enjeu central, du moins en Asie

Mistral serait valorisée 20 milliards d’euros après une levée de 3 milliards

La Fable, le Mythos et la raison d’État

Washington interdit Mythos 5 : l’Amérique veut contrôler les modèles, quelle sera la réponse des acteurs de l’IA?

Fable et Mythos officiellement jugés trop dangereux pour être publiés

Claude Fable 5 : le premier modèle Mythos est puissant, coûteux et très filtré

Le piratage de Meta révèle que la sécurité de l'IA va au-delà de Mythos

OpenAI et Microsoft présentent de nouvelles offres IA aux entreprises

MiniMax-M3 surpasse GPT-5.5 et Gemini 3.1 Pro sur des benchmarks clés, pour 5 à 10 % du coût

Les failles de Claude Mythos révèlent une réalité dure : vos correctifs d'entreprise sont beaucoup trop lents

Mistral AI lance Vibe, s'étend dans l'IA industrielle et annonce un grand centre de données pour concurrencer OpenAI

Data center, AGI, industrie : Mistral AI sur tous les fronts

Des millions d'agents IA menacés par une faille critique dans un paquet open source

Cybersécurité : la BCE s’inquiète de Mythos et convoque les banques européennes

Cohere maîtrise la quantification sans perte et les citations natives avec Command A+, son premier modèle Apache 2.0

Quatre attaques sur la chaîne d'approvisionnement IA en 50 jours révèlent des failles dans les pipelines de déploiement

Mistral AI piraté ? 5 Go de code source en vente

Claude Code ou Claude dans Chrome : grille d'audit des angles morts de votre dispositif de sécurité

L’IA aurait aidé des pirates à développer un exploit zero-day, une première selon Google

Dans l’IA, la Chine bouscule son monde avec sa stratégie open source

GPT-5.5 égale Mythos Preview dans les nouveaux tests de cybersécurité

GPT-5.5 rivalise avec Claude Mythos dans les tests de cyberattaques, selon l'Institut britannique de sécurité de l'IA

Claude Code, Copilot et Codex ont tous été piratés : les attaquants visaient les identifiants, pas le modèle

Le pari d'Amazon sur OpenAI marque une nouvelle phase dans la guerre du cloud, sans exclusivité

Comment survivre à la déferlante à venir des vulnérabilités identifiées par IA ? (3/3)

Le canadien COHERE ouvre une porte en Europe avec l’acquisition d’ALEPH ALPHA

DeepSeek-V4 : performances proches du meilleur niveau pour un sixième du coût d'Opus 4.7 et GPT-5.5

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis

Trois agents de codage IA ont laissé fuiter des secrets via une injection de prompt, un éditeur l'avait prédit

Claude Code découvre une faille du noyau Linux exploitable à distance, cachée depuis 23 ans

Mythos a exploité de façon autonome des failles ignorées depuis 27 ans : les équipes de sécurité doivent changer d'approche

Les chercheurs estiment que l'IA devient redoutablement efficace en matière de piratage, même sans Mythos

Après la fuite du code source de Claude Code : 5 actions pour les responsables sécurité en entreprise