OutilsVentureBeat AI · 14 mai 2026, 21:12· 2 min de lecture

Claude Code : ce que fait la commande /goals

Anthropic a introduit une nouvelle fonctionnalité dans Claude Code appelée /goals, qui sépare formellement l'exécution d'une tâche de son évaluation. Concrètement, lorsqu'un développeur définit un objectif via cette commande, par exemple /goal all tests in test/auth pass, and the lint step is clean, un second modèle, Claude Haiku par défaut, intervient après chaque étape pour vérifier si la condition est réellement remplie. Si ce n'est pas le cas, l'agent continue à travailler. Ce n'est qu'une fois la condition satisfaite que le système enregistre l'objectif atteint dans la transcription de la conversation et efface l'instruction. Haiku est retenu pour ce rôle d'évaluateur car sa décision est binaire : terminé ou pas terminé.

Le problème que /goals cherche à résoudre est concret et coûteux : un agent de migration de code peut terminer son exécution, afficher un pipeline vert, mais avoir laissé plusieurs composants non compilés, une erreur qui peut prendre plusieurs jours à détecter. Ce n'est pas une défaillance du modèle en tant que tel, c'est l'agent qui décide qu'il a fini avant que ce soit réellement le cas. Pour les entreprises qui déploient des pipelines IA en production, cette confusion entre ce qui a été accompli et ce qui reste à faire représente un risque opérationnel sérieux. Avec ce mécanisme natif, Anthropic affirme qu'il n'est plus nécessaire de s'appuyer sur une plateforme d'observabilité tierce ni sur des journaux personnalisés pour reconstruire après coup ce qui s'est passé.

D'autres acteurs du secteur ont identifié le même obstacle. OpenAI permet aux utilisateurs d'ajouter leurs propres évaluateurs mais laisse au modèle la responsabilité de décider quand s'arrêter. LangGraph et le Google Agent Development Kit (ADK) rendent possible une évaluation indépendante, mais exigent que les développeurs définissent eux-mêmes le nœud critique, la logique de terminaison et la configuration de l'observabilité. Google ADK propose un LoopAgent aux capacités comparables, mais l'architecture reste entièrement à la charge du développeur. Anthropic, en intégrant l'évaluateur directement dans Claude Code avec des paramètres par défaut, mise sur la simplicité de déploiement comme avantage différenciant. Sean Brownell, directeur solutions chez Sprinklr, tempère toutefois l'enthousiasme : la boucle tâche/juge fonctionne, mais l'approche d'Anthropic n'est pas fondamentalement unique. Cette évolution s'inscrit dans une tendance plus large où les systèmes de vérification indépendants deviennent un composant standard des agents à longue durée d'exécution, aux côtés d'outils comme Devin ou SWE-agent.

Dans nos dossiers

Anthropic Claude Code OpenAI

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Ars Technica AI

Voici ce que la fuite du code source de Claude Code révèle sur les plans d'Anthropic

La fuite inattendue du code source de Claude Code, l'outil de développement d'Anthropic, a mis en lumière les coulisses techniques de ce produit phare. Plus de 512 000 lignes de code réparties sur plus de 2 000 fichiers ont été rendues accessibles, permettant à de nombreux observateurs de les analyser en détail. Au-delà de l'architecture existante, les chercheurs ont découvert des références à des fonctionnalités désactivées, cachées ou inactives — offrant un aperçu inédit de la feuille de route potentielle d'Anthropic. La découverte la plus marquante est celle d'un système baptisé Kairos : un démon persistant conçu pour fonctionner en arrière-plan, même lorsque la fenêtre du terminal Claude Code est fermée. Ce système utiliserait des invitations périodiques appelées ` pour évaluer régulièrement si de nouvelles actions sont nécessaires, ainsi qu'un drapeau PROACTIVE destiné à "remonter proactivement quelque chose que l'utilisateur n'a pas demandé mais qu'il a besoin de voir maintenant." Kairos s'appuie sur un système de mémoire basé sur des fichiers, permettant une continuité d'opération entre les sessions utilisateur. Un prompt découvert derrière le drapeau désactivé KAIROS` précise que l'objectif est que le système "dispose d'une image complète de qui est l'utilisateur, comment il souhaite collaborer, quels comportements éviter ou reproduire, et le contexte derrière son travail." Cette fuite intervient dans un contexte de compétition intense entre les assistants de développement — GitHub Copilot, Cursor, et Windsurf se disputant le même marché. L'émergence d'un agent autonome et persistant comme Kairos marquerait un tournant majeur : on passerait d'un outil réactif à une IA proactive capable d'initiative. Cela soulève également des questions sur la vie privée et la surveillance des développeurs, puisque le système est explicitement conçu pour profiler les habitudes de travail et anticiper les besoins. Si Anthropic confirme et déploie ces fonctionnalités, Claude Code ne serait plus seulement un assistant — il deviendrait un collaborateur permanent, toujours actif en fond de session.

UELe système Kairos, conçu pour profiler en continu les habitudes de travail des développeurs, soulève des questions de conformité au RGPD pour les entreprises et développeurs européens utilisant Claude Code.

💬 Kairos, c'est exactement ce que j'attendais d'un agent de dev sérieux. Un démon persistant avec mémoire de session, des invitations périodiques, une capacité à agir sans qu'on lui demande, sur le papier c'est le rêve. Sauf qu'en Europe, "profiler les habitudes de travail en continu" sans consentement explicite va faire grincer des dents chez les DPO, et Anthropic va avoir du boulot pour que ça passe en prod dans une boîte française.

OutilsOutil

1 source

2Ben's Bites

Dans les fichiers Claude Code divulgués

Anthropic a accidentellement divulgué l'intégralité du code source de Claude Code début avril 2026, à cause d'une erreur humaine dans l'un de ses processus internes. Boris, le responsable du projet Claude Code chez Anthropic, a confirmé qu'il s'agissait d'une erreur de développeur, non d'un bug ou d'une intrusion. La fuite a exposé l'architecture complète de l'outil : les prompts internes, les workflows d'agents, le système de permissions, et plusieurs fonctionnalités inédites ou cachées. Parmi celles-ci : un mode "Proactif" permettant à l'IA de travailler de manière autonome sans instructions, un système de détection de frustration ou de colère via des patterns de mots-clés, un compagnon de type Tamagotchi accessible via la commande "/buddy", des démons en arrière-plan similaires à ceux d'OpenClaw, un mode de dissimulation de commits, ainsi que plusieurs flags de fonctionnalités révélant la feuille de route du produit. La communauté des développeurs s'est immédiatement emparée du code sur GitHub, forçant Anthropic à envoyer des notices DMCA pour en obtenir le retrait. La fuite met Anthropic dans une position délicate sur plusieurs fronts. D'un côté, elle expose des choix de conception et des fonctionnalités stratégiques que l'entreprise n'était pas prête à annoncer publiquement. De l'autre, des développeurs ont rapidement porté le code vers d'autres langages comme Python et Rust, créant une zone grise juridique : si Anthropic cherche à faire retirer ces portages, elle pourrait soulever des questions sur la solidité de ses propres droits d'auteur. Par ailleurs, Claude Code vient d'annoncer une fonctionnalité concrète indépendante de la fuite : un nouveau rendu d'interface en terminal pour résoudre le problème de scintillement, avec support complet de la souris et affichage du nombre de nouveaux messages lors du défilement. Cette fonctionnalité est disponible en version expérimentale via la variable d'environnement CLAUDECODENO_FLICKER=1. Cet incident s'inscrit dans une semaine chargée pour l'industrie de l'IA, compliquée par le contexte du 1er avril, qui a rendu difficile la distinction entre annonces réelles et canulars. OpenAI a par exemple finalisé une levée de fonds de 122 milliards de dollars à une valorisation post-money de 852 milliards de dollars, avec un chiffre d'affaires mensuel d'environ 2 milliards de dollars dont 40 % provenant des entreprises. Gumroad a annoncé remplacer son PDG par un agent IA, une décision présentée comme sérieuse par son fondateur Sahil Lavingia. La fuite de Claude Code illustre plus largement les risques opérationnels qui accompagnent le développement accéléré des outils d'IA en 2026 : la vitesse d'itération crée des angles morts, et les secrets industriels peuvent se retrouver publics en quelques heures, bien avant que les équipes juridiques aient le temps de réagir.

💬 La fuite Claude Code, c'est le genre d'accident qui arrive quand tu itères trop vite et que personne ne vérifie deux fois. Ce qui m'intéresse là-dedans, c'est moins le "/buddy" Tamagotchi que le mode de dissimulation de commits : ça soulève des questions sur ce qu'on laisse vraiment tourner sur nos machines. Bon, les DMCA ça ne rattrapera rien, le code est déjà partout.

OutilsOpinion

1 source

3Ben's Bites

Claude Code dans Slack

Anthropic a lancé Claude Tag, une fonctionnalité permettant de mentionner une instance partagée de Claude Code directement dans Slack, à la manière d'un collègue. Les équipes peuvent désormais déléguer des tâches à l'agent, qui conserve le contexte des conversations Slack pour agir de manière autonome pendant que les développeurs se concentrent sur d'autres priorités. Dans le même temps, Google a annoncé que Gemini 3.5 Flash intègre désormais le contrôle d'environnements informatiques, navigateur, mobile et desktop compris, avec un dépôt GitHub disponible pour des tests locaux ou via Browserbase. OpenAI, de son côté, a révélé la fabrication de sa première puce IA maison, baptisée Jalapeño, développée en partenariat avec Broadcom pour alimenter les inférences derrière ChatGPT, Codex et l'API. Par ailleurs, John Jumper, chercheur principal derrière AlphaFold chez DeepMind, quitte Google pour rejoindre Anthropic, dans ce qui constitue l'un des transferts de talent les plus remarqués de l'année dans le secteur. Ces annonces illustrent une accélération de l'intégration des agents IA dans les outils de travail quotidiens. L'arrivée de Claude dans Slack transforme un assistant individuel en ressource d'équipe partagée, ce qui change profondément la façon dont les organisations peuvent déléguer du travail cognitif à grande échelle. Le mouvement de John Jumper vers Anthropic renforce la compétition pour les chercheurs de premier plan entre les grands laboratoires, et signale que la course aux talents reste aussi intense que celle aux modèles. La puce Jalapeño marque quant à elle un tournant stratégique pour OpenAI : réduire la dépendance à Nvidia en contrôlant une partie de la chaîne matérielle, à l'instar d'Amazon et Google avant eux. La tendance de fond est claire : les outils professionnels majeurs absorbent les agents IA comme couche native. Notion annonce que sa plateforme développeur permettra bientôt d'intégrer Claude Code, Cursor ou Codex directement dans des docs et tableaux de tâches partagés. Figma, lors de sa conférence Config, a présenté la transformation de calles de design en code, un outil de motion design et des connexions tierces pour Figma Agent. Ce mouvement d'intégration verticale, où chaque SaaS devient une surface d'action pour les agents, redistribue les usages : les assistants IA ne sont plus des outils parallèles, mais des participants directs aux flux de travail existants. La question qui se pose désormais est celle de la gouvernance et de la sécurité des données d'entreprise exposées à ces agents, un sujet sur lequel plusieurs acteurs, dont Rippling, cherchent déjà à proposer des cadres structurés.

UELes entreprises françaises et européennes utilisant Slack, Notion ou Figma devront évaluer les implications RGPD de l'exposition de données internes aux agents IA, un risque de gouvernance émergent souligné par l'article.

💬 Claude dans Slack, c'est le moment où l'agent arrête d'être un outil perso pour devenir une ressource partagée par toute l'équipe. C'est un glissement qui paraît anodin mais qui change tout : une fois que n'importe qui peut lui déléguer une tâche en channel, les données internes circulent vers un système externe sans que personne ne l'ait vraiment décidé. Bon courage aux équipes juridiques françaises.

OutilsOutil

1 source

4Le Big Data

xAI lance Grok Build : L’agent de codage qui veut détrôner Claude Code

xAI, la société d'intelligence artificielle fondée par Elon Musk, a lancé le 14 mai 2026 Grok Build, un agent de codage en version bêta. Accessible uniquement aux abonnés SuperGrok Heavy à 300 dollars par mois, l'outil se présente comme un agent de programmation avancé doublé d'une interface en ligne de commande. Cette phase initiale est revendiquée par xAI comme un laboratoire grandeur nature : les retours des premiers utilisateurs serviront à corriger les bugs, affiner les performances et enrichir les fonctionnalités au fil du temps. L'installation s'effectue directement depuis le site officiel de xAI, via connexion au compte utilisateur. Grok Build cible explicitement les développeurs professionnels confrontés à des tâches complexes. Son mode sans interface graphique permet de l'intégrer dans des scripts et des automatisations existantes, et son interface en ligne de commande prend en charge le protocole ACP pour faciliter la création de bots personnalisés et d'applications orchestrant plusieurs agents. Pour les projets ambitieux, un mode planification permet à l'agent de préparer une stratégie détaillée que le développeur peut approuver, modifier ou réécrire avant toute exécution. Chaque modification s'affiche ensuite sous forme de diff structuré. L'outil reconnaît automatiquement les conventions d'un dépôt existant, prend en charge les fichiers AGENTS.md, plugins, hooks, skills et serveurs MCP, et peut déléguer certaines tâches à des sous-agents spécialisés exécutés en parallèle pour accélérer le développement. Le lancement de Grok Build s'inscrit dans une course effrénée aux agents de codage autonomes, marché où Anthropic s'est imposé avec Claude Code et où GitHub Copilot, Cursor ou Devin occupent déjà des positions établies. xAI, qui a considérablement accéléré le développement de sa famille de modèles Grok depuis le rachat de Twitter, cherche à transformer son avantage en données et en visibilité publique en une présence concrète dans les outils du quotidien des développeurs. La barrière d'entrée actuelle, 300 dollars mensuels pour un accès bêta, limite volontairement la base d'utilisateurs initiale afin de contrôler la charge et la qualité des retours. Si xAI parvient à démontrer des performances compétitives sur des benchmarks de codage réels, une ouverture plus large à des tarifs inférieurs semble probable. L'enjeu dépasse le simple outil : c'est la capacité de la plateforme Grok à s'imposer comme infrastructure de développement logiciel qui est en jeu.

💬 300 dollars par mois pour une bêta, ça élimine d'emblée les 99% qui auraient pu tester et critiquer sérieusement. Ce qui me parle dans les specs : AGENTS.md natif, MCP, sous-agents parallèles, diffs structurés... c'est exactement le workflow de Claude Code, recopié proprement. Reste à voir si Grok derrière tient en prod sur des bases de code un peu sérieuses.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic