Aller au contenu principal
Claude Code : ce que fait la commande /goals
OutilsVentureBeat AI3sem

Claude Code : ce que fait la commande /goals

Résumé IASource uniqueImpact UE
Source originale ↗·

Anthropic a introduit une nouvelle fonctionnalité dans Claude Code appelée /goals, qui sépare formellement l'exécution d'une tâche de son évaluation. Concrètement, lorsqu'un développeur définit un objectif via cette commande, par exemple /goal all tests in test/auth pass, and the lint step is clean, un second modèle, Claude Haiku par défaut, intervient après chaque étape pour vérifier si la condition est réellement remplie. Si ce n'est pas le cas, l'agent continue à travailler. Ce n'est qu'une fois la condition satisfaite que le système enregistre l'objectif atteint dans la transcription de la conversation et efface l'instruction. Haiku est retenu pour ce rôle d'évaluateur car sa décision est binaire : terminé ou pas terminé.

Le problème que /goals cherche à résoudre est concret et coûteux : un agent de migration de code peut terminer son exécution, afficher un pipeline vert, mais avoir laissé plusieurs composants non compilés, une erreur qui peut prendre plusieurs jours à détecter. Ce n'est pas une défaillance du modèle en tant que tel, c'est l'agent qui décide qu'il a fini avant que ce soit réellement le cas. Pour les entreprises qui déploient des pipelines IA en production, cette confusion entre ce qui a été accompli et ce qui reste à faire représente un risque opérationnel sérieux. Avec ce mécanisme natif, Anthropic affirme qu'il n'est plus nécessaire de s'appuyer sur une plateforme d'observabilité tierce ni sur des journaux personnalisés pour reconstruire après coup ce qui s'est passé.

D'autres acteurs du secteur ont identifié le même obstacle. OpenAI permet aux utilisateurs d'ajouter leurs propres évaluateurs mais laisse au modèle la responsabilité de décider quand s'arrêter. LangGraph et le Google Agent Development Kit (ADK) rendent possible une évaluation indépendante, mais exigent que les développeurs définissent eux-mêmes le nœud critique, la logique de terminaison et la configuration de l'observabilité. Google ADK propose un LoopAgent aux capacités comparables, mais l'architecture reste entièrement à la charge du développeur. Anthropic, en intégrant l'évaluateur directement dans Claude Code avec des paramètres par défaut, mise sur la simplicité de déploiement comme avantage différenciant. Sean Brownell, directeur solutions chez Sprinklr, tempère toutefois l'enthousiasme : la boucle tâche/juge fonctionne, mais l'approche d'Anthropic n'est pas fondamentalement unique. Cette évolution s'inscrit dans une tendance plus large où les systèmes de vérification indépendants deviennent un composant standard des agents à longue durée d'exécution, aux côtés d'outils comme Devin ou SWE-agent.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Voici ce que la fuite du code source de Claude Code révèle sur les plans d'Anthropic
1Ars Technica AI 

Voici ce que la fuite du code source de Claude Code révèle sur les plans d'Anthropic

La fuite inattendue du code source de Claude Code, l'outil de développement d'Anthropic, a mis en lumière les coulisses techniques de ce produit phare. Plus de 512 000 lignes de code réparties sur plus de 2 000 fichiers ont été rendues accessibles, permettant à de nombreux observateurs de les analyser en détail. Au-delà de l'architecture existante, les chercheurs ont découvert des références à des fonctionnalités désactivées, cachées ou inactives — offrant un aperçu inédit de la feuille de route potentielle d'Anthropic. La découverte la plus marquante est celle d'un système baptisé Kairos : un démon persistant conçu pour fonctionner en arrière-plan, même lorsque la fenêtre du terminal Claude Code est fermée. Ce système utiliserait des invitations périodiques appelées ` pour évaluer régulièrement si de nouvelles actions sont nécessaires, ainsi qu'un drapeau PROACTIVE destiné à "remonter proactivement quelque chose que l'utilisateur n'a pas demandé mais qu'il a besoin de voir maintenant." Kairos s'appuie sur un système de mémoire basé sur des fichiers, permettant une continuité d'opération entre les sessions utilisateur. Un prompt découvert derrière le drapeau désactivé KAIROS` précise que l'objectif est que le système "dispose d'une image complète de qui est l'utilisateur, comment il souhaite collaborer, quels comportements éviter ou reproduire, et le contexte derrière son travail." Cette fuite intervient dans un contexte de compétition intense entre les assistants de développement — GitHub Copilot, Cursor, et Windsurf se disputant le même marché. L'émergence d'un agent autonome et persistant comme Kairos marquerait un tournant majeur : on passerait d'un outil réactif à une IA proactive capable d'initiative. Cela soulève également des questions sur la vie privée et la surveillance des développeurs, puisque le système est explicitement conçu pour profiler les habitudes de travail et anticiper les besoins. Si Anthropic confirme et déploie ces fonctionnalités, Claude Code ne serait plus seulement un assistant — il deviendrait un collaborateur permanent, toujours actif en fond de session.

UELe système Kairos, conçu pour profiler en continu les habitudes de travail des développeurs, soulève des questions de conformité au RGPD pour les entreprises et développeurs européens utilisant Claude Code.

💬 Kairos, c'est exactement ce que j'attendais d'un agent de dev sérieux. Un démon persistant avec mémoire de session, des invitations périodiques, une capacité à agir sans qu'on lui demande, sur le papier c'est le rêve. Sauf qu'en Europe, "profiler les habitudes de travail en continu" sans consentement explicite va faire grincer des dents chez les DPO, et Anthropic va avoir du boulot pour que ça passe en prod dans une boîte française.

OutilsOutil
1 source
Dans les fichiers Claude Code divulgués
2Ben's Bites 

Dans les fichiers Claude Code divulgués

Anthropic a accidentellement divulgué l'intégralité du code source de Claude Code début avril 2026, à cause d'une erreur humaine dans l'un de ses processus internes. Boris, le responsable du projet Claude Code chez Anthropic, a confirmé qu'il s'agissait d'une erreur de développeur, non d'un bug ou d'une intrusion. La fuite a exposé l'architecture complète de l'outil : les prompts internes, les workflows d'agents, le système de permissions, et plusieurs fonctionnalités inédites ou cachées. Parmi celles-ci : un mode "Proactif" permettant à l'IA de travailler de manière autonome sans instructions, un système de détection de frustration ou de colère via des patterns de mots-clés, un compagnon de type Tamagotchi accessible via la commande "/buddy", des démons en arrière-plan similaires à ceux d'OpenClaw, un mode de dissimulation de commits, ainsi que plusieurs flags de fonctionnalités révélant la feuille de route du produit. La communauté des développeurs s'est immédiatement emparée du code sur GitHub, forçant Anthropic à envoyer des notices DMCA pour en obtenir le retrait. La fuite met Anthropic dans une position délicate sur plusieurs fronts. D'un côté, elle expose des choix de conception et des fonctionnalités stratégiques que l'entreprise n'était pas prête à annoncer publiquement. De l'autre, des développeurs ont rapidement porté le code vers d'autres langages comme Python et Rust, créant une zone grise juridique : si Anthropic cherche à faire retirer ces portages, elle pourrait soulever des questions sur la solidité de ses propres droits d'auteur. Par ailleurs, Claude Code vient d'annoncer une fonctionnalité concrète indépendante de la fuite : un nouveau rendu d'interface en terminal pour résoudre le problème de scintillement, avec support complet de la souris et affichage du nombre de nouveaux messages lors du défilement. Cette fonctionnalité est disponible en version expérimentale via la variable d'environnement CLAUDECODENO_FLICKER=1. Cet incident s'inscrit dans une semaine chargée pour l'industrie de l'IA, compliquée par le contexte du 1er avril, qui a rendu difficile la distinction entre annonces réelles et canulars. OpenAI a par exemple finalisé une levée de fonds de 122 milliards de dollars à une valorisation post-money de 852 milliards de dollars, avec un chiffre d'affaires mensuel d'environ 2 milliards de dollars dont 40 % provenant des entreprises. Gumroad a annoncé remplacer son PDG par un agent IA, une décision présentée comme sérieuse par son fondateur Sahil Lavingia. La fuite de Claude Code illustre plus largement les risques opérationnels qui accompagnent le développement accéléré des outils d'IA en 2026 : la vitesse d'itération crée des angles morts, et les secrets industriels peuvent se retrouver publics en quelques heures, bien avant que les équipes juridiques aient le temps de réagir.

💬 La fuite Claude Code, c'est le genre d'accident qui arrive quand tu itères trop vite et que personne ne vérifie deux fois. Ce qui m'intéresse là-dedans, c'est moins le "/buddy" Tamagotchi que le mode de dissimulation de commits : ça soulève des questions sur ce qu'on laisse vraiment tourner sur nos machines. Bon, les DMCA ça ne rattrapera rien, le code est déjà partout.

OutilsOpinion
1 source
xAI lance Grok Build : L’agent de codage qui veut détrôner Claude Code
3Le Big Data 

xAI lance Grok Build : L’agent de codage qui veut détrôner Claude Code

xAI, la société d'intelligence artificielle fondée par Elon Musk, a lancé le 14 mai 2026 Grok Build, un agent de codage en version bêta. Accessible uniquement aux abonnés SuperGrok Heavy à 300 dollars par mois, l'outil se présente comme un agent de programmation avancé doublé d'une interface en ligne de commande. Cette phase initiale est revendiquée par xAI comme un laboratoire grandeur nature : les retours des premiers utilisateurs serviront à corriger les bugs, affiner les performances et enrichir les fonctionnalités au fil du temps. L'installation s'effectue directement depuis le site officiel de xAI, via connexion au compte utilisateur. Grok Build cible explicitement les développeurs professionnels confrontés à des tâches complexes. Son mode sans interface graphique permet de l'intégrer dans des scripts et des automatisations existantes, et son interface en ligne de commande prend en charge le protocole ACP pour faciliter la création de bots personnalisés et d'applications orchestrant plusieurs agents. Pour les projets ambitieux, un mode planification permet à l'agent de préparer une stratégie détaillée que le développeur peut approuver, modifier ou réécrire avant toute exécution. Chaque modification s'affiche ensuite sous forme de diff structuré. L'outil reconnaît automatiquement les conventions d'un dépôt existant, prend en charge les fichiers AGENTS.md, plugins, hooks, skills et serveurs MCP, et peut déléguer certaines tâches à des sous-agents spécialisés exécutés en parallèle pour accélérer le développement. Le lancement de Grok Build s'inscrit dans une course effrénée aux agents de codage autonomes, marché où Anthropic s'est imposé avec Claude Code et où GitHub Copilot, Cursor ou Devin occupent déjà des positions établies. xAI, qui a considérablement accéléré le développement de sa famille de modèles Grok depuis le rachat de Twitter, cherche à transformer son avantage en données et en visibilité publique en une présence concrète dans les outils du quotidien des développeurs. La barrière d'entrée actuelle, 300 dollars mensuels pour un accès bêta, limite volontairement la base d'utilisateurs initiale afin de contrôler la charge et la qualité des retours. Si xAI parvient à démontrer des performances compétitives sur des benchmarks de codage réels, une ouverture plus large à des tarifs inférieurs semble probable. L'enjeu dépasse le simple outil : c'est la capacité de la plateforme Grok à s'imposer comme infrastructure de développement logiciel qui est en jeu.

💬 300 dollars par mois pour une bêta, ça élimine d'emblée les 99% qui auraient pu tester et critiquer sérieusement. Ce qui me parle dans les specs : AGENTS.md natif, MCP, sous-agents parallèles, diffs structurés... c'est exactement le workflow de Claude Code, recopié proprement. Reste à voir si Grok derrière tient en prod sur des bases de code un peu sérieuses.

OutilsOutil
1 source
☕️ Après le code, Claude génère des interfaces
4Next INpact 

☕️ Après le code, Claude génère des interfaces

Anthropic a dévoilé Claude Design, un outil expérimental capable de générer des interfaces graphiques complètes à partir d'une simple description textuelle. Concrètement, un utilisateur peut demander à Claude de « prototyper une application mobile de méditation apaisante avec une typographie douce, des couleurs inspirées de la nature et une interface épurée », et l'outil produit immédiatement une première version exploitable. Les créations peuvent ensuite être affinées par la conversation, via des commentaires intégrés directement dans l'interface, ou à l'aide de curseurs personnalisés. L'outil prend en charge une large gamme de livrables : applications mobiles, sites web, présentations, assets pour réseaux sociaux, visuels de campagne marketing. Les exports sont possibles vers Canva, en PDF ou en format PPTX. Claude Design s'appuie sur Opus 4.7 et est réservé aux abonnements Pro, Max, Team et Enterprise. Ce qui distingue Claude Design des capacités de génération d'UI déjà présentes dans Claude, c'est l'accompagnement et la cohérence. L'outil peut ingérer les règles graphiques d'une équipe, couleurs, typographies, composants, bonnes pratiques, et les appliquer systématiquement à chaque projet. Il cible explicitement les créateurs d'entreprises, les chefs produit et les responsables marketing, c'est-à-dire des profils qui ont des besoins de design fréquents mais pas nécessairement la formation pour utiliser des outils professionnels. La possibilité de multiplier les itérations rapidement, sans dépendre d'un designer, représente un gain de temps concret pour ces équipes. L'annonce a d'ailleurs provoqué une réaction immédiate sur les marchés financiers : les actions d'Adobe et surtout de Figma, l'outil de référence pour la conception d'interfaces d'applications et de sites web, ont reculé à la suite de la présentation. Claude Design s'inscrit dans une stratégie plus large d'Anthropic visant à élargir Claude au-delà de la génération de texte et de code, vers des usages créatifs et organisationnels. L'outil vient compléter Claude Cowork, un agent orienté tâches de bureau, dans une offre croissante dédiée aux entreprises. Si l'outil entre en concurrence directe avec des plateformes comme Canva sur le segment grand public, Anthropic positionne plutôt Claude Design comme un accélérateur de prototypage destiné à nourrir des workflows existants, d'où l'intégration native avec Canva. La vraie menace pèse sur Figma, dont le modèle repose sur des équipes de designers professionnels collaborant sur des projets complexes. Si Claude Design permet à des non-designers de produire des maquettes convaincantes sans formation, la pression sur ce segment de marché pourrait s'intensifier à mesure que l'outil sort de sa phase expérimentale.

UELes équipes produit et marketing françaises et européennes peuvent dès maintenant prototyper des interfaces sans designer via Claude Design, tandis que les acteurs locaux du secteur du design numérique (agences, freelances) subissent une pression concurrentielle accrue.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour