
xAI lance /goal dans Grok Build : exécution autonome longue durée avec vérification intégrée pour les tâches de codage en plusieurs étapes
xAI a lancé une nouvelle fonctionnalité baptisée /goal au sein de Grok Build, son agent de codage en ligne de commande. Le mode cible l'exécution autonome de tâches longues et complexes : l'utilisateur soumet un objectif en une seule ligne, par exemple "Migrate the auth module to the new API", et l'agent prend en charge l'ensemble du processus sans supervision à chaque étape. Grok Build planifie une approche, la décompose en une liste de tâches visible, puis exécute chaque point séquentiellement. Une fois l'objectif atteint, le panneau bascule sur "Complete" et chaque élément apparaît comme coché. L'utilisateur peut continuer à transmettre des instructions pendant l'exécution, ou piloter la session via les commandes status, pause, resume et clear. L'accès nécessite un abonnement SuperGrok ou X Premium Plus, et le CLI s'installe via une commande curl en une ligne.
Ce qui distingue /goal d'un simple agent d'édition de fichiers, c'est l'intégration native de la vérification. L'agent ne s'arrête pas après avoir écrit du code : il continue jusqu'à ce que la tâche soit réalisée et validée. Cette vérification peut prendre trois formes concrètes : relecture du code produit, inspection de pages web pour confirmer le comportement attendu, ou exécution de scripts de test. Ce mécanisme répond à l'une des limites les plus critiquées des agents autonomes, la tendance à déclarer une tâche terminée avant que le résultat ne soit réellement fonctionnel. Pour les développeurs, cela transforme la relation au travail délégué, notamment sur des tâches mécaniques mais étendues : migration de services, ajout d'endpoints, mise à jour de dépendances, portage de configurations sur plusieurs fichiers.
Grok Build est l'outil de développement d'xAI, la société d'Elon Musk fondée en 2023, et embarque déjà plusieurs fonctionnalités orientées agents : un mode plan qui bloque les modifications jusqu'à validation explicite, des sous-agents spécialisés travaillant en parallèle, et la compatibilité native avec le protocole MCP (Model Context Protocol), qui permet aux agents de se connecter à des outils et sources de données externes. /goal s'inscrit dans une compétition intense entre les grands acteurs du codage assisté, que ce soit Cursor, GitHub Copilot, Anthropic avec Claude Code ou Google avec Gemini, tous engagés dans une course à l'autonomie fiable sur des tâches longues. La vraie bataille ne porte plus sur la qualité d'une réponse unique, mais sur la capacité à mener à bien une tâche entière, sans supervision constante, et surtout en sachant s'arrêter au bon moment.
La vérification intégrée, c'est exactement ce que tous les agents rataient jusqu'ici. Pas juste écrire le code et te passer la main en prétendant avoir fini, mais inspecter, tester, confirmer que ça tourne, et seulement après s'arrêter. Reste à voir si ça tient vraiment sur de vraies migrations en prod, mais xAI vient d'attaquer le bon problème.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.



