OutilsMarkTechPost9h· 2 min de lecture

xAI lance /goal dans Grok Build : exécution autonome longue durée avec vérification intégrée pour les tâches de codage en plusieurs étapes

Résumé IASource uniqueImpact UE Take éditorial

xAI a lancé une nouvelle fonctionnalité baptisée /goal au sein de Grok Build, son agent de codage en ligne de commande. Le mode cible l'exécution autonome de tâches longues et complexes : l'utilisateur soumet un objectif en une seule ligne, par exemple "Migrate the auth module to the new API", et l'agent prend en charge l'ensemble du processus sans supervision à chaque étape. Grok Build planifie une approche, la décompose en une liste de tâches visible, puis exécute chaque point séquentiellement. Une fois l'objectif atteint, le panneau bascule sur "Complete" et chaque élément apparaît comme coché. L'utilisateur peut continuer à transmettre des instructions pendant l'exécution, ou piloter la session via les commandes status, pause, resume et clear. L'accès nécessite un abonnement SuperGrok ou X Premium Plus, et le CLI s'installe via une commande curl en une ligne.

Ce qui distingue /goal d'un simple agent d'édition de fichiers, c'est l'intégration native de la vérification. L'agent ne s'arrête pas après avoir écrit du code : il continue jusqu'à ce que la tâche soit réalisée et validée. Cette vérification peut prendre trois formes concrètes : relecture du code produit, inspection de pages web pour confirmer le comportement attendu, ou exécution de scripts de test. Ce mécanisme répond à l'une des limites les plus critiquées des agents autonomes, la tendance à déclarer une tâche terminée avant que le résultat ne soit réellement fonctionnel. Pour les développeurs, cela transforme la relation au travail délégué, notamment sur des tâches mécaniques mais étendues : migration de services, ajout d'endpoints, mise à jour de dépendances, portage de configurations sur plusieurs fichiers.

Grok Build est l'outil de développement d'xAI, la société d'Elon Musk fondée en 2023, et embarque déjà plusieurs fonctionnalités orientées agents : un mode plan qui bloque les modifications jusqu'à validation explicite, des sous-agents spécialisés travaillant en parallèle, et la compatibilité native avec le protocole MCP (Model Context Protocol), qui permet aux agents de se connecter à des outils et sources de données externes. /goal s'inscrit dans une compétition intense entre les grands acteurs du codage assisté, que ce soit Cursor, GitHub Copilot, Anthropic avec Claude Code ou Google avec Gemini, tous engagés dans une course à l'autonomie fiable sur des tâches longues. La vraie bataille ne porte plus sur la qualité d'une réponse unique, mais sur la capacité à mener à bien une tâche entière, sans supervision constante, et surtout en sachant s'arrêter au bon moment.

💬 L'analyse de Mathieu

La vérification intégrée, c'est exactement ce que tous les agents rataient jusqu'ici. Pas juste écrire le code et te passer la main en prétendant avoir fini, mais inspecter, tester, confirmer que ça tourne, et seulement après s'arrêter. Reste à voir si ça tient vraiment sur de vraies migrations en prod, mais xAI vient d'attaquer le bon problème.

Dans nos dossiers

Microsoft Anthropic Claude Code Gemini

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Le Big Data

xAI lance Grok Build : L’agent de codage qui veut détrôner Claude Code

xAI, la société d'intelligence artificielle fondée par Elon Musk, a lancé le 14 mai 2026 Grok Build, un agent de codage en version bêta. Accessible uniquement aux abonnés SuperGrok Heavy à 300 dollars par mois, l'outil se présente comme un agent de programmation avancé doublé d'une interface en ligne de commande. Cette phase initiale est revendiquée par xAI comme un laboratoire grandeur nature : les retours des premiers utilisateurs serviront à corriger les bugs, affiner les performances et enrichir les fonctionnalités au fil du temps. L'installation s'effectue directement depuis le site officiel de xAI, via connexion au compte utilisateur. Grok Build cible explicitement les développeurs professionnels confrontés à des tâches complexes. Son mode sans interface graphique permet de l'intégrer dans des scripts et des automatisations existantes, et son interface en ligne de commande prend en charge le protocole ACP pour faciliter la création de bots personnalisés et d'applications orchestrant plusieurs agents. Pour les projets ambitieux, un mode planification permet à l'agent de préparer une stratégie détaillée que le développeur peut approuver, modifier ou réécrire avant toute exécution. Chaque modification s'affiche ensuite sous forme de diff structuré. L'outil reconnaît automatiquement les conventions d'un dépôt existant, prend en charge les fichiers AGENTS.md, plugins, hooks, skills et serveurs MCP, et peut déléguer certaines tâches à des sous-agents spécialisés exécutés en parallèle pour accélérer le développement. Le lancement de Grok Build s'inscrit dans une course effrénée aux agents de codage autonomes, marché où Anthropic s'est imposé avec Claude Code et où GitHub Copilot, Cursor ou Devin occupent déjà des positions établies. xAI, qui a considérablement accéléré le développement de sa famille de modèles Grok depuis le rachat de Twitter, cherche à transformer son avantage en données et en visibilité publique en une présence concrète dans les outils du quotidien des développeurs. La barrière d'entrée actuelle, 300 dollars mensuels pour un accès bêta, limite volontairement la base d'utilisateurs initiale afin de contrôler la charge et la qualité des retours. Si xAI parvient à démontrer des performances compétitives sur des benchmarks de codage réels, une ouverture plus large à des tarifs inférieurs semble probable. L'enjeu dépasse le simple outil : c'est la capacité de la plateforme Grok à s'imposer comme infrastructure de développement logiciel qui est en jeu.

💬 300 dollars par mois pour une bêta, ça élimine d'emblée les 99% qui auraient pu tester et critiquer sérieusement. Ce qui me parle dans les specs : AGENTS.md natif, MCP, sous-agents parallèles, diffs structurés... c'est exactement le workflow de Claude Code, recopié proprement. Reste à voir si Grok derrière tient en prod sur des bases de code un peu sérieuses.

OutilsOutil

1 source

2MarkTechPost

xAI lance une marketplace de plugins pour Grok Build avec MongoDB, Vercel, Sentry et Cloudflare au lancement

xAI vient de lancer le Plugin Marketplace pour Grok Build, son agent de développement en ligne de commande. Annoncé le 12 juin 2026, ce catalogue intégré permet aux développeurs de parcourir, installer et mettre à jour des plugins directement depuis le terminal, sans quitter leur environnement de travail. Un plugin regroupe en un seul paquet six types de composants : des skills, des commandes slash, des agents, des hooks de cycle de vie, des serveurs MCP et des serveurs LSP (protocole de serveur de langage). L'index public du catalogue est hébergé sur GitHub sous le dépôt xai-org/plugin-marketplace. Au lancement, six partenaires sont présents : MongoDB pour l'exploration et l'optimisation de bases de données, Vercel pour la gestion des déploiements, Sentry pour l'analyse des erreurs en production, Chrome DevTools pour le contrôle d'un navigateur en direct, Cloudflare pour les Workers et Durable Objects, et Superpowers pour des workflows d'agents préconfigurés. L'installation se fait via la commande /marketplace dans Grok Build ou directement en shell avec grok plugin install --trust. Ce marketplace représente un changement structurel dans la façon dont les développeurs étendent leurs agents de codage. Avant cette sortie, chaque intégration devait être configurée manuellement, outil par outil. Désormais, une seule commande suffit pour embarquer un bundle complet de capacités. Concrètement, un ingénieur de permanence peut installer le plugin Sentry pour trier une stack trace de production sans changer d'outil, ou un développeur frontend peut connecter Chrome DevTools pour inspecter des requêtes réseau lors d'un rendu défaillant. Ce modèle de distribution réduit la friction d'intégration et rapproche Grok Build des environnements de développement complets, directement depuis le terminal. Sur le plan de la sécurité, xAI a introduit un mécanisme de fixation par SHA : chaque plugin distant doit spécifier un SHA de commit complet sur 40 caractères, que Grok Build vérifie après le clonage via git rev-parse HEAD. Ce système empêche qu'un force-push ou une compromission de dépôt ne fasse passer du code malveillant silencieusement. Le catalogue distingue par ailleurs les plugins internes signés par xAI des plugins tiers, pour lesquels xAI décline explicitement toute responsabilité. La plateforme est ouverte aux contributions externes : n'importe quel développeur peut proposer un plugin via une pull request sur le dépôt public. Ce mouvement s'inscrit dans une compétition directe avec d'autres agents de codage comme Claude Code, qui propose un écosystème similaire de skills et de serveurs MCP. xAI parie que la distribution centralisée et la vérification cryptographique constitueront un avantage décisif pour attirer les développeurs professionnels vers Grok Build.

OutilsOutil

1 source

3MarkTechPost

xAI lance des API autonomes de reconnaissance et synthèse vocale Grok pour les développeurs entreprise

xAI, la société d'intelligence artificielle d'Elon Musk, a lancé deux nouvelles API audio autonomes : une API de transcription vocale (Speech-to-Text) et une API de synthèse vocale (Text-to-Speech), toutes deux basées sur la même infrastructure qui alimente Grok Voice sur les applications mobiles, les véhicules Tesla et le support client Starlink. L'API STT est disponible dès maintenant, avec transcription en 25 langues, modes batch et temps réel, à des tarifs de 0,10 dollar par heure en batch et 0,20 dollar en streaming. L'API TTS, elle, est facturée 4,20 dollars par million de caractères, prend en charge 20 langues et propose cinq voix distinctes. Les deux API entrent directement en concurrence avec les acteurs établis du marché : ElevenLabs, Deepgram et AssemblyAI. Ces nouveaux outils s'adressent en priorité aux développeurs qui construisent des agents vocaux, des systèmes de transcription de réunions, des centres d'appels automatisés ou des fonctionnalités d'accessibilité. Sur le plan technique, l'API STT intègre des horodatages au niveau du mot, la diarisation des locuteurs (identification de qui parle à quel moment), le support de 12 formats audio et une normalisation intelligente du texte qui convertit automatiquement les formes orales en formats lisibles. L'API TTS se distingue par sa capacité à injecter des balises expressives dans le texte, comme [laugh], [sigh] ou des balises enveloppantes comme whisper et emphasis, permettant une synthèse vocale naturelle et nuancée, loin de la monotonie des systèmes classiques. Sur les benchmarks internes, xAI revendique un taux d'erreur de 5,0 % pour la reconnaissance d'entités sur appels téléphoniques, contre 12,0 % pour ElevenLabs, 13,5 % pour Deepgram et 21,3 % pour AssemblyAI. Ce lancement s'inscrit dans une stratégie d'expansion agressive de xAI, qui cherche à monétiser ses capacités audio au-delà de l'écosystème Grok et à conquérir un marché entreprise où la qualité de transcription et la latence sont des critères décisifs. Le marché des API vocales connaît une forte croissance portée par l'essor des agents IA conversationnels, des outils de réunion automatisés et des interfaces vocales embarquées. Si les performances annoncées se confirment en production, xAI dispose d'un avantage compétitif tangible face à des concurrents bien établis, mais les développeurs attendront des validations indépendantes avant de migrer leurs infrastructures critiques vers une plateforme encore jeune.

💬 Les chiffres du benchmark STT sont impressionnants, 5% d'erreur contre 21% pour AssemblyAI, bon, sur le papier. Le pricing est agressif et les features (diarisation, balises expressives) montrent qu'ils ont bossé le sujet sérieusement, pas juste un wrapper OpenAI Whisper habillé. Reste à voir si ça tient en prod sur des accents français ou du bruit ambiant réel, parce que les benchmarks internes de xAI, j'attends la validation communautaire avant de migrer quoi que ce soit.

OutilsOutil

1 source

4InfoQ AI

OpenAI publie Symphony en open source : un SPEC.md pour l'orchestration d'agents de codage autonomes

OpenAI a publié en open source Symphony, un orchestrateur d'agents de codage autonomes accompagné d'une spécification formelle baptisée SPEC.md. Le système utilise des outils de gestion de projet, comme les gestionnaires de tickets, comme plan de contrôle pour coordonner plusieurs agents travaillant en parallèle. Concrètement, Symphony découpe le travail en "tâches" distinctes, chacune confiée à un agent dédié qui progresse jusqu'à l'achèvement sans intervention humaine continue. Une fois la tâche terminée, un développeur humain examine le résultat avant de valider ou corriger. Ce modèle rompt avec l'approche actuelle où les développeurs supervisent activement chaque session de codage assistée par IA. Avec Symphony, un ingénieur peut déléguer simultanément plusieurs blocs de travail à une flotte d'agents autonomes, ce qui multiplie potentiellement la capacité de production d'une équipe sans augmenter ses effectifs. Pour les entreprises tech, cela annonce des pipelines de développement logiciel beaucoup plus automatisés, où l'humain intervient surtout en phase de validation plutôt qu'en pilotage continu. Symphony émerge dans un contexte de compétition intense autour des agents de codage autonomes. OpenAI affronte Anthropic et son assistant Claude, Google avec Gemini Code Assist, ainsi que des startups comme Cognition AI dont l'agent Devin cible explicitement ce marché. En diffusant Symphony sous forme de spécification ouverte, OpenAI tente d'influencer les standards de l'industrie et d'encourager l'adoption de son approche d'orchestration par d'autres équipes et plateformes. La prochaine étape sera de voir si SPEC.md s'impose comme référence, ou si chaque acteur développe son propre modèle propriétaire.

💬 OpenAI publie une spec ouverte, pas juste du code, et c'est exactement la stratégie qu'on adopte quand on veut que l'industrie entière s'aligne sur ton modèle d'orchestration plutôt que sur celui du voisin. Le truc intéressant dans Symphony, c'est ce glissement : le dev ne pilote plus en continu, il valide à la fin, comme un lead qui fait des code reviews plutôt que du pair-programming permanent. Ça ressemble à du vrai changement de workflow, pas du gadget.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic