Voice Agent Builder : xAI promet de créer votre agent vocal en moins de 2 minutes
xAI a lancé le 1er juillet 2026 Voice Agent Builder, une plateforme sans code permettant de créer un agent vocal capable de répondre au téléphone en moins de deux minutes. Disponible dès aujourd'hui en version bêta au tarif de 0,05 dollar par minute d'audio, sans frais de plateforme supplémentaires, l'outil s'appuie sur Grok Voice, le modèle vocal maison de xAI. L'utilisateur décrit simplement le rôle souhaité pour son agent, ajoute des documents de référence au format Word, Excel, Markdown ou HTML, définit des règles de sécurité, puis connecte ses outils. La plateforme propose plus de 80 voix intégrées et permet aussi de créer une voix personnalisée à partir de quelques minutes d'enregistrement audio. Un numéro de téléphone est fourni pour tester l'agent ou le déployer directement. xAI met en avant une architecture unifiée qui regroupe reconnaissance vocale, raisonnement et synthèse de la voix au sein d'une même plateforme, là où la plupart des concurrents combinent plusieurs services distincts.
Cette annonce marque l'entrée de xAI dans un marché déjà très disputé, celui des agents vocaux capables de décrocher le téléphone et d'exécuter des tâches en temps réel pour le compte d'une entreprise. Contrairement aux chatbots textuels, ces agents peuvent consulter une base documentaire, effectuer des recherches via des API, planifier un rendez-vous dans Google Agenda ou Outlook, envoyer un e-mail, ou transférer l'appel vers un opérateur humain quand la situation l'exige. En réduisant le nombre d'intermédiaires techniques, xAI promet moins de latence et moins de points de défaillance, un argument clé pour des usages comme les centres d'appels ou le support client, où chaque seconde de délai peut nuire à l'expérience. Les administrateurs conservent un contrôle fin : chaque conversation est enregistrée et transcrite, les actions de l'agent sont consultables, et des garde-fous peuvent bloquer l'accès à des données sensibles comme les informations bancaires.
Cette sortie s'inscrit dans une tendance plus large où les IA génératives quittent le simple cadre du chat pour prendre en charge des interactions vocales complexes, avec bruit de fond, accents marqués, interruptions et changements d'avis en cours de conversation. xAI affirme avoir entraîné Grok Voice spécifiquement sur ce type de situations réalistes, loin des démonstrations marketing parfaitement maîtrisées, et met en avant son propre benchmark interne, baptisé τ-Voice Bench, où son modèle devancerait plusieurs solutions concurrentes. Comme pour tout classement maison, la prudence reste de mise : ces résultats donnent une indication mais ne remplacent pas des retours d'expérience indépendants. Les entreprises jugeront avant tout sur la qualité des conversations en conditions réelles, dans un secteur où plusieurs acteurs proposent déjà des offres similaires et où la différenciation se jouera autant sur la fiabilité que sur le prix.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




