Aller au contenu principal
Vercel lance Eve, un framework open-source d'agents IA où chaque agent correspond à un répertoire de fichiers
OutilsMarkTechPost4h· 2 min de lecture

Vercel lance Eve, un framework open-source d'agents IA où chaque agent correspond à un répertoire de fichiers

Source originale ↗·

Vercel a publié eve, un framework open source sous licence Apache-2.0, disponible en tant que package npm, destiné à la création, l'exécution et le déploiement d'agents d'intelligence artificielle en production. L'entreprise affirme faire déjà tourner plus d'une centaine d'agents sur ce même framework. Son principe central repose sur une approche dite "filesystem-first" : un agent est modélisé comme un répertoire de fichiers sur disque, chaque fichier correspondant à une capacité précise. Le plus petit agent fonctionnel ne requiert que deux fichiers, un pour définir le modèle utilisé (par exemple anthropic/claude-opus-4.8) et un fichier instructions.md servant de prompt système. Les fonctionnalités embarquées incluent l'exécution durable avec points de reprise automatiques, un environnement sandboxé pour le code généré par l'agent, un mécanisme d'approbation humaine pour les actions sensibles, et des connexions sécurisées vers des services tiers comme Slack, GitHub, Snowflake, Salesforce, Notion ou Linear. Un même agent peut être exposé simultanément sur plusieurs canaux, qu'il s'agisse de HTTP, Slack, Discord, Teams, Telegram ou Twilio, à partir d'une seule définition.

Ce lancement répond à un problème récurrent dans les équipes qui développent des agents : chaque projet recrée from scratch la même infrastructure de base, gestion des sessions, sandboxing, approbations, connexions API. Eve standardise cette structure sous forme d'une convention de répertoires stricte, éliminant le code répétitif et réduisant le temps de mise en production. Les développeurs ajoutent une capacité en déposant simplement un fichier dans le bon sous-répertoire ; le framework détecte et intègre automatiquement ces ajouts lors du build, sans enregistrement manuel. La durabilité des sessions, qui survivent aux crashs et aux redéploiements en reprenant exactement là où elles s'étaient arrêtées, réduit considérablement la charge opérationnelle pour les équipes gérant des agents à grande échelle.

Eve s'inscrit dans un mouvement plus large visant à industrialiser le déploiement d'agents IA, une étape que la plupart des équipes traversent encore de façon artisanale. En open-sourçant son framework interne, Vercel adopte une stratégie comparable à celle qu'il avait employée avec Next.js : proposer une couche d'abstraction susceptible de devenir un standard de facto, tout en restant étroitement liée à son infrastructure pour les déploiements en production. La concurrence est dense dans cet espace, avec LangGraph, CrewAI, AutoGen et le récent Agent Development Kit de Google ciblant tous le même besoin. L'approche "répertoire comme contrat" d'eve se distingue par sa lisibilité et sa convention forte, plus proche de la philosophie Next.js que des frameworks d'orchestration classiques. Les suites probables incluent une adoption croissante dans les équipes utilisant déjà Vercel, et une intégration plus poussée avec Vercel AI Gateway pour le routage multi-modèle.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Warp : comment le terminal open source réinvente le code à l’ère de l’IA agentique
1Le Big Data 

Warp : comment le terminal open source réinvente le code à l’ère de l’IA agentique

Warp est un terminal de développement conçu en Rust qui ambitionne de remplacer les émulateurs classiques comme iTerm2 ou les consoles natives des systèmes d'exploitation. L'outil, développé pour corriger la lenteur et le manque d'ergonomie des interfaces en ligne de commande existantes, intègre désormais une couche d'intelligence artificielle agentique directement au coeur de l'environnement de travail. Contrairement aux assistants de code classiques qui suggèrent une ligne ou corrigent une erreur à la demande, Warp fonctionne en mode autonome : le développeur formule un objectif en langage naturel, et le système planifie puis exécute les étapes nécessaires sans intervention manuelle à chaque décision. L'outil analyse l'arborescence du projet, indexe les configurations et cartographie les dépendances via une base vectorielle locale, ce qui lui permet d'adapter ses actions à l'architecture réelle de l'application. Une fois une instruction validée, il lance une boucle continue d'action et de vérification, pouvant écrire des scripts, démarrer des serveurs, lire les erreurs et corriger le code source en cas d'échec. L'impact pour les équipes de développement est direct : la plateforme vise à éliminer la fragmentation cognitive qui caractérise le quotidien des ingénieurs, contraints de jongler en permanence entre leur éditeur de code, la documentation en ligne et un outil d'IA générative externe. Ce va-et-vient constant, qui génère une fatigue cognitive réelle et des pertes de temps importantes, devient obsolète lorsque la documentation, l'analyse des pannes et l'exécution sont regroupées dans un même environnement. Le développeur passe du rôle d'exécutant de commandes mémorisées à celui de superviseur de processus automatisés, concentrant son attention sur la conception plutôt que sur les micro-décisions répétitives. Le contexte est celui d'une stagnation de plusieurs décennies du terminal traditionnel, dont l'interface n'a pas fondamentalement évolué depuis quarante ans malgré l'explosion de la complexité des projets logiciels. Warp s'inscrit dans une tendance plus large de l'industrie qui cherche à intégrer l'IA non plus comme un module externe mais comme une couche native des outils de développement, à l'image de ce que GitHub Copilot a fait pour les éditeurs de code. La distinction clé que pose Warp est celle entre l'assistance ponctuelle et l'agentivité réelle, un positionnement qui entre en concurrence directe avec des environnements comme Cursor ou les extensions IA de VS Code, mais sur le terrain du terminal plutôt que de l'éditeur. L'enjeu pour la startup est de convaincre une profession historiquement attachée à ses outils que la ligne de commande peut devenir un centre de pilotage intelligent sans sacrifier la maîtrise que les ingénieurs revendiquent sur leur environnement.

OutilsOutil
1 source
Vercel Labs lance Zero, un langage système conçu pour que les agents IA puissent lire, corriger et livrer des programmes natifs
2MarkTechPost 

Vercel Labs lance Zero, un langage système conçu pour que les agents IA puissent lire, corriger et livrer des programmes natifs

Vercel Labs, la branche recherche de la société américaine spécialisée dans le déploiement web, a publié Zero, un langage de programmation système expérimental conçu pour que les agents d'intelligence artificielle puissent lire, corriger et compiler du code natif de manière autonome. Zero se positionne dans le même espace que C ou Rust : il compile vers des exécutables natifs, offre un contrôle explicite de la mémoire et cible les environnements bas niveau. La différence fondamentale réside dans la conception du compilateur et de la chaîne d'outils, pensés dès le départ pour être consommés par des agents IA plutôt que par des ingénieurs humains. Le problème central que Zero cherche à résoudre est la manière dont les agents interagissent avec les retours du compilateur. Dans un cycle de développement classique impliquant un agent de codage, celui-ci écrit du code, le compilateur émet une erreur sous forme de texte non structuré, et l'agent doit analyser ce texte pour comprendre ce qui a mal tourné. C'est fragile : les formats de messages changent, ils sont rédigés pour des lecteurs humains, et il n'existe aucun concept natif d'action de réparation. Zero répond à ce problème en émettant par défaut des diagnostics JSON structurés. Chaque diagnostic porte un code stable (par exemple NAM003), un message lisible par l'humain, une référence de ligne et un objet repair contenant un identifiant d'action typé. Les humains lisent le message ; les agents lisent le code et le repair. La chaîne d'outils est unifiée dans un seul binaire : zero check, zero run, zero build, zero fix, zero explain ou encore zero doctor sont tous des sous-commandes d'un même CLI. Deux d'entre elles sont particulièrement utiles dans une boucle de réparation automatisée : zero explain renvoie une explication détaillée d'un code de diagnostic donné, tandis que zero fix --plan --json produit un plan de correction structuré et lisible par machine. La commande zero skills fournit quant à elle des guides d'utilisation directement depuis le CLI, synchronisés avec la version du compilateur installé, évitant aux agents de scraper une documentation externe potentiellement obsolète. Le lancement de Zero s'inscrit dans une tendance plus large : alors que les agents de codage comme GitHub Copilot, Cursor ou Devin s'imposent dans les workflows de développement, l'outillage existant n'a pas été conçu pour eux. Vercel, dont la plateforme accueille des millions de projets web, se positionne ici en amont de la chaîne de valeur, au niveau du langage lui-même. Zero introduit également un système d'effets explicites dans les signatures de fonctions : une fonction ne peut accéder au système de fichiers, au réseau ou à la sortie standard que si elle reçoit un objet de capacité (World), vérifié à la compilation et non à l'exécution. Cette approche rend le comportement du code plus prévisible pour des agents qui doivent raisonner sur ses effets de bord sans l'exécuter. Zero reste pour l'instant expérimental, mais il signale une direction claire : concevoir les langages de programmation pour un monde où les compilateurs parlent autant aux machines qu'aux humains.

💬 L'idée est simple et évidente en rétrospective : nos compilateurs crachent du texte pensé pour des yeux humains, et on s'étonne que les agents galèrent à parser les erreurs. Zero corrige ça à la source, avec des diagnostics JSON structurés, des codes stables par type d'erreur, et une commande `zero fix --plan` qui donne à l'agent un plan de réparation lisible par machine plutôt qu'un blob de prose. Reste à voir si ça passe le cap du labo, mais la direction est la bonne.

OutilsOutil
1 source
AutoAgent : la bibliothèque open source qui permet à une IA d'optimiser son propre système d'agents
3MarkTechPost 

AutoAgent : la bibliothèque open source qui permet à une IA d'optimiser son propre système d'agents

Kevin Gu, ingénieur chez thirdlayer.inc, a publié AutoAgent, une bibliothèque open source qui automatise l'optimisation des agents IA. En l'espace de 24 heures d'exécution autonome, le système a atteint la première place sur SpreadsheetBench avec un score de 96,5 %, et la meilleure performance GPT-5 sur TerminalBench avec 55,1 %. Le projet est disponible sur GitHub avec une architecture délibérément minimaliste : un fichier agent.py qui contient l'intégralité du harness sous test, un fichier program.md que l'humain édite pour donner la directive, et un journal d'expériences results.tsv maintenu automatiquement par le méta-agent pour tracer l'historique de chaque run. Le principe est simple mais radical : là où un ingénieur IA passe des journées à ajuster manuellement les prompts système, les définitions d'outils et la logique d'orchestration de son agent, AutoAgent confie cette boucle d'itération à un second agent, le méta-agent, qui lit la directive, inspecte agent.py, exécute le benchmark, analyse les échecs, réécrit les parties pertinentes et recommence. L'humain ne touche jamais agent.py directement. Ce ratchet loop, proposer une modification, mesurer le score, conserver si meilleur, rejeter sinon, est directement inspiré du projet autoresearch d'Andrej Karpathy, qui applique la même logique à l'entraînement de modèles ML. AutoAgent transpose ce mécanisme au niveau du harness : le prompt système, les outils disponibles, le routage entre sous-agents et la stratégie d'orchestration. Concrètement, toute équipe qui développe des agents complexes pourrait déléguer la phase d'optimisation la plus fastidieuse à un processus nocturne entièrement automatisé, réduisant drastiquement le temps humain consacré au réglage fin. Cette publication s'inscrit dans une tendance plus large d'automatisation de l'ingénierie IA elle-même, souvent désignée sous le terme "méta-apprentissage" ou "self-improvement". Depuis que les LLMs ont démontré leur capacité à écrire et modifier du code de manière fiable, plusieurs laboratoires et chercheurs indépendants explorent des architectures où un modèle supervise l'amélioration d'un autre, ou de lui-même. AutoAgent se distingue par sa portée pratique immédiate : il ne requiert pas d'infrastructure exotique, s'appuie sur le format Harbor pour exprimer les benchmarks, et peut être adapté à n'importe quel domaine via les dossiers tasks/ et .agent/. Les résultats sur TerminalBench et SpreadsheetBench, deux benchmarks reconnus dans la communauté, donnent une crédibilité concrète à l'approche. La question ouverte reste celle du contrôle : lorsqu'un méta-agent réécrit librement la logique d'orchestration d'un système en production, les garanties de sécurité et de prévisibilité du comportement final deviennent un enjeu non trivial que la bibliothèque n'adresse pas encore explicitement.

💬 C'est exactement la boucle que tout dev d'agents rêve d'automatiser, et là quelqu'un l'a fait en un seul fichier. Le score sur SpreadsheetBench est bluffant, bon, reste à voir ce que ça donne sur des tâches moins balisées qu'un benchmark. La vraie question, c'est quand le méta-agent commence à réécrire l'orchestration en prod sans que tu comprennes pourquoi ça marche.

OutilsOutil
1 source
Photon lance Spectrum, framework TypeScript open source pour déployer des agents IA sur iMessage, WhatsApp et Telegram
4MarkTechPost 

Photon lance Spectrum, framework TypeScript open source pour déployer des agents IA sur iMessage, WhatsApp et Telegram

Photon, une société d'infrastructure spécialisée dans l'exécution d'agents IA à faible latence, a lancé Spectrum, un SDK open-source en TypeScript et une plateforme cloud qui permettent de déployer des agents IA directement sur iMessage, WhatsApp, Telegram, Slack, Discord, Instagram et d'autres messageries grand public. Disponible sous licence MIT via npm install spectrum-ts, le framework offre une interface de programmation unifiée : les développeurs écrivent la logique de leur agent une seule fois, et Spectrum gère la livraison sur chaque plateforme. Pour étendre un agent d'iMessage à WhatsApp, il suffit d'ajouter une entrée dans le tableau providers. L'infrastructure repose sur un réseau edge-first qui affiche une latence de bout en bout mesurée entre 150 et 250 millisecondes, contre 500 ms à 1,5 seconde pour la moyenne du secteur CPaaS, avec un engagement de disponibilité de 99,9 %. Le SDK inclut un rendu adaptatif qui ajuste automatiquement la mise en forme aux contraintes natives de chaque plateforme, permettant par exemple d'envoyer un sondage structuré dans l'application Messages d'Apple sans tomber sur un rendu en texte brut. Ce lancement s'attaque à l'un des problèmes les plus persistants du secteur : la distribution des agents IA. Malgré des capacités de raisonnement remarquables, la grande majorité des agents restent cantonnés à des interfaces développeurs ou des applications spécialisées que le grand public n'installe jamais. En permettant de déployer un agent directement dans les messageries que des milliards de personnes utilisent quotidiennement, Spectrum supprime la friction d'adoption qui freine concrètement l'usage. Pour les équipes produit, cela signifie qu'un assistant IA peut apparaître dans la liste de contacts d'un utilisateur comme n'importe quel autre interlocuteur, sans téléchargement ni inscription. La précision des types pour les messages entrants et sortants réduit également une catégorie entière d'erreurs de production fréquentes dans les déploiements d'agents. Le problème de distribution que Spectrum cherche à résoudre est structurel : l'essor des LLM a largement devancé les mécanismes pour les rendre accessibles au-delà des communautés techniques. Les CPaaS existants comme Twilio ont historiquement ciblé la messagerie transactionnelle, pas les workloads conversationnels à haute fréquence des agents IA. Photon se positionne donc sur un segment encore peu occupé, à l'intersection de l'infrastructure de messagerie et de l'orchestration d'agents. Le SDK expose également une API definePlatform pour créer des connecteurs vers des plateformes non standard, ce qui élargit le périmètre potentiel bien au-delà des intégrations actuelles. Le support de Python, Go, Rust et Swift est annoncé dans la feuille de route, ce qui laisse anticiper une adoption rapide au-delà de l'écosystème TypeScript. La vraie question reste de savoir si la promesse de latence et de fiabilité tient à l'échelle, une fois que des équipes de production commenceront à s'y appuyer sérieusement.

UELe SDK facilite le déploiement d'agents IA sur WhatsApp et Telegram, très utilisés en France et dans l'UE, ce qui pourrait réduire la friction d'adoption pour les développeurs européens souhaitant toucher le grand public.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic