OutilsThe Information AI · 8 avr. 2026, 17:00· 1 min de lecture

Une startup crée un logiciel de gestion de code pour les adeptes du tokenmaxxing

Résumé IASource uniqueImpact UE Take éditorial

GitButler, une startup berlinoise spécialisée dans la gestion de code, vient de lever 17 millions de dollars lors d'un tour de table de série A mené par Andreessen Horowitz. L'opération inclut également les investisseurs existants A.Capital Ventures et Fly Ventures. L'annonce a été faite par Scott Chacon, PDG de l'entreprise, qu'il a cofondée il y a trois ans avec les entrepreneurs Anne Leuschner et Kiril Videlov. Le logiciel de GitButler vise à faciliter la coordination entre développeurs humains et agents de codage IA, en modernisant les outils de gestion de versions qui existent depuis plusieurs décennies.

Cette levée de fonds s'inscrit dans un contexte où les entreprises technologiques poussent leurs équipes à utiliser massivement l'IA pour écrire du code. Meta, notamment, a vu émerger en interne un classement informel mesurant quels ingénieurs consomment le plus de tokens IA, une pratique baptisée "tokenmaxxing". Cette course à l'utilisation de l'IA génère une demande croissante pour des outils capables d'organiser, de tracer et de superviser le code produit par ces agents, qui travaillent en parallèle des développeurs humains et à un rythme que les systèmes traditionnels de contrôle de versions peinent à suivre.

Les outils de versioning classiques comme Git ont été conçus pour un flux de travail entièrement humain, où les modifications sont soumises de façon réfléchie et espacée. L'irruption d'agents IA capables de générer des milliers de lignes de code en continu bouscule ces paradigmes établis. GitButler parie que ce changement structurel crée un nouveau marché pour des couches logicielles intermédiaires entre les agents et les dépôts de code. Avec le soutien d'Andreessen Horowitz, l'un des fonds les plus influents de la Silicon Valley, la startup dispose désormais des ressources pour s'imposer dans cet espace encore peu défriché, à mesure que le "tokenmaxxing" se généralise au-delà de Meta.

Impact France/UE

GitButler, startup berlinoise, s'impose comme acteur européen des outils de développement IA avec ce financement d'Andreessen Horowitz, renforçant l'écosystème tech allemand face à la Silicon Valley.

💬 L'analyse de Mathieu

Le tokenmaxxing chez Meta, c'est le genre d'anecdote qui te dit que l'époque a vraiment changé, et moi je la crois. Git a 20 ans, il n'a jamais été conçu pour des agents qui crachent du code en continu, le tuyau est trop étroit. GitButler parie sur la bonne couche au bon moment, avec 17M et a16z dans le dos, reste à voir si la prod suit.

Dans nos dossiers

Meta IA Agents IA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Decoder

George Hotz : les agents de codage seront "l'une des erreurs les plus coûteuses" du développement logiciel

George Hotz, programmeur célèbre pour avoir cracké l'iPhone à 17 ans et fondateur de comma.ai, estime que les agents de codage IA seront "l'une des erreurs les plus coûteuses" de l'histoire du développement logiciel. Après six mois de tests intensifs avec différents outils basés sur des LLMs, son verdict est sévère : ces systèmes produisent des prototypes rapidement, mais s'effondrent dès qu'il s'agit de gérer les détails, introduisant des bugs de plus en plus difficiles à détecter et à corriger. Le danger pointé par Hotz est précis : les erreurs générées par les agents IA ne sont pas évidentes à repérer. Contrairement à un bug classique qui plante un programme, les défauts introduits par ces outils peuvent rester dormants, s'accumuler silencieusement et créer une dette technique invisible. Pour les équipes qui font confiance à ces agents sur des bases de code complexes, le coût de correction pourrait dépasser largement les gains de productivité initiaux. Cette mise en garde illustre une fracture profonde au sein de la communauté IA. D'un côté, des entreprises comme GitHub (Copilot), Cursor ou Cognition défendent l'automatisation agressive du code et affichent des métriques de productivité spectaculaires. De l'autre, des ingénieurs expérimentés comme Hotz alertent sur les limites fondamentales des LLMs face à la rigueur que requiert l'ingénierie logicielle à grande échelle. Le débat est loin d'être tranché, et les prochains mois diront si la réalité des projets en production confirme l'optimisme des uns ou les craintes des autres.

OutilsOpinion

1 source

2VentureBeat AI

L'ère du RAG pour les agents IA touche à sa fin : place à une couche de connaissances intégrée à la compilation

Pinecone, pionnière des bases de données vectorielles, a annoncé ce 4 mai 2026 le lancement en accès anticipé de Nexus, qu'elle présente non pas comme une amélioration de la recherche vectorielle, mais comme un moteur de connaissance entièrement repensé pour les agents IA. Le produit introduit un compilateur de contexte qui transforme les données brutes d'une entreprise en artefacts de connaissance persistants et adaptés à des tâches spécifiques, avant même qu'un agent ne formule sa première requête. Nexus embarque également KnowQL, un nouveau langage de requête déclaratif permettant aux agents de spécifier la forme des résultats attendus, les exigences de confiance et les contraintes de latence. Sur un benchmark interne, une tâche d'analyse financière qui consommait auparavant 2,8 millions de tokens a été traitée par Nexus avec seulement 4 000 tokens, soit une réduction de 98 %, bien que Pinecone n'ait pas encore validé ce chiffre en déploiement client réel. Cette rupture répond à une limite structurelle du paradigme RAG (retrieval-augmented generation), conçu pour des interactions humaines ponctuelles, une requête, une réponse, un interprète humain dans la boucle. Les agents IA fonctionnent différemment : ils reçoivent des tâches complexes, agrègent des sources multiples, résolvent des conflits d'information et enchaînent les requêtes de façon autonome. Or, dans une architecture RAG classique, chaque session repart de zéro, redécouvrant à chaque fois quelles tables sont liées, quelles sources font autorité, quels formats sont exploitables. Pinecone estime que 85 % de la puissance de calcul des agents est absorbée par ce cycle de redécouverte, au détriment de la tâche réelle. Il en résulte une latence imprévisible, des coûts en tokens incontrôlés et des résultats non déterministes, deux exécutions identiques sur les mêmes données peuvent produire des réponses différentes, sans traçabilité des sources, ce qui constitue un blocage rédhibitoire pour les entreprises soumises à des obligations de conformité. La sondage Pulse de VentureBeat pour le premier trimestre 2026 confirme ce tournant : chaque base de données vectorielle standalone perd des parts d'adoption, tandis que l'intention de récupération hybride a triplé pour atteindre 33,3 %, la position stratégique à la croissance la plus rapide du secteur. En déplaçant le travail de raisonnement du moment de l'inférence vers une phase de compilation préalable, Nexus tente de résoudre ce que le PDG Ash Ashutosh résume ainsi : les agents sont des machines contraintes de travailler sur des systèmes conçus pour des humains. L'enjeu dépasse Pinecone, c'est toute une catégorie technologique, celle des bases vectorielles nées avec ChatGPT, qui doit se réinventer pour survivre à l'ère agentique.

UELes entreprises françaises et européennes qui développent des agents IA sur des architectures RAG devront surveiller ce tournant vers des moteurs de connaissance compilés, susceptible de remodeler les choix d'infrastructure.

OutilsOutil

1 source

3AWS ML Blog

Créez une suite de tests évolutive pour votre agent avec la gestion de datasets dans Amazon Bedrock AgentCore

Amazon a annoncé une fonctionnalité de gestion de jeux de données dans Amazon Bedrock AgentCore, conçue pour stabiliser l'évaluation des agents d'intelligence artificielle. Le principe repose sur la constitution de jeux de tests versionnés : chaque scénario contient une entrée, une sortie attendue, des assertions à vérifier et la séquence d'outils que l'agent doit appeler. Ces jeux de données sont d'abord éditables dans un état brouillon, puis publiés en versions numérotées immuables. Une fois verrouillée, une version ne peut plus changer, ce qui garantit que deux évaluations successives comparent exactement les mêmes entrées. Lorsqu'un bug survient en production, la trace fautive est capturée et intégrée définitivement au jeu de test, de sorte que toute modification future de l'agent sera systématiquement confrontée à ce cas limite. L'enjeu est de taille parce que les agents LLM sont non-déterministes par nature : la même requête peut produire des réponses différentes d'une exécution à l'autre. Sans entrées stables, il est impossible de distinguer une vraie amélioration de l'agent d'une simple variation statistique du modèle. Par ailleurs, un juge LLM peut apprécier si une réponse semble pertinente, mais il ne peut pas vérifier si un cours boursier est exact, si une séquence d'appels d'outils s'est déroulée dans le bon ordre, ou si des données personnelles ont fuité entre deux sessions. Seule la vérité terrain, c'est-à-dire la réponse attendue et les assertions explicites, transforme un score subjectif en mesure vérifiable. C'est précisément ce que les datasets versionnés apportent : stabilité des inputs et ancrage dans le réel. La fonctionnalité répond à deux cycles de travail distincts dans le développement d'agents. Le premier est la boucle courte du développeur, qui modifie un outil, relance une évaluation et observe le score en quelques minutes : sans jeu de tests stable en dessous, une amélioration du score peut simplement signifier que les questions sont devenues plus faciles. Le second est la pipeline CI/CD, qui doit valider chaque changement avant déploiement. La plupart des équipes ont ce verrou, mais peu disposent d'un socle de scénarios versionnés avec assertions explicites, ce qui signifie qu'un pipeline peut valider une build simplement parce que les questions ont changé, ratant les régressions réelles. En ancrant les deux boucles sur le même dataset publié, Amazon Bedrock AgentCore vise à faire du score qui convainc le développeur en local le même score que celui que surveille la CI en production.

OutilsOutil

1 source

4VentureBeat AI

Softr lance une plateforme IA pour permettre aux équipes non techniques de créer des applications métier sans code

Softr, la plateforme no-code berlinoise utilisée par plus d'un million de créateurs et 7 000 organisations dont Netflix, Google et Stripe, a lancé ce mardi une nouvelle version qu'elle qualifie d'« AI-native » — un pari sur le fait que l'explosion des outils de création d'applications par IA a surtout produit des démonstrations impressionnantes, mais peu de logiciels métier réellement opérationnels. Le cœur de cette mise à jour est l'« AI Co-Builder » : l'utilisateur décrit en langage naturel l'application dont il a besoin, et la plateforme génère un système complet — base de données, interface, permissions et logique métier — connecté et prêt à déployer immédiatement. Mariam Hakobyan, cofondatrice et PDG de Softr, a présenté cette annonce en exclusivité à VentureBeat en amont du lancement. Ce positionnement cible une faille bien réelle du marché actuel. Les plateformes dites de « vibe coding » — Lovable, Bolt, Replit — ont capté l'attention des développeurs et des investisseurs en capital-risque depuis dix-huit mois, mais elles s'adressent mal aux milliards d'utilisateurs non techniques en entreprise qui ont besoin de logiciels opérationnels personnalisés sans pouvoir maintenir du code généré par IA quand il casse. « Un seul prompt peut casser dix étapes déjà complétées », explique Hakobyan. « On finit par maintenir quelque chose qu'on n'avait pas demandé. » Les outils qui génèrent du code brut laissent l'utilisateur face à une base de code illisible : connecter ces apps à des bases de données réelles ou à des systèmes d'authentification requiert souvent des intégrations techniques — Supabase, appels API — qui transforment l'utilisateur en développeur malgré lui. La réponse de Softr repose sur une architecture de « blocs de construction » pré-conçus — tableaux Kanban, vues liste, authentification, gestion des rôles — que l'IA assemble selon les besoins décrits, sans jamais générer de code libre. Après cinq ans passés à construire une infrastructure no-code contrainte et éprouvée, l'entreprise a superposé l'IA sur cette base stable, évitant ainsi le problème d'hallucination qui fragilise les générateurs de code. Ce lancement s'inscrit dans un moment charnière pour tout le secteur : la promesse du no-code se heurte depuis des années à la complexité des logiciels métier réels — portails clients, CRM internes, outils de gestion de stocks — qui exigent fiabilité et sécurité à chaque utilisation. Softr mise sur le fait que l'IA doit guider, pas générer, pour tenir cette promesse auprès des organisations qui n'ont ni le temps ni les ressources pour embaucher un développeur à chaque bug.

UESoftr étant une startup berlinoise, ce lancement renforce l'offre d'un acteur européen du no-code face aux plateformes américaines, avec un potentiel d'adoption direct pour les PME et équipes non techniques en France et en Europe.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic