Aller au contenu principal
OutilsBen's Bites5j

Qu'est-ce qui fait un bon AGENTS.md ?

1 source couvre ce sujet·Source originale ↗·
Résumé IA

Les fichiers AGENTS.md/CLAUDE.md sont des instructions pré-chargées avant chaque conversation avec un agent IA — AGENTS.md étant compatible avec la plupart des outils (Codex, Droid, Pi...) contrairement à CLAUDE.md, spécifique à Claude. Contrairement aux idées reçues, ces fichiers ne doivent pas contenir la stack technique ou l'architecture du projet (une étude montre que cela dégrade les performances et augmente les coûts de 20%) : ils doivent uniquement contenir vos préférences et corrections comportementales. Une astuce avancée consiste à utiliser des blocs conditionnels (``) pour adapter les instructions selon le type de projet.

AGENTS.md / CLAUDE.md are instruction files that get pre-loaded before your conversation even starts. Every model has a system prompt - instructions from the model/product makers. Your .md files get added to this. The model now has its system prompt + your instructions pre-loaded. CLAUDE.md is specific to Claude products. AGENTS.md works across Codex/Droid/Pi/most other tools. You can ‘symlink’ these - ie link my AGENTS.md to CLAUDE.md so that I only ever deal with one set of instructions and any agent will pick it up correctly. (Just ask your agent to symlink them) What goes into your AGENTS.md? We previously thought including your tech stack, key files, etc., as like a mini-map for your agent was the right approach. That’s what agents add if they create it. But there was a study that showed it hurt performance and increased cost by 20% (using extra tokens). The agent can figure out the tech stack, key files, commands, and architecture very easily and quickly. Instead, it should be pretty empty. It should be your preferences and nudges to correct agent behaviour. - When building, open a browser with agent-browser skill and test before sending me a URL (to catch bugs) - Use the Exa web search tool for web search - Always write planning files in ~/[project-name]/plan/ - I can't code, so explain things in simple terms - Record a video of your output so I can see exactly what you tested I picked up a tip from Dex , who says wrapping sections in conditional blocks is helpful: - No spec needed - Create 3 designs before choosing one - Must have dark/light mode switcher I often switch between spinning up simple sites and more complex apps. I noticed my agents keep writing specs and testing in the browser, which is unnecessary. So I’m adopting this. You don’t need to mention skills you’ve installed, as their ‘frontmatter’ (the skills’ name and description) is also pre-loaded alongside your AGENTS.md. If you’re using ChatGPT/Claude Desktop apps these instructions still work. Paste them in ‘personalisation’ / ‘preferences’ / or ‘instructions’ - in your settings. AGENTS.md also get dynamically loaded as an agent navigates through folders. my-project/ ├── AGENTS.md ← root instructions (always loaded) └── docs/ └── AGENTS.md ← loaded when agent works in /docs If it was helpful, reply and let me know 😊 What am I building this week? I’m currently in Cardiff doing talks with 16-18 yr olds on starting companies and AI. Making me think I should do proper workshops for these kids. I just killed my email triage bot. Going to try a different approach. Tried Replit Agent 4, but just did not work. I’ll record a video on this build + Replit review I’ve been using keep.md to bring all my saved items into one feed (that gets filtered for this newsletter) - and I’m going to make the feed public I need to cut my AGENTS.md down + add conditional blocks (as above) I may do a custom ‘claude for chrome’ extension… Ben’s Bites is brought to you by Viktor Your next hire isn’t on LinkedIn. Viktor is your last hire. He has his own computer, lives in your Slack, watches how your team works, and starts solving problems before anyone notices them. Writes code. Builds apps. Runs campaigns. No triggers. No workflows. It just works. Try Viktor free , you have $100 up front. * Headlines Google launched the new Stitch . They’re calling it your ‘ vibe design partner ’. Gemini is great at generating UI, unlike other models (ahem, openai), and now paired with their own harness with a bunch of features; AI-native canvas, design agent, voice, instant prototypes, design systems and DESIGN.md (handily links with our intro! Take a look at it 😊 ). Here’s a good overview video of the tool. Claude launched ‘Dispatch’ for Cowork . Once you connect, you can send messages from your mobile to the Claude Desktop app (i.e. work with files on your desktop). It can also launch Claude Code sessions . I got this working, but I had to approve some permissions on my Mac first ( “git” & “claude” would like to access your files ). They also published a report: What 81k people want from AI GPT-5.4 mini is available in ChatGPT, Codex, and the API (5.4 nano available in the API only). Roughly Sonnet 4.6 intelligence, 3x faster and ~70% cheaper. OpenAI also launched a challenge to build the most efficient pretrained model under extreme constraints. Midjourney’s v8 model is in early testing. It’s 5x faster and better at rendering text, but nowhere near nano-banana. It wins in the aesthetics as always, though. Runway’s new real-time video generation model created instant HD videos on Nvidia’s Vera Rubin hardware with time-to-first-frame under 100ms. Subscribe now My feed AssemblyAI : Real-time STT that keeps up with human conversation. Multilingual with live diarization. Built for voice agents. Start free.* Unsloth Studio - Open-source web UI to train and run LLMs. Training using your Mac is coming soon. Lenny put his entire

À lire aussi

1The Verge AI1h

Le mode automatique de Claude Code d'Anthropic devient plus sûr

Anthropic a lancé un nouveau mode appelé « auto mode » pour Claude Code, son outil de codage assisté par IA. Cette fonctionnalité permet à l'agent de prendre des décisions autonomes concernant les permissions, sans nécessiter une validation manuelle constante de l'utilisateur. Elle s'adresse particulièrement aux développeurs qui souhaitent déléguer davantage de tâches à l'IA tout en conservant un filet de sécurité. L'enjeu est de taille : Claude Code peut agir de manière indépendante, ce qui présente des risques réels comme la suppression de fichiers, la fuite de données sensibles ou l'exécution d'instructions malveillantes. L'auto mode vise à combler le fossé entre une supervision permanente — jugée contraignante — et une autonomie totale jugée dangereuse. Concrètement, le système détecte et bloque les actions potentiellement risquées avant leur exécution, tout en proposant à l'agent une alternative plus sûre. Anthropic positionne ainsi Claude Code dans un segment en pleine expansion : les outils d'IA « agentiques » capables d'agir seuls sur un poste de travail, un marché où la gestion des risques devient un argument commercial différenciant.

OutilsOutil
1 source
2Blog du Modérateur1h

ChatGPT enrichit son expérience shopping et abandonne Instant Checkout

OpenAI a mis à jour l'interface shopping de ChatGPT, la rendant plus visuelle et intuitive. La nouvelle version permet de comparer les produits plus facilement et introduit une recherche par image. En parallèle, la fonctionnalité Instant Checkout, qui permettait d'acheter directement depuis le chatbot, a été abandonnée. Ce repositionnement transforme ChatGPT en outil de découverte et de comparaison plutôt qu'en canal de vente directe. Cela redirige les utilisateurs vers les marchands pour finaliser leurs achats, ce qui soulage les tensions avec les retailers tout en conservant ChatGPT comme point d'entrée dans le parcours d'achat. Cette évolution s'inscrit dans la montée en puissance des assistants IA comme moteurs de recherche commerciale, en concurrence directe avec Google Shopping et Amazon.

OutilsOutil
1 source
3NVIDIA AI Blog1h

Les usines d'IA flexibles en énergie peuvent stabiliser le réseau électrique mondial

Lors du match de l'Euro 2020 entre l'Angleterre et l'Allemagne, des millions de téléspectateurs britanniques ont allumé leur bouilloire à la mi-temps simultanément, provoquant un pic de demande d'environ 1 gigawatt sur le réseau électrique national — l'équivalent d'un réacteur nucléaire standard. C'est ce phénomène, surnommé le "TV pickup", qui a inspiré une démonstration inédite menée en décembre 2025 à Londres par Emerald AI, en collaboration avec NVIDIA, EPRI, National Grid et Nebius. L'expérience s'est déroulée dans une "usine IA" construite sur l'infrastructure NVIDIA de Nebius, équipée de 96 GPU NVIDIA Blackwell Ultra connectés via la plateforme InfiniBand NVIDIA Quantum-X800. En simulant ce même pic d'énergie lié au match de football, le cluster IA a automatiquement réduit sa consommation pour absorber le choc — sans interrompre les charges de travail prioritaires. Cette technologie, baptisée Emerald AI Conductor Platform, ouvre une perspective concrète pour la gestion des réseaux électriques sous tension. Les usines IA, habituellement perçues comme de nouveaux fardeau énergétiques, deviennent ici des actifs flexibles capables d'ajuster leur consommation en quelques secondes selon des signaux envoyés par les gestionnaires de réseau. Lors des tests, le système a respecté 100 % des plus de 200 cibles de puissance définies par EPRI et National Grid, couvrant non seulement les GPU mais aussi les CPU et l'ensemble des équipements informatiques. En pratique, cela signifie que le réseau peut gérer les pics de demande avec les capacités existantes, sans avoir à construire d'infrastructures permanentes surdimensionnées pour les scénarios les plus extrêmes — ce qui contribue directement à limiter la hausse des tarifs pour les consommateurs. Pour les opérateurs de centres de données, l'avantage est également majeur : cette flexibilité leur permet d'obtenir des raccordements au réseau bien plus rapidement, sans attendre des années de travaux d'infrastructure. Après des essais probants dans trois États américains — Arizona, Virginie et Illinois —, Emerald AI a transposé son approche au Royaume-Uni, dans un contexte où la croissance explosive des besoins énergétiques liés à l'IA met sous pression les gestionnaires de réseaux du monde entier.

UELes gestionnaires de réseaux européens confrontés à la même explosion des besoins énergétiques liés à l'IA pourraient adopter cette approche pour stabiliser leur réseau sans surinvestissement en infrastructures permanentes.

OutilsActu
1 source
4InfoQ AI1h

Podcast : [Vidéo] Systèmes agentiques sans chaos : premiers modèles opérationnels pour agents autonomes

Shweta Vohra et Joseph Stein consacrent un épisode de podcast à la question des systèmes agentiques — ces logiciels capables de planifier, d'agir et de prendre des décisions de manière autonome. Les deux experts y examinent ce qui distingue véritablement un agent IA d'une simple automatisation traditionnelle, et comment concevoir ces systèmes sans perdre le contrôle. La discussion porte sur les défis concrets pour les architectes et ingénieurs : comment définir les limites d'action d'un agent, comment orchestrer plusieurs agents entre eux, et quels modèles organisationnels adopter dès les premières phases de déploiement. L'enjeu est de tirer parti de l'autonomie de ces systèmes tout en évitant le chaos opérationnel. Le sujet s'inscrit dans une réflexion plus large sur la maturité croissante des agents IA, qui passent progressivement du statut d'assistants réactifs à celui d'acteurs autonomes dans les infrastructures logicielles.

OutilsOpinion
1 source