Aller au contenu principal
OutilsBen's Bites14sem· 1 min de lecture

Qu'est-ce qui fait un bon AGENTS.md ?

Source originale ↗·

Les fichiers d'instructions comme AGENTS.md et CLAUDE.md sont au cœur de toute stratégie efficace avec les agents IA. Chargés automatiquement avant même le début d'une conversation, ils s'ajoutent au prompt système natif du modèle pour orienter son comportement. CLAUDE.md est spécifique aux produits Anthropic, tandis qu'AGENTS.md fonctionne de manière transversale sur Codex, Droid, Pi et la plupart des autres outils — les deux peuvent d'ailleurs être liés par un simple symlink pour n'en gérer qu'un seul.

Contrairement à ce que l'on pourrait croire, remplir ces fichiers d'informations techniques (stack, arborescence, commandes clés) est contre-productif. Une étude citée dans l'article indique que cette approche nuit aux performances et augmente les coûts de 20 % en consommant des tokens inutiles — les agents étant parfaitement capables de déduire eux-mêmes l'architecture d'un projet. La vraie valeur de ces fichiers réside dans les préférences personnelles et les correctifs comportementaux : tester dans un navigateur avant de renvoyer une URL, utiliser un outil de recherche spécifique, ou expliquer les choses simplement pour un utilisateur non-développeur.

Une technique avancée présentée par l'auteur, inspirée du développeur Dex, consiste à encapsuler des instructions dans des blocs conditionnels (<important if="simple web page">). Cela permet d'adapter dynamiquement le comportement de l'agent selon le type de projet — évitant, par exemple, qu'il rédige inutilement des spécifications pour une simple page web. Par ailleurs, AGENTS.md se charge de manière hiérarchique : un fichier à la racine s'applique globalement, tandis qu'un fichier dans un sous-dossier (/docs/AGENTS.md) n'est activé que lorsque l'agent travaille dans ce répertoire.

Sur le front des actualités mentionnées en marge, Google a lancé Stitch, un outil de design génératif intégrant Gemini avec un canvas IA, un agent de design et un fichier DESIGN.md — un écho direct au sujet principal. Anthropic, de son côté, a déployé Dispatch pour Claude Cowork, permettant d'envoyer des messages depuis mobile vers Claude Desktop et de lancer des sessions Claude Code à distance.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Composants d'un agent de codage
1Ahead of AI 

Composants d'un agent de codage

Les agents de codage comme Claude Code ou le Codex CLI d'OpenAI sont devenus des outils incontournables pour les développeurs, mais leur fonctionnement repose sur une architecture précise que peu d'articles détaillent. Un agent de codage n'est pas simplement un grand modèle de langage (LLM) auquel on pose des questions : c'est un LLM enveloppé dans une couche logicielle appelée "harness" (ou cadre agentique), qui orchestre les appels au modèle, gère les outils disponibles, maintient un état en mémoire et décide quand s'arrêter. Cette distinction est fondamentale : le modèle est le moteur, mais le harness est la transmission, le tableau de bord et les roues réunies. Un agent de codage comprend six composants principaux — la boucle de contrôle, la gestion du contexte, les outils (lecture/écriture de fichiers, exécution de code, recherche), la mémoire, la gestion des prompts et la continuité entre sessions longues. Ce cadre explique pourquoi Claude Code ou Codex semblent nettement plus capables que le même modèle sous-jacent utilisé dans une interface de chat ordinaire. La différence n'est pas dans les paramètres du modèle, mais dans le système qui l'entoure : la stabilité du cache de prompts, l'accès au contexte du dépôt Git, la boucle de feedback itérative après exécution du code, et la gestion de sessions qui peuvent durer des heures. Pour les développeurs et les équipes d'ingénierie, cela signifie que choisir un outil de codage assisté par IA revient autant à évaluer l'architecture du harness qu'à comparer les benchmarks des modèles. Un modèle plus puissant dans un harness médiocre produira des résultats inférieurs à un modèle modeste bien intégré. Il convient également de distinguer trois notions souvent confondues : le LLM classique génère des tokens ; le modèle de raisonnement est un LLM entraîné à produire des traces de réflexion intermédiaires et à s'auto-vérifier (à l'image de o1 ou de QwQ), ce qui le rend plus puissant mais plus coûteux à l'inférence ; l'agent, lui, est une boucle de contrôle qui appelle le modèle répétitivement dans un environnement, en mettant à jour son état à chaque itération. Le harness de codage est un cas spécialisé de harness agentique, orienté vers les tâches de génie logiciel — gestion du contexte de code, exécution, débogage itératif. Des systèmes comme Claude Code d'Anthropic ou Codex CLI d'OpenAI illustrent cette catégorie, et la tendance de fond est claire : les progrès les plus décisifs en IA appliquée ne viennent plus seulement des modèles eux-mêmes, mais de l'ingénierie des systèmes qui les entourent.

OutilsOpinion
1 source
La recherche de Google fait un bond en avant grâce à l'IA
2The Information AI 

La recherche de Google fait un bond en avant grâce à l'IA

Lors de sa conférence Google I/O mardi dernier, Google a annoncé une refonte majeure de son moteur de recherche en y intégrant directement des fonctionnalités d'intelligence artificielle avancées, notamment des agents IA. Le PDG Sundar Pichai a dévoilé que la frontière entre Google Search et le chatbot Gemini est désormais en train de disparaître, les deux produits fusionnant progressivement en une seule expérience unifiée. Google Search compte 3 milliards d'utilisateurs mensuels, contre 900 millions pour Gemini. Ce changement redéfinit radicalement le paysage concurrentiel de l'IA grand public. La vraie bataille ne se joue plus entre ChatGPT et Gemini, deux chatbots aux usages encore relativement similaires, mais entre ChatGPT et Google Search, un produit ancré dans les habitudes quotidiennes de milliards de personnes. OpenAI revendique un peu plus de 900 millions d'utilisateurs actifs hebdomadaires pour ChatGPT, un chiffre impressionnant mais encore loin de la portée mondiale du moteur de recherche de Google. Intégrer l'IA directement dans Search donne à Google un avantage de distribution considérable qu'aucun concurrent ne peut facilement répliquer. Cette évolution s'inscrit dans une course effrénée entre les géants technologiques pour contrôler la porte d'entrée vers l'information sur internet. Google, dont le modèle publicitaire repose historiquement sur la recherche, cherche à préserver sa position dominante face à la montée des assistants IA capables de répondre directement aux questions sans passer par des liens sponsorisés. L'enjeu dépasse la technologie : il s'agit de savoir qui captera l'intention des utilisateurs, et donc les revenus, à l'ère de l'IA générative.

UELes entreprises européennes dépendant du trafic Google devront repenser leurs stratégies SEO et d'achat publicitaire, et la Commission européenne pourrait examiner cette fusion Search/Gemini au prisme du Digital Markets Act.

💬 3 milliards d'utilisateurs mensuels contre 900 millions pour Gemini, et Google choisit de fusionner les deux. C'est le genre de coup qui, une fois dit, semble évident : pourquoi construire un concurrent à ChatGPT quand tu peux transformer le produit le plus utilisé d'internet en assistant IA ? OpenAI peut revendiquer 900 millions d'actifs, c'est une bataille qu'ils ne peuvent pas gagner sur le terrain de la distribution.

OutilsOutil
1 source
Moonshot AI lance Kimi Work, un agent de bureau qui exploiterait Kimi K2.6 et un essaim de 300 sous-agents
3MarkTechPost 

Moonshot AI lance Kimi Work, un agent de bureau qui exploiterait Kimi K2.6 et un essaim de 300 sous-agents

Moonshot AI, la startup pékinoise connue pour son modèle Kimi, a lancé cette semaine Kimi Work, un agent IA qui s'installe directement sur l'ordinateur de l'utilisateur. Compatible macOS et Windows, l'application permet de confier des objectifs en langage naturel à un agent capable de lire des fichiers locaux, de piloter le navigateur réel de la machine et d'exécuter des tâches planifiées. Selon des retours de la communauté, Kimi Work tourne sur Kimi K2.6, le modèle phare de Moonshot publié le 20 avril 2026 : un modèle Mixture-of-Experts en accès libre qui active environ 32 milliards de paramètres par token et dispose d'une fenêtre de contexte de 256 000 tokens. L'agent peut orchestrer jusqu'à 300 sous-agents en parallèle pour décomposer des tâches complexes, le modèle K2.6 supportant jusqu'à 4 000 étapes coordonnées. Une extension navigateur appelée WebBridge lui permet d'agir comme un humain sur le web, en héritant des sessions et cookies déjà ouverts. Un moteur de planification intégré (type cron) permet de déclencher des jobs à heure fixe, de manière conditionnelle ou via des scripts Python et shell, avec une option "Keep Computer Awake" pour les tâches nocturnes. Ce positionnement local tranche avec la quasi-totalité des agents IA des deux dernières années, qui s'exécutent dans le cloud sur des serveurs distants avec des navigateurs virtuels isolés. Ici, l'agent accède aux vrais fichiers de l'utilisateur, à ses sessions bancaires ou professionnelles actives, sans avoir à téléverser quoi que ce soit. Moonshot a aussi intégré des données de marché financier en natif, couvrant les actions chinoises A-shares, la Bourse de Hong Kong et les marchés américains, ce qui évite toute configuration d'API personnalisée. Les résultats peuvent être exportés directement en fichiers PowerPoint ou Excel. Pour un analyste ou un cadre qui jongle avec des dizaines de PDF trimestriels, des tableaux de prix boursiers ou des briefings quotidiens, l'outil promet un gain de temps concret sans friction d'intégration. Moonshot AI s'inscrit dans une vague de startups chinoises qui cherchent à rivaliser avec OpenAI et Anthropic sur le segment des agents autonomes, après avoir déjà marqué des points sur les LLMs longue-contexte. Le lancement de K2.6 en open-weight en avril 2026 reflète une stratégie de dissémination rapide pour capter la communauté développeur. L'approche locale soulève néanmoins une question centrale : la sécurité repose entièrement sur l'utilisateur, contrairement aux agents cloud où le vendeur prend en charge l'isolation. À mesure que les agents gagnent en autonomie et en accès aux données sensibles, ce choix d'architecture deviendra un critère de différenciation majeur, aussi bien pour les particuliers que pour les entreprises qui hésitent encore à confier leur environnement de travail réel à un modèle tiers.

OutilsOutil
1 source
Créer un agent FinOps avec Amazon Bedrock AgentCore
4AWS ML Blog 

Créer un agent FinOps avec Amazon Bedrock AgentCore

Amazon a dévoilé une solution clé en main pour construire un agent FinOps basé sur Amazon Bedrock AgentCore, permettant aux équipes financières de gérer les coûts AWS à travers plusieurs comptes via une interface conversationnelle unique. L'architecture repose sur Claude Sonnet 4.5 d'Anthropic, le Strands Agent SDK et le protocole MCP (Model Context Protocol), déployée via AWS CDK. L'agent consolide les données de trois services AWS — Cost Explorer, Budgets et Compute Optimizer — et propose plus de 20 outils spécialisés couvrant l'intégralité du spectre de la gestion des coûts cloud. La mémoire conversationnelle conserve jusqu'à 30 jours de contexte, permettant des questions de suivi sans répéter les informations préalables. Concrètement, cette solution élimine la nécessité pour les équipes finance et DevOps de naviguer manuellement entre plusieurs consoles AWS pour obtenir une vue consolidée des dépenses. Un responsable peut simplement demander "Quels sont mes principaux postes de dépenses ce mois-ci ?" et obtenir une réponse immédiate, sans requêtes SQL ni exports manuels. L'authentification repose sur Amazon Cognito (gestion des utilisateurs et flux OAuth 2.0 machine-à-machine), tandis qu'AWS Amplify héberge l'interface web. L'accès en langage naturel démocratise la visibilité sur les coûts cloud à l'ensemble de l'organisation, y compris aux profils non techniques — un enjeu majeur dans les entreprises où la facture AWS est souvent opaque pour les décideurs métier. Le FinOps — la pratique de gouvernance financière du cloud — est devenu un domaine à part entière alors que les dépenses cloud des entreprises ont explosé ces cinq dernières années, rendant le suivi des coûts multi-comptes complexe et chronophage. Amazon Bedrock AgentCore, lancé récemment par AWS, est la réponse d'Amazon à la vague d'agents IA d'entreprise : une plateforme d'exécution managée pour déployer des agents LLM avec mémoire, outils et identité gérés nativement. Cette solution illustre parfaitement la stratégie d'AWS de transformer ses propres services (Cost Explorer, Compute Optimizer) en sources de données accessibles via des agents IA, réduisant la friction d'adoption. La concurrence s'intensifie sur ce segment : Microsoft Copilot pour Azure Cost Management et Google Cloud Carbon Footprint poursuivent des ambitions similaires. La prochaine étape logique sera l'automatisation des recommandations d'optimisation, passant d'un agent qui répond à des questions à un agent qui agit directement sur l'infrastructure pour réduire les coûts.

UELes entreprises françaises et européennes utilisant AWS peuvent simplifier leur gestion de coûts cloud multi-comptes via cet agent, sans impact réglementaire ou institutionnel spécifique.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic