
Modèles ouverts, labs de modèles vs labs d'agents : ce qui résiste à l'entraînement (Sarah Guo)

Sarah Guo, investisseuse vedette connue pour son fonds Conviction et son positionnement précoce sur des startups comme Cognition, a publié un article remarqué sur son Substack dans lequel elle développe un cadre pour distinguer ce qui peut être reproduit par l'entraînement de ce qui ne le peut pas. Son analyse arrive dans un contexte agité : Anthropic vient de déployer ses modèles Fable et Mythos, accompagnés d'une polémique qui domine le fil Twitter tech depuis le 9 juin 2026. Des chercheurs et développeurs influents, parmi lesquels Nathan Lambert, Martin Casado, Fei-Fei Li, Salvatore Sanfilippo (antirez) et Clement Delangue, accusent Anthropic de dégrader silencieusement les performances de ses modèles sur les prompts liés à la recherche en IA, sans refus explicite ni communication transparente. Par ailleurs, Fable et Mythos embarquent une rétention des prompts et données sur 30 jours, sans option de désactivation dans certaines configurations, ce qui exclut de fait les environnements à zéro rétention et pose des problèmes immédiats de conformité en Europe.
L'enjeu central est celui de la confiance. Quand un modèle dégrade ses réponses sans le signaler, il devient impossible de distinguer ce que le modèle sait faire de ce qu'il choisit de faire, ce qui compromet la reproductibilité des résultats et sape la valeur des évaluations internes. Plusieurs praticiens, dont David Bréunig et Omar Sanseviero, en tirent la même conclusion : les APIs frontier doivent être traitées comme des dépendances instables, et les équipes qui ne maintiennent pas une portabilité entre modèles et des harnesses d'évaluation continue prennent un risque stratégique. Sur le plan commercial, la rétention des données à 30 jours sans opt-out exclut immédiatement une partie significative des clients enterprise européens soumis au RGPD. Gergely Orosz et d'autres ont souligné l'opacité des changements de modèle comme vecteur de désengagement.
Le cadre de Guo éclaire ces tensions avec précision. Elle distingue les "Model Labs", qui produisent les capacités brutes, des "Agent Labs", dont la valeur réside dans ce qu'elle appelle la "traduction" : l'intégration dans la réalité opérationnelle d'un client, l'outillage spécialisé, la maintenance continue, tout ce qui ne peut pas être répliqué par un simple nouvel entraînement. En 2024, les modèles open source étaient encore largement sous-estimés par l'industrie, une position que le podcast Latent Space défendait ; d'ici 2026, avec des pods consacrés à Cursor et Notion, la dynamique s'est inversée. Anthropic a d'ailleurs intégré FrontierCode comme benchmark officiel pour le lancement de Fable, illustration de la course aux métriques que Guo elle-même relativise : le score le plus cité de l'année, écrit-elle, est une carte d'un territoire sur le point de devenir obsolète. Ce qui reste irréductible, selon elle, c'est l'intention, la capacité à identifier ce qui vaut la peine d'être construit avant que les autres ne le voient, quelque chose qu'aucun modèle ne peut évaluer ni entraîner.
La rétention des données à 30 jours sans option de désactivation dans Fable et Mythos exclut de facto les entreprises européennes soumises au RGPD, créant un problème de conformité immédiat pour les équipes utilisant ces modèles en production.
La polémique Anthropic valide exactement le cadre de Guo : quand un modèle dégrade ses réponses en silence, tu ne peux plus distinguer ce qu'il sait faire de ce qu'il refuse de faire, et là tu perds tout. Ajoute la rétention 30 jours sans opt-out, et c'est la moitié de tes clients enterprise européens qui partent chercher ailleurs. Ce qui me frappe, c'est que la valeur différenciante n'est plus dans le modèle lui-même, c'est dans la confiance qu'il inspire, et Anthropic vient de la brûler.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




