Aller au contenu principal
Marc Andreessen s'interroge sur la mort du navigateur, Pi + OpenClaw, et pourquoi cette fois c'est différent
LLMsLatent Space13sem· 2 min de lecture

Marc Andreessen s'interroge sur la mort du navigateur, Pi + OpenClaw, et pourquoi cette fois c'est différent

Source originale ↗·
Marc Andreessen s'interroge sur la mort du navigateur, Pi + OpenClaw, et pourquoi cette fois c'est différent
▶ Voir sur YouTube

Marc Andreessen, cofondateur du fonds de capital-risque Andreessen Horowitz (a16z), qui vient de lever 15 milliards de dollars, s'est exprimé dans un épisode du podcast Latent Space enregistré dans les bureaux légendaires de Sand Hill Road. Face aux animateurs swyx et Alessio, il a développé sa thèse centrale : l'intelligence artificielle n'est pas un nouveau cycle de hype, mais l'aboutissement de quatre-vingts ans de progrès scientifique cumulé. Des réseaux de neurones des années 1980 aux systèmes experts, en passant par AlexNet en 2012 et les transformers, jusqu'aux modèles de raisonnement et aux agents autonomes d'aujourd'hui, Andreessen voit dans ce moment une convergence historique. Il a également mis en avant deux projets qu'il considère comme des percées architecturales majeures : Pi et OpenClaw, une combinaison de modèle de langage, shell Unix, système de fichiers, Markdown et boucle cron qu'il compare à l'invention d'Unix en termes d'importance pour l'industrie logicielle.

Pour Andreessen, ce qui distingue fondamentalement ce cycle des précédents, c'est le saut qualitatif entre les LLM classiques et les modèles de raisonnement capables de coder, d'agir de manière autonome et potentiellement de s'améliorer eux-mêmes de façon récursive. Il souligne que la vraie contrainte n'est plus technique mais institutionnelle : les organisations humaines, leurs incitations et leurs structures sociales peinent à absorber un changement aussi rapide. Sur la question des infrastructures, il nuance la comparaison avec la bulle des télécoms de 2000 : les acheteurs actuels de capacités IA sont des géants aux bilans solides, et la demande existe déjà. Il défend également l'importance de l'IA embarquée en local, citant la confidentialité, la confiance et l'économie comme facteurs structurels favorisant les modèles tournant sur Apple Silicon ou des puces dédiées.

Andreessen incarne une génération rare d'investisseurs ayant vécu de l'intérieur plusieurs révolutions technologiques : il a créé Mosaic, le premier navigateur web grand public, avant de cofonder Netscape et a16z. Son regard sur l'open source est particulièrement éclairant : il décrit DeepSeek comme "un cadeau au monde", non seulement parce que les modèles sont gratuits, mais parce qu'ils propagent la compréhension profonde de ces systèmes à l'échelle planétaire. Il anticipe également une refonte du rapport humain-machine sur internet, estimant que la détection des bots est désormais un problème insoluble par voie algorithmique seule, et que seule une preuve cryptographique et biométrique d'identité humaine permettra de rétablir la confiance en ligne. Ses prises de position, portées par l'un des fonds les plus influents de la Silicon Valley, façonnent directement les priorités d'investissement de tout un écosystème.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Pourquoi Claude Opus 4.8 change vraiment la donne (tests et benchmarks) ?
1Le Big Data 

Pourquoi Claude Opus 4.8 change vraiment la donne (tests et benchmarks) ?

Anthropic a lancé Claude Opus 4.8 le 28 mai 2026, seulement 41 jours après la version 4.7, un rythme inhabituel dans un secteur où les nouvelles versions majeures nécessitent généralement plusieurs mois. Disponible au même prix que son prédécesseur, ce modèle affiche des progrès mesurables sur plusieurs benchmarks clés : 84 % sur Online-Mind2Web, qui évalue les interactions autonomes avec des interfaces numériques, et des gains notables sur Terminal-Bench 2.1, dédié à la programmation en ligne de commande. Plus frappant encore, les évaluations internes d'Anthropic indiquent que le modèle est environ quatre fois moins susceptible de laisser passer des erreurs dans son propre code qu'Opus 4.7. Sur le plan fonctionnel, les utilisateurs de Claude AI ont désormais accès à cinq niveaux de raisonnement ajustables, tandis que Claude Code intègre les Dynamic Workflows, permettant de planifier des tâches complexes en mobilisant plusieurs sous-agents en parallèle sur de larges bases de code. Ce qui distingue Opus 4.8 ne réside pas uniquement dans les scores, mais dans un changement de philosophie profond : le modèle a été conçu pour mieux reconnaître ses propres limites et signaler ses incertitudes plutôt que de produire des réponses erronées avec assurance. Dans un contexte professionnel où une IA trop confiante peut induire en erreur des équipes entières, cette prudence constitue une valeur ajoutée concrète. Pour les développeurs qui utilisent Claude Code dans des pipelines agentiques, la réduction des erreurs non détectées et la capacité à orchestrer des sous-agents en parallèle ouvrent des cas d'usage jusqu'ici trop risqués pour être déployés en production. Le gain d'efficacité est également tangible : le modèle atteint des résultats équivalents en moins d'étapes intermédiaires, ce qui réduit les coûts d'inférence sur les longues tâches. Cette version s'inscrit dans une période de concurrence intense entre Anthropic, OpenAI et Google, où chaque éditeur cherche à dominer le segment des agents autonomes. La version 4.7 avait suscité des critiques sur ses comportements imprévisibles et sa tendance à l'excès de confiance, des défauts qui nuisaient à l'adoption en entreprise. En répondant directement à ces reproches en moins de six semaines, Anthropic signale qu'il est capable d'itérer aussi vite que ses rivaux sans sacrifier la fiabilité. La question qui demeure ouverte est celle de la durabilité de ce rythme : à 41 jours par version, l'entreprise devra démontrer que la qualité peut tenir la cadence.

UELes équipes de développement européennes utilisant Claude Code dans des pipelines agentiques bénéficient des améliorations de fiabilité et de la réduction des coûts d'inférence, sans impact réglementaire ou institutionnel spécifique à la France ou l'UE.

💬 41 jours entre deux versions majeures, c'est du jamais vu chez Anthropic. Ce qui compte vraiment là-dedans, c'est pas les scores (on peut faire dire ce qu'on veut aux benchmarks), c'est que le modèle est maintenant conçu pour signaler ses incertitudes plutôt que d'affirmer des erreurs avec aplomb, et en pipeline agentique, c'est la différence entre un outil qu'on ose déployer en prod et un truc qu'on surveille en permanence. Reste à voir si ce rythme tient dans 3 mois.

LLMsOpinion
1 source
Google Gemma 4, NVIDIA et OpenClaw s'attaquent au coût des tokens pour les agents IA en local, du RTX au DGX Spark
2MarkTechPost 

Google Gemma 4, NVIDIA et OpenClaw s'attaquent au coût des tokens pour les agents IA en local, du RTX au DGX Spark

Google a lancé la famille de modèles Gemma 4, une nouvelle génération de modèles d'intelligence artificielle open source conçus pour fonctionner localement sur du matériel grand public. Développés en collaboration avec NVIDIA, ces modèles se déclinent en quatre variantes — E2B, E4B, 26B et 31B paramètres — et couvrent un spectre allant des modules embarqués Jetson Orin Nano aux stations de travail RTX, en passant par le DGX Spark, le superordinateur personnel d'IA récemment annoncé par NVIDIA. Ils supportent nativement l'appel de fonctions pour les agents autonomes et acceptent des entrées multimodales mêlant texte et images dans un même prompt. Sur un RTX 5090, les gains de performance atteignent 2,7 fois ceux obtenus sur un Mac M3 Ultra avec llama.cpp, selon les mesures publiées par NVIDIA. L'enjeu central de cette annonce est ce que les développeurs appellent la "token tax" — le coût financier cumulatif engendré par chaque requête envoyée à un modèle cloud comme GPT-4o ou Gemini. Pour une application d'IA toujours active, qui traite en continu des fichiers, des fenêtres d'applications ou des flux de capteurs, ces coûts deviennent rapidement prohibitifs. En exécutant Gemma 4 localement sur un GPU NVIDIA, le coût marginal par inférence tombe à zéro. Des plateformes comme OpenClaw, qui permettent de construire des assistants IA personnels fonctionnant en permanence sur des PC RTX, bénéficient directement de cette combinaison : débit élevé, latence faible, et aucune dépendance à une connexion ou à un abonnement cloud. Cette évolution s'inscrit dans une tendance de fond qui voit les grands laboratoires — Google, Meta, Mistral — publier des modèles compacts capables de rivaliser avec des systèmes bien plus lourds, à mesure que les techniques de distillation et de quantification progressent. NVIDIA, dont la domination sur les GPU d'entraînement est bien établie, cherche à étendre son emprise sur le marché de l'inférence locale, notamment avec le DGX Spark positionné comme outil de développement personnel haut de gamme. La disponibilité de modèles comme Gemma 4 optimisés pour son écosystème renforce cette stratégie. Les prochains mois verront probablement une multiplication d'applications agentiques locales, portées par cette convergence entre modèles ouverts performants et matériel grand public suffisamment puissant pour les faire tourner sans compromis.

UELa disponibilité de modèles open source performants réduit la dépendance des entreprises et développeurs européens aux API cloud payantes, facilitant la conformité RGPD via le traitement local des données.

LLMsOpinion
1 source
Le directeur IA de Microsoft affirme que l'entreprise est "libérée" d'OpenAI pour poursuivre la superintelligence
3VentureBeat AI 

Le directeur IA de Microsoft affirme que l'entreprise est "libérée" d'OpenAI pour poursuivre la superintelligence

Mustafa Suleyman, directeur de Microsoft AI, a révélé lors de Microsoft Build 2026 qu'un changement contractuel conclu il y a environ six mois avec OpenAI a officiellement autorisé sa division à développer de manière autonome ce qu'il appelle ouvertement la "superintelligence". Cette annonce, faite en coulisses du Fort Mason Center à San Francisco, s'est accompagnée d'une démonstration concrète : Microsoft a présenté une famille de sept modèles d'IA entièrement développés en interne par son équipe AI Superintelligence Team, regroupés sous le nom "MAI". Le modèle phare, MAI-Thinking-1, est un modèle de raisonnement de 35 milliards de paramètres actifs qui, selon Microsoft, rivalise avec les meilleurs modèles de sa catégorie sur les benchmarks d'ingénierie logicielle et de raisonnement mathématique. La famille comprend également MAI-Code-1-Flash pour GitHub Copilot et VS Code, MAI-Image-2.5 pour la génération et l'édition d'images, MAI-Transcribe-1.5 couvrant 43 langues, et MAI-Voice-2 pour la synthèse vocale multilingue. Tous sont disponibles via Microsoft Foundry, et pour la première fois, les développeurs peuvent ajuster les poids des modèles via des plateformes tierces comme OpenRouter, Fireworks et Baseten. Ce virage stratégique marque une rupture significative pour une entreprise dont l'identité en matière d'IA était jusqu'ici presque entièrement définie par son partenariat avec OpenAI, dans lequel elle a investi un total cumulé dépassant 13 milliards de dollars. Le point le plus frappant du discours de Suleyman n'est pas la liste de modèles, mais la philosophie qui les sous-tend : tous sont entraînés depuis zéro sur des données propres et commercialement licenciées, sans distillation à partir de modèles tiers. Cette position contraste directement avec une pratique répandue dans l'industrie, où les labs utilisent les sorties de modèles concurrents pour entraîner leurs propres systèmes. Pour les entreprises clientes soucieuses de la traçabilité des données et des risques juridiques liés au copyright, ce choix représente un argument différenciant concret. La relation avec OpenAI n'est pas rompue pour autant, mais elle se transforme. Pendant des années, un arrangement contractuel spécifique limitait la capacité de Microsoft à construire ses propres modèles de frontier, la positionnant davantage comme distributeur et intégrateur que comme laboratoire de recherche à part entière. L'assouplissement de ces clauses il y a six mois marque donc un tournant institutionnel autant que technique. Suleyman l'a clairement formulé : l'objectif est qu'en 2030 et au-delà, Microsoft soit capable de "construire les meilleurs modèles au monde", et non plus seulement de les acheter. Cette transition sera longue, et les sept modèles annoncés ne sont qu'une preuve de concept. Ce qui se joue ici, c'est la capacité de Microsoft à devenir un acteur de recherche fondamentale en IA, aux côtés d'OpenAI, Google DeepMind et Anthropic, plutôt que dans leur ombre.

UEPour les entreprises et développeurs européens utilisant Azure ou GitHub Copilot, la famille MAI, entraînée exclusivement sur des données licenciées, constitue un argument de conformité potentiellement pertinent face aux exigences de traçabilité de l'AI Act et au droit d'auteur européen.

💬 Le plus intéressant dans cette histoire, c'est pas les sept modèles, c'est le changement contractuel signé il y a six mois dans la plus grande discrétion. Microsoft s'est reconstruite une liberté de recherche sans rompre avec OpenAI, c'est bien joué. Et le choix d'entraîner depuis zéro sur des données licenciées, sans distillation depuis les concurrents, ça pèse lourd pour les boîtes qui naviguent avec l'AI Act.

LLMsOpinion
1 source
Le problème des gobelins d'OpenAI : pourquoi il compte et comment libérer les vôtres
4VentureBeat AI 

Le problème des gobelins d'OpenAI : pourquoi il compte et comment libérer les vôtres

Le 27 avril 2026, un développeur utilisant le pseudonyme @arb8020 sur X a mis au jour un passage pour le moins étrange dans le dépôt GitHub open source de Codex, l'outil de codage d'OpenAI. Dans un fichier nommé models.json, une directive répétée quatre fois concernant GPT-5.5 ordonnait au modèle de ne jamais parler de "gobelins, gnomes, ratons laveurs, trolls, ogres, pigeons ou autres animaux ou créatures" sauf si le sujet était "absolument et sans ambiguïté pertinent" pour la requête de l'utilisateur. La publication est devenue virale en quelques heures sur Reddit et X, suscitant une vague de spéculations : des utilisateurs rapportaient que GPT-5.5 qualifiait spontanément les bugs techniques de "gremlins", ou que certains agents basés sur le modèle semblaient "obsédés par les gobelins", comme l'a illustré Barron Roth, Senior Project Manager chez Google, avec une capture d'écran de son agent OpenClaw. Sam Altman lui-même a rejoint la discussion, publiant avec humour une capture d'un prompt demandant de "lancer l'entraînement de GPT-6 avec des gobelins supplémentaires". Cette affaire dépasse le simple anecdote. Elle met en lumière les limites encore mal comprises du Reinforcement Learning from Human Feedback (RLHF), la technique centrale qui permet d'aligner les grands modèles de langage sur les préférences humaines. Comme l'ont noté des chercheurs sur Hacker News, il s'agit d'un "problème de l'éléphant rose" : interdire explicitement à un modèle de penser à quelque chose peut paradoxalement renforcer la saillance de ce concept dans son mécanisme d'attention. Pour une entreprise valorisée à plus de 300 milliards de dollars et dont les modèles sont utilisés par des millions de professionnels, voir une directive aussi surprenante s'infiltrer en production souligne à quel point le comportement émergent des LLMs reste difficile à contrôler, même avec des équipes de pointe. OpenAI a répondu dès le lendemain avec un billet de blog officiel intitulé "Where the goblins came from", apportant une explication technique. La cause n'est pas un bug classique, mais un effet de bord inattendu de la fonctionnalité de personnalisation introduite dans ChatGPT en juillet 2025. Contrairement à ce que l'on pourrait supposer, cette personnalisation (modes Professionnel, Amical, Efficace, Candide, etc.) n'est pas appliquée après l'entraînement du modèle, mais intégrée directement dans le pipeline d'entraînement de bout en bout des modèles GPT. C'est précisément cette intégration profonde qui a produit des comportements non anticipés, forçant l'équipe à ajouter des instructions correctives explicites dans le fichier de configuration. L'incident illustre un défi structurel pour tout le secteur : plus les modèles sont personnalisables et entraînés de manière holistique, plus les interactions entre objectifs distincts deviennent imprévisibles.

UELes développeurs et entreprises européens utilisant GPT-5.5 peuvent être exposés à des comportements émergents imprévus, mais l'impact reste indirect et mondial sans spécificité France/UE.

LLMsOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic