OutilsMarkTechPost · 18 juin 2026, 23:26· 2 min de lecture

Perplexity lance Brain, un système de mémoire auto-améliorant qui construit un graphe contextuel du travail d'un agent et apprend durant la nuit

Perplexity a lancé Brain, un système de mémoire à auto-amélioration intégré à son agent Computer, aujourd'hui disponible en Research Preview pour les abonnés Max et Enterprise Max. Contrairement aux systèmes de mémoire traditionnels qui stockent les préférences et habitudes de l'utilisateur, Brain construit un graphe de contexte centré sur le travail accompli par l'agent lui-même. Concrètement, Brain enregistre ce que Computer a fait, ce qui a fonctionné, ce qui a échoué, et les corrections apportées en cours de route. Ce graphe prend la forme d'un wiki alimenté par LLM, chargé automatiquement dans le sandbox de l'agent, dont les pages reflètent les projets, personnes, idées et sources propres à l'univers de travail de l'utilisateur. Le système se met à jour la nuit, en synthétisant les sessions passées, les résultats des connecteurs et les modifications apportées aux documents sources.

L'impact concret est significatif : Perplexity annonce, sur la base de ses propres tests, une amélioration de 25 % de la correction des réponses sur des tâches déjà rencontrées, un gain de 16 % sur le rappel d'information, et une réduction de 13 % des coûts sur les tâches nécessitant un contexte historique. Plus l'utilisateur se sert de Computer, plus les gains s'accumulent, puisque l'agent apprend progressivement quels fichiers, connecteurs et sources produisent les meilleurs résultats. Chaque entrée mémorisée est traçable jusqu'à sa session ou son document d'origine, ce qui facilite le débogage et renforce la confiance dans le système. Pour Perplexity, l'objectif est simple : chaque jeton dépensé aujourd'hui est un investissement dans une utilisation plus efficace des jetons demain.

Ce lancement s'inscrit dans une réflexion plus large sur ce que doit être la mémoire en intelligence artificielle. Jusqu'ici, les assistants IA mémorisaient principalement l'utilisateur, pour produire un sentiment d'engagement. Perplexity renverse cette logique en affirmant que la mémoire la plus utile est celle qui améliore la performance de l'agent sur le travail réel. La startup, qui s'est imposée comme un acteur sérieux de la recherche augmentée par IA face à Google et OpenAI, positionne ainsi Computer comme un agent de productivité à long terme plutôt qu'un simple assistant ponctuel. Des cas d'usage concrets illustrent cette ambition : un data scientist qui relance chaque semaine le même audit de pipeline verra Brain éliminer progressivement les sources mortes et raccourcir les détours ; une équipe support verra les tickets routés plus vite vers les bonnes ressources. La prochaine étape naturelle serait d'ouvrir ce mécanisme d'apprentissage à des intégrations tierces plus larges, et de mesurer ses performances sur des benchmarks indépendants.

Dans nos dossiers

Perplexity AI OpenAI

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost

Construire un assistant de recherche à base d'agents avec Groq, LangGraph, sous-agents et mémoire

Un tutoriel publié récemment détaille la construction d'un assistant de recherche agentique fonctionnant sur l'infrastructure d'inférence de Groq, en combinant LangGraph, LangChain et le modèle open source Llama 3.3 70B Versatile de Meta. L'architecture repose sur l'endpoint compatible OpenAI de Groq, disponible gratuitement via console.groq.com, ce qui permet d'utiliser l'interface ChatOpenAI de LangChain sans modifier le code en profondeur, simplement en redirigeant la clé API et l'URL de base. L'agent ainsi construit dispose d'un ensemble d'outils concrets: recherche web via DuckDuckGo, récupération de pages, lecture et écriture de fichiers, exécution de code Python, délégation à des sous-agents spécialisés, et une mémoire persistante entre les sessions. Le tout s'appuie sur des bibliothèques comme BeautifulSoup4 pour le parsing HTML et Pydantic pour la validation des données. Ce qui rend cette approche notable, c'est la combinaison d'une infrastructure gratuite et d'une architecture capable de raisonnement multi-étapes. L'agent ne se contente pas de répondre à une question: il décompose un sujet de recherche en sous-questions, interroge plusieurs sources, croise les informations pour identifier les consensus et les divergences, puis génère des rapports structurés sauvegardés dans un répertoire de sortie. La mémoire à long terme lui permet de réutiliser des connaissances acquises lors d'exécutions précédentes, évitant de recommencer from scratch à chaque session. Pour les développeurs et chercheurs qui cherchent à automatiser des workflows de veille ou d'analyse documentaire, cette architecture offre un point de départ fonctionnel sans coût d'inférence immédiat. Ce tutoriel s'inscrit dans une tendance de fond qui voit LangGraph s'imposer comme framework de référence pour les systèmes agentiques en Python, face à des alternatives comme AutoGen ou CrewAI. Groq, de son côté, mise sur la vitesse d'inférence permise par ses puces LPU propriétaires pour attirer les développeurs avec un tier gratuit généreux, dans l'espoir de les convertir en clients payants à l'échelle. L'utilisation de Llama 3.3 70B, modèle open source de Meta, illustre également la montée en puissance des modèles non propriétaires capables d'exécuter du tool calling fiable, compétence longtemps réservée aux modèles fermés comme GPT-4. La prochaine étape naturelle pour ce type de système serait l'intégration de sources structurées, une mémoire vectorielle plus sophistiquée, ou le déploiement dans des environnements de production avec contrôle des coûts.

OutilsTuto

1 source

2MarkTechPost

Construire un agent IA avancé avec planification, appel d'outils, mémoire et auto-critique via l'OpenAI API

Un tutoriel publié sur la plateforme de notebooks Colab détaille comment construire un système d'IA agentique avancé en s'appuyant sur l'API OpenAI et le modèle GPT-5.2. L'architecture proposée repose sur un pipeline de trois rôles spécialisés et distincts : un planificateur qui décompose les objectifs complexes en étapes, un exécuteur qui mobilise des outils concrets pour agir, et un critique qui évalue la qualité des résultats avant de les valider. Quatre outils sont intégrés directement dans le système : une calculatrice sécurisée qui accepte uniquement des expressions numériques sans variables, un moteur de recherche dans une base de connaissances interne simulant des playbooks d'équipe, un extracteur JSON pour produire des sorties structurées, et un module d'écriture de fichiers qui sauvegarde les livrables finaux avec une empreinte SHA-256 de vérification. La clé API est transmise via getpass() pour éviter toute exposition dans le code ou les sorties du notebook. Cette approche modulaire représente un changement de paradigme dans la façon de concevoir des agents IA. En séparant strictement la stratégie, l'action et le contrôle qualité en trois couches distinctes, le système évite les dérives courantes des agents monolithiques qui mélangent raisonnement et exécution sans garde-fous. Le composant critique intégré permet une autocorrection systématique avant la réponse finale, ce qui réduit les hallucinations et améliore la fiabilité des sorties dans des contextes professionnels. Pour les développeurs et les entreprises qui cherchent à automatiser des workflows complexes (rédaction de comptes-rendus de réunion, traitement de données structurées, génération de rapports), ce type d'architecture offre une robustesse que les chatbots conversationnels classiques ne peuvent pas atteindre. Ce tutoriel s'inscrit dans une vague plus large d'intérêt pour les systèmes multi-agents et les architectures dites "agentic", portées notamment par les travaux d'Anthropic sur Claude, de Google avec Gemini, et d'OpenAI elle-même avec ses API d'assistants et de function calling. L'émergence de GPT-5.2, le modèle utilisé ici, illustre la rapidité avec laquelle les capacités de base progressent et rendent ces architectures accessibles à un plus grand nombre de développeurs. La tendance de fond est claire : les LLM cessent d'être de simples générateurs de texte pour devenir des orchestrateurs capables de planifier, d'agir sur des systèmes externes et de s'autocorriger, ce qui rapproche concrètement l'IA générative des promesses d'automatisation avancée que l'industrie promet depuis plusieurs années.

OutilsTuto

1 source

3MarkTechPost

Découvrez OpenViking : une base de données contextuelle open-source qui apporte la mémoire et la récupération basées sur le système de fichiers aux systèmes d'agents intelligents comme OpenClaw

OpenViking, un projet open-source publié par Volcengine (la branche cloud de ByteDance), propose une approche radicalement différente de la gestion du contexte pour les systèmes d'agents IA. Plutôt que de stocker les informations sous forme de fragments textuels plats, OpenViking organise la mémoire des agents selon un paradigme de système de fichiers, accessible via le protocole viking://. Une rupture conceptuelle qui s'attaque directement aux limites des pipelines RAG (Retrieval-Augmented Generation) classiques. L'enjeu est majeur pour les développeurs d'agents autonomes : plus une tâche dure longtemps, plus le contexte s'accumule, et plus les systèmes traditionnels peinent à retrouver la bonne information au bon moment. OpenViking répond à cinq problèmes récurrents identifiés dans le développement d'agents, contexte fragmenté, volume croissant lors de tâches longues, mauvaise qualité de récupération, faible observabilité et mémoire limitée à l'historique de conversation. En structurant le contexte en répertoires hiérarchiques (resources/, user/, agent/), le système permet à un agent de naviguer avec des opérations de type ls ou find, plutôt que de se fier uniquement à la similarité sémantique. Le cœur technique repose sur trois mécanismes distincts. Le Directory Recursive Retrieval effectue une première recherche vectorielle pour identifier le répertoire le plus pertinent, puis affine récursivement dans les sous-répertoires, préservant à la fois la pertinence locale et la structure globale. Le Tiered Context Loading décompose automatiquement chaque contenu en trois niveaux : L0 (résumé en une phrase), L1 (vue d'ensemble pour la planification) et L2 (contenu complet), réduisant ainsi le coût en tokens en ne chargeant le détail qu'en cas de nécessité. Enfin, la Visualized Retrieval Trajectory enregistre le chemin de navigation suivi lors de chaque récupération, offrant aux développeurs une visibilité concrète sur les erreurs de routage de contexte, souvent responsables des mauvaises réponses, indépendamment des capacités du modèle sous-jacent. OpenViking intègre également un système de mémoire de session avec boucle d'auto-itération, permettant à l'agent de consolider et réviser ses souvenirs au fil du temps, au-delà du simple log de conversation. Porté par Volcengine, ce projet positionne ByteDance comme un acteur sérieux dans l'infrastructure des agents IA, un domaine où des solutions comme LangChain, LlamaIndex ou Mem0 dominent actuellement. La nature open-source du projet pourrait accélérer son adoption dans les pipelines d'agents complexes qui souffrent des limites structurelles du RAG conventionnel.

OutilsActu

1 source

4The Verge AI

Perplexity lance Personal Computer, qui transforme les PC Windows en agents IA

Perplexity a étendu son outil agentique Personal Computer à Windows, permettant aux ordinateurs tournant sous le système d'exploitation le plus répandu au monde de fonctionner comme des assistants IA locaux. Comme la version Mac lancée en avril, Personal Computer pour Windows agit comme un "travailleur numérique généraliste" capable d'accéder aux fichiers et applications locales pour effectuer des tâches à la place de l'utilisateur, telles que créer des documents ou mettre à jour des feuilles de calcul. Ce lancement fait suite aux intégrations de Personal Computer avec les applications Microsoft 365 et le logiciel de visioconférence Teams, déployées en mai. Perplexity cherche ainsi à combler l'écart restant entre les deux principaux environnements de bureau du marché. Cette extension marque une étape importante dans la stratégie de Perplexity, qui cherche à s'imposer non plus seulement comme un moteur de recherche IA, mais comme une plateforme d'automatisation du travail quotidien sur ordinateur. Pour les millions d'utilisateurs professionnels sous Windows, cela signifie la possibilité de déléguer des tâches répétitives et chronophages, comme la gestion de documents ou de tableurs, directement à un agent capable d'interagir avec le système d'exploitation. Cette approche répond à une demande croissante des entreprises pour des outils d'IA capables d'agir concrètement sur les données locales, plutôt que de se limiter à générer du texte ou des réponses. Cette avancée s'inscrit dans une course plus large entre les acteurs de l'IA pour dominer le segment des agents autonomes capables d'opérer directement sur les ordinateurs des utilisateurs, un terrain où Microsoft, OpenAI et Google investissent également massivement avec leurs propres solutions d'automatisation de bureau. En ciblant Windows après macOS, Perplexity élargit considérablement sa base d'utilisateurs potentiels, sachant que ce système équipe la grande majorité des postes de travail en entreprise. Les prochains développements devraient porter sur l'approfondissement des intégrations avec la suite Microsoft 365 et sur l'élargissement des capacités d'action de l'agent au sein de l'écosystème Windows.

UELes entreprises françaises équipées de PC Windows pourraient adopter cet outil pour automatiser des tâches bureautiques courantes, sans impact réglementaire ou concurrentiel direct identifié.

💬 Perplexity mise sur un pari simple : l'IA qui clique à ta place vaut plus cher que l'IA qui te répond. Passer sur Windows après macOS, c'est le vrai test, parce que c'est là que vivent les tableurs et les process d'entreprise pénibles à automatiser. Reste à voir si l'agent tient la route sur un poste Windows bordélique avec quinze applis métier installées, parce que sur le papier ça marche toujours mieux qu'en vrai.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic