OutilsMarkTechPost · 12 juin 2026, 01:21· 2 min de lecture

Perplexity intègre Deep Research dans son agent informatique, en distribuant les sous-tâches sur plus de 20 modèles de pointe

Perplexity a intégré sa fonctionnalité Deep Research à son système d'orchestration multi-modèles baptisé Computer, une évolution majeure annoncée en juin 2026. Là où l'ancienne version exécutait une séquence fixe de recherches, la nouvelle décompose automatiquement chaque question complexe en sous-tâches, qu'elle distribue ensuite à plus de 20 modèles d'IA en parallèle. Le moteur de raisonnement central est Claude Opus 4.6, tandis que des sous-agents spécialisés, dont Gemini, prennent en charge des pans spécifiques de l'analyse. Le résultat n'est plus un simple résumé : Deep Research dans Computer produit des rapports complets avec citations vérifiées, des présentations et des tableurs interactifs, entièrement générés et modifiables au sein de l'environnement Computer. Une capacité distinctive, baptisée Search as Code, permet au modèle d'écrire lui-même le code qui pilote la recherche, exécutant des milliers d'appels de récupération en parallèle dans un environnement sandbox, avec filtrage, déduplication et reclassement des sources à la volée.

Les gains de performance publiés par Perplexity illustrent l'ampleur du bond. Sur le benchmark BrowseComp d'OpenAI, qui teste la capacité à retrouver des informations difficiles à localiser par navigation web, le score passe de 40,7 % à 83,8 %, soit plus du doublement. Sur Humanity's Last Exam, un test d'expertise académique pluridisciplinaire conçu par le Center for AI Safety et Scale AI, le taux grimpe de 36,4 % à 50,5 %. Ces chiffres positionnent la nouvelle version comme l'une des solutions de recherche agentique les plus performantes du marché. Concrètement, un professionnel peut demander une comparaison des marges bénéficiaires des grands fabricants de puces IA sur cinq ans, une cartographie des différences entre le RGPD européen et les lois américaines sur la vie privée, ou une synthèse des essais cliniques sur l'impact cardiovasculaire des médicaments amaigrissants, et recevoir en retour un livrable structuré, prêt à l'emploi.

Computer avait été lancé fin février 2026 comme plateforme cloud de coordination d'agents IA. L'intégration de Deep Research s'inscrit dans une course effrénée entre les acteurs de la recherche augmentée par l'IA, où Perplexity affronte directement Google, OpenAI et Anthropic sur le terrain de la recherche agentique complexe. La fonctionnalité est disponible pour les abonnés Perplexity Max, mais les développeurs peuvent y accéder de façon programmatique via l'Agent API en mode pay-as-you-go, avec un preset deep-research intégré au SDK officiel et une compatibilité avec le SDK OpenAI via l'endpoint POST /v1/responses. L'ouverture aux développeurs signal que Perplexity positionne cette infrastructure non comme un produit grand public isolé, mais comme une couche de recherche que d'autres applications pourront exploiter directement, ce qui pourrait redéfinir la manière dont les outils professionnels intègrent l'accès à l'information.

Impact France/UE

Les professionnels et développeurs européens disposent d'un accès API à une couche de recherche agentique capable de traiter des sujets réglementaires comme le RGPD, sans impact institutionnel ou réglementaire direct sur la France ou l'UE.

Dans nos dossiers

Perplexity AI OpenAI Agents IA Anthropic

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost

Google Research intègre un RAG à base d'agents dans Gemini Enterprise pour les requêtes multi-étapes

L'équipe Google Research a présenté le 5 juin 2026 un nouveau cadre de récupération augmentée par agents, intégré directement à la plateforme Gemini Enterprise Agent. Cette architecture, désormais disponible en préversion publique sous le nom Cross-Corpus Retrieval, s'attaque à une limite bien connue des systèmes de recherche d'entreprise : l'incapacité à enchaîner plusieurs étapes de raisonnement sur des sources de données distinctes. Concrètement, là où un système RAG classique échoue face à une requête du type "Quelles sont les spécifications du serveur utilisé dans le Projet X ?" (parce qu'il trouve un identifiant mais ne sait pas aller chercher les specs dans une deuxième base), le nouveau système orchestre une série d'agents spécialisés. Un Orchestrateur délègue la tâche, un Agent Planificateur identifie les sources pertinentes, un Agent Réécriture de Requêtes décompose la question en sous-requêtes précises, et un Agent de Diffusion envoie ces requêtes en parallèle. Sur le benchmark FramesQA, un corpus de 824 questions et 2 676 documents PDF, le système affiche un gain de précision factuelle allant jusqu'à 34 % par rapport au RAG standard, avec de meilleures performances également sur des jeux de données propriétaires internes à Google. Ce qui distingue fondamentalement cette architecture de ses concurrentes, c'est la présence d'un Agent de Contexte Suffisant, pièce centrale du dispositif. Plutôt que de générer une réponse dès que le premier cycle de recherche se termine, cet agent inspecte les résultats, compare un brouillon intermédiaire aux extraits récupérés, et produit un journal détaillé des lacunes identifiées, avec des raisons et des feedbacks explicites. Si des informations manquent, le cycle repart : la requête est reformulée, de nouvelles sources sont explorées. Ce mécanisme d'itération évite deux défauts symétriques : la réponse incomplète présentée comme définitive, et la capitulation prématurée du modèle face à un contexte insuffisant. Pour une question médicale portant à la fois sur les médicaments de sortie, les restrictions alimentaires et les allergies d'un patient, le système ne s'arrête pas à deux éléments sur trois, il continue jusqu'à ce que les trois soient vérifiés. Google positionne cette avancée dans un contexte de concurrence intense sur les agents d'entreprise, un marché où Microsoft, Salesforce et plusieurs startups spécialisées investissent massivement. Le problème des requêtes multi-sources, dit "multi-hop", est depuis plusieurs années l'un des obstacles majeurs à l'adoption des LLM en environnement professionnel réel, où les données sont fragmentées entre bases de connaissances, systèmes CRM, dossiers PDF et notes cliniques. En intégrant cette capacité directement dans Gemini Enterprise Agent Platform plutôt que de la proposer comme une bibliothèque tierce, Google cherche à ancrer ses modèles au coeur des infrastructures de données des grandes organisations, tout en améliorant la fiabilité des réponses là où elle est la plus critique.

UELes entreprises européennes utilisant Gemini Enterprise peuvent accéder en préversion à cette architecture multi-corpus, susceptible d'améliorer l'adoption des LLM dans des secteurs à données fragmentées comme la santé ou la finance.

💬 Le truc intéressant, c'est l'agent de contexte suffisant : il sait ce qu'il lui manque, relance la recherche, et ne s'arrête pas avant d'avoir les trois éléments sur trois. C'est exactement ce qui casse les RAG classiques en prod, pas le retrieval en lui-même. Que Google l'intègre directement dans la plateforme plutôt qu'en lib tierce, ça dit tout sur leur stratégie d'ancrage infrastructure.

OutilsOutil

1 source

2The Decoder

Perplexity lance "Search as Code" : les modèles d'IA peuvent désormais écrire leurs propres pipelines de recherche

Perplexity a dévoilé une nouvelle architecture baptisée "Search as Code" qui redéfinit la façon dont les modèles d'IA effectuent des recherches en ligne. Plutôt que de s'appuyer sur des API de recherche figées aux paramètres prédéfinis, le système permet aux agents IA de rédiger eux-mêmes leurs propres routines de recherche en Python, directement dans un environnement sandbox sécurisé. Le modèle gère en autonomie le filtrage des résultats et la déduplication des sources, sans passer par des interfaces rigides. Résultat annoncé: une réduction des coûts en tokens pouvant atteindre 85%, et des performances supérieures à celles d'OpenAI et d'Anthropic sur plusieurs benchmarks de référence. L'enjeu est considérable pour les entreprises qui intègrent la recherche web dans leurs pipelines d'IA. Jusqu'ici, les agents devaient s'adapter aux contraintes imposées par des APIs standardisées, souvent peu optimisées pour des requêtes complexes ou itératives. En donnant au modèle la main sur sa propre logique de recherche, Perplexity promet des réponses plus précises, moins de redondances et une facture computationnelle drastiquement réduite, ce qui ouvre la voie à des déploiements à grande échelle. Cette annonce s'inscrit dans une course effrénée entre Perplexity, OpenAI et Anthropic autour du "web search" intégré aux LLMs, un marché stratégique depuis que les moteurs de recherche traditionnels voient leur modèle menacé par les assistants IA. Perplexity, valorisé à plusieurs milliards de dollars, mise sur l'innovation architecturale pour se distinguer face à des concurrents disposant de ressources bien supérieures.

UELes développeurs et entreprises européens intégrant la recherche web dans leurs pipelines d'IA pourraient bénéficier d'une réduction significative des coûts computationnels grâce à cette nouvelle architecture.

💬 85% de réduction sur les tokens, c'est le genre de chiffre qui fait lever les yeux au ciel, et pourtant le concept tient la route. Laisser le modèle écrire lui-même sa routine de recherche plutôt que de le contraindre dans une API figée, c'est une idée simple qui résout un vrai problème. Reste à voir ce que ça donne sur des cas limites en prod, parce que les benchmarks contre Anthropic et OpenAI, c'est toujours un peu l'arroseur arrosé.

OutilsOutil

1 source

3Pandaily

HONOR intègre le modèle DeepSeek-V4 dans son assistant YOYO

HONOR a annoncé l'intégration du modèle DeepSeek-V4 dans son assistant vocal YOYO, désormais accessible via MagicOS. La mise à jour concerne les appareils fonctionnant sous MagicOS 8.0 et versions ultérieures, à condition que l'application YOYO soit mise à jour vers la version 90.10.28.041 ou supérieure. DeepSeek-V4 est un grand modèle de langage proposant plusieurs configurations adaptées à des besoins de calcul variés, dont des variantes allégées spécialement optimisées pour les appareils mobiles. Concrètement, l'intégration renforce les capacités de YOYO en matière de dialogue multi-tours, de raisonnement logique et de compréhension multimodale, permettant aux utilisateurs d'effectuer des tâches comme la recherche d'informations ou la génération de contenu directement depuis des points d'entrée système, sans passer par une application tierce. L'impact pour les utilisateurs est immédiat : l'IA n'est plus cantonnée à une application isolée, mais s'intègre au niveau du système d'exploitation, rendant les fonctions intelligentes accessibles en permanence depuis n'importe quelle interface. Autre point notable, HONOR ne réserve pas cette mise à jour à ses modèles haut de gamme. Le déploiement est prévu pour une gamme élargie d'appareils, ce qui élargit significativement le nombre d'utilisateurs pouvant bénéficier de capacités IA avancées sans nécessairement posséder un téléphone premium. Cette initiative s'inscrit dans une tendance lourde qui transforme le marché des smartphones : l'intelligence artificielle embarquée est devenue un axe de différenciation majeur entre constructeurs. Samsung, Apple, Google et désormais HONOR se livrent une compétition intense autour de la qualité des modèles intégrés et de leur profondeur d'ancrage dans le système. Le choix de DeepSeek-V4, un modèle développé par la société chinoise DeepSeek qui a fait sensation début 2025 en proposant des performances comparables aux meilleurs modèles occidentaux à moindre coût, reflète la montée en puissance de l'écosystème IA chinois. Pour HONOR, cette intégration constitue un signal fort de sa volonté de positionner MagicOS comme une plateforme IA de premier plan face à ses concurrents.

UELes utilisateurs européens de smartphones HONOR sous MagicOS 8.0 bénéficient d'un assistant vocal renforcé par DeepSeek-V4, accessible sans application tierce.

OutilsOutil

1 source

4MarkTechPost

Nous Research lance Hermes Agent Profile Builder : identité, modèle, compétences et serveurs MCP dans un tableau de bord unique

Nous Research a publié le Profile Builder pour son agent open source Hermes, une interface graphique intégrée au tableau de bord local du projet accessible depuis un navigateur à l'adresse 127.0.0.1:9119. Jusqu'ici, configurer un agent Hermes demandait plusieurs étapes en ligne de commande : définir une identité, choisir un modèle et un fournisseur, activer des compétences, connecter des serveurs MCP. Le Profile Builder regroupe toutes ces opérations dans un formulaire guidé en cinq étapes. Le premier champ définit le nom et la description de l'agent, le nom servant également d'alias de commande dans le terminal. Viennent ensuite le choix du modèle et du fournisseur parmi Nous Portal, OpenRouter, NVIDIA, OpenAI ou tout endpoint compatible OpenAI, puis l'activation des compétences intégrées, l'installation depuis un catalogue externe via le Skills Hub, et enfin l'ajout de serveurs MCP par URL ou par commande locale. Chaque configuration produit un profil isolé : un répertoire autonome contenant son propre fichier config.yaml, ses variables d'environnement, son fichier de personnalité SOUL.md, sa mémoire, ses sessions, ses tâches planifiées et sa base de données d'état. L'intérêt principal de cette approche est la possibilité de faire tourner plusieurs agents spécialisés sur une même machine sans qu'ils partagent le moindre état. Un agent dédié au code et un agent de veille documentaire restent rigoureusement cloisonnés : mémoire séparée, credentials distincts, verrous sur les tokens pour éviter les conflits d'accès. Concrètement, un développeur peut configurer un assistant de programmation couplé à un modèle de code, un serveur MCP pour le système de fichiers et des compétences Git, pendant qu'un second profil gère une veille automatisée avec des compétences d'extraction web. Le builder abaisse significativement le seuil d'entrée : là où la configuration CLI exigeait de connaître chaque commande dans le bon ordre, le formulaire guide l'utilisateur sans supposer de familiarité avec l'outillage interne. Hermes est l'agent auto-améliorant open source de Nous Research, disponible en CLI, en application desktop et sur des plateformes de messagerie. Les compétences de l'agent reposent sur des fichiers SKILL.md dont seules les descriptions courtes sont chargées par défaut, le contenu complet n'étant consulté qu'en cas de besoin, ce qui évite d'alourdir les requêtes. Les serveurs MCP, conformes au protocole Model Context Protocol, permettent d'exposer des outils externes, qu'il s'agisse de services HTTP distants ou de processus stdio locaux. Le Profile Builder n'écrase pas le CLI, il en reproduit la logique dans une interface plus accessible : les deux chemins écrivent dans les mêmes fichiers de profil. Cette sortie s'inscrit dans une tendance plus large où les projets d'agents open source cherchent à réduire la friction de configuration pour toucher un public plus large que les seuls développeurs familiers de la ligne de commande.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic