Aller au contenu principal
Perplexity AI présente son système d'inférence hybride local-cloud au Computex 2026
OutilsVentureBeat AI2sem· 2 min de lecture

Perplexity AI présente son système d'inférence hybride local-cloud au Computex 2026

Source originale ↗·

Perplexity AI, la startup de recherche valorisée à 20 milliards de dollars, a présenté lundi soir au salon Computex 2026 ce qu'elle décrit comme le premier orchestrateur d'inférence hybride local-cloud du marché. Le PDG Aravind Srinivas a fait la démonstration en direct aux côtés de Lip-Bu Tan, directeur général d'Intel, lors du keynote de l'entreprise. Sur scène, le système traitait des documents financiers confidentiels en répartissant automatiquement les tâches: les informations sensibles restaient sur l'appareil, équipé d'un processeur Intel Core Ultra Série 3, tandis que les raisonnements complexes étaient envoyés vers des modèles cloud. La nouveauté n'est pas qu'un modèle tourne en local, mais que le système décide lui-même, en temps réel et en cours d'exécution, quelle partie de chaque tâche doit rester sur la machine et laquelle peut rejoindre le cloud. Selon la société, aucun produit n'avait jusqu'ici automatisé cette décision de routage. La fonctionnalité sera disponible dans les prochaines semaines.

L'enjeu concret est celui de la confidentialité des données dans un contexte d'agents IA de plus en plus autonomes. En demandant une validation utilisateur avant d'envoyer des éléments sensibles vers le cloud, Perplexity répond directement aux inquiétudes des entreprises sur la gouvernance des données dans les systèmes agentiques. Pour les professionnels manipulant des informations médicales, juridiques ou financières, cette architecture permet de bénéficier de la puissance des grands modèles de langage comme Claude, Gemini ou GPT sans renoncer au contrôle sur les données les plus critiques. C'est un compromis que ni les solutions purement locales ni les agents entièrement cloud ne proposaient jusqu'ici.

Cette annonce s'inscrit dans une trajectoire de produit accélérée depuis le début de l'année. Le 25 février, Perplexity lançait Computer, un agent multi-modèles orchestrant 19 modèles d'IA différents, entièrement dans le cloud. En mars, lors de sa conférence développeurs Ask 2026, la startup introduisait Personal Computer, une application Mac hybride capable d'accéder au système de fichiers local dans un environnement sécurisé et auditable. Le système présenté à Computex franchit une étape supplémentaire: l'orchestrateur raisonne désormais sur le lieu d'exécution de chaque fragment de tâche, pas seulement sur le choix du modèle. La démonstration intervient dans un contexte industriel particulièrement favorable, Computex 2026 étant dominé par le thème de l'IA embarquée: quelques heures plus tôt, Jensen Huang avait dévoilé le RTX Spark, une puce Arm Nvidia intégrant un GPU Blackwell avec 6 144 coeurs CUDA, 128 Go de mémoire LPDDR5X et une bande passante de 300 Go/s, conçue pour une nouvelle génération de PC nativement IA.

Impact France/UE

Les entreprises européennes soumises au RGPD pourraient bénéficier directement de cette architecture hybride, qui permet de maintenir les données sensibles en local tout en accédant aux grands modèles cloud, répondant aux exigences de souveraineté et de gouvernance des données imposées par la réglementation européenne.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Perplexity AI lance un orchestrateur d'inférence hybride pour PC : répartition automatique entre local et cloud
1MarkTechPost 

Perplexity AI lance un orchestrateur d'inférence hybride pour PC : répartition automatique entre local et cloud

Perplexity AI a présenté lors du Computex 2026 ce qu'elle décrit comme le premier orchestrateur d'inférence hybride local-serveur, une technologie destinée à son produit Perplexity Computer. Le principe : un modèle d'IA compact installé sur l'appareil de l'utilisateur analyse chaque tâche entrante et décide automatiquement si elle doit être exécutée en local ou envoyée vers un modèle frontier dans le cloud. La fonctionnalité arrivera en juillet 2026, d'abord sur Windows, tandis que la version Mac de Personal Computer est déjà disponible depuis avril 2026 avec une liste d'attente ouverte pour Windows. L'orchestrateur est compatible avec les puces Intel Core Ultra Series 3 et les GPU NVIDIA RTX Spark, et fonctionne indépendamment du modèle utilisé. Perplexity Computer, lancé en février 2026 sur abonnement Max à 200 dollars par mois, peut coordonner jusqu'à 20 modèles d'IA dans un même flux de travail. L'enjeu principal de cette architecture est la gouvernance des données dans les environnements professionnels. Jusqu'ici, les systèmes d'IA agentiques obligeaient les utilisateurs à choisir entre puissance de calcul et confidentialité. Le nouvel orchestrateur supprime ce compromis en automatisant la décision : les données sensibles comme les fichiers financiers, les dossiers de santé ou les documents personnels restent sur l'appareil, tandis que les tâches nécessitant une puissance de calcul élevée sont envoyées vers les serveurs de Perplexity. Le système demande l'autorisation de l'utilisateur avant tout envoi de données sensibles vers le cloud, ce qui répond directement aux exigences de conformité et de traçabilité que posent les entreprises face aux outils d'IA. Pour les équipes qui hésitaient à adopter des agents IA par crainte des fuites de données, c'est un argument concret. Cette annonce s'inscrit dans une course plus large à l'IA sur appareil, où Apple, Microsoft, Google et de nombreux fabricants de puces cherchent à convaincre que le traitement local est l'avenir. Perplexity, qui s'est imposé comme un acteur sérieux de la recherche IA avec plusieurs centaines de millions de dollars levés, tente ici de se différencier sur le segment des agents autonomes, un marché encore naissant mais très disputé. L'idée de faire du modèle local un chef d'orchestre plutôt qu'un simple exécutant est une évolution architecturale notable : ce n'est plus seulement "quel modèle utiliser" mais "où chaque morceau de la tâche doit-il s'exécuter". Si la promesse tient à l'usage réel, ce type d'orchestration pourrait devenir la norme pour tout système agentique voulant combiner performance, coût maîtrisé et confidentialité.

UEL'architecture hybride local-cloud, en maintenant les données sensibles sur l'appareil, pourrait faciliter l'adoption par les entreprises européennes soumises au RGPD qui hésitaient à déployer des agents IA.

💬 L'IA locale comme simple accélérateur, ça fait deux ans qu'on en entend parler. Ce qui change ici, c'est de mettre le petit modèle en position de chef d'orchestre qui décide ce qui part dans le cloud, avec demande explicite pour les fichiers sensibles, et pour les équipes enterprise bloquées par le RGPD, c'est l'argument concret qui manquait. Les 200 dollars par mois sur abonnement Max, c'est par contre un vrai filtre à l'entrée.

OutilsOutil
1 source
Personal Computer : le « Claude Cowork » de Perplexity est enfin accessible à tous
2Le Big Data 

Personal Computer : le « Claude Cowork » de Perplexity est enfin accessible à tous

Perplexity a ouvert au grand public son application Mac, jusqu'ici réservée à un accès limité, en y intégrant une fonctionnalité centrale baptisée Personal Computer. Disponible dès maintenant en téléchargement direct depuis le site de Perplexity (l'App Store n'est pas encore de la partie), l'application embarque les fonctions de base attendues, recherche web, pièces jointes, dictée vocale, mais c'est l'agent autonome Personal Computer qui concentre l'essentiel de l'attention. Ce système s'exécute directement sur le Mac de l'utilisateur, accède aux fichiers locaux, aux applications natives macOS, aux outils connectés et au web, et prend en charge des tâches complexes de manière indépendante. Concrètement, l'utilisateur ouvre ses Notes, appuie sur CMD, formule une instruction, gérer une liste de tâches, réorganiser un dossier, extraire des informations, et l'agent s'en charge sans intervention supplémentaire. Mieux encore, il fonctionne en continu : une tâche lancée depuis un iPhone continuera de s'exécuter sur le Mac à domicile, même en l'absence de l'utilisateur. Pour les professionnels qui jonglent quotidiennement entre dizaines d'applications, de fichiers et de sources d'information, ce type d'agent représente un gain de temps potentiellement significatif. Perplexity positionne Personal Computer comme une couche d'automatisation qui réduit la friction entre l'intention et l'exécution : plutôt que de passer d'un outil à l'autre, l'utilisateur délègue la séquence entière à l'agent. Le fait que le système reste sous contrôle, il ne prend pas de décision critique sans validation, chaque action est réversible, et les validations sont possibles depuis n'importe quel appareil, répond directement aux craintes liées à l'autonomie des IA. Ce design "human-in-the-loop" devient progressivement un standard implicite dans ce segment. Personal Computer n'évolue pas dans un vide concurrentiel. Anthropic propose une fonctionnalité comparable avec Claude Cowork, capable lui aussi de piloter des tâches sur la machine locale de l'utilisateur. Microsoft, Apple et Google poussent leurs propres agents d'automatisation dans leurs systèmes d'exploitation respectifs. Ce que Perplexity tente ici, c'est de s'imposer comme une couche d'intelligence transversale, indépendante de l'écosystème natif, en s'appuyant sur sa réputation dans la recherche augmentée. L'absence sur l'App Store reste un frein à l'adoption grand public, mais elle reflète probablement les contraintes imposées par Apple sur les applications accédant aux fichiers système et aux processus locaux. Les prochains mois diront si Personal Computer parvient à fidéliser au-delà des early adopters ou si la bataille des agents de bureau se gagne surtout sur l'intégration OS native.

💬 L'absence sur l'App Store, c'est le signal qu'on zappe vite. Perplexity essaie de s'intercaler comme couche d'IA transversale là où Apple, Microsoft et Google jouent à domicile avec l'OS sous les pieds. Ce genre de pari se gagne rarement, et leur réputation dans la recherche va devoir peser vraiment lourd pour compenser.

OutilsOutil
1 source
Le « Personal Computer » de Perplexity amène ses agents IA sur le… PC
3Ars Technica AI 

Le « Personal Computer » de Perplexity amène ses agents IA sur le… PC

Perplexity lance "Personal Computer", un agent IA en accès anticipé (sur invitation) qui s'exécute localement sur Mac Mini et donne aux agents un accès direct aux fichiers et applications de l'utilisateur. Contrairement à son homologue cloud "Computer", il permet de compléter des tâches complexes (créer des guides interactifs, produire des podcasts) en manipulant directement l'environnement local, tout en restant accessible à distance depuis n'importe quel appareil. Le concept rappelle l'outil open source OpenClaw, mais dans une version plus soignée avec une interface dockable permettant de suivre plusieurs tâches simultanément.

OutilsOutil
1 source
Perplexity intègre Deep Research dans son agent informatique, en distribuant les sous-tâches sur plus de 20 modèles de pointe
4MarkTechPost 

Perplexity intègre Deep Research dans son agent informatique, en distribuant les sous-tâches sur plus de 20 modèles de pointe

Perplexity a intégré sa fonctionnalité Deep Research à son système d'orchestration multi-modèles baptisé Computer, une évolution majeure annoncée en juin 2026. Là où l'ancienne version exécutait une séquence fixe de recherches, la nouvelle décompose automatiquement chaque question complexe en sous-tâches, qu'elle distribue ensuite à plus de 20 modèles d'IA en parallèle. Le moteur de raisonnement central est Claude Opus 4.6, tandis que des sous-agents spécialisés, dont Gemini, prennent en charge des pans spécifiques de l'analyse. Le résultat n'est plus un simple résumé : Deep Research dans Computer produit des rapports complets avec citations vérifiées, des présentations et des tableurs interactifs, entièrement générés et modifiables au sein de l'environnement Computer. Une capacité distinctive, baptisée Search as Code, permet au modèle d'écrire lui-même le code qui pilote la recherche, exécutant des milliers d'appels de récupération en parallèle dans un environnement sandbox, avec filtrage, déduplication et reclassement des sources à la volée. Les gains de performance publiés par Perplexity illustrent l'ampleur du bond. Sur le benchmark BrowseComp d'OpenAI, qui teste la capacité à retrouver des informations difficiles à localiser par navigation web, le score passe de 40,7 % à 83,8 %, soit plus du doublement. Sur Humanity's Last Exam, un test d'expertise académique pluridisciplinaire conçu par le Center for AI Safety et Scale AI, le taux grimpe de 36,4 % à 50,5 %. Ces chiffres positionnent la nouvelle version comme l'une des solutions de recherche agentique les plus performantes du marché. Concrètement, un professionnel peut demander une comparaison des marges bénéficiaires des grands fabricants de puces IA sur cinq ans, une cartographie des différences entre le RGPD européen et les lois américaines sur la vie privée, ou une synthèse des essais cliniques sur l'impact cardiovasculaire des médicaments amaigrissants, et recevoir en retour un livrable structuré, prêt à l'emploi. Computer avait été lancé fin février 2026 comme plateforme cloud de coordination d'agents IA. L'intégration de Deep Research s'inscrit dans une course effrénée entre les acteurs de la recherche augmentée par l'IA, où Perplexity affronte directement Google, OpenAI et Anthropic sur le terrain de la recherche agentique complexe. La fonctionnalité est disponible pour les abonnés Perplexity Max, mais les développeurs peuvent y accéder de façon programmatique via l'Agent API en mode pay-as-you-go, avec un preset deep-research intégré au SDK officiel et une compatibilité avec le SDK OpenAI via l'endpoint POST /v1/responses. L'ouverture aux développeurs signal que Perplexity positionne cette infrastructure non comme un produit grand public isolé, mais comme une couche de recherche que d'autres applications pourront exploiter directement, ce qui pourrait redéfinir la manière dont les outils professionnels intègrent l'accès à l'information.

UELes professionnels et développeurs européens disposent d'un accès API à une couche de recherche agentique capable de traiter des sujets réglementaires comme le RGPD, sans impact institutionnel ou réglementaire direct sur la France ou l'UE.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic