OutilsVentureBeat AI · 2 juin 2026, 22:08· 2 min de lecture

Perplexity AI présente son système d'inférence hybride local-cloud au Computex 2026

Perplexity AI, la startup de recherche valorisée à 20 milliards de dollars, a présenté lundi soir au salon Computex 2026 ce qu'elle décrit comme le premier orchestrateur d'inférence hybride local-cloud du marché. Le PDG Aravind Srinivas a fait la démonstration en direct aux côtés de Lip-Bu Tan, directeur général d'Intel, lors du keynote de l'entreprise. Sur scène, le système traitait des documents financiers confidentiels en répartissant automatiquement les tâches: les informations sensibles restaient sur l'appareil, équipé d'un processeur Intel Core Ultra Série 3, tandis que les raisonnements complexes étaient envoyés vers des modèles cloud. La nouveauté n'est pas qu'un modèle tourne en local, mais que le système décide lui-même, en temps réel et en cours d'exécution, quelle partie de chaque tâche doit rester sur la machine et laquelle peut rejoindre le cloud. Selon la société, aucun produit n'avait jusqu'ici automatisé cette décision de routage. La fonctionnalité sera disponible dans les prochaines semaines.

L'enjeu concret est celui de la confidentialité des données dans un contexte d'agents IA de plus en plus autonomes. En demandant une validation utilisateur avant d'envoyer des éléments sensibles vers le cloud, Perplexity répond directement aux inquiétudes des entreprises sur la gouvernance des données dans les systèmes agentiques. Pour les professionnels manipulant des informations médicales, juridiques ou financières, cette architecture permet de bénéficier de la puissance des grands modèles de langage comme Claude, Gemini ou GPT sans renoncer au contrôle sur les données les plus critiques. C'est un compromis que ni les solutions purement locales ni les agents entièrement cloud ne proposaient jusqu'ici.

Cette annonce s'inscrit dans une trajectoire de produit accélérée depuis le début de l'année. Le 25 février, Perplexity lançait Computer, un agent multi-modèles orchestrant 19 modèles d'IA différents, entièrement dans le cloud. En mars, lors de sa conférence développeurs Ask 2026, la startup introduisait Personal Computer, une application Mac hybride capable d'accéder au système de fichiers local dans un environnement sécurisé et auditable. Le système présenté à Computex franchit une étape supplémentaire: l'orchestrateur raisonne désormais sur le lieu d'exécution de chaque fragment de tâche, pas seulement sur le choix du modèle. La démonstration intervient dans un contexte industriel particulièrement favorable, Computex 2026 étant dominé par le thème de l'IA embarquée: quelques heures plus tôt, Jensen Huang avait dévoilé le RTX Spark, une puce Arm Nvidia intégrant un GPU Blackwell avec 6 144 coeurs CUDA, 128 Go de mémoire LPDDR5X et une bande passante de 300 Go/s, conçue pour une nouvelle génération de PC nativement IA.

Impact France/UE

Les entreprises européennes soumises au RGPD pourraient bénéficier directement de cette architecture hybride, qui permet de maintenir les données sensibles en local tout en accédant aux grands modèles cloud, répondant aux exigences de souveraineté et de gouvernance des données imposées par la réglementation européenne.

Dans nos dossiers

Perplexity AI Agents IA Blackwell CUDA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MarkTechPost

Perplexity AI lance un orchestrateur d'inférence hybride pour PC : répartition automatique entre local et cloud

Perplexity AI a présenté lors du Computex 2026 ce qu'elle décrit comme le premier orchestrateur d'inférence hybride local-serveur, une technologie destinée à son produit Perplexity Computer. Le principe : un modèle d'IA compact installé sur l'appareil de l'utilisateur analyse chaque tâche entrante et décide automatiquement si elle doit être exécutée en local ou envoyée vers un modèle frontier dans le cloud. La fonctionnalité arrivera en juillet 2026, d'abord sur Windows, tandis que la version Mac de Personal Computer est déjà disponible depuis avril 2026 avec une liste d'attente ouverte pour Windows. L'orchestrateur est compatible avec les puces Intel Core Ultra Series 3 et les GPU NVIDIA RTX Spark, et fonctionne indépendamment du modèle utilisé. Perplexity Computer, lancé en février 2026 sur abonnement Max à 200 dollars par mois, peut coordonner jusqu'à 20 modèles d'IA dans un même flux de travail. L'enjeu principal de cette architecture est la gouvernance des données dans les environnements professionnels. Jusqu'ici, les systèmes d'IA agentiques obligeaient les utilisateurs à choisir entre puissance de calcul et confidentialité. Le nouvel orchestrateur supprime ce compromis en automatisant la décision : les données sensibles comme les fichiers financiers, les dossiers de santé ou les documents personnels restent sur l'appareil, tandis que les tâches nécessitant une puissance de calcul élevée sont envoyées vers les serveurs de Perplexity. Le système demande l'autorisation de l'utilisateur avant tout envoi de données sensibles vers le cloud, ce qui répond directement aux exigences de conformité et de traçabilité que posent les entreprises face aux outils d'IA. Pour les équipes qui hésitaient à adopter des agents IA par crainte des fuites de données, c'est un argument concret. Cette annonce s'inscrit dans une course plus large à l'IA sur appareil, où Apple, Microsoft, Google et de nombreux fabricants de puces cherchent à convaincre que le traitement local est l'avenir. Perplexity, qui s'est imposé comme un acteur sérieux de la recherche IA avec plusieurs centaines de millions de dollars levés, tente ici de se différencier sur le segment des agents autonomes, un marché encore naissant mais très disputé. L'idée de faire du modèle local un chef d'orchestre plutôt qu'un simple exécutant est une évolution architecturale notable : ce n'est plus seulement "quel modèle utiliser" mais "où chaque morceau de la tâche doit-il s'exécuter". Si la promesse tient à l'usage réel, ce type d'orchestration pourrait devenir la norme pour tout système agentique voulant combiner performance, coût maîtrisé et confidentialité.

UEL'architecture hybride local-cloud, en maintenant les données sensibles sur l'appareil, pourrait faciliter l'adoption par les entreprises européennes soumises au RGPD qui hésitaient à déployer des agents IA.

💬 L'IA locale comme simple accélérateur, ça fait deux ans qu'on en entend parler. Ce qui change ici, c'est de mettre le petit modèle en position de chef d'orchestre qui décide ce qui part dans le cloud, avec demande explicite pour les fichiers sensibles, et pour les équipes enterprise bloquées par le RGPD, c'est l'argument concret qui manquait. Les 200 dollars par mois sur abonnement Max, c'est par contre un vrai filtre à l'entrée.

OutilsOutil

1 source

2Le Big Data

Personal Computer : le « Claude Cowork » de Perplexity est enfin accessible à tous

Perplexity a ouvert au grand public son application Mac, jusqu'ici réservée à un accès limité, en y intégrant une fonctionnalité centrale baptisée Personal Computer. Disponible dès maintenant en téléchargement direct depuis le site de Perplexity (l'App Store n'est pas encore de la partie), l'application embarque les fonctions de base attendues, recherche web, pièces jointes, dictée vocale, mais c'est l'agent autonome Personal Computer qui concentre l'essentiel de l'attention. Ce système s'exécute directement sur le Mac de l'utilisateur, accède aux fichiers locaux, aux applications natives macOS, aux outils connectés et au web, et prend en charge des tâches complexes de manière indépendante. Concrètement, l'utilisateur ouvre ses Notes, appuie sur CMD, formule une instruction, gérer une liste de tâches, réorganiser un dossier, extraire des informations, et l'agent s'en charge sans intervention supplémentaire. Mieux encore, il fonctionne en continu : une tâche lancée depuis un iPhone continuera de s'exécuter sur le Mac à domicile, même en l'absence de l'utilisateur. Pour les professionnels qui jonglent quotidiennement entre dizaines d'applications, de fichiers et de sources d'information, ce type d'agent représente un gain de temps potentiellement significatif. Perplexity positionne Personal Computer comme une couche d'automatisation qui réduit la friction entre l'intention et l'exécution : plutôt que de passer d'un outil à l'autre, l'utilisateur délègue la séquence entière à l'agent. Le fait que le système reste sous contrôle, il ne prend pas de décision critique sans validation, chaque action est réversible, et les validations sont possibles depuis n'importe quel appareil, répond directement aux craintes liées à l'autonomie des IA. Ce design "human-in-the-loop" devient progressivement un standard implicite dans ce segment. Personal Computer n'évolue pas dans un vide concurrentiel. Anthropic propose une fonctionnalité comparable avec Claude Cowork, capable lui aussi de piloter des tâches sur la machine locale de l'utilisateur. Microsoft, Apple et Google poussent leurs propres agents d'automatisation dans leurs systèmes d'exploitation respectifs. Ce que Perplexity tente ici, c'est de s'imposer comme une couche d'intelligence transversale, indépendante de l'écosystème natif, en s'appuyant sur sa réputation dans la recherche augmentée. L'absence sur l'App Store reste un frein à l'adoption grand public, mais elle reflète probablement les contraintes imposées par Apple sur les applications accédant aux fichiers système et aux processus locaux. Les prochains mois diront si Personal Computer parvient à fidéliser au-delà des early adopters ou si la bataille des agents de bureau se gagne surtout sur l'intégration OS native.

💬 L'absence sur l'App Store, c'est le signal qu'on zappe vite. Perplexity essaie de s'intercaler comme couche d'IA transversale là où Apple, Microsoft et Google jouent à domicile avec l'OS sous les pieds. Ce genre de pari se gagne rarement, et leur réputation dans la recherche va devoir peser vraiment lourd pour compenser.

OutilsOutil

1 source

3VentureBeat AI

Intuit présente comment il a reconstruit son infrastructure IA pour des tâches rapides et complexes

Intuit, l'éditeur américain des logiciels financiers TurboTax et QuickBooks, a entrepris une refonte complète de son infrastructure d'intelligence artificielle pour répondre aux nouvelles exigences des entreprises clientes. Plutôt que de s'appuyer sur de grands agents polyvalents capables de gérer un large éventail de tâches, la société a migré vers une architecture granulaire fondée sur des compétences et des outils spécialisés. "Nous sommes passés d'un système multi-agents avec de grands agents qui faisaient beaucoup de choses, à une intégration complète de flux de travail, de compétences et d'outils jusqu'au niveau de base", a déclaré Nhung Ho, vice-présidente de l'IA chez Intuit. Cette transformation a impliqué de décomposer les agents complexes en composants distincts, en séparant la logique de décision des actions d'exécution, tout en intégrant des experts humains directement dans les processus aux côtés de l'IA. L'orchestrateur, le planificateur et l'ensemble des couches d'intelligence ont été remplacés, entraînant des changements à l'échelle de toute l'organisation technique. Cette réarchitecturation permet désormais à Intuit de découpler son orchestration de fournisseurs de modèles spécifiques, ce qui lui donne la flexibilité de choisir les meilleurs outils selon les tâches, qu'il s'agisse de modèles proposés par de grands fournisseurs externes ou de solutions développées en interne. C'est une avancée stratégique majeure dans un secteur où la dépendance à un seul fournisseur d'IA représente un risque croissant. Pour des entreprises gérant des millions de clients et des données fiscales et financières sensibles, la capacité à substituer rapidement un modèle par un autre sans refondre l'ensemble du système est un avantage concurrentiel direct. La nouvelle architecture répond également à une évolution fondamentale des attentes : les utilisateurs ne se contentent plus de conversations simples, ils exigent des tâches agentiques complexes et multi-étapes que les infrastructures héritées ne peuvent tout simplement pas prendre en charge. Nhung Ho présentera le détail de ces choix techniques lors de la conférence VB Transform 2026, les 14 et 15 juillet prochains, notamment la conception d'une couche d'abstraction au coeur du système d'intelligence d'Intuit. Cette édition de l'événement est particulièrement dense en sessions consacrées à l'orchestration agentique : Target, Instacart, Asana, Rivian, Databricks et Atlassian y prendront également la parole pour partager leurs approches respectives du déploiement d'agents IA à grande échelle. La convergence de ces témoignages illustre une tendance de fond : les grandes entreprises technologiques sortent de la phase expérimentale et s'attaquent aux défis d'ingénierie réels que pose le déploiement d'une IA autonome en production, à la fois sur le plan de la performance, de la gouvernance et de la modularité.

💬 Intuit a fait ce que la plupart des boîtes font encore semblant de ne pas savoir : les gros agents "qui font tout" ne tiennent pas à l'échelle. Passer à une architecture de compétences granulaires avec découplage de l'orchestrateur, c'est exactement le chemin, et ça permet au passage de ne plus être prisonnier d'un seul fournisseur. Le vrai sujet à VB Transform, c'est pas Intuit spécifiquement, c'est que Target, Instacart, Atlassian disent tous la même chose en ce moment : la phase "on expérimente des agents" est terminée, place à l'ingénierie sérieuse.

OutilsActu

1 source

4MarkTechPost

Perplexity lance Brain, un système de mémoire auto-améliorant qui construit un graphe contextuel du travail d'un agent et apprend durant la nuit

Perplexity a lancé Brain, un système de mémoire à auto-amélioration intégré à son agent Computer, aujourd'hui disponible en Research Preview pour les abonnés Max et Enterprise Max. Contrairement aux systèmes de mémoire traditionnels qui stockent les préférences et habitudes de l'utilisateur, Brain construit un graphe de contexte centré sur le travail accompli par l'agent lui-même. Concrètement, Brain enregistre ce que Computer a fait, ce qui a fonctionné, ce qui a échoué, et les corrections apportées en cours de route. Ce graphe prend la forme d'un wiki alimenté par LLM, chargé automatiquement dans le sandbox de l'agent, dont les pages reflètent les projets, personnes, idées et sources propres à l'univers de travail de l'utilisateur. Le système se met à jour la nuit, en synthétisant les sessions passées, les résultats des connecteurs et les modifications apportées aux documents sources. L'impact concret est significatif : Perplexity annonce, sur la base de ses propres tests, une amélioration de 25 % de la correction des réponses sur des tâches déjà rencontrées, un gain de 16 % sur le rappel d'information, et une réduction de 13 % des coûts sur les tâches nécessitant un contexte historique. Plus l'utilisateur se sert de Computer, plus les gains s'accumulent, puisque l'agent apprend progressivement quels fichiers, connecteurs et sources produisent les meilleurs résultats. Chaque entrée mémorisée est traçable jusqu'à sa session ou son document d'origine, ce qui facilite le débogage et renforce la confiance dans le système. Pour Perplexity, l'objectif est simple : chaque jeton dépensé aujourd'hui est un investissement dans une utilisation plus efficace des jetons demain. Ce lancement s'inscrit dans une réflexion plus large sur ce que doit être la mémoire en intelligence artificielle. Jusqu'ici, les assistants IA mémorisaient principalement l'utilisateur, pour produire un sentiment d'engagement. Perplexity renverse cette logique en affirmant que la mémoire la plus utile est celle qui améliore la performance de l'agent sur le travail réel. La startup, qui s'est imposée comme un acteur sérieux de la recherche augmentée par IA face à Google et OpenAI, positionne ainsi Computer comme un agent de productivité à long terme plutôt qu'un simple assistant ponctuel. Des cas d'usage concrets illustrent cette ambition : un data scientist qui relance chaque semaine le même audit de pipeline verra Brain éliminer progressivement les sources mortes et raccourcir les détours ; une équipe support verra les tickets routés plus vite vers les bonnes ressources. La prochaine étape naturelle serait d'ouvrir ce mécanisme d'apprentissage à des intégrations tierces plus larges, et de mesurer ses performances sur des benchmarks indépendants.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic