Aller au contenu principal
Perplexity lance "Search as Code" : les modèles d'IA peuvent désormais écrire leurs propres pipelines de recherche
OutilsThe Decoder4h

Perplexity lance "Search as Code" : les modèles d'IA peuvent désormais écrire leurs propres pipelines de recherche

Résumé IASource uniqueImpact UETake éditorial
Source originale ↗·

Perplexity a dévoilé une nouvelle architecture baptisée "Search as Code" qui redéfinit la façon dont les modèles d'IA effectuent des recherches en ligne. Plutôt que de s'appuyer sur des API de recherche figées aux paramètres prédéfinis, le système permet aux agents IA de rédiger eux-mêmes leurs propres routines de recherche en Python, directement dans un environnement sandbox sécurisé. Le modèle gère en autonomie le filtrage des résultats et la déduplication des sources, sans passer par des interfaces rigides. Résultat annoncé: une réduction des coûts en tokens pouvant atteindre 85%, et des performances supérieures à celles d'OpenAI et d'Anthropic sur plusieurs benchmarks de référence.

L'enjeu est considérable pour les entreprises qui intègrent la recherche web dans leurs pipelines d'IA. Jusqu'ici, les agents devaient s'adapter aux contraintes imposées par des APIs standardisées, souvent peu optimisées pour des requêtes complexes ou itératives. En donnant au modèle la main sur sa propre logique de recherche, Perplexity promet des réponses plus précises, moins de redondances et une facture computationnelle drastiquement réduite, ce qui ouvre la voie à des déploiements à grande échelle.

Cette annonce s'inscrit dans une course effrénée entre Perplexity, OpenAI et Anthropic autour du "web search" intégré aux LLMs, un marché stratégique depuis que les moteurs de recherche traditionnels voient leur modèle menacé par les assistants IA. Perplexity, valorisé à plusieurs milliards de dollars, mise sur l'innovation architecturale pour se distinguer face à des concurrents disposant de ressources bien supérieures.

Impact France/UE

Les développeurs et entreprises européens intégrant la recherche web dans leurs pipelines d'IA pourraient bénéficier d'une réduction significative des coûts computationnels grâce à cette nouvelle architecture.

💬 Le point de vue du dev

85% de réduction sur les tokens, c'est le genre de chiffre qui fait lever les yeux au ciel, et pourtant le concept tient la route. Laisser le modèle écrire lui-même sa routine de recherche plutôt que de le contraindre dans une API figée, c'est une idée simple qui résout un vrai problème. Reste à voir ce que ça donne sur des cas limites en prod, parce que les benchmarks contre Anthropic et OpenAI, c'est toujours un peu l'arroseur arrosé.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1AI News 

Les développeurs citoyens ont désormais leur propre assistant

Emergent, une startup spécialisée dans la création d'applications par intelligence artificielle, a lancé Wingman, un agent autonome capable de prendre en charge et de piloter les outils du quotidien sans que l'utilisateur n'ait besoin de savoir coder. Selon l'entreprise, huit millions de fondateurs issus de 190 pays ont déjà utilisé ses produits pour concevoir des logiciels prêts à être déployés en production. Wingman se distingue des plateformes concurrentes par un système de "frontières de confiance" : certaines actions, comme la modification de données ou l'envoi de messages à des groupes, sont automatiquement suspendues jusqu'à validation humaine, tandis que les tâches courantes s'exécutent de façon autonome en arrière-plan. La plateforme s'intègre nativement à WhatsApp, Telegram, iMessage, les e-mails, les agendas, les CRM et GitHub, sans qu'aucun appel API ni échange de clés ne soit nécessaire de la part de l'utilisateur. Les tarifs démarrent à 20 dollars par mois, avec une formule à 200 dollars pour un usage plus intensif. Ce lancement illustre une tendance de fond : démocratiser le développement logiciel auprès des fondateurs et entrepreneurs sans bagage technique. "La plupart des gens n'échouent pas à être productifs. Ils sont submergés par les petites tâches qui n'arrêtent pas d'arriver", résume Mukund Jha, cofondateur et PDG d'Emergent. En déléguant à un agent la gestion des flux de communication, la planification ou la mise à jour de données dans un CRM, Wingman promet de libérer du temps sur des opérations répétitives à faible valeur ajoutée. Le ton des réponses générées par l'agent est ajustable, afin qu'il ressemble davantage à un collaborateur de confiance qu'à un simple outil. Le moteur peut être alimenté par les modèles d'OpenAI ou d'Anthropic, ou par l'instance propriétaire d'Emergent pour réduire les coûts. Ce type de plateforme s'inscrit dans la vague du "vibe coding", où le langage naturel remplace l'écriture de code. L'idée est séduisante, mais soulève des questions que la communication d'Emergent esquive soigneusement. Le code généré repose sur des corpus de données scrappés sur internet, recombinés et partiellement modifiés pour correspondre aux besoins exprimés. Or, pour les fondateurs qui constituent le public cible, les aspects de sécurité et de fiabilité du code produit resteront largement opaques, y compris via la fonction d'audit de code intégrée à la plateforme. Des acteurs comme OpenClaw ou d'autres outils similaires peuvent convenir à des usages personnels ou exploratoires, mais leur adoption pour des applications à portée commerciale ou publique suppose une confiance aveugle dans des systèmes dont ni les biais ni les failles ne sont aisément auditables par des non-techniciens. C'est précisément là que se situe la tension centrale du marché des agents autonomes en 2026 : entre la promesse d'accessibilité universelle et les exigences réelles d'un logiciel robuste.

OutilsOutil
1 source
Google lance une compétence d'agent dans l'API Gemini pour combler les lacunes des modèles IA sur leurs propres SDK
2The Decoder 

Google lance une compétence d'agent dans l'API Gemini pour combler les lacunes des modèles IA sur leurs propres SDK

Google a introduit une nouvelle fonctionnalité baptisée « Agent Skill » dans son API Gemini, conçue pour combler une lacune structurelle des modèles d'IA : leur ignorance des mises à jour de leurs propres SDK survenues après leur date d'entraînement. Ce mécanisme permet au modèle d'accéder dynamiquement à une documentation à jour sur ses propres outils, améliorant significativement la qualité du code généré pour les applications qui utilisent l'API Gemini. L'impact est concret pour les développeurs : un modèle qui ne connaît pas les dernières versions d'un SDK produit du code obsolète, bogué ou incompatible. En injectant automatiquement les bonnes références au moment de la génération, Google réduit les erreurs d'intégration et accélère le développement d'agents IA — un enjeu critique alors que l'écosystème évolue plusieurs fois par mois. Ce problème de « knowledge cutoff » est universel à tous les grands modèles de langage : ChatGPT, Claude et Gemini souffrent tous d'un décalage entre leur entraînement et l'état réel du monde. La réponse de Google illustre une tendance plus large — plutôt que d'attendre le prochain cycle d'entraînement, les éditeurs construisent des couches de récupération dynamique pour maintenir les modèles à jour en temps réel sur des domaines critiques comme leurs propres API.

UELes développeurs et entreprises françaises intégrant des agents IA dans leurs produits bénéficient directement d'une réduction des erreurs d'intégration liées au knowledge cutoff des SDK.

💬 C'est un problème que je rencontre toutes les semaines en intégrant des SDK qui bougent vite. Google répond d'une façon élégante : plutôt que d'attendre le prochain cycle d'entraînement, ils injectent la doc à jour directement au moment de la génération, ce qui évite les erreurs bêtes sur des méthodes dépréciées depuis trois mois. Reste à voir si ça scale quand tous les éditeurs adoptent cette logique, mais c'est clairement la bonne direction.

OutilsOutil
1 source
Les agents Claude peuvent désormais se connecter aux API d'entreprise sans exposer leurs identifiants
3VentureBeat AI 

Les agents Claude peuvent désormais se connecter aux API d'entreprise sans exposer leurs identifiants

Anthropic vient d'annoncer deux nouvelles fonctionnalités pour Claude Managed Agents qui s'attaquent directement au principal frein à l'adoption des agents IA en entreprise : la sécurité des identifiants d'accès. La première, les sandboxes auto-hébergées, permet aux équipes d'exécuter les appels d'outils au sein de leur propre infrastructure, et est disponible dès maintenant en bêta publique. La seconde, les tunnels MCP, connecte les agents à des serveurs MCP privés sans que les identifiants ne transitent par le contexte de l'agent ; elle est pour l'instant en préversion de recherche. Cette architecture divise le système en deux parties distinctes : la boucle agentique (orchestration, gestion du contexte, récupération sur erreur) s'exécute sur l'infrastructure d'Anthropic, tandis que l'exécution des outils reste dans le périmètre de l'entreprise. Les tunnels MCP, eux, fonctionnent via une passerelle légère en sortie uniquement, installée dans le réseau de l'organisation, sans qu'aucun identifiant ne passe par l'agent. Ce changement architectural répond à un problème de fond dans les déploiements actuels : dans la plupart des systèmes en production, l'agent transporte lui-même les jetons d'authentification lors de l'exécution des appels d'outils. Un agent compromis ou mal configuré emporte donc avec lui tout ce dont il a besoin pour causer des dégâts sur les systèmes internes. En déplaçant le contrôle des identifiants vers la frontière réseau plutôt que de les laisser à l'intérieur de l'agent, Anthropic modifie substantiellement le modèle de menace. Pour les équipes d'orchestration, l'enjeu dépasse la sécurité : cette séparation permet de cartographier plus précisément les flux de travail des agents, de mieux contrôler les ressources de calcul et d'isoler les responsabilités entre la plateforme et l'infrastructure métier. Anthropic n'est pas seul sur ce terrain. OpenAI avait déjà ajouté l'exécution locale à son Agents SDK en avril 2025, en réponse à des demandes similaires de ses clients entreprise. La distinction que revendique Anthropic réside précisément dans cette séparation franche entre boucle agentique et exécution des outils, que les approches sandbox existantes, y compris celle d'OpenAI, ne font pas. Le protocole MCP, adopté rapidement en environnement de production, a en effet précédé la maturité des architectures de sécurité qui l'entourent, créant un écart que ces nouvelles fonctionnalités cherchent à combler. Pour les équipes qui évaluent la plateforme, la recommandation pratique est claire : commencer par migrer l'exécution des outils vers les sandboxes auto-hébergées et valider cette frontière avant d'explorer les tunnels MCP, encore en phase expérimentale.

UELes entreprises européennes déployant des agents Claude peuvent désormais conserver leurs identifiants d'accès dans leur propre périmètre réseau, facilitant la conformité GDPR lors des déploiements d'agents IA en production.

OutilsOpinion
1 source
4The Verge AI 

Les développeurs Fortnite peuvent désormais créer des personnages IA, mais pas les draguer

Epic Games a annoncé le lancement d'un nouvel outil appelé "conversations" pour les créateurs de contenu Fortnite, permettant d'intégrer des personnages non-joueurs (PNJ) propulsés par intelligence artificielle dans les îles personnalisées. Contrairement aux arbres de dialogue traditionnels, ces PNJ peuvent désormais interagir de manière spontanée avec les joueurs, en jouant par exemple le rôle d'un donneur de quêtes ou d'un narrateur. Les créateurs définissent la personnalité du personnage via des prompts simples, choisissent une voix, et le système gère ensuite les échanges en temps réel. Cette fonctionnalité marque une évolution significative dans la création de jeux au sein de l'écosystème Fortnite, en rendant accessible à tous les créateurs une technologie d'IA conversationnelle jusqu'ici réservée à des productions à gros budget. Elle pourrait transformer la profondeur narrative des expériences créées par la communauté, sans nécessiter de compétences en programmation avancées. Toutefois, Epic impose des règles strictes d'utilisation : les personnages ne peuvent pas être configurés pour entretenir des relations romantiques ou simuler une connexion émotionnelle avec les joueurs. Cette initiative intervient quelques mois après qu'Epic a intégré un Darth Vader alimenté par IA dans Fortnite, un personnage qui avait défrayé la chronique en prononçant des jurons avec une voix recréant celle de James Earl Jones. Le géant du jeu vidéo s'inscrit ainsi dans une tendance de fond où les grands studios cherchent à démocratiser l'IA générative pour les créateurs tiers, tout en établissant des garde-fous éthiques pour éviter les dérives, notamment auprès d'un public jeune.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour