
Perplexity lance "Search as Code" : les modèles d'IA peuvent désormais écrire leurs propres pipelines de recherche
Perplexity a dévoilé une nouvelle architecture baptisée "Search as Code" qui redéfinit la façon dont les modèles d'IA effectuent des recherches en ligne. Plutôt que de s'appuyer sur des API de recherche figées aux paramètres prédéfinis, le système permet aux agents IA de rédiger eux-mêmes leurs propres routines de recherche en Python, directement dans un environnement sandbox sécurisé. Le modèle gère en autonomie le filtrage des résultats et la déduplication des sources, sans passer par des interfaces rigides. Résultat annoncé: une réduction des coûts en tokens pouvant atteindre 85%, et des performances supérieures à celles d'OpenAI et d'Anthropic sur plusieurs benchmarks de référence.
L'enjeu est considérable pour les entreprises qui intègrent la recherche web dans leurs pipelines d'IA. Jusqu'ici, les agents devaient s'adapter aux contraintes imposées par des APIs standardisées, souvent peu optimisées pour des requêtes complexes ou itératives. En donnant au modèle la main sur sa propre logique de recherche, Perplexity promet des réponses plus précises, moins de redondances et une facture computationnelle drastiquement réduite, ce qui ouvre la voie à des déploiements à grande échelle.
Cette annonce s'inscrit dans une course effrénée entre Perplexity, OpenAI et Anthropic autour du "web search" intégré aux LLMs, un marché stratégique depuis que les moteurs de recherche traditionnels voient leur modèle menacé par les assistants IA. Perplexity, valorisé à plusieurs milliards de dollars, mise sur l'innovation architecturale pour se distinguer face à des concurrents disposant de ressources bien supérieures.
Les développeurs et entreprises européens intégrant la recherche web dans leurs pipelines d'IA pourraient bénéficier d'une réduction significative des coûts computationnels grâce à cette nouvelle architecture.
85% de réduction sur les tokens, c'est le genre de chiffre qui fait lever les yeux au ciel, et pourtant le concept tient la route. Laisser le modèle écrire lui-même sa routine de recherche plutôt que de le contraindre dans une API figée, c'est une idée simple qui résout un vrai problème. Reste à voir ce que ça donne sur des cas limites en prod, parce que les benchmarks contre Anthropic et OpenAI, c'est toujours un peu l'arroseur arrosé.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.


