Perceptron Mk1 présente un modèle d'analyse vidéo très performant, 80 à 90 % moins cher qu'Anthropic, OpenAI et Google
La startup américaine Perceptron Inc. a lancé ce mois-ci son modèle d'analyse vidéo par intelligence artificielle, baptisé Mk1 (pour "Mark One"), à un prix qui bouleverse les standards du marché : 0,15 dollar par million de tokens en entrée et 1,50 dollar par million en sortie via son API. Ces tarifs représentent une réduction de 80 à 90 % par rapport aux principaux concurrents propriétaires, soit Claude Sonnet 4.5 d'Anthropic, GPT-5 d'OpenAI et Gemini 3.1 Pro de Google, ce dernier étant facturé autour de 3 dollars le million de tokens en coût combiné. Fondée il y a deux ans et pilotée par Armen Aghajanyan, ex-chercheur chez Meta FAIR et Microsoft, l'entreprise a consacré seize mois à développer une architecture multimodale conçue de zéro pour comprendre le monde physique. Sur les benchmarks de référence, Mk1 atteint 85,1 sur EmbSpatialBench, devançant le modèle Robotics-ER 1.5 de Google (78,4), et signe 72,4 sur RefSpatialBench contre seulement 9,0 pour GPT-5m et 2,2 pour Sonnet 4.5. Sur VSI-Bench, dédié au raisonnement temporel vidéo, Mk1 enregistre 88,5, le meilleur score parmi tous les modèles comparés.
Ce positionnement ouvre concrètement l'analyse vidéo avancée à des usages industriels à grande échelle, jusqu'ici freinés par les coûts. Des secteurs comme la sécurité physique, la production de contenu marketing, la recherche comportementale ou le contrôle qualité en fabrication peuvent désormais envisager un déploiement massif sans budget prohibitif. La capacité du modèle à traiter des flux vidéo natifs à 2 images par seconde sur une fenêtre de contexte de 32 000 tokens, tout en maintenant la continuité temporelle des objets entre les frames, représente un bond technique par rapport aux modèles de vision classiques qui traitent la vidéo comme une succession d'images fixes déconnectées.
L'analyse vidéo par IA reste aujourd'hui une niche technique dominée par quelques acteurs disposant de ressources considérables. Perceptron s'inscrit dans une tendance plus large où des startups spécialisées cherchent à attaquer des segments précis du marché des modèles fondamentaux, en ciblant ce que l'entreprise appelle la "frontière d'efficience", soit le rapport optimal entre performance et coût. Face à des géants comme Google, OpenAI et Anthropic qui développent des modèles généralistes onéreux, cette approche verticale centrée sur la compréhension du monde physique, incluant la causalité, la dynamique des objets et les lois de la physique, constitue un pari stratégique distinct. Une démo publique est disponible pour tester le modèle, et l'entreprise vise clairement les contrats enterprise à fort volume plutôt que la recherche exploratoire.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.



