Aller au contenu principal
Perceptron Mk1 présente un modèle d'analyse vidéo très performant, 80 à 90 % moins cher qu'Anthropic, OpenAI et Google
OutilsVentureBeat AI6sem· 2 min de lecture

Perceptron Mk1 présente un modèle d'analyse vidéo très performant, 80 à 90 % moins cher qu'Anthropic, OpenAI et Google

Source originale ↗·

La startup américaine Perceptron Inc. a lancé ce mois-ci son modèle d'analyse vidéo par intelligence artificielle, baptisé Mk1 (pour "Mark One"), à un prix qui bouleverse les standards du marché : 0,15 dollar par million de tokens en entrée et 1,50 dollar par million en sortie via son API. Ces tarifs représentent une réduction de 80 à 90 % par rapport aux principaux concurrents propriétaires, soit Claude Sonnet 4.5 d'Anthropic, GPT-5 d'OpenAI et Gemini 3.1 Pro de Google, ce dernier étant facturé autour de 3 dollars le million de tokens en coût combiné. Fondée il y a deux ans et pilotée par Armen Aghajanyan, ex-chercheur chez Meta FAIR et Microsoft, l'entreprise a consacré seize mois à développer une architecture multimodale conçue de zéro pour comprendre le monde physique. Sur les benchmarks de référence, Mk1 atteint 85,1 sur EmbSpatialBench, devançant le modèle Robotics-ER 1.5 de Google (78,4), et signe 72,4 sur RefSpatialBench contre seulement 9,0 pour GPT-5m et 2,2 pour Sonnet 4.5. Sur VSI-Bench, dédié au raisonnement temporel vidéo, Mk1 enregistre 88,5, le meilleur score parmi tous les modèles comparés.

Ce positionnement ouvre concrètement l'analyse vidéo avancée à des usages industriels à grande échelle, jusqu'ici freinés par les coûts. Des secteurs comme la sécurité physique, la production de contenu marketing, la recherche comportementale ou le contrôle qualité en fabrication peuvent désormais envisager un déploiement massif sans budget prohibitif. La capacité du modèle à traiter des flux vidéo natifs à 2 images par seconde sur une fenêtre de contexte de 32 000 tokens, tout en maintenant la continuité temporelle des objets entre les frames, représente un bond technique par rapport aux modèles de vision classiques qui traitent la vidéo comme une succession d'images fixes déconnectées.

L'analyse vidéo par IA reste aujourd'hui une niche technique dominée par quelques acteurs disposant de ressources considérables. Perceptron s'inscrit dans une tendance plus large où des startups spécialisées cherchent à attaquer des segments précis du marché des modèles fondamentaux, en ciblant ce que l'entreprise appelle la "frontière d'efficience", soit le rapport optimal entre performance et coût. Face à des géants comme Google, OpenAI et Anthropic qui développent des modèles généralistes onéreux, cette approche verticale centrée sur la compréhension du monde physique, incluant la causalité, la dynamique des objets et les lois de la physique, constitue un pari stratégique distinct. Une démo publique est disponible pour tester le modèle, et l'entreprise vise clairement les contrats enterprise à fort volume plutôt que la recherche exploratoire.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Google et Meta s'empressent de développer des agents IA personnels pendant qu'Anthropic et OpenAI creusent l'écart
1The Decoder 

Google et Meta s'empressent de développer des agents IA personnels pendant qu'Anthropic et OpenAI creusent l'écart

Google et Meta testent en interne de nouveaux agents d'IA personnels, baptisés respectivement "Remy" et "Hatch", conçus pour gérer des tâches quotidiennes de manière autonome. Ces projets sont une réponse directe à l'avance prise par Anthropic et OpenAI sur le marché des assistants intelligents. Pour concentrer ses ressources sur cette nouvelle priorité, Google a abandonné Mariner, son projet d'agent navigateur web, qui était pourtant en développement actif. Ce changement de cap illustre une transformation profonde dans la manière dont les géants technologiques conçoivent l'IA utilitaire. L'industrie délaisse les agents qui opèrent via un navigateur pour privilégier des assistants intégrés directement dans les outils du quotidien : messagerie, calendrier, plateformes d'achat. Pour les utilisateurs finaux, cela signifie des assistants capables d'agir dans leur environnement numérique réel, sans friction d'interface. Pour les entreprises, l'enjeu est de capturer un point d'entrée stratégique dans la vie numérique des utilisateurs. La course aux agents personnels s'intensifie dans un contexte où Anthropic, avec Claude, et OpenAI, avec ses offres GPT et Operator, ont pris une longueur d'avance sur l'expérience agentique. Google et Meta, malgré leurs ressources considérables, se retrouvent en position de rattrapage. Les prochains mois seront déterminants : les deux groupes devront décider s'ils misent sur leurs écosystèmes existants (Gmail, Google Agenda, WhatsApp, Instagram) pour différencier leurs agents, ou s'ils cherchent à concurrencer frontalement sur des cas d'usage génériques.

UELes agents personnels de Google et Meta s'appuieront sur des écosystèmes (Gmail, WhatsApp) massivement utilisés en Europe, soulevant des enjeux de conformité RGPD et de dépendance numérique pour les utilisateurs et entreprises européennes.

OutilsOutil
1 source
Luma ouvre l'API de son modèle image Uni-1.1 avec des tarifs et une qualité comparables à OpenAI et Google
2The Decoder 

Luma ouvre l'API de son modèle image Uni-1.1 avec des tarifs et une qualité comparables à OpenAI et Google

Luma AI ouvre l'accès à son modèle de génération d'images Uni-1.1 via une API publique, à partir de 0,04 dollar par image en résolution 2 048 pixels. Le modèle intègre nativement une recherche web, un module de raisonnement et la prise en charge de jusqu'à neuf images de référence pour guider la génération. Sur le classement Arena, référence indépendante d'évaluation des modèles, Uni-1.1 se positionne troisième, immédiatement derrière les offres de Google et d'OpenAI. Ce lancement positionne Luma comme un concurrent direct des deux géants du secteur, avec une tarification alignée sur leurs niveaux de prix tout en revendiquant une qualité comparable. Pour les développeurs et les entreprises, l'arrivée d'un troisième acteur crédible dans cette tranche de performance élargit les options et pourrait exercer une pression à la baisse sur les tarifs. La présence de fonctions comme le raisonnement intégré et la recherche web distingue Uni-1.1 des API d'images traditionnelles, qui se limitent généralement à la génération brute. Luma, connu pour son modèle vidéo Dream Machine lancé en 2024, diversifie ainsi son offre vers la génération d'images statiques de haute qualité. Le marché des API de génération visuelle s'est considérablement densifié ces derniers mois, avec des acteurs comme Stability AI, Ideogram ou Recraft qui cherchent tous à capter une part des budgets des équipes produit et créatives. La stratégie de Luma mise sur la combinaison qualité-prix et les fonctionnalités avancées pour s'imposer dans un espace de plus en plus encombré.

OutilsOutil
1 source
IA d’entreprise : Snowflake et Anthropic renforcent la gouvernance des modèles IA
3Le Big Data 

IA d’entreprise : Snowflake et Anthropic renforcent la gouvernance des modèles IA

Snowflake et Anthropic ont annoncé le 2 juin 2026, lors du Snowflake Summit 2026, un renforcement significatif de leur partenariat autour de l'IA d'entreprise. Concrètement, les modèles Claude d'Anthropic s'intègrent désormais plus profondément dans Snowflake Cortex AI, notamment pour alimenter Snowflake Cortex Code et Snowflake Intelligence. L'objectif est de permettre aux organisations de déployer des agents IA directement dans leur environnement de données existant, sans avoir à externaliser ou déplacer des données sensibles. Des entreprises comme Block, Indeed, Carvana, Notion ou eSentire utilisent déjà cette combinaison en production. Christian Kleinerman, EVP Product chez Snowflake, a indiqué que Snowflake Cortex Code serait devenu le produit à la croissance la plus rapide de toute l'histoire du groupe. L'enjeu central de ce partenariat est la gouvernance : les entreprises des secteurs réglementés, finance, santé, cybersécurité, retail, ne peuvent pas déployer l'IA sur des données critiques sans garanties fortes en matière de sécurité, de conformité et de traçabilité. En combinant la couche de gouvernance et de contrôle d'accès de Snowflake avec les capacités de raisonnement de Claude, les deux groupes proposent une architecture où le modèle devient une extension native de la plateforme data de l'entreprise plutôt qu'un outil externe. Cela change concrètement le profil de risque de l'IA générative pour les décideurs : Block automatise ainsi des workflows de conformité pour Square et Cash App, eSentire automatise des analyses SOC de niveau 1 pour libérer ses analystes humains des tâches répétitives, et Carvana optimise ses opérations logistiques et financières grâce à cette architecture. Ce renforcement s'inscrit dans la continuité d'un accord élargi signé fin 2025, qui avait déjà permis l'intégration native de Claude dans Cortex AI sur les principaux clouds. Le marché de l'IA d'entreprise est en train de basculer d'une phase d'expérimentation vers des déploiements opérationnels à grande échelle, et plusieurs acteurs, Microsoft avec Azure OpenAI, Google avec Vertex AI, AWS avec Bedrock, se livrent une concurrence intense pour capter cette demande. Snowflake, en tant que plateforme data indépendante du cloud, joue une carte différente : celle de la neutralité et de la gouvernance centralisée. Anthropic, de son côté, accélère sa distribution en entreprise via des partenariats stratégiques plutôt que par une offre cloud propriétaire. Les prochaines étapes du partenariat devraient porter sur l'extension de Claude Marketplace au sein de l'écosystème Snowflake, ouvrant la porte à un modèle de distribution plus large pour les modèles d'Anthropic dans les environnements data d'entreprise.

UELes entreprises européennes des secteurs réglementés (finance, santé, cybersécurité) disposent d'une architecture permettant de déployer Claude directement dans leur environnement de données existant, sans externaliser de données sensibles, un argument clé pour la conformité RGPD.

OutilsOpinion
1 source
Google Vids monte en puissance : les modèles IA les plus récents pour créer une vidéo en un clic
4Siècle Digital 

Google Vids monte en puissance : les modèles IA les plus récents pour créer une vidéo en un clic

Google a annoncé une mise à jour majeure de Google Vids, son outil de création vidéo intégré à Google Workspace, en déployant ses modèles d'intelligence artificielle les plus récents. La plateforme intègre désormais Veo 3.1, capable de générer des clips vidéo en 720p à partir d'une simple description textuelle. L'outil propose également la composition musicale automatique, la personnalisation d'avatars animés, la capture d'écran intégrée et une création de bout en bout à partir d'une idée initiale. Pour les entreprises et les équipes qui produisent du contenu régulièrement, cette mise à jour réduit considérablement le temps et les compétences techniques nécessaires à la production vidéo. Là où il fallait auparavant un outil de montage, des assets sonores et un opérateur formé, Google Vids promet de compresser ce workflow en quelques clics. La cible est clairement professionnelle : présentations internes, formations, communications corporate, ou contenus marketing légers, sans passer par une agence ou un logiciel spécialisé. Google positionne Vids comme le pendant vidéo de Google Slides dans l'écosystème Workspace, capitalisant sur sa base d'utilisateurs enterprise déjà captive. La montée en puissance de Veo, son modèle vidéo génératif, s'inscrit dans une compétition directe avec Sora d'OpenAI et Runway. En intégrant ces capacités directement dans Workspace plutôt qu'en produit autonome, Google mise sur l'effet d'adoption naturelle, là où ses concurrents doivent convaincre les utilisateurs de changer d'outil. La question reste de savoir si la qualité des rendus sera suffisante pour des usages professionnels exigeants.

UEGoogle Workspace étant massivement déployé dans les entreprises françaises et européennes, cette mise à jour impacte directement les équipes qui produisent du contenu vidéo dans cet écosystème.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic