Mistral OCR 4 apporte des sorties structurées prêtes à citer aux pipelines RAG, agents autonomes et recherche d'entreprise
Mistral AI a lancé le 24 juin 2026 OCR 4, la quatrième génération de son modèle de reconnaissance et de compréhension de documents. Contrairement à ses prédécesseurs qui se contentaient de convertir une page en texte brut, OCR 4 produit une représentation structurée de l'intégralité du document : chaque bloc de contenu est localisé par une boîte de délimitation précise, classifié par type (titre, tableau, équation, signature, etc.) et accompagné d'un score de confiance par mot et par page. Le modèle prend en charge 170 langues réparties en 10 groupes linguistiques, y compris les langues rares et peu dotées en ressources, et accepte les formats bureautiques courants comme PDF, DOC, PPT et OpenDocument. Il peut être déployé dans un seul conteneur pour les entreprises soumises à des contraintes de résidence des données ou de conformité réglementaire. La tarification est fixée à 4 dollars pour 1 000 pages, réduite à 2 dollars via l'API batch.
Cette sortie change la donne pour les pipelines d'ingestion documentaire en entreprise. En fournissant non seulement ce que dit un document, mais aussi où se trouve chaque élément et à quel degré de certitude, OCR 4 facilite la génération augmentée par récupération (RAG) avec citations vérifiables, les flux agentiques capables d'agir sur des factures ou des contrats, et les processus de vérification humaine ciblée sur les zones à faible confiance. Les benchmarks indépendants sont convaincants : sur plus de 600 documents et 12 langues, des annotateurs humains ont préféré OCR 4 à tous les systèmes concurrents testés, avec un taux de victoire moyen de 72 %. Sur OlmOCRBench, le modèle obtient 85,20 points ; sur OmniDocBench, 93,07. Deux clients illustrent l'impact opérationnel : Rogo a mesuré une précision équivalente aux meilleurs parseurs agentiques du marché, pour un coût huit fois inférieur et une latence dix-sept fois plus faible ; Anaqua a constaté un traitement environ quatre fois plus rapide par page que son fournisseur précédent.
OCR 4 s'inscrit dans une tendance de fond où les éditeurs de modèles cherchent à contrôler toute la chaîne de traitement documentaire, de l'ingestion brute jusqu'à la recherche sémantique. Mistral l'intègre dès aujourd'hui comme composant d'ingestion dans son Search Toolkit, un framework de recherche open source désormais en préversion publique, conçu pour alimenter des pipelines de récupération et d'évaluation avec des sorties structurées et prêtes pour la citation. La concurrence sur ce segment est vive : AWS Textract, Google Document AI et les parseurs agentiques spécialisés dominent l'espace entreprise depuis plusieurs années. Mistral parie que la combinaison prix-latence-multilingue, alliée à la possibilité de déploiement on-premise, lui ouvrira des marchés réglementés comme la finance, le droit et la santé, où les données ne peuvent pas quitter l'infrastructure interne.
Mistral AI étant une entreprise française, OCR 4 renforce la souveraineté numérique européenne en proposant un déploiement on-premise conforme au RGPD, ciblant directement les secteurs réglementés (finance, santé, droit) en France et en Europe.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




