
Associer Nova 2 Lite à Claude pour un traitement de documents à moindre coût
Amazon a publié un retour d'expérience détaillé sur une architecture combinant deux modèles d'IA pour numériser des annuaires scolaires numérisés à grande échelle. Le pipeline, développé sur Amazon Bedrock, associe Amazon Nova 2 Lite et Claude Sonnet 4.6 d'Anthropic dans deux étapes séquentielles distinctes. Testé sur 336 pages d'annuaires scannées, le système a produit 3 122 associations nom-visage, avec 93 % des correspondances atteignant un score de confiance supérieur ou égal à 0,95. La première étape confie à Nova 2 Lite l'extraction multimodale native : via un seul appel API, le modèle détecte les photos avec leurs coordonnées, extrait les noms visibles sur la page avec leurs positions approximatives, et remonte les métadonnées de la page. Claude Sonnet 4.6 intervient ensuite uniquement pour le raisonnement spatial, c'est-à-dire déterminer quel nom correspond à quel visage selon la mise en page. Ce découpage permet de limiter la sortie de Nova 2 Lite à environ 1 000 tokens par page, contre 4 500 tokens pour une passe OCR complète. Le coût total est réduit de deux tiers par rapport à un modèle unique chargé de l'intégralité de la tâche.
L'intérêt concret de cette architecture va au-delà de la numérisation d'annuaires. Elle illustre une stratégie de décomposition de tâches visuelles complexes en sous-problèmes spécialisés, permettant d'affecter à chaque étape le modèle le mieux adapté et le moins coûteux. Nova 2 Lite est configuré en mode de raisonnement LOW, le niveau minimal, sans perte mesurable de précision sur cette tâche d'extraction structurée. Claude, lui, absorbe la variabilité des mises en page sans nécessiter de prompt engineering spécifique à chaque format, grâce à ce qu'Amazon appelle son "adaptive thinking". La tarification fixe par image de Nova 2 Lite rend également le coût prévisible à grande échelle, ce qui est déterminant pour des workflows traitant des centaines de milliers de pages.
Cette publication s'inscrit dans la montée en puissance d'Amazon Bedrock comme plateforme d'orchestration multi-modèles, où différents modèles d'éditeurs tiers coexistent et peuvent être combinés. Amazon positionne Nova 2 Lite comme un modèle économique pour les tâches d'extraction à haut volume, tandis que Claude occupe le rôle de raisonneur pour les étapes à plus forte valeur ajoutée. Ce type d'architecture hybride reflète une tendance plus large dans l'industrie : plutôt que de chercher le modèle universel le plus puissant, les équipes d'ingénierie construisent des pipelines spécialisés où le coût et la précision sont optimisés étape par étape. La question des droits sur les archives numérisées, notamment pour des annuaires privés, reste un angle peu abordé mais potentiellement sensible à mesure que ces techniques se généralisent.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




