Exécutez NVIDIA Nemotron 3 Super sur Amazon Bedrock
NVIDIA vient d'élargir sa famille de modèles ouverts sur Amazon Bedrock avec l'arrivée de Nemotron 3 Super, désormais disponible en mode entièrement géré et serverless. Ce modèle rejoint les Nemotron Nano déjà présents dans l'environnement Bedrock, offrant aux développeurs un accès immédiat à une IA de pointe sans gestion d'infrastructure.
L'intégration sur Amazon Bedrock marque une étape importante pour les entreprises souhaitant déployer des systèmes d'IA agentique complexes. En s'appuyant sur l'inférence managée d'AWS, les équipes peuvent se concentrer sur leurs cas d'usage métier — de la cybersécurité à la finance en passant par le retail — sans se soucier de l'orchestration des serveurs ni de la mise à l'échelle.
Sur le plan technique, Nemotron 3 Super repose sur une architecture hybride Mixture of Experts (MoE) Transformer-Mamba, avec 120 milliards de paramètres totaux dont seulement 12 milliards actifs à l'inférence. Le modèle affiche une efficacité jusqu'à 5x supérieure à la version précédente et une précision 2x plus élevée sur les tâches de raisonnement. Sa fenêtre de contexte atteint 256 000 tokens, et il supporte sept langues dont le français. Deux innovations architecturales clés le distinguent : le Latent MoE, qui mobilise 4x plus d'experts à coût d'inférence constant, et la prédiction multi-token (MTP), qui accélère la génération pour les longues chaînes de raisonnement. Les benchmarks cités incluent AIME 2025, SWE Bench et Terminal-Bench.
Avec des poids, jeux de données et recettes d'entraînement publiés en open source via NVIDIA NeMo, le modèle reste entièrement personnalisable sur infrastructure privée — un argument de poids pour les organisations soumises à des contraintes réglementaires strictes, notamment dans les secteurs financier et de la santé.
Le modèle inclut le français parmi ses sept langues supportées, ce qui peut intéresser les développeurs européens, mais l'impact direct sur la France/UE reste limité.
Dans nos dossiers
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




