Aller au contenu principal
Le Standard d'Évaluation Ouverte : Évaluation de NVIDIA Nemotron 3 Nano avec NeMo Evaluator
RechercheHuggingFace Blog20sem

Le Standard d'Évaluation Ouverte : Évaluation de NVIDIA Nemotron 3 Nano avec NeMo Evaluator

Résumé IASource uniqueImpact UE
Source originale ↗·

Le Standard d'Évaluation Ouverte : Comparaison de NVIDIA Nemotron 3 Nano avec NeMo Evaluator

Ce texte présente l'utilisation du NeMo Evaluator pour tester les performances du NVIDIA Nemotron 3 Nano, un modèle de processeur AI, en se basant sur le Standard d'Évaluation Ouverte. Les résultats mettent en évidence des améliorations significatives en termes de vitesse et d'efficacité énergétique par rapport aux versions précédentes.

Impact France/UE

Le NeMo Evaluator a évalué le NVIDIA Nemotron 3 Nano, un processeur AI, selon le Standard d'Évaluation Ouverte, révélant des améliorations notables en vitesse et en efficacité énergétique, bénéfique pour les entreprises européennes comme NVIDIA, et aligné avec les objectifs de l'AI Act sur l'efficacité énergétique, tout en respectant le RGPD dans la gestion des données.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Au-delà de la similarité sémantique: Introduction du pipeline d'acquisition généralisable d'Agencer NVIDIA NeMo
1HuggingFace Blog 

Au-delà de la similarité sémantique: Introduction du pipeline d'acquisition généralisable d'Agencer NVIDIA NeMo

Le nouveau système NVIDIA NeMo Retriever offre une approche avancée de recherche d'informations, dépassant les méthodes basées sur la similarité sémantique. Il introduit un pipeline d'agir-recherche généralisable, optimisant la précision des résultats pour diverses tâches. Cette innovation améliore considérablement l'efficacité de recherche dans les grandes bases de données textuelles.

UEL'innovation d'NVIDIA NeMo Retriever, avec son pipeline d'acquisition généralisable, améliore significativement l'efficacité de recherche dans les grandes bases de données textuelles, potentiellement bénéficiant à des entreprises européennes comme SAP ou OVHcloud, qui gèrent et analysent de vastes quantités de données.

RechercheOutil
1 source
Évaluation de la surveillance de la chaîne de pensée
2OpenAI Blog 

Évaluation de la surveillance de la chaîne de pensée

OpenAI a introduit un nouveau cadre et un ensemble d'évaluations pour la monitorabilité de la chaîne de pensée, couvrant 13 évaluations sur 24 environnements. Ses résultats montrent que surveiller le raisonnement interne d'un modèle est bien plus efficace que de surveiller uniquement les sorties, ouvrant ainsi la voie à un contrôle à grande échelle des systèmes d'IA devenant plus capables.

RecherchePaper
1 source
3MarkTechPost 

Présentation de Mamba-3 : Un nouveau front d'état spatial avec des états deux fois plus petits et une efficacité accrue des circuits de décodage MIMO

Mamba-3, développé par des chercheurs de CMU, Princeton, Together AI et Cartesia AI, est un modèle innovant qui aborde les contraintes liées à l'efficacité inference dans les Grandes Modèles de Langage (LLM). Il s'appuie sur le cadre des Modèles d'État Espace (SSM) et introduit trois mises à jour méthodologiques clés : la discrétisation exponentielle-trapézoidale, les mises à jour d'état complexes-valeurs et une formulation Multi-Input Multi-Output (MIMO). Ces améliorations permettent à Mamba-3 de fonctionner efficacement avec une taille d'état réduite de moitié par rapport aux précédents modèles, tout en optimisant l'efficacité matérielle pour le décodage.

RecherchePaper
1 source
BEVal : étude d'évaluation comparative des modèles de segmentation BEV pour la conduite autonome
4arXiv cs.RO 

BEVal : étude d'évaluation comparative des modèles de segmentation BEV pour la conduite autonome

Une équipe de chercheurs a publié BEVal, une étude comparative sur les modèles de segmentation en vue aérienne (Bird's Eye View, ou BEV) appliqués à la conduite autonome. Contrairement aux travaux habituels, qui entraînent et évaluent les modèles sur un seul jeu de données, généralement nuScenes, les auteurs ont testé les performances de plusieurs modèles de l'état de l'art sur des combinaisons croisées de jeux de données : entraînement sur l'un, évaluation sur un autre. L'étude examine également l'influence du type de capteur utilisé, caméras ou LiDAR, sur la capacité des modèles à s'adapter à des environnements variés et à des catégories sémantiques différentes. Le code de l'étude est disponible en open source sur GitHub. Les résultats mettent en évidence un problème structurel dans la recherche actuelle : les modèles de segmentation BEV, très performants sur leurs données d'entraînement, chutent significativement lorsqu'ils sont confrontés à un nouvel environnement ou à une configuration de capteurs différente, un phénomène connu sous le nom de décalage de domaine. Pour les constructeurs automobiles et les entreprises de conduite autonome, cela signifie que des modèles optimisés en laboratoire peuvent se révéler peu fiables dans des conditions réelles variées. Les expériences d'entraînement sur plusieurs jeux de données menées en parallèle ont toutefois montré des améliorations notables des performances par rapport à l'entraînement sur un seul jeu, ouvrant la voie à des approches plus robustes. La segmentation BEV est une technologie clé pour la conduite autonome : elle permet aux véhicules de construire une représentation plane de leur environnement immédiat à partir de capteurs embarqués, facilitant la détection de routes, véhicules, piétons et obstacles. Le standard quasi universel de la recherche repose aujourd'hui sur nuScenes, un jeu de données développé par Motional, ce qui crée un biais de spécialisation problématique à l'échelle du secteur entier. En exposant cette fragilité et en proposant une méthodologie d'évaluation croisée rigoureuse, BEVal pousse la communauté scientifique vers des pratiques plus exigeantes, une condition indispensable avant tout déploiement massif de véhicules autonomes sur des routes réelles.

UELes constructeurs automobiles européens (Stellantis, Volkswagen, Renault) et les acteurs de la conduite autonome opérant en Europe sont concernés par cette fragilité structurelle des modèles BEV, qui remet en question la fiabilité des systèmes avant tout déploiement sur routes européennes aux conditions variées.

RecherchePaper
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour