Aller au contenu principal
Hermes permet aux agents IA de s'améliorer eux-mêmes, propulsés par les PC NVIDIA RTX et le DGX Spark
OutilsNVIDIA AI Blog6sem· 2 min de lecture

Hermes permet aux agents IA de s'améliorer eux-mêmes, propulsés par les PC NVIDIA RTX et le DGX Spark

Source originale ↗·

Hermes Agent, le nouveau framework d'agents IA développé par Nous Research, a franchi les 140 000 étoiles sur GitHub en moins de trois mois et s'est imposé la semaine dernière comme l'agent le plus utilisé au monde selon OpenRouter. Conçu pour fonctionner en local et en continu, il est optimisé pour tourner sur les GPU NVIDIA RTX, les stations de travail RTX PRO et les machines DGX Spark. Sa particularité principale est sa capacité d'auto-amélioration : à chaque tâche complexe ou retour utilisateur, Hermes enregistre ses apprentissages sous forme de compétences réutilisables, ce qui lui permet de s'améliorer au fil du temps sans intervention humaine. Il intègre également une architecture de sous-agents isolés, chacun dédié à une sous-tâche précise, ce qui réduit la confusion, minimise la taille des fenêtres de contexte nécessaires et rend le système plus fiable sur des modèles de 30 milliards de paramètres. Nous Research teste et valide chaque outil embarqué, ce qui distingue Hermes de la plupart des frameworks concurrents qui exigent un débogage constant. En parallèle, Alibaba a lancé la série Qwen 3.6, dont les modèles de 27 et 35 milliards de paramètres surpassent les versions précédentes de 120 et 400 milliards de paramètres, tout en nécessitant respectivement environ 20 Go de mémoire au lieu de 70 Go ou plus.

L'enjeu est considérable : pour la première fois, des agents IA capables de s'auto-améliorer, de planifier des tâches multi-étapes et d'agir de façon autonome en continu deviennent accessibles sur du matériel grand public ou de gamme professionnelle. Un développeur ou une PME peut désormais faire tourner un agent équivalent à ce qui nécessitait autrefois un datacenter, grâce à des GPU comme le RTX 5090 ou une machine compacte comme le DGX Spark, qui offre 128 Go de mémoire unifiée et 1 pétaflop de performance IA. Les Tensor Cores NVIDIA réduisent le temps d'inférence de minutes à secondes, rendant les workflows autonomes viables à l'échelle d'une journée de travail complète.

Cette convergence entre frameworks open source matures et modèles locaux ultra-compressés marque une rupture dans la démocratisation de l'IA agentique. Jusqu'ici, les agents performants dependaient de l'API d'OpenAI ou d'Anthropic, avec les coûts et les questions de confidentialité que cela implique. La montée en puissance de modèles open weight comme Qwen 3.6, combinée à des frameworks comme Hermes qui rivalisent avec les solutions propriétaires sur des benchmarks identiques, repositionne le matériel local comme infrastructure stratégique. NVIDIA profite directement de cette tendance en poussant le DGX Spark comme poste de travail dédié à l'IA agentique permanente, un segment encore embryonnaire mais en croissance rapide à mesure que les entreprises cherchent à internaliser leurs pipelines d'IA.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark
1NVIDIA AI Blog 

NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark

NVIDIA a profité du salon Computex Taipei, lors de sa conférence GTC dédiée, pour annoncer une nouvelle gamme de PC Windows baptisée RTX Spark, spécialement conçue pour faire tourner des agents d'intelligence artificielle en local. Ces machines embarquent 1 pétaflop de puissance de calcul IA et 128 Go de mémoire unifiée, ce qui leur permet de gérer des agents autonomes directement sur l'appareil, sans passer par le cloud. NVIDIA a également présenté la DGX Station pour Windows, un supercalculateur de bureau destiné aux professionnels, intégrant un GPU et un CPU de niveau datacenter dans un format compact. S'ajoutent à ces annonces : le runtime NVIDIA OpenShell pour Windows, le blueprint NemoClaw étendu à toute la gamme RTX et DGX, des gains de performance d'inférence multipliés par deux sur les modèles agentiques via la prédiction multi-token dans llama.cpp et vLLM, ainsi que des outils d'utilisation informatique développés par H Company pour les PC RTX et DGX. Des partenaires comme Adobe, Blender et ComfyUI intègrent également de nouvelles capacités graphiques propulsées par NVIDIA. L'ensemble de ces mises à jour est prévu pour l'automne 2025. Ces annonces marquent un tournant dans la démocratisation des agents IA personnels, jusqu'ici freinée par l'impossibilité de les exécuter de façon sécurisée et privée sur des machines grand public. Avec RTX Spark, NVIDIA veut transformer le PC de l'utilisateur en un véritable assistant autonome capable d'automatiser des tâches complexes, de raisonner sur des flux de travail multi-applications, de générer des contenus visuels et de rechercher sémantiquement dans des fichiers locaux, le tout sans envoyer de données sensibles vers des serveurs distants. Le runtime OpenShell, développé en partenariat avec Microsoft, introduit une couche de sécurité permettant à l'utilisateur de définir précisément ce que les agents peuvent ou ne peuvent pas faire, et de masquer les informations personnelles dans les requêtes envoyées vers des modèles cloud. Ce niveau de contrôle répond à une demande forte des utilisateurs professionnels et des développeurs qui hésitaient à déployer ces technologies faute de garanties suffisantes. L'engouement pour les agents IA en local s'est surtout manifesté jusqu'ici dans les communautés open source : des projets comme OpenClaw et Hermes Agent connaissent une adoption rapide sur GitHub, preuve d'un intérêt technique réel mais encore circonscrit aux initiés. NVIDIA s'appuie sur ce momentum pour structurer un écosystème plus large, en intégrant ces outils dans ses nouvelles primitives de sécurité Windows et en les distribuant via des installateurs simplifiés sur toute sa gamme de matériel. La collaboration avec Microsoft est centrale : les nouvelles primitives de sécurité Windows apportent identité, confinement et politique d'accès pour les agents natifs, tandis qu'NVIDIA comble les lacunes côté performance et confidentialité. Face à l'essor des solutions cloud d'OpenAI, Google ou Anthropic, NVIDIA joue clairement la carte de la souveraineté locale comme différenciateur, en pariant que la prochaine vague d'adoption des agents passera par des appareils personnels puissants et de confiance.

UEH Company, startup française spécialisée en agents IA, voit ses outils d'utilisation informatique intégrés nativement dans l'écosystème NVIDIA RTX et DGX, lui offrant une distribution mondiale sur du matériel grand public.

💬 NVIDIA joue la carte de la souveraineté locale contre le cloud, et c'est plus malin qu'il n'y paraît. OpenShell avec ses politiques d'accès par agent, c'est la réponse à la vraie question des pros : pas la performance, le contrôle. Et H Company en intégration native sur toute la gamme RTX, c'est le genre de deal qui change la trajectoire d'une startup.

InfrastructureOpinion
1 source
NVIDIA et ServiceNow s'associent pour développer des agents IA autonomes pour les entreprises
2NVIDIA AI Blog 

NVIDIA et ServiceNow s'associent pour développer des agents IA autonomes pour les entreprises

Lors de la conférence ServiceNow Knowledge 2026, Jensen Huang, fondateur et PDG de NVIDIA, est monté sur scène aux côtés de Bill McDermott, PDG de ServiceNow, pour annoncer l'extension de leur collaboration dans le domaine de l'intelligence artificielle en entreprise. Au coeur de cette annonce figure Project Arc, un agent autonome de bureau conçu pour fonctionner en continu et évoluer de façon autonome, destiné aux travailleurs du savoir comme les développeurs, les équipes IT et les administrateurs systèmes. Contrairement aux agents IA classiques, Project Arc s'intègre nativement à la plateforme ServiceNow via ServiceNow Action Fabric, et s'appuie sur OpenShell, un moteur d'exécution open source développé par NVIDIA permettant de déployer des agents dans des environnements sandbox gouvernés par des politiques de sécurité. L'agent peut accéder aux systèmes de fichiers locaux, aux terminaux et aux applications installées sur un poste de travail, et exécuter des tâches complexes en plusieurs étapes que l'automatisation traditionnelle ne peut pas prendre en charge. Ce partenariat marque un tournant dans la manière dont les grandes entreprises envisagent l'IA. Jusqu'ici cantonnée à la génération de texte ou au raisonnement assisté, l'intelligence artificielle passe désormais à l'action de façon autonome, durable et auditable. Pour les organisations, l'enjeu est considérable : déployer des agents capables d'agir sur de vraies infrastructures sans exposer des données sensibles ni contourner les règles de conformité. Project Arc répond à cette exigence en combinant l'AI Control Tower de ServiceNow, qui assure la gouvernance et la traçabilité de chaque action, avec le runtime sécurisé OpenShell de NVIDIA, qui définit précisément ce qu'un agent peut voir, quels outils il peut utiliser et comment chaque action est isolée du reste du système. L'annonce s'inscrit dans une tendance de fond : après des années d'investissements massifs dans les grands modèles de langage, les acteurs technologiques cherchent à concrétiser l'IA agentique dans des environnements professionnels réels. NVIDIA et ServiceNow misent sur un écosystème ouvert, fondé sur les modèles Nemotron de NVIDIA et des compétences spécialisées développées pour les ServiceNow AI Specialists, pour permettre aux entreprises d'adapter ces systèmes à leurs propres données et processus métier. Les deux sociétés co-développent également NOWAI-Bench, une suite de benchmarks ouverte pour évaluer les performances des agents IA en entreprise, intégrée à la bibliothèque NVIDIA NeMo Gym. L'environnement EnterpriseOps-Gym, l'un des plus exigeants du secteur, fait partie de cet effort pour établir des standards communs dans une course à l'agentique qui mobilise désormais tous les grands acteurs du cloud et de l'infrastructure.

UELes entreprises européennes pourraient déployer Project Arc en s'appuyant sur ses mécanismes de gouvernance et de traçabilité pour répondre aux exigences d'auditabilité imposées par l'AI Act.

OutilsOutil
1 source
Créer des agents d'automatisation de tableaux de bord propulsés par l'IA avec le NLP sur Amazon Bedrock AgentCore
3AWS ML Blog 

Créer des agents d'automatisation de tableaux de bord propulsés par l'IA avec le NLP sur Amazon Bedrock AgentCore

Amazon Web Services a dévoilé une solution d'automatisation de tableaux de bord basée sur l'intelligence artificielle, combinant trois de ses services : Amazon Bedrock AgentCore, le framework Strands Agents et Amazon QuickSight. L'architecture repose sur un système multi-agents composé de trois entités spécialisées : un agent de découverte (Find Dashboard Agent) chargé d'explorer les tableaux de bord et leurs métadonnées, un agent de modification (Modify Dashboard Agent) qui exécute les changements de configuration et crée de nouvelles versions, et un agent orchestrateur qui route les requêtes en langage naturel vers les agents appropriés. Concrètement, un analyste peut saisir une instruction comme "Ajoute le champ 'lastname' au tableau de bord testing" et le système interprète, valide et déploie la modification de façon autonome, tout en conservant une version originale pour permettre un retour arrière si nécessaire. L'enjeu est significatif pour les équipes métier : là où les processus traditionnels imposent plusieurs jours d'attente, soumission d'une demande à l'IT, interprétation des besoins, navigation dans la documentation d'API, déploiement, cette approche réduit le délai à quelques secondes. Le modèle de langage Amazon Nova assure la classification des requêtes entre interactions conversationnelles simples et opérations techniques réelles. Les modifications sont validées contre les colonnes disponibles dans les datasets avant exécution, ce qui maintient les contrôles de sécurité et génère des pistes d'audit. Pour les entreprises dont les décisions dépendent de données fraîches et de visualisations actualisées, supprimer ce goulot d'étranglement entre l'expression d'un besoin et sa concrétisation dans un dashboard représente un gain opérationnel direct. Cette solution s'inscrit dans la dynamique plus large d'AWS de rendre Amazon Bedrock AgentCore accessible comme plateforme d'hébergement d'agents en production, sans gestion d'infrastructure. La mémoire de session intégrée (AgentCore Memory) maintient le contexte des conversations, tandis que le module d'observabilité enregistre les décisions des agents et trace les appels API, deux composantes critiques pour déployer des agents autonomes dans des environnements d'entreprise régulés. Le framework Strands Agents, orienté code-first avec intégration native aux services AWS, positionne AWS face à des concurrents comme LangChain ou AutoGen sur le terrain des orchestrateurs d'agents. La prochaine étape logique pour ce type de système serait d'étendre la couverture au-delà de QuickSight vers d'autres services de données, voire de permettre aux agents de proposer eux-mêmes des modifications pertinentes en détectant des anomalies dans les métriques surveillées.

UELes équipes analytiques européennes utilisant des services de BI cloud pourraient réduire leurs délais de modification de tableaux de bord de plusieurs jours à quelques secondes, sans impact réglementaire direct sur la France ou l'UE.

OutilsOutil
1 source
Mindstone permet à ses agents IA d'entreprise de sélectionner automatiquement le bon modèle par tâche, via Rebel
4VentureBeat AI 

Mindstone permet à ses agents IA d'entreprise de sélectionner automatiquement le bon modèle par tâche, via Rebel

Mindstone, une startup londonnienne spécialisée dans la transformation par l'IA, a officiellement lancé cette semaine Rebel, un système d'exploitation agentique local qui ambitionne de simplifier radicalement l'orchestration d'agents IA en entreprise. Disponible sur macOS (Intel et Apple Silicon) et Windows, avec Linux en développement, Rebel adopte une licence "Fair Source" permettant aux équipes de moins de 100 utilisateurs de l'utiliser gratuitement, tandis que les organisations plus grandes devront souscrire à une licence entreprise. La société a levé 5 millions de dollars auprès d'investisseurs privés dont Pearson Ventures, Moonfire Ventures et Zanichelli Venture. Sa particularité principale réside dans une architecture locale reposant entièrement sur des fichiers markdown : toute la mémoire des agents, leurs instructions, leurs prompts et leur hiérarchie de tâches sont stockés en fichiers texte simples, contrairement aux frameworks concurrents comme LangGraph, CrewAI ou AutoGPT qui exigent des bases de données cloud et une infrastructure de gestion d'état complexe. Ce choix architectural n'est pas qu'une question de simplicité : il adresse des enjeux concrets de coût, de confidentialité et de souveraineté des données. En évitant les formats lourds comme Word ou PDF, dont les métadonnées consomment inutilement la fenêtre de contexte des modèles, Rebel optimise chaque appel API. Les entreprises gardent leurs instructions, automatisations et mémoire d'agent en local, échappant ainsi à l'enfermement propriétaire d'un éditeur SaaS. L'autre atout central est l'orchestration multi-modèles : Rebel découpe une tâche en sous-tâches et route chacune vers le modèle le plus adapté, en basculant dynamiquement entre modèles locaux et cloud selon la sensibilité des données traitées. Le système propose également des "Skills" (procédures multi-étapes réutilisables), des "Operators" (configurations comportementales pour un contexte donné, comme analyser un pitch deck du point de vue d'un investisseur) et des "Automations" (tâches planifiées en arrière-plan pour scanner des messages, préparer des réponses ou anticiper du travail avant qu'un employé n'ouvre l'application). La montée en puissance des plateformes d'orchestration d'agents reflète une évolution profonde dans la manière dont les entreprises déploient l'IA : on passe de chatbots isolés à des systèmes capables d'agir de façon autonome sur des emails, calendriers, documents et flux de travail internes. Dans cet écosystème en plein essor, Mindstone mise sur la mémoire partagée comme différenciateur stratégique. "La mémoire partagée est la chose la plus puissante que vous puissiez faire avec une IA dédiée aux travailleurs du savoir", affirme Greg Detre, directeur technique de l'entreprise, ajoutant que cela donne à une organisation "la sensation d'être un super-organisme qui devient de plus en plus intelligent". Face aux frameworks destinés aux développeurs, Rebel cible les équipes métier et opérationnelles, un segment encore largement sous-équipé malgré l'explosion de l'offre en IA agentique.

UEL'architecture locale de Rebel, stockant mémoire et données d'agents en fichiers texte sans cloud tiers, s'aligne avec les exigences RGPD, ce qui facilite son adoption par les entreprises européennes soucieuses de souveraineté des données.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic