Aller au contenu principal
BusinessAI News1sem

Comment l'économie de l'IA multi-agents influence l'automatisation des entreprises

1 source couvre ce sujet·Source originale ↗·
Résumé IA

NVIDIA a lancé Nemotron 3 Super, une architecture open source de 120 milliards de paramètres (12 milliards actifs) conçue pour les systèmes d'IA multi-agents en entreprise, offrant jusqu'à 5× plus de débit et 2× plus de précision que son prédécesseur. Le modèle combine des couches Mamba, des transformers classiques et une technique d'experts spécialisés pour réduire les deux principaux freins à l'automatisation : la « taxe de raisonnement » (coût élevé des agents autonomes) et l'explosion du contexte (jusqu'à +1 500 % de tokens par rapport aux formats standards). Avec une fenêtre de contexte d'un million de tokens, les agents peuvent charger un codebase entier ou des milliers de pages de rapports financiers en mémoire, éliminant la dérive d'objectif et accélérant l'inférence jusqu'à 4× par rapport aux configurations FP8 sur Hopper.

Managing the economics of multi-agent AI now dictates the financial viability of modern business automation workflows. Organisations progressing past standard chat interfaces into multi-agent applications face two primary constraints. The first issue is the thinking tax; complex autonomous agents need to reason at each stage, making the reliance on massive architectures for every subtask too expensive and slow for practical enterprise use. Context explosion acts as the second hurdle; these advanced workflows produce up to 1,500 percent more tokens than standard formats because every interaction demands the resending of full system histories, intermediate reasoning, and tool outputs. Across extended tasks, this token volume drives up expenses and causes goal drift, a scenario where agents diverge from their initial objectives. Evaluating architectures for multi-agent AI To address these governance and efficiency hurdles, hardware and software developers are releasing highly optimised tools aimed directly at enterprise infrastructure. NVIDIA recently introduced Nemotron 3 Super, an open architecture featuring 120 billion parameters (of which 12 billion remain active) that is specifically-engineered to execute complex agentic AI systems. Available immediately, NVIDIA’s framework blends advanced reasoning features to help autonomous agents finish tasks efficiently and accurately for improved business automation. The system relies on a hybrid mixture-of-experts architecture combining three major innovations to deliver up to five times higher throughput and twice the accuracy of the preceding Nemotron Super model. During inference, only 12 billion of the 120 billion parameters are active. Mamba layers provide four times the memory and compute efficiency, while standard transformer layers manage the complex reasoning requirements. A latent technique boosts accuracy by engaging four expert specialists for the cost of one during token generation. The system also anticipates multiple future words at the same time, accelerating inference speeds threefold. Operating on the Blackwell platform, the architecture utilises NVFP4 precision. This setup reduces memory needs and makes inference up to four times faster than FP8 configurations on Hopper systems, all without sacrificing accuracy. Translating automation capability into business outcomes The system offers a one-million-token context window, allowing agents to keep the entire workflow state in memory and directly addressing the risk of goal drift. A software development agent can load an entire codebase into context simultaneously, enabling end-to-end code generation and debugging without requiring document segmentation. Within financial analysis, the system can load thousands of pages of reports into memory, improving efficiency by removing the need to re-reason across lengthy conversations. High-accuracy tool calling ensures autonomous agents reliably navigate massive function libraries, preventing execution errors in high-stakes environments such as autonomous security orchestration within cybersecurity. Industry leaders – including Amdocs, Palantir, Cadence, Dassault Systèmes, and Siemens – are deploying and customising the model to automate workflows across telecom, cybersecurity, semiconductor design, and manufacturing. Software development platforms like CodeRabbit, Factory, and Greptile are integrating it alongside proprietary models to achieve higher accuracy at lower costs. Life sciences firms like Edison Scientific and Lila Sciences will use it to power agents for deep literature search, data science, and molecular understanding. The architecture also powers the AI-Q agent to the top position on DeepResearch Bench and DeepResearch Bench II leaderboards, highlighting its capacity for multistep research across large document sets while maintaining reasoning coherence. Finally, the model claimed the top spot on Artificial Analysis for efficiency and openness, featuring leading accuracy among models of its size. Implementation and infrastructure alignment Built to handle complex subtasks inside multi-agent systems, deployment flexibility remains a priority for leaders driving business automation. NVIDIA released the model with open weights under a permissive license, letting developers deploy and customise it across workstations, data centres, or cloud environments. It is packaged as an NVIDIA NIM microservice to aid this broad deployment from on-premises systems to the cloud. The architecture was trained on synthetic data generated by frontier reasoning models. NVIDIA published the complete methodology, encompassing over 10 trillion tokens of pre- and post-training datasets, 15 training environments for reinforcement learning, and evaluation recipes. Researchers can further fine-tune the model or build their own using the NeMo platform. Any exec planning a digitisation rollout must address context explosion and the thinking tax upfront to prevent goal drift

À lire aussi

1MIT Technology Review53min

Le commerce agentique repose sur la vérité et le contexte

L'intelligence artificielle agentique est en train de transformer le commerce numérique en profondeur. Là où les assistants numériques se contentaient jusqu'ici de proposer des options, les agents IA exécutent désormais des transactions complètes de façon autonome — réserver un voyage, comparer des offres, autoriser un paiement — sans intervention humaine. Ce changement déplace le goulot d'étranglement du commerce : les paiements s'effectuent déjà en quelques millisecondes, mais désormais c'est toute la chaîne en amont (découverte, comparaison, décision, autorisation) qui s'accélère. Le vrai défi n'est plus la vitesse, mais la confiance à l'échelle machine. Pour que ce modèle fonctionne sans dérailler, les entreprises doivent repenser leurs fondations de données. Un agent ne peut pas, comme un humain, déduire par le contexte que "Delta" désigne la compagnie aérienne et non le fabricant de robinetterie. Il a besoin de signaux déterministes. Des enregistrements clients dupliqués, des attributs produits incomplets ou des identités de marchands ambiguës — tolérables dans un flux humain — deviennent des sources d'erreurs critiques dès qu'un agent agit sans supervision. Les conséquences sont concrètes : mauvais produit livré, mauvais bénéficiaire payé, action contraire à l'intention de l'utilisateur malgré des permissions valides. La gestion des données maîtresses (MDM) — discipline consistant à établir un enregistrement unique et autoritatif pour chaque entité — devient alors la couche d'échange indispensable : elle définit qui représente l'agent, ce qu'il peut faire, et où se situe la responsabilité quand de la valeur est transférée. Plus on souhaite d'autonomie, plus l'investissement dans des données propres et une résolution d'entités fiable devient non négociable. Le commerce agentique introduit un troisième participant dans l'équation traditionnelle acheteurs/vendeurs : l'agent lui-même, qui doit être traité comme une entité à part entière avec ses propres permissions, limites et responsabilités. Ce paradigme s'inscrit dans une évolution plus large vers des marchés automatisés, qui fonctionnent déjà efficacement — à condition que l'identité, l'autorité et la responsabilité soient clairement établies dès le départ.

BusinessOpinion
1 source
2Blog du Modérateur1h

OpenAI abandonne son application Sora et perd un accord à un milliard de dollars

OpenAI a discrètement abandonné son application Sora, son générateur de vidéos par intelligence artificielle, seulement six mois après son lancement. Cette décision s'accompagne de la perte d'un accord commercial d'un milliard de dollars, sans qu'aucune explication officielle n'ait été communiquée par la société. Cette fermeture illustre les difficultés persistantes d'OpenAI à monétiser ses produits grand public au-delà de ChatGPT. Perdre un contrat d'une telle envergure soulève des questions sur la viabilité économique de ses outils créatifs, dans un marché de la génération vidéo pourtant en pleine effervescence. Sora avait été présenté comme une avancée majeure lors de son annonce en février 2024, capable de générer des vidéos réalistes à partir de simples descriptions textuelles. OpenAI fait face à une concurrence croissante dans ce segment, notamment de Runway, Kling et Google.

BusinessActu
1 source
3The Decoder1h

Disney se retire du partenariat avec OpenAI après l'arrêt de Sora quelques mois après son lancement

OpenAI met fin à son application Sora et à son API, quelques mois seulement après leur lancement. En conséquence, Disney se retire du partenariat milliardaire signé avec OpenAI en décembre dernier, abandonnant ainsi un accord conclu il y a moins de quatre mois. Ce revirement illustre la fragilité des partenariats noués autour de produits encore instables. Pour Disney, l'arrêt de Sora prive l'accord de sa raison d'être principale — l'entreprise avait probablement misé sur la génération vidéo pour ses productions créatives. La décision d'OpenAI de tuer le produit si rapidement soulève des questions sur la viabilité commerciale de Sora et sur la confiance que les grands groupes peuvent accorder à ses offres. Sora, l'outil de génération vidéo par IA d'OpenAI, avait été présenté comme une avancée majeure, mais n'a manifestement pas trouvé son marché en conditions réelles.

BusinessOpinion
1 source
4Le Big Data2h

Mirage lève 75 M$ auprès de General Catalyst pour booster son appli vidéo IA

Mirage, la startup américaine spécialisée dans la création vidéo par intelligence artificielle, a levé 75 millions de dollars auprès du Customer Value Fund de General Catalyst, portant son financement total à plus de 175 millions de dollars. Cet investissement est destiné au développement de nouveaux modèles pour Captions, son application phare de montage vidéo assisté par IA. La plateforme revendique aujourd'hui plus de 20 millions d'utilisateurs dans le monde — des créateurs de contenu individuels comme des équipes marketing de grandes entreprises telles que HubSpot, CoreWeave et King. En un an, l'application a été téléchargée 3,2 millions de fois et a généré 28,4 millions de dollars de revenus intégrés, avec plus de 200 millions de vidéos créées. Fait notable : seulement un quart des revenus provient des États-Unis, signe d'une audience résolument internationale. Ce financement marque une étape dans la transformation plus large de la startup, qui a changé de nom — passant de Captions à Mirage — pour affirmer son positionnement comme laboratoire d'IA à vocation industrielle. En janvier 2025, elle a adopté un modèle freemium pour concurrencer CapCut de ByteDance (plus d'un milliard de téléchargements, 323 millions d'utilisateurs actifs mensuels) et Edits de Meta. Elle développe désormais ce qu'elle appelle une « intelligence d'assemblage », capable de composer des vidéos à partir de sources multiples, ainsi qu'un modèle audio conçu pour mieux respecter les accents des locuteurs non anglophones — un besoin concret identifié auprès de ses utilisateurs internationaux. L'objectif affiché est de rapprocher sa suite marketing web et son application mobile Captions, pour permettre aux petites entreprises de produire des contenus vidéo à grande échelle, de manière automatisée. Ce tour de table s'inscrit dans un contexte d'investissement massif dans l'IA générative : en 2025, plus de la moitié des capitaux levés par le capital-risque mondial ont été orientés vers des startups IA, notamment dans des secteurs comme le marketing, où 71 % des directeurs prévoient d'augmenter significativement leurs dépenses en IA générative d'ici 2027 selon BCG. Mirage se positionne précisément à cette intersection entre création vidéo automatisée et besoins marketing des entreprises.

UEAvec 75 % des revenus générés hors États-Unis, l'application compte vraisemblablement une base d'utilisateurs européenne significative, mais aucune implication réglementaire ou institutionnelle directe pour la France ou l'UE n'est identifiée.

BusinessActu
1 source