Aller au contenu principal

Dossier Agents IA — page 12

1550 articles · page 12 sur 31

Les agents IA : déploiements en production, écart pilote/prod, débat sur la confiance, agent debt et négociations automatisées.

Les agents autonomes face au défi entre intention et exécution
551Amazon Science RecherchePaper

Les agents autonomes face au défi entre intention et exécution

Des chercheurs en intelligence artificielle ont publié une étude approfondie sur ce qu'ils nomment l'« écart entre intention et exécution » dans les systèmes d'agents IA, le fossé entre ce qu'un modèle de langage entend faire et ce que le logiciel qui l'entoure réalise concrètement. Pour l'illustrer : un modèle peut vouloir corriger une seule instance d'une fonction dans du code, mais le harnais, le logiciel qui orchestre ses actions et gère ses interactions avec les outils, en modifie involontairement plusieurs. Pour combler cet écart sans aucun ajustement spécifique à une tâche, les chercheurs ont développé Simple Strands Agent (SSA), un harnais léger et personnalisable à agent unique. Testé sur plusieurs benchmarks de référence, dont SWE-Pro, SWE-Verified (qui évaluent la correction automatique de dépôts de code réels) et Terminal-Bench2 (environnements de terminal interactifs), SSA obtient des gains de performance constants sur plusieurs familles de modèles. Ce travail pointe un problème structurel souvent ignoré dans l'évaluation des agents IA : les performances publiées sur les benchmarks reflètent autant la qualité de l'infrastructure d'évaluation que la capacité intrinsèque du modèle. Des facteurs apparemment triviaux, délais d'expiration lors des interactions avec l'environnement, stabilité de l'infrastructure, contraintes de ressources, provoquent des variations de performance significatives. Les auteurs baptisent ce phénomène le « benchmaxing » : la tendance à optimiser les scores publiés sans nécessairement améliorer la capacité réelle du système. Pour les équipes qui déploient des agents en production, cela signifie qu'un gain impressionnant sur un benchmark peut disparaître entièrement dans un contexte légèrement différent, rendant les comparaisons entre systèmes peu fiables. L'étude s'inscrit dans un débat plus large sur la conception des agents IA. Pendant des années, la priorité a été donnée aux optimisations spécifiques : prompts ajustés, outils sur mesure, graphes d'exécution spécialisés. Or les chercheurs montrent que ces gains sont souvent fragiles, ce qui fonctionne pour un modèle ou une version donnée se dégrade ou régresse avec les modèles suivants, car ces optimisations surajustent implicitement le comportement d'un modèle particulier. La conclusion est qu'il faut désormais identifier des principes de conception invariants, valables quel que soit le modèle sous-jacent. L'interface entre modèle et harnais devient ainsi un domaine de recherche central, à l'image du rôle d'un système d'exploitation vis-à-vis d'un processeur. Les auteurs soulignent également que cette conception n'est pas entièrement agnostique au modèle : différentes familles de modèles ont des préférences distinctes en matière d'utilisation des outils et d'interprétation du contexte, faisant de la coconception modèle-harnais un levier décisif pour atteindre des performances optimales.

1 source
Satya Nadella fustige le plan d'un vice-président visant à rendre l'agent IA de Microsoft délibérément addictif
552The Decoder 

Satya Nadella fustige le plan d'un vice-président visant à rendre l'agent IA de Microsoft délibérément addictif

Satya Nadella, PDG de Microsoft, a vivement recadré en interne un vice-président de l'entreprise après la fuite d'un mémo proposant de rendre les utilisateurs "accros" à Scout, le nouvel agent IA de Microsoft. Dans un message envoyé à une cinquantaine d'ingénieurs seniors, Nadella a réagi publiquement à cette note interne en écrivant : "Je ne sais pas qui écrit et fait fuiter ces idioties." La sortie est rare pour un dirigeant de son rang, signe que le sujet a touché une corde sensible au plus haut niveau de l'entreprise. La prise de position de Nadella est significative car elle tranche avec une tendance bien ancrée dans l'industrie technologique, où l'engagement maximal des utilisateurs a longtemps été un objectif explicite de conception. En affirmant que Scout devrait au contraire conduire à moins de temps passé sur écran, le PDG de Microsoft adopte une posture radicalement différente de celle qui a présidé au développement des réseaux sociaux et de nombreuses applications mobiles. Pour les utilisateurs professionnels visés par Scout, cela suggère un outil conçu pour l'efficacité plutôt que pour la dépendance. Microsoft déploie Scout dans un contexte de concurrence acharnée avec Google, OpenAI et d'autres acteurs sur le marché des agents IA. La fuite de ce mémo interne révèle les tensions qui peuvent exister au sein même des grandes entreprises tech sur la direction éthique à donner à ces nouveaux outils. La réaction publique de Nadella envoie un signal clair sur la culture qu'il entend imposer, à un moment où la régulation de l'IA et les questions d'éthique numérique sont au cœur des débats législatifs en Europe et aux États-Unis.

UELa prise de position de Nadella contre la conception addictive des agents IA pourrait servir de référence dans les débats européens sur la régulation de l'IA, notamment autour des obligations de conception responsable imposées par l'AI Act.

💬 Nadella qui tance publiquement un VP pour avoir proposé de rendre Scout addictif, c'est rare. Ce que je trouve presque plus intéressant que le recadrage lui-même, c'est que le mémo a existé : ça montre que le réflexe "maximise l'engagement" est encore bien vivant dans les équipes, même chez Microsoft. Bon, un message à 50 ingénieurs ça ne change pas une culture, mais ça plante un drapeau.

ÉthiqueOpinion
1 source
Nous Research publie Hermes Desktop : une interface native multiplateforme pour Hermes Agent v0.15.2 avec sortie en streaming
553MarkTechPost 

Nous Research publie Hermes Desktop : une interface native multiplateforme pour Hermes Agent v0.15.2 avec sortie en streaming

Nous Research a lancé en prévisualisation publique Hermes Desktop, une application native disponible sur macOS, Windows et Linux, qui offre pour la première fois une interface graphique à son agent IA open source Hermes. Jusqu'ici limité à une interface en ligne de commande et à des passerelles de messagerie, Hermes Agent v0.15.2 dispose désormais d'une fenêtre native avec affichage en streaming des réponses, prévisualisation en temps réel des pages web, fichiers et sorties d'outils, un navigateur de fichiers, ainsi que des entrées et sorties vocales. L'application partage entièrement son cœur avec le CLI existant : configuration, clés API, sessions, compétences et mémoire sont communs à toutes les surfaces. Une conversation démarrée dans le bureau peut reprendre dans le terminal, et inversement, sans duplication d'état. Hermes Desktop a été démontré pour la première fois lors du keynote GTC de Jensen Huang avant d'être rendu disponible le 2 juin 2026. Ce lancement marque une étape importante dans l'accessibilité des agents IA autonomes pour le grand public. Hermes n'est pas un simple assistant de chat : c'est un agent qui planifie, exécute des actions et maintient un état persistant entre les sessions. La boucle d'apprentissage fermée le distingue des outils classiques : après une tâche complexe, l'agent génère des compétences réutilisables qui s'améliorent d'elles-mêmes lors des usages ultérieurs. La mémoire est gérée par l'agent lui-même, avec rappel inter-sessions via recherche FTS5 et résumé par LLM. En supprimant le prérequis du terminal, Nous Research ouvre Hermes à une population bien plus large d'utilisateurs non techniques, ce qui pourrait accélérer l'adoption des agents IA dans des flux de travail professionnels quotidiens. Nous Research s'inscrit dans une compétition croissante autour des agents IA autonomes et multiplateformes, face à des acteurs comme Anthropic avec Claude Code ou OpenAI avec ses capacités agentiques. Hermes se connecte à Telegram, Discord, Slack, WhatsApp, Signal, Email et CLI depuis une seule passerelle, avec un planificateur cron intégré et une délégation à des sous-agents isolés. L'exécution est sandboxée via cinq backends : local, Docker, SSH, Singularity et Modal. L'interopérabilité avec le Model Context Protocol (MCP) permet d'intégrer des outils externes. Pour les API, Nous Portal propose quatre niveaux d'abonnement (Free, Plus, Super, Ultra) donnant accès à plus de 300 modèles et à un Tool Gateway unifié qui route la recherche web via Firecrawl, la génération d'images via FAL et la synthèse vocale via OpenAI. Les prochaines questions porteront sur la stabilité hors prévisualisation et sur la capacité de la startup à tenir face aux ressources des géants du secteur.

OutilsOutil
1 source
Solara : Microsoft lance son propre système d’exploitation pour l’IA
554Le Big Data 

Solara : Microsoft lance son propre système d’exploitation pour l’IA

Le 2 juin 2026, lors de sa conférence Build, Microsoft a dévoilé Solara, une nouvelle plateforme logicielle conçue spécifiquement pour alimenter une catégorie émergente d'appareils centrés sur l'intelligence artificielle. Contrairement à ce que l'on pourrait attendre du géant de Redmond, Solara ne repose pas sur Windows mais sur Android, choix délibéré pour s'adapter aux contraintes matérielles des appareils compacts et peu énergivores. Pour illustrer le concept, Microsoft a présenté deux prototypes : un écran connecté comparable à un Amazon Echo Show, équipé de reconnaissance faciale pour accéder à différents agents IA, et un badge portable intégrant caméra, lecteur d'empreintes et transcription en temps réel, activable d'une simple pression pour donner à l'agent la capacité de voir, d'entendre et de comprendre l'utilisateur. Ces deux dispositifs ne seront pas commercialisés directement par Microsoft, mais serviront de modèles de référence pour les fabricants tiers. L'enjeu de Solara dépasse la simple annonce produit : Microsoft tente de définir les règles d'une nouvelle catégorie d'appareils, celle des gadgets IA autonomes, dont l'industrie technologique parle depuis des années sans avoir trouvé de formule viable. En positionnant Solara comme une plateforme pensée "dès le départ" pour des agents intelligents, l'entreprise cherche à répliquer ce que Google a accompli avec Android dans le mobile : imposer un socle commun que les fabricants adoptent massivement. Des partenaires comme AccuWeather, Best Buy, CVS Healthcare et Target participent déjà à des programmes pilotes, ce qui suggère un intérêt réel du côté des entreprises prêtes à intégrer ces interfaces dans leurs environnements professionnels et commerciaux. Le choix d'Android révèle une inflexion culturelle significative chez Microsoft, qui reconnaît implicitement que Windows n'est plus la réponse universelle à tous les usages. Depuis l'explosion des grands modèles de langage en 2022-2023, l'industrie cherche le facteur de forme idéal pour les agents IA : ni smartphone, ni ordinateur classique, mais un objet intermédiaire, permanent et contextuel. Microsoft, qui a massivement investi dans OpenAI et intégré Copilot dans l'ensemble de sa suite logicielle, cherche maintenant à étendre son influence jusqu'à la couche matérielle. Solara reste toutefois à un stade précoce de développement, et le succès du projet dépendra de la capacité des fabricants partenaires à produire des appareils convaincants, accessibles et suffisamment utiles pour justifier une adoption à grande échelle.

UESi Solara s'impose comme standard de référence, les fabricants d'appareils européens pourraient être amenés à l'adopter, mais aucun partenaire ni enjeu réglementaire européen n'est mentionné à ce stade.

OutilsOpinion
1 source
Liquid AI publie LFM2.5-8B-A1B : un modèle MoE embarqué de 8,3 milliards de paramètres dont 1,5 milliard actifs
555MarkTechPost 

Liquid AI publie LFM2.5-8B-A1B : un modèle MoE embarqué de 8,3 milliards de paramètres dont 1,5 milliard actifs

Liquid AI a lancé LFM2.5-8B-A1B, un modèle de langage de type Mixture-of-Experts (MoE) conçu pour fonctionner directement sur des appareils grand public. Le modèle embarque 8,3 milliards de paramètres au total, mais n'en active que 1,5 milliard par token généré, ce qui réduit considérablement la charge de calcul à chaque inférence. Son architecture hybride combine 24 couches : 18 blocs de convolution LIV à double porte et 6 couches GQA. La fenêtre de contexte atteint 131 072 tokens, soit quatre fois plus que son prédécesseur LFM2-8B-A1B (32 768 tokens). Le modèle couvre neuf langues dont l'arabe, le chinois et le japonais. Par rapport à la version précédente, le volume de pré-entraînement est passé de 12 000 à 38 000 milliards de tokens, et le vocabulaire a doublé de 65 536 à 128 000 entrées, améliorant la tokenisation des scripts non-latins comme le hindi, le thaï ou l'arabe. LFM2.5-8B-A1B est également un modèle raisonnant : il produit une chaîne de pensée explicite avant chaque réponse. Les gains sur les benchmarks sont substantiels : le taux de non-hallucination AA-Omniscience bondit de 7,46 à 63,47, le score IFEval passe de 79,44 à 91,84, et MATH500 grimpe de 74,80 à 88,76. Ce modèle ouvre concrètement la voie à des agents IA autonomes capables de tourner sans cloud, directement sur un téléphone, un laptop ou une puce dédiée. Sur un CPU Apple M5 Max, il atteint 253 tokens par seconde en restant sous 6 Go de mémoire ; sur smartphone, le débit tient autour de 30 tokens par seconde. Sur un seul GPU NVIDIA H100, le débit monte à 18 500 tokens par seconde. Pour les développeurs, le modèle est compatible dès le premier jour avec llama.cpp, MLX, vLLM, SGLang et ONNX, ainsi qu'avec la plateforme edge LEAP de Liquid AI. Cette accessibilité technique signifie que des applications d'entreprise ou grand public peuvent intégrer un raisonnement structuré et une exécution d'outils sans dépendre d'une infrastructure cloud coûteuse, ce qui réduit la latence, les coûts et les risques de confidentialité. Liquid AI est une startup fondée par des chercheurs du MIT, connue pour ses architectures alternatives aux transformers classiques. LFM2.5 s'inscrit dans une série de modèles hybrides pensés pour l'inférence en périphérie du réseau (edge). Pour réduire les hallucinations, l'équipe a introduit deux étapes de reinforcement learning : une pour éliminer les boucles de raisonnement infinies via une pénalisation des mots déclencheurs comme "Wait…", une autre basée sur une récompense avg@k pour entraîner le modèle à s'abstenir plutôt qu'à inventer. Dans un secteur où Gemma de Google ou les modèles Qwen d'Alibaba dominent la course aux petits modèles performants, Liquid AI positionne LFM2.5-8B-A1B comme une alternative architecturalement différente, capable de rivaliser avec des modèles bien plus lourds sur les tâches agentiques et l'instruction following.

LLMsActu
1 source
Cognition, créateur de l'agent de code Devin, plus que double sa valorisation à 26 milliards de dollars en moins de neuf mois
556The Decoder 

Cognition, créateur de l'agent de code Devin, plus que double sa valorisation à 26 milliards de dollars en moins de neuf mois

Cognition, la startup américaine à l'origine de Devin, l'agent de développement logiciel piloté par intelligence artificielle, a finalisé une levée de fonds dépassant le milliard de dollars, portant sa valorisation à plus de 26 milliards de dollars. Cette opération, bouclée en moins de neuf mois après un précédent tour de table, plus que double la valorisation de l'entreprise et s'impose comme l'une des plus importantes jamais réalisées dans le secteur des agents IA spécialisés dans le code. Devin avait été présenté en mars 2024 comme le premier "ingénieur logiciel autonome" capable de planifier, coder, tester et déployer des applications sans intervention humaine. Ce financement illustre l'appétit spectaculaire des investisseurs pour les outils capables d'automatiser le développement logiciel, un marché estimé à plusieurs centaines de milliards de dollars. Pour les entreprises tech, l'enjeu est concret : réduire les coûts de développement, accélérer les cycles de production et potentiellement redéfinir le rôle des ingénieurs humains. Pourtant, la valeur opérationnelle réelle de Devin reste vivement discutée dans la communauté des développeurs, certains benchmarks indépendants ayant remis en question ses performances annoncées. Cognition évolue dans un secteur de plus en plus disputé, face à GitHub Copilot d'OpenAI et Microsoft, Cursor, ou encore des agents comme Claude Code d'Anthropic. La course aux agents de codage s'intensifie alors que les grands modèles de langage atteignent un niveau de compétence technique suffisant pour traiter des tâches de programmation complexes. Cette méga-levée signale que, malgré les débats sur les performances actuelles, les investisseurs parient sur un basculement prochain vers une automatisation large du génie logiciel.

BusinessActu
1 source
Fujitsu intègre OpenAI à sa stratégie IA pour les entreprises japonaises
557Le Big Data 

Fujitsu intègre OpenAI à sa stratégie IA pour les entreprises japonaises

Le 27 mai 2026, Fujitsu a officialisé un partenariat stratégique avec OpenAI pour intégrer ChatGPT Enterprise et Codex à ses services destinés aux entreprises japonaises. Le géant technologique, qui compte parmi les plus grands groupes IT du pays, prévoit de déployer ces outils aussi bien en interne que dans ses offres clients. Les équipes de développement logiciel, de gestion de projets, d'opérations et de livraison de services seront les premières concernées. Fujitsu cible en priorité trois secteurs : l'industrie manufacturière, la santé et la pharmacie, des domaines soumis à une pression croissante sur l'efficacité opérationnelle et l'automatisation des processus. Ce partenariat répond à une question devenue centrale pour les grandes entreprises : comment faire de l'IA une véritable infrastructure métier plutôt qu'une vitrine technologique ? Pour y répondre, Fujitsu s'appuie sur son modèle FDE (Forward Deployed Engineer), une méthode de travail qui associe étroitement experts sectoriels, ingénieurs et clients pour identifier rapidement des cas d'usage exploitables. En combinant cette approche terrain avec les modèles d'OpenAI, le groupe vise à réduire le fossé persistant entre démonstrations technologiques et création réelle de valeur. L'objectif affiché est de construire un modèle de collaboration entre employés et agents IA capable de standardiser des tâches complexes et d'accélérer les cycles de décision. La cybersécurité constitue un second axe prioritaire : face à la multiplication des menaces et à la complexité des infrastructures critiques, Fujitsu entend développer des dispositifs de cyberdéfense hybrides où humains et IA travaillent conjointement pour améliorer la détection et la vitesse de réponse aux incidents. Ce rapprochement s'inscrit dans un contexte japonais particulier : le vieillissement démographique accéléré et la pénurie structurelle de talents techniques font de l'automatisation intelligente un enjeu économique de premier ordre pour les industriels du pays. Fujitsu dispose d'une implantation historique profonde dans le tissu industriel japonais, ce qui lui confère un avantage réel pour déployer des solutions à grande échelle. Du côté d'OpenAI, ce partenariat confirme une stratégie d'expansion agressive vers les marchés enterprise en Asie, après des accords similaires avec des acteurs majeurs en Europe et aux États-Unis. L'alliance illustre aussi une tendance de fond : les éditeurs d'IA générative ne cherchent plus à vendre des modèles bruts, mais à s'ancrer dans des écosystèmes sectoriels via des partenaires locaux disposant de la légitimité et de la connaissance métier que les modèles seuls ne peuvent pas apporter.

💬 Le contexte japonais, ça change la lecture. Pénurie structurelle de talents, démographie qui s'effondre : les industriels là-bas n'ont pas cinq ans devant eux pour tâtonner avec l'IA. Ce qui m'intéresse dans ce deal, c'est le modèle FDE, cette méthode d'embarquer des ingénieurs directement chez les clients pour trouver les cas d'usage qui tiennent en prod, pas ceux qui brillent en démo.

BusinessOpinion
1 source
GPT-5.6 : On connaît sa date de sortie, le compte à rebours est lancé
558Le Big Data 

GPT-5.6 : On connaît sa date de sortie, le compte à rebours est lancé

OpenAI s'apprête à lancer GPT-5.6 en juin 2026, selon un faisceau de fuites convergentes. Des noms de code internes, iris-alpha, ember-alpha et beacon-alpha, ont été repérés dans les systèmes de l'entreprise, suggérant que plusieurs variantes du modèle sont testées en parallèle. Plus révélateur encore : à peine trois semaines après le déploiement de GPT-5.5, une entrée dans le système de routage de Codex faisait fugitivement référence à GPT-5.6 avant de disparaître, un comportement identique à celui observé avant l'arrivée de GPT-5.5. Des chercheurs d'OpenAI auraient par ailleurs confié utiliser en interne, au quotidien, le modèle qui a récemment résolu un problème mathématique vieux de 80 ans, notamment pour le débogage et des tâches techniques avancées. Sur la plateforme de prédiction Polymarket, la probabilité d'une sortie publique avant le 30 juin est estimée à 89 %. Le modèle serait décliné en deux versions : GPT-5.6 et GPT-5.6 Pro. Juin s'annonce également chargé du côté des concurrents, avec Claude Sonnet 4.8 d'Anthropic et Gemini 3.5 Pro de Google attendus dans la même fenêtre. Si GPT-5.6 tient ses promesses, l'impact ira au-delà d'une simple mise à jour incrémentale. Les fuites décrivent un modèle centré sur l'autonomie opérationnelle plutôt que sur la seule précision des réponses : exécution de tâches longues sans supervision humaine constante, agents capables de gérer des workflows complexes de bout en bout, réduction des hallucinations et amélioration sensible de la génération d'interfaces utilisateur. Pour les développeurs et les entreprises qui déploient des agents IA, cela représente un changement de paradigme concret : moins de babysitting, davantage de délégation réelle. La bataille ne se joue plus sur le score aux benchmarks académiques, mais sur la capacité à travailler seul, de manière fiable, sur des missions étendues. Ce lancement s'inscrit dans une accélération remarquable du rythme de sortie des modèles d'OpenAI. GPT-5.5 avait lui-même été lancé peu de semaines auparavant, et la cadence soutenue reflète une pression concurrentielle intense face à Anthropic et Google, qui alignent leurs propres sorties majeures au même moment. OpenAI consolide en parallèle son infrastructure d'agents via Codex et ses outils d'automatisation, positionnant GPT-5.6 comme une brique centrale de cette stratégie. La prochaine version devrait aussi affiner le style de génération du modèle, en réduisant les tics de formulation caractéristiques des versions précédentes. Les semaines à venir diront si OpenAI confirme une date officielle, mais tous les signaux internes pointent vers un lancement imminent.

💬 Ce qui m'intéresse dans GPT-5.6, c'est pas les noms de code qui fuient, c'est la promesse d'agents qui travaillent sans qu'on leur tienne la main en permanence. Si ça se confirme en prod et pas juste sur les démos du lancement, ça change vraiment les calculs pour déployer des pipelines. Et avec Claude 4.8 et Gemini 3.5 dans la même fenêtre en juin, on va avoir de quoi comparer sérieusement.

LLMsOpinion
1 source
Doter les agents d'ordinateurs : Ivan Burazin, Daytona
559Latent Space 

Doter les agents d'ordinateurs : Ivan Burazin, Daytona

Ivan Burazin, PDG de Daytona, est au coeur d'une transformation silencieuse mais radicale de l'infrastructure cloud. Son entreprise, fondée sur une obsession vieille de plus d'une décennie, a opéré un pivot décisif : quitter les environnements de développement pour humains afin de fournir des sandboxes informatiques aux agents IA. Daytona peut aujourd'hui démarrer un sandbox en environ 60 millisecondes, en lancer 50 000 en 75 secondes, et son plus gros client exploite quelque 850 000 sandboxes par jour. La plateforme tourne sur du bare metal avec son propre scheduler, plutôt que sur Kubernetes, et les charges de travail liées au reinforcement learning et aux évaluations de modèles sont passées de zéro à environ 50 % de l'utilisation totale en quelques mois seulement. Ce changement illustre une bascule profonde dans les besoins de l'industrie IA. Les agents logiciels ne travaillent pas sur un laptop : ils ont besoin d'une machine accessible par API, capable de conserver un état entre les tâches, de s'adapter instantanément à des pics de charge massifs, et d'être suffisamment isolée pour rester sûre. Quand un client passe de zéro à 100 000 CPUs en quelques minutes pour une tâche d'entraînement, les architectures classiques comme EKS ou GKE montrent leurs limites. Plusieurs clients de Daytona affirment ne pas vouloir revenir à ces solutions. Au-delà du code, Burazin défend l'idée que les agents auront besoin de machines Windows et macOS, pas seulement Linux, ce qui pose des contraintes de licencing importantes, notamment du côté d'Apple. Ivan Burazin n'en est pas à son coup d'essai. Il avait fondé CodeAnywhere, l'un des premiers IDE entièrement dans le navigateur, avec l'idée déjà en tête de mettre fin au développement sur machine locale. La thèse était bonne, mais le marché n'était pas prêt. L'essor des agents IA en 2025 a changé la donne : là où les développeurs humains s'attachent à leur éditeur favori, les agents sont indifférents à l'environnement, pourvu qu'il soit rapide, fiable et pilotable par code. Daytona s'est imposé dans ce créneau en lançant un MVP la veille du Nouvel An, dont les API keys se sont arrachées en quelques heures. La vision de Burazin pour la prochaine étape du cloud IA ressemble davantage à Stripe, une infrastructure invisible et composable consommée à l'usage, qu'au modèle AWS traditionnel. Un pari sur la façon dont les agents, et non plus les humains, deviendront les principaux consommateurs de ressources informatiques.

InfrastructureOpinion
1 source
NVIDIA et Google Cloud misent sur la prochaine génération de créateurs en IA
560NVIDIA AI Blog 

NVIDIA et Google Cloud misent sur la prochaine génération de créateurs en IA

À l'occasion de Google I/O 2026, NVIDIA et Google Cloud ont annoncé une série de nouvelles ressources pour leur communauté de développeurs commune, qui regroupe désormais plus de 100 000 membres. Lancée lors de Google I/O l'année précédente, cette communauté réunit développeurs, data scientists et ingénieurs en machine learning autour de l'écosystème NVIDIA sur Google Cloud. Parmi les nouveautés dévoilées cette année : un parcours d'apprentissage dédié à la bibliothèque JAX sur GPU NVIDIA, un codelab centré sur NVIDIA Dynamo pour l'optimisation de l'inférence, ainsi que des livestreams mensuels. Les développeurs peuvent désormais déployer des applications multi-agents en combinant les modèles ouverts Gemma 4 de Google DeepMind, les modèles NVIDIA Nemotron et le Google Agent Development Kit, sur des machines virtuelles G4 de Google Cloud équipées de GPU NVIDIA RTX PRO 6000 Blackwell, via Google Cloud Run ou des instances spot. Le nouveau parcours JAX et le codelab NVIDIA Dynamo sur GKE seront disponibles le mois prochain pour les membres de la communauté. Ces annonces ont un impact direct pour les équipes techniques qui cherchent à passer du prototype à la production rapidement. En combinant des modèles ouverts, des bibliothèques accélérées comme cuDF dans Google Colab Enterprise ou Dataproc, et une infrastructure GPU de dernière génération, les développeurs disposent d'un pipeline complet pour construire des applications d'IA prêtes pour la production : des systèmes RAG (retrieval-augmented generation) sur GKE aux pipelines de données d'entreprise en passant par l'analyse sportive. La collaboration sur JAX, framework de calcul numérique utilisé notamment par Google DeepMind pour l'entraînement de grands modèles, étend ces optimisations jusqu'à la plateforme Google Cloud AI Hypercomputer et au framework MaxText, permettant de passer d'expériences sur un seul GPU à des déploiements multi-rack avec une expérience cohérente. L'un des volets les plus significatifs du partenariat concerne l'IA responsable : NVIDIA est le premier partenaire industriel à avoir collaboré avec Google DeepMind sur SynthID, une technologie de tatouage numérique qui intègre des filigranes robustes directement dans les contenus générés par l'IA. Cette technologie est appliquée aux modèles Cosmos de NVIDIA, des modèles de fondation dédiés à la perception 3D et à la simulation pour robots et systèmes autonomes, disponibles sur build.nvidia.com. Dans un contexte où les agents IA combinent de plus en plus modèles propriétaires et open source pour raisonner et agir de manière autonome, cette couche de transparence devient un enjeu central pour la confiance des organisations qui déploient ces systèmes à grande échelle.

UELa technologie SynthID de filigrane numérique, développée avec Google DeepMind et intégrée aux modèles NVIDIA, répond directement aux obligations de transparence de l'AI Act européen sur les contenus générés par IA (Article 50).

OutilsOutil
1 source
Meilleures plateformes d'IA à agents autonomes pour les entreprises en 2026
561MarkTechPost 

Meilleures plateformes d'IA à agents autonomes pour les entreprises en 2026

En 2026, l'IA agentique d'entreprise a franchi le cap du projet pilote pour entrer dans les déploiements en production. Salesforce a conclu 29 000 contrats Agentforce depuis son lancement, générant 800 millions de dollars de revenus annuels récurrents. Microsoft Copilot Studio compte plus de 160 000 organisations qui font tourner plus de 400 000 agents personnalisés. ServiceNow a reconfiguré l'ensemble de son modèle commercial autour de niveaux d'autonomie IA. Sur le plan tarifaire, les modèles divergent : Agentforce facture 2 dollars par conversation ou 500 dollars pour 100 000 crédits Flex, tandis que Copilot Studio propose 200 dollars pour 25 000 crédits mensuels. Salesforce a par ailleurs finalisé en novembre 2025 l'acquisition d'Informatica pour renforcer la qualité des données intégrées à sa couche Data 360. Ces chiffres traduisent un basculement structurel : la question n'est plus de savoir s'il faut déployer des agents IA, mais quel outil convient à quel flux de travail. Ce mouvement massif vers la production révèle aussi ses limites. Les équipes qui ont réussi la transition des pilotes vers le déploiement réel rapportent que les échecs ne viennent pas des capacités des modèles, mais de trois problèmes récurrents : des données de mauvaise qualité, une propriété floue des cas limites, et une gouvernance jamais construite. Une pratique trompeuse s'est également généralisée dans le secteur, que les praticiens appellent l'« agent washing » : des éditeurs rebaptisent des chatbots existants, des scripts d'automatisation robotique ou des outils de workflow linéaires en les présentant comme des agents autonomes. Or, un vrai agent doit être capable de prise de décision autonome, de raisonnement multi-étapes et de gestion dynamique des erreurs, une barre que la majorité des produits commercialisés aujourd'hui ne franchit pas réellement. Les brochures marketing ne suffisent pas ; il faut tester sur des flux réels qui exigent ramifications, usage d'outils, rétention de contexte et récupération sur erreur. Les deux plateformes dominantes en volume illustrent une logique d'écosystème fermé. Agentforce s'appuie sur le moteur de raisonnement Atlas, qui décompose les tâches en étapes via une boucle Reason-Act-Observe, et reste nativement intégré aux données Salesforce, un avantage décisif pour les entreprises dont Salesforce est le système d'enregistrement central, mais une contrainte réelle pour les environnements SAP ou multi-stack. Copilot Studio bénéficie quant à lui d'une surface d'intégration massive : Teams, SharePoint, Dynamics 365 et le Microsoft Graph couvrent environ un milliard de sièges Microsoft 365 dans le monde. La stratégie gagnante pour 2026, selon les retours terrain, consiste à déployer un seul agent sur un workflow précis et bien documenté, mesurer les résultats, puis étendre progressivement, plutôt que de chercher une transformation générale en une seule vague.

UELes entreprises européennes sous écosystème Salesforce ou Microsoft 365 sont directement concernées par les nouvelles grilles tarifaires et les stratégies de déploiement d'agents autonomes décrites dans cet article.

OutilsOutil
1 source
GitHub sécurise les workflows à base d'agents dans les systèmes CI/CD modernes
562InfoQ AI 

GitHub sécurise les workflows à base d'agents dans les systèmes CI/CD modernes

GitHub a publié une architecture de sécurité dite "défense en profondeur" pour les flux de travail agentiques dans les pipelines CI/CD. Conçue par l'ingénieure Leela Kumili, cette approche repose sur trois piliers : l'isolation des environnements d'exécution, la restriction stricte des permissions accordées aux agents, et la traçabilité complète de chaque action effectuée. L'objectif est de permettre l'intégration d'agents IA autonomes dans les chaînes de développement logiciel sans exposer les systèmes à des risques nouveaux. L'enjeu est de taille : les agents IA opérant dans un pipeline CI/CD disposent d'un accès direct au code source, aux secrets d'infrastructure et aux systèmes de déploiement. Sans garde-fous adéquats, ils deviennent une surface d'attaque privilégiée. Les menaces identifiées par GitHub comprennent l'injection de prompts malveillants, l'escalade de privilèges non autorisée et l'exécution d'actions non intentionnelles. Pour y répondre, l'architecture préconise des environnements sandbox cloisonnés, des permissions minimales définies à la tâche, et un journal d'audit exhaustif permettant de retracer précisément ce qu'un agent a fait et pourquoi. Cette publication intervient alors que l'industrie du développement logiciel s'apprête à intégrer massivement des agents autonomes dans ses workflows, portés notamment par GitHub Copilot et ses concurrents comme Cursor ou Devin. Les équipes de sécurité peinent encore à établir des standards pour ces nouveaux acteurs capables d'écrire, tester et déployer du code sans intervention humaine. La démarche de GitHub, qui documente publiquement ses principes de conception, pourrait servir de référence pour l'ensemble de l'écosystème DevSecOps.

UELes équipes DevSecOps françaises et européennes peuvent s'appuyer sur ce cadre de référence pour sécuriser leurs pipelines CI/CD lors de l'intégration d'agents autonomes.

💬 Donner à un agent IA un accès direct à tes secrets d'infra et à ta pipeline de déploiement, c'est exactement aussi risqué que ça en a l'air. L'architecture proposée par GitHub est solide sur le papier : isolation des environnements, permissions minimales par tâche, audit complet de chaque action, c'est ce qu'on attendait avant de lâcher des agents autonomes dans nos repos. Reste à voir combien d'équipes vont vraiment l'implémenter plutôt que de cocher la case "sécurité" et continuer à déployer à l'arrache.

SécuritéActu
1 source
SAP : les entreprises qui adoptent l’IA innovent plus vite et plus efficacement
563Le Big Data 

SAP : les entreprises qui adoptent l’IA innovent plus vite et plus efficacement

SAP affirme que l'intelligence artificielle intégrée à ses solutions cloud ERP bouleverse l'accès aux outils de gestion avancés pour les entreprises de taille moyenne. Avec SAP Business AI et SAP Cloud ERP, l'éditeur allemand propose désormais aux PME et ETI les mêmes capacités d'automatisation, d'analyse et d'optimisation que celles réservées jusqu'ici aux multinationales, sans les coûts d'infrastructure d'autrefois. Des entreprises comme John Boos & Co, centenaire du secteur industriel confrontée à une forte croissance et une lourde dette technologique, s'appuient déjà sur cette plateforme. Son DSI Britt East explique que l'objectif est d'unifier les opérations tout en permettant aux équipes d'utiliser l'IA sur des cas concrets qui simplifient leur travail quotidien. Le modèle par abonnement remplace les investissements massifs en serveurs dédiés et en équipes IT spécialisées, rendant les coûts prévisibles et la montée en charge progressive. Ce changement de paradigme a des implications concrètes pour des milliers d'entreprises qui repoussaient leurs projets ERP par crainte de la complexité et des délais de déploiement. L'IA permet désormais d'automatiser des tâches qui nécessitaient auparavant plusieurs mois de configuration et d'expertise technique : les utilisateurs interagissent en langage naturel avec leurs outils pour accéder aux données, aux analyses et aux recommandations opérationnelles. Dans la logistique, SAP imagine des agents IA capables d'analyser des milliers de commandes en temps réel, de détecter des anomalies, de préparer des réponses fournisseurs ou de proposer des itinéraires alternatifs en cas de perturbation, tout en laissant le contrôle final à l'humain. Selon Tobias Siebler, PDG de FULCRUM Consulting Germany, la perception de complexité et de coût qui freinait les ETI n'est plus adaptée à la réalité du marché actuel. SAP insiste cependant sur un point central : l'IA seule ne suffit pas à produire des résultats fiables. Elle compare la situation à un GPS, aussi sophistiqué soit-il, qui devient inutile sans données routières cohérentes et mises à jour. Pour l'IA, le raisonnement est identique : sans données métier structurées, gouvernées et contextualisées, les décisions générées peuvent rapidement devenir erronées. C'est précisément ce rôle que conservent les ERP, en fournissant une base de données unifiée couvrant la finance, la supply chain, les ressources humaines et les achats. Cette stratégie positionne SAP dans la course aux plateformes d'IA d'entreprise face à des concurrents comme Oracle, Salesforce ou Microsoft Dynamics, tous engagés dans la même course à l'intégration native de l'IA dans leurs suites logicielles. L'enjeu, pour l'éditeur de Walldorf, est de convaincre les ETI qu'adopter l'IA n'est plus un projet de transformation sur cinq ans, mais une évolution incrémentale déjà disponible.

UESAP, éditeur allemand leader de l'ERP, rend ses solutions IA accessibles aux PME et ETI françaises via un modèle cloud par abonnement, abaissant concrètement les barrières à l'entrée pour la transformation numérique des entreprises européennes.

OutilsOutil
1 source
Metis d'Alibaba réduit les appels d'outils IA redondants de 98 % à 2 %, avec une meilleure précision
564VentureBeat AI 

Metis d'Alibaba réduit les appels d'outils IA redondants de 98 % à 2 %, avec une meilleure précision

Des chercheurs d'Alibaba ont publié un cadre d'apprentissage par renforcement appelé HDPO (Hierarchical Decoupled Policy Optimization), conçu pour entraîner des agents IA à mieux décider quand utiliser des outils externes et quand s'appuyer sur leurs propres connaissances. Appliqué à leur modèle multimodal Metis, ce framework réduit les appels d'outils redondants de 98 % à seulement 2 %, tout en améliorant la précision sur les benchmarks de référence du secteur. L'enjeu est concret : les agents IA actuels ont tendance à invoquer systématiquement des utilitaires externes comme la recherche web ou l'exécution de code, même lorsque la question posée ne le nécessite pas. Chaque appel inutile crée un goulet d'étranglement de traitement séquentiel, alourdit les coûts d'API et injecte du bruit dans le contexte du modèle, ce qui dégrade la qualité du raisonnement final. Ce problème touche directement les entreprises qui déploient des agents IA en production : des systèmes techniquement capables deviennent lents et coûteux à opérer, sans que cela se traduise par de meilleures réponses. Les approches précédentes tentaient de corriger ce comportement en combinant précision et efficacité dans un seul signal de récompense, mais cette conception créait un dilemme d'optimisation insoluble. Une pénalité trop forte sur l'usage des outils rend le modèle trop conservateur et nuit à sa précision sur les tâches complexes, tandis qu'une pénalité trop faible ne change rien au comportement. Pire, ce signal mélangé crée une ambiguïté sémantique : une réponse incorrecte sans aucun appel d'outil pouvait obtenir la même récompense qu'une réponse correcte avec un usage excessif. HDPO résout ce paradoxe en séparant les deux objectifs dans des canaux d'optimisation indépendants. Le canal de précision maximise la justesse des réponses sur l'ensemble des rollouts, tandis que le canal d'efficacité minimise les appels superflus. Les deux signaux ne sont combinés qu'à la dernière étape du calcul de la perte, et surtout, l'efficacité reste conditionnelle à la précision : une réponse incorrecte n'est jamais récompensée simplement parce qu'elle a été rapide ou économe en appels. Cette décorrélation offre au modèle des gradients d'apprentissage propres pour chaque objectif, sans interférence. Alibaba s'inscrit dans une course intense au développement d'agents IA fiables et économiques, où la maîtrise du coût opérationnel est devenue aussi stratégique que la performance brute. HDPO représente une avancée méthodologique qui pourrait influencer la façon dont l'ensemble de l'industrie entraîne ses agents à instrumenter le monde extérieur avec discernement plutôt qu'automatisme.

RecherchePaper
1 source
Box Automate : la fin des tâches répétitives en entreprise
565Le Big Data 

Box Automate : la fin des tâches répétitives en entreprise

Box a lancé Box Automate, une nouvelle solution d'automatisation intégrée à sa plateforme de gestion de contenu, avec pour ambition de transformer les documents statiques en déclencheurs d'actions autonomes. Développée en collaboration avec les modèles d'OpenAI, d'Anthropic et de Google, la solution repose sur un éditeur no-code basé sur le glisser-déposer, permettant à n'importe quel responsable de service de concevoir des flux de travail automatisés sans intervention du département informatique. Le système orchestre des agents IA spécialisés qui analysent le contenu des fichiers, extraient les métadonnées pertinentes et n'impliquent un humain que pour les décisions critiques. Parmi les premiers déploiements notables, Samsung utilise déjà l'outil pour automatiser l'onboarding de ses nouvelles recrues, en connectant des systèmes RH comme Workday et Greenhouse à Box DocGen pour générer des documents personnalisés en temps réel. L'enjeu central de Box Automate est de réduire drastiquement le délai entre la réception d'un document et l'action qui en découle, un goulot d'étranglement chronique dans la majorité des organisations. Les applications couvrent des fonctions très diverses : les services juridiques peuvent automatiser l'évaluation des risques contractuels, les équipes crédit croiser automatiquement les pièces justificatives pour instruire des dossiers de prêt, et les agences de recherche piloter la conformité de leurs rapports techniques. Aaron Levie, PDG de Box, positionne explicitement cette capacité d'automatisation du quotidien comme le véritable retour sur investissement de l'IA en entreprise, au-delà des usages ponctuels ou expérimentaux. Pour les utilisateurs finaux, le gain est immédiat : des traitements qui prenaient plusieurs jours peuvent désormais s'effectuer en quelques minutes. Box s'inscrit dans une tendance de fond qui voit les plateformes de gestion documentaire muer en véritables orchestrateurs de processus métier. Face à des concurrents comme Microsoft SharePoint ou Google Workspace qui intègrent eux aussi des couches d'automatisation IA, Box mise sur la flexibilité architecturale et la neutralité vis-à-vis des fournisseurs de modèles pour se différencier. Le choix d'une architecture ouverte, compatible avec plusieurs grands LLMs, permet à ses clients de bénéficier des avancées technologiques sans reconstruire leurs workflows internes. La commercialisation est déjà effective, avec une offre graduée selon les licences : les versions Business couvrent l'automatisation de base, tandis que l'Enterprise Advanced donne accès à l'orchestration complète par agents IA via Box AI Studio. La prochaine étape sera d'observer si ces promesses d'automatisation tiennent à l'échelle dans des environnements complexes, notamment sur les questions de gouvernance et de traçabilité des décisions prises par les agents.

UELes entreprises européennes utilisant Box peuvent automatiser leurs flux documentaires sans compétences techniques, mais devront évaluer la conformité RGPD des traitements automatisés par agents IA.

OutilsOutil
1 source
Ant Group publie en open source le modèle Ling-2.6-Flash avec plusieurs options de précision
566Pandaily 

Ant Group publie en open source le modèle Ling-2.6-Flash avec plusieurs options de précision

Ant Group, la filiale fintech d'Alibaba, a officiellement mis en open source son modèle Ling-2.6-Flash le 29 avril 2026, via l'équipe BaiLing spécialisée en grands modèles de langage. Le modèle compte 104 milliards de paramètres au total, dont 7,4 milliards activés à l'inférence, et est proposé en plusieurs formats de précision, BF16, FP8 et INT4, pour s'adapter à différents environnements matériels et contraintes de déploiement. Fait notable : deux semaines avant cette annonce officielle, le modèle avait été discrètement mis en ligne sur la plateforme OpenRouter sous le nom anonyme "Elephant Alpha", permettant à Ant Group de collecter des retours développeurs et d'effectuer plusieurs cycles d'optimisation, notamment sur la commutation bilingue chinois-anglais et la compatibilité avec les principaux frameworks de développement. Les performances techniques de Ling-2.6-Flash le positionnent comme un concurrent sérieux dans le segment des modèles efficaces à grande échelle. Son architecture linéaire hybride lui permet d'atteindre 340 tokens par seconde sur une configuration 4x GPU H20, avec un débit de prefill 2,2 fois supérieur à celui du Nemotron-3-Super de NVIDIA. Sur les benchmarks Artificial Analysis, il n'a consommé que 15 millions de tokens pour accomplir ses tâches, soit environ un dixième de ce que nécessite Nemotron-3-Super, un ratio coût-performance particulièrement attractif pour les équipes cherchant à déployer des agents IA à l'échelle. Sur des benchmarks spécialisés comme BFCL-V4, TAU2-bench ou SWE-bench Verified, ses résultats rivalisent avec des modèles aux paramètres actifs bien plus importants. Cette publication s'inscrit dans une stratégie d'open source agressive que mènent plusieurs grandes entreprises technologiques chinoises face à la domination américaine dans le domaine des LLM. Ant Group rejoint ainsi DeepSeek, Alibaba (Qwen) et ByteDance (Doubao) dans une course à la transparence et à l'adoption communautaire. Le choix de tester le modèle anonymement avant de le revendiquer reflète une approche plus pragmatique du lancement : valider en conditions réelles avant de s'exposer publiquement. La focalisation sur les cas d'usage agents, planification multi-étapes, utilisation d'outils, exécution de tâches complexes, indique que les prochaines batailles de l'IA ne se joueront pas sur les chatbots grand public, mais sur l'automatisation des workflows professionnels.

LLMsOpinion
1 source
L'accord Meta-Manus difficile à annuler : comment Pékin va-t-il exercer son autorité ?
567SCMP Tech 

L'accord Meta-Manus difficile à annuler : comment Pékin va-t-il exercer son autorité ?

Meta Platforms avait annoncé il y a environ quatre mois le rachat de Manus, une startup d'intelligence artificielle d'origine chinoise, pour un montant de 2 milliards de dollars. Manus, qui se présentait comme le développeur du premier agent IA général au monde, avait accordé aux employés de Meta des accès illimités à sa plateforme durant cette période d'intégration progressive. Lundi, Pékin a ordonné le blocage de l'opération, intervenant tardivement alors que la transaction était déjà bien avancée. Selon des analystes, défaire cette acquisition sera "chronophage", "complexe" et "difficile" compte tenu du niveau d'imbrication déjà atteint entre les deux entreprises. La situation expose les risques concrets pour les groupes technologiques américains qui cherchent à absorber des startups issues de Chine : plus l'intégration est avancée au moment d'un veto gouvernemental, plus le démantèlement devient coûteux, juridiquement incertain et opérationnellement douloureux. Pour Meta, cela représente un revers stratégique dans sa course aux agents IA autonomes. Cette décision s'inscrit dans un contexte de durcissement croissant de Pékin sur les transferts de technologies stratégiques à l'étranger, particulièrement dans le secteur de l'IA. Manus avait suscité un vif intérêt mondial début 2025 en se positionnant comme une solution d'agent IA de nouvelle génération, capable d'agir de manière autonome sur des tâches complexes. L'affaire pourrait freiner de futurs rachats sino-américains dans le domaine de l'IA et renforcer la fracture technologique entre les deux superpuissances, chacune cherchant à protéger ses champions nationaux.

UELa fracture technologique sino-américaine dans l'IA contraint les acteurs européens à repenser leurs stratégies d'acquisition transfrontalières et renforce l'urgence pour l'UE de développer des champions IA souverains face à cette bipolarisation croissante.

BusinessOpinion
1 source
Que cache le grand partenariat entre Meta et Amazon autour des puces CPU ?
568Le Big Data 

Que cache le grand partenariat entre Meta et Amazon autour des puces CPU ?

Le 24 avril 2026, Meta Platforms a officialisé un accord de plusieurs milliards de dollars avec Amazon Web Services portant sur l'accès à des dizaines de millions de cœurs de puces Graviton sur une durée estimée entre trois et cinq ans. Les puces concernées sont les Graviton5, gravées en 3 nanomètres, conçues en interne par Amazon via Annapurna Labs sur architecture Arm. Meta devient ainsi l'un des cinq plus grands clients de cette gamme de processeurs. Selon Nafea Bshara, vice-présidente d'AWS, le critère décisif pour Meta a été le rapport performance/prix, dans un contexte où les coûts d'infrastructure liés à l'IA atteignent des niveaux inédits. L'accord marque une rupture avec la logique purement GPU qui dominait les décisions d'infrastructure depuis deux ans et confirme un rééquilibrage profond des architectures de calcul à grande échelle. Ce retour des CPU au premier plan n'est pas un hasard. L'essor des agents IA, ces systèmes capables d'exécuter des tâches complexes de manière autonome, génère des besoins de calcul différents de ceux de l'entraînement des grands modèles. Les CPU jouent un rôle central dans les phases dites de post-entraînement, où les modèles sont ajustés pour des usages spécifiques, ainsi que dans la gestion de l'orchestration en amont et en aval des GPU. Loin de les remplacer, ils les complètent en optimisant l'ensemble de la chaîne de traitement. Pour Meta, qui déploie Meta AI à des centaines de millions d'utilisateurs et développe activement des expériences agentiques, la capacité à absorber des volumes massifs d'inférences à coût maîtrisé est devenue un avantage compétitif direct. Cet accord s'inscrit dans une stratégie d'infrastructure délibérément diversifiée. Meta multiplie les partenariats avec Nvidia, AMD et Arm Holdings, refusant toute dépendance à une architecture unique. La collaboration avec Amazon remonte à 2016, mais bascule ici vers un engagement sur une technologie CPU spécifique, ce qui est inédit dans leur relation. Sur le plan géographique, la majorité des déploiements sera réalisée aux États-Unis, dans un contexte de souveraineté technologique et de sécurisation des chaînes d'approvisionnement devenues des enjeux stratégiques. Du côté d'Amazon, valider Meta comme client de référence renforce la crédibilité des Graviton face aux solutions concurrentes et soutient une intégration verticale plus large : AWS vient d'annoncer 5 milliards de dollars supplémentaires investis dans Anthropic, qui utilisera elle aussi ces mêmes puces maison.

InfrastructureOpinion
1 source
MCP dans l'écosystème Java : une stratégie architecturale pour les intégrations LLM
569InfoQ AI 

MCP dans l'écosystème Java : une stratégie architecturale pour les intégrations LLM

Le SDK Java du Model Context Protocol (MCP) s'impose comme une nouvelle discipline architecturale pour les entreprises qui intègrent des modèles de langage dans leurs systèmes existants. Développé pour l'écosystème JVM, ce protocole ouvert, initialement lancé par Anthropic fin 2024, définit des contrats explicites entre les applications d'entreprise et les outils LLM, permettant une intégration structurée plutôt qu'ad hoc. Matteo Rossi, dans une analyse récente, détaille comment ce SDK repositionne les intégrations LLM comme une véritable discipline d'ingénierie. L'apport central du MCP Java SDK est l'introduction de serveurs MCP utilisés comme couches anti-corruption, un pattern architecturel classique qui isole le domaine métier des évolutions externes imprévisibles. Pour les équipes Java en entreprise, cela se traduit par un couplage faible entre les systèmes existants et les LLM, une gouvernance renforcée des accès aux données, et un meilleur alignement avec les pratiques de sécurité déjà en place sur la JVM. Les intégrations passent ainsi d'un état fragile et difficile à maintenir à une architecture résiliente et testable. Ce mouvement s'inscrit dans une tendance plus large : après une première vague d'intégrations LLM souvent bricolées, l'industrie cherche à industrialiser ces connexions. Le MCP, porté par Anthropic et rapidement adopté par des dizaines d'éditeurs et de fournisseurs d'outils, s'impose comme un standard de facto pour l'interopérabilité entre agents IA et systèmes tiers. L'écosystème Java, qui représente une part massive des infrastructures d'entreprise mondiales, dispose désormais d'un cadre architectural robuste pour rejoindre cette révolution sans sacrifier la rigueur opérationnelle.

UELes entreprises européennes à forte base Java, banque, industrie, administration, disposent désormais d'un cadre standardisé pour industrialiser leurs intégrations LLM sans refonte de l'existant.

OutilsOutil
1 source
GPT-5.5 : OpenAI et NVIDIA scellent un partenariat pour la prochaine vague d’IA
570Le Big Data 

GPT-5.5 : OpenAI et NVIDIA scellent un partenariat pour la prochaine vague d’IA

OpenAI et NVIDIA ont officialisé en avril 2026 un partenariat approfondi autour de GPT-5.5, le dernier grand modèle d'OpenAI déployé sur les infrastructures GB200 NVL72 de NVIDIA. Dès le lancement, plus de 10 000 employés de NVIDIA utilisent GPT-5.5 au quotidien, notamment via Codex, l'agent de développement logiciel d'OpenAI capable de transformer des instructions en langage naturel en actions concrètes sur des bases de code complexes. Les chiffres avancés sont frappants : un gain de débit multiplié par 50 et une réduction des coûts par jeton de l'ordre de 35 fois par rapport aux configurations précédentes. Chez NVIDIA, les cycles de débogage qui prenaient plusieurs jours se ramènent désormais à quelques heures, et des expérimentations autrefois longues de plusieurs semaines aboutissent maintenant en une seule nuit. Ces résultats illustrent un tournant dans l'adoption de l'IA générative en entreprise : la question n'est plus uniquement celle des capacités du modèle, mais de sa viabilité économique et opérationnelle à grande échelle. La réduction drastique des coûts d'inférence rend envisageable le déploiement d'agents IA sur l'ensemble des équipes techniques, et non plus seulement dans des projets pilotes isolés. L'impact dépasse le seul développement logiciel : les agents pilotés par GPT-5.5 interviennent désormais dans l'analyse, la résolution de problèmes et la génération d'idées, touchant le travail intellectuel dans sa globalité. Pour les directions techniques comme pour les décideurs métiers, c'est le signe que ces outils ont franchi le seuil de la maturité industrielle. Ce partenariat s'inscrit dans une relation qui remonte à 2016, lorsque NVIDIA avait livré à OpenAI l'un de ses premiers supercalculateurs DGX-1. Depuis dix ans, les deux entreprises co-construisent une partie essentielle de la chaîne de valeur de l'IA, OpenAI apportant les modèles et NVIDIA l'infrastructure d'inférence. Sur la question de la sécurité, longtemps présentée comme le principal frein à l'adoption en entreprise, le déploiement de Codex intègre des réponses architecturales concrètes : chaque agent opère dans un environnement isolé via des machines virtuelles sécurisées, les accès aux systèmes critiques sont limités en lecture seule, et une politique stricte de non-rétention des données est appliquée. Jensen Huang, PDG de NVIDIA, résume l'ambition commune en affirmant qu'on entre « pleinement dans l'ère de l'IA », une formulation qui traduit moins un effet d'annonce qu'un constat opérationnel : pour des milliers d'ingénieurs, l'IA agentique est déjà une réalité quotidienne.

UELa réduction des coûts d'inférence liée aux nouvelles générations de hardware IA pourrait faciliter l'adoption d'agents IA à grande échelle dans les entreprises européennes, sans impact réglementaire ou institutionnel direct.

LLMsActu
1 source
OpenAI permet désormais aux équipes de créer des bots personnalisés capables de travailler de façon autonome
571The Verge 

OpenAI permet désormais aux équipes de créer des bots personnalisés capables de travailler de façon autonome

OpenAI a annoncé le déploiement d'agents "workspace" directement intégrés à ChatGPT, désormais accessibles aux abonnés des formules Business, Enterprise, Edu et Teachers. Ces agents, hébergés dans le cloud, sont conçus pour exécuter des tâches professionnelles de manière autonome : l'un peut par exemple surveiller le web à la recherche de retours sur un produit et envoyer un rapport automatisé sur Slack, tandis qu'un autre est capable de rédiger des e-mails de suivi commercial directement dans Gmail. OpenAI a présenté ces capacités dans un billet de blog accompagné de plusieurs cas d'usage concrets. Pour les entreprises abonnées, ce lancement représente un changement de paradigme : il ne s'agit plus seulement d'un assistant qui répond à des questions, mais d'un système capable d'agir dans leurs outils du quotidien sans intervention humaine constante. L'intégration native à des services comme Slack et Gmail abaisse significativement la barrière d'adoption pour des équipes non techniques, et positionne ChatGPT comme une plateforme d'automatisation opérationnelle à part entière. Cette annonce s'inscrit dans une course effrénée au développement d'agents IA autonomes. Le phénomène a été amplifié par la viralité d'OpenClaw, un agent IA se présentant comme "l'IA qui fait vraiment les choses", fondé par Peter Steinberger, qui a depuis rejoint OpenAI. La tendance reflète une conviction grandissante dans l'industrie : la prochaine vague de valeur de l'IA ne viendra pas des chatbots, mais des systèmes capables d'agir de façon autonome dans des environnements de travail réels.

UELes entreprises françaises et européennes abonnées à ChatGPT Business ou Enterprise peuvent désormais déployer ces agents autonomes dans leurs outils quotidiens (Slack, Gmail) sans compétences techniques.

OutilsOutil
1 source
Shopify, l'IA en 2026 : explosion des usages, budget Opus-4.6 illimité, avec le CTO Mikhail Parakhin
572Latent Space 

Shopify, l'IA en 2026 : explosion des usages, budget Opus-4.6 illimité, avec le CTO Mikhail Parakhin

Shopify, la plateforme de commerce en ligne valorisée 200 milliards de dollars, est entrée en 2026 dans ce que son directeur technique Mikhail Parakhin appelle une "phase de transition IA". L'entreprise de vingt ans offre désormais à ses ingénieurs un budget illimité en tokens Claude Opus 4.6 et a déployé trois initiatives internes majeures : Tangle, Tangent et SimGym. Tangle rend les workflows de machine learning reproductibles et collaboratifs grâce à un cache adressé par contenu, se distinguant nettement d'outils comme Airflow. Tangent est un système d'auto-recherche en boucle fermée qui optimise automatiquement des composants comme la recherche produit, la compression de prompts ou le stockage, désormais accessible aux chefs de produit sans expertise ML. SimGym permet de simuler le comportement d'acheteurs à partir des données historiques réelles de Shopify, une infrastructure coûteuse mêlant modèles multimodaux, browser farms et distillation, qui permet d'indiquer précisément à un marchand quoi modifier sur sa boutique pour améliorer ses conversions. Parakhin révèle également que Shopify utilise Liquid AI, qu'il décrit comme la première architecture non-transformer réellement compétitive qu'il ait testée en pratique, notamment pour la compréhension de requêtes à très faible latence. Ce que Shopify documente publiquement est instructif pour toute l'industrie : le vrai goulot d'étranglement dans le développement assisté par IA n'est plus la génération de code, mais la revue, l'intégration continue et la stabilité du déploiement. Parakhin confirme un paradoxe contre-intuitif : les agents IA peuvent produire du code statistiquement plus propre que les humains tout en augmentant le nombre de bugs en production, simplement parce que le volume de code généré explose sans que les processus de validation suivent. Shopify a donc construit son propre workflow de revue de pull requests, jugeant insuffisants les outils standards du marché. Parakhin nuance également la rhétorique de Jensen Huang sur les budgets de tokens : si la direction est juste, le nombre brut de tokens reste une mauvaise métrique pour évaluer la productivité d'une équipe d'ingénierie. Mikhail Parakhin arrive chez Shopify après avoir dirigé des divisions majeures chez Microsoft, notamment Windows, Edge, Bing et la publicité, et avoir présidé à l'ère controversée du chatbot "Sydney" de Bing en 2023. Ce passé lui donne un regard calibré sur la vague actuelle : il situe un point d'inflexion décisif en décembre 2025, moment où la qualité des modèles a franchi un seuil rendant la généralisation à la fois possible et nécessaire pour rester compétitif. Pour Shopify, tenir la frontière technologique n'est plus un avantage optionnel. La combinaison Tangle-Tangent-SimGym est présentée comme un avantage structurel défensif : ces systèmes permettent d'expérimenter de façon reproductible, d'optimiser automatiquement et de simuler le comportement commercial à grande échelle, en s'appuyant sur vingt ans de données transactionnelles que peu de concurrents peuvent répliquer.

BusinessOpinion
1 source
OpenClaw peine à confirmer après son succès fulgurant
573The Information AI 

OpenClaw peine à confirmer après son succès fulgurant

OpenClaw, un logiciel d'agents IA devenu en quelques mois l'un des projets open source à la croissance la plus rapide de l'histoire de la tech, se retrouve à un carrefour délicat. Porté par une communauté de volontaires, ce projet a explosé du jour au lendemain sans que ses mainteneurs n'aient eu le temps d'anticiper une telle adoption. Aujourd'hui, ses responsables doivent décider s'ils transforment OpenClaw en outil fiable pour les entreprises, ou s'ils préservent l'ADN expérimental qui a fait son succès. La question n'est pas anodine : les entreprises qui intègrent des agents IA dans leurs processus métier ont besoin de stabilité, de documentation, de support et de garanties de pérennité que des équipes bénévoles peinent structurellement à offrir. Si OpenClaw ne franchit pas ce cap, il risque de rester un outil de laboratoire réservé aux développeurs avertis, laissant le terrain aux solutions commerciales concurrentes capables d'absorber les exigences des grands comptes. Le phénomène OpenClaw illustre une tension bien connue dans l'open source : les projets qui percent brutalement se retrouvent écrasés par leur propre succès, sans les ressources pour absorber la charge. Dans un secteur des agents IA en pleine ébullition, où des dizaines de frameworks se disputent l'adhésion des développeurs, la fenêtre pour s'imposer comme standard de référence est courte. Les mainteneurs devront probablement choisir entre chercher des financements externes, créer une fondation ou une entité commerciale, ou risquer que la communauté se fragmente autour de forks mieux gouvernés.

OutilsOutil
1 source
574VentureBeat AI 

Kimi K2.6 exécute des agents pendant plusieurs jours et révèle les limites de l'orchestration d'entreprise

Moonshot AI, le laboratoire chinois à l'origine de la famille de modèles Kimi, a lancé Kimi K2.6, un modèle conçu spécifiquement pour les agents à exécution continue. Contrairement aux systèmes concurrents, Moonshot revendique des cas d'usage internes où des agents ont fonctionné en autonomie pendant plusieurs heures, et dans un cas documenté, cinq jours d'affilée, pour gérer de la surveillance d'infrastructure et de la réponse à des incidents. Le modèle est désormais disponible sur Hugging Face, via l'API Kimi, Kimi Code et l'application Kimi. Sa principale nouveauté technique réside dans une version améliorée des "Agent Swarms", capables de coordonner jusqu'à 300 sous-agents exécutant simultanément 4 000 étapes parallèles. À la différence de Claude Code d'Anthropic ou de Codex d'OpenAI, qui s'appuient sur des rôles prédéfinis pour orchestrer leurs agents, K2.6 laisse le modèle lui-même décider de l'orchestration en temps réel. Cette évolution met en lumière une fragilité structurelle dans l'écosystème des agents IA : les frameworks d'orchestration existants ont été conçus pour des agents qui s'exécutent en quelques secondes ou minutes, pas pour des processus qui durent des jours. Maintenir l'état d'un agent sur une longue durée pose des problèmes inédits, car l'environnement dans lequel il opère ne cesse d'évoluer pendant son exécution. L'agent doit appeler des outils, des API et des bases de données différents tout au long de sa vie, ce qu'aucun framework actuel n'a été conçu pour gérer proprement. Mark Lambert, directeur produit chez ArmorCode, souligne que le déficit de gouvernance dépasse déjà le rythme de déploiement : ces systèmes génèrent du code et des changements système plus vite que la plupart des organisations ne peuvent les examiner, corriger ou auditer. La course aux agents longue durée s'inscrit dans une compétition plus large entre fournisseurs de modèles, où la capacité d'orchestration est devenue un avantage concurrentiel à part entière. Anthropic, OpenAI et désormais Moonshot AI expérimentent tous des architectures multi-sessions et d'exécution en arrière-plan, mais aucun n'a encore résolu le problème fondamental : sans mécanisme de rollback clair, un agent autonome qui échoue après plusieurs heures d'exécution peut laisser des systèmes dans un état incohérent. Kunal Anand, directeur produit chez F5, résume le défi : l'industrie est passée des scripts aux services, puis aux agents, mais le saut architectural que représentent les agents à long horizon était loin d'être anticipé par la plupart des entreprises. Le praticien Maxim Saplin l'énonce clairement : l'orchestration reste fragile, et ce n'est pas en affinant les prompts qu'on réglera le problème, mais en repensant à la fois les produits et l'entraînement des modèles.

LLMsOpinion
1 source
575Le Big Data 

JetBrains Central : piloter l’ère du développement agentique en entreprise

JetBrains a annoncé JetBrains Central, une plateforme de pilotage centralisé destinée aux équipes de développement logiciel en entreprise qui adoptent l'IA agentique. Concrètement, la solution connecte les IDE, les consoles d'administration et les pipelines CI/CD dans un système unifié capable de coordonner plusieurs agents IA simultanément : Claude d'Anthropic, Gemini de Google, Codex d'OpenAI ou encore l'Assistant JetBrains natif. La plateforme intègre une console d'administration avec gestion des identités et des accès (IAM), un suivi en temps réel de chaque décision prise par les agents, ainsi qu'un système de facturation centralisé permettant de fixer des quotas de tokens par département et d'alerter ou bloquer l'exécution en cas de dépassement budgétaire. L'enjeu est majeur pour les directions techniques qui peinent aujourd'hui à gouverner une IA de plus en plus autonome. Sans cadre structuré, les risques de fuite de données et de dépenses incontrôlées sont réels : les entreprises jonglent entre de multiples abonnements, sans visibilité sur ce que font réellement les agents dans leur base de code. JetBrains Central répond à ce problème en segmentant les permissions par projet ou par équipe, en traçant chaque commit et chaque modèle utilisé, et en transformant la conformité réglementaire en processus automatisé plutôt qu'en obstacle. Pour les secteurs régulés comme la finance ou la santé, cette traçabilité fine constitue un prérequis non négociable. L'objectif affiché est de rendre la productivité liée à l'IA mesurable en valeur métier, et non plus un coût opaque dilué dans les budgets IT. Cette annonce s'inscrit dans un contexte de fragmentation critique des outils IA en entreprise : chaque fournisseur propose son propre agent, ses propres interfaces, ses propres modèles de tarification, rendant l'orchestration de workflows complexes particulièrement difficile. JetBrains, éditeur des IDE IntelliJ, PyCharm et WebStorm utilisés par des millions de développeurs, capitalise sur sa position centrale dans le SDLC (Software Development Life Cycle) pour imposer une couche d'orchestration neutre. La plateforme s'intègre également avec GitHub, GitLab et des IDE tiers, permettant aux agents d'intervenir directement dans les pipelines CI/CD pour corriger des bugs de build ou améliorer des scripts de déploiement. En misant sur l'ouverture multi-fournisseurs plutôt que sur un écosystème fermé, JetBrains parie que la gouvernance et l'observabilité deviendront les critères d'adoption déterminants à mesure que l'autonomie des agents IA s'accroît dans les environnements de production.

UELes entreprises européennes utilisant les IDE JetBrains (très répandus en Europe) peuvent adopter cette couche de gouvernance pour répondre aux exigences de traçabilité de l'AI Act et aux contraintes des secteurs régulés comme la finance et la santé.

OutilsOutil
1 source
Cadence étend ses partenariats en IA et robotique avec Nvidia et Google Cloud
576AI News 

Cadence étend ses partenariats en IA et robotique avec Nvidia et Google Cloud

Cadence Design Systems a annoncé cette semaine, lors de son événement CadenceLIVE, deux nouvelles collaborations dans le domaine de l'intelligence artificielle : un approfondissement de son partenariat avec Nvidia, et une intégration inédite avec Google Cloud. Avec Nvidia, l'objectif est de combiner la simulation physique, le calcul accéléré et l'IA pour concevoir et déployer des systèmes robotiques et des infrastructures à grande échelle. Concrètement, Cadence intègre ses outils de simulation multiphysique avec les bibliothèques CUDA-X de Nvidia, ses modèles d'IA et son environnement de simulation basé sur Omniverse. Ces outils modélisent les interactions thermiques, électriques et mécaniques pour permettre aux ingénieurs d'évaluer le comportement des systèmes dans des conditions réelles, avant tout déploiement physique. Le PDG de Nvidia, Jensen Huang, présent à l'événement, a résumé l'ambition commune : "Nous travaillons avec vous sur l'ensemble des systèmes robotiques." Côté Google Cloud, Cadence a présenté un nouvel agent IA dédié à l'automatisation des étapes avancées de conception de puces, notamment la traduction des circuits en implantations physiques sur silicium. Cet agent s'appuie sur les modèles Gemini de Google et sera déployé directement dans le cloud. La plateforme ChipStack AI Super Agent de Cadence affiche des gains de productivité allant jusqu'à dix fois dans les premiers déploiements, sur des tâches de conception et de vérification. Ces annonces ont des implications directes pour plusieurs secteurs industriels. Dans la robotique, la simulation physique précise permet de générer des jeux de données d'entraînement sans avoir à collecter de données dans le monde réel, ce qui réduit considérablement les coûts et les délais. Comme l'a souligné le PDG de Cadence, Anirudh Devgan : "Plus les données générées sont précises, meilleur sera le modèle." Des géants de l'automatisation industrielle tels qu'ABB Robotics, FANUC, YASKAWA et KUKA intègrent déjà ces outils dans leurs flux de mise en service virtuelle pour tester des lignes de production entières avant leur déploiement physique. Pour la conception de semi-conducteurs, le passage à des agents IA capables d'automatiser les étapes de layout promet d'accélérer des cycles de développement qui comptent parmi les plus longs et coûteux de l'industrie technologique. Ces partenariats s'inscrivent dans une tendance de fond : la convergence entre conception électronique assistée par ordinateur, IA générative et jumeaux numériques. Cadence, acteur historique de l'EDA (Electronic Design Automation) aux côtés de Synopsys et Mentor, cherche à se repositionner comme une plateforme d'ingénierie systémique intégrant l'IA à chaque étape du cycle de conception. Nvidia, de son côté, poursuit l'expansion de son écosystème Omniverse au-delà du jeu et de la visualisation, vers l'industrie lourde et la robotique physique. L'utilisation de Google Cloud comme vecteur de déploiement des outils de Cadence signale également une montée en puissance du cloud dans des workflows traditionnellement dominés par des infrastructures locales. Les prochaines étapes attendues incluent des annonces de clients utilisant la plateforme ChipStack ainsi qu'une généralisation des agents IA à d'autres étapes du design de puces.

UELes industriels européens KUKA (Allemagne) et ABB (Suisse), déjà utilisateurs de ces outils de simulation, bénéficieront directement des avancées en jumeaux numériques et en automatisation de la conception de puces.

InfrastructureActu
1 source
577VentureBeat AI 

Meta présente les 'hyperagents' pour une IA auto-améliorante sur des tâches non techniques

Des chercheurs de Meta et de plusieurs universités ont présenté un nouveau cadre d'agents autonomes baptisé "hyperagents", conçu pour surmonter les limites des systèmes d'IA auto-améliorants actuels. Contrairement aux architectures existantes, comme la Darwin Gödel Machine (DGM) de Sakana AI, qui ne fonctionnent efficacement que sur des tâches de programmation, les hyperagents peuvent réécrire et optimiser leur propre logique de résolution de problèmes dans des domaines non techniques comme la robotique, l'analyse documentaire ou la revue d'articles scientifiques. Le système est dit "entièrement autoréférentiel" : il peut analyser, évaluer et modifier n'importe quelle partie de lui-même sans contraintes liées à sa configuration initiale. Les hyperagents inventent de façon autonome des capacités génériques comme la mémoire persistante ou le suivi automatisé des performances, sans intervention humaine. L'enjeu est considérable pour les entreprises qui cherchent à déployer des agents IA dans des environnements de production réels, où les tâches sont imprévisibles et variables. Jusqu'ici, les systèmes auto-améliorants étaient bridés par un "meta-agent" statique, conçu par des ingénieurs humains et incapable d'évoluer plus vite que ces derniers ne pouvaient le maintenir. Jenny Zhang, co-auteure de l'article, résume le problème ainsi : "Chaque fois que quelque chose change ou se casse, une personne doit intervenir pour mettre à jour les règles ou la logique." Les hyperagents brisent ce "mur de maintenance" en découplant la capacité à améliorer les tâches de la capacité à modifier le code sous-jacent, deux compétences fondamentalement distinctes. Le résultat est un système qui non seulement s'améliore sur les tâches, mais optimise également le cycle d'auto-amélioration lui-même, accélérant les progrès de façon exponentielle avec moins de prompt engineering manuel. Ce travail s'inscrit dans une course plus large à l'automatisation de l'ingénierie des agents IA, un domaine en pleine effervescence depuis les succès de DGM sur les benchmarks de programmation en 2025. La DGM avait démontré qu'une amélioration récursive et ouverte était techniquement réalisable, mais uniquement lorsque la tâche elle-même était du code. Meta franchit une étape supplémentaire en généralisant ce principe à des domaines où l'évaluation des performances et la réécriture du comportement requièrent des compétences radicalement différentes, comme l'analyse textuelle subjective ou l'exploration de données métier. Si les hyperagents tiennent leurs promesses à l'échelle, ils pourraient réduire drastiquement la dépendance aux équipes d'ingénierie spécialisées pour adapter les agents à chaque nouveau contexte, ouvrant la voie à des systèmes véritablement capables de s'adapter seuls aux environnements d'entreprise en constante évolution.

RecherchePaper
1 source
Google lance 'Skills' dans Chrome : des prompts IA réutilisables en actions navigateur en un clic
578MarkTechPost 

Google lance 'Skills' dans Chrome : des prompts IA réutilisables en actions navigateur en un clic

Google a lancé le 14 avril 2026 une nouvelle fonctionnalité baptisée "Skills" dans Chrome, intégrée directement à Gemini in Chrome. Disponible sur Mac, Windows et ChromeOS pour les utilisateurs dont la langue est réglée sur l'anglais américain, cette fonction permet de sauvegarder des invites (prompts) fréquemment utilisées sous forme de workflows réutilisables, activables en un clic. Concrètement, un utilisateur peut créer une "Skill" à partir de son historique de conversation avec Gemini, puis la rappeler à tout moment en tapant "/" ou en cliquant sur le bouton "+" dans l'interface. La Skill s'exécute alors sur la page en cours de consultation, ou simultanément sur plusieurs onglets sélectionnés par l'utilisateur. Google lance également une bibliothèque de Skills préconfigurées couvrant des tâches courantes : décomposer les ingrédients d'un produit consulté en ligne, comparer des spécifications techniques sur plusieurs onglets, ou encore identifier le cadeau idéal en croisant un budget avec les intérêts du destinataire. Ce que cette fonctionnalité résout est plus fondamental qu'il n'y paraît : jusqu'ici, chaque navigation vers une nouvelle page obligeait à ressaisir manuellement la même invite pour effectuer la même opération, que ce soit analyser une recette, comparer des produits ou extraire des informations clés d'un document long. Skills introduit une couche persistante et nommée entre l'utilisateur et le modèle de langage, supprimant cette friction répétitive. La capacité d'exécution multi-onglets est particulièrement significative : elle permet de traiter plusieurs pages simultanément comme un corpus de récupération unifié, un schéma familier aux ingénieurs qui travaillent avec des pipelines de recherche documentaire, mais désormais accessible sans écrire une seule ligne de code. La bibliothèque de Skills préconfigurées étend encore la portée en proposant des modèles prêts à l'emploi, personnalisables selon les besoins. Cette évolution s'inscrit dans une tendance plus large : l'intégration d'agents IA directement au niveau du navigateur, compétition dans laquelle Microsoft (avec Copilot dans Edge) et Apple (avec des fonctionnalités IA dans Safari) sont également engagés. Google avait déjà commencé à tisser Gemini dans Chrome au cours des derniers mois, mais Skills marque un saut qualitatif en introduisant de la gestion de prompts et une forme d'automatisation légère sans passer par des extensions tierces ou des outils comme LangChain. Le concept, bien connu des développeurs travaillant avec des API de modèles de langage, est ici abstrait et livré à des utilisateurs non techniques via une interface navigateur. Les questions de sécurité et de confidentialité restent en suspens, notamment concernant l'accès aux contenus de plusieurs onglets simultanément, un point que Google devra préciser à mesure que le déploiement s'élargit au-delà de l'anglais américain.

UEFonctionnalité actuellement limitée à l'anglais américain, sans déploiement ni impact direct sur le marché français ou européen à ce stade.

579MarkTechPost 

Google AI propose Vantage : un protocole basé sur les LLM pour mesurer la collaboration, la créativité et la pensée critique

Des chercheurs de Google Research ont publié un article présentant Vantage, un système d'évaluation basé sur des grands modèles de langage (LLM) conçu pour mesurer trois compétences humaines longtemps considérées comme impossibles à tester à grande échelle : la collaboration, la créativité et la pensée critique. L'étude, conduite auprès de 188 participants âgés de 18 à 25 ans recrutés via la plateforme Prolific, a généré 373 transcriptions de conversations entre humains et groupes d'agents IA. Chaque session durait 30 minutes et impliquait des tâches collaboratives structurées, comme la conception d'une expérience scientifique ou un débat argumenté. Les modèles utilisés sont Gemini 2.5 Pro pour les modules de collaboration et Gemini 3 pour la créativité et la pensée critique. L'apport technique central de Vantage est ce que les chercheurs appellent l'architecture "Executive LLM" : plutôt que de faire fonctionner un agent IA distinct pour chaque participant simulé, un seul LLM orchestre tous les personnages artificiels de la conversation. Ce modèle coordinateur a accès à la rubrique d'évaluation en temps réel et s'en sert activement pour piloter les échanges vers des situations révélatrices. Si la compétence ciblée est la résolution de conflits, l'Executive LLM peut faire exprimer un désaccord par l'un de ses personnages et le maintenir jusqu'à ce que le participant humain réagisse. Les tests ont montré que cette approche surpasse significativement une configuration où des agents indépendants interagissent sans coordination : sans pilotage, les conversations peuvent se dérouler sans jamais créer les conditions nécessaires à l'évaluation d'une compétence donnée. Les scores attribués automatiquement par le système ont atteint un niveau de fiabilité comparable à celui d'experts humains formés à la notation. Ce travail s'attaque à un problème de mesure vieux de plusieurs décennies. Les tests standardisés classiques, comme le PISA 2015 sur la résolution collaborative de problèmes, ont tenté de simuler le travail en groupe via des interfaces à choix multiples avec des coéquipiers scriptés, sacrifiant l'authenticité au profit du contrôle. Les évaluations humaines réelles font l'inverse, mais ne passent pas à l'échelle. Google positionne les LLM comme la première technologie capable de satisfaire simultanément ces deux exigences contradictoires : produire des interactions conversationnelles naturelles tout en maintenant des conditions reproductibles et comparables. Les implications dépassent largement le cadre académique : cette approche pourrait transformer les recrutements en entreprise, les certifications professionnelles ou les outils pédagogiques adaptatifs. Avec des entreprises comme Google, Microsoft et OpenAI qui investissent massivement dans les agents conversationnels, Vantage illustre une nouvelle frontière où les LLM ne servent plus seulement à produire du texte, mais à modéliser et évaluer le comportement humain lui-même.

UECe système d'évaluation automatisée pourrait influencer les pratiques de recrutement et les certifications professionnelles en Europe, ainsi que les outils pédagogiques utilisés dans les systèmes éducatifs européens.

RecherchePaper
1 source
580Le Big Data 

Accio Work d’Alibaba : l’IA autonome au service des PME

Alibaba International a lancé Accio Work, une nouvelle plateforme d'intelligence artificielle agentique destinée aux petites et moyennes entreprises. Contrairement aux assistants conversationnels classiques, cet outil ne se contente pas de répondre à des questions : il exécute des tâches opérationnelles complètes de manière autonome, sans que l'utilisateur ait besoin de compétences techniques. Concrètement, plusieurs agents spécialisés travaillent en parallèle dès qu'un objectif est fixé : l'un analyse les données de marché, un autre gère la logistique, un troisième produit des contenus promotionnels. La solution prend aussi en charge les déclarations de TVA et les formalités douanières dans une centaine de pays, mène des négociations tarifaires avec des fournisseurs, et surveille les stocks via des applications de messagerie grand public. Kuo Zhang, président d'Alibaba.com et vice-président d'Alibaba International, résume l'ambition : offrir aux petites structures les mêmes capacités opérationnelles que les multinationales. L'enjeu est considérable pour les PME qui manquent de ressources humaines pour gérer des chaînes d'approvisionnement internationales. Ces entreprises font face à une complexité administrative croissante, réglementations douanières, conformité fiscale multi-pays, négociations fournisseurs, qui mobilise un temps et une expertise disproportionnés par rapport à leur taille. Accio Work promet de compresser ces cycles opérationnels lourds en déléguant l'exécution à une équipe virtuelle coordonnée. Pour limiter les risques d'erreurs, la plateforme s'appuie sur les bases de données transactionnelles internes d'Alibaba plutôt que sur des sources web non vérifiées. Les actions sensibles comme les paiements ou l'accès à des documents confidentiels restent soumises à validation humaine explicite, ce qui maintient un filet de contrôle essentiel pour des décisions engageant la responsabilité de l'entreprise. Accio Work s'inscrit dans une trajectoire rapide : le système est apparu fin 2024 sous la forme d'un simple moteur de recherche dédié à l'approvisionnement, avant de rassembler dix millions d'utilisateurs mensuels en quelques mois. Cette montée en puissance reflète une compétition intense entre les grands acteurs technologiques pour imposer leurs agents IA dans les workflows professionnels. Alibaba joue ici un avantage structurel : son écosystème logistique et commercial mondial lui fournit des données propriétaires que ses concurrents ne peuvent pas répliquer facilement. La question qui se pose désormais est celle de l'adoption à grande échelle par des dirigeants de PME peu habitués à déléguer des décisions opérationnelles à des systèmes automatisés, et de la manière dont les régulateurs, notamment en Europe, encadreront ces agents autonomes agissant au nom d'entreprises dans des transactions commerciales internationales.

UELes PME européennes pourraient bénéficier de la gestion automatisée de la TVA et des formalités douanières dans une centaine de pays, mais le déploiement d'agents autonomes dans des transactions commerciales soulève des questions réglementaires non résolues dans le cadre de l'AI Act.

OutilsOutil
1 source
Comment un programmeur autodidacte est devenu le père de Claude Code
581The Information AI 

Comment un programmeur autodidacte est devenu le père de Claude Code

Boris Cherny, le directeur de Claude Code chez Anthropic, a failli quitter définitivement l'entreprise l'été dernier. À la place, il a contribué à faire de l'agent de programmation l'un des produits les plus populaires du moment, capable de rivaliser directement avec OpenAI. Les chiffres parlent d'eux-mêmes : les revenus annualisés de Claude Code sont passés de 1 milliard de dollars en décembre 2024 à 2,5 milliards en février 2025, avant d'accélérer encore ces dernières semaines, propulsant Anthropic à 30 milliards de dollars de revenus annualisés au total. Cette trajectoire valide le retour de Cherny chez Anthropic après un bref passage l'été dernier chez Cursor, une startup spécialisée dans les outils de programmation. Son départ avait alors été perçu comme un coup dur pour Anthropic et un avantage potentiel pour ce concurrent plus modeste. Mais depuis son retour, Claude Code a profondément bousculé une industrie technologique déjà sous l'emprise de l'IA : le produit a accéléré l'essor des agents IA autonomes, contribué à une chute des valeurs boursières des éditeurs de logiciels traditionnels, et redéfini le quotidien des ingénieurs logiciels, dont le rôle évolue à mesure que ces outils prennent en charge une part croissante du travail de développement. Boris Cherny est un cas atypique dans cet écosystème dominé par les diplômés des grandes universités : programmeur autodidacte, il s'est imposé comme l'architecte d'un produit qui redessine les contours du développement logiciel. La course aux agents de code oppose désormais frontalement Anthropic et OpenAI, dans un marché où la capacité à attirer et retenir les talents clés se révèle aussi déterminante que la puissance des modèles eux-mêmes. L'épisode Cursor illustre bien les tensions qui traversent ce secteur, où les débauchages et les retours en grâce peuvent peser des milliards de dollars de valorisation.

BusinessOpinion
1 source
OSGym : une infrastructure open source pour agents informatiques, gérant plus de 1 000 répliques à 0,23 $/jour
582MarkTechPost 

OSGym : une infrastructure open source pour agents informatiques, gérant plus de 1 000 répliques à 0,23 $/jour

Une équipe de chercheurs issue du MIT, de l'UIUC, de CMU, USC, UVA et UC Berkeley a publié OSGym, un nouveau framework d'infrastructure conçu pour entraîner des agents IA capables d'utiliser un ordinateur comme le ferait un humain. Ces agents, appelés "computer use agents", observent une capture d'écran du bureau, décident d'une action (cliquer, taper du texte, ouvrir un fichier) et l'exécutent via clavier et souris. OSGym permet de gérer plus de 1 000 répliques d'environnements OS simultanément, pour un coût d'environ 0,23 dollar par réplique et par jour, contre environ 300 dollars par jour pour 128 répliques avec une approche naïve, soit une réduction de coût d'un facteur proche de 100. L'enjeu est considérable pour la recherche académique, qui ne dispose pas des budgets des grands laboratoires commerciaux. Entraîner un agent à naviguer dans un vrai système d'exploitation nécessite des centaines, voire des milliers d'environnements virtuels tournant en parallèle, chacun avec son propre disque bootable (environ 24 Go), son allocation CPU et RAM, et sa pile graphique. OSGym résout deux problèmes majeurs : le coût prohibitif de ces environnements, et leur instabilité (crashs, sessions qui expirent, applications gelées). En utilisant des conteneurs Docker plutôt que des machines virtuelles complètes, et en optimisant la densité de répliques par serveur, le système exploite un insight clé : au-delà d'un certain seuil, le goulot d'étranglement passe du CPU à la RAM, qui coûte dix à vingt fois moins cher. Chaque réplique dispose par ailleurs de son propre gestionnaire d'état, exposant une API inspirée d'OpenAI Gym (reset, step, shutdown), ce qui évite qu'une panne en cascade paralyse l'ensemble du système. Les agents de type "computer use" constituent l'une des frontières les plus actives de la recherche en IA. Des modèles commerciaux comme Claude Computer Use d'Anthropic ou Operator d'OpenAI ont montré que la direction est prometteuse, tandis que des projets académiques comme UI-TARS, Agent-S2 ou CogAgent repoussent les limites techniques. Mais l'accélération de ces travaux bute depuis longtemps sur un mur infrastucturel : générer suffisamment de données d'interaction réelles dans des environnements OS complets est trop coûteux pour la plupart des équipes universitaires. OSGym s'attaque directement à ce verrou en proposant une infrastructure open source et économiquement viable. Si le framework tient ses promesses à grande échelle, il pourrait démocratiser significativement la recherche sur les agents autonomes et accélérer le développement de systèmes capables d'exécuter des tâches complexes sur ordinateur sans intervention humaine.

UELes équipes de recherche académiques européennes pourraient bénéficier directement de cette infrastructure open source pour mener des travaux sur les agents autonomes sans les budgets des grands laboratoires commerciaux.

RecherchePaper
1 source
OpenClaw vs ChatGPT : quel agent IA local bat le roi du cloud ?
583Le Big Data 

OpenClaw vs ChatGPT : quel agent IA local bat le roi du cloud ?

En 2026, le débat entre agents IA locaux et solutions cloud a pris une nouvelle dimension avec l'émergence d'OpenClaw, un agent dit "skills-based" qui s'exécute directement sur la machine de l'utilisateur. Contrairement à ChatGPT Agent, le mode Operator d'OpenAI lancé dans le courant de l'année, OpenClaw accède au terminal, manipule les fichiers locaux, gère les dépôts Git et peut tourner en arrière-plan même session fermée, envoyant des notifications sur Discord à la fin d'une tâche. ChatGPT Agent fonctionne lui exclusivement dans le navigateur : l'IA clique, défile et remplit des formulaires à la place de l'utilisateur, mais s'arrête dès que l'onglet est fermé. Sur le plan tarifaire, OpenClaw revient à environ 10 à 30 dollars par mois selon la consommation d'API, contre 20 dollars fixes pour l'abonnement ChatGPT Plus incluant l'accès au mode Operator. La différence fondamentale entre les deux approches tient à la souveraineté des données et à la flexibilité technique. Avec OpenClaw, l'utilisateur choisit lui-même ses modèles, Claude 3.5 pour les raisonnements complexes, Llama 3 ou Kimi pour les tâches répétitives, afin d'optimiser ses coûts, tandis que ChatGPT impose l'écosystème OpenAI sans possibilité de substitution. La mémoire d'OpenClaw est persistante via des fichiers stockés sur disque ; celle de ChatGPT Agent est éphémère, réinitialisée à chaque session. Pour les professionnels qui valorisent l'intégration profonde dans leur environnement de travail, scripts actifs, assets locaux, automatisations conditionnelles, l'agent local représente un levier que le cloud ne peut pas reproduire. Nvidia a par ailleurs introduit NemoClaw, une couche de sécurité greffable sur OpenClaw pour encadrer les actions de l'agent et prévenir les comportements non désirés, comblant l'un des reproches traditionnels faits aux solutions locales. Ce duel s'inscrit dans un basculement plus large du marché de l'IA : on ne parle plus de simples chatbots, mais d'agents capables d'agir de manière autonome sur des systèmes réels. OpenAI a misé sur l'accessibilité maximale avec une interface sans friction, au prix d'un contrôle réduit pour l'utilisateur. OpenClaw, porté par une communauté technique exigeante, répond à un besoin croissant de confidentialité et d'autonomie, notamment dans les secteurs sensibles, finance, santé, défense, où héberger des données sur des serveurs tiers reste rédhibitoire. La vraie question pour 2026 n'est donc pas laquelle des deux IA est "plus intelligente", mais laquelle correspond au niveau de contrôle et de confiance que chaque utilisateur est prêt à exercer sur ses outils numériques.

UELa souveraineté des données mise en avant par OpenClaw répond aux exigences du RGPD et aux contraintes des secteurs réglementés en France et en UE (finance, santé, défense), où l'hébergement tiers reste problématique.

OutilsOutil
1 source
Slack lance 30 nouveautés pour placer Slackbot au cœur du travail
584Le Big Data 

Slack lance 30 nouveautés pour placer Slackbot au cœur du travail

Slack a annoncé plus de 30 nouvelles fonctionnalités pour Slackbot, transformant profondément cet assistant autrefois basique en un véritable coéquipier actif au sein des organisations. Disponible dès maintenant pour les abonnements Business+ et Enterprise+ via une activation dans les paramètres administrateur, cette mise à jour s'inscrit dans la continuité des capacités "agentiques" introduites en janvier. Salesforce, propriétaire de Slack, prévoit d'élargir l'accès aux utilisateurs Free et Pro dès avril, avec un quota limité de conversations pour commencer. Parmi les nouvelles capacités concrètes : Slackbot peut écouter une réunion, prendre des notes en temps réel, afficher automatiquement une fiche client dès qu'un nom est mentionné dans la discussion, puis générer un résumé complet à la fin de l'échange. Depuis mobile, il reconnaît les commandes vocales et peut envoyer des invitations ou mettre à jour un CRM directement. Un agent desktop lui permet également d'analyser ce qui apparaît à l'écran et d'agir depuis Slack sans prise de contrôle de l'ordinateur. Un mode de recherche approfondie baptisé Deep Thoughts lui permet enfin de décomposer un problème complexe, consulter plusieurs sources et produire une synthèse structurée. Ce repositionnement de Slackbot répond à un problème identifié par Slack lui-même : les outils d'IA fonctionnent trop souvent en silo, sans offrir suffisamment de contexte opérationnel aux équipes. En intégrant l'assistant directement dans les flux de travail existants plutôt que de demander aux employés de basculer vers un outil séparé, Slack réduit le fossé entre l'analyse et l'action. Les AI Skills, ensembles d'instructions réutilisables que les équipes configurent une fois puis partagent à toute l'organisation, permettent de standardiser des tâches répétitives comme la rédaction de comptes rendus ou la synthèse d'un pipeline commercial. Pour les PME, des fonctions de gestion client permettent de mettre à jour contacts, opportunités et rapports d'appel directement depuis les conversations Slack, sans interface CRM dédiée. Slack s'inscrit dans une course que se livrent Microsoft (Copilot dans Teams), Google (Gemini dans Workspace) et désormais Salesforce pour faire de leur plateforme de collaboration le point d'entrée unique de l'IA en entreprise. L'adoption du protocole MCP — standard d'interopérabilité entre agents IA — permet à Slackbot de se connecter à Agentforce et aux applications tierces compatibles, renforçant l'écosystème Salesforce. La mémorisation progressive des habitudes utilisateur et le respect strict des permissions administrateur sont présentés comme les garanties d'un déploiement sécurisé en entreprise. La prochaine étape sera de vérifier si cet élargissement aux plans gratuits en avril convertit effectivement les utilisateurs vers les offres payantes, véritable enjeu commercial derrière cette offensive fonctionnelle.

UELes entreprises françaises et européennes utilisant Slack en abonnement Business+ ou Enterprise+ peuvent activer dès maintenant ces fonctionnalités agentiques, avec un accès élargi aux plans gratuits prévu en avril.

OutilsOutil
1 source
Arcee AI publie Trinity Large Thinking : un modèle de raisonnement open source Apache 2.0 pour les agents autonomes et l'utilisation d'outils
585MarkTechPost 

Arcee AI publie Trinity Large Thinking : un modèle de raisonnement open source Apache 2.0 pour les agents autonomes et l'utilisation d'outils

Arcee AI a publié Trinity Large Thinking, un modèle de raisonnement en open-weight distribué sous licence Apache 2.0. Architecturalement, il s'agit d'un modèle Mixture-of-Experts (MoE) sparse totalisant 400 milliards de paramètres, mais qui n'en active que 13 milliards par token grâce à une stratégie de routage 4-sur-256. Cette conception permet d'atteindre la densité de connaissance d'un modèle massif tout en conservant des latences comparables à des architectures bien plus légères. Le modèle a été pré-entraîné sur 17 000 milliards de tokens avec l'optimiseur Muon, plus efficace que l'AdamW standard, et intègre un mécanisme d'attention hybride local/global avec attention gating pour mieux gérer les longs contextes. Il supporte une fenêtre de contexte de 262 144 tokens sur OpenRouter. Sur le benchmark PinchBench, dédié aux agents autonomes, Trinity Large Thinking occupe actuellement la deuxième place, derrière Claude Opus 4.6. Ce lancement est significatif pour les développeurs qui construisent des agents IA autonomes : Trinity Large Thinking est conçu spécifiquement pour les tâches longues et complexes, les appels d'outils multi-tours et le suivi d'instructions précises sur des workflows étendus. Contrairement aux modèles de chat généralistes, il intègre une phase de "réflexion" interne avant chaque réponse, ce qui lui permet de planifier des tâches en plusieurs étapes et de vérifier sa logique avant de générer une sortie. Cette combinaison de raisonnement structuré, de fiabilité multi-tours et de fenêtre de contexte étendue répond directement aux exigences des environnements d'automatisation logicielle, où les erreurs cumulatives sur de longues séquences d'actions sont le principal point de défaillance. L'émergence de ce modèle s'inscrit dans une tendance de fond : le déplacement du centre de gravité de l'IA générative vers des systèmes capables de raisonnement multi-étapes, jusqu'ici dominé par des acteurs propriétaires comme OpenAI avec o3 ou Anthropic avec Claude. Arcee AI, spécialisé dans les LLM d'entreprise et les modèles compacts à haute performance, propose ici une alternative ouverte et auditables pour les organisations qui ne peuvent ou ne souhaitent pas dépendre d'API fermées. Deux innovations techniques internes méritent attention : SMEBU (Soft-clamped Momentum Expert Bias Updates), une stratégie d'équilibrage de charge qui prévient l'effondrement des experts dans les architectures MoE, et l'utilisation du Muon optimizer pour améliorer l'efficacité d'entraînement. La suite logique sera de voir si la communauté open-source s'empare du modèle pour des déploiements auto-hébergés, et si Arcee maintient ce niveau de performance dans des évaluations tierces indépendantes au-delà de PinchBench.

UELa licence Apache 2.0 permet aux organisations européennes de déployer un modèle de raisonnement compétitif en auto-hébergement, réduisant leur dépendance aux API fermées américaines et s'alignant sur les objectifs de souveraineté numérique européenne.

LLMsOpinion
1 source
Meta lance KernelEvolve, un agent IA pour optimiser les infrastructures d'entraînement
586Meta Engineering ML 

Meta lance KernelEvolve, un agent IA pour optimiser les infrastructures d'entraînement

Meta a présenté KernelEvolve, un système d'optimisation de kernels piloté par intelligence artificielle, développé en interne pour accélérer ses modèles de publicité et d'IA générative. Intégré à l'agent Ranking Engineer Agent, KernelEvolve automatise la création et l'optimisation de kernels — ces programmes bas niveau qui traduisent les opérations de haut niveau d'un modèle en instructions spécifiques à chaque puce. Le système cible une infrastructure hétérogène composée de GPU NVIDIA, de GPU AMD, de CPU classiques et des puces MTIA, les accélérateurs personnalisés de Meta. Les résultats publiés sont substantiels : plus de 60 % d'amélioration du débit d'inférence pour le modèle publicitaire Andromeda sur GPU NVIDIA, et plus de 25 % de gain en débit d'entraînement sur les puces MTIA. Des travaux qui auraient normalement demandé plusieurs semaines à des ingénieurs spécialisés ont été accomplis en quelques heures. L'article associé sera présenté au 53e International Symposium on Computer Architecture (ISCA) 2026. L'enjeu est direct et massif : Meta sert chaque jour des milliards d'expériences alimentées par l'IA, des recommandations personnalisées aux assistants génératifs. Chaque requête d'entraînement ou d'inférence repose sur une couche de kernels hautement optimisés, et à mesure que les modèles gagnent en complexité et que le parc matériel se diversifie, le nombre de configurations possibles explose — atteignant des milliers de combinaisons selon le hardware, l'architecture du modèle et le type d'opérateur. L'optimisation manuelle par des experts ne peut plus suivre ce rythme, créant un goulot d'étranglement critique qui freine l'adoption de nouveaux matériels et ralentit les cycles d'itération des modèles. KernelEvolve résout ce problème en traitant l'optimisation comme une recherche automatisée : un environnement d'évaluation dédié teste chaque kernel candidat, renvoie les diagnostics au LLM, et pilote une exploration continue sur des centaines d'alternatives — dépassant les performances des kernels écrits à la main par des experts humains. Cette initiative s'inscrit dans une tendance de fond chez les grandes plateformes technologiques : déléguer des tâches d'ingénierie de bas niveau à des agents IA pour absorber la complexité croissante des infrastructures de calcul. Meta fait face à la même contrainte que Google, Microsoft ou Amazon — accélérer sans cesse les modèles tout en maîtrisant les coûts de calcul sur un parc matériel qui ne cesse de se diversifier. KernelEvolve génère des kernels dans des langages aussi bien de haut niveau comme Triton ou CuteDSL que de bas niveau comme CUDA, HIP ou MTIA C++, ce qui lui confère une portabilité rare. À terme, ce type d'agent pourrait devenir standard dans l'industrie, réduisant drastiquement le besoin d'ingénieurs spécialisés en optimisation matérielle et accélérant la mise en production de nouvelles architectures de modèles sur des puces encore inconnues.

InfrastructureActu
1 source
Experian révèle un paradoxe de fraude dans l'adoption de l'IA par les services financiers
587AI News 

Experian révèle un paradoxe de fraude dans l'adoption de l'IA par les services financiers

Experian a publié début 2026 son rapport annuel sur les tendances de la fraude, et les chiffres sont édifiants : les consommateurs américains ont perdu plus de 12,5 milliards de dollars à cause de la fraude en 2024, selon les données de la FTC. Sur la même période, près de 60 % des entreprises interrogées par Experian ont signalé une augmentation de leurs pertes liées à la fraude entre 2024 et 2025. En face, les solutions de prévention d'Experian auraient permis à ses clients d'éviter environ 19 milliards de dollars de pertes frauduleuses dans le monde en 2025. Le rapport identifie cinq grandes menaces pour 2026, dont la plus préoccupante est ce que l'entreprise appelle le « machine-to-machine mayhem » : le moment où des agents IA autonomes, conçus pour effectuer des transactions au nom des utilisateurs, deviennent indiscernables des bots que les fraudeurs déploient à exactement les mêmes fins. Ce paradoxe révèle une faille structurelle dans l'adoption de l'IA par le secteur financier. Plus les organisations intègrent des agents capables de décisions autonomes, plus elles offrent aux fraudeurs une surface d'attaque à très grande échelle et à vitesse non humaine. La question de la responsabilité légale reste entière : quand un agent IA initie une transaction qui s'avère frauduleuse, personne ne sait clairement qui est responsable. Kathleen Peters, directrice de l'innovation fraude chez Experian North America, résume l'enjeu : « La technologie accélère l'évolution de la fraude, la rendant plus sophistiquée et plus difficile à détecter. » D'autres menaces identifiées dans le rapport sont tout aussi concrètes : des candidats deepfake infiltrent les processus de recrutement à distance — le FBI et le DOJ ont multiplié les alertes en 2025 sur des opératives nord-coréens ayant ainsi obtenu des postes dans des entreprises américaines. Les bots de type romance scam deviennent émotionnellement convaincants grâce à l'IA générative, tandis que le clonage de sites web par IA surcharge les équipes antifraude avec des domaines usurpés qui ressurgissent même après suppression. Enfin, les appareils connectés — assistants vocaux, serrures intelligentes — ouvrent de nouveaux points d'entrée dans les données personnelles. Ce rapport arrive à un moment charnière : 2026 s'annonce comme l'année où l'industrie sera forcée de trancher des questions de gouvernance sur l'IA agentique que personne n'a encore voulu aborder frontalement. Amazon a déjà bloqué les agents IA tiers de son écosystème, invoquant des raisons de sécurité — un signal précoce de la tension à venir entre innovation et protection. Experian, acteur central du scoring et de la vérification d'identité, se retrouve dans une position ambivalente : vendre des outils IA de défense tout en documentant comment ces mêmes outils alimentent l'offensive. Le secteur financier entre dans une course aux armements algorithmique où la vitesse d'adaptation sera le principal avantage concurrentiel — et où les régulateurs n'ont pas encore de réponse claire à apporter.

UELes institutions financières européennes utilisant des agents IA pour les transactions automatisées sont exposées aux mêmes risques de fraude machine-à-machine, dans un contexte où l'AI Act impose des exigences de gouvernance sur les systèmes IA à haut risque dans le secteur financier.

💬 Le "machine-to-machine mayhem", c'est le vrai sujet, et Experian met le doigt dessus mieux que n'importe qui. Quand ton agent IA légitime et le bot fraudeur font exactement la même chose au même rythme, comment tu distingues les deux ? La question de la responsabilité légale, personne ne veut y répondre pour l'instant, mais en 2026 ça va devenir inévitable, surtout avec l'AI Act qui attend les banques européennes au tournant.

SécuritéActu
1 source
ByteDance aide OpenClaw à lancer sa marketplace logicielle en Chine
588The Information AI 

ByteDance aide OpenClaw à lancer sa marketplace logicielle en Chine

ByteDance s'associe à OpenClaw pour lancer une version officielle chinoise de ClawHub, la place de marché qui distribue les fichiers spéciaux permettant aux agents d'IA d'exécuter des tâches spécifiques. L'annonce a été faite mercredi sur le compte X officiel d'OpenClaw, confirmant que le géant chinois de la technologie — maison mère de TikTok — apporte son soutien opérationnel à cette initiative destinée au marché local. Ce partenariat ouvre l'écosystème des agents IA au marché chinois, le plus grand au monde en nombre d'utilisateurs connectés. ClawHub fonctionne comme un App Store pour agents IA : les développeurs y publient des modules de capacités que les agents peuvent télécharger pour accomplir des actions précises — navigation web, traitement de données, intégration avec des services tiers. En adossant la version chinoise à ByteDance, OpenClaw contourne les obstacles réglementaires et infrastructurels qui freinent les plateformes étrangères en Chine, tout en bénéficiant immédiatement d'un réseau de distribution massif. ByteDance, qui développe en parallèle ses propres modèles d'IA via Doubao et a investi massivement dans l'intelligence artificielle générative, renforce ici son positionnement dans la course aux agents autonomes. OpenClaw s'inscrit dans la vague des plateformes de type MCP (Model Context Protocol), qui permettent de standardiser la façon dont les agents IA interagissent avec le monde extérieur. Ce rapprochement sino-américain intervient dans un contexte de fragmentation croissante des écosystèmes IA entre la Chine et l'Occident, où les grandes plateformes cherchent des partenaires locaux pour ne pas rater le marché chinois.

💬 Un App Store pour agents IA qui tente de s'implanter en Chine sans allié local, c'est mission impossible. OpenClaw a compris ça avant beaucoup d'autres, et ByteDance est le choix le plus logique qui soit, avec Doubao en pleine montée en puissance et un réseau de distribution que personne d'autre n'a. La fragmentation des écosystèmes IA s'accélère, mais autant jouer le jeu que regarder le marché chinois de loin.

OutilsOutil
1 source
Slack ajoute 30 fonctionnalités IA à Slackbot, sa mise à jour la plus ambitieuse depuis le rachat par Salesforce
589VentureBeat AI 

Slack ajoute 30 fonctionnalités IA à Slackbot, sa mise à jour la plus ambitieuse depuis le rachat par Salesforce

Slack a annoncé mardi plus de 30 nouvelles fonctionnalités pour Slackbot, son assistant IA intégré, lors d'un événement keynote co-animé par le PDG de Salesforce, Marc Benioff. Cette mise à jour, la plus ambitieuse depuis le rachat de Slack par Salesforce pour 27,7 milliards de dollars en 2021, transforme Slackbot en un véritable agent d'entreprise autonome. Parmi les nouveautés : un mode de recherche approfondie capable de mener des investigations multi-étapes en environ quatre minutes, une intégration du protocole MCP (Model Context Protocol) permettant d'interagir avec plus de 2 600 applications du Slack Marketplace et 6 000 applications Salesforce AppExchange, ainsi qu'une intelligence de réunion qui transcrit et résume les appels sur Zoom, Google Meet ou tout autre fournisseur en captant l'audio directement depuis l'application desktop. Slack introduit également les "AI-Skills", des ensembles d'instructions réutilisables que les équipes peuvent créer une fois et déployer à la demande — Slackbot les appliquant automatiquement dès qu'il reconnaît un cas d'usage correspondant. Ces changements ne sont pas anodins : lancé en disponibilité générale le 13 janvier 2026 pour les abonnés Business+ et Enterprise+, Slackbot est en passe de devenir le produit le plus rapidement adopté des 27 ans d'histoire de Salesforce. Certains employés de sociétés clientes déclarent économiser jusqu'à 90 minutes par jour, tandis qu'en interne, les équipes Salesforce revendiquent des gains allant jusqu'à 20 heures par semaine, soit plus de 6,4 millions de dollars de valeur productive estimée. Pour les petites entreprises, Slackbot peut même faire office de CRM léger, sans installation supplémentaire. L'enjeu est donc considérable : Slack veut se positionner comme un "système d'exploitation agentique" — une interface unique par laquelle les travailleurs pilotent leurs agents IA, leurs applications métier et leurs collaborateurs. Ce pivot s'inscrit dans une bataille frontale avec Microsoft, qui intègre depuis deux ans son assistant Copilot à l'ensemble de sa suite de productivité. Salesforce, longtemps perçu comme n'ayant pas pleinement exploité son acquisition de Slack, semble désormais vouloir en faire le point de convergence de sa stratégie IA, portée par la plateforme Agentforce. Rob Seaman, PDG par intérim de Slack et ancien directeur produit, résume l'ambition sans détour : "La limite supérieure des cas d'usage est effectivement illimitée." Avec l'adoption massive du MCP comme standard d'intégration et une architecture pensée pour l'autonomie des agents, Slack parie que l'interface de messagerie d'entreprise deviendra le cockpit central de l'IA au travail — un territoire que Microsoft, Google et d'autres entendent bien ne pas céder facilement.

UELes entreprises européennes abonnées à Slack Business+ ou Enterprise+ ont accès depuis janvier 2026 à ces capacités agentiques, ce qui peut influencer leurs décisions d'outillage face à Microsoft 365 Copilot.

OutilsOutil
1 source
OpenAI : Sora coûtait un million de dollars par jour et a perdu la moitié de ses utilisateurs en un temps record
590The Decoder 

OpenAI : Sora coûtait un million de dollars par jour et a perdu la moitié de ses utilisateurs en un temps record

OpenAI a décidé de fermer Sora, son application de génération de vidéos par intelligence artificielle, après que le projet s'est révélé financièrement insoutenable. La plateforme consommait environ un million de dollars par jour en coûts de calcul, tout en perdant rapidement la moitié de ses utilisateurs actifs — une hémorragie qui a précipité la décision de la fermer. Lancé avec un positionnement très médiatisé fin 2024, Sora était présenté comme une démonstration de force technologique, capable de générer des vidéos réalistes à partir de simples descriptions textuelles. La fermeture illustre la tension croissante entre les projets de prestige et la réalité économique des modèles d'IA générative grand public. Générer de la vidéo reste computationnellement bien plus coûteux que le texte ou même les images, et l'engagement des utilisateurs n'a pas suivi les attentes. Pour OpenAI, qui brûle des milliards chaque année malgré des revenus en forte hausse, chaque dollar doit désormais justifier un retour mesurable — Sora ne remplissait plus ce critère. Les ressources dégagées seront redirigées vers les segments jugés prioritaires : l'assistance au code, les produits enterprise, et les agents IA autonomes, trois domaines où la monétisation est plus directe et les marges potentiellement meilleures. Ce pivot s'inscrit dans une stratégie plus large d'OpenAI pour atteindre la rentabilité avant une éventuelle introduction en bourse. Il signale aussi que la course aux démos spectaculaires cède la place à une logique de produits viables — une pression que ressentent désormais tous les acteurs du secteur.

UELe retrait d'une plateforme majeure de génération vidéo IA réduit l'offre d'outils accessibles pour les créateurs et entreprises européennes du secteur audiovisuel, et signale que la viabilité économique de ces services reste un obstacle structurel pour tout acteur souhaitant s'y lancer.

BusinessOpinion
1 source
A-Evolve : l'équivalent PyTorch pour les systèmes d'agents autonomes, remplaçant le réglage manuel par la mutation d'état automatisée et l'auto-correction
591MarkTechPost 

A-Evolve : l'équivalent PyTorch pour les systèmes d'agents autonomes, remplaçant le réglage manuel par la mutation d'état automatisée et l'auto-correction

Une équipe de chercheurs affiliés à Amazon a publié A-Evolve, une infrastructure universelle conçue pour automatiser le développement d'agents IA autonomes. Le framework repose sur un moteur de mutation qui modifie directement les fichiers de configuration, les prompts et le code d'un agent — regroupés dans une structure appelée Agent Workspace — pour en améliorer les performances de façon itérative, sans intervention humaine. Le cycle de fonctionnement s'articule en cinq étapes : l'agent tente une tâche, le système observe les résultats, un moteur d'évolution identifie les points de défaillance et modifie les fichiers, un module de validation vérifie qu'aucune régression n'est introduite, puis l'agent redémarre avec le workspace mis à jour. Chaque mutation est taguée sous Git (evo-1, evo-2…) pour permettre un rollback automatique si nécessaire. Les tests initiaux ont été conduits sur des modèles de la série Claude d'Anthropic, sur des benchmarks exigeants dont SWE-bench, le standard de référence pour évaluer la résolution autonome de tickets GitHub. L'enjeu est de taille : aujourd'hui, construire un agent IA performant exige un travail manuel intensif. Quand un agent échoue sur une tâche, l'ingénieur doit inspecter les logs, diagnostiquer la logique défaillante, réécrire les prompts et recommencer — un cycle chronophage qui freine le passage à l'échelle. A-Evolve automatise précisément cette boucle, ce que ses créateurs comparent à l'impact qu'a eu PyTorch sur le deep learning en 2016 : PyTorch avait éliminé le calcul manuel des gradients et démocratisé l'entraînement de réseaux de neurones ; A-Evolve ambitionne de faire de même pour la conception d'agents, en remplaçant le tuning artisanal par un processus systématique et reproductible. Pour les équipes d'ingénierie IA en entreprise, cela pourrait réduire drastiquement le temps de développement et permettre de déployer des agents spécialisés dans des domaines variés sans expertise pointue à chaque itération. Le projet s'inscrit dans une course plus large à l'automatisation de l'automatisation elle-même — ce que la communauté appelle parfois le "méta-apprentissage" ou l'auto-amélioration des systèmes IA. Amazon n'est pas seul sur ce terrain : OpenAI, DeepMind et plusieurs startups explorent des approches similaires d'optimisation automatique d'agents. Ce qui distingue A-Evolve est son architecture modulaire de type "Bring Your Own" : l'utilisateur peut brancher n'importe quelle architecture d'agent (ReAct, multi-agent), n'importe quel environnement d'exécution (sandbox de code, CLI cloud) et n'importe quel algorithme d'évolution (mutation pilotée par LLM ou par renforcement). Le code est disponible sur GitHub sous le compte A-EVO-Lab. La vraie question reste celle de la généralisation : les gains de performance observés sur SWE-bench se traduiront-ils sur des tâches métier réelles, moins standardisées ? C'est le prochain test que l'industrie imposera à ce type de framework.

💬 La comparaison avec PyTorch, c'est gonflé, mais pas complètement faux. Automatiser la boucle debug-réécriture-test sur des agents, c'est exactement ce qui bloque la mise à l'échelle aujourd'hui, et le fait que ça soit testé sur SWE-bench avec Claude donne du crédit. La vraie question c'est si ça tient sur des tâches métier réelles, moins propres qu'un benchmark standard.

RecherchePaper
1 source
Les hyperagents de Meta progressent dans leurs tâches et dans leur capacité à s'améliorer
592The Decoder 

Les hyperagents de Meta progressent dans leurs tâches et dans leur capacité à s'améliorer

Des chercheurs de Meta, en collaboration avec plusieurs universités, ont développé ce qu'ils appellent des « hyperagents » — des systèmes d'IA capables non seulement d'accomplir des tâches, mais aussi d'optimiser activement le mécanisme même par lequel ils s'améliorent. Cette architecture dépasse le cadre classique de l'apprentissage par renforcement ou du fine-tuning : l'agent agit sur deux niveaux simultanément, en résolvant des problèmes tout en affinant sa propre stratégie d'amélioration. Les résultats ont été présentés dans le cadre de travaux impliquant plusieurs équipes académiques aux côtés de Meta. Cette capacité à « s'améliorer en s'améliorant » représente un changement de paradigme potentiel dans la conception des systèmes d'IA agentiques. Là où les agents actuels nécessitent des cycles humains de rétroaction ou de supervision pour progresser, les hyperagents pourraient théoriquement accélérer leur propre développement de manière autonome. L'approche fonctionne sur plusieurs domaines de tâches différents, ce qui suggère une généralisation plutôt qu'une spécialisation étroite — un critère déterminant pour une adoption plus large dans des applications réelles. Ce travail s'inscrit dans une course intense entre les grands laboratoires pour développer des agents IA toujours plus autonomes. Meta, qui a misé massivement sur l'IA agentique avec ses modèles Llama et ses recherches en raisonnement, cherche à rattraper OpenAI et Google sur ce terrain. Le concept d'IA auto-accélératrice soulève également des questions profondes sur la sécurité et la contrôlabilité : si un système peut modifier sa propre dynamique d'apprentissage, la supervision humaine devient structurellement plus difficile à maintenir.

RecherchePaper
1 source
L'avenir de l'IA entre ouverture et propriétaire
593NVIDIA AI Blog 

L'avenir de l'IA entre ouverture et propriétaire

L'intelligence artificielle s'impose comme l'infrastructure technologique centrale de notre époque, portée par un écosystème diversifié de modèles — grands et petits, ouverts et propriétaires, généralistes et spécialisés. Lors d'une session spéciale consacrée aux modèles ouverts à la conférence NVIDIA GTC, Jensen Huang, fondateur et PDG de NVIDIA, a résumé la situation en une phrase : « Propriétaire versus open source n'est pas un débat. C'est propriétaire et open source. » Pour illustrer cet engagement, NVIDIA a annoncé la création de la Nemotron Coalition, une collaboration mondiale inédite regroupant des laboratoires d'IA et des développeurs de modèles pour faire avancer les modèles fondamentaux ouverts. Le premier projet issu de cette coalition sera un modèle de base codéveloppé par Mistral AI et NVIDIA, dont les membres apporteront données, évaluations et expertise sectorielle. Les modèles Nemotron ont déjà été téléchargés plus de 45 millions de fois sur Hugging Face, plateforme sur laquelle NVIDIA est désormais la plus grande organisation avec près de 4 000 membres d'équipe. Plusieurs panels réunissant des figures majeures du secteur — dont Mira Murati (Thinking Machines Lab), Aravind Srinivas (Perplexity), Michael Truell (Cursor) et Arthur Mensch (Mistral) — ont dégagé des tendances clés. Les agents IA s'apprêtent à devenir de véritables collègues capables de mener des tâches complexes sur plusieurs jours. L'IA n'est plus un modèle unique mais un système orchestré : « ce que vous voulez, c'est une orchestra multimodale, multi-modèles et multi-cloud », a déclaré Srinivas. L'ouverture des modèles est présentée comme un moteur d'innovation indispensable, aussi bien pour les grandes entreprises que pour la recherche académique. Murati a insisté sur ce point : « il y a beaucoup d'études à mener qui ne peuvent pas être réalisées uniquement dans les grands laboratoires — c'est là que l'ouverture est précieuse, elle fait avancer la science de l'intelligence. » Cette dynamique s'inscrit dans un tournant structurel où chaque secteur — santé, finance, industrie — a besoin d'une IA adaptée à ses données et workflows spécifiques, rendant la coexistence de modèles ouverts et propriétaires non seulement inévitable, mais souhaitable pour accélérer l'innovation à tous les niveaux.

UEMistral AI, acteur français majeur, est cofondateur de la Nemotron Coalition aux côtés de NVIDIA, ce qui renforce son rôle stratégique dans l'écosystème mondial des modèles ouverts.

LLMsActu
1 source
Granola lève 125 M$, valorisée 1,5 milliard, et passe de la prise de notes aux applications IA d'entreprise
594TechCrunch AI 

Granola lève 125 M$, valorisée 1,5 milliard, et passe de la prise de notes aux applications IA d'entreprise

Granola, l'application de prise de notes pour réunions propulsée par l'IA, a levé 125 millions de dollars lors d'un nouveau tour de financement, faisant bondir sa valorisation de 250 millions à 1,5 milliard de dollars. L'entreprise profite de cet afflux de capitaux pour élargir son positionnement, passant d'un simple outil de transcription de réunions à une plateforme d'IA d'entreprise à part entière. Le produit intègre désormais un support renforcé pour les agents IA, une fonctionnalité réclamée par les utilisateurs après des lacunes signalées. Cette montée en gamme vers l'entreprise représente un pari stratégique majeur : le marché des assistants de réunion est encombré, mais celui des plateformes IA d'entreprise offre des marges et une rétention bien supérieures. Le support des agents IA positionne Granola comme un hub d'automatisation du travail, et non plus seulement un greffier numérique. La multiplication par six de la valorisation en un seul tour reflète l'appétit persistant des investisseurs pour les outils IA à forte adoption dans les environnements professionnels.

BusinessActu
1 source
The Download : le bien-être animal conquis par l'AGI, et la Maison Blanche dévoile sa politique IA
595MIT Technology Review 

The Download : le bien-être animal conquis par l'AGI, et la Maison Blanche dévoile sa politique IA

Le mouvement de bien-être animal de la Bay Area explore comment l'IA générale pourrait réduire la souffrance animale, avec des militants et chercheurs réunis à San Francisco pour discuter d'agents IA dans le lobbying et de viande cultivée par IA. La Maison Blanche a dévoilé son cadre de politique IA, Trump souhaitant que le Congrès le codifie en loi tout en bloquant les réglementations étatiques, tandis que le Pentagone adopte Palantir comme système militaire central pour le ciblage d'armes. Par ailleurs, Elon Musk a été reconnu coupable d'avoir induit en erreur les investisseurs de Twitter avant son rachat à 44 milliards de dollars, et OpenAI prévoit d'afficher des publicités aux utilisateurs gratuits de ChatGPT pour financer ses coûts de calcul croissants.

UELe cadre de politique IA de la Maison Blanche visant à bloquer les réglementations étatiques américaines pourrait renforcer la pression sur l'UE pour harmoniser son propre cadre réglementaire face à un bloc américain unifié.

SociétéReglementation
1 source
596The Decoder 

Google fait marche arrière sur l'IA dans le navigateur alors que l'industrie mise sur les outils de développement

Google abandonne ses efforts sur les agents IA pour navigateurs web, tandis que l'industrie mise massivement sur les outils d'IA pour le code. Les agents de navigation perdent du terrain face aux agents de développement logiciel, et Google en tire les conséquences stratégiques.

OutilsOpinion
1 source
597MarkTechPost 

Google Colab propose un serveur MCP (Model Context Protocol) open source : accédez aux environnements GPU depuis n'importe quel agent IA local

Google a lancé le Colab MCP Server, une implémentation open-source du Model Context Protocol permettant à des agents IA (comme Claude Code ou Gemini CLI) d'interagir directement avec des notebooks Jupyter hébergés dans le cloud, y compris l'exécution de code Python sur des GPU. Le serveur MCP fait office de pont entre la machine locale et l'infrastructure Colab : l'agent sélectionne les outils, provisionne un runtime via l'API Colab, exécute le code et récupère les résultats de manière itérative. Cette intégration marque un passage de l'exécution manuelle à une orchestration autonome, en exposant les fonctions internes de Colab comme outils standardisés appelables par n'importe quel client MCP compatible.

UELes développeurs français et européens utilisant Google Colab peuvent désormais connecter leurs agents IA locaux (Claude Code, etc.) aux environnements GPU cloud via ce serveur MCP open-source, sans impact réglementaire ou économique spécifique à l'UE.

OutilsOutil
1 source
Internet est submergé par des milliards de visites de robots IA selon un rapport
598Siècle Digital 

Internet est submergé par des milliards de visites de robots IA selon un rapport

Les agents IA autonomes génèrent désormais des milliards de visites sur le web, transformant discrètement la nature du trafic en ligne. Ces systèmes redéfinissent la façon dont les sites sont explorés, indexés et exploités, bien au-delà des usages visibles de l'IA. Cette mutation silencieuse soulève des questions sur l'impact des robots IA sur l'infrastructure du web.

UELes sites web français et européens subissent une augmentation significative du trafic de robots IA, ce qui peut impacter leurs coûts d'hébergement, leurs analytiques et la qualité de leurs données.

InfrastructureActu
1 source
Comment Nvidia NemoClaw compte sécuriser les agents OpenClaw ?
599Numerama 

Comment Nvidia NemoClaw compte sécuriser les agents OpenClaw ?

Le 16 mars 2026, Nvidia a lancé NemoClaw, une couche de sécurité et de gouvernance conçue pour s'intégrer au-dessus d'OpenClaw. L'objectif est de rassurer les entreprises sur la compatibilité entre agents IA et exigences de sécurité.

UELes entreprises européennes déployant des agents IA pourront s'appuyer sur NemoClaw pour répondre aux exigences de gouvernance imposées par l'AI Act.

OutilsActu
1 source
La version OpenClaw de Nvidia pourrait résoudre son plus grand problème : la sécurité
600TechCrunch AI 

La version OpenClaw de Nvidia pourrait résoudre son plus grand problème : la sécurité

Nvidia a annoncé NemoClaw, une plateforme enterprise open source pour agents IA, basée sur OpenClaw. Cette initiative vise à résoudre le principal défi de Nvidia dans ce domaine : la sécurité des systèmes d'IA agentiques.

UELes entreprises européennes déployant des agents IA pourront s'appuyer sur NemoClaw pour renforcer la sécurité de leurs systèmes, en lien avec les exigences de l'AI Act.

OutilsActu
1 source