Aller au contenu principal

Dossier Agents IA — page 15

1550 articles · page 15 sur 31

Les agents IA : déploiements en production, écart pilote/prod, débat sur la confiance, agent debt et négociations automatisées.

Accélérer les workflows de campagne grâce aux analyses d'Adobe Marketing Agent for Amazon Quick
701AWS ML Blog OutilsOutil

Accélérer les workflows de campagne grâce aux analyses d'Adobe Marketing Agent for Amazon Quick

Adobe et Amazon ont annoncé une intégration entre Adobe Marketing Agent et Amazon Quick, la plateforme de chat IA d'Amazon Web Services, permettant aux équipes marketing d'interroger leurs données de campagne en langage naturel. Le système repose sur le protocole MCP (Model Context Protocol), une norme ouverte qui permet à Amazon Quick de se connecter à des serveurs distants, de découvrir les outils exposés et de les enregistrer comme actions disponibles dans le chat. Concrètement, un responsable marketing peut poser une question comme "quels sont mes segments d'audience les plus performants ?" et obtenir en quelques secondes un classement, un tableau ou une recommandation, sans quitter l'interface de conversation. L'intégration couvre cinq domaines fonctionnels : le suivi des campagnes, la planification, les insights d'audience (taille des profils, chevauchements entre segments), l'analyse des parcours client et la détection de conflits entre journeys avant leur mise en production. Pour les équipes marketing, l'enjeu est considérable : accéder à des données issues d'Adobe Real-Time CDP ou d'Adobe Customer Journey Analytics nécessitait jusqu'ici de naviguer entre plusieurs interfaces spécialisées ou de solliciter des équipes data. Cette intégration réduit ce délai à une simple question en chat, tout en maintenant des contrôles de gouvernance stricts, notamment l'isolation par tenant, la journalisation des audits, le principe de moindre privilège et une validation humaine obligatoire avant toute décision de lancement de campagne. Pour les organisations qui gèrent des dizaines de campagnes simultanées, la capacité à détecter automatiquement les conflits entre parcours clients représente un gain opérationnel direct, évitant qu'un même client reçoive des messages contradictoires depuis différentes campagnes actives. Cette annonce s'inscrit dans une tendance de fond qui voit les grandes plateformes marketing adopter massivement le protocole MCP, popularisé par Anthropic fin 2024, comme standard d'interopérabilité entre agents IA et sources de données métier. Adobe, qui cherche à positionner son Experience Platform comme la colonne vertébrale des stratégies data marketing des grandes entreprises, y voit un levier pour renforcer l'attractivité de sa suite CX Enterprise face à Salesforce et à l'écosystème Google Marketing. Amazon Quick, de son côté, consolide sa place dans l'espace des assistants IA d'entreprise en multipliant les connecteurs vers des applications tierces. L'accès à cette intégration requiert un abonnement Amazon Quick Enterprise et une licence Adobe couvrant au moins l'un des produits CX Enterprise, ce qui la réserve pour l'instant aux grands comptes disposant déjà des deux environnements.

UELes grandes entreprises françaises disposant à la fois d'une licence Adobe Experience Platform et d'Amazon Q Enterprise pourraient exploiter cette intégration, mais son accès reste limité aux grands comptes ayant les deux abonnements.

1 source
Snowflake intensifie ses efforts pour généraliser l'IA en interne
702The Information AI 

Snowflake intensifie ses efforts pour généraliser l'IA en interne

Snowflake déploie en interne ses propres agents IA pour automatiser des tâches qui mobilisaient jusqu'ici plusieurs semaines de travail humain. Le PDG Sridhar Ramaswamy et le directeur financier Brian Robins s'appuient désormais sur un agent développé en interne pour préparer leurs échanges avec les analystes de Wall Street lors des conférences de résultats trimestriels : l'outil anticipe les questions probables et suggère des réponses en quelques minutes, un processus qui réclamait auparavant plusieurs semaines à des équipes entières, selon Anahita Tafvizi, directrice des données et de l'IA chez Snowflake. Un second agent, déployé pour le directeur financier, surveille en continu les clients dont la consommation de services s'écarte des prévisions -- à la hausse comme à la baisse -- analyse les causes et rédige automatiquement des emails d'alerte à destination des commerciaux concernés. "Brian n'a plus qu'à relire et envoyer", résume Tafvizi. Ces agents reposent sur deux produits maison : Snowflake CoCo (anciennement Cortex Code), un agent de codage, et Snowflake CoWork, dédié à l'interrogation de données internes et d'applications tierces. L'équipe de Tafvizi les déploie transversalement dans les fonctions ventes, marketing, finance et ressources humaines. L'enjeu dépasse la seule productivité interne : selon un commercial Snowflake, la maîtrise de ces outils en interne renforce directement la capacité de l'entreprise à les vendre à ses clients, en alimentant le discours commercial d'une expérience pratique et crédible. Snowflake s'inscrit dans une tendance de fond chez les éditeurs de logiciels cloud qui cherchent à démontrer la valeur de leur stack IA autant par l'exemple que par le catalogue produit. Pour une entreprise dont la proposition de valeur repose sur l'exploitation des données d'entreprise, utiliser ses propres outils pour automatiser des workflows critiques -- comme la préparation aux marchés financiers ou la gestion des comptes clients -- constitue à la fois un laboratoire de validation et un argument commercial. La prochaine étape sera d'étendre ces agents à d'autres fonctions métier et de mesurer l'impact sur les revenus générés par les clients ciblés.

BusinessActu
1 source
Infoblox IQ mise sur l’IA agentique pour l’IT
703Le Big Data 

Infoblox IQ mise sur l’IA agentique pour l’IT

Infoblox lance Infoblox IQ, une plateforme d'IA agentique destinée aux équipes réseau et cybersécurité d'entreprise. Présentée comme une évolution majeure par rapport aux outils d'assistance classiques, la solution centralise les données d'infrastructure, DNS, DHCP, adresses IP, équipements connectés, pour les transformer en décisions opérationnelles concrètes. Plutôt que de simplement répondre à des requêtes, la plateforme analyse automatiquement des milliers d'événements quotidiens et en extrait les signaux pertinents. Un assistant en langage naturel permet aux administrateurs d'interroger leur environnement directement, d'obtenir des explications sur un incident ou des suggestions de correction sans naviguer entre de multiples tableaux de bord. L'entreprise cite un exemple client où plus d'un demi-million d'événements opérationnels ont été réduits à quelques dizaines d'actions prioritaires. L'impact est direct pour deux populations en tension permanente : les équipes SOC et les équipes réseau. Côté sécurité, le problème n'est plus la détection des menaces mais leur qualification parmi un flux d'alertes croissant. Infoblox IQ compile automatiquement les éléments d'enquête, appareils concernés, utilisateurs impliqués, activité réseau observée, avant même que l'analyste commence son investigation. Côté réseau, la plateforme détecte les erreurs de configuration, les problèmes de capacité et les anomalies précurseurs d'interruptions de service, en fournissant des pistes de résolution directement exploitables. L'objectif déclaré est de rendre les opérations informatiques plus autonomes, en réduisant le temps de réaction et la charge cognitive des équipes. Le lancement d'Infoblox IQ s'inscrit dans un mouvement plus large : l'IA agentique gagne du terrain dans les infrastructures d'entreprise, où les données DNS et DHCP, longtemps considérées comme de simples données de plomberie réseau, deviennent un actif stratégique. Pour faciliter l'intégration avec d'autres systèmes, Infoblox introduit un serveur MCP (Model Context Protocol), un standard émergent qui permet à des agents IA externes de se connecter aux données de la plateforme de manière normalisée. Scott Harrell, directeur général d'Infoblox, positionne explicitement ces données d'infrastructure comme un prérequis à toute automatisation fiable : sans information précise à la base, les agents IA prennent de mauvaises décisions. La première version d'Infoblox IQ for Threat Defense est attendue prochainement, avec les autres modules du programme prévus pour le second semestre 2026, dans un marché où Cisco, Palo Alto et CrowdStrike se livrent une bataille similaire sur l'automatisation des opérations de sécurité.

SécuritéOutil
1 source
Les 21 meilleurs outils IA sans code ou low-code en 2026
704MarkTechPost 

Les 21 meilleurs outils IA sans code ou low-code en 2026

En 2026, les plateformes sans code et low-code ont franchi un cap décisif : elles ne se contentent plus de glisser-déposer des composants, elles génèrent des applications complètes à partir d'une simple phrase. Un panorama de 21 outils représentatifs de cette nouvelle génération illustre l'ampleur du basculement. Parmi les plus notables, Lovable produit une application web full-stack, frontend React, backend, base de données, authentification, depuis une description en langage naturel, avec déploiement en un clic et synchronisation GitHub bidirectionnelle. Bolt.new, développé par StackBlitz, fonctionne sur le même principe mais en exposant le code source, ce qui permet aux développeurs d'intervenir directement. Replit combine un environnement de développement navigateur avec un agent autonome capable de scaffolding, de construction et de déploiement. Du côté des outils mobiles, Adalo génère des binaires conformes à l'App Store depuis un prompt, tandis que Glide transforme des feuilles de calcul en interfaces applicatives. Sur le terrain de l'automatisation, Zapier reste la référence avec ses milliers de connecteurs SaaS, désormais complétés par des agents IA pilotables en langage naturel, et n8n propose une alternative open-source auto-hébergeable pour les équipes soucieuses de la souveraineté de leurs données. Ce mouvement redessine profondément l'accès au développement logiciel. Des entrepreneurs sans équipe technique peuvent désormais mettre en production un produit monétisable, avec authentification utilisateur, paiement Stripe et hébergement intégré, en quelques minutes, comme le propose Atoms. Pour les grandes organisations, ces outils accélèrent la création d'outils internes, de portails clients et d'automatisations métier sans mobiliser des développeurs seniors. L'enjeu n'est plus seulement la vitesse : c'est la démocratisation de la capacité à construire, tester et itérer sur des produits numériques à une échelle inédite. Les équipes produit et design, en particulier, gagnent une autonomie réelle grâce à des outils comme v0 de Vercel, spécialisé dans la génération de frontends Next.js. Cette convergence entre no-code et IA générative s'est accélérée depuis l'émergence des grands modèles de langage en 2023, qui ont permis d'interpréter des intentions exprimées en prose et de les traduire en architectures logicielles cohérentes. Le marché se segmente désormais clairement entre les constructeurs d'interfaces visuelles (Bubble, Softr, Adalo), les générateurs de code full-stack (Lovable, Bolt.new, Replit), et les orchestrateurs d'agents et d'automatisations (Zapier, Make, n8n). La prochaine frontière sera probablement la maintenance autonome : des agents capables non seulement de construire une application, mais de la faire évoluer en réponse aux comportements utilisateurs, sans intervention humaine.

UELes équipes européennes soucieuses de souveraineté des données peuvent s'appuyer sur n8n, alternative open-source auto-hébergeable, pour répondre aux contraintes RGPD sans dépendre de plateformes américaines.

💬 Le saut est réel. Pour les équipes produit qui n'avaient pas de dev en interne, un MVP avec auth et Stripe en quelques minutes, c'était de la science-fiction il y a deux ans. Ce qu'on verra d'ici 6 mois, c'est si ces apps tiennent face aux vrais besoins métier, pas juste les exemples propres qu'on voit en démo.

OutilsOutil
1 source
TinyFish lance BigSet : un système multi-agents open source qui construit des jeux de données structurés à partir de descriptions en langage naturel
705MarkTechPost 

TinyFish lance BigSet : un système multi-agents open source qui construit des jeux de données structurés à partir de descriptions en langage naturel

TinyFish vient de publier BigSet, un système multi-agents open source sous licence AGPL-3.0, conçu pour automatiser la construction de jeux de données structurés à partir du web en langage naturel. Le principe est simple : l'utilisateur décrit en une phrase les données qu'il souhaite obtenir, par exemple "les entreprises YC actuellement en train de recruter des ingénieurs, avec leur stade de financement, leur localisation et le nombre de postes ouverts", et BigSet se charge d'inférer le schéma, de collecter les données sur le web, de dédupliquer les résultats et d'exporter le tout en CSV ou XLSX. Le code source complet est disponible sur GitHub. La génération d'un dataset prend entre 2 et 5 minutes, le temps que les agents effectuent de vraies recherches web. Une fonctionnalité de rafraîchissement automatique permet de maintenir les données à jour selon une cadence paramétrable : 30 minutes, 6 heures, 12 heures, quotidienne ou hebdomadaire. L'architecture repose sur un pipeline en cinq étapes clairement séparées. Claude Sonnet 4.6, accessible via OpenRouter, intervient en premier pour inférer le schéma : noms de colonnes, types de données, clés primaires et sources potentielles, avant tout accès web. Un agent orchestrateur basé sur Qwen (qwen/qwen3.7-max, via OpenRouter) identifie ensuite les entités correspondant à la description. Des sous-agents sont alors déployés en parallèle, chacun responsable d'une seule ligne du tableau final, avec un budget plafonné à 6 appels d'outils. Chaque agent utilise TinyFish Fetch pour récupérer le contenu des pages, extrait les champs pertinents, puis insère la ligne avec une attribution de source traçable. La déduplication par clé primaire est appliquée avant l'export final. La stack technique s'appuie sur Next.js 16, React 19, Fastify, TypeScript, Convex pour la base de données, et Mastra pour l'orchestration des workflows IA. BigSet s'attaque à un problème persistant dans le travail avec les données web : la fragmentation du pipeline entre identification des sources, scraping, conception du schéma, déduplication et planification des mises à jour. Ces étapes restent manuelles et chronophages, que l'on construise un dataset ou cent. En abstrayant l'ensemble de cette chaîne derrière une description en langage naturel, TinyFish cible directement les analystes, journalistes de données, équipes produit et chercheurs qui ont besoin de tableaux structurés sans vouloir maintenir une infrastructure de scraping. Le système est auto-hébergé via Docker, ce qui répond aussi aux préoccupations de confidentialité des données. TinyFish, qui développe par ailleurs ses propres outils de recherche et de fetch web, positionne BigSet comme une couche d'abstraction entre un besoin en données et une table exploitable, dans un écosystème où les agents IA commencent à remplacer les pipelines ETL traditionnels.

OutilsOutil
1 source
J’ai transformé mon PC en développeur IA avec OpenClaw (et voici combien ça me coûte vraiment)
706Frandroid 

J’ai transformé mon PC en développeur IA avec OpenClaw (et voici combien ça me coûte vraiment)

Un bricoleur passionné mais non-codeur a publié sur Frandroid le récit de son expérience avec OpenClaw, un agent IA autonome installé directement sur son PC personnel. L'auteur, qui bidouille depuis vingt ans sans jamais avoir maîtrisé la programmation, décrit comment cet outil a transformé sa machine en un véritable développeur à demeure : capable de rédiger des scripts sur commande, d'automatiser une veille technologique et de corriger des bugs de manière autonome, y compris pendant la nuit. Ce type de configuration, longtemps réservée aux développeurs, devient accessible à des profils purement amateurs. L'impact est significatif pour une catégorie d'utilisateurs jusqu'ici laissée de côté : les "power users" non-développeurs, ceux qui ont des idées d'automatisation mais butent sur l'obstacle du code. Un agent IA local et autonome efface cette barrière, rendant possible la création d'outils personnalisés sans compétences techniques. Pour l'industrie, cela illustre un basculement concret : l'IA ne sert plus seulement à assister les professionnels, elle démocratise des capacités autrefois réservées à une élite technique. OpenClaw s'inscrit dans une vague d'agents IA autonomes locaux, aux côtés de projets comme Aider ou Open Interpreter, qui misent sur l'exécution directe sur la machine de l'utilisateur plutôt que sur le cloud. Cette approche soulève des questions sur les coûts réels (abonnements LLM, ressources matérielles) et sur la sécurité, puisqu'un agent avec accès système peut agir sans supervision humaine. La popularité croissante de ces outils chez les profils non-techniques suggère que 2025-2026 marque le début d'une adoption grand public de l'IA agentique.

UELes 'power users' non-développeurs en France peuvent désormais accéder à des agents IA locaux autonomes pour automatiser des tâches sans compétences de programmation, abaissant concrètement la barrière technique pour un large public amateur francophone.

💬 Ça fait deux ans qu'on parle de démocratisation de l'IA, et là c'est peut-être la première fois que je vois un cas qui colle vraiment à ce mot. La barrière du code, c'était le dernier verrou, et un agent local qui bricole à ta place la nuit le fait sauter. La question des coûts réels et de l'accès système reste entière, mais le concept tient.

OutilsOutil
1 source
AWS SMGS transforme sa gestion commerciale avec un assistant conversationnel IA sur Amazon Bedrock AgentCore
707AWS ML Blog 

AWS SMGS transforme sa gestion commerciale avec un assistant conversationnel IA sur Amazon Bedrock AgentCore

Amazon Web Services a déployé en interne un assistant conversationnel basé sur l'intelligence artificielle, baptisé NarrateAI, pour transformer la façon dont les dirigeants de son organisation SMGS (Sales, Marketing and Global Services) accèdent aux données métier. Développé sur Amazon Bedrock AgentCore et accessible via l'interface Amazon Quick, l'outil permet à tous les niveaux hiérarchiques, du PDG aux équipes terrain, de poser des questions en langage naturel sur la performance commerciale et d'obtenir des réponses immédiatement exploitables. L'architecture repose sur deux couches distinctes : une couche de traitement par lots qui génère en amont des narratives personnalisées par utilisateur à partir de requêtes SQL paramétrées sur Amazon Redshift, et une couche temps réel qui répond aux questions de manière conversationnelle. AWS Lambda transforme les données extraites en JSON structuré, tandis que des templates Jinja les restituent en textes lisibles. Le recours à Bedrock AgentCore a permis de réduire le délai de déploiement de plusieurs mois à quelques semaines, en évitant de construire une infrastructure d'orchestration sur mesure. L'enjeu concret est significatif : les dirigeants AWS consacraient auparavant plusieurs heures à préparer manuellement leurs revues métier, en naviguant entre de multiples tableaux de bord et en réconciliant des sources de données disparates. NarrateAI supprime cette friction en livrant des analyses contextualisées à la demande, sans intermédiaire. Les équipes de reporting ne sont plus un goulot d'étranglement, et les décisions stratégiques peuvent être prises sur la base de données fraîches plutôt qu'en attendant des rapports consolidés. Pour une organisation de la taille d'AWS SMGS, qui opère à l'échelle mondiale sur des hiérarchies complexes, cette capacité à accéder instantanément à une vue unifiée de la performance représente un avantage opérationnel direct sur la réactivité des décisions commerciales. Ce projet s'inscrit dans une tendance de fond chez les grandes entreprises tech qui cherchent à remplacer la business intelligence traditionnelle, fondée sur des dashboards statiques, par des interfaces conversationnelles pilotées par des agents IA. Amazon Bedrock AgentCore, le service serverless d'AWS pour l'orchestration d'agents, est ici utilisé en interne avant d'être commercialisé auprès des clients, une stratégie classique chez AWS qui consiste à "dogfooder" ses propres services. La publication de ce retour d'expérience détaillé, incluant les patterns d'ingénierie et les choix architecturaux, vise clairement à convaincre les entreprises clientes d'adopter la même stack. Alors que les concurrents comme Microsoft et Google avancent eux aussi sur les agents IA d'entreprise, AWS positionne NarrateAI comme une vitrine de ce qu'il est possible de construire rapidement et en production avec Bedrock AgentCore.

OutilsOutil
1 source
Sarang Kulkarni : les enseignements du développement d'agents de recherche approfondie en production
708InfoQ AI 

Sarang Kulkarni : les enseignements du développement d'agents de recherche approfondie en production

Sarang Kulkarni, architecte chez Thoughtworks, a présenté lors de l'Arc of AI Conference 2026 les enseignements tirés du déploiement en production de systèmes d'agents de recherche approfondie. Ces systèmes, appelés Deep Research Agentic Systems, sont des agents IA capables de conduire des investigations en plusieurs étapes sur des questions complexes : ils combinent raisonnement dynamique, récupération d'information en chaîne (multi-hop retrieval) et génération de rapports analytiques structurés, allant bien au-delà des chatbots classiques. Ces architectures multi-agents représentent un saut qualitatif pour les entreprises qui ont besoin d'automatiser des tâches de veille, d'analyse concurrentielle ou de recherche documentaire. Là où un LLM standard répond à une question en une passe, un agent de recherche profonde décompose le problème, interroge plusieurs sources, valide ses hypothèses et synthétise un rapport cohérent. Le retour d'expérience de Thoughtworks, cabinet de conseil technologique présent dans le monde entier, est particulièrement précieux car il aborde les réalités du déploiement en production : latence, fiabilité, coûts opérationnels et maintenance des workflows. L'intervention de Kulkarni s'inscrit dans une tendance de fond : après l'engouement pour les LLMs, l'industrie entre dans une phase d'industrialisation des agents IA. Des acteurs comme Google avec Deep Research, Perplexity ou OpenAI ont popularisé le concept, mais les pratiques de déploiement en entreprise restent peu documentées. Les conférences spécialisées comme Arc of AI 2026 deviennent des espaces clés pour partager ce savoir tacite, avant que les standards de l'ingénierie agentique ne se cristallisent.

UELes entreprises européennes déployant des agents IA en production peuvent s'appuyer sur ce retour d'expérience de Thoughtworks pour anticiper les défis de latence, fiabilité et coûts opérationnels.

OutilsOutil
1 source
Des robots autonomes dotés d'une perception précise de l'environnement réel grâce à une avancée d'ingénieurs américains
709Interesting Engineering 

Des robots autonomes dotés d'une perception précise de l'environnement réel grâce à une avancée d'ingénieurs américains

Brain Corp, spécialiste américain des robots autonomes mobiles (AMR) pour environnements commerciaux, annonce un partenariat de recherche avec l'Université de Californie à San Diego (UCSD) autour des technologies de cartographie sémantique et d'intelligence contextuelle. L'objectif est de doter les systèmes autonomes d'une "couche de grounding contextuel", soit une représentation numérique intelligente de l'espace physique qui permet aux robots de comprendre ce qui se passe autour d'eux et de réagir de manière adaptée. Ce partenariat s'appuie sur l'empreinte opérationnelle existante de Brain Corp: plus de 50 000 robots autonomes déployés à l'échelle mondiale, avec plus de 25 millions d'heures d'opérations enregistrées dans des environnements commerciaux variés (centres commerciaux, entrepôts, aéroports). Du côté académique, c'est le Dr. Atanasov, du département Génie électrique et informatique de la Jacobs School of Engineering d'UCSD, qui pilote les travaux. Les avancées issues de cette collaboration seront intégrées dans BrainOS, la plateforme d'autonomie propriétaire de Brain Corp. Ce partenariat signale un pivot stratégique dans la robotique AMR: le secteur passe d'une compétition centrée sur la navigation vers une compétition sur la compréhension contextuelle de l'espace. Le SLAM (Simultaneous Localization and Mapping) a permis de faire sortir les robots des environnements industriels fixes vers des espaces plus dynamiques, mais pour orchestrer des flottes entières de robots, de capteurs fixes et d'agents IA à l'échelle enterprise, la localisation seule ne suffit plus. Il faut que le système distingue un client qui passe d'un obstacle temporaire, ou adapte son comportement à une zone de travaux en temps réel. John Black, CTO de Brain Corp, formule l'enjeu ainsi: "Le défi n'est plus simplement le mouvement ou la perception, mais la compréhension." C'est le passage de la robotique de tâche à la robotique de situation, dont les implications pour la commercialisation à grande échelle sont concrètes, même si les métriques de performance des cartes sémantiques produites par cette collaboration n'ont pas encore été communiquées. Brain Corp, fondée en 2009 et dont le siège est à San Diego, a bâti sa position sur BrainOS, système d'exploitation pour AMR utilisé notamment par des fabricants de machines de nettoyage comme Tennant et Minuteman. Avec 50 000 unités déployées, la société dispose d'un corpus de données opérationnelles réelles que peu d'acteurs de la robotique commerciale peuvent revendiquer, un avantage structurel face à des concurrents comme Avidbots ou SoftBank Robotics. Le partenariat avec l'UCSD s'inscrit dans une tendance plus large: les plateformes AMR cherchent à devenir des couches d'orchestration multi-robots et multi-capteurs, concurrençant indirectement des solutions comme celles de Fetch Robotics (racheté par Zebra Technologies) ou 6 River Systems (acquis par Shopify). À ce stade, aucun budget de recherche, ni calendrier de déploiement de fonctionnalités dans BrainOS, n'a été rendu public.

RobotiquePaper
1 source
Évaluateurs multimodaux : MLLM comme juge pour les tâches image vers texte dans Strands Evals
710AWS ML Blog 

Évaluateurs multimodaux : MLLM comme juge pour les tâches image vers texte dans Strands Evals

Amazon a annoncé le lancement de quatre nouveaux évaluateurs multimodaux dans son SDK Strands Evals, conçus pour juger automatiquement la qualité des réponses textuelles générées à partir d'images. Baptisés Overall Quality, Correctness, Faithfulness et Instruction Following, ces évaluateurs fonctionnent sur Amazon Bedrock et s'intègrent directement dans le flux de travail Case/Experiment/Report de Strands Evals. Leur principe : envoyer l'image source, la requête et la réponse du modèle à un modèle juge multimodal, qui retourne un score (sur une échelle de Likert 1-5 ou binaire) accompagné d'un raisonnement exploitable pour le débogage. Ils supportent deux modes d'évaluation, avec ou sans réponse de référence, et peuvent être branchés directement dans des pipelines d'intégration continue pour détecter automatiquement hallucinations visuelles, erreurs factuelles et violations d'instructions. La limitation des évaluateurs textuels classiques est au coeur de cette annonce. Un juge qui ne voit pas l'image peut valider un texte bien rédigé tout en laissant passer des erreurs critiques : un modèle qui invente une tendance dans un graphique qui ne la montre pas, hallucine un produit absent d'une photo, ou ignore une instruction de format. Ces trois types d'échecs nécessitent trois types de corrections différents, et les agréger en un seul score global rend le débogage quasi impossible. Sans évaluation multimodale automatisée, les équipes sont coincées entre la revue humaine, coûteuse et non scalable, et des proxys textuels qui manquent précisément les défaillances qui comptent, notamment dans des cas d'usage comme la lecture de factures, l'analyse de tableaux de bord ou la description de captures d'écran. L'enjeu est considérable à l'échelle de l'industrie. Selon Gartner, 80 % des logiciels d'entreprise seront multimodaux d'ici 2030, contre moins de 10 % en 2024. Cette transition rapide pousse les équipes d'ingénierie à construire des pipelines d'évaluation capables de suivre la complexité croissante des modèles déployés. Strands Evals s'inscrit dans l'écosystème d'agents IA open source qu'Amazon a commencé à assembler ces derniers mois, avec une ambition claire : fournir une chaîne d'outils complète, de la construction à l'évaluation des agents. Ces quatre évaluateurs représentent une brique manquante pour les équipes qui travaillent sur le commerce visuel, la compréhension de documents ou tout système où la vérité de terrain réside dans l'image et non dans le texte. La prochaine étape logique sera d'étendre ces mécanismes à des modalités supplémentaires, vidéo, audio, à mesure que les modèles fondamentaux gagnent en capacités.

OutilsOutil
1 source
Étendre la mémoire conversationnelle de Kiro CLI avec Amazon Bedrock AgentCore Memory
711AWS ML Blog 

Étendre la mémoire conversationnelle de Kiro CLI avec Amazon Bedrock AgentCore Memory

Amazon Web Services a présenté une solution pour doter Kiro CLI d'une mémoire conversationnelle persistante entre les sessions, en s'appuyant sur Amazon Bedrock AgentCore Memory. Kiro CLI est l'interface en ligne de commande qui permet aux développeurs d'interagir directement depuis leur terminal avec les agents IA de Kiro, l'IDE agentique d'AWS. Le problème résolu est concret : chaque nouvelle session repart de zéro, forçant le développeur à réexpliquer le contexte de son projet, ses préférences et ses conventions à chaque démarrage. La solution repose sur un serveur MCP (Model Context Protocol) personnalisé, open source et disponible sur GitHub, qui fait le pont entre Kiro CLI et le service managé Bedrock AgentCore Memory. Ce serveur expose trois catégories d'outils : des outils conversationnels pour stocker et retrouver l'historique par sujet ou période, des outils de supervision pour consulter les statistiques d'utilisation mémoire, et des outils d'administration pour supprimer des sessions ou des données ciblées. La récupération du contexte repose sur une stratégie à deux niveaux : une recherche sémantique via l'API retrievememoryrecords d'AgentCore Memory, avec repli automatique sur une correspondance directe dans les contenus bruts si le premier niveau n'a pas encore terminé son indexation. L'impact pour les équipes de développement travaillant sur des bases de code volumineuses est direct. Un développeur qui revient sur un projet après plusieurs jours n'a plus besoin de réexpliquer l'architecture, les contraintes métier ou ses préférences de style à l'agent IA : celui-ci retrouve automatiquement les sessions précédentes, identifiables par des formulations naturelles comme "hier soir" ou "la semaine dernière". Cette continuité de contexte réduit la friction cognitive et le temps perdu en répétition, deux freins majeurs à l'adoption productive des outils IA dans les workflows de développement au quotidien. Amazon Bedrock AgentCore Memory est un service entièrement managé lancé par AWS pour répondre à un besoin croissant dans l'écosystème des agents IA : la persistance de la mémoire à long terme. Jusqu'ici, les agents IA des IDEs et des outils de développement souffraient d'une amnésie structurelle entre les sessions, limitant leur utilité réelle sur des projets complexes et de longue durée. Le Model Context Protocol, standardisé par Anthropic, est devenu le mécanisme central d'extensibilité pour les agents IA, permettant à des services tiers d'exposer des capacités via une interface unifiée. AWS positionne ainsi AgentCore Memory comme une brique d'infrastructure réutilisable pour tout éditeur souhaitant ajouter de la mémoire à ses propres agents MCP-compatibles. La mise à disposition du code source en exemple sur GitHub signale une volonté d'adoption large, au-delà de Kiro, vers l'ensemble des clients AWS qui construisent des outils agentiques sur Bedrock.

OutilsOutil
1 source
Des évaluateurs personnalisés basés sur du code dans Amazon Bedrock AgentCore
712AWS ML Blog 

Des évaluateurs personnalisés basés sur du code dans Amazon Bedrock AgentCore

Amazon a lancé les évaluateurs personnalisés basés sur du code dans Amazon Bedrock AgentCore Evaluations, une fonctionnalité permettant aux équipes de développement d'intégrer des fonctions AWS Lambda comme moteur d'évaluation pour leurs agents IA. Contrairement aux juges LLM classiques, ces évaluateurs produisent des résultats déterministes : le même input donne toujours le même score. Ils peuvent être utilisés en mode on-demand, comme porte de validation dans les pipelines CI/CD, ou en mode online pour scorer du trafic de production en temps réel. L'annonce a été portée par une équipe pluridisciplinaire incluant Stephanie Yuan, Lefan Zhang, Ritvika Pillai, Vivek Singh et plusieurs ingénieurs et chefs de produit d'AWS. Pour les entreprises des secteurs financiers et spécialisés, cette capacité répond à des exigences concrètes que les LLM-as-a-Judge ne couvrent pas bien. Un agent de veille de marchés financiers doit citer des cours boursiers dans une fourchette de tolérance configurable, respecter un workflow d'identification du courtier avant d'accéder aux profils clients, retourner des sorties d'outils conformes à un schéma JSON strict, et ne jamais exposer d'informations personnelles identifiables. Un LLM est sujet à des erreurs arithmétiques, peut coûter cher à chaque appel, et ne convient pas à la vérification de règles objectives. Un évaluateur en code appelle directement le système de référence, calcule l'écart de tolérance, et signale chaque anomalie avec une précision que même un écart de 0,1 % peut déclencher, un seuil qui peut influencer une décision de trading. Le lancement s'inscrit dans un problème plus large que rencontre l'industrie : la transition des agents IA du prototype vers la production. Un agent fonctionnel en démo peut, en conditions réelles, produire des données mal formées suite à un bug de parsing ou une panne d'API tierce, divulguer des données confidentielles par inadvertance, ou ne pas respecter l'ordre des appels d'outils requis par une politique interne. Amazon propose désormais quatre dimensions d'évaluation adaptées au code : la validation de schéma des réponses d'outils, la précision numérique par rapport à une source de référence, la conformité au contrat de workflow, et la détection de PII ou de secrets via des services externes comme Amazon Comprehend. Ces évaluateurs peuvent être combinés avec les évaluateurs intégrés d'AgentCore et fonctionnent indépendamment du framework agent utilisé en production. L'enjeu est de donner aux équipes un filet de sécurité déterministe là où les capacités linguistiques des LLM atteignent leurs limites.

OutilsOutil
1 source
Les événements à ne pas rater pour comprendre la montée en puissance de l’IA en 2026
713FrenchWeb 

Les événements à ne pas rater pour comprendre la montée en puissance de l’IA en 2026

L'année 2026 s'impose comme un tournant décisif pour l'intelligence artificielle. Après plusieurs années d'expérimentation intense portée par l'essor des modèles génératifs, le secteur entre dans une phase de maturité industrielle. Les grandes conférences et salons professionnels de l'année reflètent ce changement de cap : les thématiques dominantes ne sont plus la découverte ou la démonstration, mais l'intégration opérationnelle, le déploiement à grande échelle et la gouvernance des systèmes IA en conditions réelles. Les enjeux qui structurent l'agenda 2026 sont multiples et convergents. Les infrastructures de calcul (compute) et la consommation énergétique des centres de données sont au coeur des débats, à mesure que les modèles deviennent plus complexes et plus gourmands. Les agents IA autonomes, capables d'exécuter des tâches longues et enchaînées, concentrent l'attention des entreprises qui cherchent à automatiser des processus métier entiers. La robotique physique et la souveraineté numérique s'invitent également dans les discussions, portées par des tensions géopolitiques persistantes autour du contrôle des semi-conducteurs et des données. Ce basculement vers une logique industrielle reflète une transformation plus profonde : les entreprises ne se demandent plus si elles doivent adopter l'IA, mais comment le faire sans perdre le contrôle. Les événements professionnels de 2026 servent ainsi de baromètre pour mesurer où en sont réellement les acteurs du secteur, entre les annonces des géants technologiques américains et les ambitions croissantes des acteurs européens et asiatiques.

UEL'article met explicitement en avant les ambitions croissantes des acteurs européens face aux géants américains, notamment sur les enjeux de souveraineté numérique et de gouvernance de l'IA, thématiques centrales du cadre réglementaire européen en cours de déploiement.

💬 La phase POC est officiellement terminée pour beaucoup. Ce qui m'intéresse maintenant, c'est qui va réussir l'industrialisation sans se planter sur la gouvernance, parce que c'est là que ça va coincer. Les Européens ont une carte à jouer sur la souveraineté, si tant est qu'ils arrêtent d'en parler et commencent à livrer.

BusinessOpinion
1 source
Agent IA vs SaaS : les logiciels vont-ils disparaître ?
714Le Big Data 

Agent IA vs SaaS : les logiciels vont-ils disparaître ?

Les agents IA ne vont pas tuer le SaaS, mais ils en transforment radicalement la nature. Pendant vingt ans, le modèle SaaS a restructuré le travail en entreprise, remplaçant les installations locales par des abonnements cloud accessibles depuis n'importe quel navigateur. CRM, outils comptables, plateformes marketing : ces logiciels sont devenus l'infrastructure invisible de l'organisation moderne, standardisant les processus de la PME jusqu'au grand groupe. Mais une rupture s'opère aujourd'hui : les agents IA, des entités autonomes capables d'analyser une requête, planifier des étapes et enchaîner des actions complexes sans intervention humaine continue, commencent à interagir directement avec ces logiciels via leurs API, court-circuitant les interfaces visuelles pensées pour des clics humains. Cette mutation change profondément qui est le véritable utilisateur du logiciel. Là où le SaaS supposait un humain devant un formulaire, l'agent IA devient le client programmatique le plus actif : il gère courriels, factures et réunions en arrière-plan, en quelques secondes là où une tâche prenait auparavant plusieurs heures. Des tâches de recouvrement, par exemple, peuvent être entièrement orchestrées par un agent qui consulte à la fois le CRM et les bases comptables sans jamais afficher d'écran. Pour les entreprises, le gain de productivité est réel et immédiat. Pour les éditeurs de logiciels, cette évolution déplace la valeur : le modèle économique migre progressivement de l'abonnement par siège vers des formules indexées sur les tâches accomplies ou les résultats obtenus, ce qui fragilise ceux dont l'unique différenciation était la qualité de l'interface graphique. Ce basculement s'inscrit dans une dynamique plus large où le logiciel cesse d'être un support pour devenir un moteur d'exécution. Les agents IA n'ont ni stockage propre ni règles métier structurées : ils dépendent entièrement des SaaS pour organiser, sécuriser et valider les données. Le SaaS ne disparaît pas, il se repositionne en serveur de logique métier, pilier invisible de l'autonomie de l'IA. Les éditeurs qui survivront à cette transition seront ceux qui auront ouvert des API robustes et pensé leur produit pour un usage programmatique autant que visuel. Les autres, dont la valeur reposait exclusivement sur l'ergonomie d'une interface, risquent d'être contournés. L'enjeu pour l'ensemble du secteur est donc de se réinventer non plus comme des outils pour les humains, mais comme des infrastructures de confiance pour des agents autonomes, un défi architectural et économique qui redéfinit les règles du jeu de la transformation numérique.

UELes éditeurs de logiciels français et européens devront repenser leur modèle économique et ouvrir des APIs robustes pour rester compétitifs face aux agents IA qui contournent les interfaces visuelles.

BusinessOpinion
1 source
AgentCore : optimisation de la qualité des agents, désormais en préversion
715AWS ML Blog 

AgentCore : optimisation de la qualité des agents, désormais en préversion

Amazon a annoncé ce 5 mai 2026 l'intégration de nouvelles capacités d'optimisation automatique dans AgentCore, sa plateforme de déploiement d'agents IA, désormais disponibles en préversion. Ces fonctionnalités couvrent trois mécanismes complémentaires : les Recommandations, l'évaluation par lots (batch evaluation) et les tests A/B. Le moteur de recommandations analyse les traces de production et les résultats d'évaluation pour proposer des améliorations concrètes des prompts système ou des descriptions d'outils, en ciblant un critère de performance défini par le développeur. L'évaluation par lots permet ensuite de valider ces suggestions sur un jeu de données de test prédéfini, en mesurant des scores agrégés pour détecter d'éventuelles régressions. Enfin, les tests A/B comparent deux versions d'un agent en production via AgentCore Gateway, en répartissant le trafic réel selon un pourcentage configurable et en restituant les résultats avec intervalles de confiance et significativité statistique. L'ensemble s'appuie sur un système de traçabilité OpenTelemetry géré par AgentCore Observability, qui capture chaque appel au modèle, chaque invocation d'outil et chaque étape de raisonnement. Ces nouvelles capacités répondent à un problème structurel bien connu des équipes IA en production : la dégradation silencieuse des agents au fil du temps. Lorsque les modèles évoluent, les comportements utilisateurs changent, ou les prompts sont réutilisés dans des contextes imprévus, la qualité baisse sans signal d'alerte clair. Jusqu'ici, le cycle de correction restait entièrement manuel : un utilisateur se plaint, un développeur lit des traces, formule une hypothèse, réécrit le prompt, teste quelques cas et pousse un correctif qui peut en créer un autre. AgentCore ferme cette boucle en remplaçant l'intuition du développeur par des données systématiques, avec un signal de récompense configurable : taux de succès des objectifs, précision de sélection des outils, pertinence, sécurité. Yoshiharu Okuda, directeur de la stratégie IA générative chez NTT DATA, a confirmé que des processus qui nécessitaient auparavant plusieurs semaines de réglage manuel se transforment désormais en cycles rapides et reproductibles. AgentCore est la plateforme d'Amazon Web Services pour construire, connecter et optimiser des agents IA à grande échelle, avec des milliers de développeurs déjà actifs. Cette annonce s'inscrit dans une course plus large entre les grands fournisseurs cloud pour proposer des outils d'opérationnalisation des agents, au-delà de la simple inférence. Google Vertex AI, Microsoft Azure AI et AWS se disputent les équipes qui passent de la phase expérimentale à la production à grande échelle, là où la maintenance de la qualité devient un défi d'ingénierie à part entière. En automatisant la boucle observer-évaluer-améliorer, AWS positionne AgentCore comme une infrastructure de fond pour les organisations qui ne peuvent pas se permettre des équipes dédiées à l'optimisation manuelle de prompts sur des cycles hebdomadaires, alors que leurs agents dérivent chaque jour en production.

OutilsActu
1 source
RunPod Flash : un outil Python open source pour accélérer le développement IA sans conteneurs
716VentureBeat AI 

RunPod Flash : un outil Python open source pour accélérer le développement IA sans conteneurs

RunPod, la plateforme cloud spécialisée dans les GPU haute performance pour le développement IA, a lancé ce jeudi un nouvel outil open source baptisé RunPod Flash. Distribué sous licence MIT, cet outil Python vise à supprimer une contrainte jusqu'ici incontournable dans le développement serverless sur GPU : la conteneurisation Docker. Dans le cycle de développement traditionnel, un développeur devait écrire un Dockerfile, construire une image, la pousser vers un registre, puis attendre que l'environnement se déploie avant qu'une seule ligne de code puisse s'exécuter sur un GPU distant. Flash remplace ce processus par un moteur de build multiplateforme qui génère automatiquement un artefact Linux x86_64 depuis un Mac M-series, détecte la version Python locale, force les wheels binaires, et monte les dépendances directement à l'exécution sur la flotte serverless de RunPod. Le nouveau décorateur @Endpoint, pièce centrale de cette version GA, centralise la configuration de ce pipeline en un seul appel de fonction. L'impact concret est double. Pour les équipes de recherche, la suppression de ce que RunPod appelle la "taxe de packaging" réduit drastiquement les cycles d'itération : plus besoin de rebuilder et repousser une image à chaque modification de code. Pour les applications en production, Flash embarque des fonctionnalités de niveau entreprise, API HTTP avec load balancing basse latence, traitement par lots en file d'attente, stockage persistant multi-datacenter. L'outil permet également de construire des pipelines dits "polyglots" : un endpoint CPU bon marché peut prendre en charge le prétraitement des données avant de router automatiquement vers un GPU NVIDIA H100 ou B200 pour l'inférence. Cette architecture réduit aussi les "cold starts", ces délais à froid qui pénalisent les environnements serverless, en évitant d'initialiser de lourdes images conteneurisées à chaque requête. Derrière Flash se trouve une infrastructure réseau propriétaire SDN/CDN que RunPod a construite pour résoudre ce que son CTO Brennen Smith décrit comme le vrai problème du GPU cloud : non pas les processeurs eux-mêmes, mais le réseau et le stockage qui les relient. L'outil est explicitement conçu pour servir de substrat aux agents IA et assistants de code, Claude Code, Cursor, Cline sont cités nommément, leur permettant d'orchestrer et déployer du matériel distant de façon autonome. "Tout le monde parle d'IA agentique, mais il faut une colle solide pour que ces agents puissent réellement fonctionner", a déclaré Smith à VentureBeat. RunPod entre ainsi en compétition directe avec AWS Lambda et Modal sur le segment du serverless GPU, en pariant que la suppression de la friction de déploiement sera le facteur décisif pour les labs et équipes produit qui multiplient les expérimentations IA.

OutilsActu
1 source
Baidu lance GenFlow 4.0 et améliore ses agents de stockage cloud et de bureautique
717Pandaily 

Baidu lance GenFlow 4.0 et améliore ses agents de stockage cloud et de bureautique

Le 27 avril, Baidu a présenté GenFlow 4.0 lors de son événement AI Day, une mise à jour majeure de son système d'agents IA généraliste. Cette nouvelle version est désormais disponible sur les versions PC et mobile de Baidu Netdisk, le service de stockage cloud de l'entreprise, et intègre des agents spécialisés pour les tâches bureautiques sur PowerPoint, Excel et Word. Les utilisateurs peuvent lancer une tâche depuis leur mobile et la faire exécuter sur PC, créant ainsi des flux de travail multi-appareils fluides. Depuis son lancement initial en avril 2025, GenFlow a atteint 100 millions d'utilisateurs actifs mensuels et 200 millions d'exécutions de tâches par mois. La version 4.0 améliore particulièrement la reconnaissance d'intention, la décomposition de tâches complexes, la coordination entre outils et la restitution des résultats. En pratique, GenFlow 4.0 permet des enchaînements bureautiques complets : analyser des données dans Excel, générer automatiquement une présentation PowerPoint à partir des résultats, puis compiler un rapport Word, le tout sans intervention manuelle entre chaque étape. Le système s'étend également à l'édition vidéo, à la gestion de photos et aux usages pédagogiques, en exploitant les fichiers déjà stockés dans le cloud. Pour renforcer la sécurité des données, Baidu introduit une fonctionnalité "espace de travail" qui limite l'accès de l'IA aux seuls fichiers autorisés. Côté entreprise, une fonctionnalité "Team Space" permet la collaboration multi-utilisateurs et la gestion de tâches par agents, déjà adoptée par plus de 10 000 organisations. Cette annonce s'inscrit dans la course acharnée que se livrent les géants technologiques chinois pour intégrer l'IA agentique dans leurs écosystèmes productifs. Baidu, qui doit faire face à une concurrence accrue d'Alibaba, Tencent et de nouveaux acteurs comme DeepSeek, mise sur Netdisk comme point d'ancrage stratégique pour déployer ses agents au quotidien. L'intégration directe dans un service de stockage à 100 millions d'utilisateurs actifs constitue un levier de diffusion considérable, et la direction prise vers l'automatisation de tâches complexes multi-applications pourrait redéfinir les standards attendus des assistants IA en milieu professionnel.

OutilsOutil
1 source
Amazon Bedrock Knowledge Bases : créer et déployer une solution de synchronisation automatique
718AWS ML Blog 

Amazon Bedrock Knowledge Bases : créer et déployer une solution de synchronisation automatique

Amazon Web Services a publié la description d'une solution serverless permettant de synchroniser automatiquement les bases de connaissances Amazon Bedrock avec les documents stockés dans Amazon S3, sans aucune intervention manuelle. Conçue selon une architecture événementielle, elle repose sur cinq services AWS articulés ensemble : EventBridge capte les modifications dans les buckets S3 en temps réel, des fonctions Lambda traitent ces événements, des files SQS absorbent les pics de requêtes, Step Functions orchestre le flux de synchronisation, et DynamoDB assure le suivi des changements et des métadonnées de jobs. Le tout se déploie via AWS SAM (Serverless Application Model), sans infrastructure à provisionner ni à maintenir. Deloitte figure parmi les entreprises ayant adopté ce type d'approche pour moderniser leur infrastructure de tests et de traitement documentaire. L'enjeu est considérable pour les organisations qui utilisent Bedrock Knowledge Bases dans des environnements multi-utilisateurs ou des applications critiques comme les systèmes de support client. Amazon Bedrock impose des quotas stricts : au maximum cinq jobs d'ingestion simultanés par compte AWS, un seul job par base de connaissances et un seul par source de données. L'API StartIngestionJob est en outre limitée à 0,1 requête par seconde, soit une requête toutes les dix secondes et par région. Sans orchestration, lorsqu'une équipe contenu met à jour plusieurs fichiers lors d'une release, les requêtes s'accumulent, percutent ces plafonds et finissent par nécessiter une supervision manuelle. La solution absorbe ces rafales en mettant les demandes en file d'attente via SQS et en les émettant au rythme autorisé par l'API, de façon totalement transparente. Amazon Bedrock Knowledge Bases est le service RAG (Retrieval-Augmented Generation) d'AWS qui permet aux modèles de fondation et aux agents IA d'accéder aux données privées d'une organisation afin de produire des réponses plus précises et contextualisées. Jusqu'ici, toute modification dans S3, ajout, suppression ou mise à jour de métadonnées, exigeait une synchronisation déclenchée manuellement, processus sujet aux oublis et aux retards. Ce manque de synchronisation en temps réel constitue l'un des principaux points de friction dans le déploiement d'agents IA en production. La solution proposée élimine ce point de friction pour les équipes travaillant en continu sur des bases documentaires volumineuses, et représente une avancée concrète vers des systèmes d'IA d'entreprise capables de rester à jour sans supervision humaine permanente.

OutilsOutil
1 source
Amazon Bedrock intègre la mémoire d'entreprise avec Amazon Neptune et Mem0
719AWS ML Blog 

Amazon Bedrock intègre la mémoire d'entreprise avec Amazon Neptune et Mem0

TrendMicro, l'un des plus grands éditeurs mondiaux de logiciels antivirus, a déployé une architecture de mémoire persistante pour son chatbot d'entreprise Trend's Companion, en collaboration avec les équipes AWS et son Generative AI Innovation Center. Le système repose sur trois piliers technologiques : Amazon Bedrock pour l'orchestration des agents IA, Amazon Neptune pour stocker un graphe de connaissances propre à chaque entreprise cliente, et Mem0 pour gérer à la fois la mémoire conversationnelle à court terme et la mémoire persistante à long terme. Concrètement, lorsqu'un utilisateur envoie un message, le modèle Claude sur Amazon Bedrock extrait automatiquement les entités, relations et éléments mémorisables, qui sont ensuite vectorisés via Amazon Bedrock Titan Text Embed et indexés dans Amazon OpenSearch Service et Neptune. Un mécanisme de réordonnancement via Amazon Bedrock Rerank ou Cohere Rerank garantit que les informations les plus pertinentes remontent en priorité lors de chaque requête. L'enjeu est de taille pour les chatbots d'entreprise : jusqu'ici, ces systèmes perdaient le fil dès qu'une conversation se terminait, obligeant les utilisateurs à se répéter et rendant impossible toute capitalisation sur les échanges passés. Avec cette architecture, le chatbot peut désormais référencer l'historique des interactions, retrouver des connaissances organisationnelles structurées et adapter ses réponses au contexte spécifique d'une entreprise cliente, sans que l'utilisateur ait besoin de tout réexpliquer. Un mécanisme de validation humaine renforce encore la fiabilité du système : après chaque réponse, l'IA associe ses affirmations aux souvenirs précis sur lesquels elle s'est appuyée, et l'utilisateur peut approuver ou rejeter ces associations. Les mémoires validées restent dans la base de connaissances ; les autres sont supprimées d'OpenSearch et de Neptune. Ce "human-in-the-loop" donne aux entreprises un contrôle direct sur la qualité et la fiabilité du savoir accumulé par leur chatbot. Cette initiative s'inscrit dans une tendance de fond qui voit les grands éditeurs tech chercher à transformer leurs assistants IA de simples répondeurs en véritables agents dotés de mémoire organisationnelle. TrendMicro fait face à une clientèle d'entreprises qui attendent des outils capables de comprendre leur environnement propre, leurs processus internes et leur historique de support, sans compromettre la sécurité des données. Le choix d'Amazon Neptune comme socle du graphe de connaissances est particulièrement significatif : contrairement à une base vectorielle classique, un graphe permet de modéliser des relations complexes entre entités, offrant une précision structurée que la recherche sémantique seule ne peut pas atteindre. A mesure que les agents IA autonomes se généralisent dans les entreprises, ce type d'architecture hybride, combinant graphe de connaissances, mémoire vectorielle et validation humaine, pourrait s'imposer comme un standard pour tout déploiement IA à l'échelle organisationnelle.

OutilsOutil
1 source
720AI News 

Snowflake élargit ses plateformes IA techniques et grand public

Snowflake a annoncé une expansion significative de ses deux plateformes d'intelligence artificielle, Snowflake Intelligence et Cortex Code, lors d'une mise à jour publiée cette semaine. Snowflake Intelligence cible les employés non techniques qui souhaitent automatiser des tâches métier en langage naturel : préparer des présentations, lancer des analyses multi-étapes ou envoyer des messages de suivi. Cortex Code, lui, s'adresse aux équipes de développement logiciel en entreprise. Parmi les nouveautés : des intégrations élargies avec Google Workspace, Jira, Salesforce et Slack via le protocole MCP (Model Context Protocol), de nouvelles connexions à des sources de données externes comme AWS Glue, Databricks et PostgreSQL, ainsi qu'un support du protocole ACP (Agent Communication Protocol). Une extension VS Code pour Cortex Code est en préversion privée, et un plugin Snowflake pour Claude Code est en cours de développement. Une application iOS pour Snowflake Intelligence doit entrer en préversion publique prochainement. La plateforme revendique plus de 9 100 clients utilisant ses produits IA chaque semaine, et plus de la moitié de sa base cliente utilise désormais l'une ou l'autre des deux plateformes depuis leur lancement il y a six mois. Ces annonces illustrent la montée en puissance des plateformes dites "agentiques" dans l'entreprise, capables d'exécuter des séquences de tâches de manière autonome à partir d'une simple instruction en langage naturel. Pour les grandes organisations, l'enjeu est de permettre à des collaborateurs sans compétences techniques de piloter des flux de travail complexes, tout en maintenant un contrôle strict sur les droits d'accès et la conformité aux politiques internes. La possibilité de sauvegarder et partager des workflows, combinée à des fenêtres de contexte étendues qui mémorisent les préférences utilisateur, réduit la friction dans l'adoption quotidienne. Le mode "Plan Mode", qui permet de prévisualiser et valider un flux avant son exécution, répond directement aux craintes des entreprises face aux agents IA autonomes. Ces développements s'inscrivent dans une course intense entre fournisseurs de données cloud pour devenir la couche d'orchestration IA de référence en entreprise. Snowflake, historiquement positionné sur le stockage et l'analyse de données, cherche à élargir son emprise vers l'exécution d'actions concrètes, un territoire que se disputent aussi Microsoft, Salesforce et Google. Les nouvelles fonctionnalités découlent en partie du projet SnowWork, une initiative de recherche lancée le mois dernier pour tester la plateforme et collecter les retours utilisateurs. L'ouverture via MCP et ACP signale une stratégie d'interopérabilité délibérée : plutôt que de construire un écosystème fermé, Snowflake mise sur la connectivité avec les outils déjà en place dans les organisations, pariant que la valeur viendra de l'orchestration plutôt que du remplacement.

OutilsOutil
1 source
721AWS ML Blog 

Commandes omnicanales avec Amazon Bedrock AgentCore et Amazon Nova 2 Sonic

Amazon a présenté une architecture complète pour construire des systèmes de commande vocale omnicanaux en s'appuyant sur deux de ses services cloud : Amazon Bedrock AgentCore, une plateforme dédiée au déploiement d'agents IA en production, et Amazon Nova 2 Sonic, un modèle de fondation speech-to-speech disponible via Amazon Bedrock. La solution permet à une application de traiter des commandes vocales en temps réel sur plusieurs points de contact simultanément, application mobile, site web et interface vocale, tout en maintenant le contexte conversationnel entre les échanges. L'infrastructure s'appuie sur AWS CDK pour le déploiement, le protocole MCP (Model Context Protocol) pour connecter l'agent IA aux services métier, et une série de services managés : Amazon Cognito pour l'authentification OAuth 2.0, API Gateway pour exposer les endpoints REST, AWS Lambda pour la logique métier, DynamoDB pour le stockage des profils et commandes, et AWS Location Services pour les recommandations géolocalisées de points de retrait. L'intérêt principal de cette architecture réside dans sa capacité à isoler chaque composant pour les faire évoluer indépendamment. AgentCore Runtime exécute chaque session utilisateur dans une microVM isolée, ce qui garantit qu'un pic de charge sur une session n'affecte pas les autres, un problème classique des systèmes vocaux en production. Le MCP standardise la communication entre l'agent et les services backend, ce qui permet de modifier ou d'étendre la logique métier sans réécrire le code d'intégration. Pour les équipes qui construisent des expériences de commande vocale à grande échelle, restauration rapide, retail, logistique, cette séparation claire entre la couche IA, le frontend et le backend réduit significativement la complexité opérationnelle et les risques de régression lors des mises à jour. La publication de cette solution s'inscrit dans une compétition intense autour des agents IA en production. Google, Microsoft et des acteurs comme Anthropic proposent leurs propres infrastructures agentiques, mais AWS mise sur l'intégration native avec son écosystème de services cloud existants comme différenciateur clé. Nova 2 Sonic, le modèle speech-to-speech au coeur du système, représente l'entrée d'Amazon dans les interfaces vocales conversationnelles en temps réel, un segment où OpenAI s'est imposé avec GPT-4o Voice. En publiant ce tutoriel complet avec une architecture de restaurant fictive comme backend d'exemple, Amazon cherche à accélérer l'adoption par les développeurs et à établir AgentCore comme standard de fait pour le déploiement d'agents IA sur AWS. Les prochaines étapes logiques incluront probablement l'extension à d'autres modalités et l'intégration avec des systèmes de caisse et d'inventaire existants.

OutilsOutil
1 source
Des ingénieurs chinois forment leurs sosies IA, et certains résistent
722MIT Technology Review 

Des ingénieurs chinois forment leurs sosies IA, et certains résistent

En Chine, des ingénieurs et développeurs sont de plus en plus poussés par leurs employeurs à documenter leurs méthodes de travail pour former des agents IA capables de les remplacer. Le phénomène a pris une dimension publique début avril 2026, lorsqu'un projet GitHub baptisé Colleague Skill est devenu viral sur les réseaux sociaux chinois. L'outil, créé par Tianyi Zhou, ingénieur au Shanghai Artificial Intelligence Laboratory, permet à un utilisateur de saisir le nom d'un collègue, d'importer automatiquement ses historiques de conversation et fichiers depuis les plateformes professionnelles Lark et DingTalk, puis de générer des manuels détaillés décrivant ses tâches, ses habitudes de communication et même ses petites particularités. Une utilisatrice shanghaïenne de 27 ans, Amber Li, a testé l'outil sur un ancien collègue : en quelques minutes, Colleague Skill avait produit un profil complet reproduisant jusqu'aux tics de ponctuation de la personne. Zhou a précisé au journal Southern Metropolis Daily que le projet était avant tout une provocation satirique, née des licenciements liés à l'IA et de la tendance croissante des entreprises à demander à leurs salariés de s'automatiser eux-mêmes. Il n'a pas souhaité commenter davantage. Ce qui était une blague a touché quelque chose de réel. La viralité de Colleague Skill a déclenché un débat de fond sur la dignité et l'individualité des travailleurs à l'ère de l'IA. Sur les réseaux sociaux chinois, les ingénieurs alternent entre humour noir et malaise sincère : un commentaire sur Rednote résume l'ambiance, suggérant d'automatiser ses collègues avant eux-mêmes pour survivre un peu plus longtemps. Un développeur ayant requis l'anonymat a confié à MIT Technology Review avoir formé un agent sur son propre workflow et avoir trouvé l'expérience profondément réductrice, comme si des années de savoir-faire avaient été compressées en modules interchangeables. Amber Li, malgré la précision troublante du résultat, qualifie l'expérience d'«étrange et inconfortable». Ce mouvement s'inscrit dans un contexte plus large : depuis qu'OpenClaw, un outil d'agent IA, est devenu un phénomène national en Chine, de nombreuses entreprises tech encouragent leurs équipes à expérimenter les agents pour des tâches comme la lecture de mails, la navigation web ou le débogage de code. Mais Hancheng Cao, professeur assistant à l'université Emory spécialisé dans l'IA et le travail, souligne que l'enjeu dépasse la mode managériale : en demandant à leurs employés de produire ces blueprints, les entreprises cartographient discrètement leur capital humain, identifient ce qui peut être standardisé et ce qui reste irréductiblement humain. Pour les salariés, la frontière entre optimisation et précarisation organisée devient de plus en plus floue.

SociétéActu
1 source
723VentureBeat AI 

Traza lève 2,1 millions de dollars auprès de Base10 pour automatiser les processus d'approvisionnement par IA

Traza, une startup new-yorkaise fondée récemment, a annoncé la clôture d'un tour de table pré-seed de 2,1 millions de dollars mené par Base10 Partners, avec la participation de Kfund, des scouts d'a16z, Clara Ventures, Masia Ventures, et plusieurs business angels dont Pepe Agell, l'homme qui avait porté Chartboost à 700 millions d'utilisateurs mensuels avant sa rachat par Zynga. L'entreprise développe des agents IA capables d'automatiser entièrement les processus d'approvisionnement en entreprise : envoi de demandes de devis, suivi des commandes, communications fournisseurs, traitement des factures, le tout sans supervision humaine continue. Selon ses premières données de déploiement, Traza revendique une réduction de 70 % du temps humain consacré aux tâches d'achat, et des cycles d'approvisionnement trois fois plus rapides que les processus manuels. L'enjeu est considérable. Le marché des logiciels de procurement dépasse déjà 8 milliards de dollars et croît d'environ 10 % par an, mais le vrai gisement de valeur se trouve ailleurs : dans les pertes silencieuses qui surviennent après la signature des contrats. Une étude de World Commerce & Contracting et Ironclad estime que les entreprises perdent en moyenne 11 % de la valeur totale de leurs contrats une fois ceux-ci signés, un phénomène baptisé "value leakage post-signature". Pour une grande entreprise avec 500 millions de dollars de dépenses contractualisées annuelles, cela représente 55 millions qui s'évaporent chaque année, non pas à cause de mauvaises négociations, mais faute de suivi opérationnel. La majorité des entreprises ne gèrent activement que leurs 20 % de fournisseurs principaux ; les 80 % restants sont largement laissés à l'abandon. Le secteur du procurement n'a pas manqué de solutions logicielles ces dernières années, SAP Ariba, Coupa, Zip, Fairmarkit ou encore Tonkean ont tous intégré des couches d'IA à leurs plateformes. Mais ces outils sont restés des copilotes : ils analysent, suggèrent, alertent, sans jamais agir. Traza représente un changement de posture, passant du conseil à l'exécution autonome. Le PDG et cofondateur Silvestre Jara Montes positionne explicitement sa startup dans la "couche opérationnelle" du contrat, là où la valeur se perd le plus concrètement. Avec un financement modeste mais des investisseurs emblématiques de l'écosystème IA, Traza entre sur un marché où les grands éditeurs ERP ont historiquement tardé à innover, et où la promesse des agents autonomes pourrait trouver son premier cas d'usage industriel à grande échelle.

BusinessOpinion
1 source
724AWS ML Blog 

Le Spring AI SDK pour Amazon Bedrock AgentCore est désormais en disponibilité générale

Amazon a rendu disponible en accès général le Spring AI SDK pour Amazon Bedrock AgentCore, une bibliothèque open source qui permet aux développeurs Java de construire et déployer des agents IA autonomes en production sur l'infrastructure d'AWS. Ce SDK s'intègre nativement dans l'écosystème Spring Boot 3.5 et Java 17 minimum, en exploitant les patterns familiers du framework : annotations, auto-configuration et advisors composables. Concrètement, un développeur ajoute une dépendance au projet, annote une méthode, et le SDK prend en charge tout le reste, de la gestion des endpoints jusqu'au streaming des réponses en temps réel. Jusqu'à présent, intégrer Amazon Bedrock AgentCore dans une application Spring représentait plusieurs semaines de travail d'infrastructure avant même d'écrire la moindre logique métier : il fallait implémenter manuellement les endpoints /invocations et /ping, gérer le streaming Server-Sent Events avec son protocole précis, configurer les health checks, le rate limiting, et connecter les advisors et les outils. Le SDK automatise entièrement ce contrat technique imposé par l'AgentCore Runtime. En particulier, il détecte automatiquement les tâches asynchrones longues et signale un statut "HealthyBusy" au runtime pour éviter qu'il ne retire des ressources pendant un traitement actif, un détail critique dans un modèle de facturation à l'usage où les temps d'inactivité ne sont pas facturés. Les équipes peuvent ainsi se concentrer sur la logique des agents plutôt que sur la plomberie infrastructure, et déployer des fonctionnalités comme la mémoire conversationnelle, l'automatisation de navigateur et l'exécution de code en sandbox. L'émergence de ce SDK s'inscrit dans une tendance de fond : les entreprises cherchent à passer des preuves de concept en IA générative à des systèmes agentiques véritablement opérationnels à grande échelle, capables de planifier et d'exécuter des tâches complexes en plusieurs étapes de manière autonome. AWS positionne Bedrock AgentCore comme une plateforme universelle, compatible avec n'importe quel framework et n'importe quel modèle. En ciblant spécifiquement la communauté Java et Spring, l'une des plus larges dans l'entreprise, Amazon ouvre un couloir direct vers la production pour des millions de développeurs backend qui auraient autrement dû franchir une barrière technique considérable. La concurrence dans ce segment est vive : Microsoft avec Azure AI, Google avec Vertex AI et des acteurs comme LangChain ou CrewAI proposent leurs propres abstractions pour les agents IA. La disponibilité générale du Spring AI AgentCore SDK marque une étape dans la maturité de l'outillage autour des agents IA en entreprise, où la gouvernance, la sécurité et la scalabilité deviennent des critères aussi importants que les capacités du modèle lui-même.

UELes développeurs Java et Spring Boot en Europe peuvent intégrer directement Amazon Bedrock AgentCore dans leurs projets sans semaines de travail d'infrastructure, accélérant la mise en production d'agents IA sur AWS.

OutilsOutil
1 source
725AWS ML Blog 

Amazon Bedrock AgentCore Runtime introduit des capacités MCP client avec état

Amazon a introduit des capacités client MCP (Model Context Protocol) avec état dans son service AgentCore Runtime sur Amazon Bedrock, marquant une évolution majeure pour les développeurs d'agents IA. Jusqu'à présent, les serveurs MCP hébergés sur cette plateforme fonctionnaient en mode sans état : chaque requête HTTP était traitée de façon indépendante, sans mémoire entre les appels. Le nouveau mode avec état, activé via un simple paramètre stateless_http=False, provision une microVM dédiée par session utilisateur, persistant jusqu'à 8 heures ou 15 minutes d'inactivité. Cette architecture permet désormais trois capacités clés du protocole MCP : l'élicitation (demander une saisie utilisateur en cours d'exécution), le sampling (solliciter du contenu généré par un LLM côté client), et les notifications de progression (streamer des mises à jour en temps réel). La continuité de session est assurée via un en-tête Mcp-Session-Id, échangé lors de l'initialisation et inclus dans toutes les requêtes suivantes. Ces nouvelles capacités transforment fondamentalement la nature des workflows agents. Là où les implémentations sans état forçaient les agents à s'exécuter de bout en bout sans interruption, les agents peuvent désormais mener de véritables conversations bidirectionnelles avec leurs clients : s'arrêter pour demander une clarification à l'utilisateur au milieu d'un appel d'outil, déléguer dynamiquement la génération de contenu au LLM présent côté client, ou signaler l'avancement d'opérations longues en temps réel. Pour les équipes qui construisent des assistants IA complexes, des pipelines de traitement de documents ou des agents d'automatisation nécessitant validation humaine intermédiaire, c'est un changement de paradigme concret qui élimine des contournements architecturaux souvent coûteux à maintenir. Le Model Context Protocol, standard ouvert définissant comment les applications LLM se connectent à des outils et sources de données externes, gagne rapidement en adoption depuis son lancement par Anthropic fin 2024. Amazon avait déjà intégré l'hébergement de serveurs MCP sans état dans AgentCore Runtime dans une version précédente ; cette mise à jour complète l'implémentation bidirectionnelle du protocole. L'isolation entre sessions via des microVMs dédiées garantit la sécurité et l'indépendance des contextes, chaque session bénéficiant de CPU, mémoire et système de fichiers séparés. Si une session expire ou que le serveur redémarre, les clients reçoivent une erreur 404 et doivent réinitialiser la connexion. Cette approche positionne AWS comme un acteur central dans l'infrastructure d'agents IA d'entreprise, en rivalité directe avec les offres similaires de Microsoft Azure et Google Cloud dans la course à standardiser les architectures agentiques.

UELes équipes européennes développant des agents IA sur des plateformes cloud peuvent désormais implémenter des workflows agentiques bidirectionnels natifs sans contournements architecturaux coûteux.

OutilsActu
1 source
LaCy : ce que les petits modèles de langage peuvent et doivent apprendre ne se réduit pas à une question de perte
726Apple Machine Learning 

LaCy : ce que les petits modèles de langage peuvent et doivent apprendre ne se réduit pas à une question de perte

Une étude présentée au workshop "Memory for LLM-Based Agentic Systems" de la conférence ICLR 2025 s'attaque à une question fondamentale pour les petits modèles de langage (SLM) : que doivent-ils apprendre lors du préentraînement, et que doivent-ils déléguer à des sources externes ? Les chercheurs ont développé LaCy, un cadre théorique et expérimental qui questionne la fonction de perte standard utilisée pour entraîner ces modèles, en montrant qu'optimiser uniquement la vraisemblance des données n'est pas suffisant pour des SLM efficaces et fiables. Le problème est structurel : contrairement aux grands modèles comme GPT-4 ou Llama 3, les SLM disposent d'une capacité paramétrique limitée, ce qui les contraint à faire des choix sur les connaissances à mémoriser. Sans mécanisme adapté, ils génèrent des faits incorrects plutôt que d'admettre leur ignorance et de consulter une base de données ou un modèle plus puissant. LaCy propose de reformuler ce que le modèle "devrait" apprendre en tenant compte explicitement de la disponibilité de sources externes, comme des documents récupérés par RAG ou des API spécialisées. Ce travail s'inscrit dans la tendance croissante à déployer des agents IA embarqués sur des appareils à faible puissance, où les gros modèles ne peuvent pas tourner localement. Alors que des entreprises comme Google, Apple ou Mistral misent sur des SLM pour l'edge computing et les assistants embarqués, la question de la frontière entre mémoire paramétrique et mémoire externe devient stratégique. LaCy ouvre la voie à des entraînements plus ciblés, où le modèle apprend à savoir ce qu'il ne sait pas.

UEMistral, entreprise française en pointe sur les petits modèles pour l'edge computing, est directement concernée par les conclusions de LaCy sur l'optimisation de l'entraînement des SLM.

RecherchePaper
1 source
Combiner Google Search, Google Maps et fonctions personnalisées dans un appel Gemini avec chaînes d'agents multi-étapes
727MarkTechPost 

Combiner Google Search, Google Maps et fonctions personnalisées dans un appel Gemini avec chaînes d'agents multi-étapes

Google a annonce en mars 2026 une mise a jour majeure de son API Gemini permettant desormais de combiner dans un seul appel API des outils integres comme Google Search et Google Maps avec des fonctions personnalisees definies par le developpeur. Jusqu'ici, ces capacites devaient etre appelees separement, necessitant plusieurs requetes et une orchestration manuelle cote client. La mise a jour introduit egalement trois mecanismes cles : la circulation de contexte, qui preserve l'historique complet de chaque appel d'outil et de chaque reponse entre les tours de conversation ; les identifiants uniques de reponse d'outil, qui permettent de lier precisement chaque appel de fonction parallele a son resultat correspondant ; et le "Grounding with Google Maps", qui injecte des donnees de localisation en temps reel directement dans le raisonnement du modele. Les modeles concernes sont gemini-3-flash-preview pour les combinaisons d'outils et gemini-2.5-flash pour l'ancrage cartographique, les deux etant accessibles sans configuration de facturation. Cette evolution transforme la facon dont les developpeurs peuvent construire des agents IA autonomes. Auparavant, orchestrer plusieurs sources d'information, une recherche web, une donnee meteo via API tierce, et une localisation geographique, exigeait plusieurs allers-retours et une logique de coordination externe complexe. Desormais, un unique appel suffit pour que Gemini planifie, execute et synthetise des informations issues de sources heterogenes en une seule chaine de raisonnement. Pour les applications metier, assistants de voyage, outils de veille concurrentielle, agents de support client, cela reduit la latence, simplifie l'architecture et rend les systemes multi-outils beaucoup plus accessibles aux equipes de taille modeste. L'introduction des identifiants de reponse paralleles resout par ailleurs un probleme concret de fiabilite : quand plusieurs fonctions sont appelees simultanement, il etait auparavant difficile de garantir que chaque reponse correspondait bien a la bonne requete. Ces annonces s'inscrivent dans une competition intense entre Google, OpenAI et Anthropic pour imposer leur API comme la couche d'orchestration de reference pour les agents IA. OpenAI avait deja introduit le "parallel function calling" dans GPT-4 en 2023, et Anthropic a renforce les capacites d'outils de Claude tout au long de 2025. Google repond avec une integration native de son ecosysteme, Search et Maps etant des atouts considerables qu'aucun concurrent ne peut repliquer a l'identique. La prochaine etape probable est une extension de ce modele a d'autres services Google (Gmail, Calendar, Drive), transformant Gemini en un agent capable d'agir directement dans l'infrastructure numerique quotidienne des entreprises. La question qui demeure est celle du controle et de la transparence : a mesure que les chaines agentiques se complexifient, auditer ce qu'un modele a reellement fait, et pourquoi, devient un enjeu critique pour la confiance des utilisateurs professionnels.

OutilsOutil
1 source
Les modeles se standardisent : l'avantage concurrentiel en IA se deplace vers les donnees maitrisees et leurs plateformes
728VentureBeat AI 

Les modeles se standardisent : l'avantage concurrentiel en IA se deplace vers les donnees maitrisees et leurs plateformes

Alors que les grands modèles de langage atteignent un niveau de performance comparable entre eux, l'avantage concurrentiel dans l'IA d'entreprise se déplace vers la donnée et les plateformes qui la gouvernent. C'est le constat que dresse Box, spécialiste de la gestion de contenu cloud, dans une analyse publiée début avril 2026. Selon Yash Bhavnani, responsable IA chez Box, "ce n'est plus ce que fait le modèle qui compte, c'est la donnée non structurée de l'entreprise elle-même : ses contrats, ses dossiers clients, ses spécifications produits, la façon dont tout cela est organisé, gouverné et rendu accessible à l'IA." Ben Kus, directeur technique de Box, va plus loin : "Les organisations qui domineront en IA sont celles qui auront construit l'infrastructure de gouvernance pour rendre n'importe quel modèle fiable, avec les bons droits d'accès, le bon contenu accessible et une piste d'audit claire pour chaque action." L'enjeu est immédiat et concret. Quand des employés utilisent des modèles frontières pour résumer des documents ou rédiger des rapports sans connexion à un système de référence interne contrôlé, les résultats deviennent impossibles à auditer et potentiellement dangereux. Bhavnani cite l'exemple d'un assureur qui utilise l'IA pour analyser des sinistres : une faible précision ou une sortie non traçable est tout simplement inacceptable. Plus grave encore, Box rapporte que des clients constatent que leurs employés téléchargent des documents sensibles sur des comptes personnels pour y lancer leurs propres workflows IA, sans aucune visibilité côté entreprise. Ce contournement génère des doublons, des silos de connaissance fantômes et des risques de conformité réels dans des secteurs soumis à HIPAA, FedRAMP High ou SOC 2. La montée en puissance des agents IA autonomes, capables d'exécuter des tâches multi-étapes sur des documents et des systèmes entiers sans intervention humaine, rend la question encore plus critique. Ces agents agissent plus vite que les humains et manquent souvent du jugement contextuel nécessaire pour distinguer les données auxquelles ils sont autorisés à accéder. Kus est catégorique : "Une plateforme IA sans gestion des permissions est trop dangereuse à déployer." Box positionne ainsi ses plateformes de contenu non plus comme de simples dépôts de fichiers, mais comme des couches d'orchestration, des "AI control planes" intercalés entre les modèles, les agents et les données d'entreprise. Cette évolution reflète un virage structurel dans l'industrie : la prochaine bataille de l'IA d'entreprise ne se jouera pas sur les benchmarks des modèles, mais sur la capacité des éditeurs de logiciels à offrir une gouvernance des données robuste, traçable et intégrée nativement à chaque flux de travail.

UELa problématique de gouvernance des données IA est directement applicable aux entreprises européennes soumises au RGPD, qui impose traçabilité et contrôle des accès sur les données personnelles traitées par des systèmes automatisés.

OutilsActu
1 source
Why AI Systems Fail Quietly
729IEEE Spectrum AI 

Why AI Systems Fail Quietly

Dans les systèmes d'intelligence artificielle distribués, une nouvelle catégorie de pannes préoccupe de plus en plus les ingénieurs : des défaillances silencieuses où tout semble fonctionner normalement, les tableaux de bord restent au vert, les journaux d'erreurs sont vides, et pourtant les décisions produites par le système se dégradent progressivement. L'exemple typique est celui d'un assistant IA d'entreprise chargé de synthétiser des mises à jour réglementaires pour des analystes financiers : il continue de générer des résumés cohérents, de récupérer des documents valides, de distribuer ses synthèses sans interruption, mais il travaille silencieusement sur des informations obsolètes parce qu'un dépôt documentaire mis à jour n'a jamais été intégré à son pipeline de récupération. Aucune alerte ne se déclenche. Aucun composant ne tombe en panne. Le système fonctionne exactement comme prévu, mais son résultat est faux. Ce phénomène représente une rupture fondamentale avec la manière dont l'industrie logicielle a traditionnellement pensé la fiabilité. Les outils d'observabilité classiques, conçus autour de métriques comme la disponibilité, la latence et les taux d'erreur, sont bien adaptés aux applications transactionnelles où chaque requête est traitée indépendamment et où la correction peut être vérifiée immédiatement. Ils deviennent insuffisants face aux systèmes autonomes, qui fonctionnent en boucles de raisonnement continues : chaque décision influence les actions suivantes, et la correction du résultat émerge non pas d'un calcul isolé mais d'une séquence d'interactions entre composants, étalée dans le temps. Un agent de planification peut générer des étapes localement raisonnables mais globalement dangereuses. Un système de décision distribué peut exécuter des actions correctes dans le mauvais ordre. Aucune de ces conditions ne produit nécessairement d'erreur au sens technique du terme. La cause profonde est architecturale. Les logiciels traditionnels reposent sur des opérations discrètes, déclenchées de l'extérieur par un utilisateur ou un planificateur, avec un contrôle épisodique et traçable. Les systèmes autonomes modernes, qu'il s'agisse d'agents IA maintenant un contexte entre les interactions, de systèmes d'infrastructure ajustant leurs ressources en temps réel ou de workflows automatisés enchaînant des actions sans intervention humaine, observent, raisonnent et agissent en continu. La correction ne dépend plus du bon fonctionnement de chaque composant individuel, mais de la coordination dans le temps d'un flux de décisions prises par des modèles, des moteurs de raisonnement et des algorithmes de planification. Les ingénieurs spécialisés dans les systèmes distribués connaissent bien les problèmes de coordination, mais il s'agit ici d'une coordination d'un type nouveau : non plus maintenir la cohérence des données entre services, mais garantir qu'une chaîne de décisions autonomes reste alignée avec l'intention initiale du système, même lorsque rien ne se casse.

SécuritéOpinion
1 source
Boomi appelle cela l'activation des données et affirme qu'il s'agit du maillon manquant dans tout déploiement d'IA
730AI News 

Boomi appelle cela l'activation des données et affirme qu'il s'agit du maillon manquant dans tout déploiement d'IA

En 2026, le principal obstacle au déploiement de l'intelligence artificielle en entreprise n'est pas la qualité des modèles ni leur capacité à raisonner : c'est la fragmentation des données. C'est le constat que tire Boomi, spécialiste de l'intégration de données, après avoir analysé 75 000 agents IA en production chez ses clients. La société, qui revendique plus de 30 000 clients dans le monde dont plus d'un quart du Fortune 500, a présenté le 9 mars 2026 une mise à jour majeure de sa plateforme centrée sur ce qu'elle appelle l'"activation des données" pour l'IA agentique. Steve Lucas, PDG de Boomi, résume la position de l'entreprise : "L'IA ne crée de valeur que lorsque les données sont correctement activées, fiables et gouvernées au préalable." Pour répondre à ce problème, Boomi a lancé Meta Hub, un référentiel central conçu pour standardiser les définitions métier à travers l'entreprise et fournir un contexte cohérent à chaque agent IA. La mise à jour inclut également une extraction en temps réel des données SAP via la capture de données en continu, ainsi que de nouvelles fonctionnalités de gouvernance pour les agents Snowflake Cortex, avec journaux d'audit et traces de session intégrés dans l'Agent Control Tower de Boomi. L'enjeu est considérable pour les grandes organisations. Un agent IA qui croise des données clients issues d'un CRM avec des données tarifaires issues d'un ERP peut se retrouver à travailler à partir de définitions contradictoires d'un même concept, qu'il s'agisse d'un client ou d'un produit. Les résultats qu'il produit ne sont cohérents que si les standards de données sous-jacents le sont aussi. C'est précisément ce vide que Boomi cherche à combler : permettre aux agents de raisonner à partir d'une compréhension unifiée de la logique métier, plutôt que de synthétiser des interprétations disparates tirées de systèmes cloisonnés. La question de la gouvernance prend également de l'importance, les entreprises réclamant de plus en plus de visibilité sur les actions prises par leurs agents IA, jusqu'ici trop souvent opaques. Ce positionnement reçoit une validation externe significative. Le 16 mars, Gartner a classé Boomi parmi les Leaders de son Magic Quadrant 2026 pour les plateformes d'intégration en tant que service, pour la douzième année consécutive, en le plaçant en tête sur la capacité d'exécution. Le 31 mars, l'IDC MarketScape sur la gestion des API à l'échelle mondiale lui a accordé le même rang, soulignant sa stratégie centrée sur l'IA. Gartner note explicitement que "l'intégration prête pour l'IA" est désormais un critère d'évaluation stratégique à part entière, ce qui marque un tournant : les plateformes iPaaS ne sont plus jugées uniquement sur leurs capacités d'intégration traditionnelles, mais sur leur aptitude à rendre les agents IA fiables dans des processus métier réels. Le passage du pilote à la production reste bloqué pour beaucoup d'organisations non pas faute de modèles, mais faute d'infrastructure de données à la hauteur.

UELes entreprises européennes clientes de Boomi pourraient bénéficier de ces nouvelles capacités d'activation des données pour leurs déploiements d'agents IA, sans impact réglementaire ou stratégique spécifique à la France ou à l'UE.

OutilsActu
1 source
Des agents d'intégration des employés par IA avec Amazon Quick
731AWS ML Blog 

Des agents d'intégration des employés par IA avec Amazon Quick

Amazon a lancé Quick, un service d'agents IA entièrement géré et sans code, conçu pour automatiser l'onboarding des nouveaux employés en entreprise. Concrètement, Quick permet aux équipes RH de créer des assistants conversationnels capables de répondre aux questions des nouvelles recrues sur les politiques internes, les avantages sociaux ou les procédures administratives, de suivre la complétion des documents de conformité, et de traiter automatiquement les tickets courants, comme une demande d'équipement IT via ServiceNow ou l'envoi d'un message de bienvenue sur Slack. Le service s'intègre aux outils existants de l'entreprise : SharePoint, OneDrive, Confluence, Amazon S3, et les outils de gestion de projet. Il repose sur trois composants clés : des bases de connaissances indexées depuis ces sources multiples, des connecteurs d'actions permettant à l'agent d'agir directement dans les systèmes tiers, et des espaces collaboratifs qui regroupent fichiers, tableaux de bord et bases de connaissances pour une équipe donnée. L'enjeu est significatif pour les grandes organisations : les entreprises perdent un temps considérable par nouvelle recrue pendant la période d'intégration, les employés n'atteignant souvent qu'une fraction de leur productivité potentielle durant le premier mois. Les équipes RH, elles, s'épuisent à répondre aux mêmes questions répétitives, à basculer entre wikis, emails, outils de ticketing et plateformes de messagerie pour coordonner chaque étape. Avec Quick, un agent unifié centralise toutes ces interactions : il présente la checklist d'onboarding à jour, répond avec un langage validé par l'entreprise, ouvre des demandes dans les outils métier, et oriente le nouvel arrivant vers l'étape suivante, le tout sans intervention manuelle d'un chargé RH. Ce lancement s'inscrit dans la stratégie plus large d'Amazon Web Services d'imposer ses services managés dans les workflows d'entreprise, face à des concurrents comme Microsoft Copilot ou ServiceNow Now Assist qui occupent déjà ce terrain. L'approche sans code de Quick vise explicitement les équipes RH non techniques, qui peuvent configurer leurs agents via une interface visuelle plutôt que du développement sur mesure. Deux modes coexistent : un assistant système généraliste disponible par défaut, et des agents personnalisés adaptés aux processus spécifiques de chaque organisation. La question qui se pose désormais est celle de l'adoption réelle dans des environnements enterprise souvent fragmentés, où les intégrations avec des dizaines d'outils legacy restent le principal frein, et où la gouvernance des données RH sensibles transitant par un service cloud tiers soulèvera inévitablement des questions de conformité.

UELes entreprises européennes devront évaluer la conformité RGPD avant de confier des données RH sensibles à ce service cloud américain.

OutilsOutil
1 source
Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur
732AWS ML Blog 

Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur

Amazon a introduit une fonctionnalité de personnalisation de modèles sans serveur dans SageMaker AI, permettant aux équipes d'améliorer drastiquement les capacités d'appel d'outils des agents IA sans gérer d'infrastructure GPU. Dans un cas concret publié début avril 2026, des ingénieurs ont affiné le modèle Qwen 2.5 7B Instruct en utilisant la technique RLVR (Reinforcement Learning with Verifiable Rewards) et ont obtenu une amélioration de 57% du score de qualité des appels d'outils sur des scénarios inédits, c'est-à-dire des outils que le modèle n'avait jamais vus lors de l'entraînement. La méthode repose sur un principe simple : le modèle génère huit réponses candidates par prompt, une fonction de récompense vérifie lesquelles sont correctes, et l'algorithme GRPO (Group Relative Policy Optimization) renforce les comportements qui surpassent la moyenne du groupe. SageMaker AI prend en charge les familles de modèles Amazon Nova, Llama, Qwen et DeepSeek, avec un suivi des métriques via MLflow intégré. L'enjeu est concret : les agents IA en production échouent fréquemment lors des appels d'outils, qu'il s'agisse d'halluciner des fonctions inexistantes, de passer des paramètres incorrects, ou de déclencher une action là où ils devraient demander une clarification. Ces erreurs bloquent le déploiement en production et détruisent la confiance des utilisateurs. La nouvelle approche serverless d'Amazon supprime l'obstacle opérationnel majeur que représentait jusqu'ici le fine-tuning par renforcement : achat de GPU, orchestration mémoire entre les phases de rollout et d'entraînement, infrastructure de récompenses, gestion des checkpoints. Les équipes peuvent désormais se concentrer sur leurs données, leur modèle et leur fonction de récompense, le reste étant géré par la plateforme. Le fine-tuning supervisé classique (SFT) montre ses limites pour ce type de tâche : il nécessite des exemples étiquetés pour chaque comportement souhaité, mais peine à généraliser la prise de décision entre appeler un outil, demander des informations supplémentaires, ou refuser d'agir. RLVR contourne ce problème en exploitant la nature vérifiable des appels d'outils : soit le modèle a appelé la bonne fonction avec les bons paramètres, soit non. Cette objectivité binaire rend l'appel d'outils particulièrement adapté à l'apprentissage par renforcement. Amazon positionne cette offre dans un marché de l'IA agentique en forte croissance, où des acteurs comme Google (Vertex AI), Microsoft (Azure ML) et des startups spécialisées se disputent les équipes qui cherchent à industrialiser des agents fiables, avec un accès simplifié via SageMaker Studio et un compte AWS standard.

OutilsActu
1 source
Meta utilise l'IA pour cartographier les connaissances tacites dans ses pipelines de données
733Meta Engineering ML 

Meta utilise l'IA pour cartographier les connaissances tacites dans ses pipelines de données

Meta a développé un système original pour rendre ses agents IA capables de travailler efficacement sur une base de code massive : un pipeline de données couvrant quatre dépôts, trois langages de programmation et plus de 4 100 fichiers. Face à l'inefficacité des assistants IA classiques sur ce terrain, incapables de produire des modifications utiles rapidement, les ingénieurs ont conçu un moteur de pré-calcul composé de plus de 50 agents IA spécialisés. Ces agents ont systématiquement parcouru l'ensemble du code pour produire 59 fichiers de contexte condensés, encodant ce que les développeurs appellent le « tribal knowledge » : les règles implicites et les conventions qui n'existent que dans la tête des ingénieurs. Résultat : la couverture structurée du code est passée de 5 % à 100 % des modules, soit les 4 100 fichiers des trois dépôts. Plus de 50 patterns « non-évidents » ont été documentés pour la première fois, et les tests préliminaires montrent une réduction de 40 % des appels d'outils par les agents IA pour chaque tâche. L'enjeu n'est pas anodin. Sans cette cartographie, les agents IA se comportaient comme des développeurs juniors largués sur un projet inconnu : ils compilaient du code fonctionnel en apparence, mais subtilement incorrect. Par exemple, deux modes de configuration utilisent des noms de champs différents pour la même opération, les inverser produit une erreur silencieuse. Ou encore, des dizaines de valeurs d'énumération marquées « deprecated » ne peuvent jamais être supprimées, car la compatibilité de sérialisation en dépend. Aucune de ces règles n'était écrite nulle part. En les formalisant, Meta permet désormais à des modèles IA variés de naviguer le codebase de manière fiable, le système de connaissance étant indépendant du modèle utilisé. L'infrastructure se maintient aussi elle-même : toutes les quelques semaines, des jobs automatisés valident les chemins de fichiers, détectent les lacunes de couverture et corrigent les références obsolètes. Ce projet s'inscrit dans une tendance plus large où les grandes entreprises tech cherchent à industrialiser l'usage des agents IA sur des codebases de production réels, bien au-delà des démos. Meta avait déjà déployé des systèmes IA pour des tâches opérationnelles, surveillance de dashboards, reconnaissance de patterns incidents, suggestions de corrections, mais l'extension aux tâches de développement butait sur ce problème fondamental d'absence de contexte. La solution choisie, baptisée « compass, not encyclopedia », repose sur des fichiers ultra-compacts de 25 à 35 lignes environ 1 000 tokens chacun, organisés en quatre sections : commandes clés, fichiers essentiels, patterns non-évidents, et références croisées. Les 59 fichiers réunis pèsent moins d'un contexte de modèle standard. C'est cette sobriété délibérée, chaque ligne justifie sa présence, qui permet au système de rester maintenable et scalable à mesure que le codebase évolue.

OutilsActu
1 source
Podcast : l'ingénierie de contexte avec Adi Polak
734InfoQ AI 

Podcast : l'ingénierie de contexte avec Adi Polak

Thomas Betts et Adi Polak, ingénieure en intelligence artificielle, consacrent un épisode de podcast à l'ingénierie de contexte, une approche émergente pour concevoir des systèmes d'IA agentiques. Là où le prompt engineering traite chaque interaction de manière isolée, sans mémoire ni état persistant, l'ingénierie de contexte permet aux systèmes d'IA de conserver un état entre les échanges, en gérant activement les informations transmises au modèle de langage à chaque étape. Cette distinction est importante pour les développeurs qui construisent des agents IA capables d'exécuter des tâches complexes en plusieurs étapes. Un système purement basé sur les prompts oublie ce qu'il a fait à l'étape précédente ; un système à contexte géré peut accumuler des informations, prendre des décisions cohérentes sur la durée et mieux s'adapter aux objectifs à long terme. C'est un changement de paradigme qui touche directement la fiabilité des agents autonomes en production. L'ingénierie de contexte s'inscrit dans une réflexion plus large sur les limites des LLMs sans mémoire native. Avec l'essor des frameworks agentiques comme LangChain, LlamaIndex ou AutoGen, la communauté cherche des méthodes rigoureuses pour structurer ce que les modèles "voient" à chaque appel. Adi Polak, dont les travaux portent sur la mise en production de systèmes d'IA, positionne cette discipline comme une compétence fondamentale pour les ingénieurs qui veulent passer du prototype à l'application robuste.

LLMsTuto
1 source
OPINION. « Fin de la taxe Zucman : vers une fiscalité des agents intelligents »
735La Tribune 

OPINION. « Fin de la taxe Zucman : vers une fiscalité des agents intelligents »

Gabriel Zucman, économiste français reconnu pour ses travaux sur la fiscalité des ultra-riches, a défendu une taxation mondiale des grandes fortunes comme réponse aux inégalités croissantes. Mais une tribune d'opinion publiée récemment remet en question cette approche au profit d'une nouvelle piste : taxer directement les agents intelligents plutôt que les individus ou les entreprises qui les déploient. L'argument central est que le modèle fiscal des économies développées repose encore sur le travail humain — cotisations, impôts sur les revenus — alors que l'automatisation par IA érode progressivement cette base. L'enjeu est considérable : si les agents IA remplacent des millions de travailleurs, les États perdent des recettes fiscales massives sans mécanisme de compensation. Une fiscalité des agents intelligents permettrait de maintenir le financement des services publics et de la protection sociale à mesure que l'automatisation s'accélère. Cela toucherait directement les grandes entreprises tech — Google, Meta, Microsoft — qui déploient ces systèmes à grande échelle. Ce débat s'inscrit dans une réflexion plus large sur l'adaptation des États à l'ère de l'IA. Plusieurs économistes et institutions, dont l'OCDE, commencent à explorer des pistes similaires. La question n'est plus théorique : avec l'explosion des agents autonomes capables de réaliser des tâches cognitives complexes, la fenêtre pour concevoir un cadre fiscal adapté se referme rapidement.

UEL'OCDE et des économistes européens, dont le Français Gabriel Zucman, explorent une taxation directe des agents IA pour compenser l'érosion des recettes fiscales liées à l'automatisation, un enjeu structurel pour le financement de la protection sociale en France et en Europe.

RégulationReglementation
1 source
DeepL : 83 % des grandes entreprises accusent du retard sur l'IA linguistique
736AI News 

DeepL : 83 % des grandes entreprises accusent du retard sur l'IA linguistique

Selon un rapport publié le 10 mars 2026 par DeepL, intitulé « Borderless Business : Transforming Translation in the Age of AI », 83 % des grandes entreprises n'ont pas encore adopté les outils modernes d'intelligence artificielle pour leurs opérations multilingues. L'étude, menée auprès de dirigeants d'entreprise aux États-Unis, au Royaume-Uni, en France, en Allemagne et au Japon, révèle que 35 % des entreprises internationales traitent encore leurs traductions entièrement manuellement, et 33 % supplémentaires s'appuient sur une automatisation classique avec révision humaine systématique. Seulement 17 % ont déployé des outils de nouvelle génération — grands modèles de langage ou IA agentique — pour leurs flux de travail linguistiques. Parallèlement, le volume de contenu d'entreprise a bondi de 50 % depuis 2023, mais 68 % des sociétés fonctionnent toujours avec des processus conçus pour une autre époque. DeepL compte aujourd'hui plus de 200 000 clients professionnels dans 228 marchés, dont 2 000 qui déploient déjà des agents IA pour l'analyse de rapports, le ciblage commercial et la revue de documents juridiques. Ce retard n'est pas anodin : la traduction et les opérations multilingues touchent des fonctions critiques de l'entreprise. D'après le rapport, l'expansion internationale constitue le premier moteur d'investissement dans l'IA linguistique (33 % des cas), devant les ventes et le marketing (26 %), le support client (23 %) et le juridico-financier (22 %). Une étude complémentaire de décembre 2025, conduite auprès de 5 000 cadres dirigeants, révèle que 54 % des dirigeants mondiaux estiment que la traduction vocale en temps réel sera indispensable en 2026, contre 32 % aujourd'hui — avec des écarts notables entre pays : 48 % au Royaume-Uni, 33 % en France, seulement 11 % au Japon. Pour Jarek Kutylowski, PDG et fondateur de DeepL : « L'IA est partout, mais l'efficacité ne l'est pas. La plupart des entreprises ont déployé l'IA sous une forme ou une autre, mais peu atteignent une vraie productivité à l'échelle, parce que les workflows centraux restent conçus autour des personnes, pas des systèmes. » DeepL se distingue de ses concurrents généralistes sur un point stratégique : la souveraineté des données. Dans les secteurs réglementés — finance, santé, droit, administration publique — la conformité est devenue un critère de sélection de premier ordre. L'entreprise est certifiée ISO 27001, SOC 2 Type 2 et RGPD, et propose un chiffrement « Bring Your Own Key » permettant aux clients de révoquer l'accès à leurs données en quelques secondes, y compris pour DeepL lui-même. Cette garantie lui ouvre des portes que les grands fournisseurs de LLM peinent à franchir. En 2026, la société accélère sur l'IA agentique avec DeepL Agent, et son CTO Sebastian Enderlein résume l'ambition : « 2026 sera l'année où l'IA arrête d'expérimenter et commence à exécuter, à une échelle que nous n'avons pas encore vue. »

UEL'étude couvre explicitement la France et l'Allemagne, et la conformité RGPD mise en avant par DeepL répond à une exigence réglementaire européenne directe pour les entreprises traitant des données multilingues sensibles.

OutilsOutil
1 source
Gradient Labs dote chaque client bancaire d'un gestionnaire de compte IA
737OpenAI Blog 

Gradient Labs dote chaque client bancaire d'un gestionnaire de compte IA

Gradient Labs a dévoilé une solution d'intelligence artificielle destinée aux banques, permettant à chaque client de disposer d'un gestionnaire de compte virtuel disponible en permanence. La startup s'appuie sur les modèles GPT-4.1 et GPT-5 mini et nano d'OpenAI pour alimenter des agents capables d'automatiser l'intégralité des flux de support bancaire — de la gestion des réclamations aux opérations courantes — avec une latence réduite et un niveau de fiabilité élevé. Pour les établissements bancaires, l'enjeu est considérable : le service client représente l'un des postes de coût les plus lourds du secteur, et la qualité de l'expérience client reste un facteur clé de fidélisation. En déployant des agents IA capables de traiter les demandes de millions de clients simultanément, Gradient Labs promet de démocratiser l'accès à un accompagnement personnalisé — jusqu'ici réservé aux clients fortunés disposant d'un conseiller dédié — tout en réduisant les délais de traitement et les coûts opérationnels pour les banques. Cette annonce s'inscrit dans une vague d'adoption accélérée de l'IA agentique dans les services financiers, où les établissements cherchent à automatiser les interactions à faible valeur ajoutée sans sacrifier la qualité. L'utilisation combinée de modèles de différentes tailles — GPT-4.1 pour les tâches complexes, les versions mini et nano pour les requêtes simples à haute fréquence — reflète une approche pragmatique d'optimisation coût-performance. Gradient Labs entre en compétition directe avec des acteurs comme Sierra, Intercom ou Salesforce Einstein, dans un marché du support IA pour la finance en pleine consolidation.

UELes banques européennes envisageant d'adopter ce type de solution devront s'assurer de sa conformité avec l'AI Act, qui classe les systèmes d'IA dans les services financiers comme à haut risque.

OutilsOutil
1 source
Un système alimenté par IA pour la collecte de preuves de conformité
738AWS ML Blog 

Un système alimenté par IA pour la collecte de preuves de conformité

Des équipes d'Amazon Web Services ont développé et documenté un système automatisé de collecte de preuves pour les audits de conformité, s'appuyant sur Amazon Bedrock et une extension de navigateur compatible Chrome et Firefox. Concrètement, l'outil exécute des workflows prédéfinis qui naviguent automatiquement dans des interfaces web — GitHub, consoles AWS, applications internes — en capturant des captures d'écran horodatées, puis les stocke de manière organisée dans Amazon S3. Le cœur intelligent du système repose sur le modèle Amazon Nova 2 Lite : lorsqu'un auditeur lui soumet un document de conformité en langage naturel, le modèle l'analyse et génère automatiquement les workflows JSON exécutables correspondants. En fin de cycle, Amazon SES produit et envoie un rapport de conformité par e-mail. L'authentification est gérée via Amazon Cognito couplé à AWS STS et IAM, garantissant des accès à privilèges minimaux vers Bedrock, S3 et SES. L'impact est direct pour les équipes de conformité et de sécurité des entreprises, qui consacrent aujourd'hui des dizaines d'heures par cycle d'audit à des tâches manuelles répétitives — naviguer de page en page, faire des captures d'écran, les renommer et les classer. Ce système rend le processus reproductible à l'identique d'un audit à l'autre, élimine les erreurs humaines de capture ou d'organisation, et produit une piste d'audit complète avec horodatage et chiffrement au repos. L'approche par extension navigateur présente un avantage structurel important : elle fonctionne avec n'importe quelle application web sans nécessiter d'accès API spécifique, et s'adapte aux évolutions d'interface grâce à l'automatisation pilotée par IA plutôt que par des sélecteurs CSS fragiles. Ce développement s'inscrit dans une tendance plus large d'industrialisation des agents IA pour des tâches d'entreprise à haute valeur réglementaire. Les audits SOC 2, ISO 27001 ou PCI-DSS imposent des volumes de preuves considérables, et la pression réglementaire sur les entreprises tech ne faiblit pas — notamment en Europe avec NIS2 et l'AI Act. AWS positionne ici Bedrock non pas comme un simple moteur de génération de texte, mais comme une couche d'orchestration capable de piloter des interfaces utilisateur réelles, ce qui représente un saut qualitatif par rapport aux intégrations API classiques. La prochaine étape logique sera l'extension de ces agents à des workflows multi-systèmes entièrement autonomes, où l'humain ne valide plus que l'exception — un modèle qui soulève déjà des questions sur la supervision et la responsabilité dans les processus réglementaires.

UELes entreprises européennes soumises à NIS2 ou à l'AI Act pourraient adopter des approches similaires pour automatiser la collecte de preuves d'audit, réduisant la charge de conformité réglementaire.

OutilsOutil
1 source
OpenClaw : le guide ultime des meilleurs Skills pour booster votre agent IA
739Le Big Data 

OpenClaw : le guide ultime des meilleurs Skills pour booster votre agent IA

OpenClaw, l'agent IA local et open source lancé fin 2025, a rapidement dépassé Linux et React sur GitHub pour atteindre plus de 330 000 étoiles, s'imposant comme l'un des projets les plus suivis de la plateforme. Contrairement aux chatbots classiques, OpenClaw agit directement sur la machine de l'utilisateur de manière autonome. Pour étendre ses capacités, la communauté a développé une marketplace d'extensions appelée ClawHub, proposant des milliers de modules baptisés Skills. Parmi les plus plébiscités : le Skill Obsidian, qui synchronise l'agent avec une base de notes locale en Markdown ; le module RAG (Retrieval-Augmented Generation) pour interroger des documents PDF et archives internes sans envoyer de données vers des serveurs externes ; le Skill GOG pour connecter l'agent à Gmail, Google Calendar et Drive via OAuth ; et enfin le Skill GitHub, qui s'appuie sur le CLI officiel gh pour gérer le cycle de vie complet d'un dépôt de code. Ce qui distingue OpenClaw des assistants IA classiques, c'est précisément cette capacité à passer de la consultation à l'exécution concrète. Un utilisateur peut demander à l'agent de trier sa boîte mail, rédiger une note structurée dans Obsidian, ou créer une pull request sur GitHub — le tout sans ouvrir un seul onglet de navigateur. Le module RAG est particulièrement stratégique pour les entreprises : il permet d'interroger des gigaoctets de documentation interne sensible en restant entièrement en local, éliminant le risque de fuite de données vers des API tierces. Pour les développeurs, le Skill GitHub transforme l'agent en ingénieur DevOps autonome capable de gérer des workflows complexes sans supervision constante. OpenClaw s'inscrit dans une tendance de fond : la montée des agents IA locaux, souverains et extensibles, portée par la communauté open source. Son ascension fulgurante rappelle celle de projets comme Docker ou Kubernetes en leur temps — des outils qui ont redéfini les pratiques professionnelles en quelques mois. La marketplace ClawHub joue un rôle central dans cet écosystème, en reproduisant le modèle de distribution des extensions de VS Code ou des plugins npm, mais appliqué à l'automatisation par IA. Les prochains enjeux tournent autour de la sécurité des Skills tiers, de la standardisation des interfaces entre modules, et de l'émergence d'agents capables de chaîner plusieurs Skills de manière fiable sur des tâches longues — un défi technique que la communauté commence à peine à adresser.

UELe module RAG local d'OpenClaw répond aux exigences de souveraineté des données imposées par le RGPD, permettant aux entreprises européennes de traiter des documents internes sensibles sans transférer de données vers des serveurs tiers.

OutilsOutil
1 source
Un aperçu des outils en ligne de commande
740Ben's Bites 

Un aperçu des outils en ligne de commande

Les agents d'intelligence artificielle fonctionnent en combinant un modèle de langage avec des outils concrets — et les interfaces en ligne de commande (CLI) constituent leur outil de prédilection. Concrètement, un agent peut exécuter une séquence de commandes bash pour renommer 400 photos produit selon un format SKU précis, les redimensionner en 1200x1200 pixels, les trier dans des sous-dossiers par catégorie, puis vérifier le résultat — le tout en quelques secondes, là où un humain y passerait plusieurs heures. Chaque étape correspond à une commande réelle : ls pour lister les fichiers, mkdir pour créer les dossiers, mogrify pour redimensionner les images, mv pour déplacer et renommer. L'agent enchaîne ces opérations de façon autonome, interprète les sorties, et s'adapte à ce qu'il découvre. Ce mécanisme de "tool use" est au cœur de ce qui distingue un agent d'un simple chatbot. Plus on lui donne accès à des CLIs spécialisées — Stripe CLI pour les données de paiement, Playwright pour contrôler un navigateur web, AWS CLI pour gérer une infrastructure cloud, Vercel CLI pour déployer un site en une commande — plus ses capacités s'étendent. Un agent équipé de bash seul peut organiser des fichiers ; ajoutez Stripe et il peut analyser vos revenus ; ajoutez Playwright et il peut naviguer sur le web ; ajoutez Vercel et il peut déployer ce qu'il vient de construire. C'est cette combinaison d'outils qui définit concrètement ce qu'un agent est capable d'accomplir. Des outils comme Claude Code permettent d'ailleurs de voir les commandes défiler en temps réel, ou de les retrouver via un panneau extensible. Ce modèle technique s'inscrit dans une période d'accélération notable pour les outils d'agents IA. Anthropic vient justement de lancer un "auto mode" pour Claude Code, un régime intermédiaire entre la validation manuelle de chaque action et l'exécution sans aucune permission — une réponse directe aux tensions entre autonomie et sécurité dans les workflows développeurs. En parallèle, les connecteurs Claude pour les outils professionnels sont désormais disponibles sur mobile, et Anthropic travaille sur une fonctionnalité "auto-dream" dédiée à la compaction de mémoire des agents pendant la nuit. Claude Code peut également envoyer des messages iMessage pour notifier l'utilisateur en cours de tâche. Ces annonces illustrent une tendance de fond : les grands labs ne cherchent plus seulement à améliorer les modèles, mais à rendre les agents réellement opérationnels dans des environnements de production réels, avec des garde-fous calibrés pour des usages professionnels quotidiens.

OutilsOutil
1 source
Le commerce agentique repose sur la vérité et le contexte
741MIT Technology Review 

Le commerce agentique repose sur la vérité et le contexte

L'intelligence artificielle agentique est en train de transformer le commerce numérique en profondeur. Là où les assistants numériques se contentaient jusqu'ici de proposer des options, les agents IA exécutent désormais des transactions complètes de façon autonome — réserver un voyage, comparer des offres, autoriser un paiement — sans intervention humaine. Ce changement déplace le goulot d'étranglement du commerce : les paiements s'effectuent déjà en quelques millisecondes, mais désormais c'est toute la chaîne en amont (découverte, comparaison, décision, autorisation) qui s'accélère. Le vrai défi n'est plus la vitesse, mais la confiance à l'échelle machine. Pour que ce modèle fonctionne sans dérailler, les entreprises doivent repenser leurs fondations de données. Un agent ne peut pas, comme un humain, déduire par le contexte que "Delta" désigne la compagnie aérienne et non le fabricant de robinetterie. Il a besoin de signaux déterministes. Des enregistrements clients dupliqués, des attributs produits incomplets ou des identités de marchands ambiguës — tolérables dans un flux humain — deviennent des sources d'erreurs critiques dès qu'un agent agit sans supervision. Les conséquences sont concrètes : mauvais produit livré, mauvais bénéficiaire payé, action contraire à l'intention de l'utilisateur malgré des permissions valides. La gestion des données maîtresses (MDM) — discipline consistant à établir un enregistrement unique et autoritatif pour chaque entité — devient alors la couche d'échange indispensable : elle définit qui représente l'agent, ce qu'il peut faire, et où se situe la responsabilité quand de la valeur est transférée. Plus on souhaite d'autonomie, plus l'investissement dans des données propres et une résolution d'entités fiable devient non négociable. Le commerce agentique introduit un troisième participant dans l'équation traditionnelle acheteurs/vendeurs : l'agent lui-même, qui doit être traité comme une entité à part entière avec ses propres permissions, limites et responsabilités. Ce paradigme s'inscrit dans une évolution plus large vers des marchés automatisés, qui fonctionnent déjà efficacement — à condition que l'identité, l'autorité et la responsabilité soient clairement établies dès le départ.

BusinessOpinion
1 source
Meta recrute l'équipe de la startup IA Dreamer
742The Information AI 

Meta recrute l'équipe de la startup IA Dreamer

Meta a recruté les fondateurs et l'équipe de la startup d'agents IA Dreamer, dont Hugo Barra, David Singleton et Nicholas Jitkoff, qui rejoignent le groupe Meta Superintelligence Labs. Dans le cadre de l'accord, Dreamer accordera une licence de sa technologie à Meta.

BusinessActu
1 source
Intégration d'Amazon Bedrock AgentCore avec Slack
743AWS ML Blog 

Intégration d'Amazon Bedrock AgentCore avec Slack

Amazon Bedrock AgentCore permet désormais d'intégrer des agents IA directement dans Slack, éliminant le besoin de basculer entre applications tout en gérant la mémoire conversationnelle, la sécurité et les délais de réponse. La solution repose sur AWS CDK avec trois fonctions Lambda, Amazon API Gateway, SQS et Secrets Manager, tandis que l'agent est conteneurisé et hébergé dans l'AgentCore Runtime via le SDK Strands Agents. L'architecture utilise le protocole MCP (Model Context Protocol) pour l'exécution des outils, et bien que l'exemple soit un agent météo, la couche d'intégration est entièrement réutilisable pour tout cas d'usage métier.

OutilsOutil
1 source
Tencent va doubler ses investissements en IA pour dépasser 5 milliards de dollars l'an prochain
744AI Business 

Tencent va doubler ses investissements en IA pour dépasser 5 milliards de dollars l'an prochain

Tencent prévoit de doubler ses investissements dans l'IA pour dépasser 5 milliards de dollars sur la prochaine année. Le géant technologique chinois se positionne sur le marché en forte croissance des agents IA personnels.

BusinessActu
1 source
745The Decoder 

La demande d'entraînement IA réaliste explose : Deeptune lève 43 millions de dollars pour simuler des environnements de travail

Deeptune, une startup spécialisée dans l'entraînement d'agents IA dans des environnements de travail simulés, lève 43 millions de dollars avec la participation d'Andreessen Horowitz. Cette levée de fonds répond à une demande croissante pour des données d'entraînement réalistes, alors que les entreprises cherchent à développer des agents IA capables d'opérer dans des contextes professionnels complexes.

BusinessActu
1 source
746InfoQ AI 

Quelle place pour les humains dans le développement logiciel assisté par l'IA ?

Sur le blog de Martin Fowler, Kief Morris analyse la place des développeurs dans l'ingénierie logicielle assistée par IA, concluant qu'ils ne seront pas mis "hors de la boucle." Les équipes travailleront plutôt "sur la boucle" — en concevant tests, spécifications et mécanismes de feedback pour guider les agents IA. Le débat du secteur porte désormais sur la vérification et la gouvernance de ces systèmes.

OutilsOpinion
1 source
L'atelier Build-A-Claw de Nvidia
747The Information AI 

L'atelier Build-A-Claw de Nvidia

Lors de la conférence GTC de Nvidia, l'attraction phare était le stand "Build-A-Claw", où les participants pouvaient tester NemoClaw, un logiciel open-source pour créer des agents IA basé sur OpenClaw. NemoClaw introduit des contrôles de confidentialité et de sécurité qui faisaient défaut à OpenClaw, permettant aux utilisateurs de restreindre les fichiers accessibles et les actions réalisables par un agent. Ces nouvelles garanties visent particulièrement les entreprises soucieuses des risques de sécurité liés aux agents IA.

OutilsOutil
1 source
IA agentique en entreprise – Partie 2 : Conseils par persona
748AWS ML Blog 

IA agentique en entreprise – Partie 2 : Conseils par persona

Dans la deuxième partie de cette série de l'AWS Generative AI Innovation Center, les auteurs s'adressent directement aux dirigeants d'entreprise pour leur expliquer comment déployer concrètement des agents IA selon leur rôle. Pour les responsables métier (P&L owners), la recommandation clé est de rédiger une "fiche de poste" pour l'agent — avec des objectifs précis liés aux KPIs existants (délais, coûts, taux d'erreurs) — avant de penser à la technologie. L'entrée en matière idéale est un agent qui consolide les handoffs entre équipes et pré-instruit les dossiers, générant des économies rapides qui permettent d'obtenir le soutien du CFO pour des projets plus ambitieux.

OutilsTuto
1 source
Zendesk rachète la startup d'IA pour le service client Forethought
749The Information AI 

Zendesk rachète la startup d'IA pour le service client Forethought

Zendesk, fournisseur de logiciels de service client, acquiert Forethought, une startup de 9 ans spécialisée dans les agents IA capables d'exécuter des tâches en plusieurs étapes. Le montant de la transaction n'a pas été divulgué. Cette acquisition illustre la tendance des grandes entreprises à racheter leurs concurrents plus petits dans le domaine de l'IA agentique.

BusinessActu
1 source
Meta rachète Moltbook, le réseau social de l'agent IA
750Ars Technica AI 

Meta rachète Moltbook, le réseau social de l'agent IA

Meta a acquis Moltbook, un réseau social simulé composé d'agents IA qui avait fait le buzz récemment. Les fondateurs Matt Schlicht et Ben Parr rejoignent les Meta Superintelligence Labs. Ce qui a attiré Meta est notamment l'"approche pour connecter les agents via un répertoire toujours actif", jugée novatrice dans l'espace agentique.

BusinessActu
1 source