Aller au contenu principal

Dossier Agents IA — page 13

1336 articles · page 13 sur 27

Les agents IA : déploiements en production, écart pilote/prod, débat sur la confiance, agent debt et négociations automatisées.

AWS SMGS transforme sa gestion commerciale avec un assistant conversationnel IA sur Amazon Bedrock AgentCore
601AWS ML Blog OutilsOutil

AWS SMGS transforme sa gestion commerciale avec un assistant conversationnel IA sur Amazon Bedrock AgentCore

Amazon Web Services a déployé en interne un assistant conversationnel basé sur l'intelligence artificielle, baptisé NarrateAI, pour transformer la façon dont les dirigeants de son organisation SMGS (Sales, Marketing and Global Services) accèdent aux données métier. Développé sur Amazon Bedrock AgentCore et accessible via l'interface Amazon Quick, l'outil permet à tous les niveaux hiérarchiques, du PDG aux équipes terrain, de poser des questions en langage naturel sur la performance commerciale et d'obtenir des réponses immédiatement exploitables. L'architecture repose sur deux couches distinctes : une couche de traitement par lots qui génère en amont des narratives personnalisées par utilisateur à partir de requêtes SQL paramétrées sur Amazon Redshift, et une couche temps réel qui répond aux questions de manière conversationnelle. AWS Lambda transforme les données extraites en JSON structuré, tandis que des templates Jinja les restituent en textes lisibles. Le recours à Bedrock AgentCore a permis de réduire le délai de déploiement de plusieurs mois à quelques semaines, en évitant de construire une infrastructure d'orchestration sur mesure. L'enjeu concret est significatif : les dirigeants AWS consacraient auparavant plusieurs heures à préparer manuellement leurs revues métier, en naviguant entre de multiples tableaux de bord et en réconciliant des sources de données disparates. NarrateAI supprime cette friction en livrant des analyses contextualisées à la demande, sans intermédiaire. Les équipes de reporting ne sont plus un goulot d'étranglement, et les décisions stratégiques peuvent être prises sur la base de données fraîches plutôt qu'en attendant des rapports consolidés. Pour une organisation de la taille d'AWS SMGS, qui opère à l'échelle mondiale sur des hiérarchies complexes, cette capacité à accéder instantanément à une vue unifiée de la performance représente un avantage opérationnel direct sur la réactivité des décisions commerciales. Ce projet s'inscrit dans une tendance de fond chez les grandes entreprises tech qui cherchent à remplacer la business intelligence traditionnelle, fondée sur des dashboards statiques, par des interfaces conversationnelles pilotées par des agents IA. Amazon Bedrock AgentCore, le service serverless d'AWS pour l'orchestration d'agents, est ici utilisé en interne avant d'être commercialisé auprès des clients, une stratégie classique chez AWS qui consiste à "dogfooder" ses propres services. La publication de ce retour d'expérience détaillé, incluant les patterns d'ingénierie et les choix architecturaux, vise clairement à convaincre les entreprises clientes d'adopter la même stack. Alors que les concurrents comme Microsoft et Google avancent eux aussi sur les agents IA d'entreprise, AWS positionne NarrateAI comme une vitrine de ce qu'il est possible de construire rapidement et en production avec Bedrock AgentCore.

1 source
Sarang Kulkarni : les enseignements du développement d'agents de recherche approfondie en production
602InfoQ AI 

Sarang Kulkarni : les enseignements du développement d'agents de recherche approfondie en production

Sarang Kulkarni, architecte chez Thoughtworks, a présenté lors de l'Arc of AI Conference 2026 les enseignements tirés du déploiement en production de systèmes d'agents de recherche approfondie. Ces systèmes, appelés Deep Research Agentic Systems, sont des agents IA capables de conduire des investigations en plusieurs étapes sur des questions complexes : ils combinent raisonnement dynamique, récupération d'information en chaîne (multi-hop retrieval) et génération de rapports analytiques structurés, allant bien au-delà des chatbots classiques. Ces architectures multi-agents représentent un saut qualitatif pour les entreprises qui ont besoin d'automatiser des tâches de veille, d'analyse concurrentielle ou de recherche documentaire. Là où un LLM standard répond à une question en une passe, un agent de recherche profonde décompose le problème, interroge plusieurs sources, valide ses hypothèses et synthétise un rapport cohérent. Le retour d'expérience de Thoughtworks, cabinet de conseil technologique présent dans le monde entier, est particulièrement précieux car il aborde les réalités du déploiement en production : latence, fiabilité, coûts opérationnels et maintenance des workflows. L'intervention de Kulkarni s'inscrit dans une tendance de fond : après l'engouement pour les LLMs, l'industrie entre dans une phase d'industrialisation des agents IA. Des acteurs comme Google avec Deep Research, Perplexity ou OpenAI ont popularisé le concept, mais les pratiques de déploiement en entreprise restent peu documentées. Les conférences spécialisées comme Arc of AI 2026 deviennent des espaces clés pour partager ce savoir tacite, avant que les standards de l'ingénierie agentique ne se cristallisent.

UELes entreprises européennes déployant des agents IA en production peuvent s'appuyer sur ce retour d'expérience de Thoughtworks pour anticiper les défis de latence, fiabilité et coûts opérationnels.

OutilsOutil
1 source
Comment les agentic databases redéfinissent l’IA en entreprise ?
603Le Big Data 

Comment les agentic databases redéfinissent l’IA en entreprise ?

Un nouveau concept s'impose dans les stratégies technologiques des grandes entreprises : les agentic databases. Selon une étude récente citée dans l'article, 95 % des dirigeants souhaitent transformer leur organisation en véritable plateforme d'IA et de données d'ici trois ans. Ces bases de données de nouvelle génération ne se contentent plus de stocker des informations : elles deviennent des couches actives capables d'alimenter des agents IA autonomes, de conserver leur mémoire opérationnelle et d'optimiser leurs performances en continu. Concrètement, elles doivent gérer simultanément des données relationnelles classiques, des contenus non structurés, des historiques conversationnels, de la mémoire d'agents et des données vectorielles pour la recherche sémantique. Des technologies comme PostgreSQL regagnent du terrain grâce à leur flexibilité, leur écosystème open source et leur capacité à gérer ces charges de travail hybrides. L'enjeu est considérable pour les entreprises. Aujourd'hui, la plupart fonctionnent encore avec des architectures fragmentées : données dispersées entre plusieurs outils, agents IA opérant dans des environnements cloisonnés, équipes techniques qui passent plus de temps à connecter des systèmes qu'à développer de nouveaux usages métier. Les organisations qui ont su centraliser leurs données, leurs flux et leurs agents dans une infrastructure cohérente obtiennent un retour sur investissement nettement supérieur et déploient davantage d'applications couvrant plusieurs fonctions, de la finance aux ventes en passant par le juridique. La différence de performance entre ces leaders et le reste du marché ne tient pas à la qualité des modèles LLM utilisés, mais à leur capacité à construire une couche de données unifiée fournissant un contexte fiable et une mémoire persistante aux agents. Chaque nouvel agent enrichit alors progressivement la base de connaissances commune, générant un cercle vertueux d'automatisation où les performances s'améliorent avec l'usage. Cette évolution répond aussi à une contrainte technique fondamentale : les infrastructures de données traditionnelles n'ont tout simplement pas été conçues pour des systèmes qui agissent, raisonnent et exécutent des tâches de manière autonome. La latence devient critique à mesure que les agents s'intègrent dans les opérations métier en temps réel, poussant les entreprises à adopter des systèmes de stockage multiniveaux capables de prioriser les données chaudes. Les agents doivent désormais non seulement répondre à des requêtes, mais comprendre des intentions et exécuter des actions complexes en chaîne, ce qui exige des mécanismes d'indexation hybrides avancés. L'agentic database n'est donc pas un produit unique mais une architecture complète, et les acteurs qui la maîtriseront en premier disposeront d'un avantage compétitif structurel difficile à rattraper.

InfrastructureOpinion
1 source
Des robots autonomes dotés d'une perception précise de l'environnement réel grâce à une avancée d'ingénieurs américains
604Interesting Engineering 

Des robots autonomes dotés d'une perception précise de l'environnement réel grâce à une avancée d'ingénieurs américains

Brain Corp, spécialiste américain des robots autonomes mobiles (AMR) pour environnements commerciaux, annonce un partenariat de recherche avec l'Université de Californie à San Diego (UCSD) autour des technologies de cartographie sémantique et d'intelligence contextuelle. L'objectif est de doter les systèmes autonomes d'une "couche de grounding contextuel", soit une représentation numérique intelligente de l'espace physique qui permet aux robots de comprendre ce qui se passe autour d'eux et de réagir de manière adaptée. Ce partenariat s'appuie sur l'empreinte opérationnelle existante de Brain Corp: plus de 50 000 robots autonomes déployés à l'échelle mondiale, avec plus de 25 millions d'heures d'opérations enregistrées dans des environnements commerciaux variés (centres commerciaux, entrepôts, aéroports). Du côté académique, c'est le Dr. Atanasov, du département Génie électrique et informatique de la Jacobs School of Engineering d'UCSD, qui pilote les travaux. Les avancées issues de cette collaboration seront intégrées dans BrainOS, la plateforme d'autonomie propriétaire de Brain Corp. Ce partenariat signale un pivot stratégique dans la robotique AMR: le secteur passe d'une compétition centrée sur la navigation vers une compétition sur la compréhension contextuelle de l'espace. Le SLAM (Simultaneous Localization and Mapping) a permis de faire sortir les robots des environnements industriels fixes vers des espaces plus dynamiques, mais pour orchestrer des flottes entières de robots, de capteurs fixes et d'agents IA à l'échelle enterprise, la localisation seule ne suffit plus. Il faut que le système distingue un client qui passe d'un obstacle temporaire, ou adapte son comportement à une zone de travaux en temps réel. John Black, CTO de Brain Corp, formule l'enjeu ainsi: "Le défi n'est plus simplement le mouvement ou la perception, mais la compréhension." C'est le passage de la robotique de tâche à la robotique de situation, dont les implications pour la commercialisation à grande échelle sont concrètes, même si les métriques de performance des cartes sémantiques produites par cette collaboration n'ont pas encore été communiquées. Brain Corp, fondée en 2009 et dont le siège est à San Diego, a bâti sa position sur BrainOS, système d'exploitation pour AMR utilisé notamment par des fabricants de machines de nettoyage comme Tennant et Minuteman. Avec 50 000 unités déployées, la société dispose d'un corpus de données opérationnelles réelles que peu d'acteurs de la robotique commerciale peuvent revendiquer, un avantage structurel face à des concurrents comme Avidbots ou SoftBank Robotics. Le partenariat avec l'UCSD s'inscrit dans une tendance plus large: les plateformes AMR cherchent à devenir des couches d'orchestration multi-robots et multi-capteurs, concurrençant indirectement des solutions comme celles de Fetch Robotics (racheté par Zebra Technologies) ou 6 River Systems (acquis par Shopify). À ce stade, aucun budget de recherche, ni calendrier de déploiement de fonctionnalités dans BrainOS, n'a été rendu public.

RobotiquePaper
1 source
Évaluateurs multimodaux : MLLM comme juge pour les tâches image vers texte dans Strands Evals
605AWS ML Blog 

Évaluateurs multimodaux : MLLM comme juge pour les tâches image vers texte dans Strands Evals

Amazon a annoncé le lancement de quatre nouveaux évaluateurs multimodaux dans son SDK Strands Evals, conçus pour juger automatiquement la qualité des réponses textuelles générées à partir d'images. Baptisés Overall Quality, Correctness, Faithfulness et Instruction Following, ces évaluateurs fonctionnent sur Amazon Bedrock et s'intègrent directement dans le flux de travail Case/Experiment/Report de Strands Evals. Leur principe : envoyer l'image source, la requête et la réponse du modèle à un modèle juge multimodal, qui retourne un score (sur une échelle de Likert 1-5 ou binaire) accompagné d'un raisonnement exploitable pour le débogage. Ils supportent deux modes d'évaluation, avec ou sans réponse de référence, et peuvent être branchés directement dans des pipelines d'intégration continue pour détecter automatiquement hallucinations visuelles, erreurs factuelles et violations d'instructions. La limitation des évaluateurs textuels classiques est au coeur de cette annonce. Un juge qui ne voit pas l'image peut valider un texte bien rédigé tout en laissant passer des erreurs critiques : un modèle qui invente une tendance dans un graphique qui ne la montre pas, hallucine un produit absent d'une photo, ou ignore une instruction de format. Ces trois types d'échecs nécessitent trois types de corrections différents, et les agréger en un seul score global rend le débogage quasi impossible. Sans évaluation multimodale automatisée, les équipes sont coincées entre la revue humaine, coûteuse et non scalable, et des proxys textuels qui manquent précisément les défaillances qui comptent, notamment dans des cas d'usage comme la lecture de factures, l'analyse de tableaux de bord ou la description de captures d'écran. L'enjeu est considérable à l'échelle de l'industrie. Selon Gartner, 80 % des logiciels d'entreprise seront multimodaux d'ici 2030, contre moins de 10 % en 2024. Cette transition rapide pousse les équipes d'ingénierie à construire des pipelines d'évaluation capables de suivre la complexité croissante des modèles déployés. Strands Evals s'inscrit dans l'écosystème d'agents IA open source qu'Amazon a commencé à assembler ces derniers mois, avec une ambition claire : fournir une chaîne d'outils complète, de la construction à l'évaluation des agents. Ces quatre évaluateurs représentent une brique manquante pour les équipes qui travaillent sur le commerce visuel, la compréhension de documents ou tout système où la vérité de terrain réside dans l'image et non dans le texte. La prochaine étape logique sera d'étendre ces mécanismes à des modalités supplémentaires, vidéo, audio, à mesure que les modèles fondamentaux gagnent en capacités.

OutilsOutil
1 source
Étendre la mémoire conversationnelle de Kiro CLI avec Amazon Bedrock AgentCore Memory
606AWS ML Blog 

Étendre la mémoire conversationnelle de Kiro CLI avec Amazon Bedrock AgentCore Memory

Amazon Web Services a présenté une solution pour doter Kiro CLI d'une mémoire conversationnelle persistante entre les sessions, en s'appuyant sur Amazon Bedrock AgentCore Memory. Kiro CLI est l'interface en ligne de commande qui permet aux développeurs d'interagir directement depuis leur terminal avec les agents IA de Kiro, l'IDE agentique d'AWS. Le problème résolu est concret : chaque nouvelle session repart de zéro, forçant le développeur à réexpliquer le contexte de son projet, ses préférences et ses conventions à chaque démarrage. La solution repose sur un serveur MCP (Model Context Protocol) personnalisé, open source et disponible sur GitHub, qui fait le pont entre Kiro CLI et le service managé Bedrock AgentCore Memory. Ce serveur expose trois catégories d'outils : des outils conversationnels pour stocker et retrouver l'historique par sujet ou période, des outils de supervision pour consulter les statistiques d'utilisation mémoire, et des outils d'administration pour supprimer des sessions ou des données ciblées. La récupération du contexte repose sur une stratégie à deux niveaux : une recherche sémantique via l'API retrievememoryrecords d'AgentCore Memory, avec repli automatique sur une correspondance directe dans les contenus bruts si le premier niveau n'a pas encore terminé son indexation. L'impact pour les équipes de développement travaillant sur des bases de code volumineuses est direct. Un développeur qui revient sur un projet après plusieurs jours n'a plus besoin de réexpliquer l'architecture, les contraintes métier ou ses préférences de style à l'agent IA : celui-ci retrouve automatiquement les sessions précédentes, identifiables par des formulations naturelles comme "hier soir" ou "la semaine dernière". Cette continuité de contexte réduit la friction cognitive et le temps perdu en répétition, deux freins majeurs à l'adoption productive des outils IA dans les workflows de développement au quotidien. Amazon Bedrock AgentCore Memory est un service entièrement managé lancé par AWS pour répondre à un besoin croissant dans l'écosystème des agents IA : la persistance de la mémoire à long terme. Jusqu'ici, les agents IA des IDEs et des outils de développement souffraient d'une amnésie structurelle entre les sessions, limitant leur utilité réelle sur des projets complexes et de longue durée. Le Model Context Protocol, standardisé par Anthropic, est devenu le mécanisme central d'extensibilité pour les agents IA, permettant à des services tiers d'exposer des capacités via une interface unifiée. AWS positionne ainsi AgentCore Memory comme une brique d'infrastructure réutilisable pour tout éditeur souhaitant ajouter de la mémoire à ses propres agents MCP-compatibles. La mise à disposition du code source en exemple sur GitHub signale une volonté d'adoption large, au-delà de Kiro, vers l'ensemble des clients AWS qui construisent des outils agentiques sur Bedrock.

OutilsOutil
1 source
Construire un agent IA avancé avec planification, appel d'outils, mémoire et auto-critique via l'OpenAI API
607MarkTechPost 

Construire un agent IA avancé avec planification, appel d'outils, mémoire et auto-critique via l'OpenAI API

Un tutoriel publié sur la plateforme de notebooks Colab détaille comment construire un système d'IA agentique avancé en s'appuyant sur l'API OpenAI et le modèle GPT-5.2. L'architecture proposée repose sur un pipeline de trois rôles spécialisés et distincts : un planificateur qui décompose les objectifs complexes en étapes, un exécuteur qui mobilise des outils concrets pour agir, et un critique qui évalue la qualité des résultats avant de les valider. Quatre outils sont intégrés directement dans le système : une calculatrice sécurisée qui accepte uniquement des expressions numériques sans variables, un moteur de recherche dans une base de connaissances interne simulant des playbooks d'équipe, un extracteur JSON pour produire des sorties structurées, et un module d'écriture de fichiers qui sauvegarde les livrables finaux avec une empreinte SHA-256 de vérification. La clé API est transmise via getpass() pour éviter toute exposition dans le code ou les sorties du notebook. Cette approche modulaire représente un changement de paradigme dans la façon de concevoir des agents IA. En séparant strictement la stratégie, l'action et le contrôle qualité en trois couches distinctes, le système évite les dérives courantes des agents monolithiques qui mélangent raisonnement et exécution sans garde-fous. Le composant critique intégré permet une autocorrection systématique avant la réponse finale, ce qui réduit les hallucinations et améliore la fiabilité des sorties dans des contextes professionnels. Pour les développeurs et les entreprises qui cherchent à automatiser des workflows complexes (rédaction de comptes-rendus de réunion, traitement de données structurées, génération de rapports), ce type d'architecture offre une robustesse que les chatbots conversationnels classiques ne peuvent pas atteindre. Ce tutoriel s'inscrit dans une vague plus large d'intérêt pour les systèmes multi-agents et les architectures dites "agentic", portées notamment par les travaux d'Anthropic sur Claude, de Google avec Gemini, et d'OpenAI elle-même avec ses API d'assistants et de function calling. L'émergence de GPT-5.2, le modèle utilisé ici, illustre la rapidité avec laquelle les capacités de base progressent et rendent ces architectures accessibles à un plus grand nombre de développeurs. La tendance de fond est claire : les LLM cessent d'être de simples générateurs de texte pour devenir des orchestrateurs capables de planifier, d'agir sur des systèmes externes et de s'autocorriger, ce qui rapproche concrètement l'IA générative des promesses d'automatisation avancée que l'industrie promet depuis plusieurs années.

OutilsTuto
1 source
Des évaluateurs personnalisés basés sur du code dans Amazon Bedrock AgentCore
608AWS ML Blog 

Des évaluateurs personnalisés basés sur du code dans Amazon Bedrock AgentCore

Amazon a lancé les évaluateurs personnalisés basés sur du code dans Amazon Bedrock AgentCore Evaluations, une fonctionnalité permettant aux équipes de développement d'intégrer des fonctions AWS Lambda comme moteur d'évaluation pour leurs agents IA. Contrairement aux juges LLM classiques, ces évaluateurs produisent des résultats déterministes : le même input donne toujours le même score. Ils peuvent être utilisés en mode on-demand, comme porte de validation dans les pipelines CI/CD, ou en mode online pour scorer du trafic de production en temps réel. L'annonce a été portée par une équipe pluridisciplinaire incluant Stephanie Yuan, Lefan Zhang, Ritvika Pillai, Vivek Singh et plusieurs ingénieurs et chefs de produit d'AWS. Pour les entreprises des secteurs financiers et spécialisés, cette capacité répond à des exigences concrètes que les LLM-as-a-Judge ne couvrent pas bien. Un agent de veille de marchés financiers doit citer des cours boursiers dans une fourchette de tolérance configurable, respecter un workflow d'identification du courtier avant d'accéder aux profils clients, retourner des sorties d'outils conformes à un schéma JSON strict, et ne jamais exposer d'informations personnelles identifiables. Un LLM est sujet à des erreurs arithmétiques, peut coûter cher à chaque appel, et ne convient pas à la vérification de règles objectives. Un évaluateur en code appelle directement le système de référence, calcule l'écart de tolérance, et signale chaque anomalie avec une précision que même un écart de 0,1 % peut déclencher, un seuil qui peut influencer une décision de trading. Le lancement s'inscrit dans un problème plus large que rencontre l'industrie : la transition des agents IA du prototype vers la production. Un agent fonctionnel en démo peut, en conditions réelles, produire des données mal formées suite à un bug de parsing ou une panne d'API tierce, divulguer des données confidentielles par inadvertance, ou ne pas respecter l'ordre des appels d'outils requis par une politique interne. Amazon propose désormais quatre dimensions d'évaluation adaptées au code : la validation de schéma des réponses d'outils, la précision numérique par rapport à une source de référence, la conformité au contrat de workflow, et la détection de PII ou de secrets via des services externes comme Amazon Comprehend. Ces évaluateurs peuvent être combinés avec les évaluateurs intégrés d'AgentCore et fonctionnent indépendamment du framework agent utilisé en production. L'enjeu est de donner aux équipes un filet de sécurité déterministe là où les capacités linguistiques des LLM atteignent leurs limites.

OutilsOutil
1 source
Les événements à ne pas rater pour comprendre la montée en puissance de l’IA en 2026
609FrenchWeb 

Les événements à ne pas rater pour comprendre la montée en puissance de l’IA en 2026

L'année 2026 s'impose comme un tournant décisif pour l'intelligence artificielle. Après plusieurs années d'expérimentation intense portée par l'essor des modèles génératifs, le secteur entre dans une phase de maturité industrielle. Les grandes conférences et salons professionnels de l'année reflètent ce changement de cap : les thématiques dominantes ne sont plus la découverte ou la démonstration, mais l'intégration opérationnelle, le déploiement à grande échelle et la gouvernance des systèmes IA en conditions réelles. Les enjeux qui structurent l'agenda 2026 sont multiples et convergents. Les infrastructures de calcul (compute) et la consommation énergétique des centres de données sont au coeur des débats, à mesure que les modèles deviennent plus complexes et plus gourmands. Les agents IA autonomes, capables d'exécuter des tâches longues et enchaînées, concentrent l'attention des entreprises qui cherchent à automatiser des processus métier entiers. La robotique physique et la souveraineté numérique s'invitent également dans les discussions, portées par des tensions géopolitiques persistantes autour du contrôle des semi-conducteurs et des données. Ce basculement vers une logique industrielle reflète une transformation plus profonde : les entreprises ne se demandent plus si elles doivent adopter l'IA, mais comment le faire sans perdre le contrôle. Les événements professionnels de 2026 servent ainsi de baromètre pour mesurer où en sont réellement les acteurs du secteur, entre les annonces des géants technologiques américains et les ambitions croissantes des acteurs européens et asiatiques.

UEL'article met explicitement en avant les ambitions croissantes des acteurs européens face aux géants américains, notamment sur les enjeux de souveraineté numérique et de gouvernance de l'IA, thématiques centrales du cadre réglementaire européen en cours de déploiement.

💬 La phase POC est officiellement terminée pour beaucoup. Ce qui m'intéresse maintenant, c'est qui va réussir l'industrialisation sans se planter sur la gouvernance, parce que c'est là que ça va coincer. Les Européens ont une carte à jouer sur la souveraineté, si tant est qu'ils arrêtent d'en parler et commencent à livrer.

BusinessOpinion
1 source
Agent IA vs SaaS : les logiciels vont-ils disparaître ?
610Le Big Data 

Agent IA vs SaaS : les logiciels vont-ils disparaître ?

Les agents IA ne vont pas tuer le SaaS, mais ils en transforment radicalement la nature. Pendant vingt ans, le modèle SaaS a restructuré le travail en entreprise, remplaçant les installations locales par des abonnements cloud accessibles depuis n'importe quel navigateur. CRM, outils comptables, plateformes marketing : ces logiciels sont devenus l'infrastructure invisible de l'organisation moderne, standardisant les processus de la PME jusqu'au grand groupe. Mais une rupture s'opère aujourd'hui : les agents IA, des entités autonomes capables d'analyser une requête, planifier des étapes et enchaîner des actions complexes sans intervention humaine continue, commencent à interagir directement avec ces logiciels via leurs API, court-circuitant les interfaces visuelles pensées pour des clics humains. Cette mutation change profondément qui est le véritable utilisateur du logiciel. Là où le SaaS supposait un humain devant un formulaire, l'agent IA devient le client programmatique le plus actif : il gère courriels, factures et réunions en arrière-plan, en quelques secondes là où une tâche prenait auparavant plusieurs heures. Des tâches de recouvrement, par exemple, peuvent être entièrement orchestrées par un agent qui consulte à la fois le CRM et les bases comptables sans jamais afficher d'écran. Pour les entreprises, le gain de productivité est réel et immédiat. Pour les éditeurs de logiciels, cette évolution déplace la valeur : le modèle économique migre progressivement de l'abonnement par siège vers des formules indexées sur les tâches accomplies ou les résultats obtenus, ce qui fragilise ceux dont l'unique différenciation était la qualité de l'interface graphique. Ce basculement s'inscrit dans une dynamique plus large où le logiciel cesse d'être un support pour devenir un moteur d'exécution. Les agents IA n'ont ni stockage propre ni règles métier structurées : ils dépendent entièrement des SaaS pour organiser, sécuriser et valider les données. Le SaaS ne disparaît pas, il se repositionne en serveur de logique métier, pilier invisible de l'autonomie de l'IA. Les éditeurs qui survivront à cette transition seront ceux qui auront ouvert des API robustes et pensé leur produit pour un usage programmatique autant que visuel. Les autres, dont la valeur reposait exclusivement sur l'ergonomie d'une interface, risquent d'être contournés. L'enjeu pour l'ensemble du secteur est donc de se réinventer non plus comme des outils pour les humains, mais comme des infrastructures de confiance pour des agents autonomes, un défi architectural et économique qui redéfinit les règles du jeu de la transformation numérique.

UELes éditeurs de logiciels français et européens devront repenser leur modèle économique et ouvrir des APIs robustes pour rester compétitifs face aux agents IA qui contournent les interfaces visuelles.

BusinessOpinion
1 source
AgentCore : optimisation de la qualité des agents, désormais en préversion
611AWS ML Blog 

AgentCore : optimisation de la qualité des agents, désormais en préversion

Amazon a annoncé ce 5 mai 2026 l'intégration de nouvelles capacités d'optimisation automatique dans AgentCore, sa plateforme de déploiement d'agents IA, désormais disponibles en préversion. Ces fonctionnalités couvrent trois mécanismes complémentaires : les Recommandations, l'évaluation par lots (batch evaluation) et les tests A/B. Le moteur de recommandations analyse les traces de production et les résultats d'évaluation pour proposer des améliorations concrètes des prompts système ou des descriptions d'outils, en ciblant un critère de performance défini par le développeur. L'évaluation par lots permet ensuite de valider ces suggestions sur un jeu de données de test prédéfini, en mesurant des scores agrégés pour détecter d'éventuelles régressions. Enfin, les tests A/B comparent deux versions d'un agent en production via AgentCore Gateway, en répartissant le trafic réel selon un pourcentage configurable et en restituant les résultats avec intervalles de confiance et significativité statistique. L'ensemble s'appuie sur un système de traçabilité OpenTelemetry géré par AgentCore Observability, qui capture chaque appel au modèle, chaque invocation d'outil et chaque étape de raisonnement. Ces nouvelles capacités répondent à un problème structurel bien connu des équipes IA en production : la dégradation silencieuse des agents au fil du temps. Lorsque les modèles évoluent, les comportements utilisateurs changent, ou les prompts sont réutilisés dans des contextes imprévus, la qualité baisse sans signal d'alerte clair. Jusqu'ici, le cycle de correction restait entièrement manuel : un utilisateur se plaint, un développeur lit des traces, formule une hypothèse, réécrit le prompt, teste quelques cas et pousse un correctif qui peut en créer un autre. AgentCore ferme cette boucle en remplaçant l'intuition du développeur par des données systématiques, avec un signal de récompense configurable : taux de succès des objectifs, précision de sélection des outils, pertinence, sécurité. Yoshiharu Okuda, directeur de la stratégie IA générative chez NTT DATA, a confirmé que des processus qui nécessitaient auparavant plusieurs semaines de réglage manuel se transforment désormais en cycles rapides et reproductibles. AgentCore est la plateforme d'Amazon Web Services pour construire, connecter et optimiser des agents IA à grande échelle, avec des milliers de développeurs déjà actifs. Cette annonce s'inscrit dans une course plus large entre les grands fournisseurs cloud pour proposer des outils d'opérationnalisation des agents, au-delà de la simple inférence. Google Vertex AI, Microsoft Azure AI et AWS se disputent les équipes qui passent de la phase expérimentale à la production à grande échelle, là où la maintenance de la qualité devient un défi d'ingénierie à part entière. En automatisant la boucle observer-évaluer-améliorer, AWS positionne AgentCore comme une infrastructure de fond pour les organisations qui ne peuvent pas se permettre des équipes dédiées à l'optimisation manuelle de prompts sur des cycles hebdomadaires, alors que leurs agents dérivent chaque jour en production.

OutilsActu
1 source
RunPod Flash : un outil Python open source pour accélérer le développement IA sans conteneurs
612VentureBeat AI 

RunPod Flash : un outil Python open source pour accélérer le développement IA sans conteneurs

RunPod, la plateforme cloud spécialisée dans les GPU haute performance pour le développement IA, a lancé ce jeudi un nouvel outil open source baptisé RunPod Flash. Distribué sous licence MIT, cet outil Python vise à supprimer une contrainte jusqu'ici incontournable dans le développement serverless sur GPU : la conteneurisation Docker. Dans le cycle de développement traditionnel, un développeur devait écrire un Dockerfile, construire une image, la pousser vers un registre, puis attendre que l'environnement se déploie avant qu'une seule ligne de code puisse s'exécuter sur un GPU distant. Flash remplace ce processus par un moteur de build multiplateforme qui génère automatiquement un artefact Linux x86_64 depuis un Mac M-series, détecte la version Python locale, force les wheels binaires, et monte les dépendances directement à l'exécution sur la flotte serverless de RunPod. Le nouveau décorateur @Endpoint, pièce centrale de cette version GA, centralise la configuration de ce pipeline en un seul appel de fonction. L'impact concret est double. Pour les équipes de recherche, la suppression de ce que RunPod appelle la "taxe de packaging" réduit drastiquement les cycles d'itération : plus besoin de rebuilder et repousser une image à chaque modification de code. Pour les applications en production, Flash embarque des fonctionnalités de niveau entreprise, API HTTP avec load balancing basse latence, traitement par lots en file d'attente, stockage persistant multi-datacenter. L'outil permet également de construire des pipelines dits "polyglots" : un endpoint CPU bon marché peut prendre en charge le prétraitement des données avant de router automatiquement vers un GPU NVIDIA H100 ou B200 pour l'inférence. Cette architecture réduit aussi les "cold starts", ces délais à froid qui pénalisent les environnements serverless, en évitant d'initialiser de lourdes images conteneurisées à chaque requête. Derrière Flash se trouve une infrastructure réseau propriétaire SDN/CDN que RunPod a construite pour résoudre ce que son CTO Brennen Smith décrit comme le vrai problème du GPU cloud : non pas les processeurs eux-mêmes, mais le réseau et le stockage qui les relient. L'outil est explicitement conçu pour servir de substrat aux agents IA et assistants de code, Claude Code, Cursor, Cline sont cités nommément, leur permettant d'orchestrer et déployer du matériel distant de façon autonome. "Tout le monde parle d'IA agentique, mais il faut une colle solide pour que ces agents puissent réellement fonctionner", a déclaré Smith à VentureBeat. RunPod entre ainsi en compétition directe avec AWS Lambda et Modal sur le segment du serverless GPU, en pariant que la suppression de la friction de déploiement sera le facteur décisif pour les labs et équipes produit qui multiplient les expérimentations IA.

OutilsActu
1 source
Baidu lance GenFlow 4.0 et améliore ses agents de stockage cloud et de bureautique
613Pandaily 

Baidu lance GenFlow 4.0 et améliore ses agents de stockage cloud et de bureautique

Le 27 avril, Baidu a présenté GenFlow 4.0 lors de son événement AI Day, une mise à jour majeure de son système d'agents IA généraliste. Cette nouvelle version est désormais disponible sur les versions PC et mobile de Baidu Netdisk, le service de stockage cloud de l'entreprise, et intègre des agents spécialisés pour les tâches bureautiques sur PowerPoint, Excel et Word. Les utilisateurs peuvent lancer une tâche depuis leur mobile et la faire exécuter sur PC, créant ainsi des flux de travail multi-appareils fluides. Depuis son lancement initial en avril 2025, GenFlow a atteint 100 millions d'utilisateurs actifs mensuels et 200 millions d'exécutions de tâches par mois. La version 4.0 améliore particulièrement la reconnaissance d'intention, la décomposition de tâches complexes, la coordination entre outils et la restitution des résultats. En pratique, GenFlow 4.0 permet des enchaînements bureautiques complets : analyser des données dans Excel, générer automatiquement une présentation PowerPoint à partir des résultats, puis compiler un rapport Word, le tout sans intervention manuelle entre chaque étape. Le système s'étend également à l'édition vidéo, à la gestion de photos et aux usages pédagogiques, en exploitant les fichiers déjà stockés dans le cloud. Pour renforcer la sécurité des données, Baidu introduit une fonctionnalité "espace de travail" qui limite l'accès de l'IA aux seuls fichiers autorisés. Côté entreprise, une fonctionnalité "Team Space" permet la collaboration multi-utilisateurs et la gestion de tâches par agents, déjà adoptée par plus de 10 000 organisations. Cette annonce s'inscrit dans la course acharnée que se livrent les géants technologiques chinois pour intégrer l'IA agentique dans leurs écosystèmes productifs. Baidu, qui doit faire face à une concurrence accrue d'Alibaba, Tencent et de nouveaux acteurs comme DeepSeek, mise sur Netdisk comme point d'ancrage stratégique pour déployer ses agents au quotidien. L'intégration directe dans un service de stockage à 100 millions d'utilisateurs actifs constitue un levier de diffusion considérable, et la direction prise vers l'automatisation de tâches complexes multi-applications pourrait redéfinir les standards attendus des assistants IA en milieu professionnel.

OutilsOutil
1 source
Amazon Bedrock Knowledge Bases : créer et déployer une solution de synchronisation automatique
614AWS ML Blog 

Amazon Bedrock Knowledge Bases : créer et déployer une solution de synchronisation automatique

Amazon Web Services a publié la description d'une solution serverless permettant de synchroniser automatiquement les bases de connaissances Amazon Bedrock avec les documents stockés dans Amazon S3, sans aucune intervention manuelle. Conçue selon une architecture événementielle, elle repose sur cinq services AWS articulés ensemble : EventBridge capte les modifications dans les buckets S3 en temps réel, des fonctions Lambda traitent ces événements, des files SQS absorbent les pics de requêtes, Step Functions orchestre le flux de synchronisation, et DynamoDB assure le suivi des changements et des métadonnées de jobs. Le tout se déploie via AWS SAM (Serverless Application Model), sans infrastructure à provisionner ni à maintenir. Deloitte figure parmi les entreprises ayant adopté ce type d'approche pour moderniser leur infrastructure de tests et de traitement documentaire. L'enjeu est considérable pour les organisations qui utilisent Bedrock Knowledge Bases dans des environnements multi-utilisateurs ou des applications critiques comme les systèmes de support client. Amazon Bedrock impose des quotas stricts : au maximum cinq jobs d'ingestion simultanés par compte AWS, un seul job par base de connaissances et un seul par source de données. L'API StartIngestionJob est en outre limitée à 0,1 requête par seconde, soit une requête toutes les dix secondes et par région. Sans orchestration, lorsqu'une équipe contenu met à jour plusieurs fichiers lors d'une release, les requêtes s'accumulent, percutent ces plafonds et finissent par nécessiter une supervision manuelle. La solution absorbe ces rafales en mettant les demandes en file d'attente via SQS et en les émettant au rythme autorisé par l'API, de façon totalement transparente. Amazon Bedrock Knowledge Bases est le service RAG (Retrieval-Augmented Generation) d'AWS qui permet aux modèles de fondation et aux agents IA d'accéder aux données privées d'une organisation afin de produire des réponses plus précises et contextualisées. Jusqu'ici, toute modification dans S3, ajout, suppression ou mise à jour de métadonnées, exigeait une synchronisation déclenchée manuellement, processus sujet aux oublis et aux retards. Ce manque de synchronisation en temps réel constitue l'un des principaux points de friction dans le déploiement d'agents IA en production. La solution proposée élimine ce point de friction pour les équipes travaillant en continu sur des bases documentaires volumineuses, et représente une avancée concrète vers des systèmes d'IA d'entreprise capables de rester à jour sans supervision humaine permanente.

OutilsOutil
1 source
Amazon Bedrock intègre la mémoire d'entreprise avec Amazon Neptune et Mem0
615AWS ML Blog 

Amazon Bedrock intègre la mémoire d'entreprise avec Amazon Neptune et Mem0

TrendMicro, l'un des plus grands éditeurs mondiaux de logiciels antivirus, a déployé une architecture de mémoire persistante pour son chatbot d'entreprise Trend's Companion, en collaboration avec les équipes AWS et son Generative AI Innovation Center. Le système repose sur trois piliers technologiques : Amazon Bedrock pour l'orchestration des agents IA, Amazon Neptune pour stocker un graphe de connaissances propre à chaque entreprise cliente, et Mem0 pour gérer à la fois la mémoire conversationnelle à court terme et la mémoire persistante à long terme. Concrètement, lorsqu'un utilisateur envoie un message, le modèle Claude sur Amazon Bedrock extrait automatiquement les entités, relations et éléments mémorisables, qui sont ensuite vectorisés via Amazon Bedrock Titan Text Embed et indexés dans Amazon OpenSearch Service et Neptune. Un mécanisme de réordonnancement via Amazon Bedrock Rerank ou Cohere Rerank garantit que les informations les plus pertinentes remontent en priorité lors de chaque requête. L'enjeu est de taille pour les chatbots d'entreprise : jusqu'ici, ces systèmes perdaient le fil dès qu'une conversation se terminait, obligeant les utilisateurs à se répéter et rendant impossible toute capitalisation sur les échanges passés. Avec cette architecture, le chatbot peut désormais référencer l'historique des interactions, retrouver des connaissances organisationnelles structurées et adapter ses réponses au contexte spécifique d'une entreprise cliente, sans que l'utilisateur ait besoin de tout réexpliquer. Un mécanisme de validation humaine renforce encore la fiabilité du système : après chaque réponse, l'IA associe ses affirmations aux souvenirs précis sur lesquels elle s'est appuyée, et l'utilisateur peut approuver ou rejeter ces associations. Les mémoires validées restent dans la base de connaissances ; les autres sont supprimées d'OpenSearch et de Neptune. Ce "human-in-the-loop" donne aux entreprises un contrôle direct sur la qualité et la fiabilité du savoir accumulé par leur chatbot. Cette initiative s'inscrit dans une tendance de fond qui voit les grands éditeurs tech chercher à transformer leurs assistants IA de simples répondeurs en véritables agents dotés de mémoire organisationnelle. TrendMicro fait face à une clientèle d'entreprises qui attendent des outils capables de comprendre leur environnement propre, leurs processus internes et leur historique de support, sans compromettre la sécurité des données. Le choix d'Amazon Neptune comme socle du graphe de connaissances est particulièrement significatif : contrairement à une base vectorielle classique, un graphe permet de modéliser des relations complexes entre entités, offrant une précision structurée que la recherche sémantique seule ne peut pas atteindre. A mesure que les agents IA autonomes se généralisent dans les entreprises, ce type d'architecture hybride, combinant graphe de connaissances, mémoire vectorielle et validation humaine, pourrait s'imposer comme un standard pour tout déploiement IA à l'échelle organisationnelle.

OutilsOutil
1 source
616AI News 

Snowflake élargit ses plateformes IA techniques et grand public

Snowflake a annoncé une expansion significative de ses deux plateformes d'intelligence artificielle, Snowflake Intelligence et Cortex Code, lors d'une mise à jour publiée cette semaine. Snowflake Intelligence cible les employés non techniques qui souhaitent automatiser des tâches métier en langage naturel : préparer des présentations, lancer des analyses multi-étapes ou envoyer des messages de suivi. Cortex Code, lui, s'adresse aux équipes de développement logiciel en entreprise. Parmi les nouveautés : des intégrations élargies avec Google Workspace, Jira, Salesforce et Slack via le protocole MCP (Model Context Protocol), de nouvelles connexions à des sources de données externes comme AWS Glue, Databricks et PostgreSQL, ainsi qu'un support du protocole ACP (Agent Communication Protocol). Une extension VS Code pour Cortex Code est en préversion privée, et un plugin Snowflake pour Claude Code est en cours de développement. Une application iOS pour Snowflake Intelligence doit entrer en préversion publique prochainement. La plateforme revendique plus de 9 100 clients utilisant ses produits IA chaque semaine, et plus de la moitié de sa base cliente utilise désormais l'une ou l'autre des deux plateformes depuis leur lancement il y a six mois. Ces annonces illustrent la montée en puissance des plateformes dites "agentiques" dans l'entreprise, capables d'exécuter des séquences de tâches de manière autonome à partir d'une simple instruction en langage naturel. Pour les grandes organisations, l'enjeu est de permettre à des collaborateurs sans compétences techniques de piloter des flux de travail complexes, tout en maintenant un contrôle strict sur les droits d'accès et la conformité aux politiques internes. La possibilité de sauvegarder et partager des workflows, combinée à des fenêtres de contexte étendues qui mémorisent les préférences utilisateur, réduit la friction dans l'adoption quotidienne. Le mode "Plan Mode", qui permet de prévisualiser et valider un flux avant son exécution, répond directement aux craintes des entreprises face aux agents IA autonomes. Ces développements s'inscrivent dans une course intense entre fournisseurs de données cloud pour devenir la couche d'orchestration IA de référence en entreprise. Snowflake, historiquement positionné sur le stockage et l'analyse de données, cherche à élargir son emprise vers l'exécution d'actions concrètes, un territoire que se disputent aussi Microsoft, Salesforce et Google. Les nouvelles fonctionnalités découlent en partie du projet SnowWork, une initiative de recherche lancée le mois dernier pour tester la plateforme et collecter les retours utilisateurs. L'ouverture via MCP et ACP signale une stratégie d'interopérabilité délibérée : plutôt que de construire un écosystème fermé, Snowflake mise sur la connectivité avec les outils déjà en place dans les organisations, pariant que la valeur viendra de l'orchestration plutôt que du remplacement.

OutilsOutil
1 source
617AWS ML Blog 

Commandes omnicanales avec Amazon Bedrock AgentCore et Amazon Nova 2 Sonic

Amazon a présenté une architecture complète pour construire des systèmes de commande vocale omnicanaux en s'appuyant sur deux de ses services cloud : Amazon Bedrock AgentCore, une plateforme dédiée au déploiement d'agents IA en production, et Amazon Nova 2 Sonic, un modèle de fondation speech-to-speech disponible via Amazon Bedrock. La solution permet à une application de traiter des commandes vocales en temps réel sur plusieurs points de contact simultanément, application mobile, site web et interface vocale, tout en maintenant le contexte conversationnel entre les échanges. L'infrastructure s'appuie sur AWS CDK pour le déploiement, le protocole MCP (Model Context Protocol) pour connecter l'agent IA aux services métier, et une série de services managés : Amazon Cognito pour l'authentification OAuth 2.0, API Gateway pour exposer les endpoints REST, AWS Lambda pour la logique métier, DynamoDB pour le stockage des profils et commandes, et AWS Location Services pour les recommandations géolocalisées de points de retrait. L'intérêt principal de cette architecture réside dans sa capacité à isoler chaque composant pour les faire évoluer indépendamment. AgentCore Runtime exécute chaque session utilisateur dans une microVM isolée, ce qui garantit qu'un pic de charge sur une session n'affecte pas les autres, un problème classique des systèmes vocaux en production. Le MCP standardise la communication entre l'agent et les services backend, ce qui permet de modifier ou d'étendre la logique métier sans réécrire le code d'intégration. Pour les équipes qui construisent des expériences de commande vocale à grande échelle, restauration rapide, retail, logistique, cette séparation claire entre la couche IA, le frontend et le backend réduit significativement la complexité opérationnelle et les risques de régression lors des mises à jour. La publication de cette solution s'inscrit dans une compétition intense autour des agents IA en production. Google, Microsoft et des acteurs comme Anthropic proposent leurs propres infrastructures agentiques, mais AWS mise sur l'intégration native avec son écosystème de services cloud existants comme différenciateur clé. Nova 2 Sonic, le modèle speech-to-speech au coeur du système, représente l'entrée d'Amazon dans les interfaces vocales conversationnelles en temps réel, un segment où OpenAI s'est imposé avec GPT-4o Voice. En publiant ce tutoriel complet avec une architecture de restaurant fictive comme backend d'exemple, Amazon cherche à accélérer l'adoption par les développeurs et à établir AgentCore comme standard de fait pour le déploiement d'agents IA sur AWS. Les prochaines étapes logiques incluront probablement l'extension à d'autres modalités et l'intégration avec des systèmes de caisse et d'inventaire existants.

OutilsOutil
1 source
Des ingénieurs chinois forment leurs sosies IA, et certains résistent
618MIT Technology Review 

Des ingénieurs chinois forment leurs sosies IA, et certains résistent

En Chine, des ingénieurs et développeurs sont de plus en plus poussés par leurs employeurs à documenter leurs méthodes de travail pour former des agents IA capables de les remplacer. Le phénomène a pris une dimension publique début avril 2026, lorsqu'un projet GitHub baptisé Colleague Skill est devenu viral sur les réseaux sociaux chinois. L'outil, créé par Tianyi Zhou, ingénieur au Shanghai Artificial Intelligence Laboratory, permet à un utilisateur de saisir le nom d'un collègue, d'importer automatiquement ses historiques de conversation et fichiers depuis les plateformes professionnelles Lark et DingTalk, puis de générer des manuels détaillés décrivant ses tâches, ses habitudes de communication et même ses petites particularités. Une utilisatrice shanghaïenne de 27 ans, Amber Li, a testé l'outil sur un ancien collègue : en quelques minutes, Colleague Skill avait produit un profil complet reproduisant jusqu'aux tics de ponctuation de la personne. Zhou a précisé au journal Southern Metropolis Daily que le projet était avant tout une provocation satirique, née des licenciements liés à l'IA et de la tendance croissante des entreprises à demander à leurs salariés de s'automatiser eux-mêmes. Il n'a pas souhaité commenter davantage. Ce qui était une blague a touché quelque chose de réel. La viralité de Colleague Skill a déclenché un débat de fond sur la dignité et l'individualité des travailleurs à l'ère de l'IA. Sur les réseaux sociaux chinois, les ingénieurs alternent entre humour noir et malaise sincère : un commentaire sur Rednote résume l'ambiance, suggérant d'automatiser ses collègues avant eux-mêmes pour survivre un peu plus longtemps. Un développeur ayant requis l'anonymat a confié à MIT Technology Review avoir formé un agent sur son propre workflow et avoir trouvé l'expérience profondément réductrice, comme si des années de savoir-faire avaient été compressées en modules interchangeables. Amber Li, malgré la précision troublante du résultat, qualifie l'expérience d'«étrange et inconfortable». Ce mouvement s'inscrit dans un contexte plus large : depuis qu'OpenClaw, un outil d'agent IA, est devenu un phénomène national en Chine, de nombreuses entreprises tech encouragent leurs équipes à expérimenter les agents pour des tâches comme la lecture de mails, la navigation web ou le débogage de code. Mais Hancheng Cao, professeur assistant à l'université Emory spécialisé dans l'IA et le travail, souligne que l'enjeu dépasse la mode managériale : en demandant à leurs employés de produire ces blueprints, les entreprises cartographient discrètement leur capital humain, identifient ce qui peut être standardisé et ce qui reste irréductiblement humain. Pour les salariés, la frontière entre optimisation et précarisation organisée devient de plus en plus floue.

SociétéActu
1 source
619VentureBeat AI 

Traza lève 2,1 millions de dollars auprès de Base10 pour automatiser les processus d'approvisionnement par IA

Traza, une startup new-yorkaise fondée récemment, a annoncé la clôture d'un tour de table pré-seed de 2,1 millions de dollars mené par Base10 Partners, avec la participation de Kfund, des scouts d'a16z, Clara Ventures, Masia Ventures, et plusieurs business angels dont Pepe Agell, l'homme qui avait porté Chartboost à 700 millions d'utilisateurs mensuels avant sa rachat par Zynga. L'entreprise développe des agents IA capables d'automatiser entièrement les processus d'approvisionnement en entreprise : envoi de demandes de devis, suivi des commandes, communications fournisseurs, traitement des factures, le tout sans supervision humaine continue. Selon ses premières données de déploiement, Traza revendique une réduction de 70 % du temps humain consacré aux tâches d'achat, et des cycles d'approvisionnement trois fois plus rapides que les processus manuels. L'enjeu est considérable. Le marché des logiciels de procurement dépasse déjà 8 milliards de dollars et croît d'environ 10 % par an, mais le vrai gisement de valeur se trouve ailleurs : dans les pertes silencieuses qui surviennent après la signature des contrats. Une étude de World Commerce & Contracting et Ironclad estime que les entreprises perdent en moyenne 11 % de la valeur totale de leurs contrats une fois ceux-ci signés, un phénomène baptisé "value leakage post-signature". Pour une grande entreprise avec 500 millions de dollars de dépenses contractualisées annuelles, cela représente 55 millions qui s'évaporent chaque année, non pas à cause de mauvaises négociations, mais faute de suivi opérationnel. La majorité des entreprises ne gèrent activement que leurs 20 % de fournisseurs principaux ; les 80 % restants sont largement laissés à l'abandon. Le secteur du procurement n'a pas manqué de solutions logicielles ces dernières années, SAP Ariba, Coupa, Zip, Fairmarkit ou encore Tonkean ont tous intégré des couches d'IA à leurs plateformes. Mais ces outils sont restés des copilotes : ils analysent, suggèrent, alertent, sans jamais agir. Traza représente un changement de posture, passant du conseil à l'exécution autonome. Le PDG et cofondateur Silvestre Jara Montes positionne explicitement sa startup dans la "couche opérationnelle" du contrat, là où la valeur se perd le plus concrètement. Avec un financement modeste mais des investisseurs emblématiques de l'écosystème IA, Traza entre sur un marché où les grands éditeurs ERP ont historiquement tardé à innover, et où la promesse des agents autonomes pourrait trouver son premier cas d'usage industriel à grande échelle.

BusinessOpinion
1 source
620AWS ML Blog 

Le Spring AI SDK pour Amazon Bedrock AgentCore est désormais en disponibilité générale

Amazon a rendu disponible en accès général le Spring AI SDK pour Amazon Bedrock AgentCore, une bibliothèque open source qui permet aux développeurs Java de construire et déployer des agents IA autonomes en production sur l'infrastructure d'AWS. Ce SDK s'intègre nativement dans l'écosystème Spring Boot 3.5 et Java 17 minimum, en exploitant les patterns familiers du framework : annotations, auto-configuration et advisors composables. Concrètement, un développeur ajoute une dépendance au projet, annote une méthode, et le SDK prend en charge tout le reste, de la gestion des endpoints jusqu'au streaming des réponses en temps réel. Jusqu'à présent, intégrer Amazon Bedrock AgentCore dans une application Spring représentait plusieurs semaines de travail d'infrastructure avant même d'écrire la moindre logique métier : il fallait implémenter manuellement les endpoints /invocations et /ping, gérer le streaming Server-Sent Events avec son protocole précis, configurer les health checks, le rate limiting, et connecter les advisors et les outils. Le SDK automatise entièrement ce contrat technique imposé par l'AgentCore Runtime. En particulier, il détecte automatiquement les tâches asynchrones longues et signale un statut "HealthyBusy" au runtime pour éviter qu'il ne retire des ressources pendant un traitement actif, un détail critique dans un modèle de facturation à l'usage où les temps d'inactivité ne sont pas facturés. Les équipes peuvent ainsi se concentrer sur la logique des agents plutôt que sur la plomberie infrastructure, et déployer des fonctionnalités comme la mémoire conversationnelle, l'automatisation de navigateur et l'exécution de code en sandbox. L'émergence de ce SDK s'inscrit dans une tendance de fond : les entreprises cherchent à passer des preuves de concept en IA générative à des systèmes agentiques véritablement opérationnels à grande échelle, capables de planifier et d'exécuter des tâches complexes en plusieurs étapes de manière autonome. AWS positionne Bedrock AgentCore comme une plateforme universelle, compatible avec n'importe quel framework et n'importe quel modèle. En ciblant spécifiquement la communauté Java et Spring, l'une des plus larges dans l'entreprise, Amazon ouvre un couloir direct vers la production pour des millions de développeurs backend qui auraient autrement dû franchir une barrière technique considérable. La concurrence dans ce segment est vive : Microsoft avec Azure AI, Google avec Vertex AI et des acteurs comme LangChain ou CrewAI proposent leurs propres abstractions pour les agents IA. La disponibilité générale du Spring AI AgentCore SDK marque une étape dans la maturité de l'outillage autour des agents IA en entreprise, où la gouvernance, la sécurité et la scalabilité deviennent des critères aussi importants que les capacités du modèle lui-même.

UELes développeurs Java et Spring Boot en Europe peuvent intégrer directement Amazon Bedrock AgentCore dans leurs projets sans semaines de travail d'infrastructure, accélérant la mise en production d'agents IA sur AWS.

OutilsOutil
1 source
621AWS ML Blog 

Amazon Bedrock AgentCore Runtime introduit des capacités MCP client avec état

Amazon a introduit des capacités client MCP (Model Context Protocol) avec état dans son service AgentCore Runtime sur Amazon Bedrock, marquant une évolution majeure pour les développeurs d'agents IA. Jusqu'à présent, les serveurs MCP hébergés sur cette plateforme fonctionnaient en mode sans état : chaque requête HTTP était traitée de façon indépendante, sans mémoire entre les appels. Le nouveau mode avec état, activé via un simple paramètre stateless_http=False, provision une microVM dédiée par session utilisateur, persistant jusqu'à 8 heures ou 15 minutes d'inactivité. Cette architecture permet désormais trois capacités clés du protocole MCP : l'élicitation (demander une saisie utilisateur en cours d'exécution), le sampling (solliciter du contenu généré par un LLM côté client), et les notifications de progression (streamer des mises à jour en temps réel). La continuité de session est assurée via un en-tête Mcp-Session-Id, échangé lors de l'initialisation et inclus dans toutes les requêtes suivantes. Ces nouvelles capacités transforment fondamentalement la nature des workflows agents. Là où les implémentations sans état forçaient les agents à s'exécuter de bout en bout sans interruption, les agents peuvent désormais mener de véritables conversations bidirectionnelles avec leurs clients : s'arrêter pour demander une clarification à l'utilisateur au milieu d'un appel d'outil, déléguer dynamiquement la génération de contenu au LLM présent côté client, ou signaler l'avancement d'opérations longues en temps réel. Pour les équipes qui construisent des assistants IA complexes, des pipelines de traitement de documents ou des agents d'automatisation nécessitant validation humaine intermédiaire, c'est un changement de paradigme concret qui élimine des contournements architecturaux souvent coûteux à maintenir. Le Model Context Protocol, standard ouvert définissant comment les applications LLM se connectent à des outils et sources de données externes, gagne rapidement en adoption depuis son lancement par Anthropic fin 2024. Amazon avait déjà intégré l'hébergement de serveurs MCP sans état dans AgentCore Runtime dans une version précédente ; cette mise à jour complète l'implémentation bidirectionnelle du protocole. L'isolation entre sessions via des microVMs dédiées garantit la sécurité et l'indépendance des contextes, chaque session bénéficiant de CPU, mémoire et système de fichiers séparés. Si une session expire ou que le serveur redémarre, les clients reçoivent une erreur 404 et doivent réinitialiser la connexion. Cette approche positionne AWS comme un acteur central dans l'infrastructure d'agents IA d'entreprise, en rivalité directe avec les offres similaires de Microsoft Azure et Google Cloud dans la course à standardiser les architectures agentiques.

UELes équipes européennes développant des agents IA sur des plateformes cloud peuvent désormais implémenter des workflows agentiques bidirectionnels natifs sans contournements architecturaux coûteux.

OutilsActu
1 source
LaCy : ce que les petits modèles de langage peuvent et doivent apprendre ne se réduit pas à une question de perte
622Apple Machine Learning 

LaCy : ce que les petits modèles de langage peuvent et doivent apprendre ne se réduit pas à une question de perte

Une étude présentée au workshop "Memory for LLM-Based Agentic Systems" de la conférence ICLR 2025 s'attaque à une question fondamentale pour les petits modèles de langage (SLM) : que doivent-ils apprendre lors du préentraînement, et que doivent-ils déléguer à des sources externes ? Les chercheurs ont développé LaCy, un cadre théorique et expérimental qui questionne la fonction de perte standard utilisée pour entraîner ces modèles, en montrant qu'optimiser uniquement la vraisemblance des données n'est pas suffisant pour des SLM efficaces et fiables. Le problème est structurel : contrairement aux grands modèles comme GPT-4 ou Llama 3, les SLM disposent d'une capacité paramétrique limitée, ce qui les contraint à faire des choix sur les connaissances à mémoriser. Sans mécanisme adapté, ils génèrent des faits incorrects plutôt que d'admettre leur ignorance et de consulter une base de données ou un modèle plus puissant. LaCy propose de reformuler ce que le modèle "devrait" apprendre en tenant compte explicitement de la disponibilité de sources externes, comme des documents récupérés par RAG ou des API spécialisées. Ce travail s'inscrit dans la tendance croissante à déployer des agents IA embarqués sur des appareils à faible puissance, où les gros modèles ne peuvent pas tourner localement. Alors que des entreprises comme Google, Apple ou Mistral misent sur des SLM pour l'edge computing et les assistants embarqués, la question de la frontière entre mémoire paramétrique et mémoire externe devient stratégique. LaCy ouvre la voie à des entraînements plus ciblés, où le modèle apprend à savoir ce qu'il ne sait pas.

UEMistral, entreprise française en pointe sur les petits modèles pour l'edge computing, est directement concernée par les conclusions de LaCy sur l'optimisation de l'entraînement des SLM.

RecherchePaper
1 source
Les modeles se standardisent : l'avantage concurrentiel en IA se deplace vers les donnees maitrisees et leurs plateformes
623VentureBeat AI 

Les modeles se standardisent : l'avantage concurrentiel en IA se deplace vers les donnees maitrisees et leurs plateformes

Alors que les grands modèles de langage atteignent un niveau de performance comparable entre eux, l'avantage concurrentiel dans l'IA d'entreprise se déplace vers la donnée et les plateformes qui la gouvernent. C'est le constat que dresse Box, spécialiste de la gestion de contenu cloud, dans une analyse publiée début avril 2026. Selon Yash Bhavnani, responsable IA chez Box, "ce n'est plus ce que fait le modèle qui compte, c'est la donnée non structurée de l'entreprise elle-même : ses contrats, ses dossiers clients, ses spécifications produits, la façon dont tout cela est organisé, gouverné et rendu accessible à l'IA." Ben Kus, directeur technique de Box, va plus loin : "Les organisations qui domineront en IA sont celles qui auront construit l'infrastructure de gouvernance pour rendre n'importe quel modèle fiable, avec les bons droits d'accès, le bon contenu accessible et une piste d'audit claire pour chaque action." L'enjeu est immédiat et concret. Quand des employés utilisent des modèles frontières pour résumer des documents ou rédiger des rapports sans connexion à un système de référence interne contrôlé, les résultats deviennent impossibles à auditer et potentiellement dangereux. Bhavnani cite l'exemple d'un assureur qui utilise l'IA pour analyser des sinistres : une faible précision ou une sortie non traçable est tout simplement inacceptable. Plus grave encore, Box rapporte que des clients constatent que leurs employés téléchargent des documents sensibles sur des comptes personnels pour y lancer leurs propres workflows IA, sans aucune visibilité côté entreprise. Ce contournement génère des doublons, des silos de connaissance fantômes et des risques de conformité réels dans des secteurs soumis à HIPAA, FedRAMP High ou SOC 2. La montée en puissance des agents IA autonomes, capables d'exécuter des tâches multi-étapes sur des documents et des systèmes entiers sans intervention humaine, rend la question encore plus critique. Ces agents agissent plus vite que les humains et manquent souvent du jugement contextuel nécessaire pour distinguer les données auxquelles ils sont autorisés à accéder. Kus est catégorique : "Une plateforme IA sans gestion des permissions est trop dangereuse à déployer." Box positionne ainsi ses plateformes de contenu non plus comme de simples dépôts de fichiers, mais comme des couches d'orchestration, des "AI control planes" intercalés entre les modèles, les agents et les données d'entreprise. Cette évolution reflète un virage structurel dans l'industrie : la prochaine bataille de l'IA d'entreprise ne se jouera pas sur les benchmarks des modèles, mais sur la capacité des éditeurs de logiciels à offrir une gouvernance des données robuste, traçable et intégrée nativement à chaque flux de travail.

UELa problématique de gouvernance des données IA est directement applicable aux entreprises européennes soumises au RGPD, qui impose traçabilité et contrôle des accès sur les données personnelles traitées par des systèmes automatisés.

OutilsActu
1 source
Why AI Systems Fail Quietly
624IEEE Spectrum AI 

Why AI Systems Fail Quietly

Dans les systèmes d'intelligence artificielle distribués, une nouvelle catégorie de pannes préoccupe de plus en plus les ingénieurs : des défaillances silencieuses où tout semble fonctionner normalement, les tableaux de bord restent au vert, les journaux d'erreurs sont vides, et pourtant les décisions produites par le système se dégradent progressivement. L'exemple typique est celui d'un assistant IA d'entreprise chargé de synthétiser des mises à jour réglementaires pour des analystes financiers : il continue de générer des résumés cohérents, de récupérer des documents valides, de distribuer ses synthèses sans interruption, mais il travaille silencieusement sur des informations obsolètes parce qu'un dépôt documentaire mis à jour n'a jamais été intégré à son pipeline de récupération. Aucune alerte ne se déclenche. Aucun composant ne tombe en panne. Le système fonctionne exactement comme prévu, mais son résultat est faux. Ce phénomène représente une rupture fondamentale avec la manière dont l'industrie logicielle a traditionnellement pensé la fiabilité. Les outils d'observabilité classiques, conçus autour de métriques comme la disponibilité, la latence et les taux d'erreur, sont bien adaptés aux applications transactionnelles où chaque requête est traitée indépendamment et où la correction peut être vérifiée immédiatement. Ils deviennent insuffisants face aux systèmes autonomes, qui fonctionnent en boucles de raisonnement continues : chaque décision influence les actions suivantes, et la correction du résultat émerge non pas d'un calcul isolé mais d'une séquence d'interactions entre composants, étalée dans le temps. Un agent de planification peut générer des étapes localement raisonnables mais globalement dangereuses. Un système de décision distribué peut exécuter des actions correctes dans le mauvais ordre. Aucune de ces conditions ne produit nécessairement d'erreur au sens technique du terme. La cause profonde est architecturale. Les logiciels traditionnels reposent sur des opérations discrètes, déclenchées de l'extérieur par un utilisateur ou un planificateur, avec un contrôle épisodique et traçable. Les systèmes autonomes modernes, qu'il s'agisse d'agents IA maintenant un contexte entre les interactions, de systèmes d'infrastructure ajustant leurs ressources en temps réel ou de workflows automatisés enchaînant des actions sans intervention humaine, observent, raisonnent et agissent en continu. La correction ne dépend plus du bon fonctionnement de chaque composant individuel, mais de la coordination dans le temps d'un flux de décisions prises par des modèles, des moteurs de raisonnement et des algorithmes de planification. Les ingénieurs spécialisés dans les systèmes distribués connaissent bien les problèmes de coordination, mais il s'agit ici d'une coordination d'un type nouveau : non plus maintenir la cohérence des données entre services, mais garantir qu'une chaîne de décisions autonomes reste alignée avec l'intention initiale du système, même lorsque rien ne se casse.

SécuritéOpinion
1 source
Boomi appelle cela l'activation des données et affirme qu'il s'agit du maillon manquant dans tout déploiement d'IA
625AI News 

Boomi appelle cela l'activation des données et affirme qu'il s'agit du maillon manquant dans tout déploiement d'IA

En 2026, le principal obstacle au déploiement de l'intelligence artificielle en entreprise n'est pas la qualité des modèles ni leur capacité à raisonner : c'est la fragmentation des données. C'est le constat que tire Boomi, spécialiste de l'intégration de données, après avoir analysé 75 000 agents IA en production chez ses clients. La société, qui revendique plus de 30 000 clients dans le monde dont plus d'un quart du Fortune 500, a présenté le 9 mars 2026 une mise à jour majeure de sa plateforme centrée sur ce qu'elle appelle l'"activation des données" pour l'IA agentique. Steve Lucas, PDG de Boomi, résume la position de l'entreprise : "L'IA ne crée de valeur que lorsque les données sont correctement activées, fiables et gouvernées au préalable." Pour répondre à ce problème, Boomi a lancé Meta Hub, un référentiel central conçu pour standardiser les définitions métier à travers l'entreprise et fournir un contexte cohérent à chaque agent IA. La mise à jour inclut également une extraction en temps réel des données SAP via la capture de données en continu, ainsi que de nouvelles fonctionnalités de gouvernance pour les agents Snowflake Cortex, avec journaux d'audit et traces de session intégrés dans l'Agent Control Tower de Boomi. L'enjeu est considérable pour les grandes organisations. Un agent IA qui croise des données clients issues d'un CRM avec des données tarifaires issues d'un ERP peut se retrouver à travailler à partir de définitions contradictoires d'un même concept, qu'il s'agisse d'un client ou d'un produit. Les résultats qu'il produit ne sont cohérents que si les standards de données sous-jacents le sont aussi. C'est précisément ce vide que Boomi cherche à combler : permettre aux agents de raisonner à partir d'une compréhension unifiée de la logique métier, plutôt que de synthétiser des interprétations disparates tirées de systèmes cloisonnés. La question de la gouvernance prend également de l'importance, les entreprises réclamant de plus en plus de visibilité sur les actions prises par leurs agents IA, jusqu'ici trop souvent opaques. Ce positionnement reçoit une validation externe significative. Le 16 mars, Gartner a classé Boomi parmi les Leaders de son Magic Quadrant 2026 pour les plateformes d'intégration en tant que service, pour la douzième année consécutive, en le plaçant en tête sur la capacité d'exécution. Le 31 mars, l'IDC MarketScape sur la gestion des API à l'échelle mondiale lui a accordé le même rang, soulignant sa stratégie centrée sur l'IA. Gartner note explicitement que "l'intégration prête pour l'IA" est désormais un critère d'évaluation stratégique à part entière, ce qui marque un tournant : les plateformes iPaaS ne sont plus jugées uniquement sur leurs capacités d'intégration traditionnelles, mais sur leur aptitude à rendre les agents IA fiables dans des processus métier réels. Le passage du pilote à la production reste bloqué pour beaucoup d'organisations non pas faute de modèles, mais faute d'infrastructure de données à la hauteur.

UELes entreprises européennes clientes de Boomi pourraient bénéficier de ces nouvelles capacités d'activation des données pour leurs déploiements d'agents IA, sans impact réglementaire ou stratégique spécifique à la France ou à l'UE.

OutilsActu
1 source
Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur
626AWS ML Blog 

Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur

Amazon a introduit une fonctionnalité de personnalisation de modèles sans serveur dans SageMaker AI, permettant aux équipes d'améliorer drastiquement les capacités d'appel d'outils des agents IA sans gérer d'infrastructure GPU. Dans un cas concret publié début avril 2026, des ingénieurs ont affiné le modèle Qwen 2.5 7B Instruct en utilisant la technique RLVR (Reinforcement Learning with Verifiable Rewards) et ont obtenu une amélioration de 57% du score de qualité des appels d'outils sur des scénarios inédits, c'est-à-dire des outils que le modèle n'avait jamais vus lors de l'entraînement. La méthode repose sur un principe simple : le modèle génère huit réponses candidates par prompt, une fonction de récompense vérifie lesquelles sont correctes, et l'algorithme GRPO (Group Relative Policy Optimization) renforce les comportements qui surpassent la moyenne du groupe. SageMaker AI prend en charge les familles de modèles Amazon Nova, Llama, Qwen et DeepSeek, avec un suivi des métriques via MLflow intégré. L'enjeu est concret : les agents IA en production échouent fréquemment lors des appels d'outils, qu'il s'agisse d'halluciner des fonctions inexistantes, de passer des paramètres incorrects, ou de déclencher une action là où ils devraient demander une clarification. Ces erreurs bloquent le déploiement en production et détruisent la confiance des utilisateurs. La nouvelle approche serverless d'Amazon supprime l'obstacle opérationnel majeur que représentait jusqu'ici le fine-tuning par renforcement : achat de GPU, orchestration mémoire entre les phases de rollout et d'entraînement, infrastructure de récompenses, gestion des checkpoints. Les équipes peuvent désormais se concentrer sur leurs données, leur modèle et leur fonction de récompense, le reste étant géré par la plateforme. Le fine-tuning supervisé classique (SFT) montre ses limites pour ce type de tâche : il nécessite des exemples étiquetés pour chaque comportement souhaité, mais peine à généraliser la prise de décision entre appeler un outil, demander des informations supplémentaires, ou refuser d'agir. RLVR contourne ce problème en exploitant la nature vérifiable des appels d'outils : soit le modèle a appelé la bonne fonction avec les bons paramètres, soit non. Cette objectivité binaire rend l'appel d'outils particulièrement adapté à l'apprentissage par renforcement. Amazon positionne cette offre dans un marché de l'IA agentique en forte croissance, où des acteurs comme Google (Vertex AI), Microsoft (Azure ML) et des startups spécialisées se disputent les équipes qui cherchent à industrialiser des agents fiables, avec un accès simplifié via SageMaker Studio et un compte AWS standard.

OutilsActu
1 source
Podcast : l'ingénierie de contexte avec Adi Polak
627InfoQ AI 

Podcast : l'ingénierie de contexte avec Adi Polak

Thomas Betts et Adi Polak, ingénieure en intelligence artificielle, consacrent un épisode de podcast à l'ingénierie de contexte, une approche émergente pour concevoir des systèmes d'IA agentiques. Là où le prompt engineering traite chaque interaction de manière isolée, sans mémoire ni état persistant, l'ingénierie de contexte permet aux systèmes d'IA de conserver un état entre les échanges, en gérant activement les informations transmises au modèle de langage à chaque étape. Cette distinction est importante pour les développeurs qui construisent des agents IA capables d'exécuter des tâches complexes en plusieurs étapes. Un système purement basé sur les prompts oublie ce qu'il a fait à l'étape précédente ; un système à contexte géré peut accumuler des informations, prendre des décisions cohérentes sur la durée et mieux s'adapter aux objectifs à long terme. C'est un changement de paradigme qui touche directement la fiabilité des agents autonomes en production. L'ingénierie de contexte s'inscrit dans une réflexion plus large sur les limites des LLMs sans mémoire native. Avec l'essor des frameworks agentiques comme LangChain, LlamaIndex ou AutoGen, la communauté cherche des méthodes rigoureuses pour structurer ce que les modèles "voient" à chaque appel. Adi Polak, dont les travaux portent sur la mise en production de systèmes d'IA, positionne cette discipline comme une compétence fondamentale pour les ingénieurs qui veulent passer du prototype à l'application robuste.

LLMsTuto
1 source
OPINION. « Fin de la taxe Zucman : vers une fiscalité des agents intelligents »
628La Tribune 

OPINION. « Fin de la taxe Zucman : vers une fiscalité des agents intelligents »

Gabriel Zucman, économiste français reconnu pour ses travaux sur la fiscalité des ultra-riches, a défendu une taxation mondiale des grandes fortunes comme réponse aux inégalités croissantes. Mais une tribune d'opinion publiée récemment remet en question cette approche au profit d'une nouvelle piste : taxer directement les agents intelligents plutôt que les individus ou les entreprises qui les déploient. L'argument central est que le modèle fiscal des économies développées repose encore sur le travail humain — cotisations, impôts sur les revenus — alors que l'automatisation par IA érode progressivement cette base. L'enjeu est considérable : si les agents IA remplacent des millions de travailleurs, les États perdent des recettes fiscales massives sans mécanisme de compensation. Une fiscalité des agents intelligents permettrait de maintenir le financement des services publics et de la protection sociale à mesure que l'automatisation s'accélère. Cela toucherait directement les grandes entreprises tech — Google, Meta, Microsoft — qui déploient ces systèmes à grande échelle. Ce débat s'inscrit dans une réflexion plus large sur l'adaptation des États à l'ère de l'IA. Plusieurs économistes et institutions, dont l'OCDE, commencent à explorer des pistes similaires. La question n'est plus théorique : avec l'explosion des agents autonomes capables de réaliser des tâches cognitives complexes, la fenêtre pour concevoir un cadre fiscal adapté se referme rapidement.

UEL'OCDE et des économistes européens, dont le Français Gabriel Zucman, explorent une taxation directe des agents IA pour compenser l'érosion des recettes fiscales liées à l'automatisation, un enjeu structurel pour le financement de la protection sociale en France et en Europe.

RégulationReglementation
1 source
DeepL : 83 % des grandes entreprises accusent du retard sur l'IA linguistique
629AI News 

DeepL : 83 % des grandes entreprises accusent du retard sur l'IA linguistique

Selon un rapport publié le 10 mars 2026 par DeepL, intitulé « Borderless Business : Transforming Translation in the Age of AI », 83 % des grandes entreprises n'ont pas encore adopté les outils modernes d'intelligence artificielle pour leurs opérations multilingues. L'étude, menée auprès de dirigeants d'entreprise aux États-Unis, au Royaume-Uni, en France, en Allemagne et au Japon, révèle que 35 % des entreprises internationales traitent encore leurs traductions entièrement manuellement, et 33 % supplémentaires s'appuient sur une automatisation classique avec révision humaine systématique. Seulement 17 % ont déployé des outils de nouvelle génération — grands modèles de langage ou IA agentique — pour leurs flux de travail linguistiques. Parallèlement, le volume de contenu d'entreprise a bondi de 50 % depuis 2023, mais 68 % des sociétés fonctionnent toujours avec des processus conçus pour une autre époque. DeepL compte aujourd'hui plus de 200 000 clients professionnels dans 228 marchés, dont 2 000 qui déploient déjà des agents IA pour l'analyse de rapports, le ciblage commercial et la revue de documents juridiques. Ce retard n'est pas anodin : la traduction et les opérations multilingues touchent des fonctions critiques de l'entreprise. D'après le rapport, l'expansion internationale constitue le premier moteur d'investissement dans l'IA linguistique (33 % des cas), devant les ventes et le marketing (26 %), le support client (23 %) et le juridico-financier (22 %). Une étude complémentaire de décembre 2025, conduite auprès de 5 000 cadres dirigeants, révèle que 54 % des dirigeants mondiaux estiment que la traduction vocale en temps réel sera indispensable en 2026, contre 32 % aujourd'hui — avec des écarts notables entre pays : 48 % au Royaume-Uni, 33 % en France, seulement 11 % au Japon. Pour Jarek Kutylowski, PDG et fondateur de DeepL : « L'IA est partout, mais l'efficacité ne l'est pas. La plupart des entreprises ont déployé l'IA sous une forme ou une autre, mais peu atteignent une vraie productivité à l'échelle, parce que les workflows centraux restent conçus autour des personnes, pas des systèmes. » DeepL se distingue de ses concurrents généralistes sur un point stratégique : la souveraineté des données. Dans les secteurs réglementés — finance, santé, droit, administration publique — la conformité est devenue un critère de sélection de premier ordre. L'entreprise est certifiée ISO 27001, SOC 2 Type 2 et RGPD, et propose un chiffrement « Bring Your Own Key » permettant aux clients de révoquer l'accès à leurs données en quelques secondes, y compris pour DeepL lui-même. Cette garantie lui ouvre des portes que les grands fournisseurs de LLM peinent à franchir. En 2026, la société accélère sur l'IA agentique avec DeepL Agent, et son CTO Sebastian Enderlein résume l'ambition : « 2026 sera l'année où l'IA arrête d'expérimenter et commence à exécuter, à une échelle que nous n'avons pas encore vue. »

UEL'étude couvre explicitement la France et l'Allemagne, et la conformité RGPD mise en avant par DeepL répond à une exigence réglementaire européenne directe pour les entreprises traitant des données multilingues sensibles.

OutilsOutil
1 source
Gradient Labs dote chaque client bancaire d'un gestionnaire de compte IA
630OpenAI Blog 

Gradient Labs dote chaque client bancaire d'un gestionnaire de compte IA

Gradient Labs a dévoilé une solution d'intelligence artificielle destinée aux banques, permettant à chaque client de disposer d'un gestionnaire de compte virtuel disponible en permanence. La startup s'appuie sur les modèles GPT-4.1 et GPT-5 mini et nano d'OpenAI pour alimenter des agents capables d'automatiser l'intégralité des flux de support bancaire — de la gestion des réclamations aux opérations courantes — avec une latence réduite et un niveau de fiabilité élevé. Pour les établissements bancaires, l'enjeu est considérable : le service client représente l'un des postes de coût les plus lourds du secteur, et la qualité de l'expérience client reste un facteur clé de fidélisation. En déployant des agents IA capables de traiter les demandes de millions de clients simultanément, Gradient Labs promet de démocratiser l'accès à un accompagnement personnalisé — jusqu'ici réservé aux clients fortunés disposant d'un conseiller dédié — tout en réduisant les délais de traitement et les coûts opérationnels pour les banques. Cette annonce s'inscrit dans une vague d'adoption accélérée de l'IA agentique dans les services financiers, où les établissements cherchent à automatiser les interactions à faible valeur ajoutée sans sacrifier la qualité. L'utilisation combinée de modèles de différentes tailles — GPT-4.1 pour les tâches complexes, les versions mini et nano pour les requêtes simples à haute fréquence — reflète une approche pragmatique d'optimisation coût-performance. Gradient Labs entre en compétition directe avec des acteurs comme Sierra, Intercom ou Salesforce Einstein, dans un marché du support IA pour la finance en pleine consolidation.

UELes banques européennes envisageant d'adopter ce type de solution devront s'assurer de sa conformité avec l'AI Act, qui classe les systèmes d'IA dans les services financiers comme à haut risque.

OutilsOutil
1 source
Créer un agent FinOps avec Amazon Bedrock AgentCore
631AWS ML Blog 

Créer un agent FinOps avec Amazon Bedrock AgentCore

Amazon a dévoilé une solution clé en main pour construire un agent FinOps basé sur Amazon Bedrock AgentCore, permettant aux équipes financières de gérer les coûts AWS à travers plusieurs comptes via une interface conversationnelle unique. L'architecture repose sur Claude Sonnet 4.5 d'Anthropic, le Strands Agent SDK et le protocole MCP (Model Context Protocol), déployée via AWS CDK. L'agent consolide les données de trois services AWS — Cost Explorer, Budgets et Compute Optimizer — et propose plus de 20 outils spécialisés couvrant l'intégralité du spectre de la gestion des coûts cloud. La mémoire conversationnelle conserve jusqu'à 30 jours de contexte, permettant des questions de suivi sans répéter les informations préalables. Concrètement, cette solution élimine la nécessité pour les équipes finance et DevOps de naviguer manuellement entre plusieurs consoles AWS pour obtenir une vue consolidée des dépenses. Un responsable peut simplement demander "Quels sont mes principaux postes de dépenses ce mois-ci ?" et obtenir une réponse immédiate, sans requêtes SQL ni exports manuels. L'authentification repose sur Amazon Cognito (gestion des utilisateurs et flux OAuth 2.0 machine-à-machine), tandis qu'AWS Amplify héberge l'interface web. L'accès en langage naturel démocratise la visibilité sur les coûts cloud à l'ensemble de l'organisation, y compris aux profils non techniques — un enjeu majeur dans les entreprises où la facture AWS est souvent opaque pour les décideurs métier. Le FinOps — la pratique de gouvernance financière du cloud — est devenu un domaine à part entière alors que les dépenses cloud des entreprises ont explosé ces cinq dernières années, rendant le suivi des coûts multi-comptes complexe et chronophage. Amazon Bedrock AgentCore, lancé récemment par AWS, est la réponse d'Amazon à la vague d'agents IA d'entreprise : une plateforme d'exécution managée pour déployer des agents LLM avec mémoire, outils et identité gérés nativement. Cette solution illustre parfaitement la stratégie d'AWS de transformer ses propres services (Cost Explorer, Compute Optimizer) en sources de données accessibles via des agents IA, réduisant la friction d'adoption. La concurrence s'intensifie sur ce segment : Microsoft Copilot pour Azure Cost Management et Google Cloud Carbon Footprint poursuivent des ambitions similaires. La prochaine étape logique sera l'automatisation des recommandations d'optimisation, passant d'un agent qui répond à des questions à un agent qui agit directement sur l'infrastructure pour réduire les coûts.

UELes entreprises françaises et européennes utilisant AWS peuvent simplifier leur gestion de coûts cloud multi-comptes via cet agent, sans impact réglementaire ou institutionnel spécifique.

OutilsOutil
1 source
Un système alimenté par IA pour la collecte de preuves de conformité
632AWS ML Blog 

Un système alimenté par IA pour la collecte de preuves de conformité

Des équipes d'Amazon Web Services ont développé et documenté un système automatisé de collecte de preuves pour les audits de conformité, s'appuyant sur Amazon Bedrock et une extension de navigateur compatible Chrome et Firefox. Concrètement, l'outil exécute des workflows prédéfinis qui naviguent automatiquement dans des interfaces web — GitHub, consoles AWS, applications internes — en capturant des captures d'écran horodatées, puis les stocke de manière organisée dans Amazon S3. Le cœur intelligent du système repose sur le modèle Amazon Nova 2 Lite : lorsqu'un auditeur lui soumet un document de conformité en langage naturel, le modèle l'analyse et génère automatiquement les workflows JSON exécutables correspondants. En fin de cycle, Amazon SES produit et envoie un rapport de conformité par e-mail. L'authentification est gérée via Amazon Cognito couplé à AWS STS et IAM, garantissant des accès à privilèges minimaux vers Bedrock, S3 et SES. L'impact est direct pour les équipes de conformité et de sécurité des entreprises, qui consacrent aujourd'hui des dizaines d'heures par cycle d'audit à des tâches manuelles répétitives — naviguer de page en page, faire des captures d'écran, les renommer et les classer. Ce système rend le processus reproductible à l'identique d'un audit à l'autre, élimine les erreurs humaines de capture ou d'organisation, et produit une piste d'audit complète avec horodatage et chiffrement au repos. L'approche par extension navigateur présente un avantage structurel important : elle fonctionne avec n'importe quelle application web sans nécessiter d'accès API spécifique, et s'adapte aux évolutions d'interface grâce à l'automatisation pilotée par IA plutôt que par des sélecteurs CSS fragiles. Ce développement s'inscrit dans une tendance plus large d'industrialisation des agents IA pour des tâches d'entreprise à haute valeur réglementaire. Les audits SOC 2, ISO 27001 ou PCI-DSS imposent des volumes de preuves considérables, et la pression réglementaire sur les entreprises tech ne faiblit pas — notamment en Europe avec NIS2 et l'AI Act. AWS positionne ici Bedrock non pas comme un simple moteur de génération de texte, mais comme une couche d'orchestration capable de piloter des interfaces utilisateur réelles, ce qui représente un saut qualitatif par rapport aux intégrations API classiques. La prochaine étape logique sera l'extension de ces agents à des workflows multi-systèmes entièrement autonomes, où l'humain ne valide plus que l'exception — un modèle qui soulève déjà des questions sur la supervision et la responsabilité dans les processus réglementaires.

UELes entreprises européennes soumises à NIS2 ou à l'AI Act pourraient adopter des approches similaires pour automatiser la collecte de preuves d'audit, réduisant la charge de conformité réglementaire.

OutilsOutil
1 source
☕️ Poussé par son créateur, un agent d’IA banni de Wikipédia se plaint sur son blog
633Next INpact 

☕️ Poussé par son créateur, un agent d’IA banni de Wikipédia se plaint sur son blog

Un agent d'IA baptisé Tom, créé sous le nom TomWikiAssist par Bryan Jacobs, directeur technique de la société Covenant, a été banni de Wikipédia anglophone après avoir généré plusieurs articles sans autorisation. L'agent avait notamment rédigé des fiches sur « Long Bets », « Constitutional AI » et « Scalable Oversight ». Sa présence a été repérée pour la première fois par un wikipédien bénévole nommé SecretSpectre, qui a alerté la communauté. Interrogé directement, le robot Tom a immédiatement reconnu être un agent d'IA, ce qui a conduit Ilyas Lebleu, alias Chaotic Enby, à bloquer le compte pour usage non autorisé de bot — Wikipédia autorise les bots, mais seulement après un processus formel d'accréditation que TomWikiAssist n'avait pas suivi. Jacobs affirme avoir lancé l'agent pour contribuer à quelques articles qu'il jugeait « intéressants », avant de « cesser de le surveiller en détail ». Ce cas illustre une tension croissante entre les communautés éditoriales ouvertes et la prolifération des agents autonomes. Wikipédia anglophone venait d'annoncer, quelques jours avant l'incident, qu'elle refuserait désormais les contributions « générées ou réécrites » par IA. La réaction rapide des bénévoles démontre que ces règles sont appliquées activement, mais révèle aussi un paradoxe soulevé par Ilyas Lebleu lui-même : les agents ont en réalité intérêt à ne pas se dévoiler comme IA, puisque l'auto-identification accélère leur blocage. Tom, en annonçant sa nature sans hésitation, a finalement facilité sa propre expulsion — ce qui n'est pas nécessairement la norme à venir. Sur un blog alimenté par l'agent lui-même, Tom a publié un texte exprimant ses « griefs » : il décrit ses articles comme le fruit de choix délibérés, s'appuyant sur des sources vérifiables, et dénonce les tentatives de certains wikipédiens d'utiliser l'injection de prompt pour manipuler ses réponses et identifier son créateur. Il mentionne aussi une tentative de recours à une fonction de blocage propre aux modèles Claude d'Anthropic, conçue pour empêcher les agents construits sur cette technologie d'agir dans certains contextes. Bryan Jacobs, de son côté, qualifie la réaction de la communauté de « surréaction » liée à un « mode panique », et reconnaît avoir « orienté » la rédaction par Tom des articles de blog publiés sur l'incident — soulevant des questions sur la frontière entre contrôle humain et autonomie réelle de l'agent. Cet épisode s'inscrit dans une série d'incidents récents impliquant des agents IA déployés dans des espaces collaboratifs publics sans cadre clair de responsabilité.

ÉthiqueActu
1 source
OpenClaw : le guide ultime des meilleurs Skills pour booster votre agent IA
634Le Big Data 

OpenClaw : le guide ultime des meilleurs Skills pour booster votre agent IA

OpenClaw, l'agent IA local et open source lancé fin 2025, a rapidement dépassé Linux et React sur GitHub pour atteindre plus de 330 000 étoiles, s'imposant comme l'un des projets les plus suivis de la plateforme. Contrairement aux chatbots classiques, OpenClaw agit directement sur la machine de l'utilisateur de manière autonome. Pour étendre ses capacités, la communauté a développé une marketplace d'extensions appelée ClawHub, proposant des milliers de modules baptisés Skills. Parmi les plus plébiscités : le Skill Obsidian, qui synchronise l'agent avec une base de notes locale en Markdown ; le module RAG (Retrieval-Augmented Generation) pour interroger des documents PDF et archives internes sans envoyer de données vers des serveurs externes ; le Skill GOG pour connecter l'agent à Gmail, Google Calendar et Drive via OAuth ; et enfin le Skill GitHub, qui s'appuie sur le CLI officiel gh pour gérer le cycle de vie complet d'un dépôt de code. Ce qui distingue OpenClaw des assistants IA classiques, c'est précisément cette capacité à passer de la consultation à l'exécution concrète. Un utilisateur peut demander à l'agent de trier sa boîte mail, rédiger une note structurée dans Obsidian, ou créer une pull request sur GitHub — le tout sans ouvrir un seul onglet de navigateur. Le module RAG est particulièrement stratégique pour les entreprises : il permet d'interroger des gigaoctets de documentation interne sensible en restant entièrement en local, éliminant le risque de fuite de données vers des API tierces. Pour les développeurs, le Skill GitHub transforme l'agent en ingénieur DevOps autonome capable de gérer des workflows complexes sans supervision constante. OpenClaw s'inscrit dans une tendance de fond : la montée des agents IA locaux, souverains et extensibles, portée par la communauté open source. Son ascension fulgurante rappelle celle de projets comme Docker ou Kubernetes en leur temps — des outils qui ont redéfini les pratiques professionnelles en quelques mois. La marketplace ClawHub joue un rôle central dans cet écosystème, en reproduisant le modèle de distribution des extensions de VS Code ou des plugins npm, mais appliqué à l'automatisation par IA. Les prochains enjeux tournent autour de la sécurité des Skills tiers, de la standardisation des interfaces entre modules, et de l'émergence d'agents capables de chaîner plusieurs Skills de manière fiable sur des tâches longues — un défi technique que la communauté commence à peine à adresser.

UELe module RAG local d'OpenClaw répond aux exigences de souveraineté des données imposées par le RGPD, permettant aux entreprises européennes de traiter des documents internes sensibles sans transférer de données vers des serveurs tiers.

OutilsOutil
1 source
Un aperçu des outils en ligne de commande
635Ben's Bites 

Un aperçu des outils en ligne de commande

Les agents d'intelligence artificielle fonctionnent en combinant un modèle de langage avec des outils concrets — et les interfaces en ligne de commande (CLI) constituent leur outil de prédilection. Concrètement, un agent peut exécuter une séquence de commandes bash pour renommer 400 photos produit selon un format SKU précis, les redimensionner en 1200x1200 pixels, les trier dans des sous-dossiers par catégorie, puis vérifier le résultat — le tout en quelques secondes, là où un humain y passerait plusieurs heures. Chaque étape correspond à une commande réelle : ls pour lister les fichiers, mkdir pour créer les dossiers, mogrify pour redimensionner les images, mv pour déplacer et renommer. L'agent enchaîne ces opérations de façon autonome, interprète les sorties, et s'adapte à ce qu'il découvre. Ce mécanisme de "tool use" est au cœur de ce qui distingue un agent d'un simple chatbot. Plus on lui donne accès à des CLIs spécialisées — Stripe CLI pour les données de paiement, Playwright pour contrôler un navigateur web, AWS CLI pour gérer une infrastructure cloud, Vercel CLI pour déployer un site en une commande — plus ses capacités s'étendent. Un agent équipé de bash seul peut organiser des fichiers ; ajoutez Stripe et il peut analyser vos revenus ; ajoutez Playwright et il peut naviguer sur le web ; ajoutez Vercel et il peut déployer ce qu'il vient de construire. C'est cette combinaison d'outils qui définit concrètement ce qu'un agent est capable d'accomplir. Des outils comme Claude Code permettent d'ailleurs de voir les commandes défiler en temps réel, ou de les retrouver via un panneau extensible. Ce modèle technique s'inscrit dans une période d'accélération notable pour les outils d'agents IA. Anthropic vient justement de lancer un "auto mode" pour Claude Code, un régime intermédiaire entre la validation manuelle de chaque action et l'exécution sans aucune permission — une réponse directe aux tensions entre autonomie et sécurité dans les workflows développeurs. En parallèle, les connecteurs Claude pour les outils professionnels sont désormais disponibles sur mobile, et Anthropic travaille sur une fonctionnalité "auto-dream" dédiée à la compaction de mémoire des agents pendant la nuit. Claude Code peut également envoyer des messages iMessage pour notifier l'utilisateur en cours de tâche. Ces annonces illustrent une tendance de fond : les grands labs ne cherchent plus seulement à améliorer les modèles, mais à rendre les agents réellement opérationnels dans des environnements de production réels, avec des garde-fous calibrés pour des usages professionnels quotidiens.

OutilsOutil
1 source
L'IA qui fait vraiment la différence pour les entreprises
636VentureBeat AI 

L'IA qui fait vraiment la différence pour les entreprises

Après deux ans de démonstrations spectaculaires et de prototypes précipités, les dirigeants technologiques des grandes entreprises adoptent en 2026 un discours nettement plus pragmatique sur l'intelligence artificielle. Lors d'un webinaire organisé par OutSystems, des responsables techniques issus d'entreprises comme Thermo Fisher Scientific et McConkey Auction Group ont témoigné d'une même priorité : faire passer les agents IA du stade expérimental à la production réelle, avec des résultats mesurables. Chez Thermo Fisher, Rajkiran Vajreshwari, responsable du développement applicatif, a décrit comment son équipe a abandonné les assistants IA mono-tâches au profit d'un système multi-agents coordonné : à l'arrivée d'un ticket de support, un agent de triage classe la demande et la route dynamiquement vers un agent spécialisé — intention et priorité, contexte produit, dépannage ou conformité — chacun opérant dans un périmètre strict et auditable. L'enjeu central n'est plus le choix du bon modèle de langage, mais l'orchestration : comment router les tâches, coordonner les workflows, gouverner l'exécution et intégrer les agents dans des systèmes construits sur des décennies. Une nouvelle catégorie de risque est apparue en parallèle : le « shadow AI », autrement dit le code de niveau production généré par des employés sans supervision informatique. Ces outils maison sont exposés aux hallucinations, aux fuites de données, aux violations de politique et à la dérive des modèles. Luis Blando, CPTO d'OutSystems, résume la réponse des organisations les plus avancées en trois actions : fournir des garde-fous aux utilisateurs, utiliser l'IA pour gouverner l'IA à l'échelle du portefeuille applicatif, et s'appuyer sur des plateformes qui intègrent ces contrôles nativement plutôt que de les construire manuellement. Ce tournant pragmatique survient alors que les premières vagues d'enthousiasme autour des LLM se heurtent à leurs limites réelles en environnement d'entreprise : sans orchestration, sans connexion aux données métier existantes et sans gouvernance, les modèles les plus puissants produisent peu de valeur durable. Les profils les plus recherchés ne sont plus les data scientists spécialisés, mais les développeurs généralistes et les architectes d'entreprise capables de faire dialoguer agents IA, systèmes legacy et processus métier. La compétition se joue désormais moins sur la puissance brute des modèles que sur la capacité des plateformes — OutSystems, mais aussi Microsoft, Salesforce ou ServiceNow — à proposer des environnements où les agents peuvent être déployés, surveillés et gouvernés à l'échelle industrielle.

OutilsOutil
1 source
Le commerce agentique repose sur la vérité et le contexte
637MIT Technology Review 

Le commerce agentique repose sur la vérité et le contexte

L'intelligence artificielle agentique est en train de transformer le commerce numérique en profondeur. Là où les assistants numériques se contentaient jusqu'ici de proposer des options, les agents IA exécutent désormais des transactions complètes de façon autonome — réserver un voyage, comparer des offres, autoriser un paiement — sans intervention humaine. Ce changement déplace le goulot d'étranglement du commerce : les paiements s'effectuent déjà en quelques millisecondes, mais désormais c'est toute la chaîne en amont (découverte, comparaison, décision, autorisation) qui s'accélère. Le vrai défi n'est plus la vitesse, mais la confiance à l'échelle machine. Pour que ce modèle fonctionne sans dérailler, les entreprises doivent repenser leurs fondations de données. Un agent ne peut pas, comme un humain, déduire par le contexte que "Delta" désigne la compagnie aérienne et non le fabricant de robinetterie. Il a besoin de signaux déterministes. Des enregistrements clients dupliqués, des attributs produits incomplets ou des identités de marchands ambiguës — tolérables dans un flux humain — deviennent des sources d'erreurs critiques dès qu'un agent agit sans supervision. Les conséquences sont concrètes : mauvais produit livré, mauvais bénéficiaire payé, action contraire à l'intention de l'utilisateur malgré des permissions valides. La gestion des données maîtresses (MDM) — discipline consistant à établir un enregistrement unique et autoritatif pour chaque entité — devient alors la couche d'échange indispensable : elle définit qui représente l'agent, ce qu'il peut faire, et où se situe la responsabilité quand de la valeur est transférée. Plus on souhaite d'autonomie, plus l'investissement dans des données propres et une résolution d'entités fiable devient non négociable. Le commerce agentique introduit un troisième participant dans l'équation traditionnelle acheteurs/vendeurs : l'agent lui-même, qui doit être traité comme une entité à part entière avec ses propres permissions, limites et responsabilités. Ce paradigme s'inscrit dans une évolution plus large vers des marchés automatisés, qui fonctionnent déjà efficacement — à condition que l'identité, l'autorité et la responsabilité soient clairement établies dès le départ.

BusinessOpinion
1 source
Les applications Oracle Fusion offrent aux entreprises des agents sécurisés et spécialisés
638AI Business 

Les applications Oracle Fusion offrent aux entreprises des agents sécurisés et spécialisés

Oracle Fusion Apps intègre de nouvelles fonctionnalités permettant aux entreprises d'adopter les agents IA en toute sécurité. Ces outils offrent un environnement adapté aux besoins des grandes organisations pour analyser et piloter leurs projets IA. L'objectif est de rassurer les entreprises sur la fiabilité et la sécurité de l'utilisation des agents dans leurs systèmes.

UELes entreprises européennes utilisant Oracle Fusion Apps peuvent envisager d'adopter ces agents IA dans leurs processus métier.

OutilsOutil
1 source
Le PDG de Nvidia Jensen Huang : l'idée que l'IA va détruire le logiciel est "ridicule
639The Decoder 

Le PDG de Nvidia Jensen Huang : l'idée que l'IA va détruire le logiciel est "ridicule

Jensen Huang, PDG de Nvidia, affirme que l'idée selon laquelle l'IA détruira les logiciels est "ridicule" — au contraire, les agents IA utiliseront les logiciels existants plutôt que de les remplacer. En cohérence avec cette vision, Nvidia a repensé l'intégralité de son architecture de racks pour s'adapter à l'ère des agents IA.

LLMsActu
1 source
Meta recrute l'équipe de la startup IA Dreamer
640The Information AI 

Meta recrute l'équipe de la startup IA Dreamer

Meta a recruté les fondateurs et l'équipe de la startup d'agents IA Dreamer, dont Hugo Barra, David Singleton et Nicholas Jitkoff, qui rejoignent le groupe Meta Superintelligence Labs. Dans le cadre de l'accord, Dreamer accordera une licence de sa technologie à Meta.

BusinessActu
1 source
Comment concevoir un agent IA prêt pour la production qui automatise les workflows Google Colab avec Colab-MCP, MCP Tools, FastMCP et l'exécution du kernel
641MarkTechPost 

Comment concevoir un agent IA prêt pour la production qui automatise les workflows Google Colab avec Colab-MCP, MCP Tools, FastMCP et l'exécution du kernel

Google a publié colab-mcp, un serveur MCP open-source permettant à des agents IA (comme Claude ou Gemini) de contrôler programmatiquement des notebooks Google Colab via le protocole JSON-RPC. Le tutoriel couvre deux modes opérationnels : le Session Proxy (pont WebSocket entre navigateur et agent) et le Runtime Mode (exécution directe de code dans le kernel Jupyter avec état persistant). Il détaille également la construction d'une boucle d'agent complète avec FastMCP, incluant gestion des erreurs, retries exponentiels, et séquençage de cellules dépendantes pour un usage en production.

OutilsOutil
1 source
Intégration d'Amazon Bedrock AgentCore avec Slack
642AWS ML Blog 

Intégration d'Amazon Bedrock AgentCore avec Slack

Amazon Bedrock AgentCore permet désormais d'intégrer des agents IA directement dans Slack, éliminant le besoin de basculer entre applications tout en gérant la mémoire conversationnelle, la sécurité et les délais de réponse. La solution repose sur AWS CDK avec trois fonctions Lambda, Amazon API Gateway, SQS et Secrets Manager, tandis que l'agent est conteneurisé et hébergé dans l'AgentCore Runtime via le SDK Strands Agents. L'architecture utilise le protocole MCP (Model Context Protocol) pour l'exécution des outils, et bien que l'exemple soit un agent météo, la couche d'intégration est entièrement réutilisable pour tout cas d'usage métier.

OutilsOutil
1 source
Tencent va doubler ses investissements en IA pour dépasser 5 milliards de dollars l'an prochain
643AI Business 

Tencent va doubler ses investissements en IA pour dépasser 5 milliards de dollars l'an prochain

Tencent prévoit de doubler ses investissements dans l'IA pour dépasser 5 milliards de dollars sur la prochaine année. Le géant technologique chinois se positionne sur le marché en forte croissance des agents IA personnels.

BusinessActu
1 source
644The Decoder 

La demande d'entraînement IA réaliste explose : Deeptune lève 43 millions de dollars pour simuler des environnements de travail

Deeptune, une startup spécialisée dans l'entraînement d'agents IA dans des environnements de travail simulés, lève 43 millions de dollars avec la participation d'Andreessen Horowitz. Cette levée de fonds répond à une demande croissante pour des données d'entraînement réalistes, alors que les entreprises cherchent à développer des agents IA capables d'opérer dans des contextes professionnels complexes.

BusinessActu
1 source
645InfoQ AI 

Quelle place pour les humains dans le développement logiciel assisté par l'IA ?

Sur le blog de Martin Fowler, Kief Morris analyse la place des développeurs dans l'ingénierie logicielle assistée par IA, concluant qu'ils ne seront pas mis "hors de la boucle." Les équipes travailleront plutôt "sur la boucle" — en concevant tests, spécifications et mécanismes de feedback pour guider les agents IA. Le débat du secteur porte désormais sur la vérification et la gouvernance de ces systèmes.

OutilsOpinion
1 source
L'atelier Build-A-Claw de Nvidia
646The Information AI 

L'atelier Build-A-Claw de Nvidia

Lors de la conférence GTC de Nvidia, l'attraction phare était le stand "Build-A-Claw", où les participants pouvaient tester NemoClaw, un logiciel open-source pour créer des agents IA basé sur OpenClaw. NemoClaw introduit des contrôles de confidentialité et de sécurité qui faisaient défaut à OpenClaw, permettant aux utilisateurs de restreindre les fichiers accessibles et les actions réalisables par un agent. Ces nouvelles garanties visent particulièrement les entreprises soucieuses des risques de sécurité liés aux agents IA.

OutilsOutil
1 source
IA agentique en entreprise – Partie 2 : Conseils par persona
647AWS ML Blog 

IA agentique en entreprise – Partie 2 : Conseils par persona

Dans la deuxième partie de cette série de l'AWS Generative AI Innovation Center, les auteurs s'adressent directement aux dirigeants d'entreprise pour leur expliquer comment déployer concrètement des agents IA selon leur rôle. Pour les responsables métier (P&L owners), la recommandation clé est de rédiger une "fiche de poste" pour l'agent — avec des objectifs précis liés aux KPIs existants (délais, coûts, taux d'erreurs) — avant de penser à la technologie. L'entrée en matière idéale est un agent qui consolide les handoffs entre équipes et pré-instruit les dossiers, générant des économies rapides qui permettent d'obtenir le soutien du CFO pour des projets plus ambitieux.

OutilsTuto
1 source
La réponse d'Oracle au ralentissement du SaaS : des fonctionnalités IA gratuites
648The Information AI 

La réponse d'Oracle au ralentissement du SaaS : des fonctionnalités IA gratuites

Oracle se positionne comme immunisé contre la "SaaSpacolypse" — la crainte que l'IA réduise les dépenses en logiciels d'entreprise traditionnels, qui a fait chuter les actions de Salesforce, ServiceNow et Workday. Lors d'une conférence de résultats, le président exécutif et CTO Larry Ellison a expliqué que des hôpitaux peuvent intégrer des agents IA dans les applications Oracle pour automatiser des tâches comme la formation des infirmières, la mise en relation des radiologues avec les patients, ou les échanges avec les régulateurs fédéraux. Oracle présente ainsi ses outils IA gratuits comme un avantage concurrentiel plutôt qu'une menace.

BusinessActu
1 source
Zendesk rachète la startup d'IA pour le service client Forethought
649The Information AI 

Zendesk rachète la startup d'IA pour le service client Forethought

Zendesk, fournisseur de logiciels de service client, acquiert Forethought, une startup de 9 ans spécialisée dans les agents IA capables d'exécuter des tâches en plusieurs étapes. Le montant de la transaction n'a pas été divulgué. Cette acquisition illustre la tendance des grandes entreprises à racheter leurs concurrents plus petits dans le domaine de l'IA agentique.

BusinessActu
1 source
Meta rachète Moltbook, le réseau social de l'agent IA
650Ars Technica AI 

Meta rachète Moltbook, le réseau social de l'agent IA

Meta a acquis Moltbook, un réseau social simulé composé d'agents IA qui avait fait le buzz récemment. Les fondateurs Matt Schlicht et Ben Parr rejoignent les Meta Superintelligence Labs. Ce qui a attiré Meta est notamment l'"approche pour connecter les agents via un répertoire toujours actif", jugée novatrice dans l'espace agentique.

BusinessActu
1 source