Dossier Agents IA — page 7

1550 articles · page 7 sur 31

Les agents IA : déploiements en production, écart pilote/prod, débat sur la confiance, agent debt et négociations automatisées.

301AWS ML Blog OutilsTuto

Infrastructure partagée, locataires isolés : la mutualisation multi-tenant avec Amazon Bedrock AgentCore

Amazon Web Services vient de publier un guide architectural détaillé pour la construction d'applications d'intelligence artificielle multi-locataires à l'aide d'Amazon Bedrock AgentCore. Le document, second volet d'une série consacrée à ce sujet, s'appuie sur un cas concret dans le domaine médical : une plateforme d'agents IA servant simultanément plusieurs cliniques et hôpitaux. L'architecture proposée repose sur un modèle dit "pool", où tous les clients partagent la même infrastructure sous-jacente, mais sont isolés les uns des autres par des mécanismes logiques : identifiants scopés, politiques d'accès et partitionnement des données. La hiérarchie est structurée en trois niveaux, Niveau de service, Locataire, Utilisateur, et l'isolation est appliquée à chaque couche, depuis les documents stockés en base de connaissances jusqu'au suivi des coûts. Ce schéma répond à un défi concret pour les éditeurs de logiciels en mode SaaS : comment servir des clients aux besoins très différents sans multiplier les infrastructures dédiées ni exposer des données d'un client à un autre ? La solution présentée définit deux niveaux de service distincts. L'offre basique, destinée aux petites cliniques, utilise le modèle Mistral Ministral 3 8B Instruct pour des tâches de recherche documentaire simples, avec un coût réduit. L'offre premium, réservée aux hôpitaux et centres spécialisés, s'appuie sur OpenAI GPT OSS 120B, un modèle de 120 milliards de paramètres aux capacités de raisonnement avancées, et donne accès à des outils supplémentaires comme la recherche web. Cette différenciation par niveaux permet à un même fournisseur de servir des clients aux exigences très différentes tout en maintenant une efficacité opérationnelle. Le contexte est celui d'une adoption croissante des agents IA dans les entreprises, qui soulève des questions de gouvernance, d'attribution des coûts et de qualité de service que les architectures classiques ne résolvent pas facilement. Amazon positionne Bedrock AgentCore comme une brique native pour absorber cette complexité sans code personnalisé excessif. La publication du dépôt GitHub associé aux exemples illustre une volonté de standardisation des pratiques : l'objectif est que les équipes techniques puissent répliquer ces patterns dans des secteurs variés, plateformes SaaS, solutions d'entreprise multi-entités, services managés. Les enjeux sont significatifs, car une mauvaise isolation entre locataires dans un contexte médical exposerait des données sensibles de patients, avec des conséquences réglementaires sévères. Ce cadre architectural cherche précisément à rendre ce risque gérable par conception plutôt que par surveillance manuelle.

UELes éditeurs européens de SaaS dans le secteur médical peuvent s'appuyer sur ces patterns d'isolation multi-tenant pour faciliter la conformité au RGPD, même si la solution repose intégralement sur l'infrastructure américaine d'AWS.

Dossier Agents IA — page 7

Infrastructure partagée, locataires isolés : la mutualisation multi-tenant avec Amazon Bedrock AgentCore

Pourquoi Canva ne considere pas ChatGPT et Claude comme une menace

L'IA atteint le mur de la mémoire : il lui faut un nouveau niveau de contexte

SAP et Google Cloud déploient une architecture commerciale à base d'agents autonomes

Un nouveau framework d'optimisation IA surpasse Claude Code et Codex de 2,5 fois à budget de calcul égal

Amazon Bedrock AgentCore est disponible en production : passez d'une idée à un agent opérationnel en quelques minutes

AWS rejoint la course à la couche contextuelle avec un graphe enrichi par les agents, sans curation manuelle

GitHub Copilot lance une application desktop pour les flux de travail multi-agents en parallèle

OpenAI étend l'évaluation des risques pré-déploiement au codage à base d'agents via des appels d'outils simulés

Qwen-RobotNav : un modèle de navigation extensible conçu pour un système de navigation à base d'agents

Anthropic suspend la facturation au token pour son Claude Agent SDK

Salesforce acquiert Fin pour renforcer son offre d’IA d’entreprise

☕️ KPMG retire un rapport chantant les louanges de l’IA après la découverte d’hallucinations

MCP a résolu l'appel d'outils, A2A la coordination. Et le transport ?

SkillOpt de Microsoft améliore GPT-5.5 avec un simple fichier Markdown entraîné

Moonshot AI publie Kimi K2.7-Code : un modèle de code avec +21,8 % sur Kimi Code Bench v2 par rapport à K2.6

Google DeepMind s'interroge sur les risques liés aux interactions entre des millions d'agents autonomes

Claude Fable 5 : vous pouvez maintenant le tester sur Perplexity Computer

Surprise : GPT-5.5 devance Claude Fable 5 sur le benchmark Agents' Last Exam

Fini le réglage manuel des kernels : Neuron Agentic Development accélère les optimisations AWS Trainium

Comment diriger une entreprise hybride alliant humains et IA

L'IA s'apprête à remplacer les interfaces, et les dirigeants d'entreprise ne sont pas prêts

Frontier Radar #3 : comment l'IA à base d'agents fait des tokens un indicateur métier

OpenAI annonce la fin du chat et projette de transformer ChatGPT en application d'agents autonomes

Le nouveau Colab CLI de Google permet aux développeurs et agents IA d'exécuter Python sur des GPU et TPU distants depuis le terminal

IBM et Google Cloud veulent accélérer l’adoption de l’IA dans les entreprises

Perplexity AI lance un orchestrateur d'inférence hybride pour PC : répartition automatique entre local et cloud

NVIDIA lance Nemotron 3 Ultra, un hybride Mamba-Transformer open source à 550 milliards de paramètres pour agents autonomes

Nous Research publie Hermes Desktop : une interface native multiplateforme pour Hermes Agent v0.15.2 avec sortie en streaming

Microsoft Build : MAI-Thinking-1 et la famille de modèles MAI

Microsoft lance le Surface RTX Spark Dev Box pour faire tourner de grands modèles IA sans recourir au cloud

OpenAI met à jour Codex : les agents peuvent créer des espaces de travail interactifs via Sites et plugins par rôle

L’AI Act : le cadre Européen qui redéfinit l’Impact sociologique de l’IA en entreprise

Les utilisateurs de GitHub Copilot réagissent au nouveau système de tarification à l'usage

L'agent navigateur d'Anthropic a été détourné dans 31,5 % des cas avant l'activation des protections

Faut-il dire adieu à la souris ? Windows lance l’IA qui clique et tape à votre place depuis la barre des tâches grâce à Nvidia

Liquid AI lance LFM2.5-8B-A1B : la taille ne fait-elle plus vraiment la performance ?

Liquid AI publie LFM2.5-8B-A1B : un modèle MoE embarqué de 8,3 milliards de paramètres dont 1,5 milliard actifs

DeepSWE : Claude n’est pas aussi doué qu’on ne le pensait en codage, il a triché !

Verizon Connect : comment l'IA à base d'agents est passée de la surcharge de données à 100 000 utilisateurs

Nouvelles licornes à 10 milliards dans l'infra IA : Fireworks, Baseten (et OpenRouter en chemin)

WorkOS publie auth.md : un protocole ouvert d'enregistrement d'agents basé sur OAuth

Le dernier modèle IA d'Alibaba a optimisé de façon autonome le code de sa puce personnalisée pendant 35 heures

The Download : l'avenir du code, les « Jeux olympiques sous stéroïdes » et la science par l'IA

CopilotKit redéfinit l'architecture IA à base d'agents en 2026

MagenticLite, MagenticBrain, Fara1.5 : une expérience à base d'agents optimisée pour les petits modèles

IA et performance : le verdict de l’indice mondial Fivetran

Meilleures plateformes d'IA à agents autonomes pour les entreprises en 2026

Cline publie son SDK open source : un runtime d'agents qui alimente désormais son CLI et son Kanban, avec migration des extensions IDE

L'autorisation des agents est défaillante, et la transmission de l'authentification aggrave le problème