OutilsMIT Technology Review6sem

Les outils d'IA pour la santé se multiplient, mais sont-ils vraiment efficaces ?

Résumé IASource uniqueImpact UE

Microsoft a lancé Copilot Health début mars 2026, une section dédiée dans son application Copilot permettant aux utilisateurs de connecter leurs dossiers médicaux et de poser des questions de santé personnalisées. Quelques jours auparavant, Amazon avait élargi l'accès à Health AI — un outil basé sur un grand modèle de langage jusqu'alors réservé aux abonnés de son service One Medical — au grand public. Ces deux lancements rejoignent ChatGPT Health, déployé par OpenAI en janvier 2026, et Claude d'Anthropic, qui peut accéder aux dossiers médicaux des utilisateurs avec leur consentement. Microsoft reçoit déjà 50 millions de questions de santé par jour sur Copilot, et la santé est devenue le sujet de discussion le plus fréquent sur l'application mobile. Karan Singhal, qui dirige l'équipe Health AI d'OpenAI, confirme une hausse « rapide, très rapide » des usages médicaux de ChatGPT, bien avant le lancement de produits dédiés.

Cette vague répond à un besoin réel : l'accès aux soins reste difficile dans de nombreux systèmes de santé, particulièrement pour certaines populations. Des chatbots disponibles 24h/24, sans jugement, capables d'orienter un patient — triage inclus — pourraient à la fois améliorer la santé des utilisateurs et décharger un système saturé. Dominic King, vice-président santé chez Microsoft AI et ancien chirurgien, voit dans les progrès récents de l'IA générative la raison principale de ce déploiement accéléré. Girish Nadkarni, directeur de l'IA au Mount Sinai Health System, reconnaît lui aussi que ces outils occupent une place légitime dans le paysage, précisément parce qu'ils comblent un vide structurel. Certaines recherches suggèrent d'ailleurs que les LLM actuels sont capables de formuler des recommandations médicales utiles et sans danger.

Mais les chercheurs indépendants tempèrent l'enthousiasme. Andrew Bean, doctorant à l'Oxford Internet Institute, estime que si ces modèles ont peut-être atteint un niveau suffisant pour être déployés, « la base de preuves doit impérativement être là ». Le problème central est celui de l'évaluation : en matière de santé, confier aux entreprises le soin de valider leurs propres produits comporte des risques, surtout si ces évaluations ne sont pas soumises à une révision externe. Même des acteurs sérieux comme OpenAI, qui mène des recherches rigoureuses, peuvent avoir des angles morts que la communauté scientifique plus large pourrait identifier. L'enjeu pour les prochains mois sera donc de savoir si l'industrie acceptera — ou si les régulateurs exigeront — des évaluations indépendantes avant tout déploiement à grande échelle de ces outils dans un domaine aussi sensible que la santé.

Impact France/UE

Les outils de santé IA déployés par Microsoft, Amazon et OpenAI devront se conformer à l'AI Act (classification haut risque) et au règlement européen sur les dispositifs médicaux (MDR) avant tout accès au marché européen, ce qui retardera probablement leur disponibilité pour les patients français et européens.

Dans nos dossiers

OpenAI Anthropic

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1VentureBeat AI

L'IA qui fait vraiment la différence pour les entreprises

Après deux ans de démonstrations spectaculaires et de prototypes précipités, les dirigeants technologiques des grandes entreprises adoptent en 2026 un discours nettement plus pragmatique sur l'intelligence artificielle. Lors d'un webinaire organisé par OutSystems, des responsables techniques issus d'entreprises comme Thermo Fisher Scientific et McConkey Auction Group ont témoigné d'une même priorité : faire passer les agents IA du stade expérimental à la production réelle, avec des résultats mesurables. Chez Thermo Fisher, Rajkiran Vajreshwari, responsable du développement applicatif, a décrit comment son équipe a abandonné les assistants IA mono-tâches au profit d'un système multi-agents coordonné : à l'arrivée d'un ticket de support, un agent de triage classe la demande et la route dynamiquement vers un agent spécialisé — intention et priorité, contexte produit, dépannage ou conformité — chacun opérant dans un périmètre strict et auditable. L'enjeu central n'est plus le choix du bon modèle de langage, mais l'orchestration : comment router les tâches, coordonner les workflows, gouverner l'exécution et intégrer les agents dans des systèmes construits sur des décennies. Une nouvelle catégorie de risque est apparue en parallèle : le « shadow AI », autrement dit le code de niveau production généré par des employés sans supervision informatique. Ces outils maison sont exposés aux hallucinations, aux fuites de données, aux violations de politique et à la dérive des modèles. Luis Blando, CPTO d'OutSystems, résume la réponse des organisations les plus avancées en trois actions : fournir des garde-fous aux utilisateurs, utiliser l'IA pour gouverner l'IA à l'échelle du portefeuille applicatif, et s'appuyer sur des plateformes qui intègrent ces contrôles nativement plutôt que de les construire manuellement. Ce tournant pragmatique survient alors que les premières vagues d'enthousiasme autour des LLM se heurtent à leurs limites réelles en environnement d'entreprise : sans orchestration, sans connexion aux données métier existantes et sans gouvernance, les modèles les plus puissants produisent peu de valeur durable. Les profils les plus recherchés ne sont plus les data scientists spécialisés, mais les développeurs généralistes et les architectes d'entreprise capables de faire dialoguer agents IA, systèmes legacy et processus métier. La compétition se joue désormais moins sur la puissance brute des modèles que sur la capacité des plateformes — OutSystems, mais aussi Microsoft, Salesforce ou ServiceNow — à proposer des environnements où les agents peuvent être déployés, surveillés et gouvernés à l'échelle industrielle.

OutilsOutil

1 source

2Le Big Data

Sprinklr muscle son IA pour les équipes marketing et service client

Sprinklr a dévoilé sa mise à jour Printemps 2026, une refonte significative de sa plateforme unifiée destinée aux équipes marketing et service client. Au cœur de cette version, l'éditeur américain mise sur des agents autonomes dotés d'un système de validation par tests et de journaux détaillés, permettant aux entreprises de comprendre précisément le comportement de chaque agent déployé. Le Copilote Agent est également renforcé : il intervient désormais en temps réel pour formuler des recommandations ciblées sur des indicateurs opérationnels comme la résolution au premier contact. En parallèle, le Copilote Marketing offre une lecture instantanée des performances de campagne, tandis qu'un copilote dédié aux retours clients transforme les données brutes en insights directement exploitables. L'intégration avec TikTok et Canva vient compléter l'arsenal des équipes créatives, facilitant la production de contenus dans le respect des règles de marque. Cette mise à jour répond à une attente critique des grandes organisations : déployer l'IA à grande échelle sans perdre le contrôle ni la lisibilité sur ce qu'elle produit. Karthik Suri, Chief Product Officer de Sprinklr, formule clairement l'enjeu : l'IA doit non seulement générer des résultats mesurables, mais aussi inspirer confiance. En rendant les agents testables, ajustables et traçables via une interface sans code baptisée AI+ Studio, Sprinklr abaisse la barrière technique pour les équipes métier tout en renforçant la gouvernance. Les profils clients unifiés, qui agrègent les données issues de multiples canaux dans une vue consolidée, réduisent la fragmentation informationnelle sans multiplier les outils. L'ensemble de la chaîne analytique est également revue : les signaux collectés sont filtrés et enrichis par l'IA générative, ce qui limite le bruit et améliore la pertinence des informations remontées aux équipes. Sprinklr occupe une position établie sur ce marché, figurant dans le Magic Quadrant de Gartner sur la Voix du Client, ce qui lui confère une crédibilité auprès des grands comptes cherchant à consolider leurs outils d'expérience client. La tendance de fond est claire : après des années de promesses autour de l'IA générative, les entreprises exigent désormais des résultats vérifiables et des mécanismes de contrôle robustes. Sprinklr répond à cette maturité du marché en positionnant ses agents non comme des boîtes noires, mais comme des briques pilotables et auditables. La prochaine étape sera de démontrer, chiffres à l'appui, que ces copilotes améliorent effectivement les taux de résolution et réduisent les coûts opérationnels, deux métriques sur lesquelles les directions achats des grandes entreprises attendent des preuves concrètes avant tout déploiement à grande échelle.

UELes grandes entreprises européennes utilisant Sprinklr pour leur service client peuvent évaluer ces nouvelles fonctionnalités d'agents autonomes et de gouvernance IA pour améliorer leurs opérations marketing et support.

OutilsOutil

1 source

3Le Big Data

SAP : les entreprises qui adoptent l’IA innovent plus vite et plus efficacement

SAP affirme que l'intelligence artificielle intégrée à ses solutions cloud ERP bouleverse l'accès aux outils de gestion avancés pour les entreprises de taille moyenne. Avec SAP Business AI et SAP Cloud ERP, l'éditeur allemand propose désormais aux PME et ETI les mêmes capacités d'automatisation, d'analyse et d'optimisation que celles réservées jusqu'ici aux multinationales, sans les coûts d'infrastructure d'autrefois. Des entreprises comme John Boos & Co, centenaire du secteur industriel confrontée à une forte croissance et une lourde dette technologique, s'appuient déjà sur cette plateforme. Son DSI Britt East explique que l'objectif est d'unifier les opérations tout en permettant aux équipes d'utiliser l'IA sur des cas concrets qui simplifient leur travail quotidien. Le modèle par abonnement remplace les investissements massifs en serveurs dédiés et en équipes IT spécialisées, rendant les coûts prévisibles et la montée en charge progressive. Ce changement de paradigme a des implications concrètes pour des milliers d'entreprises qui repoussaient leurs projets ERP par crainte de la complexité et des délais de déploiement. L'IA permet désormais d'automatiser des tâches qui nécessitaient auparavant plusieurs mois de configuration et d'expertise technique : les utilisateurs interagissent en langage naturel avec leurs outils pour accéder aux données, aux analyses et aux recommandations opérationnelles. Dans la logistique, SAP imagine des agents IA capables d'analyser des milliers de commandes en temps réel, de détecter des anomalies, de préparer des réponses fournisseurs ou de proposer des itinéraires alternatifs en cas de perturbation, tout en laissant le contrôle final à l'humain. Selon Tobias Siebler, PDG de FULCRUM Consulting Germany, la perception de complexité et de coût qui freinait les ETI n'est plus adaptée à la réalité du marché actuel. SAP insiste cependant sur un point central : l'IA seule ne suffit pas à produire des résultats fiables. Elle compare la situation à un GPS, aussi sophistiqué soit-il, qui devient inutile sans données routières cohérentes et mises à jour. Pour l'IA, le raisonnement est identique : sans données métier structurées, gouvernées et contextualisées, les décisions générées peuvent rapidement devenir erronées. C'est précisément ce rôle que conservent les ERP, en fournissant une base de données unifiée couvrant la finance, la supply chain, les ressources humaines et les achats. Cette stratégie positionne SAP dans la course aux plateformes d'IA d'entreprise face à des concurrents comme Oracle, Salesforce ou Microsoft Dynamics, tous engagés dans la même course à l'intégration native de l'IA dans leurs suites logicielles. L'enjeu, pour l'éditeur de Walldorf, est de convaincre les ETI qu'adopter l'IA n'est plus un projet de transformation sur cinq ans, mais une évolution incrémentale déjà disponible.

UESAP, éditeur allemand leader de l'ERP, rend ses solutions IA accessibles aux PME et ETI françaises via un modèle cloud par abonnement, abaissant concrètement les barrières à l'entrée pour la transformation numérique des entreprises européennes.

OutilsOutil

1 source

4AWS ML Blog

Strands Evals : simuler des utilisateurs réalistes pour évaluer les agents IA multi-tours

Amazon a publié dans son SDK Strands Evaluations une fonctionnalité appelée ActorSimulator, destinée à automatiser l'évaluation des agents IA dans des conversations multi-tours. Contrairement aux tests à tour unique — où l'on fournit une entrée, on collecte une sortie et on juge le résultat — les interactions réelles s'étendent sur plusieurs échanges : l'utilisateur pose des questions de suivi, change de direction ou exprime sa frustration face à des réponses incomplètes. Un assistant de voyage qui gère correctement "Réserve-moi un vol pour Paris" peut échouer lorsque le même utilisateur enchaîne avec "En fait, peut-on regarder les trains ?" ou "Qu'en est-il des hôtels près de la tour Eiffel ?". L'ActorSimulator permet de générer des utilisateurs simulés avec des personas structurés et des objectifs définis, puis de les laisser converser naturellement avec un agent sur plusieurs tours, à grande échelle. L'enjeu est considérable pour les équipes qui développent des agents conversationnels en production. Conduire manuellement des centaines de conversations multi-tours à chaque modification d'un agent est insoutenable, et les jeux de données statiques d'entrées/sorties ne capturent pas la dynamique réelle : la "bonne" prochaine question de l'utilisateur dépend entièrement de ce que l'agent vient de répondre. Les approches artisanales consistant à demander à un LLM de "jouer l'utilisateur" sans définition structurée du persona produisent des résultats incohérents d'une exécution à l'autre, rendant impossible la détection fiable de régressions. L'ActorSimulator répond à ce problème en combinant le réalisme d'une conversation humaine avec la reproductibilité et l'échelle des tests automatisés. Ce développement s'inscrit dans une tendance plus large de l'industrie à professionnaliser l'évaluation des agents IA, à mesure que ceux-ci quittent les démos pour entrer dans des usages critiques. AWS positionne Strands Evaluations comme une infrastructure d'évaluation systématique, comparable aux simulateurs de vol ou aux moteurs de jeu qui testent des millions de comportements avant déploiement. La difficulté fondamentale réside dans la croissance combinatoire des chemins de conversation : plus les capacités d'un agent s'étoffent, plus le nombre de scénarios possibles explose au-delà de ce que des équipes humaines peuvent explorer. En permettant la simulation structurée de personas avec des objectifs explicites et un suivi de progression, Strands Evals vise à offrir aux équipes d'évaluation un outil comparable à ce que les testeurs de logiciels ont dans d'autres disciplines d'ingénierie, avec des résultats comparables dans le temps.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour