Aller au contenu principal
Plongée dans le code : UI à base d'agents, UI générative, synchronisation d'état et validation par interruption
OutilsMarkTechPost6sem· 2 min de lecture

Plongée dans le code : UI à base d'agents, UI générative, synchronisation d'état et validation par interruption

Source originale ↗·

Un tutoriel récemment publié propose de construire une pile complète d'interfaces utilisateur agentiques (Agentic UI) en Python pur, sans recourir à des frameworks externes. L'implémentation couvre le protocole AG-UI, un flux d'événements composé d'environ 16 types diffusés en temps réel via Server-Sent Events (SSE), parmi lesquels des événements de démarrage et fin de session, de messages texte, d'appels d'outils et de synchronisation d'état. Le tutoriel intègre également A2UI, une couche déclarative permettant de définir des interfaces graphiques sous forme de JSON structuré plutôt que de code exécutable. L'ensemble est connecté à un modèle de langage (GPT-4o-mini d'OpenAI dans les exemples de code) capable de générer des interfaces complètes à partir de descriptions en langage naturel.

L'enjeu central de cette approche réside dans la synchronisation entre l'état de l'agent et celui de l'interface utilisateur, assurée via JSON Patch, une norme RFC permettant des mises à jour incrémentales et précises de structures de données. Le tutoriel aborde aussi les flux d'approbation interrompus, un mécanisme qui impose une validation humaine pour les actions critiques avant qu'un agent ne les exécute, principe connu sous le nom de "human-in-the-loop". Pour les développeurs, cette architecture ouvre la voie à des interfaces capables de s'adapter dynamiquement au raisonnement d'un agent IA, sans rechargement ni recompilation manuelle. C'est une rupture avec les interfaces statiques traditionnelles : l'UI devient un artefact vivant, piloté par l'état cognitif du modèle.

Cet article s'inscrit dans une effervescence croissante autour des systèmes multi-agents et des protocoles qui leur sont associés. AG-UI émerge comme une tentative de standardisation, à l'image du Model Context Protocol (MCP) d'Anthropic pour la gestion du contexte, ou d'Agent2Agent de Google pour la communication inter-agents. L'objectif commun est de fournir une couche d'interopérabilité entre agents et interfaces, indépendamment du modèle sous-jacent. En construisant cet outillage depuis zéro, le tutoriel cherche à démystifier ces protocoles souvent masqués par des abstractions de haut niveau comme LangGraph ou CrewAI. À mesure que les agents IA passent du laboratoire à la production, la question de leur observabilité et de leur contrôlabilité devient critique, et des ressources pédagogiques de ce type jouent un rôle de formation essentiel pour les ingénieurs qui bâtissent ces systèmes.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Des alertes isolées à l'intelligence contextuelle : analyse d'anomalies maritimes par agents autonomes et IA générative
1AWS ML Blog 

Des alertes isolées à l'intelligence contextuelle : analyse d'anomalies maritimes par agents autonomes et IA générative

Windward, spécialiste de l'intelligence maritime par IA, a développé en partenariat avec l'AWS Generative AI Innovation Center un système baptisé MAI Expert, présenté comme le premier agent IA génératif dédié à l'analyse maritime. Ce système automatise l'investigation des anomalies de comportement de navires en croisant des données AIS (Automatic Identification System), des signaux de télédétection, des flux d'actualités en temps réel et des modèles propriétaires. Concrètement, dès qu'une anomalie est détectée par le module Windward Early Detection -- pic d'activité inhabituel, mouvement inattendu, déviation de route -- le pipeline IA extrait les métadonnées de l'événement (horodatage, coordonnées, type d'anomalie, classe du navire) puis interroge automatiquement des sources externes diversifiées pour produire une évaluation de risque textuelle et contextualisée. L'architecture repose sur Amazon Bedrock pour les modèles de langage et AWS Step Functions pour l'orchestration des étapes d'analyse. Avant ce système, les analystes maritimes passaient des heures à collecter et corréler manuellement des données complexes pour comprendre chaque anomalie -- un travail qui exigeait une expertise pointue et ralentissait considérablement la prise de décision. MAI Expert réduit ce délai en automatisant la collecte de contexte: météo, actualités, alertes croisées, données propriétaires. Les agences de défense, services de renseignement, forces de l'ordre et acteurs commerciaux qui utilisent la plateforme Windward peuvent ainsi concentrer leur énergie sur l'interprétation stratégique plutôt que sur la recherche d'information. L'enjeu est direct: dans le domaine maritime, une réponse rapide à une menace peut conditionner la protection d'infrastructures critiques ou l'interception d'activités illicites. Windward s'inscrit dans une tendance de fond qui voit l'IA générative dépasser le simple rôle de résumé pour devenir un véritable agent d'investigation autonome. La coopération avec AWS illustre comment les acteurs spécialisés dans des domaines à forte contrainte opérationnelle -- sécurité maritime, défense, logistique -- cherchent à intégrer les grands modèles de langage dans des workflows métier complexes, sans sacrifier la précision ni la traçabilité des sources. La suite logique de ce développement sera d'élargir le nombre de sources interrogées, d'améliorer la fiabilité des évaluations de risque en contexte ambigu, et potentiellement d'étendre le modèle à d'autres domaines où la surveillance multi-sources est critique, comme la gestion des frontières ou la surveillance environnementale.

UELes agences européennes de surveillance maritime, gardes-côtes et services de renseignement pourraient s'appuyer sur ce type de système pour renforcer la surveillance des frontières maritimes de l'UE et la lutte contre les trafics illicites en mer.

OutilsOutil
1 source
Comment créer des pipelines de génération de graphes de connaissances à partir de texte avec kg-gen, NetworkX et des visualisations interactives
2MarkTechPost 

Comment créer des pipelines de génération de graphes de connaissances à partir de texte avec kg-gen, NetworkX et des visualisations interactives

Une équipe de chercheurs de l'Université Stanford a publié un tutoriel complet présentant kg-gen, une bibliothèque Python open source permettant de générer automatiquement des graphes de connaissances à partir de texte non structuré. Le workflow décrit s'appuie sur trois outils principaux : kg-gen pour l'extraction des entités et relations, NetworkX pour l'analyse des structures de graphes, et PyVis ainsi que Matplotlib pour la visualisation interactive. Le processus repose sur un modèle de langage configuré via LiteLLM, une couche d'abstraction qui permet de brancher indifféremment GPT-4o-mini d'OpenAI, Claude d'Anthropic, Gemini de Google ou des modèles locaux via Ollama. À partir d'un texte simple, « Linda est la mère de Josh, Ben est son frère, Andrew son père, Josh étudie à Stanford », kg-gen identifie automatiquement les entités (Linda, Josh, Ben, Stanford) et les relations sémantiques qui les lient sous forme de triplets sujet-prédicat-objet. Pour les passages plus longs, la bibliothèque intègre un mécanisme de découpage par chunks de 800 caractères et un algorithme de clustering qui regroupe les entités synonymes, évitant ainsi les doublons lorsqu'un même concept apparaît sous plusieurs formes dans le texte source. L'intérêt concret de cet outil réside dans sa capacité à transformer des corpus textuels volumineux et désordonnés en structures de données navigables et interrogeables. Pour les équipes data, les chercheurs ou les développeurs travaillant sur des bases documentaires, cela représente un gain significatif : là où il fallait annoter manuellement les relations entre concepts, kg-gen automatise l'extraction en quelques lignes de code. Le graphe résultant peut ensuite être analysé avec NetworkX pour identifier les nœuds les plus connectés, détecter des communautés thématiques, ou mesurer la centralité de certains acteurs dans un corpus. La visualisation interactive via PyVis permet de naviguer dans le graphe directement dans un notebook Jupyter ou un navigateur, ce qui ouvre des usages en veille technologique, en analyse de réseaux d'influence ou en construction de bases de connaissances pour des systèmes RAG. kg-gen a été développé à Stanford et s'appuie en interne sur DSPy, un framework de programmation déclarative pour les LLM, pour garantir des sorties structurées et reproductibles. LiteLLM, qui sert de couche de routage, supporte une quarantaine de fournisseurs de modèles, ce qui rend le pipeline indépendant d'un prestataire unique. Ce tutoriel s'inscrit dans une tendance plus large visant à combiner les grands modèles de langage avec des représentations symboliques du savoir, à mi-chemin entre les approches purement neuronales et les systèmes expert classiques. Plusieurs grandes entreprises tech explorent cette direction pour améliorer la fiabilité des réponses de leurs IA, notamment en réduisant les hallucinations en ancrant le raisonnement dans un graphe de faits vérifiables. La prochaine étape naturelle du projet consiste à fusionner des graphes issus de sources multiples, un problème d'alignement d'entités que kg-gen aborde également dans les sections avancées du tutoriel.

OutilsTuto
1 source
Google Research intègre un RAG à base d'agents dans Gemini Enterprise pour les requêtes multi-étapes
3MarkTechPost 

Google Research intègre un RAG à base d'agents dans Gemini Enterprise pour les requêtes multi-étapes

L'équipe Google Research a présenté le 5 juin 2026 un nouveau cadre de récupération augmentée par agents, intégré directement à la plateforme Gemini Enterprise Agent. Cette architecture, désormais disponible en préversion publique sous le nom Cross-Corpus Retrieval, s'attaque à une limite bien connue des systèmes de recherche d'entreprise : l'incapacité à enchaîner plusieurs étapes de raisonnement sur des sources de données distinctes. Concrètement, là où un système RAG classique échoue face à une requête du type "Quelles sont les spécifications du serveur utilisé dans le Projet X ?" (parce qu'il trouve un identifiant mais ne sait pas aller chercher les specs dans une deuxième base), le nouveau système orchestre une série d'agents spécialisés. Un Orchestrateur délègue la tâche, un Agent Planificateur identifie les sources pertinentes, un Agent Réécriture de Requêtes décompose la question en sous-requêtes précises, et un Agent de Diffusion envoie ces requêtes en parallèle. Sur le benchmark FramesQA, un corpus de 824 questions et 2 676 documents PDF, le système affiche un gain de précision factuelle allant jusqu'à 34 % par rapport au RAG standard, avec de meilleures performances également sur des jeux de données propriétaires internes à Google. Ce qui distingue fondamentalement cette architecture de ses concurrentes, c'est la présence d'un Agent de Contexte Suffisant, pièce centrale du dispositif. Plutôt que de générer une réponse dès que le premier cycle de recherche se termine, cet agent inspecte les résultats, compare un brouillon intermédiaire aux extraits récupérés, et produit un journal détaillé des lacunes identifiées, avec des raisons et des feedbacks explicites. Si des informations manquent, le cycle repart : la requête est reformulée, de nouvelles sources sont explorées. Ce mécanisme d'itération évite deux défauts symétriques : la réponse incomplète présentée comme définitive, et la capitulation prématurée du modèle face à un contexte insuffisant. Pour une question médicale portant à la fois sur les médicaments de sortie, les restrictions alimentaires et les allergies d'un patient, le système ne s'arrête pas à deux éléments sur trois, il continue jusqu'à ce que les trois soient vérifiés. Google positionne cette avancée dans un contexte de concurrence intense sur les agents d'entreprise, un marché où Microsoft, Salesforce et plusieurs startups spécialisées investissent massivement. Le problème des requêtes multi-sources, dit "multi-hop", est depuis plusieurs années l'un des obstacles majeurs à l'adoption des LLM en environnement professionnel réel, où les données sont fragmentées entre bases de connaissances, systèmes CRM, dossiers PDF et notes cliniques. En intégrant cette capacité directement dans Gemini Enterprise Agent Platform plutôt que de la proposer comme une bibliothèque tierce, Google cherche à ancrer ses modèles au coeur des infrastructures de données des grandes organisations, tout en améliorant la fiabilité des réponses là où elle est la plus critique.

UELes entreprises européennes utilisant Gemini Enterprise peuvent accéder en préversion à cette architecture multi-corpus, susceptible d'améliorer l'adoption des LLM dans des secteurs à données fragmentées comme la santé ou la finance.

💬 Le truc intéressant, c'est l'agent de contexte suffisant : il sait ce qu'il lui manque, relance la recherche, et ne s'arrête pas avant d'avoir les trois éléments sur trois. C'est exactement ce qui casse les RAG classiques en prod, pas le retrieval en lui-même. Que Google l'intègre directement dans la plateforme plutôt qu'en lib tierce, ça dit tout sur leur stratégie d'ancrage infrastructure.

OutilsOutil
1 source
Découvrez la pile de commerce à base d'agents d'AMEX : contrats d'intention et tokens à usage unique pour sécuriser les transactions IA
4VentureBeat AI 

Découvrez la pile de commerce à base d'agents d'AMEX : contrats d'intention et tokens à usage unique pour sécuriser les transactions IA

American Express développe un système permettant à des agents IA d'effectuer des achats et des paiements au nom des utilisateurs, via un kit développeur baptisé ACE (Agentic Commerce Experiences). Présenté par Luke Gebb, vice-président exécutif et responsable mondial de l'innovation chez Amex, ce dispositif repose sur une architecture en boucle fermée : Amex agit simultanément comme émetteur de carte et réseau de paiement, ce qui lui permet de valider les transactions initiées par des agents IA sans dépendre d'un intermédiaire tiers. Le kit offre aux développeurs un accès à plusieurs services intégrés : enregistrement des agents, activation de compte, gestion des intentions, émission de jetons de paiement à usage unique, contexte du panier d'achat. Amex participe par ailleurs au projet Agent Pay Protocol (AP2) de Google, centré sur l'interopérabilité entre plateformes. Ce système s'attaque à l'un des problèmes fondamentaux du commerce dit "agentique" : la confiance. Aujourd'hui, ni les consommateurs, ni les marchands, ni les banques ne veulent s'exposer aux risques qu'un agent autonome pourrait faire peser sur leurs transactions, achats non autorisés, articles impayés, fraudes ou afflux de contestations. En positionnant Amex comme premier émetteur à entrer dans cette conversation, Gebb revendique un angle mort comblé : "C'est vraiment la première fois qu'un émetteur s'assoit à la table." Contrairement à Visa ou Mastercard, qui opèrent des réseaux sans émettre de cartes elles-mêmes, Amex contrôle l'ensemble du circuit, ce qui lui donne une capacité de validation de bout en bout que ses concurrents n'ont pas. Malgré ces ambitions, le système n'est pas sans zones d'ombre. Raj Ananthanpillai, fondateur et PDG de Trua, un fournisseur de systèmes d'identité et de vérification, souligne que des outils comme ACE, la suite Agentic Commerce de Stripe ou la chaîne de preuve d'intention vérifiable de Google "excellent dans la gestion des preuves et des autorisations vérifiables, mais laissent la validation humaine en amont opaque et peu développée." Sans lien cryptographique clair prouvant qu'un agent agit sous l'autorité explicite d'un humain vérifié, les risques de répudiation, de fraude et de transactions par des personnes sous sanctions restent élevés. Amex affirme que ses agents peuvent soumettre un panier et le confronter à l'intention initiale de l'utilisateur, mais n'a pas divulgué le mécanisme exact de cette validation. C'est précisément ce manque de transparence que l'écosystème du commerce agentique devra résoudre pour atteindre une adoption à grande échelle.

UELes standards de commerce agentique en cours de définition aux États-Unis (Amex ACE, Stripe, Google AP2) pourraient devenir des références que les acteurs européens du paiement devront intégrer pour garantir l'interopérabilité, mais sans impact direct immédiat sur la France ou l'UE.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic