Aller au contenu principal
Podcast : [Vidéo] Systèmes agentiques sans chaos : premiers modèles opérationnels pour agents autonomes
OutilsInfoQ AI12sem· 1 min de lecture

Podcast : [Vidéo] Systèmes agentiques sans chaos : premiers modèles opérationnels pour agents autonomes

Source originale ↗·

Les systèmes agentiques marquent une rupture fondamentale dans la conception logicielle : contrairement à l'automatisation traditionnelle, ces architectures permettent à des agents logiciels de planifier, agir et prendre des décisions de manière autonome, sans intervention humaine à chaque étape. C'est le sujet central d'un épisode de podcast réunissant Shweta Vohra et Joseph Stein, qui s'interrogent sur ce que cette évolution change concrètement pour les équipes d'ingénierie.

L'enjeu dépasse la simple optimisation des workflows existants. Quand un système commence à raisonner sur ses propres actions et à orchestrer des sous-tâches de façon dynamique, les paradigmes classiques de conception — gestion des erreurs, traçabilité, contrôle des permissions — doivent être entièrement repensés. Pour les architectes et les ingénieurs, la question n'est plus seulement « que fait le système ? » mais « jusqu'où peut-il décider seul ? »

La conversation s'articule autour de trois axes structurants : la distinction entre automatisation classique et véritable agentivité, la définition de frontières opérationnelles claires pour les agents autonomes, et les premiers modèles d'orchestration qui émergent comme bonnes pratiques dans ce domaine. Vohra et Stein insistent sur la nécessité de poser des garde-fous architecturaux dès la conception, avant que la complexité ne devienne ingérable.

Ces réflexions s'inscrivent dans un mouvement plus large de maturation de l'écosystème IA agentique, où l'industrie cherche à passer des expérimentations isolées à des déploiements en production fiables. Les premiers modèles opérationnels qui émergent — séparation des plans d'exécution, supervision humaine ciblée, journalisation des décisions — dessinent les contours d'une ingénierie agentique rigoureuse.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

AWS lance des agents autonomes pour les tests de sécurité et les opérations cloud
1AWS ML Blog 

AWS lance des agents autonomes pour les tests de sécurité et les opérations cloud

Amazon Web Services a annoncé la disponibilité générale de deux agents autonomes d'intelligence artificielle lors de son événement re:Invent : AWS Security Agent, dédié aux tests d'intrusion, et AWS DevOps Agent, spécialisé dans les opérations cloud. Ces systèmes appartiennent à une nouvelle catégorie baptisée « frontier agents » — des IA capables de travailler de façon autonome pendant des heures, voire des jours, sans supervision humaine continue. Selon AWS, les retours des clients en phase de préversion sont significatifs : AWS Security Agent réduit les délais de tests de pénétration de plusieurs semaines à quelques heures, tandis qu'AWS DevOps Agent accélère la résolution d'incidents de 3 à 5 fois. Des entreprises comme Bamboo Health et HENNGE K.K. témoignent de résultats concrets, cette dernière affirmant avoir réduit la durée de ses cycles de sécurité de plus de 90 %. L'enjeu pour les équipes de sécurité et d'exploitation est majeur. La plupart des organisations ne peuvent aujourd'hui faire réaliser des tests de pénétration manuels que sur leurs applications les plus critiques, faute de temps et de budget — laissant la majorité de leur portefeuille logiciel vulnérable entre deux cycles d'audit. AWS Security Agent change cette équation en analysant le code source, les diagrammes d'architecture et la documentation pour reconstituer des chaînes d'attaque complexes que les scanners traditionnels ne détectent pas. Côté opérations, AWS DevOps Agent s'intègre avec les principaux outils du marché — CloudWatch, Datadog, Dynatrace, Splunk, Grafana, GitHub, GitLab — et corrèle télémétrie, code et données de déploiement pour identifier la cause racine d'un incident, qu'il s'agisse d'infrastructures AWS, Azure, hybrides ou on-premise. Pour les équipes SRE débordées, c'est la promesse d'un coéquipier disponible en permanence. Ces annonces s'inscrivent dans une course à l'automatisation des opérations IT qui s'intensifie depuis l'essor des grands modèles de langage. Les hyperscalers — AWS, Microsoft Azure, Google Cloud — cherchent tous à proposer des agents capables de gérer des tâches complexes et durables, au-delà des simples assistants conversationnels. AWS positionne explicitement ces outils non comme des aides ponctuelles, mais comme de véritables extensions de l'équipe humaine, capables de prendre des décisions en plusieurs étapes sans intervention constante. Amy Herzog, vice-présidente et RSSI d'AWS, indique que l'entreprise utilise elle-même AWS Security Agent en interne. La question qui se posera à mesure de l'adoption est celle de la gouvernance : jusqu'où déléguer à une IA des décisions critiques sur la sécurité ou la stabilité des systèmes de production ?

UELes entreprises européennes utilisant AWS peuvent adopter ces agents pour réduire leurs coûts et délais de tests de sécurité, mais la délégation de décisions critiques à une IA soulève des questions de conformité avec le RGPD et l'AI Act.

OutilsOutil
1 source
Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur
2AWS ML Blog 

Amazon SageMaker AI accélère les appels d'outils des agents autonomes avec la personnalisation de modèles sans serveur

Amazon a introduit une fonctionnalité de personnalisation de modèles sans serveur dans SageMaker AI, permettant aux équipes d'améliorer drastiquement les capacités d'appel d'outils des agents IA sans gérer d'infrastructure GPU. Dans un cas concret publié début avril 2026, des ingénieurs ont affiné le modèle Qwen 2.5 7B Instruct en utilisant la technique RLVR (Reinforcement Learning with Verifiable Rewards) et ont obtenu une amélioration de 57% du score de qualité des appels d'outils sur des scénarios inédits, c'est-à-dire des outils que le modèle n'avait jamais vus lors de l'entraînement. La méthode repose sur un principe simple : le modèle génère huit réponses candidates par prompt, une fonction de récompense vérifie lesquelles sont correctes, et l'algorithme GRPO (Group Relative Policy Optimization) renforce les comportements qui surpassent la moyenne du groupe. SageMaker AI prend en charge les familles de modèles Amazon Nova, Llama, Qwen et DeepSeek, avec un suivi des métriques via MLflow intégré. L'enjeu est concret : les agents IA en production échouent fréquemment lors des appels d'outils, qu'il s'agisse d'halluciner des fonctions inexistantes, de passer des paramètres incorrects, ou de déclencher une action là où ils devraient demander une clarification. Ces erreurs bloquent le déploiement en production et détruisent la confiance des utilisateurs. La nouvelle approche serverless d'Amazon supprime l'obstacle opérationnel majeur que représentait jusqu'ici le fine-tuning par renforcement : achat de GPU, orchestration mémoire entre les phases de rollout et d'entraînement, infrastructure de récompenses, gestion des checkpoints. Les équipes peuvent désormais se concentrer sur leurs données, leur modèle et leur fonction de récompense, le reste étant géré par la plateforme. Le fine-tuning supervisé classique (SFT) montre ses limites pour ce type de tâche : il nécessite des exemples étiquetés pour chaque comportement souhaité, mais peine à généraliser la prise de décision entre appeler un outil, demander des informations supplémentaires, ou refuser d'agir. RLVR contourne ce problème en exploitant la nature vérifiable des appels d'outils : soit le modèle a appelé la bonne fonction avec les bons paramètres, soit non. Cette objectivité binaire rend l'appel d'outils particulièrement adapté à l'apprentissage par renforcement. Amazon positionne cette offre dans un marché de l'IA agentique en forte croissance, où des acteurs comme Google (Vertex AI), Microsoft (Azure ML) et des startups spécialisées se disputent les équipes qui cherchent à industrialiser des agents fiables, avec un accès simplifié via SageMaker Studio et un compte AWS standard.

OutilsActu
1 source
OpenAI publie Symphony en open source : un SPEC.md pour l'orchestration d'agents de codage autonomes
3InfoQ AI 

OpenAI publie Symphony en open source : un SPEC.md pour l'orchestration d'agents de codage autonomes

OpenAI a publié en open source Symphony, un orchestrateur d'agents de codage autonomes accompagné d'une spécification formelle baptisée SPEC.md. Le système utilise des outils de gestion de projet, comme les gestionnaires de tickets, comme plan de contrôle pour coordonner plusieurs agents travaillant en parallèle. Concrètement, Symphony découpe le travail en "tâches" distinctes, chacune confiée à un agent dédié qui progresse jusqu'à l'achèvement sans intervention humaine continue. Une fois la tâche terminée, un développeur humain examine le résultat avant de valider ou corriger. Ce modèle rompt avec l'approche actuelle où les développeurs supervisent activement chaque session de codage assistée par IA. Avec Symphony, un ingénieur peut déléguer simultanément plusieurs blocs de travail à une flotte d'agents autonomes, ce qui multiplie potentiellement la capacité de production d'une équipe sans augmenter ses effectifs. Pour les entreprises tech, cela annonce des pipelines de développement logiciel beaucoup plus automatisés, où l'humain intervient surtout en phase de validation plutôt qu'en pilotage continu. Symphony émerge dans un contexte de compétition intense autour des agents de codage autonomes. OpenAI affronte Anthropic et son assistant Claude, Google avec Gemini Code Assist, ainsi que des startups comme Cognition AI dont l'agent Devin cible explicitement ce marché. En diffusant Symphony sous forme de spécification ouverte, OpenAI tente d'influencer les standards de l'industrie et d'encourager l'adoption de son approche d'orchestration par d'autres équipes et plateformes. La prochaine étape sera de voir si SPEC.md s'impose comme référence, ou si chaque acteur développe son propre modèle propriétaire.

💬 OpenAI publie une spec ouverte, pas juste du code, et c'est exactement la stratégie qu'on adopte quand on veut que l'industrie entière s'aligne sur ton modèle d'orchestration plutôt que sur celui du voisin. Le truc intéressant dans Symphony, c'est ce glissement : le dev ne pilote plus en continu, il valide à la fin, comme un lead qui fait des code reviews plutôt que du pair-programming permanent. Ça ressemble à du vrai changement de workflow, pas du gadget.

OutilsOutil
1 source
NVIDIA déploie des agents IA fiables pour les opérations télécoms en continu
4NVIDIA AI Blog 

NVIDIA déploie des agents IA fiables pour les opérations télécoms en continu

NVIDIA présente cette semaine à Copenhague, lors du TM Forum DTW Ignite 2026, une plateforme d'autonomie pour les opérateurs télécom, réunissant plusieurs partenaires industriels majeurs autour d'agents d'intelligence artificielle capables de gérer des réseaux en continu et sans intervention humaine systématique. Parmi les partenaires impliqués figurent SoftBank Corp., Amdocs, NTT DATA et AdaptKey. Les briques technologiques démontrées incluent NVIDIA NeMo Safe Synthesizer et NeMo Anonymizer pour la génération de données synthétiques, ainsi que NemoClaw et OpenShell pour le déploiement sécurisé d'agents autonomes. SoftBank utilise ces outils pour constituer des jeux de données synthétiques qui reflètent la structure de ses données réseau réelles, sans exposer d'informations sensibles, afin d'entraîner un grand modèle télécom propriétaire. AdaptKey pilote des agents capables de détecter des problèmes de sécurité et de connectivité sur des réseaux 5G, puis de soumettre des demandes de correction auditables couvrant le coeur de réseau, le RAN et les systèmes de facturation. Amdocs, de son côté, déploie des agents proactifs pour la relation client, notamment pour détecter les abonnés dont le forfait itinérance approche de son plafond et leur proposer automatiquement des options validées par l'opérateur. Ce passage vers l'autonomie représente un saut qualitatif par rapport à l'automatisation classique, qui se limitait jusqu'ici à accélérer des étapes prédéfinies tout en laissant aux humains la corrélation des informations et les décisions. Les agents autonomes de nouvelle génération sont conçus pour tenir des tâches complexes de bout en bout, sous contraintes de niveaux de service, de politiques de changement et de réglementations strictes. Pour les opérateurs, cela signifie des réseaux capables de se réparer seuls, une relation client prise en charge en temps réel et des migrations de systèmes de facturation orchestrées intelligemment selon l'éligibilité de chaque compte client, sans mobiliser d'équipes entières pour chaque décision. Le chemin vers ces réseaux autonomes se heurtait jusqu'ici à un obstacle majeur : 54 % des opérateurs identifient les problèmes liés aux données comme leur principal frein, les données réseau et clients les plus précieuses étant trop sensibles pour alimenter directement les modèles d'IA. La génération de données synthétiques permet de contourner cette contrainte en produisant des datasets représentatifs sans exposer les enregistrements bruts. Par ailleurs, la question de la gouvernance reste centrale : les agents NemoClaw et OpenShell opèrent dans des environnements bac à sable, avec des garde-fous basés sur des politiques, pour garantir que leur comportement reste prévisible et auditable. La démonstration de Copenhague intervient dans un contexte où la course aux réseaux autonomes s'accélère, avec des enjeux considérables pour la fiabilité des infrastructures critiques et la capacité des opérateurs à proposer des services à valeur ajoutée pilotés par l'IA.

UELes opérateurs télécom européens, soumis à des réglementations strictes sur la protection des données, pourraient tirer parti de l'approche par données synthétiques de NVIDIA pour déployer des agents IA sur leurs réseaux sans exposer d'informations sensibles.

OutilsActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic