Le code : outil de raisonnement et d'action des…

44

1VentureBeat AI

Le prochain goulot d'étranglement de l'IA n'est pas les modèles, c'est la capacité des agents à raisonner ensemble

Les agents d'intelligence artificielle peuvent désormais être interconnectés dans des workflows complexes, mais Vijoy Pandey, SVP et directeur général d'Outshift by Cisco, pointe une limite fondamentale : la connexion n'est pas la cognition. Chaque agent repart de zéro à chaque interaction, sans contexte partagé ni alignement sémantique avec ses pairs. Pour résoudre ce problème, l'équipe de Pandey développe trois nouveaux protocoles de communication inter-agents : le Semantic State Transfer Protocol (SSTP), qui opère au niveau du langage pour permettre aux systèmes d'inférer la bonne tâche ; le Latent Space Transfer Protocol (LSTP), capable de transférer l'espace latent complet d'un agent à un autre, en transmettant directement le cache KV pour éviter le coût de la tokenisation ; et le Compressed State Transfer Protocol (CSTP), orienté vers les déploiements en périphérie de réseau où il faut transmettre de grandes quantités d'état de manière précise et compressée. En parallèle, Cisco a collaboré avec le MIT sur le Ripple Effect Protocol, une initiative complémentaire dans cette direction. L'enjeu derrière ces travaux est considérable : atteindre ce que Pandey appelle l'"internet de la cognition", un niveau où des agents peuvent résoudre des problèmes inédits, sans intervention humaine, en partageant véritablement leur intention et leur contexte. Ce saut qualitatif représente selon lui le "grand déblocage" pour les systèmes d'IA de prochaine génération. Sur le plan opérationnel, Cisco a déjà montré des résultats concrets : en déployant plus de vingt agents, dont certains développés en interne et d'autres issus de fournisseurs tiers, l'équipe SRE de Cisco a automatisé plus d'une douzaine de workflows de bout en bout, incluant les pipelines CI/CD, les déploiements Kubernetes et les instanciations EC2. Ces agents accèdent à plus de cent outils via des frameworks comme le Model Context Protocol (MCP), tout en s'intégrant aux plateformes de sécurité de Cisco. Pandey situe cette évolution dans une trajectoire historique plus large : l'intelligence humaine a d'abord émergé individuellement, avant que la communication progressive entre individus ne déclenche une révolution cognitive collective, permettant l'intention partagée, la coordination et l'innovation distribuée. Son équipe reproduit délibérément cette trajectoire dans le silicium, en codifiant l'intention, le contexte et l'innovation collective directement dans l'infrastructure sous forme de règles, d'API et de capacités. L'architecture cible se décompose en trois couches : les protocoles (SSTP, LSTP, CSTP), un tissu de distribution pour synchroniser les états cognitifs entre endpoints, et des "moteurs de cognition" fournissant garde-fous et accélération. Cisco n'est pas seul sur ce terrain : la course à l'infrastructure agentique de nouvelle génération s'intensifie, avec des acteurs comme Anthropic, OpenAI et des startups spécialisées qui poussent chacun leurs propres standards, rendant la bataille des protocoles aussi stratégique que celle des modèles eux-mêmes.

InfrastructureOpinion

1 source

Google et AWS répartissent la pile des agents IA entre contrôle et exécution

49

2VentureBeat AI

Google et AWS répartissent la pile des agents IA entre contrôle et exécution

Google et Amazon Web Services viennent de redéfinir leurs approches respectives pour orchestrer les agents IA d'entreprise, révélant une fracture profonde dans la façon de concevoir l'infrastructure agentique. Google a lancé une nouvelle version de Gemini Enterprise, regroupant sous une même bannière sa plateforme Gemini Enterprise et son application éponyme, tout en rebaptisant Vertex AI en Gemini Enterprise Platform. De son côté, AWS a enrichi Bedrock AgentCore d'un système de harness, un dispositif de configuration automatique alimenté par Strands Agents, son framework open source. Ce harness permet aux équipes de définir ce que l'agent doit faire, quel modèle utiliser et quels outils appeler, le reste étant pris en charge automatiquement. Dans le même temps, Anthropic a dévoilé ses Claude Managed Agents et OpenAI a renforcé son Agents SDK, confirmant que l'ensemble de l'industrie cherche simultanément à résoudre le même problème : comment gérer des agents IA qui tournent durablement en production. L'enjeu dépasse la simple question de l'outillage développeur. À mesure que les agents passent de courtes tâches ponctuelles à des workflows autonomes de longue durée, un nouveau type de défaillance émerge : la dérive d'état (state drift). Un agent qui fonctionne en continu accumule de la mémoire, des réponses et un contexte évolutif. Avec le temps, ce contexte devient obsolète : les sources de données changent, les outils renvoient des réponses contradictoires, et l'agent perd en fiabilité sans que personne ne s'en rende forcément compte. C'est ce problème systémique que Google et AWS cherchent à prévenir, par deux chemins opposés. Google mise sur un plan de contrôle à la manière de Kubernetes, centré sur la gouvernance et la visibilité. AWS privilégie la vitesse de déploiement et la simplification de la configuration, en déléguant la coordination à la couche d'exécution. Cette divergence illustre une transformation plus profonde de la pile IA, qui se stratifie désormais en couches spécialisées. Google positionne Gemini Enterprise comme une porte d'entrée unifiée vers l'ensemble de ses systèmes IA, avec des outils de sécurité et de gouvernance inclus dans l'abonnement, selon Maryam Gholami, directrice senior produit chez Google. AWS, Anthropic et OpenAI s'orientent davantage vers la vélocité et la flexibilité d'exécution. La question de savoir quelle approche s'imposera reste ouverte : Gholami elle-même reconnaît que ce sont les clients qui dicteront les usages des agents longue durée, un domaine où les bonnes pratiques restent encore à définir. Le vrai test viendra lorsque les entreprises feront tourner ces systèmes en conditions réelles, avec des agents qui devront remonter de l'information, demander des validations humaines, et résister à la dégradation progressive de leur contexte.

UELes entreprises européennes qui déploient des agents IA en production sur Google Cloud ou AWS devront arbitrer entre les deux approches d'orchestration pour leurs workflows agentiques durables.

InfrastructureOpinion

1 source

Les agents IA ont besoin de contexte partout, même là où le cloud ne peut pas les suivre

50

3VentureBeat AI

Les agents IA ont besoin de contexte partout, même là où le cloud ne peut pas les suivre

Couchbase a annoncé mardi son AI Data Plane, une plateforme opérationnelle unifiée qui combine mémoire persistante pour agents IA, récupération de contexte en temps réel et serveur MCP géré en entreprise. L'annonce positionne la société comme un acteur central dans la bataille pour le contrôle du contexte des agents IA en entreprise, un terrain où s'affrontent déjà des géants comme Databricks, AWS et Redis. L'AI Data Plane regroupe trois composants : une couche de persistance unifiée pour le contexte conversationnel, les données opérationnelles structurées et les embeddings vectoriels ; un serveur MCP auto-géré livré nativement dans la plateforme ; et un catalogue d'outils agents appelé Agent Catalog. La plateforme tourne de manière identique sur le cloud, en on-premises et dans des environnements edge déconnectés, grâce à Couchbase Lite, le moteur embarqué qui exécute SQL, recherche plein texte et recherche vectorielle localement sans connexion réseau. L'enjeu concret est celui de l'efficacité opérationnelle et de la souveraineté des données. Pour les secteurs réglementés, les déploiements industriels ou le retail en mobilité, l'impossibilité d'envoyer des données vers le cloud n'est pas un détail technique mais une contrainte légale ou physique. En cachant le contexte partagé localement, la plateforme évite que chaque agent récupère et traite les mêmes données indépendamment, réduisant la consommation de tokens pour les sessions concurrentes. Couchbase cite l'exemple concret d'une chaîne hôtelière où plusieurs agents servent simultanément des clients, chacun puisant dans un contexte local via recherche vectorielle on-device, la mémoire de session se synchronisant ensuite de manière bidirectionnelle vers le cloud dès que la connectivité est rétablie. Agora, une plateforme d'intégration d'IA conversationnelle pour les entreprises, utilise Couchbase en production depuis février 2024. Couchbase arrive à ce problème avec une architecture distincte : la société était un système de cache avant de devenir une base de données, ce que son CTO Gopi Duddi présente comme un avantage structurel. Écrire en mémoire est dix fois plus rapide qu'écrire sur disque, argue-t-il, séparant Couchbase des bases NoSQL qui superposent des workloads mémoire sur un stockage disque. Redis, qui partage ces racines dans le cache, a également annoncé récemment une couche de contexte pour agents IA, mais Duddi souligne que Couchbase maintient une conformité ACID, atomicité, cohérence, isolation, durabilité, essentielle pour les charges de travail transactionnelles. La vraie bataille qui se joue ici est celle du substrat de mémoire des agents : quelle plateforme de données va devenir le système d'enregistrement de l'intelligence artificielle en production, y compris là où le cloud ne peut pas suivre.

UEPour les entreprises européennes soumises au RGPD ou à des réglementations sectorielles imposant la localisation des données, la capacité de déploiement on-premises et edge constitue une alternative concrète aux architectures cloud-first pour les agents IA en production.

💬 Ce que fait Couchbase ici, c'est mettre la main sur la mémoire de travail des agents, et tout le monde comprend que c'est là que se joue la prochaine bataille d'infrastructure. Leurs racines dans le cache leur donnent un avantage structurel sur des bases NoSQL qui ont bricolé une couche mémoire par-dessus du disque. Pour les boîtes européennes entre RGPD et réseaux capricieux, un système qui tourne pareil offline et sur le cloud, c'est pas anodin.

InfrastructureOpinion

1 source

Trump ignore les principales raisons de l'échec de son plan de construction de centres de données pour l'IA

43

4Ars Technica AI

Trump ignore les principales raisons de l'échec de son plan de construction de centres de données pour l'IA

Donald Trump se heurte à de sérieux obstacles dans son ambition de transformer les États-Unis en puissance dominante de l'intelligence artificielle. Après avoir signé plusieurs décrets exécutifs l'année dernière faisant de la construction rapide de centres de données IA une priorité nationale dans la course technologique face à la Chine, le président américain voit ses plans compromis par ses propres politiques commerciales. Selon Bloomberg, près de la moitié des centres de données américains prévus pour 2026 devraient être retardés ou annulés. Le paradoxe est frappant : les tarifs douaniers agressifs imposés par Trump sur les importations chinoises bloquent précisément les équipements indispensables à la construction de ces infrastructures. Les développeurs ne parviennent pas à s'approvisionner en transformateurs électriques, en appareillages de commutation et en batteries, des composants essentiels pour alimenter les centres de données. Sans cette infrastructure électrique, impossible de faire tourner les milliers de puces GPU que nécessitent les grands modèles d'IA. Cette situation illustre la tension fondamentale entre le protectionnisme commercial de l'administration Trump et ses ambitions technologiques. La chaîne d'approvisionnement mondiale en équipements électriques industriels reste largement dépendante de fabricants asiatiques, notamment chinois. Alors que Washington cherche à accélérer le déploiement de capacités de calcul pour rester compétitif face à Pékin dans la course à l'IA, ses propres barrières douanières fragilisent la réalisation de cet objectif. Les entreprises tech et les opérateurs de data centers se retrouvent pris en étau entre injonctions politiques contradictoires.

UELes retards dans le déploiement des capacités de calcul américaines pourraient indirectement ralentir l'accès mondial aux grands modèles IA et renforcer l'argument en faveur d'une souveraineté numérique européenne dans l'infrastructure IA.

InfrastructureOpinion

1 source

Le code : outil de raisonnement et d'action des agents IA, pas seulement leur production

À lire aussi

Le prochain goulot d'étranglement de l'IA n'est pas les modèles, c'est la capacité des agents à raisonner ensemble

Google et AWS répartissent la pile des agents IA entre contrôle et exécution

Les agents IA ont besoin de contexte partout, même là où le cloud ne peut pas les suivre

Trump ignore les principales raisons de l'échec de son plan de construction de centres de données pour l'IA