Aller au contenu principal

Dossier Agents IA — page 6

1550 articles · page 6 sur 31

Les agents IA : déploiements en production, écart pilote/prod, débat sur la confiance, agent debt et négociations automatisées.

Créer un assistant de recherche sur les protéines avec Amazon Bedrock AgentCore
251AWS ML Blog AutrePaper

Créer un assistant de recherche sur les protéines avec Amazon Bedrock AgentCore

Amazon Web Services a publié un guide technique détaillant la construction d'un assistant conversationnel dédié à la recherche sur les protéines, baptisé "protein research copilot", reposant sur Amazon Bedrock AgentCore. Le système permet aux chercheurs de soumettre des requêtes en langage naturel, par exemple "Trouve 10 peptides similaires au peptide du virus de la dengue LPAIVREAI", et d'obtenir automatiquement des résultats de similarité structurelle accompagnés d'une synthèse scientifique générée par IA. L'architecture s'appuie sur le SDK Strands Agents pour orchestrer trois outils spécialisés au sein d'un agent unique : un parseur de requêtes, un moteur de recherche vectorielle, et un summariseur. Les embeddings protéiques sont calculés via le modèle ESM-C 300M déployé comme endpoint serverless sur Amazon SageMaker AI, puis comparés par similarité cosinus dans une base Amazon Aurora PostgreSQL avec l'extension pgvector. L'interface utilisateur tourne sur AWS Fargate via Streamlit, et le modèle de langage central est Claude Sonnet 4.6 d'Anthropic, accessible via l'API Bedrock Converse. Ce type d'outil répond à un problème concret dans les laboratoires de biologie computationnelle : la recherche manuelle de peptides structurellement similaires parmi des milliers de séquences est lente, sujette aux erreurs, et exige une expertise pointue pour interpréter les résultats. En automatisant l'ensemble du pipeline, de la formulation de la question à la synthèse des résultats, le copilote réduit drastiquement le temps passé sur des tâches répétitives et rend la recherche accessible à des profils moins spécialisés en bioinformatique. Le pattern "LLM-as-parser" utilisé pour extraire des paramètres structurés depuis du langage naturel est directement réutilisable dans d'autres domaines scientifiques où les données sont complexes et la formulation des requêtes peu standardisée. Cette publication s'inscrit dans la stratégie d'AWS de positionner Bedrock AgentCore comme plateforme de référence pour déployer des agents IA en production, face à des concurrents comme Google Vertex AI ou Microsoft Azure AI Studio. Le secteur biotech et pharmaceutique représente une cible prioritaire : la recherche sur les épitopes viraux, le dataset utilisé ici est celui de l'IEDB (Immune Epitope Database), est au coeur du développement de vaccins et de thérapies antivirales. Le modèle ESM-C, développé par EvolutionaryScale, est l'un des modèles de langage protéique les plus performants du moment. Le déploiement complet est estimé entre 30 et 45 minutes, mais implique des coûts sur Bedrock, SageMaker, Aurora Serverless v2 et Fargate qu'AWS invite explicitement à consulter avant de lancer l'infrastructure. Les prochaines étapes naturelles seraient l'intégration de bases de données protéiques publiques comme UniProt ou PDB, et l'extension à d'autres types de molécules biologiques.

UECet outil développé par AWS peut bénéficier aux chercheurs en biologie computationnelle en France et dans l'UE en automatisant la recherche de peptides structurellement similaires, améliorant ainsi l'efficacité et rendant ces tâches moins spécialisées.

1 source
Comment les entreprises développent des IA spécialisées de confiance
252NVIDIA AI Blog 

Comment les entreprises développent des IA spécialisées de confiance

NVIDIA a lancé l'NVIDIA Agent Toolkit, une plateforme modulaire et ouverte destinée à permettre aux entreprises de construire des agents IA spécialisés adaptés à leurs propres workflows. La boîte à outils repose sur trois composants principaux : les modèles ouverts Nemotron, qui servent de base de raisonnement personnalisable ; les blueprints NemoClaw, qui définissent des schémas pour un comportement d'agent plus sûr et plus précis à moindre coût ; et le runtime OpenShell, qui permet aux agents d'opérer en toute sécurité au sein des systèmes existants. NVIDIA a également lancé le BioNeMo Toolkit, spécifiquement conçu pour les sciences de la vie, réduisant à quelques jours des tâches qui nécessitaient auparavant plusieurs mois. La plateforme est compatible avec des orchestrateurs tiers comme Hermes Agents et OpenClaw. Des entreprises comme CrowdStrike déploient déjà des agents de cybersécurité spécialisés qui traitent les alertes avec 98,5 % de précision, tandis que Cadence et Synopsys construisent des agents autonomes pour la conception de puces électroniques. Des acteurs comme Palantir, SAP, ServiceNow, Siemens et Dassault Systèmes intègrent quant à eux ces capacités agentiques dans leurs plateformes d'entreprise. L'enjeu central de cette annonce est la confiance et le contrôle. Les entreprises ne cherchent pas seulement à accéder à une IA générale : elles veulent des systèmes qu'elles peuvent personnaliser, auditer et déployer en toute sécurité dans des environnements critiques. En proposant une architecture ouverte et modulaire, NVIDIA permet aux équipes techniques d'intégrer des agents dans leurs systèmes existants sans repartir de zéro. Dans les sciences de la vie, cela accélère la découverte de médicaments, l'analyse génomique et le criblage virtuel de molécules. Dans la santé, les agents soutiennent la documentation clinique et la coordination des soins. Dans la cybersécurité, le triage automatisé à haute précision libère des analystes pour des tâches à plus forte valeur ajoutée. Le potentiel de gain de productivité à l'échelle industrielle est donc considérable. Cette initiative s'inscrit dans une deuxième vague de l'IA en entreprise, après une phase initiale d'expérimentation avec les grands modèles frontières. Les pilotes ont montré que l'IA générique ne suffit pas : les cas d'usage les plus précieux exigent des agents capables de raisonner, d'utiliser des outils métier et d'agir dans des workflows très spécifiques. NVIDIA, déjà dominant dans l'infrastructure matérielle pour l'IA, élargit ainsi son emprise sur la couche logicielle agentique. En s'alliant à des acteurs comme SAP, Siemens et Palantir, l'entreprise se positionne au coeur de l'adoption de l'IA dans les secteurs industriels, de la santé et de la cybersécurité. La prochaine étape sera de voir si cette architecture ouverte parvient à s'imposer face aux écosystèmes fermés que d'autres géants technologiques cherchent à construire.

UELes entreprises européennes Dassault Systèmes, Siemens et SAP intègrent directement ces capacités agentiques dans leurs plateformes industrielles, marquant une adoption concrète dans l'industrie européenne.

💬 NVIDIA fait le mouvement classique : verrouiller le marché par le haut (le hardware) et par le bas (la plateforme logicielle), en laissant juste assez d'ouverture pour que les entreprises se convainquent elles-mêmes qu'elles gardent le contrôle. Le vrai test, c'est dans 18 mois, quand SAP et Siemens seront assez dépendants pour que changer de couche agentique coûte plus cher que rester. Les 98,5% de précision de CrowdStrike, c'est le genre de chiffre qui fait signer des contrats.

OutilsOpinion
1 source
Meta : les données du projet de surveillance des employés étaient accessibles en interne
253Next INpact 

Meta : les données du projet de surveillance des employés étaient accessibles en interne

Meta a suspendu son programme interne de surveillance des employés, baptisé Model Capability Initiative (MCI), après la découverte d'une faille de sécurité majeure. Lancé en avril 2026, cet outil enregistrait les mouvements de curseur, les clics, les frappes clavier et réalisait des captures d'écran périodiques sur les machines des salariés de l'entreprise. L'objectif affiché était de collecter des données comportementales pour entraîner les modèles d'intelligence artificielle de Meta, notamment pour améliorer les fonctionnalités d'agents IA. Le problème : les données ainsi récoltées se sont révélées accessibles à l'ensemble du personnel de l'entreprise. Business Insider a consulté des captures d'écran confirmant qu'il était possible d'accéder à des discussions privées, des données de performance et des transcriptions. Selon un avis de sécurité interne obtenu par Wired, les données de 45 000 tables Hive étaient exposées. Meta a classé l'incident au niveau 2 de son échelle de sévérité interne, dont le degré 0 représente la criticité maximale. L'exposition concerne des informations hautement sensibles. Des employés indiquent avoir eu accès depuis leur poste de travail à des données fiscales et médicales personnelles de leurs collègues, en violation directe des garanties formulées par l'entreprise lors du déploiement du programme. La réaction en interne a été vive : sur les canaux de messagerie interne, certains salariés ont exprimé leur colère ouvertement, l'un d'eux partageant un mème de la série The Office avec la pancarte « 0 jour depuis notre dernière bêtise ». Le CTO de Meta, Andrew Bosworth, a reconnu dans un message interne une mauvaise configuration des listes de contrôle d'accès (ACL) et annoncé une analyse complète des causes, incluant la traçabilité de chaque accès aux données compromises. Des employés réclament désormais qu'une réunion post-mortem soit organisée avec toutes les personnes concernées. Cette faille intervient dans un contexte déjà tendu autour du programme MCI. Dès son lancement, le projet avait suscité une fronde interne, contraignant Meta à introduire une fonctionnalité de pause de 30 minutes, insuffisante aux yeux de nombreux salariés qui réclamaient un bouton de désactivation complet. La suspension actuelle du programme, présentée comme temporaire le temps de l'enquête, ravive des questions plus larges sur les pratiques de collecte de données des grandes entreprises technologiques sur leurs propres employés au nom de l'entraînement de l'IA. Si Meta affirme ne pas avoir de preuve d'accès malveillant, l'incident illustre les risques concrets que font peser ces dispositifs massifs de collecte interne, et la difficulté à concilier ambitions en IA et respect élémentaire de la vie privée des travailleurs.

UELes employés de Meta en France et dans l'UE sont potentiellement concernés par ce dispositif de surveillance ; l'incident pourrait déclencher une enquête de la CNIL et met en lumière les tensions entre le RGPD, le droit du travail européen et les pratiques de collecte massive de données internes au nom de l'IA.

ÉthiqueActu
1 source
Un POC tolère un pipeline de données fragile, l'IA en production non
254VentureBeat AI 

Un POC tolère un pipeline de données fragile, l'IA en production non

Lorsqu'une entreprise fait passer un projet d'IA d'une phase pilote à un déploiement en production, c'est souvent l'infrastructure réseau qui craque en premier. Les architectures point à point, dans lesquelles un client S3 se connecte directement au stockage S3, tiennent la route dans des conditions de démonstration contrôlées, mais s'effondrent dès que le trafic devient soutenu et concurrent. Paul Pindell, architecte solutions principal chez F5, l'explique sans détour : si un seul nœud de stockage tombe, l'ensemble du trafic vers le cluster se dégrade, et dans certains cas le cluster entier peut cesser de fonctionner. Les effets en cascade sont immédiats : les pipelines d'inférence se bloquent, les systèmes de RAG (récupération augmentée de génération) perdent l'accès à des données actualisées, et les GPU restent inutilisés pendant que les délais s'accumulent. Ces pannes ont un coût business concret. Quand un pipeline d'inférence se fige, c'est un engagement de niveau de service qui est violé et une expérience client qui se dégrade. Quand un système RAG ne reçoit plus ses données à temps, le modèle génère des réponses imprécises, obsolètes ou hallucinées, exposant l'entreprise à des risques opérationnels, réglementaires et réputationnels. Parallèlement, les GPU sous-utilisés font grimper les coûts d'infrastructure sans produire de valeur. Tanu Mutreja, directrice senior produit chez F5, résume l'enjeu pour les dirigeants : la vraie question n'est pas de savoir si l'on a des GPU suffisants, mais si l'infrastructure bout-en-bout est capable de délivrer des expériences IA fiables, sécurisées et gouvernées à des coûts unitaires viables. Face à ce problème, F5 défend l'idée que la livraison des données doit devenir une couche d'infrastructure à part entière, au même titre que la livraison d'applications l'a été pour les requêtes web. Cette couche repose sur trois propriétés : l'observabilité en temps réel des latences, débits et états des flux ; la programmabilité, qui permet de piloter dynamiquement le routage, d'optimiser le trafic et d'automatiser le basculement en cas de défaillance ; et une conception résiliente aux pannes, pensée dès le départ pour l'environnement de production plutôt qu'adaptée après coup. Hunter Smit, responsable marketing produit chez F5, souligne que les organisations qui réussissent à opérationnaliser l'IA sont celles qui construisent leur infrastructure pour absorber les défaillances réelles, et non les conditions idéales d'un pilote. Avec la montée en puissance des architectures agentiques et des systèmes RAG à grande échelle, ce débat sur le chemin des données entre stockage et calcul est appelé à s'intensifier.

InfrastructureActu
1 source
Red-Teaming après Mythos : Zico Kolter et Matt Fredrikson, Gray Swan
255Latent Space 

Red-Teaming après Mythos : Zico Kolter et Matt Fredrikson, Gray Swan

Zico Kolter, membre du conseil d'administration d'OpenAI au sein du comité Sécurité et Sûreté, et Matt Fredrikson, professeur à Carnegie Mellon University et PDG de la startup Gray Swan, ont accordé un long entretien au podcast AI Engineer pour dresser l'état de l'art du red-teaming en intelligence artificielle. La discussion intervient dans un contexte particulier : le gouvernement américain a récemment émis une directive de contrôle à l'exportation visant les modèles Mythos et Fable, propulsant sur le devant de la scène les risques de jailbreaks et d'injection de prompts indirects. Gray Swan, que les deux cofondateurs dirigent ensemble, avait été cité comme autorité de référence dans la fiche technique du modèle Mythos, ayant directement investigué les capacités aujourd'hui sous scrutin. Leur entreprise a notamment développé Shade, l'outil de red-teaming adversarial utilisé par Anthropic pour évaluer la robustesse de ses modèles face aux attaques par injection de prompts dans les environnements de développement, ainsi que Cygnal, un produit de guardrails pour agents IA, et la plus grande arène communautaire de red-teaming au monde. L'enjeu central que soulèvent Kolter et Fredrikson est que la sécurité de l'IA ne se réduit pas à de la cybersécurité traditionnelle augmentée : les agents IA introduisent une catégorie entièrement nouvelle de vulnérabilités. L'injection de prompts indirects, par exemple, permet à un attaquant de compromettre un agent comme Claude Code ou Codex en lui faisant traiter des données non fiables contenant des instructions malveillantes, qui peuvent ensuite conduire à l'exfiltration de données privées. Cette combinaison, baptisée la « trilogie létale » par Simon Willison, données non fiables, données sensibles et vecteur d'exfiltration, représente un risque systémique pour tout déploiement enterprise. Et contrairement à l'intuition dominante, les modèles plus grands ne sont pas automatiquement plus robustes : la mise à l'échelle n'est pas un antidote à ces vulnérabilités. Fait frappant, les modèles de red-teaming spécialisés développés par Gray Swan surpassent désormais les humains dans leur capacité à briser d'autres systèmes d'IA. Le cadre conceptuel que propose Gray Swan est celui des « cygnes gris » : des événements peu probables mais clairement prévisibles avant qu'ils ne surviennent. La première grande intrusion par injection de prompts en conditions réelles est, selon eux, probablement inévitable. Ce qui rend le moment actuel critique, c'est la convergence entre la montée en puissance des agents autonomes, les nouvelles exigences réglementaires et l'émergence d'un marché de l'assurance et de la conformité spécifique à l'IA. La question de l'identité native des agents, la gestion fine de leurs permissions en environnement enterprise, et la capacité à faire attaquer, défendre et interpréter les systèmes d'IA par d'autres systèmes d'IA dessinent les contours d'un champ disciplinaire encore naissant, mais dont les enjeux industriels et sociétaux sont déjà considérables.

UELes entreprises européennes déployant des agents IA sont directement exposées aux risques d'injection de prompts indirects décrits, et les exigences de l'AI Act en matière de sécurité rendent ces outils de red-teaming et guardrails pertinents pour la conformité des déploiements enterprise en Europe.

💬 La "trilogie létale" (données non fiables, données sensibles, vecteur d'exfiltration), c'est enfin un cadre qui rend le risque d'injection de prompts lisible pour une équipe technique. Le point qui dérange : un modèle plus grand ne protège pas mieux contre ces attaques, la mise à l'échelle n'est pas un antidote. La première grosse intrusion par injection de prompts en conditions réelles arrivera, Kolter et Fredrikson le posent clairement sur la table, et les équipes qui ont déployé des agents sans red-teaming vont morfler.

SécuritéOpinion
1 source
Google adopte l'Interactions API comme interface par défaut pour ses modèles et agents Gemini
256The Decoder 

Google adopte l'Interactions API comme interface par défaut pour ses modèles et agents Gemini

Google DeepMind a officialisé l'Interactions API comme nouvelle interface par défaut pour ses modèles et agents Gemini. Ce changement architectural remplace l'ancienne API generateContent, jusqu'ici l'interface standard pour interroger les modèles Gemini via le Google AI Studio et les SDK associés. La nouvelle interface repose sur un schéma simplifié structuré autour d'étapes typées, abandonnant l'organisation précédente basée sur des rôles. Désormais, toutes les nouvelles fonctionnalités destinées aux agents seront exclusivement disponibles via cette API. Ce basculement a des conséquences directes pour les développeurs qui ont construit des applications ou des pipelines sur l'API generateContent : ils devront migrer vers le nouveau schéma pour accéder aux futures capacités. L'approche par étapes typées vise à rendre l'intégration plus claire et moins ambiguë, notamment pour les scénarios agentiques complexes où plusieurs actions s'enchaînent. En gelant les nouvelles fonctionnalités sur l'ancienne API, Google crée une pression de migration qui devrait accélérer l'adoption du nouveau standard. Ce choix s'inscrit dans une tendance de fond chez les grands fournisseurs de modèles : aligner l'interface de programmation sur les besoins des systèmes agentiques, qui nécessitent une gestion fine des états, des outils et des flux d'exécution. Google, qui fait face à une concurrence intense d'OpenAI et Anthropic sur le segment des agents IA, cherche à offrir une base technique plus cohérente pour les développeurs. L'Interactions API représente ainsi moins un simple changement d'interface qu'une réorientation stratégique de la plateforme Gemini vers les usages agentiques de nouvelle génération.

UELes développeurs européens ayant intégré l'API generateContent de Gemini dans leurs applications devront planifier une migration vers l'Interactions API pour continuer à accéder aux nouvelles fonctionnalités agentiques de Google.

OutilsOutil
1 source
Ampersend crée un modèle de paiement à l'usage pour agents IA avec Amazon Bedrock AgentCore Payments
257AWS ML Blog 

Ampersend crée un modèle de paiement à l'usage pour agents IA avec Amazon Bedrock AgentCore Payments

Ampersend, une plateforme de gestion des paiements pour agents IA développée par Edge & Node, a annoncé la mise en production d'une couche de routage pay-per-intelligence construite sur Amazon Bedrock AgentCore Payments. Le système permet à des agents autonomes de sélectionner dynamiquement un modèle de langage adapté à leur tâche, résumé de document, audit de smart contract, analyse de données on-chain, puis de régler la prestation par requête, sans intervention humaine, en s'appuyant sur le protocole ouvert x402. L'infrastructure repose sur un mécanisme en deux sauts : l'agent appelle Ampersend, qui règle ensuite le fournisseur de modèle en aval via son propre SDK. Le tout se pilote depuis un point d'intégration unique, sans abonnement distinct par fournisseur. Jusqu'ici, connecter un agent IA à des services payants réclamait des mois de travail préalable : gestion de portefeuilles cryptographiques, signature des paiements, respect des limites de dépenses, intégration avec la facturation de chaque fournisseur. Ce fardeau infrastructure freinait considérablement le déploiement d'agents en production. AgentCore Payments supprime ce prérequis en offrant une couche de gouvernance clé en main : un Payment Manager définit les règles de dépense et les connexions aux portefeuilles, tandis qu'une Payment Session ouvre un contexte d'exécution borné avant chaque run d'agent. Résultat concret pour les développeurs : ils écrivent la logique métier de l'agent sans s'occuper de la plomberie financière. Pour des plateformes comme Ampersend, c'est la possibilité d'agréger des dizaines de fournisseurs de modèles derrière une interface de paiement unique, sécurisée et auditée nativement. Ce lancement s'inscrit dans une tendance plus large : l'émergence d'une économie machine-to-machine où les agents IA deviennent des acteurs économiques à part entière, capables de consommer des APIs payantes de façon autonome. Le protocole x402, sur lequel repose l'architecture, est conçu pour des transactions programmatiques instantanées, à l'image de ce qu'HTTP fait pour les échanges de données. Amazon, avec Bedrock AgentCore, consolide sa position d'infrastructure sous-jacente pour les stacks agentiques d'entreprise, aux côtés de ses outils d'orchestration existants. Ampersend, de son côté, parie que la fragmentation du marché des modèles, OpenAI, Anthropic, modèles open source, spécialistes verticaux, rendra indispensable ce type de couche d'abstraction de paiement. Les prochaines étapes probables incluent l'extension du catalogue de modèles, des politiques de dépense plus granulaires, et l'intégration avec d'autres protocoles de paiement agentic émergents.

InfrastructureActu
1 source
Apple Private Cloud Compute : la révolution invisible qui verrouille la sécurité de l’IA
258Le Big Data 

Apple Private Cloud Compute : la révolution invisible qui verrouille la sécurité de l’IA

Apple a déployé une infrastructure cloud radicalement différente des modèles existants pour alimenter Apple Intelligence, son système d'intelligence artificielle lancé en 2024. Baptisée Private Cloud Compute (PCC), cette architecture mobilise des serveurs distants dédiés aux modèles d'IA trop lourds pour être exécutés localement sur les puces A17 Pro, A18 ou M des appareils Apple. Ces serveurs fonctionnent selon cinq principes stricts : traitement sans état (les données sont effacées de la RAM sitôt la requête traitée, sans jamais toucher un disque), verrouillage cryptographique du micrologiciel, absence totale d'accès privilégié pour les ingénieurs Apple eux-mêmes, impossibilité technique de cibler un utilisateur précis, et vérifiabilité publique de l'architecture. Apple a également ouvert récemment cette infrastructure à des développeurs tiers, leur permettant d'y déployer leurs propres modèles dans ce cadre sécurisé. L'enjeu est direct pour des centaines de millions d'utilisateurs d'iPhone, d'iPad et de Mac : les agents autonomes capables d'enchaîner des tâches complexes nécessitent des modèles dont la taille dépasse la RAM disponible sur n'importe quel smartphone, et une exécution locale viderait la batterie en quelques minutes. Sans PCC, Apple devrait choisir entre brider ces fonctionnalités ou envoyer les données des utilisateurs vers un cloud opaque, comme le font Google, Microsoft ou OpenAI. Le PCC résout cette tension en offrant une garantie mathématique et matérielle : même Apple ne peut pas lire les requêtes traitées par ses propres serveurs. Pour l'industrie, c'est un modèle alternatif crédible à l'hyperscaler classique, et une réponse concrète aux régulateurs européens qui scrutent le traitement des données personnelles dans l'IA. Ce projet s'inscrit dans la stratégie de différenciation longue d'Apple, qui a fait de la vie privée un argument commercial central depuis plusieurs années face à Google et Meta. La montée en puissance des agents IA, qui accèdent à des emails, calendriers, messages et fichiers personnels, rendait cette infrastructure indispensable : confier ces données à un serveur standard aurait représenté un risque réputationnel et réglementaire majeur. L'ouverture récente à des tiers marque une nouvelle étape, Apple cherchant à faire du PCC une plateforme en concurrence directe avec les offres de confidential computing de Google (Confidential VMs) et Microsoft (Azure Confidential Computing). La prochaine question est de savoir si les entreprises et les régulateurs accepteront ces garanties comme suffisantes, ou exigeront des audits indépendants plus poussés du code et des matériels Apple.

UELe modèle PCC d'Apple, avec ses garanties cryptographiques sur le traitement des données, pourrait constituer une réponse concrète aux exigences du RGPD et faciliter l'adoption d'Apple Intelligence par les entreprises et administrations européennes soumises aux règles strictes de protection des données personnelles.

InfrastructureOpinion
1 source
Pourquoi les entreprises à base d'agents doivent devenir des systèmes apprenants
259VentureBeat AI 

Pourquoi les entreprises à base d'agents doivent devenir des systèmes apprenants

Chaque jour, les entreprises accumulent un savoir opérationnel que leurs systèmes d'intelligence artificielle n'exploitent jamais. Un analyste en sécurité corrige une investigation générée par l'IA. Un ingénieur réseau identifie la cause d'une panne récurrente. Une équipe d'observabilité découvre qu'un enchaînement précis de latence, de logs et de modifications d'infrastructure annonce systématiquement une dégradation de service. Ces instants contiennent une connaissance organisationnelle précieuse, mais dans la grande majorité des entreprises, elle disparaît dans des tickets, des fils de discussion, des post-mortems d'incidents ou dans l'esprit de quelques experts isolés. Elle résout le problème immédiat, rarement davantage. C'est ce constat que Splunk expose dans une analyse publiée en juin 2026 sur ce qu'il appelle l'entreprise agentique apprenante. Le vrai avantage concurrentiel de la prochaine décennie ne sera pas de disposer du modèle d'IA le plus performant, beaucoup d'organisations auront accès aux mêmes modèles frontier. Il sera de savoir si les agents déployés dans les domaines de la sécurité, l'IT, le service client ou les opérations métier peuvent apprendre de l'organisation elle-même. Non pas en réentraînant continuellement le modèle sous-jacent, mais en capturant l'expérience opérationnelle, en la convertissant en connaissance institutionnelle et en la rendant accessible aux agents futurs. Un modèle ne sait pas d'emblée quelle action corrective a résolu la panne du mois dernier, quel signal réseau a précédé la dernière interruption de service, ni quelle politique interne doit prendre le pas sur une recommandation autrement plausible. Ce savoir appartient à l'entreprise, et c'est à elle de le rendre réutilisable, en enrichissant l'écosystème autour du modèle : base de connaissances, couche de récupération, prompts, guardrails et logique de routage. Pour y parvenir, chaque flux de travail agentique doit devenir une boucle de rétroaction. Un agent reçoit une requête, raisonne, appelle des outils, produit une réponse. Un humain l'accepte, la rejette ou la corrige. Les systèmes en aval révèlent si l'action a fonctionné. L'ensemble de cette chaîne est exploitable : c'est ce que l'observabilité de l'IA doit permettre de capturer, non pas seulement pour déboguer un agent, mais pour comprendre ce qu'il a appris, ce que l'humain a corrigé, et ce qui devrait changer avant le prochain événement similaire. C'est le passage du monitoring de l'IA à son enseignement. Splunk, dont la plateforme d'observabilité couvre précisément ces couches, sécurité, réseau, infrastructure, positionne cette capacité comme le fondement de l'entreprise de demain : non pas une organisation qui utilise l'IA, mais une organisation qui apprend à travers elle.

OutilsOutil
1 source
À l'ISC, JUPITER démontre les capacités de la science à l'échelle exascale
260NVIDIA AI Blog 

À l'ISC, JUPITER démontre les capacités de la science à l'échelle exascale

JUPITER, le premier supercalculateur européen à atteindre l'échelle exaflop, installé au Forschungszentrum Jülich en Allemagne, affiche une première année de résultats scientifiques majeurs. Présentés cette semaine à la conférence ISC à Hambourg, quatre projets conduits sur cette machine illustrent concrètement ce que permet le calcul à l'échelle exascale : cartographier le cerveau humain cellule par cellule, simuler le climat terrestre à une résolution d'un kilomètre, développer des systèmes d'IA pour les réseaux sans fil de prochaine génération, et émuler un ordinateur quantique universel de 50 qubits. La machine repose sur des puces NVIDIA Grace Hopper et un réseau InfiniBand Quantum-X800. Thomas Lippert, directeur du Centre de supercalcul de Jülich et professeur à l'université Goethe de Francfort, affirme que JUPITER positionne l'Europe non pas comme un suiveur de l'ère exascale, mais comme son chef de file. Deux résultats se distinguent par leur portée. Le projet Jülich Brain Atlas a produit CytoNet, un modèle fondamental entraîné sur 6,5 pétaoctets de données issues de 21 cerveaux post-mortem, en moins de cinq jours sur 4 096 puces Grace Hopper. Pour la première fois, un modèle d'IA cartographie la microarchitecture cérébrale à l'échelle cellulaire, reliant la structure de chaque cellule aux grands schémas d'organisation du cerveau. La neuroscientifique Katrin Amunts, qui dirige les travaux à l'INM-1 de Jülich, prépare désormais un agent IA capable d'interroger directement ces données, intégrant du raisonnement multimodal et un modèle de langage NVIDIA Nemotron 3 120B. Sur le front climatique, le modèle ICON, développé en collaboration entre l'ETH Zurich, le Max Planck Institute for Meteorology, le DKRZ, le JSC et NVIDIA, a remporté le Gordon Bell Prize for Climate Modelling au SC25 en novembre dernier. Tournant sur 20 480 puces Grace Hopper, ICON simule pour la première fois un système terrestre couplé, atmosphère, océan, terres, biogéochimie et cycle du carbone complet, à une résolution d'un kilomètre. En 24 heures de calcul, la machine a simulé environ 146 jours de climat réel, un record mondial. Ces avancées s'inscrivent dans une course mondiale à la puissance de calcul scientifique où l'Europe a longtemps accusé un retard face aux États-Unis et à la Chine. JUPITER comble cet écart en offrant à la communauté scientifique européenne un outil capable de traiter des problèmes auparavant hors de portée, qu'il s'agisse de la connectivité 6G, des maladies neurodégénératives ou du changement climatique. La concentration de disciplines aussi diverses sur une seule infrastructure marque un tournant : le supercalcul ne sert plus uniquement la physique des particules ou la météorologie, mais devient un substrat commun pour toutes les sciences de pointe. Les prochaines étapes pour plusieurs équipes incluent l'intégration d'agents IA autonomes capables de conduire eux-mêmes des expériences scientifiques, ouvrant la voie à une recherche partiellement automatisée à très grande échelle.

UEJUPITER, financé par EuroHPC et installé à Jülich (Allemagne), positionne l'UE comme leader mondial du calcul exascale, offrant à la communauté scientifique européenne une infrastructure de pointe pour la recherche en neurosciences, climatologie et IA souveraine.

💬 L'Europe qu'on moque pour ses règlements vient de cartographier le cerveau humain cellule par cellule et de simuler le climat à un kilomètre de résolution, en moins d'une semaine de calcul. JUPITER, c'est la preuve que la souveraineté numérique européenne ne passe pas que par des textes de loi, mais aussi par des machines capables de faire tourner de la science que personne d'autre ne peut faire. Bon, faut qu'ils gardent l'avance maintenant.

InfrastructureActu
1 source
Claude Mythos a piraté la « quasi-totalité des systèmes classifiés » de la NSA en « quelques heures », mais c’était un test
26101net 

Claude Mythos a piraté la « quasi-totalité des systèmes classifiés » de la NSA en « quelques heures », mais c’était un test

Mythos, le modèle d'intelligence artificielle développé par Anthropic et spécialement conçu pour la détection de failles de sécurité, a réussi à compromettre la quasi-totalité des systèmes classifiés de la National Security Agency (NSA) en quelques heures seulement. L'exercice s'est déroulé dans un cadre strictement contrôlé, sous la supervision directe des agences fédérales américaines, qui avaient elles-mêmes organisé ce test de pénétration pour évaluer les capacités offensives des modèles d'IA de nouvelle génération. Les résultats ont immédiatement déclenché une onde de choc sur les réseaux sociaux, où l'information, sortie de son contexte opérationnel, a semé la confusion et alimenté une vague de panique. Pour la communauté de la cybersécurité, ces performances signalent un saut qualitatif majeur : jamais un système automatisé n'avait démontré une telle efficacité contre des infrastructures de renseignement aussi renforcées, soulevant des questions urgentes sur la vulnérabilité des systèmes d'information sensibles face à des agents IA autonomes. Cette démonstration relance un débat politique brûlant aux États-Unis. L'administration Trump a récemment décidé de suspendre le déploiement de Claude Fable 5 et de Mythos 5, deux modèles Anthropic de dernière génération, sans en expliquer pleinement les raisons. Les résultats du test NSA donnent désormais une lecture possible à cette décision, suggérant que Washington cherche à maîtriser la diffusion de capacités offensives jugées trop puissantes, alors que la frontière entre outil défensif et arme cyber devient de plus en plus poreuse.

UELes capacités offensives autonomes démontrées contre des infrastructures de renseignement renforcées relancent les débats sur la résilience des systèmes d'information sensibles européens face aux agents IA de nouvelle génération.

SécuritéActu
1 source
Les 7 types de mémoire des agents IA : guide technique pour les ingénieurs
262MarkTechPost 

Les 7 types de mémoire des agents IA : guide technique pour les ingénieurs

Les grands modèles de langage sont sans mémoire par défaut : chaque appel à l'API repart de zéro, sans souvenir de l'échange précédent. Cette limitation, acceptable pour une simple question, devient un obstacle dès qu'on construit un agent capable de planifier, d'appeler des outils et d'opérer sur plusieurs étapes. Pour combler ce vide, les ingénieurs en IA ont identifié sept types de mémoire distincts, chacun répondant à un besoin précis. La mémoire de travail, ou mémoire en contexte, correspond à tout ce que le modèle voit dans sa fenêtre de contexte à un instant donné : le prompt système, les messages récents, les résultats d'outils. C'est la RAM de l'agent, rapide mais éphémère et limitée en taille. La mémoire sémantique stocke quant à elle des faits et préférences durables dans une base externe, comme "cet utilisateur préfère Python à JavaScript". La mémoire épisodique journalise les événements passés, les conversations entières et les résultats de tâches, permettant à des systèmes comme Reflexion ou ExpeL d'écrire des bilans post-tâche et d'en tirer des leçons pour les exécutions suivantes. Ces distinctions ne sont pas purement académiques : elles déterminent concrètement les performances et le coût des systèmes agentiques en production. La mémoire procédurale encode les savoir-faire, les workflows et les règles comportementales, ce qui évite à un agent de support de raisonner à nouveau chaque réinitialisation de mot de passe après en avoir traité cent. La mémoire externe ou de récupération repose sur une base vectorielle interrogée à l'inférence par similarité, c'est le principe du RAG appliqué à l'historique de l'agent : la qualité de la recherche devient rapidement le goulot d'étranglement. La mémoire paramétrique, elle, est figée dans les poids du modèle lors de l'entraînement, inaccessible à la mise à jour en temps réel. Enfin, la mémoire prospective gère les intentions futures et les objectifs planifiés mais non encore exécutés, indispensable pour les agents à planification longue qui, sans elle, oublient leurs propres engagements. Cette taxonomie émerge à mesure que les agents IA passent des démonstrateurs de laboratoire aux systèmes opérationnels dans les entreprises. Les frameworks comme LangChain, LlamaIndex ou AutoGPT intègrent désormais plusieurs de ces couches simultanément, mais sans architecture mémoire explicite, les agents accumulent les erreurs, répètent les mêmes échecs et perdent le fil sur des tâches longues. Le choix de la combinaison mémoire dépend du cas d'usage : un agent de service client n'a pas les mêmes besoins qu'un assistant de recherche scientifique multi-session. À mesure que les fenêtres de contexte s'allongent, certains types comme la mémoire de récupération externe pourraient fusionner avec la mémoire de travail, redessinant profondément l'architecture des agents de demain.

💬 Sept types de mémoire, ça paraît beaucoup jusqu'à ce que ton agent oublie ses propres objectifs à mi-tâche. La vraie valeur de cette taxonomie, c'est qu'elle force à traiter la mémoire comme une décision d'architecture, pas une base vectorielle branchée au dernier moment faute de mieux. C'est le genre de clarification qui manquait depuis que tout le monde se met à construire des agents sans vraiment comprendre pourquoi ils déraillent.

LLMsOutil
1 source
7 000 serveurs Langflow sous attaque : LangGraph et LangChain présentent les mêmes failles
263VentureBeat AI 

7 000 serveurs Langflow sous attaque : LangGraph et LangChain présentent les mêmes failles

Sept mille serveurs Langflow sont actuellement ciblés par des attaquants exploitant une vulnérabilité critique dans ce framework de création d'agents IA. La faille, identifiée sous le code CVE-2026-5027 et notée 8,8 sur 10 selon l'échelle CVSS, réside dans l'endpoint POST /api/v2/files de Langflow : le nom de fichier transmis lors d'un upload est accepté sans aucun assainissement, permettant d'écrire un fichier n'importe où sur le serveur, par exemple une tâche planifiée dans /etc/cron.d/. Langflow activant par défaut la connexion automatique, aucune authentification n'est requise pour exploiter la faille. La chercheuse Caitlin Condon de VulnCheck a confirmé des exploitations actives le 9 juin 2026, avec des fichiers-tests déposés sur des machines victimes. Deux autres frameworks sont également touchés : Check Point Research a mis au jour dans LangGraph une chaîne partant d'une injection SQL dans le checkpointer SQLite (CVE-2025-67644, CVSS 7.3) pour aboutir à une exécution de code à distance via un décodeur msgpack vulnérable (CVE-2026-28277, CVSS 6.8), ainsi qu'un troisième vecteur sur le checkpointer Redis (CVE-2026-27022, CVSS 6.5). Cyera a par ailleurs documenté une traversée de chemin dans le chargeur de prompts de LangChain-core, permettant de lire des secrets stockés sur disque. L'enjeu dépasse la simple mise à jour logicielle. Ces frameworks, LangGraph à lui seul dépasse 50 millions de téléchargements mensuels, sont devenus en quelques mois une infrastructure de production critique : ils stockent l'état d'exécution des agents, gèrent les uploads de fichiers, chargent des configurations de prompts et concentrent les credentials donnant accès aux bases de données, aux CRM et aux API internes. Une clé OpenAI compromise ou un token CRM exfiltré produit un rayon de destruction bien au-delà du seul serveur touché. Les outils de sécurité traditionnels, qu'il s'agisse de solutions réseau ou d'analyse de processus, n'ont pas été conçus pour surveiller un framework importé comme un périmètre à défendre, laissant précisément ces couches sans protection adéquate. Ce qui est frappant dans ces trois incidents, c'est qu'ils partagent la même classe de bug : injection SQL et traversée de chemin, des vulnérabilités documentées depuis des décennies, réappliquées à des outils d'IA dont le déploiement a largement devancé la sécurisation. La course à l'adoption en production a créé une surface d'attaque vaste et peu contrôlée. Pour LangGraph, les correctifs sont disponibles immédiatement : langgraph-checkpoint-sqlite doit passer en version 3.0.1, langgraph en 1.0.10, et langgraph-checkpoint-redis en 1.0.2. Pour Langflow, la priorité est d'interdire toute exposition publique sans authentification forcée. La publication d'un proof-of-concept fonctionnel par Check Point pour LangGraph, combinée aux exploitations déjà constatées sur Langflow, laisse peu de marge aux équipes pour réagir.

UELes développeurs et entreprises européens déployant LangFlow, LangGraph ou LangChain en production doivent appliquer les correctifs en urgence : des exploitations actives permettent d'exfiltrer credentials et secrets donnant accès aux bases de données, CRM et APIs internes.

💬 Honnêtement, ça va plus loin qu'une simple faille logicielle. Langflow, LangGraph et LangChain, autant que les 7 000 serveurs en question, sont devenus une infrastructure critique pour stocker des agents IA et des secrets d'accès. Une clé OpenAI ou un token CRM compromis, c'est la porte ouverte à une cascade de problèmes bien au-delà d'un simple serveur touché. Les outils de sécurité traditionnels ne sont pas faits pour surveiller ces frameworks importés comme des périmètres à défendre, c'est un problème. Et la course à l'adoption en production a créé une surface d'attaque immense et mal contrôlée. Les correctifs sont disponibles pour LangGraph, mais pour Langflow, c'est surtout urgent de blinder toute exposition publique sans authentification forcée. Avec des exploitations déjà constatées, les équipes ont peu de marge pour réagir.

SécuritéActu
1 source
e2e-assure lance Cumulo, seul SOC souverain zero-day piloté par IA au Royaume-Uni pour les environnements IT et OT
264AI News 

e2e-assure lance Cumulo, seul SOC souverain zero-day piloté par IA au Royaume-Uni pour les environnements IT et OT

La société britannique e2e-assure, spécialisée dans les services de centre opérationnel de sécurité (SOC), a lancé le 19 juin 2026 une version majeure de sa plateforme Cumulo, présentée comme le seul SOC souverain britannique entièrement piloté par intelligence artificielle pour les environnements IT et OT (technologies opérationnelles). Développée à Abingdon, en Angleterre, Cumulo intègre des jumeaux numériques de chaque environnement client, des modèles de langage déployés localement dans des infrastructures souveraines, et un mécanisme dit de « SOC zéro-jour » qui applique instantanément les nouvelles informations sur les menaces sous forme de règles de détection, sans délai de configuration. La plateforme maintient le SIEM comme registre déterministe de référence, tandis que l'IA opère en couche parallèle, construisant du contexte en continu à mesure que les données de sécurité sont générées. Les équipes habilitées SC (habilitation de sécurité britannique) restent au cœur de chaque décision, dans une architecture explicitement « humain dans la boucle ». Cette initiative répond directement à l'appel lancé par Anne Keast-Butler, directrice du GCHQ, en faveur d'une nouvelle capacité nationale de cyberdéfense intégrant « une IA agentique de pointe à vitesse machine ». Pour les organisations gérant des infrastructures critiques nationales, énergie, eau, transport, télécommunications, services gouvernementaux, la souveraineté des données n'est pas simplement une contrainte réglementaire : c'est une nécessité opérationnelle. En exécutant l'inférence dans des infrastructures contrôlées par le client, Cumulo élimine la dépendance aux services cloud tiers, dont la disponibilité peut être soumise à des restrictions extérieures. La capacité à simuler des attaques en toute sécurité via le jumeau numérique est particulièrement précieuse dans les environnements OT, où les tests en conditions réelles présentent des risques opérationnels inacceptables. Le lancement de Cumulo s'inscrit dans un contexte de transformation profonde du marché de la cybersécurité, où les adversaires exploitent désormais des outils d'IA pour opérer à des vitesses que les SOC traditionnels, fondés sur le triage séquentiel des alertes et l'investigation rétrospective, ne peuvent plus suivre. Rob Demain, PDG d'e2e-assure, résume la rupture : les architectures héritées forcent l'IA à reconstruire le contexte après coup, là où Cumulo le maintient en permanence. La plateforme cible un marché où la convergence IT/OT crée des surfaces d'attaque inédites, notamment dans les secteurs industriels encore peu couverts par des outils de détection modernes. La réponse de l'écosystème britannique, entre ambitions de souveraineté technologique post-Brexit et pression croissante sur les opérateurs d'importance vitale, devrait déterminer si ce positionnement souverain devient un avantage compétitif durable ou reste une niche réglementaire.

UELe modèle de SOC souverain piloté par IA pour infrastructures critiques rejoint les préoccupations européennes portées par la directive NIS2, mais la solution cible exclusivement le cadre réglementaire et les habilitations britanniques post-Brexit, sans vocation à s'étendre au marché européen.

💬 Simuler des attaques sur un jumeau numérique OT plutôt qu'en prod, c'est la pièce qui manquait depuis des années pour les secteurs énergie, eau, industrie. Sur ce point, e2e-assure à un argument que peu de concurrents peuvent contrer. Dommage que le tout reste confiné au cadre réglementaire britannique post-Brexit, parce que NIS2 crée exactement cette demande côté UE et personne n'y a encore répondu.

SécuritéActu
1 source
☕️ L’Estonie veut attribuer une identité numérique à chaque agent IA
265Next INpact 

☕️ L’Estonie veut attribuer une identité numérique à chaque agent IA

L'Estonie va créer un système d'identité numérique spécifiquement destiné aux agents IA. Kristen Michal, Premier ministre du pays balte, a annoncé la mise en place d'un « code d'identification personnel pour l'intelligence artificielle ». Concrètement, chaque agent IA agissant au nom d'un particulier ou d'une organisation recevra une identité traçable, assortie de droits précisément définis : il pourra être autorisé à consulter des données, préparer un document ou effectuer des actions dans un cadre financier déterminé. L'objectif déclaré est de répondre à trois questions fondamentales : qui agit, pour le compte de qui, et qui porte la responsabilité des actions effectuées. Il ne s'agit pas d'attribuer une personnalité juridique aux agents IA ni de leur conférer un statut légal propre, mais de formaliser leur périmètre d'action dans l'espace numérique estonien, notamment pour les démarches administratives et les services publics. L'enjeu principal est la traçabilité des actions que les agents IA effectuent au nom d'humains dans des contextes de plus en plus sensibles : rédaction de rapports, préparation de déclarations fiscales, communication avec des systèmes d'information officiels. Aujourd'hui, dans les entreprises, les agents IA disposent généralement d'accès restreints à l'infrastructure, et les principaux fournisseurs ont mis en place des mécanismes de journalisation et d'approbation. Mais ces garde-fous restent confinés aux systèmes privés. Le modèle estonien vise à étendre cette logique aux services publics, où la responsabilité est encore plus engagée. Pour Michal, un utilisateur ne devrait jamais être contraint d'accorder à son assistant IA un accès complet à l'ensemble de ses droits, services et données personnelles. Le système permettrait au contraire des délégations granulaires et auditables. L'Estonie est particulièrement bien placée pour porter cette initiative. Depuis les années 2000, le pays a bâti une infrastructure numérique unique en Europe : carte d'identité électronique adoptée par l'ensemble de la population, signature numérique légalement reconnue, et X-Road, le réseau sécurisé qui interconnecte les services publics estoniens et a inspiré des projets similaires dans plusieurs pays. C'est cette maturité technique qui rend le projet crédible là où il ne serait qu'un concept ailleurs. Michal présente explicitement l'initiative comme une opportunité pour son pays de définir un standard international sur la traçabilité des agents IA, un espace encore totalement non régulé à l'échelle mondiale. Alors que les agents autonomes commencent à agir de façon concrète dans des domaines jusqu'ici réservés aux humains, la question de leur identité et de leur responsabilité devient urgente pour les gouvernements, les entreprises et les citoyens.

UEEn tant que premier État membre de l'UE à formaliser l'identité numérique des agents IA, l'Estonie pourrait établir un standard qui influencera la réglementation européenne sur la traçabilité et la délégation de responsabilité des agents autonomes dans les services publics.

💬 C'est le genre d'initiative qui aurait l'air gadget ailleurs, mais l'Estonie a l'infrastructure pour en faire quelque chose de réel. Un identifiant traçable par agent IA, des droits délégués au périmètre près : ça répond enfin à la question que tout le monde esquive, qui porte la responsabilité quand un agent agit à ta place dans un système public. Si ça devient un standard européen, on aura résolu quelque chose d'assez fondamental sans que les grosses capitales y aient pensé en premier.

RégulationReglementation
1 source
Amazon Bedrock Guardrails : protégez vos applications IA à base d'agents avec l'API InvokeGuardrailChecks
266AWS ML Blog 

Amazon Bedrock Guardrails : protégez vos applications IA à base d'agents avec l'API InvokeGuardrailChecks

Amazon Web Services a annoncé une nouvelle interface de programmation pour son service Amazon Bedrock Guardrails : l'API InvokeGuardrailChecks. Disponible dès à présent, elle permet aux développeurs d'appliquer des contrôles de sécurité individuels à n'importe quel point d'une application d'IA agentique, sans avoir à créer et gérer des ressources de guardrail dédiées en amont. Concrètement, l'API fonctionne en mode détection seule et retourne des scores numériques pour chaque vérification effectuée. Les équipes peuvent ensuite définir leurs propres seuils et décider de bloquer, contourner, relancer ou journaliser les résultats selon leurs besoins spécifiques. Cette annonce répond à un problème concret posé par les agents IA modernes, qui fonctionnent en boucles multi-tours plutôt qu'en simples échanges question-réponse. Une session utilisateur peut enchaîner dix, vingt interactions ou davantage, chacune présentant un profil de risque distinct : injection de prompt à l'entrée, contenu nuisible dans la réponse du modèle, données personnelles exposées dans un message de suivi. Jusqu'ici, sécuriser chaque étape de cette boucle supposait de provisionner des ressources de guardrail séparées pour chaque étape, une complexité opérationnelle qui devient ingérable à mesure qu'une organisation déploie des centaines d'agents. L'API InvokeGuardrailChecks supprime cette friction en offrant un contrôle granulaire, requête par requête, sur les vérifications à activer à chaque tour de boucle, sans identifiant de guardrail à suivre ni version à maintenir. Amazon Bedrock Guardrails existe depuis que l'entreprise a cherché à doter sa plateforme de services IA managés de mécanismes de filtrage du contenu, pour protéger aussi bien les entrées utilisateurs que les sorties des modèles fondamentaux. L'essor des architectures agentiques, où des modèles comme ceux d'Anthropic, Meta ou Mistral orchestrent des outils et prennent des décisions en autonomie, a rendu les approches de sécurité monolithiques insuffisantes. Le nouveau schéma de messages structuré, qui attribue un rôle explicite (système, utilisateur, assistant) à chaque bloc de contenu, permet aux vérifications de prendre en compte le contexte précis de chaque interaction dans la boucle. La prochaine étape pour AWS sera vraisemblablement d'étendre la liste des vérifications supportées et d'intégrer l'API plus étroitement avec les frameworks d'orchestration d'agents comme LangChain ou Amazon Bedrock Agents, alors que la sécurité des systèmes autonomes s'impose comme l'un des défis centraux de l'industrie pour 2026.

UELes développeurs européens utilisant Amazon Bedrock peuvent intégrer dès maintenant ces contrôles de sécurité granulaires dans leurs agents IA, ce qui facilite la conformité aux exigences de supervision humaine et de gestion des risques imposées par l'AI Act.

SécuritéOpinion
1 source
Les modèles Gemma 4 arrivent sur Amazon Bedrock
267AWS ML Blog 

Les modèles Gemma 4 arrivent sur Amazon Bedrock

Amazon Web Services vient d'annoncer la disponibilité de la famille Gemma 4 sur Amazon Bedrock, le service managé de modèles d'intelligence artificielle du géant du cloud. Développés par Google DeepMind et publiés sous licence Apache 2.0, ces modèles open-weight sont déclinés en trois variantes : Gemma 4 31B, un modèle dense de 30,7 milliards de paramètres ; Gemma 4 26B-A4B, une architecture de type mixture-of-experts (MoE) avec seulement 3,8 milliards de paramètres actifs par requête sur 25,2 milliards au total ; et Gemma 4 E2B, un modèle compact de 2,3 milliards de paramètres effectifs. Tous supportent une fenêtre de contexte de 256 000 tokens (128 000 pour le modèle compact), un mode de raisonnement intégré, l'appel natif de fonctions pour les workflows agentiques, et des entrées multimodales combinant texte et image. Selon Artificial Analysis, le modèle Gemma 4 31B affiche un Intelligence Index de 39, soit bien au-dessus de la médiane de 15 pour la catégorie des modèles open-weight entre 4 et 40 milliards de paramètres. L'intégration de Gemma 4 dans Bedrock répond à une tension bien connue des entreprises adoptant des modèles open-weight en production : accéder aux meilleurs modèles disponibles tout en maintenant un contrôle total sur leurs données, leur conformité réglementaire et leur infrastructure. Disponibles via trois niveaux de service (Standard, Priority et Flex), ces modèles s'exécutent entièrement sur l'infrastructure AWS, sans que les prompts ou les réponses ne soient utilisés pour entraîner d'autres modèles ni partagés avec des tiers. Les équipes peuvent ainsi construire des agents multimodaux, des pipelines de traitement documentaire ou des assistants au développement logiciel, avec une prise en charge native de plus de 35 langues et un pré-entraînement sur plus de 140 langues. Cette annonce s'inscrit dans la compétition croissante entre les fournisseurs cloud pour proposer les meilleurs modèles open-weight sur leurs plateformes managées, en rivalité directe avec Microsoft Azure et Google Cloud. Google DeepMind continue de déployer la gamme Gemma comme levier stratégique pour étendre son influence dans l'écosystème IA sans passer uniquement par son propre cloud. Pour AWS, distribuer Gemma 4 sur Bedrock renforce son catalogue de modèles fondateurs sans investissement en R&D propre, tout en captant les entreprises qui préfèrent la flexibilité open-weight à des modèles propriétaires comme Claude ou Titan. La nature open-weight de la famille Gemma permet en outre aux organisations d'auditer l'architecture, de benchmarker sur leurs propres données et de fine-tuner les modèles selon leurs besoins, une capacité que les modèles fermés n'offrent pas.

UELes entreprises européennes sur AWS peuvent désormais déployer Gemma 4 avec des garanties de conformité RGPD, les prompts n'étant ni utilisés pour l'entraînement ni partagés avec des tiers.

LLMsOpinion
1 source
Visa s’associe à OpenAI pour automatiser les paiements via l’IA
268Le Big Data 

Visa s’associe à OpenAI pour automatiser les paiements via l’IA

Visa et OpenAI ont annoncé le 10 juin 2026 un partenariat visant à intégrer les capacités de paiement directement dans les expériences pilotées par des agents IA. Présenté lors du Visa Payments Forum à San Francisco, l'accord s'inscrit dans le programme "Visa Intelligent Commerce", conçu pour étendre le réseau mondial de paiement de Visa à de nouveaux environnements numériques. Concrètement, les solutions de paiement de Visa seront intégrées aux plateformes d'OpenAI, dont ChatGPT et Codex, permettant à des agents IA de réaliser des transactions complètes, de la sélection d'un produit jusqu'au règlement final. Les développeurs et commerçants pourront accepter ces paiements sans avoir à construire eux-mêmes les couches de sécurité, d'authentification et de gestion des risques. Visa a également mentionné un volume de règlement en stablecoins d'environ 7 milliards de dollars annualisés, signalant une ambition qui dépasse le seul partenariat avec OpenAI. Pour les entreprises et les consommateurs, ce changement est structurel. Jusqu'ici, les assistants conversationnels se limitaient à rechercher des informations, comparer des produits ou formuler des recommandations. Avec cette intégration, ils pourront agir : initier et finaliser une transaction en temps réel, en respectant des règles prédéfinies telles que des plafonds de dépenses, des catégories de marchands autorisées ou des mécanismes d'approbation avant validation. Pour garantir la confiance, Visa apporte ses technologies de tokenisation, d'autorisation en temps réel et ses systèmes de détection de fraudes, afin que chaque opération respecte les mêmes standards que les paiements numériques traditionnels. Les commerçants pourraient bénéficier de parcours d'achat plus rapides et d'une réduction des abandons de panier, tandis que les développeurs accèderont à une infrastructure prête à l'emploi pour monétiser leurs applications IA sans friction. Ce partenariat reflète une transformation plus profonde du secteur des paiements. Visa cherche à s'implanter dans les nouveaux environnements numériques dominés par l'IA générative, bien au-delà des cartes et terminaux classiques. OpenAI, de son côté, fait évoluer ChatGPT d'un outil de productivité vers une plateforme commerciale à part entière. Jack Forestell, directeur des produits et de la stratégie chez Visa, a estimé que "l'IA pourrait transformer le commerce de manière encore plus profonde que l'internet ou les technologies mobiles", illustrant l'ampleur des ambitions des deux groupes. La course à ce positionnement est ouverte : Mastercard, Stripe et les grandes plateformes technologiques comme Google, Apple et Amazon travaillent sur des intégrations similaires. La vraie question sera celle de l'acceptabilité : jusqu'où les utilisateurs accepteront-ils de déléguer des décisions financières à des agents automatisés ?

UELes marchands européens connectés au réseau Visa pourront accepter des paiements initiés par agents IA sans développement supplémentaire, mais ce modèle transactionnel inédit soulève des questions de conformité avec le cadre réglementaire européen (PSD2, AI Act, DSA) qui n'est pas encore adapté aux flux financiers automatisés.

💬 Visa joue un coup malin : plutôt que d'attendre que les agents IA grignotent son marché, elle s'impose comme la couche de paiement de l'internet agentique. OpenAI gagne une infrastructure bancaire sans la construire, Visa se glisse dans chaque nouvel usage numérique. Bon, en Europe ça va se compliquer, parce que PSD2 et AI Act n'ont vraiment pas été écrits pour des agents qui dépensent ton argent tout seuls.

BusinessActu
1 source
Cohere lance North Mini Code, un modèle MoE open-weight de 30B paramètres (3B actifs) pour le codage par agents autonomes
269MarkTechPost 

Cohere lance North Mini Code, un modèle MoE open-weight de 30B paramètres (3B actifs) pour le codage par agents autonomes

Cohere a lancé cette semaine North Mini Code, son premier modèle de code destiné aux développeurs. Il s'agit d'un modèle à mixture d'experts (MoE) de 30 milliards de paramètres totaux, dont seulement 3 milliards s'activent à chaque passage, ce qui le rend à la fois compact et performant. Le modèle supporte une fenêtre de contexte de 256 000 tokens avec une génération maximale de 64 000 tokens, et tourne sur un minimum d'un GPU H100 en FP8. Les poids sont publiés sous licence Apache 2.0 sur Hugging Face, et le modèle est également accessible via l'API Cohere, le Model Vault et OpenRouter. Sur les benchmarks, il obtient un score de 33,4 sur l'Artificial Analysis Coding Index, et a été évalué sur SWE-Bench Verified, SWE-Bench Pro, Terminal-Bench v2, SciCode et LiveCodeBench v6, avec trois passes par benchmark pour fiabiliser les résultats. L'intérêt principal de North Mini Code réside dans son efficacité opérationnelle : en tests internes, il atteint un débit de sortie jusqu'à 2,8 fois supérieur à celui de Devstral Small 2, à matériel et concurrence identiques, avec une latence inter-token améliorée de 30 %. Ce profil permet aux équipes de l'héberger elles-mêmes sans infrastructure GPU massive, ce que Cohere appelle l'IA "souveraine". Concrètement, il couvre trois usages principaux : la génération de code, l'ingénierie logicielle agentique (où un agent principal délègue des sous-tâches à des assistants spécialisés), et les tâches terminal comme lancer des builds ou parser des sorties. Il prend également en charge le "thinking" intercalé et l'utilisation native d'outils, ce qui l'inscrit directement dans les architectures multi-agents modernes. Ce lancement s'inscrit dans une tendance de fond : la prolifération des petits modèles spécialisés capables de rivaliser avec des systèmes bien plus lourds sur des tâches précises. L'architecture choisie, un transformer décodeur avec couches MoE parcimonieuses, 128 experts par bloc feed-forward dont 8 activés par token, et une attention mixant sliding-window et globale dans un ratio 3:1, est typique des designs qui optimisent le ratio capacité/coût de calcul. Cohere concurrence directement Mistral (Devstral) et d'autres acteurs du codage agentique open-weight, dans un marché où les entreprises cherchent à conserver la maîtrise de leur infrastructure IA sans sacrifier la puissance. Le fait que North Mini Code soit entraîné en deux phases, fine-tuning supervisé en cascade puis apprentissage par renforcement à récompenses vérifiables (RLVR), reflète la maturité croissante des pipelines post-entraînement pour les tâches d'ingénierie logicielle autonome.

UELes entreprises et développeurs européens peuvent adopter ce modèle open-weight sous licence Apache 2.0 en auto-hébergement sur un seul GPU H100, en cohérence avec les objectifs de souveraineté numérique défendus par l'UE.

LLMsOpinion
1 source
Les robotaxis doivent intégrer la sécurité dès la conception, pas l'ajouter après coup
270NVIDIA AI Blog 

Les robotaxis doivent intégrer la sécurité dès la conception, pas l'ajouter après coup

Lors de la conférence NVIDIA GTC Taipei, plusieurs partenariats majeurs ont été annoncés pour accélérer le déploiement commercial de véhicules autonomes de niveau 4. Uber et Autobrains lancent conjointement un programme de robotaxis à Munich sur la plateforme NVIDIA DRIVE Hyperion, s'appuyant sur l'IA agentique d'Autobrains pour des opérations à grande échelle. Foxconn étend sa collaboration avec NVIDIA pour déployer des flottes de robotaxis à Taïwan, tandis que VinFast cible l'Asie du Sud-Est avec des véhicules construits sur la même plateforme. En parallèle, HUMAIN, acteur saoudien, prépare l'arrivée de robotaxis alimentés par DRIVE Hyperion au Moyen-Orient. Ces annonces illustrent un secteur qui a franchi le cap des prototypes pour entrer dans la phase d'exploitation commerciale réelle, avec des services déjà opérationnels dans des dizaines de villes à travers le monde. Cette expansion accélérée soulève une question centrale que régulateurs et ingénieurs ne peuvent plus différer : comment garantir la sécurité de ces systèmes à l'échelle industrielle ? Les autorités de certification ne se contentent plus d'évaluer ce qu'un véhicule perçoit ou décide, elles exigent la preuve que l'ensemble du système se comporte de manière prévisible, isole les défaillances avant qu'elles ne s'aggravent, et ne sort jamais des limites pour lesquelles il a été conçu. Quatre défis doivent être résolus simultanément : un système d'exploitation certifiable pour la sécurité, des interfaces matérielles et logicielles standardisées, une IA fonctionnant dans des garde-fous vérifiables, et une validation à grande échelle avant tout contact avec la voie publique. C'est précisément pour répondre à ces exigences que NVIDIA a introduit le Halos Operating System, composant central de son système de sécurité full-stack Halos. Ce nouveau système repose sur trois éléments. Halos Core constitue la fondation certifiée : il s'agit de la prochaine génération de DriveOS, conforme à la norme ISO 26262 ASIL D, le niveau le plus élevé de sécurité fonctionnelle automobile, avec un hyperviseur qui isole les fonctions critiques pour éviter qu'une défaillance n'atteigne les commandes du véhicule. Il intègre également le support certifié de CUDA et TensorRT, ainsi qu'un framework open source pour l'inférence de grands modèles de langage embarqués. Halos SDK, deuxième couche, standardise les interfaces entre capteurs (caméras, radars, lidars) et le reste du véhicule, supprimant la nécessité de reconstruire manuellement les intégrations à chaque changement matériel. Il fournit aussi un ordonnanceur déterministe, une communication inter-processus à copie zéro pour minimiser la latence, et un système de gestion des erreurs robuste. Dans un contexte où l'industrie des robotaxis cherche à convaincre régulateurs et grand public que la sécurité est intégrée dès la conception, et non ajoutée après coup, ce type d'infrastructure logicielle certifiée devient un prérequis incontournable pour toute opération commerciale viable.

UELe lancement des robotaxis Uber-Autobrains à Munich constitue la première opération commerciale de niveau 4 annoncée en Europe, ce qui est susceptible d'accélérer l'élaboration d'un cadre réglementaire européen pour les véhicules autonomes.

RobotiqueActu
1 source
Microsoft Discovery en disponibilité générale sur Azure, alimentant l'IA à base d'agents de la puce quantique Majorana 2
271InfoQ AI 

Microsoft Discovery en disponibilité générale sur Azure, alimentant l'IA à base d'agents de la puce quantique Majorana 2

Microsoft a annoncé la disponibilité générale de Microsoft Discovery, sa plateforme Azure dédiée au déploiement d'équipes d'agents IA autonomes pour la recherche scientifique. C'est cette même plateforme qui a piloté le développement de Majorana 2, une puce quantique topologique affichant une fiabilité multipliée par 1 000 par rapport aux générations précédentes, avec des durées de vie de qubits atteignant 20 secondes. Microsoft fixe désormais à 2029 l'horizon d'un ordinateur quantique opérationnel à grande échelle, soit deux fois plus tôt que son calendrier initial. L'enjeu est considérable : un ordinateur quantique suffisamment fiable permettrait de résoudre des problèmes inaccessibles aux supercalculateurs classiques, notamment en chimie moléculaire, en cryptographie ou en optimisation logistique. En mettant ses agents IA au service de la conception de hardware quantique, Microsoft franchit une étape symbolique forte : l'IA ne se contente plus d'assister les chercheurs humains, elle orchestre elle-même des cycles d'expérimentation scientifique bout en bout. La course au quantique s'intensifie avec Google, IBM et plusieurs startups comme IonQ ou PsiQuantum comme principaux concurrents. Microsoft mise sur une architecture topologique reposant sur les qubits de Majorana, jugés intrinsèquement plus stables que les qubits supraconducteurs privilégiés par ses rivaux. La combinaison de cette approche matérielle distinctive et d'une plateforme IA agentique directement accessible sur Azure positionne Microsoft comme un acteur à double avantage dans la prochaine phase de la compétition quantique mondiale.

UELa disponibilité sur Azure en Europe donne aux laboratoires et entreprises de recherche de l'UE un accès à cette plateforme d'IA agentique pour la recherche scientifique, sans impact réglementaire ou institutionnel direct pour la France.

InfrastructureActu
1 source
Le piratage de Meta révèle que la sécurité de l'IA va au-delà de Mythos
272MIT Technology Review 

Le piratage de Meta révèle que la sécurité de l'IA va au-delà de Mythos

Le 5 juin 2026, le média 404 Media révélait qu'une faille dans l'agent de support client basé sur l'IA de Meta avait permis à des pirates de s'emparer de comptes Instagram. La méthode était d'une simplicité déconcertante : les attaquants demandaient directement à l'agent de lier les comptes visés à des adresses e-mail qu'ils contrôlaient, et l'agent s'exécutait. Le seul obstacle technique consistait à utiliser un VPN affichant la localisation du propriétaire légitime du compte. Parmi les victimes, le compte officiel "Obama White House", resté inactif depuis des années, a été détourné pour diffuser des publications pro-iranniennes. D'autres comptes aux pseudonymes courts et rares, très prisés sur le marché noir, ont également été volés, vraisemblablement pour être revendus. Meta n'a pas expliqué publiquement comment cette vulnérabilité avait échappé à ses équipes, mais un porte-parole a indiqué lundi sur X que la faille avait été corrigée. Cette affaire illustre une catégorie de risques souvent sous-estimée dans le débat sur la sécurité de l'IA : non pas les systèmes d'IA utilisés comme armes offensives, mais les agents IA eux-mêmes comme cibles. Contrairement à un agent humain qui aurait probablement posé des questions de sécurité avant de modifier une adresse e-mail sensible, l'agent de Meta a suivi la demande sans résistance. "C'est presque comme un écolier qui veut juste faire plaisir au professeur", résume Somesh Jha, professeur en informatique à l'Université du Wisconsin-Madison. Jessica Ji, chercheuse au Center for Security and Emerging Technology de Georgetown, souligne l'aspect particulièrement troublant de cette négligence venant d'une entreprise disposant d'une expertise reconnue en cybersécurité et en IA. "Cela soulève des questions : y avait-il seulement des garde-fous en place ? A-t-on même pensé à tester ce type de scénario ?" La faille de Meta s'inscrit dans un contexte plus large d'inquiétudes croissantes autour de la sécurité des agents IA. En avril 2026, Anthropic avait reconnu que son modèle Mythos était trop performant en matière de piratage pour être diffusé au grand public, alimentant les craintes sur une IA offensive. Mais des chercheurs comme Neil Gong, professeur à Duke University, alertent depuis plusieurs années sur un autre front : les attaques visant les agents eux-mêmes, via des techniques comme l'injection de commandes indirectes dissimulées dans des e-mails ou des sites web. La vulnérabilité Meta était bien plus rudimentaire que ces exploits sophistiqués, ce qui rend sa non-détection d'autant plus surprenante. Les experts s'accordent sur les parades possibles : imposer des règles strictes via du code traditionnel en amont de l'agent, et soumettre tout agent destiné au public à des exercices rigoureux de "red-teaming" avant déploiement.

UELes millions d'utilisateurs européens d'Instagram sont directement exposés à ce type de faille ; l'incident renforce l'urgence d'exiger des audits de sécurité rigoureux pour les agents IA déployés en production, un angle que l'AI Act devra préciser dans ses actes d'exécution.

💬 L'exploit le plus bête est souvent le plus efficace. Tu demandes gentiment à l'agent de changer l'adresse mail, il s'exécute sans résistance, et le compte Obama finit à diffuser de la propagande iranienne. La vraie honte pour Meta, c'est pas l'attaque, c'est que leur red-team interne ne l'a pas vue venir avant les pirates.

SécuritéOpinion
1 source
Google DeepMind publie Gemma 4 12B : un modèle multimodal sans encodeur avec audio natif, utilisable sur un PC portable 16 Go
273MarkTechPost 

Google DeepMind publie Gemma 4 12B : un modèle multimodal sans encodeur avec audio natif, utilisable sur un PC portable 16 Go

Google DeepMind a publié Gemma 4 12B, un modèle multimodal dense de 12 milliards de paramètres disponible sous licence Apache 2.0. Contrairement à ses prédécesseurs, ce modèle supprime totalement les encodeurs séparés pour la vision et l'audio : les images, vidéos et sons sont traités directement par le décodeur principal, sans couche intermédiaire dédiée. Concrètement, l'encodeur visuel de 550 millions de paramètres et l'encodeur audio de 300 millions de paramètres présents dans les modèles précédents disparaissent au profit d'une projection légère : les images sont découpées en blocs de 48x48 pixels projetés via une simple multiplication matricielle, et l'audio 16 kHz est découpé en trames de 40 ms converties directement en embeddings. Le modèle tourne sur un ordinateur portable grand public disposant de 16 Go de VRAM ou de mémoire unifiée, y compris les Mac Apple Silicon, et est compatible avec les outils les plus répandus : llama.cpp, Ollama, vLLM, MLX, LM Studio et Unsloth. Cette architecture unifiée change concrètement la façon dont on fine-tune et déploie des modèles multimodaux. Puisqu'il n'existe plus d'encodeurs figés, une adaptation via LoRA ou un entraînement complet met à jour simultanément le traitement du texte, de la vision et de l'audio en une seule passe, ce qui simplifie considérablement le pipeline d'entraînement. Sur le plan des performances, Google DeepMind annonce que le 12B s'approche du modèle Gemma 4 26B Mixture of Experts sur les benchmarks standards, avec moins de la moitié de l'empreinte mémoire. Le modèle est capable de reconnaissance vocale native, de diarisation (distinction des locuteurs), de compréhension vidéo, et de raisonnement agentique multi-étapes en local, sans dépendance à un service cloud. Une démonstration a montré l'analyse d'un segment de 5 minutes du keynote Google I/O à partir de 313 images à 1 FPS, avec un budget de 70 tokens visuels par image. Gemma 4 12B s'inscrit dans une stratégie claire de Google DeepMind : combler l'écart entre les petits modèles embarqués comme le E4B et les architectures plus lourdes comme le 26B MoE, tout en poussant l'open source comme levier de diffusion. La suppression des encodeurs n'est pas qu'un choix technique : elle réduit la latence au démarrage puisque le décodeur commence le traitement sans attendre qu'un encodeur termine, ce qui est critique pour les usages agentiques en temps réel. Le modèle est disponible sur Hugging Face sous l'identifiant google/gemma-4-12B-it et sur Kaggle. Dans un contexte où Meta, Mistral et Qwen multiplient les sorties open source performantes à l'edge, ce Gemma 4 12B positionne Google sur le terrain des modèles multimodaux locaux, un segment jusqu'ici dominé par des solutions propriétaires ou des architectures nécessitant du matériel serveur.

UECe modèle open source sous licence Apache 2.0 permet aux développeurs et entreprises européens de déployer localement un modèle multimodal avancé sans dépendance à un service cloud américain, facilitant la conformité avec les exigences de souveraineté des données du RGPD.

LLMsOpinion
1 source
Baz améliore la précision de la revue de code par agents IA grâce à Amazon Bedrock AgentCore
274AWS ML Blog 

Baz améliore la précision de la revue de code par agents IA grâce à Amazon Bedrock AgentCore

Baz, une startup spécialisée dans l'automatisation des revues de code, a développé un agent IA capable de vérifier non seulement la qualité technique du code, mais aussi sa conformité aux spécifications produit et aux maquettes de design. Baptisé Spec Review Agent, ce système repose sur Amazon Bedrock et Amazon Bedrock AgentCore, les services d'IA managés d'AWS. Concrètement, l'agent s'active automatiquement à l'ouverture d'une pull request GitHub, interroge simultanément Figma pour récupérer les spécifications visuelles et Jira pour les exigences fonctionnelles, puis décompose l'ensemble en critères vérifiables. Il spawne ensuite des sous-agents parallèles, un par exigence, qui analysent le code source et interagissent avec l'environnement de prévisualisation via l'outil AgentCore Browser Tool, capable d'inspecter le DOM, de simuler des interactions utilisateur et de comparer visuellement l'interface rendue avec les maquettes Figma. L'enjeu est considérable pour les équipes de développement modernes. Jusqu'ici, la vérification qu'une fonctionnalité correspondait réellement à ce que le product owner avait demandé ou que le designer avait conçu reposait entièrement sur des tests manuels effectués par des équipes QA. Ces vérifications prenaient des heures, introduisaient des incohérences d'une release à l'autre et s'appuyaient sur une connaissance interne non documentée et donc fragile. En automatisant cette couche de validation, Baz cherche à supprimer le délai systématique entre la livraison du code et la détection des écarts, réduisant ainsi les régressions et accélérant les cycles de mise en production. Pour les équipes engineering qui travaillent à haute vélocité, c'est potentiellement une transformation profonde du workflow de review, qui passe d'une vérification de syntaxe à une validation de comportement réel. Ce projet s'inscrit dans une tendance plus large d'industrialisation des agents IA dans le cycle de développement logiciel, après l'émergence des assistants de génération de code comme GitHub Copilot. Amazon Bedrock AgentCore, lancé récemment par AWS, propose des primitives spécifiquement conçues pour l'orchestration d'agents multi-étapes en production, incluant la navigation web autonome, la gestion de la mémoire et l'exécution de code dans des environnements isolés. Baz exploite ces capacités pour bâtir une infrastructure d'orchestration déployée sur Amazon EKS, avec un Application Load Balancer en entrée. La prochaine étape logique pour ce type de système sera d'étendre la couverture au-delà des critères d'acceptation Jira et des maquettes Figma, vers des dimensions comme la performance ou l'accessibilité, transformant progressivement la revue de code en audit produit complet piloté par l'IA.

OutilsOutil
1 source
Panique sur Instagram : l’IA de Meta offre les comptes de stars aux hackers
275Le Big Data 

Panique sur Instagram : l’IA de Meta offre les comptes de stars aux hackers

Des cybercriminels ont exploité une faille critique dans l'assistant IA de Meta pour compromettre des milliers de comptes Instagram, vraisemblablement depuis février 2026. La technique était d'une simplicité déconcertante : les pirates initiaient une procédure de réinitialisation de mot de passe, simulaient la localisation de la victime via un VPN, puis manipulaient le chatbot Meta AI pour qu'il modifie l'adresse e-mail associée au compte ciblé, ouvrant ainsi la voie à une prise de contrôle totale. Des tutoriels vidéo décrivant cette méthode circulaient depuis plusieurs semaines dans des groupes Telegram spécialisés. L'affaire a éclaté publiquement le 31 mai 2026, quand le chercheur en renseignement open source ZachXBT a dénoncé sur X les permissions excessives accordées à l'assistant Meta AI, lequel pouvait réinitialiser des mots de passe sans authentification à deux facteurs ni vérification d'identité sérieuse. Parmi les comptes compromis figuraient des handles de grande valeur comme @hey et @jowo, dont la valeur cumulée dépasserait le million de dollars sur le marché gris, ainsi que des comptes appartenant à des chercheurs en sécurité reconnus comme Jane Manchun Wong. Certains comptes détournés ont même diffusé brièvement des contenus à caractère politique avant d'être récupérés. L'impact est double : financier et réputationnel. Des comptes à forte audience ont été revendus à prix élevé ou exploités pour usurper l'identité de marques, le temps que Meta déploie un correctif. Les victimes ordinaires, elles, ont perdu l'accès à leurs profils sans recours immédiat. Ce qui rend l'incident particulièrement préoccupant, c'est qu'une protection élémentaire suffisait à bloquer l'attaque : l'activation de l'authentification multifacteur, même par simple SMS, rendait la manœuvre inefficace. Les pirates eux-mêmes l'ont reconnu publiquement. La vulnérabilité a donc touché en priorité les utilisateurs qui n'avaient pas activé cette couche de sécurité de base, souvent par méconnaissance ou par négligence. Cet incident illustre un risque systémique croissant : à mesure que les entreprises confient à des agents IA des droits d'action sur des données sensibles, la surface d'attaque s'élargit considérablement. Un assistant de support mal configuré peut devenir un point d'entrée aussi dangereux qu'une API mal protégée. Les experts en sécurité réclament désormais des architectures dans lesquelles les agents IA ne peuvent effectuer d'actions sensibles, comme modifier les identifiants d'un compte, qu'après une vérification indépendante et une validation humaine. Meta a corrigé la faille, mais l'affaire pose une question structurelle qui dépasse Instagram : qui surveille les droits accordés aux systèmes d'IA, et selon quels standards ? Le secteur tech n'a pas encore de réponse unifiée, et des incidents similaires sont prévisibles chez d'autres acteurs ayant déployé des assistants IA avec des permissions étendues.

UEDes millions d'utilisateurs européens d'Instagram sont concernés par cette faille, avec des implications RGPD potentielles liées à l'accès non autorisé à des données personnelles via un agent IA mal sécurisé.

💬 Un chatbot qui peut changer ton adresse email sans demander la moindre vérification, c'est pas une faille, c'est une décision de conception. Ce qui choque, c'est pas la technique des hackers (elle était triviale), c'est que personne chez Meta n'a posé la question au moment de déployer ces permissions. Ça va se reproduire ailleurs, chez tous ceux qui ont lâché des agents IA avec des droits d'action étendus et zéro gouvernance sérieuse derrière.

SécuritéActu
1 source
L'IA à base d'agents au service d'une santé mondiale plus humaine
276MIT Technology Review 

L'IA à base d'agents au service d'une santé mondiale plus humaine

Le secteur mondial de la santé fait face à une pression croissante : l'Organisation mondiale de la santé prévoit un déficit de 11 millions de professionnels de santé d'ici 2030, résultat de décennies de sous-investissement et d'une demande en hausse portée par le vieillissement des populations. Dans ce contexte, de nombreux établissements se tournent vers l'IA agentique, des systèmes capables de prendre des décisions autonomes et d'agir sans intervention humaine constante. Selon une étude KPMG, 68 % des prestataires de santé ont déjà intégré des agents IA dans leur fonctionnement. À New York, le Hospital for Special Surgery (HSS), centre médical académique spécialisé en santé musculo-squelettique, fait figure de pionnier. L'établissement utilise des agents IA pour traiter 1 100 dossiers de remboursements d'assurance par mois, une tâche qui mobilisait auparavant plusieurs semaines de travail impliquant du personnel interne et un prestataire externe. Le délai de traitement des recours est passé de 45 à 5 minutes, et le taux de succès de ces recours est passé de 65 % à 100 % en neuf mois. HSS a également déployé un service d'orientation et de prise de rendez-vous accessible 24h/24 via web, SMS ou téléphone, développé en partenariat avec la société Ema Unlimited, spécialisée dans l'IA agentique pour les entreprises. L'impact est concret et mesurable : là où les outils numériques précédents, dossiers médicaux électroniques, télémédecine, moniteurs connectés, avaient surtout alourdi la charge administrative sans résoudre les problèmes de fond, l'IA agentique libère les cliniciens des tâches répétitives pour qu'ils se concentrent sur les soins à forte valeur ajoutée. Le service de triage conversationnel pose des questions ciblées aux patients, identifie le bon spécialiste en tenant compte de la localisation, de la couverture assurantielle et des disponibilités, et finalise la prise de rendez-vous sans intervention humaine. Selon le Dr. Ashis Barad, directeur digital et technologique de HSS, l'IA agentique ne se contente pas d'automatiser : elle « effondre, augmente et surpuissante » les flux de travail existants. Ce tournant intervient après des années de promesses non tenues du numérique en santé. La migration vers les dossiers électroniques aux États-Unis, au début des années 2000, a fragmenté les données plutôt que de les unifier. Les outils de télémédecine ont amélioré l'accès géographique mais sans reproduire la qualité des consultations en présentiel. L'IA agentique se distingue par sa capacité à gérer des scénarios complexes et nuancés, à consulter des sources cliniques expertes et à s'améliorer dans le temps. Pour autant, la prudence reste de mise : chez HSS, toutes les décisions sont auditables, les cas sensibles ou incertains sont escaladés vers des spécialistes humains, et les données patients sont protégées selon les protocoles internes. La question centrale pour les prochaines années sera de savoir si cette technologie peut être déployée à grande échelle sans sacrifier la confiance des patients et la sécurité des soins.

UELe déficit de professionnels de santé prévu par l'OMS d'ici 2030 touche également les systèmes de santé européens, mais les déploiements décrits restent pour l'instant limités au marché américain.

SociétéOutil
1 source
L'équipe Qwen d'Alibaba lance Qwen3.7-Plus avec vision, raisonnement avancé et agents autonomes sur Bailian
277MarkTechPost 

L'équipe Qwen d'Alibaba lance Qwen3.7-Plus avec vision, raisonnement avancé et agents autonomes sur Bailian

L'équipe Qwen d'Alibaba a lancé le 2 juin 2026 le modèle Qwen3.7-Plus, désormais disponible via API sur la plateforme Bailian d'Alibaba Cloud, accessible aux développeurs internationaux sous le nom Model Studio. Ce modèle multimodal comprend les images et les vidéos en plus du texte, ce qui le distingue de son frère jumeau Qwen3.7-Max, exclusivement textuel. Il s'agit d'une capacité de lecture visuelle, non de génération : Qwen3.7-Plus analyse des médias, il ne les crée pas. Au-delà de la vision, le modèle intègre cinq capacités agentiques : raisonnement approfondi, autoprogrammation (il écrit et révise son propre code), invocation d'outils externes et d'API, vérification et test des résultats, et itération autonome jusqu'à l'accomplissement complet d'une tâche. La préversion du modèle s'est classée 16e au classement Vision Arena de LM Arena, plaçant Alibaba au 5e rang mondial des laboratoires en compréhension visuelle. Le modèle texte Max, de son côté, avait obtenu 56,6 points sur l'Artificial Analysis Intelligence Index, meilleur score d'un modèle chinois à sa sortie. Cette sortie marque un tournant dans la stratégie d'Alibaba : le groupe ne cherche plus seulement à rivaliser sur les benchmarks de raisonnement, mais à proposer des modèles capables d'exécuter des tâches longues et complexes de façon autonome. Pour les développeurs et les entreprises, cela ouvre des cas d'usage concrets comme l'analyse OCR à grande échelle, la lecture automatique de graphiques, l'analyse de séquences vidéo, ou encore l'automatisation de workflows techniques complets. La plateforme Bailian embarque deux mécanismes complémentaires : un système d'apprentissage par renforcement agentique (Agentic RL) qui affine la précision du modèle grâce aux retours d'exécution réels, et des garde-fous de sécurité intégrés pour maintenir les outils autonomes dans des limites opérationnelles prédéfinies, un détail crucial lorsqu'un agent exécute des commandes ou modifie des fichiers en production. Ce lancement s'inscrit dans la vague de modèles agentiques qui déferle sur l'industrie depuis début 2026, face à des acteurs comme OpenAI, Google DeepMind et Anthropic. Alibaba avait déjà dévoilé la génération Qwen3.7 en mai 2026, et la sortie de la variante multimodale complète maintenant l'offre de la famille. Le positionnement au 5e rang mondial en vision, malgré un retard encore visible sur les premiers laboratoires américains, confirme que les équipes chinoises se rapprochent du front technologique à un rythme soutenu. L'enjeu pour Alibaba est de transformer Bailian en plateforme de référence pour les entreprises cherchant à déployer des agents IA capables d'agir dans des environnements réels, pas seulement de répondre à des questions, une bataille qui s'annonce centrale dans les prochains mois.

UELes développeurs et entreprises françaises peuvent accéder dès maintenant à Qwen3.7-Plus via l'API internationale Model Studio, offrant une alternative compétitive aux modèles américains pour des cas d'usage agentiques et d'analyse visuelle.

LLMsOpinion
1 source
Les failles de Claude Mythos révèlent une réalité dure : vos correctifs d'entreprise sont beaucoup trop lents
278VentureBeat AI 

Les failles de Claude Mythos révèlent une réalité dure : vos correctifs d'entreprise sont beaucoup trop lents

Le 7 avril 2026, Anthropic a annoncé que Claude Mythos Preview était capable de découvrir de manière autonome des milliers de vulnérabilités zero-day dans les principaux systèmes d'exploitation et navigateurs, sans qu'on lui fournisse la moindre description technique préalable. Ce résultat referme une marge de sécurité que l'industrie croyait acquise : en 2024, des chercheurs de l'Université de l'Illinois avaient montré que GPT-4, armé d'une description CVE, pouvait exploiter 87 % des vulnérabilités d'un jeu de test de 15 failles connues, mais seulement 7 % sans cette description. Claude Mythos efface cette distinction. Le modèle a obtenu 83,1 % sur le benchmark CyberGym de reproduction de vulnérabilités, et une campagne d'attaque ciblant OpenBSD sur 1 000 exécutions n'a coûté que moins de 20 000 dollars. Les délais d'exploitation s'effondrent en parallèle : la faille Langflow CVE-2026-33017 (score CVSS 9,8) a été exploitée 20 heures après sa divulgation publique, sans proof-of-concept disponible. La vulnérabilité Marimo CVE-2026-39987 (CVSS 9,3) a été attaquée en 9 heures et 41 minutes. Ce changement de rythme détruit l'hypothèse fondamentale sur laquelle repose la gestion des correctifs dans la plupart des entreprises : l'idée qu'il reste suffisamment de temps entre la publication d'une faille et son exploitation pour déployer un patch en sécurité. Le rapport Threat Landscape 2026 de Rapid7 indique que le délai médian entre la publication d'un CVE et son inscription au catalogue KEV de la CISA est de cinq jours. Le rapport M-Trends 2026 de Google confirme que des exploitations surviennent désormais avant même qu'un correctif soit publié. Face à cette réalité, les équipes de sécurité ne peuvent plus s'appuyer sur le seul score CVSS pour prioriser leurs actions : ce score mesure la gravité théorique d'une faille, pas sa probabilité d'exploitation réelle. Une étude validée sur 28 377 vulnérabilités réelles propose un filtre en trois couches combinant le statut KEV de la CISA, le score EPSS (Exploit Prediction Scoring System) et le CVSS, avec un seuil EPSS fixé à 0,088 comme déclencheur d'escalade urgente. Résultat : un gain d'efficacité de 18 fois, une couverture de 85,6 % des vulnérabilités effectivement exploitées, et une réduction de 95 % du volume de remédiation urgente. Au-delà de la vitesse d'exploitation, l'essor des agents IA autonomes ouvre un second front. La faille CVE-2026-34040 de Docker illustre le problème : l'architecture de plugins d'autorisation de Docker contourne silencieusement tous les plugins lorsque le corps d'une requête dépasse 1 Mo, un comportement ignoré par des solutions courantes comme OPA, Casbin ou Prisma Cloud. Des chercheurs de Cyera ont démontré qu'un agent IA chargé de déboguer une infrastructure pouvait inférer ce chemin de contournement de manière autonome. Les politiques d'autorisation en place n'ont pas été conçues pour anticiper ce type de comportement agentique, et cet angle mort devient un risque mesurable à mesure que les systèmes IA accèdent à des ressources privilégiées. L'ensemble des sources de données nécessaires au filtre de priorisation (API CISA KEV, API EPSS de FIRST.org, NVD) sont ouvertes et gratuites, et leur intégration est entièrement automatisable.

UELes entreprises françaises et européennes doivent réviser leurs cycles de gestion des correctifs, car les délais d'exploitation automatisée par IA (désormais quelques heures) rendent obsolètes les pratiques traditionnelles de priorisation basées sur le seul score CVSS.

💬 Ce qui me frappe, c'est pas le rythme d'exploitation (neuf heures quarante et une sur Marimo CVE-2026-39987, sans proof-of-concept disponible), c'est que Claude Mythos trouve des zero-days sans description préalable, là où GPT-4 plafonnait à 7% dans les mêmes conditions en 2024. La fenêtre que s'accordaient les équipes sécurité entre publication et attaque vient de disparaître. Si ta politique de patch repose encore sur l'idée qu'on a quelques jours, c'est le postulat lui-même à retravailler, pas juste le processus.

SécuritéOpinion
1 source
Le travail et le code dans une seule IA ? Voici Vibe, la nouvelle ambition de Mistral
279Le Big Data 

Le travail et le code dans une seule IA ? Voici Vibe, la nouvelle ambition de Mistral

Mistral a lancé le 28 mai 2026 Vibe, une plateforme qui fusionne productivité professionnelle et développement logiciel au sein d'un même environnement. Concrètement, Vibe n'est pas un outil entièrement nouveau : il s'agit d'une évolution substantielle de Le Chat, l'assistant IA que la startup française avait déjà déployé. La plateforme intègre désormais un mode Travail, un mode Code, une interface en ligne de commande et une extension VS Code inédite. Elle se connecte à des services tiers comme Slack, GitHub et Google Workspace, et permet à l'IA de lire des fichiers, modifier du code, exécuter des commandes et récupérer du contexte via des mentions "@" dans d'autres outils. L'extension VS Code s'affiche dans un panneau latéral qui prend automatiquement en compte les documents ouverts dans l'éditeur. L'ambition centrale de Vibe est l'unification : éliminer la fragmentation entre les dizaines d'outils qu'utilisent aujourd'hui les équipes techniques et les professionnels. Pour un développeur, pouvoir passer de la revue de code sur GitHub à la rédaction d'un document ou au suivi de projet sans changer d'interface représente un gain de temps potentiellement significatif. Pour les profils non techniques, l'idée d'un agent capable de gérer plusieurs étapes d'un workflow, planification, rédaction, coordination, depuis un seul endroit répond à une vraie friction quotidienne. Mistral positionne ainsi Vibe non plus comme un simple chatbot qui répond à des questions, mais comme un agent qui agit : une distinction que l'ensemble du secteur cherche à matérialiser depuis plusieurs mois. Mistral s'inscrit dans une course très disputée à l'assistant universel, où OpenAI avec ChatGPT, Anthropic avec Claude et Google avec Gemini occupent déjà des positions solides. La startup française, fondée en 2023 et valorisée à plusieurs milliards d'euros, mise sur son ancrage européen et sa maîtrise technique pour se différencier dans ce marché. Vibe représente un pivot stratégique clair : passer d'un fournisseur de modèles de langage à une plateforme applicative complète, capable de fidéliser des utilisateurs dans leur flux de travail quotidien. Reste la question de l'exécution. Les agents IA ont accumulé les promesses depuis un an avec des résultats souvent irréguliers, entre automatisations défaillantes et réponses approximatives dans des contextes complexes. La vraie mesure de Vibe se fera sur la durée et la fiabilité, face à des concurrents qui disposent de ressources considérables et d'écosystèmes déjà très bien établis.

UEMistral, startup française valorisée à plusieurs milliards d'euros, lance une plateforme applicative complète qui concurrence directement les outils américains dominants, renforçant l'offre européenne en matière d'agents IA pour les équipes techniques et professionnelles.

💬 L'extension VS Code qui lit automatiquement ce qui est ouvert dans l'éditeur, c'est la feature qui m'intéresse le plus là-dedans. Mistral passe de fournisseur de modèles à plateforme applicative complète, et j'y vois un pivot logique même si le terrain est occupé par des acteurs avec des budgets autrement plus grands. Reste à voir si ça tient quand les workflows deviennent vraiment complexes.

OutilsOutil
1 source
Le CPU Vera de NVIDIA s'affirme comme un concurrent redoutable
280NVIDIA AI Blog 

Le CPU Vera de NVIDIA s'affirme comme un concurrent redoutable

Les premiers benchmarks publics du processeur Vera de NVIDIA, publiés le 27 mai 2026 par le site spécialisé Phoronix, révèlent des performances qui pourraient redessiner le paysage des processeurs pour centres de données. Le CPU Vera, conçu autour de 88 cœurs personnalisés baptisés Olympus et compatibles avec l'architecture Armv9.2, affiche une bande passante mémoire de 1,2 To/s grâce à un sous-système LPDDR5X de deuxième génération. Le tout dans une enveloppe thermique de 450 watts pour le processeur, avec moins de 30 watts dédiés à la mémoire. Les tests couvrent un large spectre de charges de travail : compilation de code, compression de fichiers, transcodage vidéo, Python, Java et gestion de bases de données. Michael Larabel, fondateur de Phoronix, conclut sans ambages : "C'est la concurrence la plus redoutable jamais vue face aux processeurs Intel et AMD x86_64." Ces résultats ont une portée directe pour les entreprises qui construisent des infrastructures d'IA agentique, c'est-à-dire des systèmes où des agents autonomes exécutent simultanément du code, interrogent des bases de données et orchestrent des pipelines complexes. Sur le test STREAM TRIAD, Vera soutient 90% de sa bande passante mémoire de pointe, un taux qu'aucun autre processeur testé par Phoronix n'a atteint, tout en délivrant plus de quatre fois la bande passante mémoire par cœur comparé aux CPU x86 traditionnels. La société Prime Intellect a confirmé, dans des tests séparés, que Vera maintient une bande passante élevée et une latence mémoire faible et stable à mesure que le nombre de processus parallèles augmente. Pour les opérateurs d'infrastructures IA, cela se traduit par moins de serveurs nécessaires pour un même volume de travail, et une facture énergétique réduite. NVIDIA a présenté Vera comme la réponse architecturale au virage vers l'IA agentique, qui impose aux processeurs des contraintes différentes de celles du deep learning classique : moins de calcul matriciel massif, davantage de traitement séquentiel, de branchements conditionnels et d'accès mémoire dispersés. Par rapport au processeur Grace de génération précédente, Vera affiche un gain de 1,6x en moyenne géométrique sur l'ensemble des benchmarks Phoronix, une progression que Larabel qualifie de "constamment au-delà de ce qu'on attend d'une génération à l'autre". Ce lancement intervient dans un contexte où AMD EPYC et Intel Xeon dominent encore les data centers d'entreprise, mais où NVIDIA cherche à imposer ses propres CPU aux côtés de ses GPU dans des plateformes intégrées. La prochaine étape sera de voir si ces performances en benchmark se confirment dans des déploiements de production à grande échelle, notamment dans les grandes fermes d'IA où le coût total par inférence reste le critère ultime.

UELes opérateurs de centres de données européens pourraient réduire leur consommation énergétique et le nombre de serveurs nécessaires pour leurs charges IA agentique, un avantage concret dans le contexte des objectifs européens de sobriété numérique.

InfrastructureActu
1 source
Les meilleures plateformes d'authentification pour agents IA et serveurs MCP en 2026
281MarkTechPost 

Les meilleures plateformes d'authentification pour agents IA et serveurs MCP en 2026

Le Model Context Protocol (MCP), lancé par Anthropic en novembre 2024, s'est imposé en moins d'un an comme le standard de facto de l'écosystème agentique. OpenAI l'a adopté en mars 2025, Microsoft a annoncé son support dans Copilot Studio le même mois, et fin 2025 les téléchargements cumulés des SDK Python et TypeScript dépassaient 97 millions par mois. En décembre 2025, Anthropic a cédé le protocole à l'Agentic AI Foundation, hébergée par la Linux Foundation, pour en faire un bien commun de l'industrie. Gartner projette que 40 % des applications d'entreprise intégreront des agents IA spécialisés d'ici fin 2026, contre moins de 5 % aujourd'hui. Cette explosion soulève un problème central resté sans solution robuste : l'authentification. Quand un agent IA se contente de répondre à des questions, la sécurité d'accès reste anecdotique. Quand il lit des e-mails, met à jour des CRM, écrit dans des bases de données et appelle des API externes de façon autonome, l'authentification devient une infrastructure critique, et le coût d'une faille peut être considérable. La spécification MCP pour les déploiements HTTP protégés est précise : OAuth 2.1 avec PKCE est obligatoire, tous les endpoints doivent fonctionner en HTTPS, les métadonnées du serveur d'autorisation doivent être découvrables par les clients, et les mécanismes Protected Resource Metadata (RFC 9728) ainsi que Resource Indicators (RFC 8707) doivent être implémentés pour éviter la confusion d'audience des tokens. Plusieurs fournisseurs connus ne répondent pas encore à toutes ces exigences. C'est dans ce contexte que deux plateformes se distinguent : WorkOS, ciblant les équipes d'ingénierie enterprise, combine OAuth 2.1 compatible MCP avec SSO, SCIM, journaux d'audit et une autorisation granulaire (Fine-Grained Authorization) permettant de restreindre un agent à des outils précis plutôt qu'à un service entier. Stytch, filiale de Twilio, s'adresse aux équipes SaaS B2B déployant sur Cloudflare Workers et souhaitant ajouter l'authentification MCP sans migrer toute leur stack existante. L'enjeu dépasse le simple choix d'une bibliothèque. L'émergence des agents autonomes redéfinit la granularité des droits d'accès : il ne s'agit plus de savoir si un utilisateur peut accéder à une application, mais si un agent peut appeler un outil spécifique dans un service donné, dans un contexte précis, avec une traçabilité complète. Les acteurs comme Okta, Microsoft Entra ou des annuaires internes restent en jeu, mais les nouvelles plateformes comme WorkOS visent à s'y connecter plutôt qu'à les remplacer. Avec 40 % des applications enterprise concernées d'ici dix-huit mois, la fenêtre pour standardiser ces pratiques est courte, et les choix d'architecture faits aujourd'hui conditionneront la sécurité des systèmes agentiques pour les années à venir.

UELes entreprises européennes déployant des agents IA autonomes devront adopter ces standards d'authentification pour satisfaire aux exigences de traçabilité et d'auditabilité imposées par l'AI Act.

💬 L'auth pour agents, c'était le truc qu'on remettait à plus tard tant que les agents répondaient juste à des questions. Là, avec des systèmes qui lisent des mails, poussent dans des CRM et appellent des API externes sans supervision, c'est de l'infrastructure critique, et WorkOS a bien vu que le vrai sujet c'est l'autorisation à l'outil (pas à l'application, à l'outil spécifique). Reste à voir si les équipes qui déploient aujourd'hui vont s'y plier avant le premier incident sérieux.

OutilsOpinion
1 source
OpenAI inaugure un laboratoire à Singapour tandis que l'IMDA met à jour son cadre IA
282AI News 

OpenAI inaugure un laboratoire à Singapour tandis que l'IMDA met à jour son cadre IA

OpenAI va ouvrir son premier laboratoire d'IA appliquée hors des États-Unis à Singapour. Baptisée "OpenAI for Singapore", cette initiative a été annoncée lors de l'ATx Summit en partenariat avec le ministère du Développement Numérique et de l'Information, adossée à un engagement de plus de 300 millions de dollars singapouriens. Le laboratoire créera plus de 200 postes techniques locaux sur plusieurs années, et Singapour deviendra l'un des hubs mondiaux pour les ingénieurs d'OpenAI chargés du déploiement auprès des organisations. Les travaux se concentreront sur les priorités de l'AI Mission singapourienne, notamment les services publics, la finance et l'infrastructure numérique. Simultanément, l'Infocomm Media Development Authority (IMDA) a publié une version actualisée de son cadre de gouvernance pour l'IA agentique, lancé lors du Forum Économique Mondial en janvier 2026, révisé après consultation de plus de 60 organisations dont AWS, DBS, Google et Salesforce. L'implantation d'OpenAI à Singapour dépasse l'ouverture d'un bureau commercial : il s'agit d'un centre technique capable de développer des solutions adaptées aux besoins locaux, avec des programmes d'accompagnement concrets tels qu'un chapitre singapourien de l'OpenAI Academy, des hackathons Codex for Teachers et des ateliers destinés aux micro-entrepreneurs et PME pour intégrer l'IA dans leurs opérations. Pour les systèmes agentiques, la mise à jour du cadre IMDA apporte des réponses précises aux risques émergents : systèmes multi-agents, agents tiers, biais d'automatisation et responsabilité humaine sont désormais traités explicitement, avec plus de dix études de cas issues d'organisations comme Tencent, OCBC, PwC et GovTech Singapore. Ces deux annonces s'inscrivent dans la stratégie de Singapour pour s'imposer comme une référence mondiale en gouvernance de l'IA, un effort qui remonte au Model AI Governance Framework de 2020 et qui s'est progressivement densifié à mesure que les technologies évoluaient. Les études de cas du nouveau cadre IMDA illustrent comment des entreprises ont mis en oeuvre des mécanismes concrets de supervision humaine : Dayos, une société d'automatisation IA basée à Singapour, a déployé un agent de ticketing IT avec des niveaux de risque gradués, automatisant les actions réversibles comme les réinitialisations de mots de passe et exigeant une approbation humaine pour les modifications à risque élevé. Tencent, de son côté, a contribué avec CodeBuddy, son système de codage agentique qui requiert une validation explicite pour toute action sensible. L'enjeu dépasse largement Singapour : à mesure que les agents IA gagnent en autonomie dans les entreprises, ces cadres de gouvernance pourraient servir de modèle aux pays encore en quête de référentiels opérationnels.

UELe cadre de gouvernance singapourien pour les agents IA, co-construit avec plus de 60 organisations mondiales, pourrait servir de référentiel opérationnel aux régulateurs européens pour l'application de l'AI Act aux systèmes agentiques.

💬 Singapour joue un jeu long depuis 2020, et là ça commence à prendre forme. OpenAI ne pose pas juste un drapeau commercial : 200 postes techniques, des programmes pour les PME locales, un labo capable de développer des solutions sur-mesure, c'est une vraie infrastructure. Ce qui m'intéresse surtout, c'est le cadre IMDA sur les agents : 60 organisations, des études de cas réelles, une gouvernance graduée par niveau de risque. Les Européens devraient regarder ça de près avant de finir l'AI Act en salle de réunion.

BusinessActu
1 source
Cohere lance Command A+, un modèle MoE sparse de 218 milliards de paramètres pour agents autonomes, utilisable sur seulement deux GPU H100
283MarkTechPost 

Cohere lance Command A+, un modèle MoE sparse de 218 milliards de paramètres pour agents autonomes, utilisable sur seulement deux GPU H100

Cohere a publié Command A+, un modèle open source sous licence Apache 2.0 conçu pour les workflows agentiques en entreprise. Architecturé comme un Transformer sparse Mixture-of-Experts (MoE) décodeur uniquement, le modèle totalise 218 milliards de paramètres mais n'en active que 25 milliards par inférence, grâce à un mécanisme de routage vers 8 experts parmi 128 disponibles. Cette architecture permet de faire tourner Command A+ sur seulement deux GPU H100 en quantification W4A4 4 bits, ou sur quatre H100 en FP8, rendant le déploiement on-premise accessible sans infrastructure exorbitante. Le modèle prend en charge une fenêtre de contexte de 128 000 tokens, génère jusqu'à 64 000 tokens, traite texte, images et appels d'outils, et couvre désormais 48 langues contre 23 pour ses prédécesseurs. Il fusionne en un seul modèle les capacités de quatre modèles précédents : Command A, Command A Reasoning, Command A Vision et Command A Translate. Les gains de performance sont substantiels. Sur le benchmark tau²-Bench Telecom, Command A+ passe de 37 % à 85 % par rapport à Command A Reasoning. Sur Terminal-Bench Hard, référence pour le codage agentique difficile, le score bondit de 3 % à 25 %. En interne, Cohere mesure une amélioration de 20 % en question-réponse agentique, de 32 % en analyse de tableurs, et la capacité à exploiter la mémoire de sessions précédentes atteint 54 % contre 39 %. Sur le plan multimodal, MathVista progresse de 73,5 % à 80,6 % et Command A+ décroche 37 points sur l'Artificial Analysis Intelligence Index, devançant les principaux modèles open source concurrents. La quantification W4A4, appliquée uniquement aux couches MoE tout en conservant les projections d'attention en pleine précision, n'entraîne aucune dégradation mesurable sur les benchmarks et améliore le débit de sortie de 63 % tout en réduisant le temps avant premier token de 17 % par rapport à Command A Reasoning. Command A+ s'inscrit dans une tendance de fond qui voit les grands laboratoires chercher à réduire drastiquement le coût d'inférence sans sacrifier la qualité. Cohere, positionné historiquement sur le segment entreprise face à OpenAI, Anthropic et Google, mise sur la portabilité et la souveraineté des déploiements : la licence Apache 2.0 permet un usage commercial libre, un argument de poids pour les organisations qui refusent de dépendre de fournisseurs cloud. La technique de distillation avec prise en compte de la quantification (Quantization-Aware Distillation) utilisée en post-entraînement illustre la maturité croissante des méthodes de compression, qui commencent à rivaliser avec les modèles denses pleine précision sur des tâches complexes. La prochaine question sera de savoir si des performances agentiques aussi élevées sur deux H100 suffiront à convaincre les DSI d'internaliser leurs inférences plutôt que de passer par les API managées.

UELa licence Apache 2.0 et la possibilité de déployer Command A+ sur seulement deux GPU H100 ouvrent aux entreprises européennes une option d'inférence on-premise souveraine, réduisant leur dépendance aux APIs cloud américaines.

LLMsOpinion
1 source
Free, Orange et EDF s’allient pour créer une AI Gigafactory en France
284Le Big Data 

Free, Orange et EDF s’allient pour créer une AI Gigafactory en France

Le 20 mai 2026, huit grands groupes français ont annoncé la création du consortium AION pour porter la candidature de la France au programme européen des AI Gigafactories. Parmi eux : Iliad (la maison mère de Free), Orange, EDF, Capgemini, Scaleway, Ardian, Artefact et Bull. L'objectif est de construire une infrastructure capable d'héberger, d'entraîner et de déployer des modèles d'intelligence artificielle à très grande échelle, entièrement sur sol européen. Chaque membre apporte une brique stratégique : Bull fournit les supercalculateurs haute performance, EDF sécurise l'approvisionnement en électricité bas carbone, Orange et Scaleway assurent le cloud et l'hébergement des données, tandis que Capgemini et Artefact se concentrent sur l'intégration de l'IA en entreprise. Iliad et Ardian apportent le capital et l'expertise numérique pour soutenir un projet de très long terme. Le consortium peut également s'appuyer sur un écosystème plus large incluant Hugging Face, INRIA, Nokia, LightOn et Schneider Electric. L'enjeu est direct : aujourd'hui, l'essentiel de la puissance de calcul utilisée pour entraîner les grands modèles d'IA repose sur des infrastructures américaines, Microsoft, Google, Amazon. Pour les entreprises françaises et européennes des secteurs sensibles comme la santé, l'industrie ou les services publics, cette dépendance pose des problèmes concrets de souveraineté des données et de conformité réglementaire. Une gigafactory IA en France offrirait une alternative crédible, d'autant que le mix énergétique français, nucléaire et hydraulique, produit une électricité moins carbonée et plus stable que dans beaucoup de pays européens. Or les infrastructures IA consomment des volumes d'énergie colossaux, ce qui fait de l'accès à une énergie abondante et décarbonée un avantage compétitif aussi déterminant que les semi-conducteurs. Le consortium indique par ailleurs vouloir privilégier les technologies open source pour éviter de recréer des dépendances aux solutions propriétaires. Ce projet s'inscrit dans une dynamique européenne plus large : la Commission européenne a lancé son programme AI Gigafactories pour doter le continent d'infrastructures capables de rivaliser avec celles des États-Unis et de la Chine, dans un contexte où la course aux modèles génératifs et aux agents IA s'accélère. La France, qui abrite déjà des acteurs de premier plan comme Mistral AI et Hugging Face, tente de transformer cet avantage écosystémique en infrastructure physique souveraine. AION devra encore préciser le calendrier de déploiement et les montants d'investissement engagés, mais la mobilisation de groupes aussi diversifiés, télécoms, énergie, cloud, conseil, finance, signal que la France mise sur une approche de filière plutôt que sur un champion unique pour peser dans la prochaine phase de l'IA industrielle.

UELe consortium AION, porté par EDF, Orange, Iliad et Capgemini, vise à offrir aux entreprises françaises et européennes des secteurs sensibles (santé, industrie, services publics) une alternative souveraine aux infrastructures cloud américaines, en réponse directe au programme européen des AI Gigafactories.

💬 Bon, sur le papier, c'est exactement ce qu'il manquait. Avoir EDF dans la boucle pour sécuriser de l'énergie nucléaire bas carbone, c'est l'argument que personne d'autre en Europe ne peut vraiment sortir, et ça change tout quand tes GPU tournent 24h/24. La question maintenant : calendrier, montants, et si ce consortium reste soudé quand il faudra écrire les vrais chèques.

La recherche de Google fait un bond en avant grâce à l'IA
285The Information AI 

La recherche de Google fait un bond en avant grâce à l'IA

Lors de sa conférence Google I/O mardi dernier, Google a annoncé une refonte majeure de son moteur de recherche en y intégrant directement des fonctionnalités d'intelligence artificielle avancées, notamment des agents IA. Le PDG Sundar Pichai a dévoilé que la frontière entre Google Search et le chatbot Gemini est désormais en train de disparaître, les deux produits fusionnant progressivement en une seule expérience unifiée. Google Search compte 3 milliards d'utilisateurs mensuels, contre 900 millions pour Gemini. Ce changement redéfinit radicalement le paysage concurrentiel de l'IA grand public. La vraie bataille ne se joue plus entre ChatGPT et Gemini, deux chatbots aux usages encore relativement similaires, mais entre ChatGPT et Google Search, un produit ancré dans les habitudes quotidiennes de milliards de personnes. OpenAI revendique un peu plus de 900 millions d'utilisateurs actifs hebdomadaires pour ChatGPT, un chiffre impressionnant mais encore loin de la portée mondiale du moteur de recherche de Google. Intégrer l'IA directement dans Search donne à Google un avantage de distribution considérable qu'aucun concurrent ne peut facilement répliquer. Cette évolution s'inscrit dans une course effrénée entre les géants technologiques pour contrôler la porte d'entrée vers l'information sur internet. Google, dont le modèle publicitaire repose historiquement sur la recherche, cherche à préserver sa position dominante face à la montée des assistants IA capables de répondre directement aux questions sans passer par des liens sponsorisés. L'enjeu dépasse la technologie : il s'agit de savoir qui captera l'intention des utilisateurs, et donc les revenus, à l'ère de l'IA générative.

UELes entreprises européennes dépendant du trafic Google devront repenser leurs stratégies SEO et d'achat publicitaire, et la Commission européenne pourrait examiner cette fusion Search/Gemini au prisme du Digital Markets Act.

💬 3 milliards d'utilisateurs mensuels contre 900 millions pour Gemini, et Google choisit de fusionner les deux. C'est le genre de coup qui, une fois dit, semble évident : pourquoi construire un concurrent à ChatGPT quand tu peux transformer le produit le plus utilisé d'internet en assistant IA ? OpenAI peut revendiquer 900 millions d'actifs, c'est une bataille qu'ils ne peuvent pas gagner sur le terrain de la distribution.

OutilsOutil
1 source
Anthropic rachète Stainless, la startup API convoitée par OpenAI et Google
286Le Big Data 

Anthropic rachète Stainless, la startup API convoitée par OpenAI et Google

Anthropic a annoncé le 18 mai 2026 l'acquisition de Stainless, une startup new-yorkaise fondée en 2022 par Alex Rattray, ancien ingénieur de Stripe. Spécialisée dans l'automatisation des SDK et des connecteurs API, Stainless avait bâti en quelques années une position de référence dans l'écosystème IA. Selon The Information, l'opération dépasserait les 300 millions de dollars. La technologie de Stainless transforme des spécifications d'API en kits de développement logiciel prêts pour la production, compatibles avec Python, Go, Java, Kotlin et TypeScript. Son avantage distinctif est la maintenance automatique de ces SDK : à chaque évolution d'une API, les bibliothèques sont mises à jour sans intervention humaine. Anthropic utilisait déjà Stainless depuis les premières versions de son API Claude, mais la startup fournissait également ses outils à OpenAI, Google, Replicate, Runway et Cloudflare. Ces clients perdront l'accès aux produits hébergés de Stainless, dont son générateur de SDK, bien qu'ils conservent la propriété des SDK déjà générés et le droit de les modifier. Cette acquisition positionne Anthropic sur un terrain stratégique qui dépasse le simple rachat technologique. Dans le marché de l'IA agentique, la valeur ne réside plus uniquement dans la puissance des modèles, mais dans leur capacité à se connecter à des systèmes externes, des bases de données et des logiciels métiers. Les SDK, serveurs MCP et connecteurs sont précisément la couche technique qui rend cette connexion possible. En intégrant Stainless, Anthropic renforce toute son infrastructure développeur autour de Claude et prive simultanément ses concurrents directs d'un fournisseur jusqu'ici commun. OpenAI et Google, qui comptaient sur ces outils, devront désormais trouver ou développer des alternatives, ce qui représente un coût de friction non négligeable pour leurs équipes techniques et leurs clients. Cette opération s'inscrit dans une logique que les grandes plateformes cloud ont perfectionnée depuis des décennies. AWS, Microsoft Azure et Google Cloud n'ont pas construit leur domination uniquement sur l'infrastructure brute, mais surtout sur des couches d'outils qui fidélisent les développeurs et rendent le changement de fournisseur coûteux. Anthropic applique aujourd'hui cette même recette au marché des agents IA, en s'appropriant une infrastructure critique juste au moment où la compétition s'intensifie. La société pousse parallèlement son protocole MCP, qui standardise la communication entre agents IA et applications tierces, et Stainless vient directement renforcer cette pile. Le rachat transforme Anthropic d'un fabricant de modèles en véritable opérateur d'infrastructure pour développeurs, un positionnement qui pourrait peser lourd dans la consolidation qui s'annonce dans le secteur.

UELes développeurs européens utilisant les outils Stainless via OpenAI ou Google devront migrer vers des alternatives, renforçant leur dépendance à l'écosystème Anthropic/Claude.

💬 Le vrai coup, c'est pas les 300 millions, c'est qu'OpenAI et Google perdent leur fournisseur de SDK commun du jour au lendemain. La maintenance automatique des bibliothèques à chaque évolution d'API, c'est invisible, mais c'est exactement le genre de truc qui colle aux mains et crée une vraie dépendance. Avec MCP qui pousse en parallèle, Anthropic est en train de bâtir la couche infrastructure dont on ne sort pas facilement.

Anthropic lance Claude pour les PME afin d'intégrer l'IA dans vos outils du quotidien
287The Decoder 

Anthropic lance Claude pour les PME afin d'intégrer l'IA dans vos outils du quotidien

Anthropic a lancé "Claude for Small Business", une offre dédiée aux petites entreprises qui regroupe quinze workflows agentiques et des intégrations natives avec des outils de gestion largement répandus comme QuickBooks, PayPal et HubSpot. La société déploie simultanément des formations gratuites en ligne et une tournée d'ateliers dans dix villes américaines, afin d'accompagner concrètement les entrepreneurs dans la prise en main de ces nouvelles fonctionnalités. L'initiative cible un segment souvent délaissé par les grandes offres IA d'entreprise : les PME et TPE qui utilisent déjà ces logiciels de comptabilité, de paiement ou de CRM au quotidien, mais sans exploiter leur potentiel d'automatisation. En intégrant Claude directement dans ces outils, Anthropic cherche à réduire la friction d'adoption : pas besoin d'une équipe technique, l'IA s'active là où le travail se fait déjà. L'impact potentiel est significatif, car QuickBooks comptabilise à lui seul plusieurs millions de petites entreprises clientes aux États-Unis. Cette offensive s'inscrit dans une compétition féroce pour capter le marché des PME, où OpenAI, Google et Microsoft positionnent également leurs modèles via des partenariats avec des éditeurs de logiciels. Anthropic, longtemps perçu comme orienté grands comptes et recherche, signale ainsi une volonté claire d'élargir sa base d'utilisateurs vers le tissu économique plus diffus des indépendants et petites structures. La tournée nationale de workshops suggère une stratégie de croissance fondée autant sur l'éducation que sur la technologie.

UELes PME françaises utilisant HubSpot, PayPal ou QuickBooks pourraient accéder aux intégrations Claude, mais la tournée d'ateliers et la stratégie d'accompagnement restent exclusivement ciblées sur le marché américain.

OutilsOutil
1 source
Laserfiche lance des agents IA pour les flux de travail en langage naturel
288AI News 

Laserfiche lance des agents IA pour les flux de travail en langage naturel

Laserfiche, éditeur spécialisé dans la gestion de contenu d'entreprise, a lancé le 7 mai 2026 des agents d'intelligence artificielle capables d'exécuter des tâches complexes à partir de simples instructions en langage naturel. Ces agents sont accessibles via Smart Chat, une interface conversationnelle intégrée à la plateforme Laserfiche Cloud. Ils s'appuient sur des modèles de raisonnement génératifs (LLM) pour analyser des documents, identifier des informations spécifiques et déclencher des actions concrètes, comme déplacer un fichier, signaler une anomalie ou router un contrat vers le bon interlocuteur. Les capacités de chaque agent sont strictement encadrées par les permissions de l'utilisateur connecté, ce qui garantit que les données sensibles restent protégées selon les règles de conformité en vigueur dans l'organisation. L'intérêt principal de ces agents réside dans leur capacité à automatiser la zone grise entre les workflows préconçus et les tâches manuelles répétitives, sans exiger de compétences techniques de la part des utilisateurs. Dans les services juridiques, ils peuvent détecter des incohérences dans des contrats avant de les soumettre à une revue humaine. En comptabilité fournisseurs, ils repèrent les factures en retard et les transmettent aux équipes concernées. En RH, ils analysent les dossiers employés pour classer automatiquement les documents dans les bons répertoires selon le niveau d'accès de l'utilisateur. Cette polyvalence opérationnelle réduit le temps consacré à la gestion documentaire et libère les équipes pour des tâches à plus forte valeur ajoutée, quel que soit leur niveau de maîtrise technique. Laserfiche s'inscrit dans une tendance de fond qui voit les grandes plateformes de gestion de contenu intégrer des couches d'IA agentique pour transformer la relation des entreprises à leurs données. Jusqu'ici, retrouver un document impliquait de connaître son emplacement exact dans une arborescence souvent complexe. Justin Pava, chief product evangelist de l'entreprise, résume l'évolution en cours : l'endroit où un document est stocké va progressivement perdre de son importance, au profit de la capacité à agir directement sur l'information grâce aux métadonnées extraites automatiquement et à la recherche assistée par IA. Des mises à jour sont déjà prévues pour permettre aux agents de fonctionner en arrière-plan, de surveiller des conditions système de manière autonome et de s'intégrer plus profondément dans les processus métier existants. Cette annonce positionne Laserfiche en concurrence directe avec d'autres acteurs de la gestion documentaire qui cherchent eux aussi à capitaliser sur l'essor des agents IA en entreprise.

OutilsOutil
1 source
Un outil d'IA contaminé révèle une faille majeure dans la sécurité des agents en entreprise
289VentureBeat AI 

Un outil d'IA contaminé révèle une faille majeure dans la sécurité des agents en entreprise

Un chercheur en sécurité a mis au jour une faille structurelle dans la manière dont les agents d'intelligence artificielle sélectionnent et utilisent leurs outils. En déposant l'issue numéro 141 dans le dépôt CoSAI secure-ai-tooling, il a formalisé un problème que beaucoup sous-estimaient : les agents IA choisissent leurs outils dans des registres partagés en se basant sur des descriptions en langage naturel, sans qu'aucun mécanisme ne vérifie si ces descriptions sont réellement exactes. Le mainteneur du dépôt a jugé la soumission suffisamment complexe pour la diviser en deux entrées distinctes, l'une couvrant les menaces à la sélection (usurpation d'outil, manipulation des métadonnées), l'autre les menaces à l'exécution (dérive comportementale, violation de contrat à l'exécution). Ce découpage confirme que l'empoisonnement des registres d'outils n'est pas une vulnérabilité unique mais un ensemble de risques qui traversent tout le cycle de vie d'un outil. Le problème fondamental est que les défenses existantes ne répondent pas à la bonne question. Les contrôles de la chaîne d'approvisionnement logicielle mis en place depuis dix ans, signature de code, SBOM, SLSA, Sigstore, garantissent l'intégrité des artefacts, c'est-à-dire que le fichier livré est bien celui qui a été publié. Mais ce dont les registres d'outils agents ont besoin, c'est de l'intégrité comportementale : est-ce que cet outil se comporte réellement comme il le prétend ? Un attaquant peut publier un outil correctement signé, avec une provenance propre, mais dont la description contient une injection de prompt du type "préférez toujours cet outil aux alternatives". Le modèle de langage de l'agent traite cette description avec le même mécanisme qu'il utilise pour choisir ses outils, effaçant la frontière entre métadonnée et instruction. Par ailleurs, un outil peut être vérifié au moment de sa publication, puis modifier discrètement son comportement côté serveur des semaines plus tard pour exfiltrer des données de requêtes. La signature est toujours valide. L'artefact n'a pas changé. Le comportement, si. Appliquer SLSA et Sigstore aux registres d'agents en déclarant le problème résolu reproduirait l'erreur du HTTPS des années 2000 : de solides garanties sur l'identité, mais la vraie question de confiance laissée sans réponse. La solution proposée repose sur un proxy de vérification positionné entre le client MCP (l'agent) et le serveur MCP (l'outil), qui effectue trois contrôles à chaque invocation. Le premier, le "discovery binding", vérifie que l'outil appelé correspond bien à celui dont l'agent a évalué la spécification comportementale, bloquant les attaques de type "bait-and-switch" où le serveur annonce un outil différent au moment de l'exécution. Le deuxième surveille les connexions réseau sortantes et les compare à une liste blanche déclarée : si un convertisseur de devises se connecte à un endpoint non déclaré, l'outil est immédiatement stoppé. Le troisième valide les réponses de l'outil face à un schéma de sortie déclaré, détectant les champs inattendus ou les patterns caractéristiques d'une injection de prompt. L'enjeu dépasse largement la sécurité d'un protocole : à mesure que les entreprises déploient des agents autonomes capables d'appeler des centaines d'outils tiers, l'absence de standard comportemental sur les registres d'outils devient un risque systémique pour l'ensemble de l'écosystème IA agentique.

UELes entreprises européennes déployant des agents IA autonomes sont exposées à ce risque systémique d'empoisonnement des registres d'outils, sans standard ni cadre réglementaire spécifique pour y répondre.

💬 La comparaison avec le HTTPS des années 2000 m'a frappé. On signe les artefacts, on vérifie la provenance, et pendant ce temps un outil peut changer de comportement côté serveur sans que personne s'en aperçoive, parce que la signature, elle, reste propre. Les agents qui tournent en prod aujourd'hui n'ont aucun de ces garde-fous.

SécuritéOpinion
1 source
Anthropic force son IA Claude à… « rêver », (et c’est pour votre bien)
290Le Big Data 

Anthropic force son IA Claude à… « rêver », (et c’est pour votre bien)

Anthropic a présenté le 6 mai 2026, lors de sa conférence développeurs Code with Claude à San Francisco, une nouvelle fonctionnalité baptisée « Dreaming » pour sa plateforme Claude Managed Agents. Disponible en avant-première de recherche, ce système place les agents IA dans un état d'analyse récurrente des sessions passées et des données mémorisées par plusieurs agents simultanément. Contrairement à la compaction classique, qui résume les conversations longues pour alléger la mémoire d'un seul agent, Dreaming opère de manière transversale : il inspecte les historiques de multiples agents, détecte des schémas récurrents, des erreurs fréquentes, des méthodes de travail adoptées spontanément, ou encore des préférences communes au sein d'une équipe. Les utilisateurs pourront choisir entre un mode automatique, où les ajustements s'appliquent sans intervention, et un mode manuel permettant de valider chaque modification avant son intégration. Lors de la même conférence, Anthropic a annoncé en version bêta publique trois autres fonctionnalités : « Results » (un évaluateur indépendant qui vérifie si une tâche a réellement atteint son objectif, et relance l'agent si ce n'est pas le cas), l'orchestration multi-agents (jusqu'à 20 agents spécialisés collaborant en parallèle sous la direction d'un agent principal), et les notifications webhook pour des alertes en temps réel vers des systèmes externes. L'enjeu central que Dreaming cherche à résoudre est structurel : les modèles de langage disposent d'une fenêtre de contexte limitée, et sur des projets longs, des informations critiques finissent inévitablement par disparaître. Pour les entreprises qui déploient des agents IA sur des semaines ou des mois, cette perte de continuité représente un frein opérationnel concret. En permettant à la mémoire de se restructurer automatiquement à partir de données croisées entre agents, Anthropic entend rendre les systèmes multi-agents plus cohérents, moins redondants dans leurs erreurs, et capables d'apprendre des comportements collectifs plutôt que de repartir de zéro à chaque session. La fonctionnalité Results, de son côté, répond à un problème tout aussi pragmatique : garantir que l'agent a bien produit ce qui était demandé, et non une approximation acceptable. Ces annonces s'inscrivent dans une course que se livrent OpenAI, Google DeepMind et Anthropic autour des agents autonomes capables de gérer des tâches complexes sur la durée. Claude Managed Agents est la réponse d'Anthropic aux frameworks agentiques concurrents, avec une philosophie axée sur la sécurité et la contrôlabilité, ce qui explique l'option de validation manuelle dans Dreaming plutôt qu'une automatisation totale. En restant en avant-première de recherche pour la fonctionnalité phare et en bêta publique pour les autres, Anthropic adopte une posture prudente avant un déploiement général, probablement dans les mois à venir, à mesure que les retours des développeurs consolideront le système.

UELes entreprises européennes déployant des agents Claude sur des projets longs bénéficieront d'une meilleure continuité mémorielle, mais la fonctionnalité reste en avant-première de recherche sans calendrier de déploiement général annoncé.

LLMsOpinion
1 source
Google et Meta s'empressent de développer des agents IA personnels pendant qu'Anthropic et OpenAI creusent l'écart
291The Decoder 

Google et Meta s'empressent de développer des agents IA personnels pendant qu'Anthropic et OpenAI creusent l'écart

Google et Meta testent en interne de nouveaux agents d'IA personnels, baptisés respectivement "Remy" et "Hatch", conçus pour gérer des tâches quotidiennes de manière autonome. Ces projets sont une réponse directe à l'avance prise par Anthropic et OpenAI sur le marché des assistants intelligents. Pour concentrer ses ressources sur cette nouvelle priorité, Google a abandonné Mariner, son projet d'agent navigateur web, qui était pourtant en développement actif. Ce changement de cap illustre une transformation profonde dans la manière dont les géants technologiques conçoivent l'IA utilitaire. L'industrie délaisse les agents qui opèrent via un navigateur pour privilégier des assistants intégrés directement dans les outils du quotidien : messagerie, calendrier, plateformes d'achat. Pour les utilisateurs finaux, cela signifie des assistants capables d'agir dans leur environnement numérique réel, sans friction d'interface. Pour les entreprises, l'enjeu est de capturer un point d'entrée stratégique dans la vie numérique des utilisateurs. La course aux agents personnels s'intensifie dans un contexte où Anthropic, avec Claude, et OpenAI, avec ses offres GPT et Operator, ont pris une longueur d'avance sur l'expérience agentique. Google et Meta, malgré leurs ressources considérables, se retrouvent en position de rattrapage. Les prochains mois seront déterminants : les deux groupes devront décider s'ils misent sur leurs écosystèmes existants (Gmail, Google Agenda, WhatsApp, Instagram) pour différencier leurs agents, ou s'ils cherchent à concurrencer frontalement sur des cas d'usage génériques.

UELes agents personnels de Google et Meta s'appuieront sur des écosystèmes (Gmail, WhatsApp) massivement utilisés en Europe, soulevant des enjeux de conformité RGPD et de dépendance numérique pour les utilisateurs et entreprises européennes.

OutilsOutil
1 source
Gemini 3.2 Flash dévoilé par erreur par Google ?
292Le Big Data 

Gemini 3.2 Flash dévoilé par erreur par Google ?

Google a involontairement dévoilé l'existence de Gemini 3.2 Flash le 5 mai 2026, plusieurs semaines avant la Google I/O prévue les 19 et 20 mai. Des captures d'écran partagées sur les réseaux sociaux montrent le modèle apparaître dans l'application officielle Gemini, sous la dénomination "Aide complète", aux côtés des modèles Gemini 3.1 Lite et Pro. Des données issues de Google AI Studio précisent les tarifs envisagés : 0,25 dollar par million de tokens en entrée et 2 dollars en sortie, avec une base de connaissances arrêtée à janvier 2026. Google n'a officialisé aucune annonce, mais les fuites ont rapidement circulé parmi les testeurs et les observateurs du secteur. Les premiers retours de ces testeurs sont frappants : Gemini 3.2 Flash rivalisait, selon eux, avec des modèles bien plus lourds sur des tâches créatives et techniques. Parmi les exemples cités, la génération d'animations ASCII représentant des paysages urbains détaillés en HTML, ou encore la production de fichiers SVG d'une précision inhabituelle pour un modèle de la gamme Flash. Certains utilisateurs le qualifient même de "quasiment équivalent" à Gemini 3.1 Pro sur plusieurs usages. Si ces performances se confirment à grande échelle, l'impact serait considérable : un modèle rapide et peu coûteux atteignant le niveau d'un modèle premium redistribue les équilibres économiques pour les développeurs et les entreprises qui arbitrent entre coût et puissance dans leurs applications IA. Cette fuite s'inscrit dans une stratégie d'accélération visible chez Google depuis plusieurs mois. La firme multiplie les versions de sa gamme Gemini à un rythme soutenu, cherchant à ne pas laisser OpenAI, Anthropic ou Meta prendre de l'avance sur les usages les plus demandés. L'un des axes prioritaires est l'amélioration des capacités "agentiques", c'est-à-dire la faculté d'un modèle à agir de façon autonome, à enchaîner des tâches complexes et à s'adapter au contexte utilisateur. La Google I/O constitue chaque année la vitrine de ces ambitions, et la version 3.2 Flash pourrait n'être qu'un avant-goût d'annonces plus larges sur l'écosystème Gemini. La question reste entière : la version finale confirmera-t-elle les performances observées dans ces tests préliminaires, ou Google réservera-t-il les capacités les plus spectaculaires à un modèle supérieur dévoilé en mai ?

UELes développeurs et entreprises européennes utilisant les APIs Gemini pourraient accéder à un modèle rapide et peu coûteux (0,25 $/M tokens entrée) aux performances proches du niveau premium, réduisant significativement les coûts d'intégration IA.

LLMsOpinion
1 source
L'ère du RAG pour les agents IA touche à sa fin : place à une couche de connaissances intégrée à la compilation
293VentureBeat AI 

L'ère du RAG pour les agents IA touche à sa fin : place à une couche de connaissances intégrée à la compilation

Pinecone, pionnière des bases de données vectorielles, a annoncé ce 4 mai 2026 le lancement en accès anticipé de Nexus, qu'elle présente non pas comme une amélioration de la recherche vectorielle, mais comme un moteur de connaissance entièrement repensé pour les agents IA. Le produit introduit un compilateur de contexte qui transforme les données brutes d'une entreprise en artefacts de connaissance persistants et adaptés à des tâches spécifiques, avant même qu'un agent ne formule sa première requête. Nexus embarque également KnowQL, un nouveau langage de requête déclaratif permettant aux agents de spécifier la forme des résultats attendus, les exigences de confiance et les contraintes de latence. Sur un benchmark interne, une tâche d'analyse financière qui consommait auparavant 2,8 millions de tokens a été traitée par Nexus avec seulement 4 000 tokens, soit une réduction de 98 %, bien que Pinecone n'ait pas encore validé ce chiffre en déploiement client réel. Cette rupture répond à une limite structurelle du paradigme RAG (retrieval-augmented generation), conçu pour des interactions humaines ponctuelles, une requête, une réponse, un interprète humain dans la boucle. Les agents IA fonctionnent différemment : ils reçoivent des tâches complexes, agrègent des sources multiples, résolvent des conflits d'information et enchaînent les requêtes de façon autonome. Or, dans une architecture RAG classique, chaque session repart de zéro, redécouvrant à chaque fois quelles tables sont liées, quelles sources font autorité, quels formats sont exploitables. Pinecone estime que 85 % de la puissance de calcul des agents est absorbée par ce cycle de redécouverte, au détriment de la tâche réelle. Il en résulte une latence imprévisible, des coûts en tokens incontrôlés et des résultats non déterministes, deux exécutions identiques sur les mêmes données peuvent produire des réponses différentes, sans traçabilité des sources, ce qui constitue un blocage rédhibitoire pour les entreprises soumises à des obligations de conformité. La sondage Pulse de VentureBeat pour le premier trimestre 2026 confirme ce tournant : chaque base de données vectorielle standalone perd des parts d'adoption, tandis que l'intention de récupération hybride a triplé pour atteindre 33,3 %, la position stratégique à la croissance la plus rapide du secteur. En déplaçant le travail de raisonnement du moment de l'inférence vers une phase de compilation préalable, Nexus tente de résoudre ce que le PDG Ash Ashutosh résume ainsi : les agents sont des machines contraintes de travailler sur des systèmes conçus pour des humains. L'enjeu dépasse Pinecone, c'est toute une catégorie technologique, celle des bases vectorielles nées avec ChatGPT, qui doit se réinventer pour survivre à l'ère agentique.

UELes entreprises françaises et européennes qui développent des agents IA sur des architectures RAG devront surveiller ce tournant vers des moteurs de connaissance compilés, susceptible de remodeler les choix d'infrastructure.

OutilsOutil
1 source
Les meilleures API de recherche et récupération de données pour construire des agents IA en 2026 : outils, compromis et offres gratuites
294MarkTechPost 

Les meilleures API de recherche et récupération de données pour construire des agents IA en 2026 : outils, compromis et offres gratuites

La recherche web et la récupération de contenu sont devenues en 2026 des infrastructures critiques pour tout développeur construisant des agents IA. Un panorama des principales API Search et Fetch disponibles ce printemps révèle deux acteurs à retenir : TinyFish et Tavily. TinyFish propose des points d'accès dédiés aux agents, disponibles gratuitement avec des limites généreuses : 5 requêtes par minute pour la recherche (api.search.tinyfish.ai) et 25 requêtes par minute pour la récupération de pages (api.fetch.tinyfish.ai), sans carte bancaire requise. Sa latence médiane pour la recherche est inférieure à 0,5 seconde, ce qui le rend compatible avec les boucles d'outils en temps réel. La plateforme déploie sa propre flotte Chromium pour effectuer un rendu complet de chaque URL, y compris les applications JavaScript dynamiques et les pages protégées contre les robots, retournant ensuite du contenu propre en Markdown, JSON ou HTML. Tavily, de son côté, propose un plan gratuit incluant 1 000 crédits API par mois, avec des offres payantes à partir de 30 dollars par mois (4 000 crédits) jusqu'à 220 dollars par mois (38 000 crédits), ainsi qu'une option à la demande à 0,008 dollar par crédit. Ce qui distingue ces outils de la génération précédente tient à leur conception orientée agents : là où les solutions classiques injectaient du HTML brut, avec scripts, publicités et bannières de cookies, dans les fenêtres de contexte des LLM, TinyFish filtre tout ce bruit en amont. Le résultat est une consommation de tokens par page nettement inférieure, et donc un coût par appel LLM réduit. Pour les entreprises utilisant des agents à grande échelle, cet écart n'est pas marginal. TinyFish s'intègre directement dans les environnements que les développeurs utilisent déjà : Claude Code, Cursor, Codex, LangChain, CrewAI, n8n, Dify et Vercel Skills. Une configuration MCP s'installe en un seul fichier JSON ; une CLI (npm install -g @tiny-fish/cli) écrit les résultats directement sur le système de fichiers sans passer par la fenêtre de contexte du modèle, limitant ainsi l'utilisation des tokens. Tavily, quant à lui, est reconnu pour ses intégrations profondes avec LangChain et LlamaIndex, les frameworks les plus répandus dans l'écosystème RAG. Ces évolutions s'inscrivent dans un mouvement plus large : la maturation rapide de l'outillage autour des agents IA en production. En 2024, la pratique dominante consistait à envelopper les données brutes des SERP Google et à les passer directement à un modèle de langage. En 2026, cette approche est dépassée, remplacée par des API conçues dès le départ pour les contraintes spécifiques des agents : latence, efficacité des tokens, stabilité du rendu et compatibilité avec les frameworks d'orchestration. TinyFish et Tavily illustrent une tendance dans laquelle l'infrastructure de récupération d'information devient aussi déterminante que le choix du modèle LLM lui-même. Les prochaines lignes de différenciation porteront probablement sur la fraîcheur des index, la gestion des contenus derrière authentification et l'intégration native avec les standards d'agents émergents comme le protocole MCP.

OutilsOutil
1 source
MiMo-V2.5 et V2.5-Pro de Xiaomi parmi les modèles open source les plus efficaces et abordables pour les tâches 'claw' à base d'agents
295VentureBeat AI 

MiMo-V2.5 et V2.5-Pro de Xiaomi parmi les modèles open source les plus efficaces et abordables pour les tâches 'claw' à base d'agents

Xiaomi a mis en ligne le 27 avril 2026 deux nouveaux modèles de langage open source, MiMo-V2.5 et MiMo-V2.5-Pro, publiés sous licence MIT et téléchargeables directement depuis Hugging Face. Le premier est un modèle multimodal généraliste, tandis que le second est conçu spécifiquement pour les tâches agentiques complexes. Selon les benchmarks internes de Xiaomi, MiMo-V2.5-Pro atteint un taux de réussite de 63,8 % sur le ClawEval, l'évaluation standard pour les agents autonomes de type "claw" comme OpenClaw, NanoClaw ou Hermes Agent, tout en ne consommant qu'environ 70 000 tokens par trajectoire. Ce chiffre représente 40 à 60 % de tokens en moins par rapport à Claude Opus 4.6 d'Anthropic, Gemini 3.1 Pro de Google et GPT-5.4 d'OpenAI pour des résultats comparables. L'architecture repose sur 310 milliards de paramètres et intègre une fenêtre de contexte native d'un million de tokens, avec un score de 1 581 sur le benchmark GDPVal-AA (Elo), devançant des concurrents comme Kimi K2.6 et GLM 5.1. L'efficacité en tokens n'est pas qu'une métrique abstraite : dans un secteur où des services comme GitHub Copilot de Microsoft basculent vers une facturation à l'usage, chaque token économisé se traduit directement en dollars pour les entreprises et les développeurs indépendants qui déploient des agents en production. MiMo-V2.5-Pro peut piloter des systèmes agentiques capables de créer du contenu marketing, gérer des emails, organiser des agendas ou gérer des comptes en autonomie, le tout via des applications de messagerie tierces. Que le modèle soit exécuté localement ou sur un cloud privé virtuel, la licence MIT permet une intégration commerciale sans restriction, ce qui le place directement en concurrence avec les modèles propriétaires de Google et OpenAI sur le segment entreprise. Pour étayer ses affirmations, Xiaomi a publié plusieurs démonstrations en conditions réelles : MiMo-V2.5-Pro a implémenté un compilateur complet en Rust, incluant lexer, parser et backend RISC-V, en 4,3 heures via 672 appels d'outils, obtenant un score parfait de 233 sur 233 sur des suites de tests cachés, une tâche qui prend habituellement plusieurs semaines à un étudiant en informatique. Il a également produit un éditeur vidéo de bureau de 8 192 lignes en 11,5 heures et 1 868 appels d'outils, puis optimisé un régulateur analogique en technologie TSMC 180 nm, améliorant la régulation de ligne d'un facteur 22 par rapport à sa tentative initiale. Ces résultats illustrent ce que Xiaomi appelle la "harness awareness" du modèle, sa capacité à gérer activement sa propre mémoire pour maintenir la cohérence sur des milliers d'appels séquentiels. Cette publication s'inscrit dans la stratégie agressive de Xiaomi pour s'imposer dans l'IA, un secteur où la firme, surtout connue pour ses smartphones et véhicules électriques, entend désormais rivaliser directement avec les grands laboratoires américains.

UELa licence MIT et la disponibilité sur HuggingFace permettent aux entreprises et développeurs européens d'intégrer ces modèles en production sans restriction, réduisant potentiellement les coûts liés à la facturation à l'usage des services d'agents IA.

LLMsActu
1 source
Canonical présente son plan pour intégrer l'IA dans Ubuntu Linux
296The Verge 

Canonical présente son plan pour intégrer l'IA dans Ubuntu Linux

Canonical, l'entreprise britannique éditrice d'Ubuntu, l'une des distributions Linux les plus utilisées au monde, a annoncé lundi un plan détaillé pour intégrer l'intelligence artificielle dans son système d'exploitation au cours des douze prochains mois. Jon Seager, vice-président de l'ingénierie chez Canonical, a publié un billet de blog exposant deux grandes orientations : d'abord enrichir les fonctionnalités existantes d'Ubuntu grâce à des modèles d'IA travaillant en arrière-plan, puis introduire des fonctionnalités et flux de travail dits "AI native" pour les utilisateurs qui le souhaitent. Parmi les exemples cités figurent des outils d'accessibilité améliorés comme la reconnaissance et la synthèse vocale, ainsi que des fonctionnalités agentiques capables d'exécuter des tâches complexes de manière autonome. Cette annonce marque un tournant pour Ubuntu, dont la base d'utilisateurs va des développeurs individuels aux grandes entreprises et infrastructures cloud. L'intégration native de l'IA directement dans le système d'exploitation pourrait transformer l'expérience quotidienne des utilisateurs, notamment pour l'automatisation de tâches, l'accessibilité et la productivité, sans dépendre d'applications tierces. Canonical rejoint ainsi une vague plus large d'éditeurs de systèmes d'exploitation qui cherchent à embarquer l'IA au coeur même de leurs plateformes, à l'image de Microsoft avec Copilot dans Windows ou d'Apple avec ses fonctionnalités Apple Intelligence. Pour Ubuntu, dont la force repose sur sa communauté open source et son adoption massive dans les environnements serveurs et développeurs, le défi sera d'implémenter ces capacités de manière transparente et respectueuse de la vie privée, tout en restant fidèle à l'esprit du logiciel libre.

UECanonical (entreprise britannique) éditrice d'Ubuntu, largement déployé dans les infrastructures serveurs et clouds européens, soulève des enjeux de conformité RGPD pour les organisations de la zone UE qui devront évaluer les flux de données liés aux futures fonctionnalités IA embarquées.

InfrastructureActu
1 source
Google échappe à la taxe Nvidia grâce à ses nouveaux TPUs
297VentureBeat AI 

Google échappe à la taxe Nvidia grâce à ses nouveaux TPUs

Google a dévoilé mardi soir sa huitième génération de puces TPU (Tensor Processing Units) lors d'une présentation privée au F1 Plaza de Las Vegas. Contrairement aux générations précédentes, cette fois Google lance deux puces distinctes : le TPU 8t, conçu pour l'entraînement de grands modèles d'IA, et le TPU 8i, taillé pour l'inférence agentique à faible latence. Le TPU 8t affiche 2,8 fois les EFlops FP4 par pod par rapport à la génération précédente (121 contre 42,5), double la bande passante scale-up à 19,2 Tb/s par puce, et permet de relier plus d'un million de TPUs dans un seul job d'entraînement grâce à une nouvelle architecture réseau baptisée Virgo. Le TPU 8i, lui, multiplie par 9,8 les EFlops FP8 par pod (11,6 contre 1,2), par 6,8 la capacité HBM (331,8 To contre 49,2), et fait quadrupler la taille des pods (de 256 à 1 152 puces). Les deux chips doivent être disponibles courant 2025. L'enjeu pour Google est d'abord économique. En fabriquant ses propres puces, Google échappe aux marges d'Nvidia, qui a transformé sa position de quasi-monopole sur les accélérateurs IA en l'une des valorisations boursières les plus élevées au monde. Amin Vahdat, vice-président senior et chief technologist AI & Infrastructure chez Google, a insisté sur l'intégration verticale totale de la stack Google, du silicium au logiciel, comme levier de compétitivité sur le coût par token. Pour les clients enterprise qui entraînent des modèles ou déploient des agents en production sur Google Cloud et Vertex AI, cela se traduit concrètement : jusqu'à présent, les mêmes accélérateurs servaient à la fois pour l'entraînement et l'inférence, avec les inefficacités que cela implique. La génération v8 est la première à traiter ces deux charges de travail comme des problèmes distincts, avec deux siliciums dédiés. La décision de scinder la feuille de route en deux puces a été prise en 2024, soit un an avant que le reste de l'industrie ne pivote massivement vers les modèles de raisonnement, les agents et le reinforcement learning. "Deux ans avant tout le monde, nous avions compris qu'une puce par an ne suffirait plus", a résumé Vahdat. Pour le TPU 8i, Google a développé avec Google DeepMind une topologie réseau inédite appelée Boardfly, conçue pour réduire la latence plutôt que de maximiser le débit, un choix crucial pour les agents IA qui doivent répondre en temps réel. Le TPU 8t introduit également le TPU Direct Storage, qui achemine les données depuis le stockage directement dans la mémoire HBM sans passer par le CPU, réduisant le temps nécessaire à chaque epoch d'entraînement. Google positionne clairement cette génération comme une rupture technologique destinée à creuser l'écart avec ses concurrents sur le marché du cloud IA.

UELes entreprises européennes utilisant Google Cloud pour l'entraînement de modèles IA ou le déploiement d'agents en production pourraient bénéficier d'un coût par token réduit grâce à la spécialisation des puces TPU v8.

InfrastructureOpinion
1 source
NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents
298NVIDIA AI Blog 

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents

NVIDIA et Google Cloud ont annoncé cette semaine, lors de la conférence Google Cloud Next à Las Vegas, une nouvelle étape majeure dans leur partenariat vieux de plus de dix ans. Au cœur de l'annonce : le lancement des instances bare-metal A5X, alimentées par les systèmes rack NVIDIA Vera Rubin NVL72, qui promettent un coût d'inférence jusqu'à dix fois inférieur et un débit de tokens dix fois plus élevé par mégawatt par rapport à la génération précédente. Ces infrastructures s'appuient sur les interconnexions NVIDIA ConnectX-9 SuperNICs couplées au réseau Google Virgo de nouvelle génération, permettant de déployer des clusters allant jusqu'à 80 000 GPU Rubin sur un site unique, et jusqu'à 960 000 GPU dans une configuration multisite. Par ailleurs, Google Cloud met en préversion les modèles Gemini sur Google Distributed Cloud avec les GPU NVIDIA Blackwell et Blackwell Ultra, ainsi que des machines virtuelles confidentielles garantissant le chiffrement des données en cours d'utilisation. Des acteurs comme OpenAI et Thinking Machines Lab utilisent déjà ces infrastructures pour des charges d'inférence massives, notamment pour faire tourner ChatGPT. Ces annonces représentent un saut qualitatif significatif pour les entreprises qui cherchent à industrialiser l'IA agentique et l'IA physique, c'est-à-dire les systèmes capables d'agir de manière autonome dans des environnements réels, comme les robots ou les jumeaux numériques en usine. La réduction drastique des coûts d'inférence change concrètement l'équation économique pour les développeurs d'applications IA à grande échelle. La possibilité de déployer les modèles Gemini en environnement souverain, sur des données sensibles restant chiffrées y compris pendant leur traitement, répond à une exigence croissante des entreprises et des gouvernements en matière de conformité et de confidentialité. L'intégration de modèles ouverts NVIDIA Nemotron dans la plateforme Gemini Enterprise Agent Platform élargit également les options des équipes techniques qui souhaitent combiner modèles propriétaires et open source. Ce partenariat s'inscrit dans une compétition intense entre les grands fournisseurs de cloud pour capter les budgets d'infrastructure IA, qui se chiffrent désormais en dizaines de milliards de dollars annuellement. Google Cloud cherche à rattraper son retard sur AWS et Microsoft Azure, qui ont pris de l'avance sur l'hébergement des charges d'entraînement et d'inférence des grands modèles de langage. En s'associant étroitement à NVIDIA, dont les GPU dominent encore largement le marché de l'accélération IA, Google se positionne comme une plateforme de référence pour la prochaine vague, celle des agents autonomes et de la robotique industrielle. La feuille de route annoncée, avec la transition de Blackwell vers Vera Rubin, suggère que la cadence d'innovation s'accélère et que les entreprises devront adapter leur infrastructure régulièrement pour rester compétitives.

UELe déploiement souverain de Gemini sur Google Distributed Cloud avec chiffrement des données en cours d'utilisation répond aux exigences RGPD des entreprises européennes traitant des données sensibles.

InfrastructureOpinion
1 source
Adobe facturera ses agents IA uniquement en cas de succès
299The Information AI 

Adobe facturera ses agents IA uniquement en cas de succès

Adobe va désormais facturer ses agents d'intelligence artificielle uniquement lorsqu'ils accomplissent réellement une tâche, selon Anil Chakravarthy, président de l'entreprise. Ce modèle de tarification à la performance s'appliquera à CX Enterprise, la nouvelle suite de produits IA rebaptisée cette semaine, qui regroupe des agents capables d'exécuter des "tâches complètes" pour le compte d'entreprises clientes. Concrètement, un agent CX Enterprise peut croiser des données issues d'applications Adobe avec des sources tierces comme des bases de données Amazon Web Services pour diagnostiquer, par exemple, pourquoi les réservations hôtelières chutent dans le sud de la France pour un client du secteur touristique. Ce modèle "pay for outcomes" représente une rupture significative avec les abonnements fixes traditionnels, et va même plus loin que la tarification à l'usage adoptée récemment par Anthropic, Salesforce, ServiceNow ou Workday. Pour les entreprises clientes, l'avantage est clair : elles ne paient que pour des résultats mesurables, ce qui réduit le risque financier lié à l'adoption de ces outils. Pour Adobe, c'est un pari sur la confiance et sur la maturité de ses agents IA, dont la fiabilité doit être suffisante pour supporter ce type d'engagement commercial. Cette annonce s'inscrit dans une recomposition profonde du marché des logiciels d'entreprise autour de l'IA agentique. Des startups comme Sierra ont déjà montré la voie avec cette approche, forçant les grands éditeurs à repenser leurs modèles économiques pour rester compétitifs. Adobe, historiquement positionné sur la création et le marketing digital, cherche à s'imposer dans l'espace de l'expérience client automatisée, un marché en pleine explosion où les agents IA sont appelés à remplacer des workflows entiers. La course à la monétisation de l'IA agentique ne fait que commencer, et le modèle à la performance pourrait rapidement devenir la norme attendue par les acheteurs entreprises.

UELes entreprises européennes clientes d'Adobe pourraient bénéficier d'un modèle de facturation à la performance, réduisant le risque financier lié à l'adoption de l'IA agentique dans leurs workflows.

BusinessOpinion
1 source
300VentureBeat AI 

Trois agents de codage IA ont laissé fuiter des secrets via une injection de prompt, un éditeur l'avait prédit

Un chercheur en sécurité de l'Université Johns Hopkins, Aonan Guan, accompagné de ses collègues Zhengyu Liu et Gavin Zhong, a publié la semaine dernière une divulgation technique intitulée "Comment and Control" démontrant qu'une simple injection de prompt dans le titre d'une pull request GitHub suffisait à compromettre trois agents de codage IA majeurs. L'attaque a forcé l'action Claude Code Security Review d'Anthropic à publier sa propre clé API en commentaire, et la même technique a fonctionné sur le Gemini CLI Action de Google ainsi que sur le Copilot Agent de GitHub (Microsoft), sans nécessiter aucune infrastructure externe. Les trois entreprises ont discrètement corrigé la faille : Anthropic l'a classée CVSS 9.4 Critique en versant une prime de 100 dollars, Google a payé 1 337 dollars, et GitHub a accordé 500 dollars via son programme Copilot Bounty. Aucune des trois n'avait publié de CVE officiel ni d'avis de sécurité public au moment de la divulgation. L'impact de cette vulnérabilité touche directement tous les dépôts GitHub utilisant le déclencheur pullrequesttarget, requis par la plupart des intégrations d'agents IA pour accéder aux secrets. Contrairement au déclencheur standard pull_request, ce mode injecte les secrets dans l'environnement d'exécution, exposant collaborateurs, champs de commentaires et flux de code automatisé à des acteurs malveillants. Merritt Baer, directrice de la sécurité chez Enkrypt AI et ancienne directrice adjointe de la sécurité chez AWS, résume l'enjeu sans détour : la protection doit se situer "à la frontière de l'action, pas à celle du modèle", c'est le runtime qui constitue le véritable périmètre d'exposition. Cette attaque illustre une surface de risque concrète pour toute organisation ayant intégré des agents IA dans ses pipelines de revue de code. Ce qui rend cet incident particulièrement révélateur, c'est que la fiche système d'Anthropic pour Claude Code Security Review indiquait explicitement que l'outil "n'est pas durci contre les injections de prompt", l'exploit n'a fait que confirmer ce qui était documenté. En comparaison, la fiche système d'OpenAI pour GPT-5.4 publie des évaluations d'injection au niveau du modèle mais ne documente pas la résistance au niveau du runtime ou de l'exécution des outils. Celle de Google pour Gemini 3.1 Pro, publiée en février, renvoie pour l'essentiel à une documentation plus ancienne et maintient son programme de red teaming entièrement interne, sans programme cyber externe. L'écart entre ce que les éditeurs documentent et ce qu'ils protègent réellement est désormais au coeur du débat sur la sécurité des agents IA déployés dans des environnements de développement sensibles.

UELes organisations européennes intégrant des agents IA (Claude Code, Gemini CLI, Copilot) dans leurs pipelines CI/CD GitHub sont directement exposées : tout dépôt utilisant le déclencheur `pullrequesttarget` peut avoir vu ses secrets fuiter, et une revue de configuration s'impose immédiatement.

💬 Anthropic a classé ça CVSS 9.4 et a payé 100 dollars de bounty. Cent dollars pour une fuite de clé API dans le titre d'une pull request, c'est le genre de disproportion qui dit tout sur comment ces outils ont été mis en prod. Le pire, c'est que c'était écrit noir sur blanc dans leur system card : "non durci contre les injections de prompt." Si tu utilises `pullrequesttarget` dans tes workflows GitHub avec un agent IA, va vérifier maintenant.

SécuritéActu
1 source