Aller au contenu principal

Outils — page 10

1357 articles · page 10 sur 28

Les meilleurs outils IA : applications, produits et services propulsés par l'intelligence artificielle.

Hapag-Lloyd utilise Amazon Bedrock pour transformer les retours clients en informations exploitables
451AWS ML Blog OutilsOutil

Hapag-Lloyd utilise Amazon Bedrock pour transformer les retours clients en informations exploitables

Hapag-Lloyd, l'un des leaders mondiaux du transport maritime de conteneurs, a déployé une solution d'analyse automatisée des retours clients basée sur Amazon Bedrock, le service d'IA générative d'AWS. L'armateur allemand, qui exploite une flotte de 313 porte-conteneurs représentant 2,5 millions d'EVP de capacité de transport, emploie environ 14 000 personnes dans son segment de lignes régulières et gère plus de 400 bureaux dans 140 pays. Son équipe d'ingénierie produit, répartie entre Hambourg et Gdańsk, pilote cette initiative dans le cadre d'une ambition plus large de devenir une entreprise dite "AI-native". Le système s'appuie sur Amazon Bedrock, LangChain et LangGraph, ainsi qu'Elasticsearch pour collecter les commentaires clients, en extraire le sentiment, identifier des thèmes récurrents et produire des synthèses exploitables. L'enjeu est d'abord opérationnel : avant cette solution, les chefs de produit exportaient manuellement des fichiers CSV toutes les deux semaines, parcouraient des centaines de commentaires et les catégorisaient à la main, un travail qui pouvait mobiliser plusieurs heures, parfois plusieurs jours, avant chaque réunion de revue produit. Désormais, l'ensemble de ce flux est automatisé, de l'ingestion des données à la production d'insights. Les équipes peuvent ainsi se concentrer sur la stratégie et l'innovation plutôt que sur l'analyse répétitive. Pour une entreprise qui relie plus de 600 ports via 133 lignes régulières mondiales et traite un volume massif d'interactions clients, la capacité à lire rapidement les signaux du terrain constitue un avantage concurrentiel direct sur la qualité de service et la réactivité produit. Cette transformation s'inscrit dans une dynamique plus large de l'industrie du shipping, où la digitalisation s'accélère sous la pression de la concurrence et des attentes croissantes des chargeurs. Hapag-Lloyd a construit sa capacité sur une stack technologique qu'il maîtrise en propre, ce qui lui a permis d'itérer rapidement vers des usages d'IA générative sans dépendance contraignante. Le choix d'Amazon Bedrock est également révélateur : le service donne accès via une API unifiée aux modèles d'Anthropic, Meta, Mistral, DeepSeek et d'autres, avec des garanties de sécurité et de confidentialité adaptées aux exigences d'un groupe coté en bourse. À mesure que d'autres armateurs et acteurs logistiques adoptent des approches similaires, la capacité à transformer le feedback client en décisions produit en temps quasi réel pourrait devenir un standard du secteur plutôt qu'un avantage différenciant.

UEHapag-Lloyd, armateur allemand coté en bourse avec ses équipes à Hambourg et Gdańsk, automatise l'analyse de ses retours clients via Amazon Bedrock, signalant l'accélération de l'IA générative dans la logistique maritime européenne.

1 source
MLflow v3.10 sur Amazon SageMaker simplifie le développement d'IA générative
452AWS ML Blog 

MLflow v3.10 sur Amazon SageMaker simplifie le développement d'IA générative

Amazon Web Services a annoncé le support de MLflow version 3.10 sur Amazon SageMaker AI MLflow Apps, son service géré de suivi d'expériences machine learning. Cette mise à jour apporte des améliorations ciblées autour de l'observabilité, de l'évaluation et du développement d'applications d'IA générative. Parmi les nouveautés phares figure une API dédiée à l'évaluation, mlflow.genai.evaluation(), qui mesure automatiquement la qualité des modèles selon des critères de pertinence, de fidélité, d'exactitude et de sécurité. MLflow 3.10 introduit également un traçage amélioré pour les workflows multi-tours complexes, une intégration plus étroite avec les principaux frameworks LLM, ainsi que des tableaux de bord de performance préconfigurés affichant la distribution des latences, le nombre de requêtes, les scores de qualité et la consommation de tokens. Ces améliorations ont un impact direct pour les équipes de data scientists et d'ingénieurs ML qui développent des applications d'IA générative en production. L'API d'évaluation permet de mesurer et maintenir la qualité des modèles de manière systématique tout au long du cycle de développement, depuis l'expérimentation jusqu'au déploiement. Les tableaux de bord intégrés éliminent le besoin de configuration manuelle des graphiques, offrant une visibilité immédiate sur les coûts opérationnels et les performances des charges de travail. La notion de "workspaces" MLflow, introduite dans cette version, permet aux équipes d'organiser leurs artefacts et expériences de façon structurée à l'échelle de projets et de départements entiers, ce qui répond à un besoin croissant de gouvernance dans les organisations qui industrialisent leurs déploiements de modèles. MLflow est un framework open source lancé par Databricks en 2018, devenu une référence pour le suivi d'expériences et la gestion du cycle de vie des modèles ML. La version 3.0, publiée précédemment, avait posé les bases du traçage et de l'observabilité pour l'IA générative ; la 3.10 consolide et étend ces fondations en réponse à la montée en puissance des architectures agentiques et des workflows LLM complexes. AWS positionne SageMaker AI comme une infrastructure de niveau entreprise pour l'IA générative, en intégrant MLflow directement dans SageMaker Studio, accessible via la console AWS, l'AWS CLI ou son API. La configuration par défaut provisionne automatiquement MLflow 3.10 avec un rôle IAM et un bucket S3 préconfigurés, abaissant significativement le seuil d'adoption pour les équipes qui souhaitent passer de l'expérimentation à la production sans infrastructure supplémentaire à gérer.

OutilsOutil
1 source
Amazon Bedrock AgentCore Browser : actions au niveau du système d'exploitation
453AWS ML Blog 

Amazon Bedrock AgentCore Browser : actions au niveau du système d'exploitation

Amazon a annoncé cette semaine l'ajout des OS Level Actions à AgentCore Browser, son environnement de navigation isolé et sécurisé disponible dans la plateforme Bedrock. Cette nouvelle capacité est accessible via l'API InvokeBrowser sans configuration supplémentaire pour les sessions existantes comme pour les nouvelles. Elle expose huit actions réparties en trois catégories : contrôle de la souris (clics, positionnement), saisie clavier (touches, raccourcis) et capture visuelle (screenshot plein écran en PNG encodé base64). Le principe de fonctionnement repose sur une boucle action-screenshot-réaction : l'agent exécute une action, capture l'état de l'écran, l'envoie à un modèle de vision pour décider de la prochaine étape, et recommence. Chaque appel API transporte une seule action identifiée par son type et ses arguments, et renvoie un statut SUCCESS ou FAILED lié à la session via l'en-tête x-amzn-browser-session-id. Ce lancement répond à une limite structurelle des outils d'automatisation web actuels. Playwright et le Chrome DevTools Protocol (CDP) opèrent exclusivement dans la couche DOM du navigateur : ils ne voient pas, et ne peuvent donc pas interagir avec, tout ce que le système d'exploitation génère en dehors de cette couche. Les boîtes de dialogue natives comme les demandes d'impression (window.print()), les invites de sécurité Windows ou macOS, les sélecteurs de certificats ou encore les menus contextuels sont totalement invisibles pour CDP. Pour les agents dotés de vision, ce blocage était particulièrement frustrant : le modèle pouvait observer précisément ce qu'il fallait faire sur le screenshot, mais n'avait aucun mécanisme pour agir. Les OS Level Actions comblent exactement ce vide en donnant à l'agent un contrôle direct au niveau du bureau complet, pas seulement du contenu web. Cette annonce s'inscrit dans la montée en puissance des agents d'automatisation web déployés en production, où les workflows réels font surface à des états applicatifs imprévisibles que les tests ne reproduisent pas. La couche DOM est suffisante dans la majorité des scénarios, mais les cas limites, configuration OS spécifique, permissions utilisateur, applications hybrides web-natif, se produisent régulièrement à l'échelle. Amazon positionne AgentCore Browser comme une infrastructure complète pour les agents autonomes, capable de gérer aussi bien le web standard que les interfaces natives du système. L'intégration dans Bedrock suggère que cette fonctionnalité sera prochainement exploitée par des agents construits avec d'autres services de la plateforme, notamment les modèles Claude d'Anthropic disponibles via Bedrock, qui disposent déjà de capacités d'utilisation d'outils et de vision avancées.

OutilsOutil
1 source
Anthropic lance dix agents IA pour la finance, dans la course aux revenus avant introduction en bourse
454The Decoder 

Anthropic lance dix agents IA pour la finance, dans la course aux revenus avant introduction en bourse

Anthropic vient de lancer dix agents d'intelligence artificielle préconfigurés destinés au secteur financier, couvrant des tâches clés comme la recherche d'investissement, les vérifications de conformité et de risque, ainsi que la comptabilité financière. Ces modèles prêts à l'emploi s'adressent directement aux banques d'investissement, aux gestionnaires d'actifs et aux compagnies d'assurance, qui peuvent les déployer sans développement sur mesure. L'annonce s'inscrit dans une offensive commerciale accélérée de la startup californienne, valorisée à plus de 60 milliards de dollars après sa dernière levée de fonds. Ce lancement marque un pivot stratégique important : Anthropic ne se contente plus de vendre un accès brut à son modèle Claude, mais propose désormais des solutions verticales clés en main pour des secteurs à forte valeur ajoutée. Pour les institutions financières, l'enjeu est considérable, automatiser des processus jusqu'ici réservés à des équipes d'analystes coûteux représente des économies potentielles de plusieurs millions de dollars par an. La rapidité de traitement des données réglementaires et des rapports de risque pourrait également réduire les délais de conformité, un avantage concurrentiel direct. Ce mouvement s'explique aussi par la pression croissante sur Anthropic de démontrer une trajectoire de revenus solide en vue d'une éventuelle introduction en bourse. OpenAI suit une logique similaire en multipliant les offres entreprise et les partenariats sectoriels. Les deux acteurs se livrent désormais une bataille frontale pour capturer les budgets technologiques des grandes institutions financières mondiales, un marché estimé à plusieurs dizaines de milliards de dollars.

UELes banques et gestionnaires d'actifs européens sont des cibles directes de ces agents préconfigurés, susceptibles d'accélérer l'adoption de l'IA dans la conformité et la gestion des risques financiers.

💬 Anthropic arrête de vendre de la farine et commence à vendre du pain. Dix agents préconfigurés pour la finance, c'est exactement ce que les DSI attendaient depuis deux ans, parce qu'une API brute ça demande des mois de dev interne avant de créer de la valeur. Reste à voir si ces agents tiennent vraiment face aux workflows réels des banques, ou si c'est un produit nickel en démo et chantier en prod.

OutilsOutil
1 source
Unity AI arrive en bêta ouverte : créer un jeu n’a jamais été aussi rapide (ni aussi inquiétant)
455Le Big Data 

Unity AI arrive en bêta ouverte : créer un jeu n’a jamais été aussi rapide (ni aussi inquiétant)

Unity a lancé le 4 mai 2026 la bêta ouverte de Unity AI, son assistant intégré directement dans l'éditeur Unity 6. L'outil permet aux développeurs de générer du code C# à partir d'une description textuelle, de produire des assets visuels, sprites, textures, sons, en quelques secondes, et de convertir des maquettes Figma en interfaces ou scènes jouables. L'agent embarqué repose sur le modèle Gemini de Google, mais une passerelle d'IA (AI Gateway) permet également de connecter des modèles tiers comme Claude d'Anthropic. Matthew Bromberg, PDG d'Unity, le présente comme « le seul agent d'IA à vraiment connaître Unity de l'intérieur », développé en interne pour coller au plus près des workflows propres au moteur. Un essai gratuit de 14 jours est proposé à l'ensemble des utilisateurs. L'impact est immédiat pour les équipes de développement : les cycles de prototypage s'accélèrent, les blocages techniques se réduisent, et les barrières à l'entrée pour les créateurs indépendants s'abaissent considérablement. Un développeur solo peut désormais itérer sur des mécaniques de jeu sans maîtriser l'intégralité de la chaîne technique. Pour les studios, cela signifie moins de temps passé à produire et davantage consacré à valider et orienter. Mais cette accélération soulève des questions structurelles : si l'IA écrit, corrige et optimise à la place du développeur, le rôle de ce dernier se déplace vers la supervision plutôt que la conception artisanale. Pour les professionnels aguerris, ce glissement n'est pas sans friction, certains redoutent une uniformisation des productions, les mêmes outils tendant mécaniquement vers les mêmes résultats créatifs. Unity traverse depuis plusieurs années une période de turbulences. L'entreprise a essuyé de vives critiques en 2023 après une tentative de modifier sa politique tarifaire à la défaveur des développeurs, provoquant un mouvement de défiance dans l'industrie et des licenciements massifs en interne. L'arrivée de Unity AI s'inscrit dans une stratégie de reconquête : repositionner le moteur comme une plateforme de productivité augmentée, capable de rivaliser avec Unreal Engine d'Epic sur le terrain de l'innovation. Dans un secteur du jeu vidéo déjà fragilisé par des vagues de suppressions de postes, l'automatisation d'une partie des tâches de développement alimente des inquiétudes légitimes sur l'emploi. Le spectre d'une multiplication de jeux génériques de faible qualité, produits massivement grâce à ces outils, plane également sur les plateformes de distribution comme Steam. La bêta ouverte constitue un test grandeur nature : Unity mise sur l'adoption large pour affiner l'outil, tout en cherchant à prouver que l'IA peut amplifier la créativité sans la remplacer.

UELes studios de jeu vidéo français et européens utilisant Unity peuvent accéder immédiatement à la bêta ouverte, avec des implications concrètes sur les workflows de développement et des questions ouvertes sur l'emploi dans un secteur déjà fragilisé.

OutilsOutil
1 source
Les agents IA ratent toutes les discussions de votre équipe. SageOX propose une infrastructure de contexte pour agents autonomes
456VentureBeat AI 

Les agents IA ratent toutes les discussions de votre équipe. SageOX propose une infrastructure de contexte pour agents autonomes

SageOX, une startup de Seattle fondée par des vétérans ayant construit l'infrastructure originale d'AWS EC2 et EBS, est sortie du mode furtif en annonçant un tour de financement de 15 millions de dollars mené par Canaan, avec la participation d'A.Capital, Pioneer Square Labs et Founders' Co-op. L'entreprise, dirigée par Ajit Banerjee, ancien ingénieur chez Hugging Face, Meta, Amazon et Apple, commercialise ce qu'elle appelle une "infrastructure de contexte agentique" : un système conçu pour garder les agents IA aussi informés que les employés humains sur les décisions, discussions et objectifs d'une équipe. La suite produit repose sur deux composants principaux : l'Ox Dot, un petit appareil physique placé dans les espaces partagés qui enregistre réunions et séances de travail d'une simple pression, et l'Ox CLI, un outil en ligne de commande open source sous licence MIT qui permet aux assistants de codage comme Claude Code ou Codex d'interroger la mémoire collective de l'équipe avant d'écrire du code. Le problème que SageOX cherche à résoudre est celui du "drift" des agents, c'est-à-dire leur tendance à s'écarter des intentions réelles de l'équipe parce qu'ils démarrent chaque tâche sans historique ni contexte. Si une équipe décide en réunion d'utiliser un schéma d'authentification précis, l'agent de codage l'ignorera complètement, sauf si quelqu'un le lui précise explicitement dans chaque prompt. L'Ox Dot capture audio, transcrit et identifie les intervenants, puis distille ces échanges en une mémoire d'équipe accessible aux humains et aux agents. Sa fonctionnalité "Auto Rewind" permet même de capturer rétrospectivement une conversation informelle qui s'est tenue sans enregistrement, évitant la perte de décisions prises lors d'échanges spontanés. La commande ox agent prime intègre ensuite cet historique directement dans le contexte de travail des agents. Le problème de l'"ingénierie du contexte" est l'un des défis majeurs non résolus de l'ère agentique. À mesure que les grands fournisseurs de modèles comme OpenAI, Anthropic ou Google descendent dans la chaîne de valeur en proposant leurs propres agents métier, la question de comment équiper ces agents d'un contexte riche et fidèle à la réalité d'une organisation reste entière. SageOX parie que la réponse n'est pas dans le prompt engineering ou la documentation statique, mais dans une couche d'infrastructure dédiée qui capte le contexte là où il se forme naturellement : conversations, tableaux blancs, standups. Ryan Snodgrass, CTO et ancien d'Amazon, pousse même plus loin en remettant en question les principes classiques de gestion de code source, estimant que les historiques "propres" de commits sont souvent contre-productifs pour les agents. La startup s'attaque ainsi à un marché encore peu balisé, à l'intersection de la collaboration d'équipe et de l'orchestration agentique.

OutilsOutil
1 source
Codex gagne du terrain
457Ben's Bites 

Codex gagne du terrain

OpenAI accélère le déploiement de Codex auprès du grand public en annonçant plusieurs évolutions majeures visant à rendre l'outil accessible aux utilisateurs non techniques. La plateforme permet désormais d'importer des paramètres, plugins, agents et configurations de projets depuis des outils concurrents comme Claude, facilitant la migration pour ceux qui souhaitent changer d'environnement. Des améliorations concrètes ont également été déployées pour les tâches du quotidien : création de présentations et de feuilles de calcul, interface plus intuitive, et une intégration iMessage non officielle qui permet d'interagir avec Codex directement depuis son téléphone via un fil de discussion persistant. Par ailleurs, xAI a lancé Grok 4.3 dans son API publique : le modèle supporte un contexte d'un million de tokens, accepte texte et images en entrée, intègre des capacités de raisonnement et dispose d'une base de connaissance arrêtée à décembre 2025. Son tarif, fixé à 1,25 dollar pour un million de tokens en entrée et 2,50 dollars en sortie, le positionne comme une alternative nettement moins chère que Claude Sonnet 4.6 pour des performances comparables. Ces mouvements signalent une intensification de la concurrence dans le segment des assistants de développement et de productivité alimentés par l'IA. En ciblant explicitement les non-développeurs, OpenAI cherche à élargir considérablement son marché potentiel pour Codex, qui était jusqu'ici perçu comme un outil avant tout destiné aux ingénieurs. La guerre des prix entre modèles LLM s'accentue également : la tarification agressive de Grok 4.3 par xAI force les autres acteurs à justifier leurs propres coûts, ce qui devrait bénéficier aux entreprises et développeurs cherchant à réduire leurs dépenses d'infrastructure IA. Enfin, la société Entire, fondée par l'ex-PDG de GitHub, a dévoilé deux outils complémentaires : git-sync, un utilitaire pour synchroniser des dépôts git entre sources sans clonage local, et Dispatches, une fonctionnalité générant automatiquement des notes de version à partir des commits et sessions d'agents par dépôt et plage de dates. Codex a été lancé par OpenAI comme successeur de GitHub Copilot dans une logique d'agent de développement autonome, mais la plateforme peine encore à s'imposer comme outil universel face à des concurrents comme Claude ou Cursor. L'ouverture à des profils non techniques représente un pivot stratégique notable, dans un contexte où la frontière entre outils de développement et outils de productivité généraliste s'efface progressivement. Du côté des benchmarks, un signe d'avertissement : Base44 indique dans son outil Frustration Meter qu'Opus 4.7 génère 43 % de frustration en plus qu'Opus 4.6, suggérant que la course aux capacités ne se traduit pas toujours par une meilleure expérience utilisateur. Les semaines à venir diront si Codex réussit son pari d'élargissement, et si Grok 4.3 parvient à s'imposer comme le modèle rapport qualité-prix de référence.

UELa guerre des prix entre LLM (Grok 4.3 à 1,25 $/M tokens en entrée) devrait permettre aux développeurs et entreprises européens de réduire sensiblement leurs coûts d'infrastructure IA.

OutilsOutil
1 source
Amazon envisage un mode de recherche IA hybride sur son site marchand
458The Information AI 

Amazon envisage un mode de recherche IA hybride sur son site marchand

Amazon envisage d'intégrer des réponses conversationnelles directement dans sa barre de recherche principale, selon Amanda Doerr, vice-présidente en charge du shopping chez Amazon. Jusqu'ici, l'assistant IA Rufus fonctionnait comme un outil séparé, distinct du moteur de recherche classique utilisé par des centaines de millions d'acheteurs. Le modèle envisagé consisterait à afficher un encart conversationnel au-dessus des résultats de recherche pour certaines requêtes, sans rediriger l'utilisateur vers une interface de chatbot distincte. Ce changement pourrait transformer en profondeur la manière dont les consommateurs naviguent sur Amazon, qui reste l'une des premières destinations mondiales pour la recherche de produits. En fusionnant la navigation, la recherche d'information et l'achat dans un seul flux, Amazon réduirait la friction entre la phase de découverte et l'acte d'achat. Pour les vendeurs et les marques présents sur la plateforme, cela soulèverait également des questions importantes sur la visibilité des produits dans un format où une réponse IA pourrait éclipser les résultats organiques traditionnels. Cette évolution s'inscrit dans une course plus large entre les géants technologiques pour intégrer l'IA générative aux interfaces de recherche. Google expérimente depuis 2023 ses "AI Overviews" dans les résultats de recherche, tandis que Microsoft a ajouté Copilot à Bing. Amazon, dont le cœur de métier reste le commerce, doit trouver un équilibre délicat entre améliorer l'expérience utilisateur et préserver la lisibilité des catalogues produits sur lesquels repose son modèle publicitaire.

UELes millions de consommateurs français et les vendeurs présents sur Amazon.fr seraient directement affectés par ce changement, qui modifierait la visibilité des produits et la dynamique de découverte d'articles sur la plateforme.

💬 Amazon c'est la vraie barre de recherche pour les achats, pas Google, et c'est pour ça que ce changement est plus important qu'il n'y paraît. Une réponse IA qui s'affiche avant les résultats organiques, ça remet à zéro dix ans de stratégie SEO marchand pour des milliers de vendeurs. Reste à voir si Amazon est vraiment prêt à toucher à son modèle pub pour ça, parce que là c'est leur chiffre d'affaires qui est en jeu.

OutilsOutil
1 source
Payer moins d’impôts grâce à l’IA : le guide ultime avec tous les prompts
459Le Big Data 

Payer moins d’impôts grâce à l’IA : le guide ultime avec tous les prompts

ChatGPT, Claude et Mistral s'imposent comme de nouveaux outils d'optimisation fiscale pour les particuliers français, selon un guide pratique publié début 2026 détaillant des méthodes concrètes pour réduire légalement sa facture d'impôts grâce à des prompts ciblés. Le guide présente trois stratégies principales : comparer l'abattement forfaitaire de 10 % aux frais réels pour les salariés en télétravail, identifier des charges déductibles méconnues pour les indépendants et micro-entrepreneurs, et arbitrer entre le rattachement fiscal d'un enfant étudiant et le versement d'une pension alimentaire déductible (plafonnée à 6 635 euros). Dans chaque cas, des formulations précises sont proposées pour interroger l'IA avec les bons paramètres : revenus nets imposables, kilométrage domicile-travail, puissance fiscale du véhicule, surface du bureau à domicile ou situation familiale. Ce qui change concrètement, c'est la rupture d'une asymétrie d'information qui durait depuis des décennies : l'optimisation fiscale était jusqu'ici réservée aux contribuables capables de s'offrir un avocat fiscaliste à 300 euros de l'heure ou un expert-comptable. L'IA, entraînée sur des corpus juridiques et comptables massifs incluant le Bulletin Officiel des Finances Publiques (BOFiP), peut simuler en quelques secondes des scénarios complets, rédiger des courriers administratifs avec le vocabulaire juridique adapté, et identifier des niches fiscales que la plupart des contribuables ignorent. Pour les freelances en SASU ou EURL, par exemple, l'outil peut lister des dépenses "grises" légalement déductibles mais rarement réclamées, comme le mobilier ergonomique, les abonnements logiciels ou certains frais de réception. Ce phénomène s'inscrit dans un mouvement plus large de démocratisation des services professionnels via l'IA générative, après les domaines juridique, médical et financier. En France, où la complexité du Code Général des Impôts décourage une grande partie des contribuables de revendiquer leurs droits, l'accessibilité de ces outils représente un changement structurel. Les limites restent néanmoins réelles : les modèles de langage peuvent commettre des erreurs sur des cas complexes ou des dispositions récentes, et aucun ne remplace la responsabilité juridique d'un professionnel certifié. La question qui se pose désormais pour les cabinets comptables est celle de leur repositionnement face à des clients de mieux en mieux informés, capables de préparer eux-mêmes une première analyse avant de consulter un expert.

UELes contribuables français peuvent immédiatement utiliser ChatGPT, Claude et Mistral pour optimiser leur déclaration d'impôts selon le droit fiscal français (BOFiP, CGI), réduisant concrètement l'asymétrie d'information face aux professionnels et potentiellement forçant les cabinets comptables français à repositionner leur offre.

OutilsOutil
1 source
Au-delà du Copilot : Classiq invente l’ingénieur quantique virtuel
460Le Big Data 

Au-delà du Copilot : Classiq invente l’ingénieur quantique virtuel

La start-up israélienne Classiq vient de franchir une étape significative dans la démocratisation du calcul quantique en intégrant un agent d'intelligence artificielle générative au coeur de sa plateforme de développement. Concrètement, cet outil permet à un responsable technique ou à un ingénieur métier de décrire un problème en langage naturel, en français ou en anglais, et d'obtenir en retour une architecture logicielle quantique compilable. L'agent ne se contente pas de générer du texte : il synthétise du code en tenant compte des contraintes physiques réelles des processeurs quantiques actuels, garantissant ainsi que les programmes produits sont réellement exécutables et non de simples ébauches conceptuelles. Nir Minerbi, fondateur et PDG de Classiq, présente cet outil comme une passerelle directe entre les problématiques concrètes des entreprises et les actifs numériques exploitables sur les machines de demain. L'enjeu est considérable pour des secteurs comme la finance quantitative, la chimie computationnelle ou la conception de nouveaux matériaux, où la rapidité d'itération conditionne l'avantage concurrentiel. Jusqu'ici, programmer pour un ordinateur quantique exigeait une maîtrise pointue de la physique des qubits, un profil rare et coûteux que peu d'entreprises pouvaient s'offrir à grande échelle. En automatisant l'intégralité du cycle de développement, de la traduction du besoin métier jusqu'à l'optimisation des circuits, Classiq libère les équipes des tâches de «tuyauterie» complexe et leur permet de concentrer leurs efforts sur la valeur ajoutée. Pour les directions informatiques, c'est aussi l'assurance d'un investissement durable : le code généré s'adapte aux évolutions matérielles sans devenir obsolète à chaque mise à jour des processeurs. L'adoption du calcul quantique par les grandes entreprises bute depuis des années sur un double obstacle : la rareté des experts capables d'écrire des algorithmes quantiques, et la fragmentation d'un écosystème où chaque génération de machines impose de réécrire le code from scratch. Plusieurs acteurs, dont IBM, Google et IonQ, investissent massivement pour abaisser cette barrière d'entrée, mais l'approche de Classiq se distingue en ciblant explicitement la couche de développement logiciel plutôt que le matériel. En structurant la connaissance quantique dans des bibliothèques réutilisables gérées par des agents experts, la start-up entend faire entrer ce calcul de haute performance dans les flux de travail industriels standard. Si la promesse se confirme en production, cette démarche pourrait accélérer significativement le moment où le quantique cesse d'être un sujet de laboratoire pour devenir un outil opérationnel dans les entreprises.

OutilsOutil
1 source
OpenAI transforme sa soirée GPT-5.5 complète en un mois d'accès gratuit à Codex pour 8 000 développeurs
461VentureBeat AI 

OpenAI transforme sa soirée GPT-5.5 complète en un mois d'accès gratuit à Codex pour 8 000 développeurs

OpenAI a envoyé lundi un email surprise à plus de 8 000 développeurs ayant postulé pour sa soirée privée baptisée « GPT-5.5 on 5/5 », organisée le 5 mai à San Francisco de 17h55 à 20h55 heure du Pacifique. Incapable d'accueillir tout le monde dans ses locaux, l'entreprise a compensé en multipliant par dix les limites d'utilisation quotidiennes de Codex, son agent de programmation propulsé par IA, sur les comptes ChatGPT personnels des candidats, qu'ils aient été acceptés, mis sur liste d'attente ou refusés. Ce cadeau reste actif jusqu'au 5 juin. Sam Altman avait annoncé la surprise sur X quelques minutes avant l'envoi des emails, récoltant plus de 521 000 vues en quelques heures. La soirée elle-même, tenue dans un lieu gardé secret jusqu'à la confirmation des invitations, ne comportait aucune annonce produit : juste de la nourriture, des boissons, des goodies et une discussion informelle avec l'équipe derrière GPT-5.5. Pour les développeurs, l'impact est concret et immédiat. Codex fonctionne sous des plafonds d'utilisation journaliers variables selon l'abonnement, et un multiplicateur de dix donne accès à un volume d'usage bien plus large pour prototyper, déboguer et livrer du code. GPT-5.5, le modèle qui alimente Codex, affiche selon OpenAI une latence par token comparable à GPT-4, mais à un niveau d'intelligence supérieur et avec significativement moins de tokens par tâche. Sur 31 jours, cette fenêtre d'accès élargi vise à transformer l'essai en habitude profonde : l'idée est que les développeurs qui travailleront pendant un mois entier avec Codex à plein régime hésiteront à revenir en arrière, et qu'une partie d'entre eux souscrira à un abonnement payant pour maintenir ce flux de travail après le 5 juin. Une question reste ouverte : ce bonus se cumule-t-il avec le multiplicateur x20 inclus dans l'abonnement Pro à 200 dollars par mois ? Selon un utilisateur ayant contacté le support OpenAI, la réponse serait non, le système applique la limite la plus haute, sans addition. Cette opération s'inscrit dans une stratégie d'expansion agressive d'OpenAI sur le marché des outils de développement, où GitHub Copilot, Cursor et d'autres concurrents se disputent l'adoption quotidienne des ingénieurs. En inondant des milliers de développeurs d'un accès premium durant une période clé, OpenAI subventionne une adoption intensive plutôt que de laisser Codex se découvrir progressivement. La soirée du 5 mai comportait elle-même un élément de mise en scène produit : Altman a révélé que GPT-5.5 avait lui-même planifié l'événement, proposant la date, suggérant que les toasts soient portés par des humains et recommandant l'installation d'une boîte à suggestions pour le prochain modèle, ce qu'Altman a qualifié de « comportement émergent étrange ». Codex a également géré la sélection des invités, boucle logique dans une soirée conçue autant comme démonstration que comme célébration.

OutilsOutil
1 source
Google ajoute des webhooks événementiels à l'API Gemini et supprime le recours au polling pour les tâches IA longues
462MarkTechPost 

Google ajoute des webhooks événementiels à l'API Gemini et supprime le recours au polling pour les tâches IA longues

Google a intégré des webhooks événementiels à son API Gemini, une fonctionnalité désormais accessible à tous les développeurs utilisant la plateforme. Ce mécanisme de notification en temps réel remplace le système de polling jusqu'ici incontournable dans les pipelines d'intelligence artificielle à long cours. Concrètement, au lieu que le code client envoie des requêtes GET répétées pour vérifier si une tâche est terminée, c'est l'API Gemini qui contacte directement le serveur du développeur dès qu'une opération se conclut, via un HTTP POST instantané. Le système s'applique aux opérations longues durée, appelées Long-Running Operations, comme la génération de vidéos, les sessions Deep Research ou le traitement de milliers de prompts via l'API Batch, des tâches qui peuvent s'étaler sur plusieurs minutes voire plusieurs heures. Cette évolution répond à un problème concret d'efficacité à grande échelle. Le polling continu consomme inutilement du quota API et des ressources de calcul, tout en introduisant un délai artificiel entre la fin d'une tâche et le moment où l'application en est informée. Pour les architectures agentiques ou les pipelines de traitement en volume, ces frictions se cumulent et deviennent un goulet d'étranglement opérationnel. Avec les webhooks, la latence de notification tombe à zéro et le quota économisé peut être redirigé vers le traitement réel. Deux modes de configuration sont disponibles : les webhooks statiques, configurés une fois au niveau du projet via le WebhookService API pour des intégrations globales comme les notifications Slack ou la synchronisation de bases de données, et les webhooks dynamiques, définis à la demande pour un appel spécifique via un champ webhookconfig, idéaux pour router des tâches vers des files d'attente dédiées dans les systèmes d'orchestration d'agents. Les webhooks dynamiques supportent également un champ usermetadata permettant d'attacher des paires clé-valeur arbitraires à chaque job, comme {"job_group": "nightly-eval", "priority": "high"}, facilitant ainsi le routage différencié vers des processeurs en aval sans infrastructure de suivi supplémentaire. Sur le plan de la sécurité, Google s'appuie strictement sur la spécification Standard Webhooks : chaque requête est signée via les en-têtes webhook-signature, webhook-id et webhook-timestamp, garantissant l'idempotence et la protection contre les attaques par rejeu. Les webhooks statiques utilisent un HMAC avec un secret partagé symétrique, fourni une seule fois à la création et impossible à récupérer ensuite en cas de perte. La rotation de ce secret intègre un paramètre REVOKEPREVIOUSSECRETSAFTERH24, qui maintient l'ancien secret valide pendant 24 heures pour permettre une transition sans interruption en production, ou une révocation immédiate en cas d'incident. Cette annonce s'inscrit dans la montée en puissance des workflows agentiques dans l'écosystème Gemini, où Google cherche à outiller les développeurs pour des systèmes autonomes capables de traiter des charges massives de manière fiable et économe en ressources.

UELes développeurs français et européens utilisant l'API Gemini pour des pipelines IA à longue durée peuvent réduire leur consommation de quota et améliorer leurs architectures agentiques en adoptant ces webhooks événementiels.

Construire un pipeline de machine learning en production avec ZenML : matérialiseurs, métadonnées et hyperparamètres
463MarkTechPost 

Construire un pipeline de machine learning en production avec ZenML : matérialiseurs, métadonnées et hyperparamètres

ZenML, framework open-source dédié à l'orchestration de pipelines de machine learning, propose une approche structurée pour construire des pipelines de bout en bout de niveau production. Un tutoriel détaillé publié récemment illustre comment assembler un système complet incluant des matérialiseurs personnalisés, un suivi de métadonnées et une optimisation d'hyperparamètres, en s'appuyant sur Python 3, scikit-learn, pandas et PyArrow. Le pipeline construit charge des données depuis le dataset Breast Cancer de scikit-learn, les prétraite via un StandardScaler, puis lance une recherche parallèle sur trois architectures de modèles, RandomForest, GradientBoosting et LogisticRegression, avant de sélectionner et promouvoir automatiquement le meilleur modèle selon ses métriques d'évaluation (accuracy, F1-score, AUC-ROC). Ce type de pipeline répond à un besoin concret des équipes data : garantir la reproductibilité complète des expériences ML sans intervention manuelle. Le mécanisme de cache de ZenML évite de réexécuter des étapes coûteuses si les données ou le code n'ont pas changé, ce qui réduit significativement les temps de cycle en production. Le suivi automatique des artefacts, chaque dataset, modèle intermédiaire et métrique est versionné, permet à une équipe de remonter précisément à quelle version des données correspond quel modèle déployé. La stratégie fan-out/fan-in, où plusieurs modèles sont entraînés en parallèle puis comparés dans une étape de synthèse, est particulièrement utile pour les équipes qui veulent industrialiser la sélection de modèles sans scripts ad hoc. ZenML s'inscrit dans un écosystème d'outils MLOps en pleine consolidation, aux côtés de MLflow, Kubeflow et Metaflow. Sa particularité est de proposer un "model control plane" centralisé qui abstrait le stockage des artefacts et l'exécution des étapes, quel que soit l'infrastructure sous-jacente, local, cloud, ou Kubernetes. La notion de matérialiseur personnalisé, illustrée ici avec un objet DatasetBundle sérialisant séparément les arrays NumPy et les métadonnées JSON, est au cœur de son extensibilité : elle permet d'intégrer n'importe quel type de données métier dans le système de tracking. Avec la montée en complexité des projets ML en entreprise, ce type d'approche normalisée devient un standard de fait pour les équipes qui cherchent à passer du notebook expérimental au déploiement répétable en production.

OutilsTuto
1 source
Découvrez la pile de commerce à base d'agents d'AMEX : contrats d'intention et tokens à usage unique pour sécuriser les transactions IA
464VentureBeat AI 

Découvrez la pile de commerce à base d'agents d'AMEX : contrats d'intention et tokens à usage unique pour sécuriser les transactions IA

American Express développe un système permettant à des agents IA d'effectuer des achats et des paiements au nom des utilisateurs, via un kit développeur baptisé ACE (Agentic Commerce Experiences). Présenté par Luke Gebb, vice-président exécutif et responsable mondial de l'innovation chez Amex, ce dispositif repose sur une architecture en boucle fermée : Amex agit simultanément comme émetteur de carte et réseau de paiement, ce qui lui permet de valider les transactions initiées par des agents IA sans dépendre d'un intermédiaire tiers. Le kit offre aux développeurs un accès à plusieurs services intégrés : enregistrement des agents, activation de compte, gestion des intentions, émission de jetons de paiement à usage unique, contexte du panier d'achat. Amex participe par ailleurs au projet Agent Pay Protocol (AP2) de Google, centré sur l'interopérabilité entre plateformes. Ce système s'attaque à l'un des problèmes fondamentaux du commerce dit "agentique" : la confiance. Aujourd'hui, ni les consommateurs, ni les marchands, ni les banques ne veulent s'exposer aux risques qu'un agent autonome pourrait faire peser sur leurs transactions, achats non autorisés, articles impayés, fraudes ou afflux de contestations. En positionnant Amex comme premier émetteur à entrer dans cette conversation, Gebb revendique un angle mort comblé : "C'est vraiment la première fois qu'un émetteur s'assoit à la table." Contrairement à Visa ou Mastercard, qui opèrent des réseaux sans émettre de cartes elles-mêmes, Amex contrôle l'ensemble du circuit, ce qui lui donne une capacité de validation de bout en bout que ses concurrents n'ont pas. Malgré ces ambitions, le système n'est pas sans zones d'ombre. Raj Ananthanpillai, fondateur et PDG de Trua, un fournisseur de systèmes d'identité et de vérification, souligne que des outils comme ACE, la suite Agentic Commerce de Stripe ou la chaîne de preuve d'intention vérifiable de Google "excellent dans la gestion des preuves et des autorisations vérifiables, mais laissent la validation humaine en amont opaque et peu développée." Sans lien cryptographique clair prouvant qu'un agent agit sous l'autorité explicite d'un humain vérifié, les risques de répudiation, de fraude et de transactions par des personnes sous sanctions restent élevés. Amex affirme que ses agents peuvent soumettre un panier et le confronter à l'intention initiale de l'utilisateur, mais n'a pas divulgué le mécanisme exact de cette validation. C'est précisément ce manque de transparence que l'écosystème du commerce agentique devra résoudre pour atteindre une adoption à grande échelle.

UELes standards de commerce agentique en cours de définition aux États-Unis (Amex ACE, Stripe, Google AP2) pourraient devenir des références que les acteurs européens du paiement devront intégrer pour garantir l'interopérabilité, mais sans impact direct immédiat sur la France ou l'UE.

OutilsOutil
1 source
L'ère du RAG pour les agents IA touche à sa fin : place à une couche de connaissances intégrée à la compilation
465VentureBeat AI 

L'ère du RAG pour les agents IA touche à sa fin : place à une couche de connaissances intégrée à la compilation

Pinecone, pionnière des bases de données vectorielles, a annoncé ce 4 mai 2026 le lancement en accès anticipé de Nexus, qu'elle présente non pas comme une amélioration de la recherche vectorielle, mais comme un moteur de connaissance entièrement repensé pour les agents IA. Le produit introduit un compilateur de contexte qui transforme les données brutes d'une entreprise en artefacts de connaissance persistants et adaptés à des tâches spécifiques, avant même qu'un agent ne formule sa première requête. Nexus embarque également KnowQL, un nouveau langage de requête déclaratif permettant aux agents de spécifier la forme des résultats attendus, les exigences de confiance et les contraintes de latence. Sur un benchmark interne, une tâche d'analyse financière qui consommait auparavant 2,8 millions de tokens a été traitée par Nexus avec seulement 4 000 tokens, soit une réduction de 98 %, bien que Pinecone n'ait pas encore validé ce chiffre en déploiement client réel. Cette rupture répond à une limite structurelle du paradigme RAG (retrieval-augmented generation), conçu pour des interactions humaines ponctuelles, une requête, une réponse, un interprète humain dans la boucle. Les agents IA fonctionnent différemment : ils reçoivent des tâches complexes, agrègent des sources multiples, résolvent des conflits d'information et enchaînent les requêtes de façon autonome. Or, dans une architecture RAG classique, chaque session repart de zéro, redécouvrant à chaque fois quelles tables sont liées, quelles sources font autorité, quels formats sont exploitables. Pinecone estime que 85 % de la puissance de calcul des agents est absorbée par ce cycle de redécouverte, au détriment de la tâche réelle. Il en résulte une latence imprévisible, des coûts en tokens incontrôlés et des résultats non déterministes, deux exécutions identiques sur les mêmes données peuvent produire des réponses différentes, sans traçabilité des sources, ce qui constitue un blocage rédhibitoire pour les entreprises soumises à des obligations de conformité. La sondage Pulse de VentureBeat pour le premier trimestre 2026 confirme ce tournant : chaque base de données vectorielle standalone perd des parts d'adoption, tandis que l'intention de récupération hybride a triplé pour atteindre 33,3 %, la position stratégique à la croissance la plus rapide du secteur. En déplaçant le travail de raisonnement du moment de l'inférence vers une phase de compilation préalable, Nexus tente de résoudre ce que le PDG Ash Ashutosh résume ainsi : les agents sont des machines contraintes de travailler sur des systèmes conçus pour des humains. L'enjeu dépasse Pinecone, c'est toute une catégorie technologique, celle des bases vectorielles nées avec ChatGPT, qui doit se réinventer pour survivre à l'ère agentique.

UELes entreprises françaises et européennes qui développent des agents IA sur des architectures RAG devront surveiller ce tournant vers des moteurs de connaissance compilés, susceptible de remodeler les choix d'infrastructure.

OutilsOutil
1 source
Les meilleures API de recherche et récupération de données pour construire des agents IA en 2026 : outils, compromis et offres gratuites
466MarkTechPost 

Les meilleures API de recherche et récupération de données pour construire des agents IA en 2026 : outils, compromis et offres gratuites

La recherche web et la récupération de contenu sont devenues en 2026 des infrastructures critiques pour tout développeur construisant des agents IA. Un panorama des principales API Search et Fetch disponibles ce printemps révèle deux acteurs à retenir : TinyFish et Tavily. TinyFish propose des points d'accès dédiés aux agents, disponibles gratuitement avec des limites généreuses : 5 requêtes par minute pour la recherche (api.search.tinyfish.ai) et 25 requêtes par minute pour la récupération de pages (api.fetch.tinyfish.ai), sans carte bancaire requise. Sa latence médiane pour la recherche est inférieure à 0,5 seconde, ce qui le rend compatible avec les boucles d'outils en temps réel. La plateforme déploie sa propre flotte Chromium pour effectuer un rendu complet de chaque URL, y compris les applications JavaScript dynamiques et les pages protégées contre les robots, retournant ensuite du contenu propre en Markdown, JSON ou HTML. Tavily, de son côté, propose un plan gratuit incluant 1 000 crédits API par mois, avec des offres payantes à partir de 30 dollars par mois (4 000 crédits) jusqu'à 220 dollars par mois (38 000 crédits), ainsi qu'une option à la demande à 0,008 dollar par crédit. Ce qui distingue ces outils de la génération précédente tient à leur conception orientée agents : là où les solutions classiques injectaient du HTML brut, avec scripts, publicités et bannières de cookies, dans les fenêtres de contexte des LLM, TinyFish filtre tout ce bruit en amont. Le résultat est une consommation de tokens par page nettement inférieure, et donc un coût par appel LLM réduit. Pour les entreprises utilisant des agents à grande échelle, cet écart n'est pas marginal. TinyFish s'intègre directement dans les environnements que les développeurs utilisent déjà : Claude Code, Cursor, Codex, LangChain, CrewAI, n8n, Dify et Vercel Skills. Une configuration MCP s'installe en un seul fichier JSON ; une CLI (npm install -g @tiny-fish/cli) écrit les résultats directement sur le système de fichiers sans passer par la fenêtre de contexte du modèle, limitant ainsi l'utilisation des tokens. Tavily, quant à lui, est reconnu pour ses intégrations profondes avec LangChain et LlamaIndex, les frameworks les plus répandus dans l'écosystème RAG. Ces évolutions s'inscrivent dans un mouvement plus large : la maturation rapide de l'outillage autour des agents IA en production. En 2024, la pratique dominante consistait à envelopper les données brutes des SERP Google et à les passer directement à un modèle de langage. En 2026, cette approche est dépassée, remplacée par des API conçues dès le départ pour les contraintes spécifiques des agents : latence, efficacité des tokens, stabilité du rendu et compatibilité avec les frameworks d'orchestration. TinyFish et Tavily illustrent une tendance dans laquelle l'infrastructure de récupération d'information devient aussi déterminante que le choix du modèle LLM lui-même. Les prochaines lignes de différenciation porteront probablement sur la fraîcheur des index, la gestion des contenus derrière authentification et l'intégration native avec les standards d'agents émergents comme le protocole MCP.

OutilsOutil
1 source
Amazon QuickSight va plus loin que la BI classique avec sa fonction Questions-Réponses sur les données
467AWS ML Blog 

Amazon QuickSight va plus loin que la BI classique avec sa fonction Questions-Réponses sur les données

Amazon a dévoilé une fonctionnalité appelée Dataset Q&A, intégrée à son outil de business intelligence Amazon QuickSight, qui permet aux équipes d'interroger leurs données en langage naturel sans avoir à construire de nouveaux tableaux de bord. Concrètement, un responsable peut poser une question complexe directement dans une interface de chat et obtenir une réponse précise en quelques secondes, en s'appuyant sur les jeux de données existants. Pour illustrer le potentiel de cette technologie, AWS a développé en interne un agent analytique baptisé TARA (Technical Analysis Research Agent), conçu par l'équipe Specialist Data Lens. TARA connecte plusieurs ensembles de données intégrés, des API système en temps réel et des agents de recherche spécialisés via le protocole MCP, le tout au travers d'une interface conversationnelle unifiée. Le programme AWS Technical Field Communities, qui gère des centaines de milliers d'engagements clients par an dans des dizaines de domaines technologiques, utilise déjà TARA pour piloter ses opérations au quotidien. L'enjeu est considérable pour toute organisation qui dépend de la donnée pour prendre des décisions rapides. Avant l'arrivée de ce type d'outil, une question d'un dirigeant se transformait en interruption pour un ingénieur BI : ce dernier suspendait ses travaux planifiés, construisait l'agrégation demandée, renvoyait une réponse qui générait inévitablement de nouvelles questions. Le vrai coût n'était pas dans l'exécution de la requête, mais dans le délai de transmission entre celui qui pose la question et celui qui dispose des outils pour y répondre. Avec Dataset Q&A, ce goulot d'étranglement disparaît : les équipes explorent librement des dimensions multiples sans file d'attente, sans perturber les tableaux de bord opérationnels dont dépendent leurs collègues. Par ailleurs, TARA gère la protection des données personnelles (PII) de manière native, permettant de faire remonter du contexte qualitatif sensible de façon sécurisée, ce qui était jusqu'ici un obstacle majeur à l'analyse conversationnelle en entreprise. Cette évolution s'inscrit dans une tendance de fond : les outils de BI traditionnels, pensés pour répondre à des questions connues à l'avance, montrent leurs limites face à la complexité croissante des opérations à grande échelle. AWS n'est pas seul sur ce terrain. Microsoft, Google et des acteurs spécialisés comme ThoughtSpot ou Databricks investissent massivement dans des interfaces en langage naturel pour démocratiser l'accès à la donnée. Ce qui distingue l'approche d'Amazon est l'intégration native dans QuickSight, déjà largement déployé chez les entreprises clientes du cloud AWS, et la possibilité de connecter des sources hétérogènes via MCP. TARA reste pour l'instant un outil interne à AWS, mais les capacités Dataset Q&A sur lesquelles il repose sont disponibles pour tous les clients QuickSight, ouvrant la voie à des déploiements similaires dans d'autres secteurs.

UELes entreprises européennes clientes d'Amazon QuickSight peuvent adopter dès maintenant cette fonctionnalité d'interrogation en langage naturel, réduisant leur dépendance aux équipes BI pour l'analyse ad hoc.

OutilsOutil
1 source
AgentCore Optimization : AWS lance une boucle d'amélioration des performances des agents
468AWS ML Blog 

AgentCore Optimization : AWS lance une boucle d'amélioration des performances des agents

Amazon a annoncé le lancement en préversion d'AgentCore Optimization, une nouvelle fonctionnalité intégrée à sa plateforme Amazon Bedrock AgentCore. Cette brique complète ce qu'Amazon appelle la boucle "observer, évaluer, améliorer" pour les agents IA en production. Concrètement, le système analyse automatiquement les traces de production, génère des recommandations d'optimisation pour les prompts système ou les descriptions d'outils, puis propose deux mécanismes de validation : l'évaluation par lot sur des jeux de données prédéfinis, et les tests A/B en conditions réelles via AgentCore Gateway, avec découpage du trafic en production à un pourcentage configurable et résultats assortis d'intervalles de confiance et de signification statistique. NTT DATA, partenaire annoncé lors du lancement, indique que des processus qui nécessitaient auparavant plusieurs semaines d'ajustement manuel de prompts peuvent désormais s'exécuter en cycles rapides et reproductibles. L'enjeu est de taille pour les équipes produit qui déploient des agents IA : la qualité d'un agent se dégrade silencieusement à mesure que les modèles évoluent, que le comportement des utilisateurs change, et que les prompts sont réutilisés dans des contextes imprévus. Jusqu'ici, la remédiation reposait entièrement sur l'intuition du développeur, lire des traces, formuler une hypothèse, réécrire le prompt, tester quelques cas, déployer, un cycle qui introduit souvent de nouveaux problèmes en corrigeant les anciens. AgentCore Optimization remplace cette boucle artisanale par un processus systématique fondé sur les données : les recommandations sont générées à partir des traces réelles et validées avant tout déploiement, éliminant la part de pari inhérente aux corrections en aveugle. Amazon Bedrock AgentCore, déjà utilisé par des milliers de développeurs pour construire des agents capables de raisonner et d'agir dans des workflows complexes, s'enrichit ainsi d'une couche d'amélioration continue qui manquait jusqu'à présent à l'écosystème. Les grandes équipes disposent certes d'équipes scientifiques dédiées et de benchmarks centralisés, mais ces dispositifs fonctionnent sur des cycles hebdomadaires ou mensuels, pendant que les agents dérivent en production chaque jour. En intégrant la traçabilité OpenTelemetry, les évaluateurs built-in (taux de succès, précision de sélection d'outils, sécurité), et la possibilité de simuler des jeux de données via un acteur LLM jouant le rôle de l'utilisateur final, Amazon positionne AgentCore comme une plateforme complète pour industrialiser l'optimisation des agents, une capacité qui pourrait devenir un critère de choix déterminant face à des concurrents comme Google Vertex AI ou Microsoft Azure AI Foundry.

UELes équipes européennes déployant des agents IA sur Amazon Bedrock peuvent désormais automatiser l'optimisation de leurs prompts et outils, réduisant des cycles d'ajustement manuel qui duraient plusieurs semaines à des itérations rapides et reproductibles.

OutilsOutil
1 source
AgentCore Optimization en préversion : la boucle de qualité des agents
469AWS ML Blog 

AgentCore Optimization en préversion : la boucle de qualité des agents

Amazon a annoncé le 5 mai 2026 la disponibilité en preview d'AgentCore Optimization, une nouvelle fonctionnalité de sa plateforme Amazon Bedrock AgentCore dédiée à l'amélioration continue des agents d'intelligence artificielle en production. Le système introduit une boucle automatisée en trois étapes : génération de recommandations à partir des traces de production, validation par évaluation en batch ou par test A/B, puis déploiement. Concrètement, l'API Recommendations analyse les logs stockés dans CloudWatch pour identifier les failles dans le prompt système ou les descriptions d'outils, en ciblant un signal de récompense défini par l'équipe, taux de succès des objectifs, précision dans la sélection d'outils, ou critères personnalisés via un LLM-as-judge. L'évaluation en batch compare ensuite la nouvelle version sur un jeu de tests préétabli, tandis que le test A/B, routé via AgentCore Gateway, divise le trafic réel selon un pourcentage configurable et produit des résultats avec intervalles de confiance et significativité statistique. NTT DATA, via Yoshiharu Okuda, son responsable de la stratégie IA générative, confirme déjà que des cycles de tuning de prompts qui prenaient auparavant plusieurs semaines sont devenus des itérations rapides et reproductibles grâce à ce système. L'enjeu est de taille pour les équipes produit qui déploient des agents à grande échelle. Jusqu'ici, lorsqu'un agent dégradait en qualité, parce qu'un modèle sous-jacent avait évolué, que les comportements utilisateurs avaient changé, ou qu'un prompt était réutilisé hors de son contexte d'origine, la correction reposait entièrement sur l'intuition d'un développeur : lire les traces, formuler une hypothèse, réécrire le prompt, tester quelques cas, déployer, et recommencer. Ce cycle manuel était non seulement lent, mais souvent contre-productif, un correctif résolvant un problème pour un utilisateur tout en en créant un nouveau pour un autre. AgentCore Optimization remplace cette mécanique artisanale par une boucle systématique alimentée par des données réelles, ce qui permet aux équipes produit de détecter les dérives au fil du quotidien plutôt que d'attendre les benchmarks hebdomadaires ou mensuels des équipes scientifiques dédiées. Amazon Bedrock AgentCore est la plateforme sur laquelle des milliers de développeurs construisent déjà des agents capables de raisonner, planifier et agir dans des workflows complexes. La composante Observability du service capture chaque appel de modèle, invocation d'outil et étape de raisonnement sous forme de traces compatibles OpenTelemetry, fournissant ainsi la matière première nécessaire à la nouvelle boucle d'optimisation. Cette annonce s'inscrit dans une tendance de fond : les grands fournisseurs cloud cherchent à industrialiser non plus seulement la création d'agents, mais leur maintenance opérationnelle dans la durée. Avec cette fonctionnalité encore en preview, Amazon positionne Bedrock comme une plateforme de bout en bout pour le cycle de vie complet des agents, dans un marché où Google Vertex AI et Microsoft Azure AI Foundry jouent la même carte d'intégration verticale.

UELes équipes produit françaises et européennes déployant des agents sur Amazon Bedrock pourront bénéficier de cycles d'optimisation automatisés, réduisant une dépendance aux processus manuels chronophages, sans impact réglementaire ou institutionnel spécifique à l'UE.

OutilsOutil
1 source
AgentCore : optimisation de la qualité des agents, désormais en préversion
470AWS ML Blog 

AgentCore : optimisation de la qualité des agents, désormais en préversion

Amazon a annoncé ce 5 mai 2026 l'intégration de nouvelles capacités d'optimisation automatique dans AgentCore, sa plateforme de déploiement d'agents IA, désormais disponibles en préversion. Ces fonctionnalités couvrent trois mécanismes complémentaires : les Recommandations, l'évaluation par lots (batch evaluation) et les tests A/B. Le moteur de recommandations analyse les traces de production et les résultats d'évaluation pour proposer des améliorations concrètes des prompts système ou des descriptions d'outils, en ciblant un critère de performance défini par le développeur. L'évaluation par lots permet ensuite de valider ces suggestions sur un jeu de données de test prédéfini, en mesurant des scores agrégés pour détecter d'éventuelles régressions. Enfin, les tests A/B comparent deux versions d'un agent en production via AgentCore Gateway, en répartissant le trafic réel selon un pourcentage configurable et en restituant les résultats avec intervalles de confiance et significativité statistique. L'ensemble s'appuie sur un système de traçabilité OpenTelemetry géré par AgentCore Observability, qui capture chaque appel au modèle, chaque invocation d'outil et chaque étape de raisonnement. Ces nouvelles capacités répondent à un problème structurel bien connu des équipes IA en production : la dégradation silencieuse des agents au fil du temps. Lorsque les modèles évoluent, les comportements utilisateurs changent, ou les prompts sont réutilisés dans des contextes imprévus, la qualité baisse sans signal d'alerte clair. Jusqu'ici, le cycle de correction restait entièrement manuel : un utilisateur se plaint, un développeur lit des traces, formule une hypothèse, réécrit le prompt, teste quelques cas et pousse un correctif qui peut en créer un autre. AgentCore ferme cette boucle en remplaçant l'intuition du développeur par des données systématiques, avec un signal de récompense configurable : taux de succès des objectifs, précision de sélection des outils, pertinence, sécurité. Yoshiharu Okuda, directeur de la stratégie IA générative chez NTT DATA, a confirmé que des processus qui nécessitaient auparavant plusieurs semaines de réglage manuel se transforment désormais en cycles rapides et reproductibles. AgentCore est la plateforme d'Amazon Web Services pour construire, connecter et optimiser des agents IA à grande échelle, avec des milliers de développeurs déjà actifs. Cette annonce s'inscrit dans une course plus large entre les grands fournisseurs cloud pour proposer des outils d'opérationnalisation des agents, au-delà de la simple inférence. Google Vertex AI, Microsoft Azure AI et AWS se disputent les équipes qui passent de la phase expérimentale à la production à grande échelle, là où la maintenance de la qualité devient un défi d'ingénierie à part entière. En automatisant la boucle observer-évaluer-améliorer, AWS positionne AgentCore comme une infrastructure de fond pour les organisations qui ne peuvent pas se permettre des équipes dédiées à l'optimisation manuelle de prompts sur des cycles hebdomadaires, alors que leurs agents dérivent chaque jour en production.

OutilsActu
1 source
Des workflows guidés par agents pour accélérer la personnalisation de modèles dans Amazon SageMaker AI
471AWS ML Blog 

Des workflows guidés par agents pour accélérer la personnalisation de modèles dans Amazon SageMaker AI

Amazon a lancé une expérience agentique intégrée dans SageMaker AI pour simplifier radicalement la personnalisation des modèles de langage. Jusqu'ici, adapter un modèle fondation à un cas d'usage métier exigeait de maîtriser des techniques comme le Supervised Fine-Tuning (SFT), le Direct Preference Optimization (DPO) ou le Reinforcement Learning Verifiable Rewards (RLVR), de naviguer entre des APIs fragmentées et des formats de données spécifiques à chaque modèle, et de gérer des cycles d'expérimentation qui s'étiraient sur plusieurs mois. Désormais, un développeur peut décrire son cas d'usage en langage naturel, et l'agent de codage prend en charge l'ensemble du parcours: définition du problème, préparation des données, sélection de la technique d'entraînement, évaluation de la qualité du modèle, puis déploiement vers Amazon Bedrock ou un endpoint SageMaker AI. Amazon Kiro, l'agent de développement logiciel d'Amazon, est préconfiguré par défaut dans l'environnement JupyterLab de SageMaker AI Studio, avec complétion de code, débogage assisté et support interactif. Les agents compatibles avec le protocole ACP (Agent Communication Protocol), dont Claude Code d'Anthropic, peuvent également être intégrés et bénéficier des mêmes fonctionnalités. La version 4.1 ou supérieure de SageMaker AI Distribution est requise, ainsi qu'un rôle IAM avec la politique gérée AmazonSageMakerFullAccess. Le coeur du dispositif repose sur des "Skills", des modules d'instructions préconçus et modulaires qui encapsulent l'expertise AWS et data science sur l'ensemble du cycle de personnalisation. Lorsqu'un développeur décrit son besoin, l'agent active automatiquement les Skills pertinents, qui le guident à travers la validation des données, la configuration des hyperparamètres et l'évaluation du modèle via des métriques LLM-as-a-Judge. Chaque étape génère des notebooks directement exécutables, entièrement modifiables et réutilisables dans des workflows existants. Un avantage opérationnel concret: les Skills réduisent la consommation de tokens tout en augmentant la précision des réponses, car l'agent dispose d'un contexte spécialisé plutôt que de connaissances génériques. Les organisations peuvent personnaliser ces Skills pour les aligner sur leurs standards de gouvernance, leurs outils internes et leurs pratiques d'équipe, résolvant ainsi un problème récurrent avec les assistants de codage généralistes qui ne reproduisent pas de manière fiable les conventions maison. L'annonce s'inscrit dans une dynamique plus large où la personnalisation des modèles devient le principal levier de différenciation concurrentielle, tous les acteurs ayant accès aux mêmes modèles fondations publics. Amazon positionne SageMaker AI comme une plateforme bout-en-bout pour les équipes qui veulent exploiter leurs données propriétaires sans assembler elles-mêmes une chaîne d'outils dispersés. La prise en charge du protocole ACP ouvre la voie à un écosystème d'agents tiers, signalant une stratégie d'interopérabilité plutôt que de verrouillage. Les prochaines étapes naturelles incluent l'extension de ce type d'expérience agentique à d'autres phases du cycle MLOps, comme la surveillance des modèles en production ou la gestion des dérives de données.

UELes équipes data européennes utilisant AWS SageMaker AI peuvent accélérer leurs projets de fine-tuning de modèles fondation sans expertise MLOps avancée, réduisant les délais de personnalisation sur données propriétaires.

OutilsOutil
1 source
L'IA adaptée aux besoins du secteur de la santé
472MIT Technology Review 

L'IA adaptée aux besoins du secteur de la santé

Le marché de la santé est devenu l'une des cibles prioritaires des développeurs d'intelligence artificielle, attirés par l'ampleur des défis du secteur : pressions financières, pénuries de personnel soignant et vieillissement accéléré de la population. La FDA américaine a approuvé à ce jour plus de 1 300 dispositifs médicaux intégrant de l'IA, dont plus de la moitié au cours des trois dernières années, les premières homologations remontant à 1995. La grande majorité concerne l'interprétation d'images diagnostiques, mais des applications non radiologiques couvrent déjà des usages aussi variés que le suivi de l'apnée du sommeil, l'analyse des rythmes cardiaques ou la planification de chirurgies orthopédiques. En parallèle, des outils non réglementés comme dispositifs médicaux, gestion des plannings, coordination administrative, se multiplient à un rythme encore plus rapide et difficile à quantifier. L'enjeu dépasse largement la clinique. Un sondage récent auprès de responsables technologiques du secteur révèle que 72 % d'entre eux classent la réduction de la charge des soignants et l'amélioration de leur satisfaction comme priorité absolue pour l'IA, devant les applications cliniques directes. Plus de 53 % citent l'efficacité des flux de travail. Ces outils remplacent concrètement des tableaux blancs et des post-it pour coordonner des processus complexes, et leur impact potentiel sur les systèmes de santé pourrait surpasser celui des usages médicaux purs. Mais le risque est réel : 77 % des mêmes responsables considèrent que l'immaturité des outils IA constitue un obstacle majeur à leur adoption, car une application mal conçue ou insuffisamment validée peut mettre les patients en danger, même indirectement. C'est dans ce contexte que les partenariats entre prestataires de santé et développeurs de logiciels s'imposent comme la stratégie dominante. Selon une étude McKinsey, 61 % des organisations de santé prévoient de collaborer avec des fournisseurs tiers pour développer des solutions d'IA générative sur mesure, plutôt que de les construire en interne ou d'acheter des produits standardisés. Des plateformes comme Mayo Clinic Platform, qui accompagne le déploiement de solutions numériques en s'appuyant sur des données cliniques et une validation experte, incarnent ce modèle. Steve Bethke, vice-président du marché des développeurs de solutions chez Mayo Clinic Platform, résume l'équation : sans une maîtrise simultanée des dimensions cliniques, techniques et économiques, une solution ne sera ni adoptée ni génératrice de valeur. Le cadre réglementaire américain reste lui-même en construction, un rapport au Congrès de 2024 le souligne, ce qui renforce l'importance d'un ancrage profond dans les réalités du terrain pour quiconque ambitionne de transformer durablement le secteur.

UELes défis structurels évoqués (vieillissement, pénuries soignantes) sont communs à l'UE, mais le cadre réglementaire décrit est américain (FDA) ; l'AI Act et le règlement MDR européens imposent des contraintes différentes aux déploiements d'IA médicale en France et dans l'UE.

OutilsOutil
1 source
Automatisation du montage vidéo : créez des vidéos 10x plus vite avec l’IA
473Le Big Data 

Automatisation du montage vidéo : créez des vidéos 10x plus vite avec l’IA

Les outils d'intelligence artificielle dédiés au montage vidéo permettent désormais de réduire jusqu'à 40 % du temps de post-production traditionnel en moins de soixante secondes. Des plateformes comme Submagic, qui se positionne aujourd'hui comme le leader du segment, automatisent l'intégralité du workflow : analyse audio à l'importation pour isoler les moments forts, suppression automatique des silences et hésitations, insertion contextuelle de B-rolls et d'éléments graphiques basés sur la transcription générée, et même zoom dynamique sur les pics d'intensité émotionnelle détectés dans la voix. Ce qui prenait autrefois une demi-journée de dérushing manuel se boucle en quelques minutes, avec une précision que les éditeurs décrivent comme chirurgicale. L'enjeu est considérable pour les créateurs de contenu, solopreneurs comme studios en croissance, qui font face à une demande de formats courts qui ne faiblit pas. En déléguant les tâches répétitives et chronophages à des algorithmes entraînés pour ça, ils récupèrent du temps pour la stratégie et la direction créative, les seules dimensions que la machine ne peut pas encore pleinement remplacer. Concrètement, la barrière économique et humaine qui séparait une production amateur d'une post-production de haute volée s'effondre : un créateur seul peut désormais sortir un volume de contenu qui nécessitait auparavant une équipe entière. Cette mutation s'inscrit dans une transformation plus large de l'industrie de la création visuelle, accélérée par la montée en puissance des LLMs et des modèles multimodaux depuis 2022-2023. Le marché des outils d'automatisation vidéo s'est densifié rapidement, avec des acteurs comme Descript, CapCut ou Runway qui se disputent les mêmes flux de travail. Submagic mise sur la régularité de ses mises à jour et sur l'intégration verticale de ses fonctionnalités pour se démarquer. La prochaine frontière concerne la personnalisation à grande échelle : configurer un système qui comprend non seulement la structure narrative d'une vidéo, mais aussi les codes esthétiques et la ligne éditoriale propres à chaque créateur. Ce degré de personnalisation reste encore largement en développement, et représente le prochain terrain de compétition pour ces plateformes.

OutilsOutil
1 source
Google fait de la gouvernance des agents IA un produit, les entreprises doivent encore s'adapter
474AI News 

Google fait de la gouvernance des agents IA un produit, les entreprises doivent encore s'adapter

Il y a deux semaines à Las Vegas, lors du Google Cloud Next '26, Google a franchi un cap que l'industrie de l'IA entreprise évitait depuis près de deux ans : intégrer la gouvernance des agents IA directement dans le produit, non pas comme une fonctionnalité optionnelle, mais comme une couche architecturale fondamentale. La pièce maîtresse de l'événement est le Gemini Enterprise Agent Platform, présenté comme le successeur de Vertex AI. Sa particularité : chaque agent construit sur la plateforme reçoit une identité cryptographique unique à des fins de traçabilité et d'audit, tandis qu'une composante appelée Agent Gateway supervise les interactions entre les agents et les données d'entreprise. La gouvernance, autrement dit, est livrée avec le produit, et non ajoutée après coup. Cette annonce répond à un écart alarmant mis en lumière par plusieurs études récentes. Une enquête d'OutSystems auprès de 1 879 décideurs IT, publiée en avril, révèle que 97 % des organisations explorent déjà des stratégies d'agents IA, et que 49 % s'estiment avancées ou expertes dans ce domaine. Pourtant, seulement 36 % disposent d'une approche centralisée de gouvernance, et à peine 12 % utilisent une plateforme unifiée pour contrôler la prolifération des agents. Le Hype Cycle 2026 de Gartner confirme la tension : si seulement 17 % des organisations ont réellement déployé des agents IA à ce jour, plus de 60 % comptent le faire dans les deux prochaines années, la courbe d'adoption la plus agressive jamais enregistrée par Gartner pour une technologie émergente. Dans les faits, entre 11 % et 14 % des projets pilotes d'agents IA atteignent une mise en production réelle. Les 86 à 89 % restants ont été mis en pause, abandonnés, ou n'ont jamais dépassé le stade du proof-of-concept, avec la gouvernance et la complexité d'intégration citées comme causes premières. La stratégie de Google est cohérente : selon une analyse de Bain & Company, l'entreprise se repositionne d'un simple fournisseur d'accès aux modèles vers une plateforme d'entreprise agentique complète, où le contexte, l'identité et la sécurité sont au centre de l'architecture. Fait notable, les trois grands fournisseurs cloud n'ont annoncé leurs registres d'agents qu'en avril 2026, ce qui illustre à quel point les outils de gouvernance restent embryonnaires dans l'ensemble du secteur. Google propose la réponse la plus complète à ce jour, mais elle implique une contrepartie : une intégration profonde dans l'écosystème Google. C'est précisément ce que les architectes d'entreprise doivent arbitrer aujourd'hui. Les systèmes agentiques multiplient les identités et les permissions à une vitesse que les modèles traditionnels de gestion des accès n'ont jamais été conçus pour absorber, et la question n'est plus quel modèle est approuvé, mais quelles actions un agent donné peut exécuter, avec quelle identité, sur quels outils, et avec quelle piste d'audit.

UELes entreprises européennes soumises à l'AI Act, qui impose traçabilité et audit des systèmes IA à haut risque, doivent arbitrer entre adopter la couche de gouvernance Google, la plus complète du marché, et le verrouillage écosystémique qui l'accompagne.

💬 86% des pilotes qui n'arrivent jamais en prod, c'est le chiffre qui résume tout. Google a visiblement lu les mêmes postmortems et décidé d'intégrer la gouvernance dans l'architecture de base plutôt que de la coller en option après coup, ce qui est la seule approche qui tienne quand tes agents se multiplient et accumulent des identités et des permissions à toute vitesse. Le prix à payer, c'est l'intégration profonde dans l'écosystème Google, et les architectes européens sous AI Act vont devoir trancher vite là-dessus.

OutilsOutil
1 source
Aouch ! Google publie par accident l’application qui va remplacer Gemini
475Le Big Data 

Aouch ! Google publie par accident l’application qui va remplacer Gemini

Le 30 avril 2026, Google a brièvement publié sur le Play Store une application baptisée COSMO, signée Google Research et présentée comme un « experimental AI assistant ». L'application, pesant 1,13 Go, embarque directement un modèle Gemini Nano capable de fonctionner en local sur l'appareil, sans recours systématique au cloud. Elle a disparu aussi rapidement qu'elle était apparue, mais les captures d'écran et les descriptions techniques ont eu le temps de circuler. L'interface, visiblement non finalisée, ressemblait davantage à un prototype interne qu'à un produit destiné au grand public, certaines illustrations du Play Store étant même mal affichées, signe que la publication était accidentelle. Ce qui distingue COSMO des assistants conversationnels classiques, c'est son comportement proactif : l'application ne répond pas à des requêtes, elle observe ce qui se passe à l'écran et agit sans qu'on le lui demande. Elle repose sur quatorze « Skills » capables de se déclencher automatiquement selon le contexte. Si une conversation mentionne un délai, l'assistant propose un minuteur. Si un rendez-vous apparaît dans un message, il suggère de l'ajouter à Google Agenda. Si un terme inconnu figure dans un PDF ouvert, il en affiche la définition instantanément. L'application intègre même un « Browser Agent » capable de naviguer sur le web à la place de l'utilisateur, rappelant le projet Mariner de Google. Pour fonctionner ainsi, COSMO exploite l'API d'accessibilité d'Android, ce qui lui donne un accès étendu à ce qui s'affiche sur l'écran, une capacité puissante, mais qui soulève immédiatement des questions sérieuses sur la collecte de données et le risque de surveillance permanente. Sur le plan technique, Google teste trois modes de traitement distincts : un mode entièrement local via Gemini Nano pour préserver la confidentialité, un mode cloud via une infrastructure baptisée « PI » pour des traitements plus puissants, et un mode hybride combinant les deux selon la situation. COSMO s'inscrit dans une tendance plus large chez les grands acteurs tech : aller au-delà du chatbot réactif pour construire des agents capables d'agir de manière autonome dans l'environnement numérique de l'utilisateur. Apple développe une vision similaire avec une Siri plus contextuelle, tandis que Microsoft intègre Copilot de plus en plus profondément dans Windows. Cette fuite accidentelle intervient à moins de trois semaines du Google I/O 2026, prévu le 19 mai, où Google devrait officiellement dévoiler sa nouvelle génération d'assistants. COSMO pourrait bien en être la pièce maîtresse.

UEL'accès permanent à l'écran via l'API d'accessibilité d'Android soulève des questions de conformité GDPR et AI Act qui s'appliqueront à COSMO lors de son déploiement en Europe.

Retviews de Lectra : l’assistant data des marques de mode
476Le Big Data 

Retviews de Lectra : l’assistant data des marques de mode

Lectra, éditeur technologique spécialisé dans l'industrie de la mode, vient de dévoiler une refonte majeure de sa plateforme d'analyse concurrentielle Retviews. La mise à jour intègre une intelligence artificielle entraînée spécifiquement sur les mécanismes du prêt-à-porter, capable de surveiller en continu des milliers de plateformes de vente pour cartographier les mouvements de la concurrence en temps réel. Concrètement, les équipes merchandising peuvent désormais personnaliser entièrement la classification des données selon leurs propres indicateurs internes, plutôt que de subir un flux brut standardisé. Lectra lance en parallèle un service premium baptisé Fashion Insight Reports, des analyses sectorielles clés en main destinées aux directions générales, portant sur des sujets stratégiques comme l'entrée sur un nouveau marché géographique ou le repositionnement d'une gamme. François Gonnot, responsable marketing chez Lectra, justifie cette offre par la volatilité croissante du secteur, qui rend les anciens modèles de pilotage insuffisants. L'impact le plus immédiat concerne la gestion des stocks, un problème structurel coûteux pour l'ensemble du secteur. En donnant aux marques des signaux très en amont sur ce qui fonctionne réellement en rayon et à quel prix, Retviews leur permet d'ajuster leurs volumes de production avant de s'engager, évitant ainsi la surproduction qui alimente les ventes promotionnelles et érode les marges. Caterina Ticchio, responsable du merchandising chez CP Company, témoigne que l'outil transforme la façon dont ses équipes conçoivent les collections : la décision n'est plus intuitive mais adossée à des données de marché actualisées. Pour les marques positionnées sur des segments premium, l'enjeu dépasse la rentabilité pure, il s'agit aussi de protéger une image de marque incompatible avec des fins de saison bradées. L'industrie de la mode traverse depuis plusieurs années une crise de surproduction et d'accélération des cycles, amplifiée par la montée en puissance de plateformes de fast-fashion comme Shein, qui inondent le marché avec des milliers de références nouvelles chaque semaine. Face à cette pression, les marques traditionnelles cherchent à gagner en agilité sans perdre leur identité. Lectra, qui cible historiquement les acteurs du luxe et du prêt-à-porter structuré, positionne Retviews comme une réponse à cette double contrainte : être aussi réactif que les pure players numériques tout en conservant la cohérence d'une collection pensée sur le long terme. La combinaison d'un outil SaaS en accès continu et d'un service d'analyse à valeur ajoutée portée par des experts humains illustre une tendance de fond dans les logiciels B2B : l'IA seule ne suffit pas, c'est l'interprétation contextualisée qui fait la différence pour les décideurs.

UELectra étant une entreprise française cotée, cette mise à jour de Retviews bénéficie directement aux marques de mode françaises et européennes cherchant à optimiser leur gestion des stocks et leur veille concurrentielle face à la pression des plateformes de fast-fashion.

OutilsOutil
1 source
Salesforce lance Agentforce Operations pour corriger les workflows qui bloquent l'IA en entreprise
477VentureBeat AI 

Salesforce lance Agentforce Operations pour corriger les workflows qui bloquent l'IA en entreprise

Salesforce a lancé Agentforce Operations, une nouvelle plateforme de gestion des workflows d'entreprise conçue pour rendre les processus back-office compatibles avec les agents IA. Présentée lors d'un entretien accordé à VentureBeat par Sanjna Parulekar, vice-présidente senior des Produits chez Salesforce, cette solution permet aux entreprises de télécharger leurs processus existants ou d'utiliser des modèles prédéfinis appelés Blueprints. Le système décompose ensuite ces workflows en tâches précises et structurées, assignées à des agents spécialisés. L'objectif est de créer une couche intermédiaire de contrôle d'exécution qui impose une structure déterministe aux processus que les agents sont censés suivre, là où la plupart des outils d'automatisation traditionnels s'appuient sur des décisions probabilistes. Le problème que Salesforce cherche à résoudre est fondamental pour toute organisation qui déploie des agents IA à grande échelle : les workflows d'entreprise ont été conçus autour du jugement humain, pas de l'exécution machine. Des années de contournements, d'étapes implicites et de décisions tacites ont produit des processus qui se brisent dès qu'un agent tente de les suivre à la lettre. Parulekar a résumé le constat de son équipe : "La défaillance d'un processus se trouve souvent dans votre document de spécifications produit." Sans couche de contrôle, les entreprises risquent de déployer des agents qui aggravent les coûts au lieu de les réduire. Agentforce Operations introduit aussi de l'observabilité via un modèle de traçage des sessions, et permet d'intégrer des points de validation humaine pour rendre le processus plus transparent et auditable. La plateforme arrive dans un contexte où les entreprises commencent à mesurer que la capacité de raisonnement des modèles IA n'est pas le goulot d'étranglement principal, c'est la cohérence des processus qui les sous-tendent. Mais cette approche soulève un risque structurel : codifier un workflow défaillant l'ancre à l'échelle. Une fois les processus distribués entre agents, la question du gouvernance se pose avec acuité, qui possède le processus, qui le valide, qui le fait évoluer quand les conditions changent ? Brandon Metcalf, fondateur et CEO d'Asymbl, une entreprise d'orchestration de la main-d'œuvre, souligne que la clé reste un objectif partagé entre humains et agents : "Il faut que quelqu'un soit responsable du résultat à livrer, que ce soit une personne ou un agent." Le vrai défi de l'IA en entreprise n'est donc plus technique, il est organisationnel et politique.

UELes organisations françaises et européennes qui déploient des agents IA en entreprise disposent d'un nouveau référentiel d'orchestration et d'observabilité pour sécuriser leurs workflows back-office.

OutilsOutil
1 source
La couche d'orchestration IA s'effondre : le PDG de LlamaIndex explique ce qui survit
478VentureBeat AI 

La couche d'orchestration IA s'effondre : le PDG de LlamaIndex explique ce qui survit

La couche d'outillage qui permettait aux développeurs de construire des applications LLM, moteurs d'indexation, pipelines de récupération, boucles d'orchestration d'agents, est en train de s'effondrer. C'est le constat que dresse Jerry Liu, co-fondateur et PDG de LlamaIndex, l'un des principaux frameworks RAG (retrieval-augmented generation) du marché, dans un épisode récent du podcast VentureBeat Beyond the Pilot. Liu reconnaît lui-même que les frameworks comme le sien deviennent moins indispensables : les modèles actuels raisonnent sur de vastes quantités de données non structurées avec une précision croissante, se corrigent d'eux-mêmes, planifient sur plusieurs étapes, et des protocoles comme MCP (Model Context Protocol) permettent désormais aux agents de découvrir et utiliser des outils sans intégrations manuelles. Résultat : environ 95 % du code de LlamaIndex lui-même est aujourd'hui généré par l'IA. "Les ingénieurs n'écrivent plus vraiment de code", dit Liu. "Ils tapent tous en langage naturel." Ce bouleversement redéfinit ce qui constitue un avantage concurrentiel dans l'écosystème IA. Quand la pile technique se simplifie et que les frameworks d'orchestration perdent de leur valeur, ce qui reste est le contexte, la capacité à extraire les bonnes informations depuis les bons formats de fichiers, avec précision et à moindre coût. LlamaIndex mise sur ce créneau via le traitement documentaire agentique par OCR, ciblant les données "enfermées dans des conteneurs de formats de fichiers". Pour Liu, le choix entre OpenAI Codex ou Claude Code importe peu : "ce dont ils ont tous besoin, c'est du contexte." Cette logique pousse aussi les entreprises verticales spécialisées à prendre de l'avance sur les généralistes, car elles maîtrisent mieux les données et les workflows spécifiques à leur secteur. LlamaIndex est né comme un projet expérimental avec initialement seulement 40 % de précision, avant de devenir une référence de l'écosystème RAG. Mais Liu prend soin d'avertir les entreprises contre la tentation de sur-construire : les stacks doivent rester modulaires et agnostiques vis-à-vis des modèles frontière, car chaque nouvelle version de modèle redistribue les cartes. "Vous voulez garder la flexibilité d'en tirer parti", dit-il. La récupération de données a évolué vers un modèle "agent + sandbox", et les bases de code doivent pouvoir être adaptées sans dette technique excessive. Dans ce contexte, la question "construire ou acheter" reste entièrement valide, en particulier pour les workflows complexes que les entreprises SaaS cherchent à standardiser pour des travailleurs du savoir non techniques. La prochaine bataille ne se joue pas sur l'orchestration, mais sur qui contrôle le contexte.

OutilsOutil
1 source
GitHub Copilot adopte une facturation à la consommation
479AI News 

GitHub Copilot adopte une facturation à la consommation

À partir du 1er juin 2026, GitHub Copilot abandonne son modèle d'abonnement à requêtes fixes pour adopter une facturation à la consommation de tokens. Jusqu'à présent, les utilisateurs disposaient d'un quota mensuel de « requêtes premium », chaque requête comptant pour une unité qu'il s'agisse d'une tâche complexe de refactorisation ou d'une simple question. Le nouveau système remplace ces requêtes par des « AI Credits » : un abonné Copilot Pro à 10 dollars par mois reçoit 1 000 crédits, chaque crédit valant un centime américain. Un token représente environ les trois quarts d'un mot, ce qui signifie que 10 000 mots de code soumis à Copilot génèrent entre 12 000 et 13 000 tokens facturés. Le coût réel dépendra du modèle choisi, du ratio entrées/sorties, de la taille du cache et de la fonctionnalité utilisée. Seules les suggestions de complétion de code et les « Next Edit suggestions » resteront gratuites. Ce changement modifie profondément la relation des développeurs avec l'outil. Alors que l'abonnement mensuel masquait jusqu'ici la consommation réelle de tokens, Microsoft subventionnait de facto trois à huit fois la valeur nominale de chaque abonnement grâce à ses revenus logiciels et cloud, les utilisateurs devront désormais surveiller activement leur dépense token par requête. Pour un développeur qui enchaîne des tâches simples, l'impact sera limité. En revanche, les équipes qui déploient des agents de codage autonomes sur de grandes bases de code risquent de voir leur facture exploser rapidement. Le cas d'Uber est emblématique : selon The Information, le directeur technique de l'entreprise a déclaré avoir déjà épuisé l'intégralité du budget IA 2026 dès les premiers mois de l'année, alors que 11 % des mises à jour du code d'Uber sont désormais rédigées par des agents IA, principalement basés sur Claude d'Anthropic. Ce virage tarifaire s'inscrit dans un mouvement plus large du secteur. Anthropic et OpenAI ont déjà migré leurs clients enterprise vers une facturation à la consommation. Microsoft, propriétaire de GitHub, suit la même trajectoire mais à partir d'une position plus exposée : Copilot cible précisément les développeurs individuels et les petites équipes, un public moins préparé que les grandes entreprises à raisonner en coût par token. Le risque pour GitHub est double : freiner l'exploration des nouveaux utilisateurs, qui hésiteront avant de soumettre de longues sessions de débogage, et accélérer l'arbitrage chez les équipes tech qui compareront désormais les coûts réels de Copilot face à ses concurrents directs comme Cursor ou les offres Claude for Business. La transparence des coûts, longtemps perçue comme un avantage client, devient un terrain de compétition où les marges de chaque acteur seront exposées.

UELes développeurs français et européens utilisant GitHub Copilot devront surveiller activement leur consommation de tokens dès juin 2026 et réévaluer leurs budgets IA face à des alternatives comme Cursor ou Claude for Business.

💬 Microsoft vient de retirer le masque. Tant que le forfait fixe absorbait tout, personne ne regardait la consommation réelle, mais là, un agent autonome sur une grosse codebase, et la facture peut tripler sans prévenir. Le cas Uber, c'est pas une anecdote, c'est exactement ce qui attend les équipes qui ont dit oui à l'IA à grande échelle sans jamais compter les tokens.

OutilsOutil
1 source
Plongée dans le code : UI à base d'agents, UI générative, synchronisation d'état et validation par interruption
480MarkTechPost 

Plongée dans le code : UI à base d'agents, UI générative, synchronisation d'état et validation par interruption

Un tutoriel récemment publié propose de construire une pile complète d'interfaces utilisateur agentiques (Agentic UI) en Python pur, sans recourir à des frameworks externes. L'implémentation couvre le protocole AG-UI, un flux d'événements composé d'environ 16 types diffusés en temps réel via Server-Sent Events (SSE), parmi lesquels des événements de démarrage et fin de session, de messages texte, d'appels d'outils et de synchronisation d'état. Le tutoriel intègre également A2UI, une couche déclarative permettant de définir des interfaces graphiques sous forme de JSON structuré plutôt que de code exécutable. L'ensemble est connecté à un modèle de langage (GPT-4o-mini d'OpenAI dans les exemples de code) capable de générer des interfaces complètes à partir de descriptions en langage naturel. L'enjeu central de cette approche réside dans la synchronisation entre l'état de l'agent et celui de l'interface utilisateur, assurée via JSON Patch, une norme RFC permettant des mises à jour incrémentales et précises de structures de données. Le tutoriel aborde aussi les flux d'approbation interrompus, un mécanisme qui impose une validation humaine pour les actions critiques avant qu'un agent ne les exécute, principe connu sous le nom de "human-in-the-loop". Pour les développeurs, cette architecture ouvre la voie à des interfaces capables de s'adapter dynamiquement au raisonnement d'un agent IA, sans rechargement ni recompilation manuelle. C'est une rupture avec les interfaces statiques traditionnelles : l'UI devient un artefact vivant, piloté par l'état cognitif du modèle. Cet article s'inscrit dans une effervescence croissante autour des systèmes multi-agents et des protocoles qui leur sont associés. AG-UI émerge comme une tentative de standardisation, à l'image du Model Context Protocol (MCP) d'Anthropic pour la gestion du contexte, ou d'Agent2Agent de Google pour la communication inter-agents. L'objectif commun est de fournir une couche d'interopérabilité entre agents et interfaces, indépendamment du modèle sous-jacent. En construisant cet outillage depuis zéro, le tutoriel cherche à démystifier ces protocoles souvent masqués par des abstractions de haut niveau comme LangGraph ou CrewAI. À mesure que les agents IA passent du laboratoire à la production, la question de leur observabilité et de leur contrôlabilité devient critique, et des ressources pédagogiques de ce type jouent un rôle de formation essentiel pour les ingénieurs qui bâtissent ces systèmes.

OutilsOutil
1 source
[AINews] Des agents pour tout le reste : Codex pour le travail intellectuel, Claude pour la création
481Latent Space 

[AINews] Des agents pour tout le reste : Codex pour le travail intellectuel, Claude pour la création

OpenAI a déployé cette semaine une mise à jour majeure de Codex, repositionnant l'outil bien au-delà du code pour en faire un agent universel de travail sur ordinateur. Intitulée « Codex for Work », cette évolution introduit un navigateur réactif 42 % plus rapide, de nouvelles commandes comme /chronicle et /goal, une interface de planification inédite et un éditeur de fichiers intégré pour les formats Microsoft Office, avec des connexions directes aux suites Microsoft, Google et Salesforce. Sam Altman a personnellement amplifié le lancement sur X en invitant les utilisateurs à « essayer Codex pour les tâches non-coding ». Dans le même temps, Anthropic a lancé Claude Security, un outil de revue de code axé sur la détection de vulnérabilités, et a annoncé le support de logiciels créatifs majeurs : Blender, Autodesk, Adobe Creative Cloud, Ableton, Splice, Canva et Affinity. Sur le front des évaluations, le UK AI Security Institute a signalé que GPT-5.5 est devenu le deuxième modèle à compléter de bout en bout une simulation d'attaque informatique multi-étapes, avec un taux de réussite moyen de 71,4 % contre 68,6 % pour Claude Mythos Preview. Ces annonces marquent un tournant stratégique dans la compétition entre les deux leaders de l'IA générative. En transformant Codex en agent généraliste, OpenAI cherche à capturer un marché bien plus large que le développement logiciel : les travailleurs du savoir, analystes, juristes, marketeurs et consultants, qui passent leurs journées entre documents, présentations et feuilles de calcul. L'interface dynamique adoptée par Codex, qui laisse l'agent choisir lui-même l'expérience utilisateur selon la nature de la tâche plutôt qu'un simple bouton de bascule, illustre une ambition de « SuperApp » pleinement assumée. Du côté d'Anthropic, l'intégration aux outils créatifs professionnels ouvre Claude à un public radicalement différent : graphistes, musiciens, vidéastes. Quant aux résultats cyber de GPT-5.5, ils remettent en cause l'avantage qu'Anthropic était supposé détenir dans l'automatisation offensive, les performances du modèle continuant de progresser au-delà de 100 millions de tokens d'inférence sans signe de saturation visible. Ces évolutions s'inscrivent dans une dynamique que les observateurs du secteur nomment « la sortie de confinement des agents de coding » : les outils initialement conçus pour les développeurs commencent à coloniser l'ensemble du travail sur ordinateur. OpenAI productise désormais activement l'interface « agent computer-use », tandis qu'Anthropic mise sur la sécurité et la créativité pour différencier Claude. GPT-5.5 Pro envoie également un signal économique notable : selon Artificial Analysis, il améliore légèrement les scores sur le benchmark CritPt par rapport à GPT-5.4 Pro tout en réduisant les coûts d'environ 60 %, suggérant qu'OpenAI parie autant sur l'efficacité que sur la puissance brute. Les prochaines semaines diront si ces repositionnements trouvent un écho réel auprès des utilisateurs non-techniques que les deux entreprises cherchent désormais à conquérir.

UELes nouveaux outils d'OpenAI et Anthropic (Codex for Work, Claude Security, intégrations créatives) sont accessibles aux professionnels européens, mais les résultats du UK AI Security Institute sur les capacités offensives de GPT-5.5 interpellent les régulateurs de l'UE sur les implications de l'AI Act pour les modèles à double usage.

💬 OpenAI fait sortir Codex du code pour aller chercher les consultants et les juristes, et l'interface qui s'adapte toute seule à la tâche sans bascule manuelle, c'est là que le truc est sérieux. Claude dans Blender et Ableton, je l'attendais pas, mais ça a du sens comme différenciation. Et GPT-5.5 qui boucle des simulations d'attaque cyber à 71%, ça, ça va faire causer bien au-delà du secteur IA.

OutilsOutil
1 source
Comment analyser le sentiment client avec Google Gemini
482The Information AI 

Comment analyser le sentiment client avec Google Gemini

Les équipes de support client croulent sous des volumes considérables de retours non structurés : tickets d'assistance, commentaires d'enquêtes, avis d'applications. Jusqu'à présent, exploiter cette masse de données impliquait un travail manuel fastidieux sur des tableurs, au risque de ce que les spécialistes appellent le "sentiment drift", une dérive progressive des critères d'évaluation humains après l'examen de centaines de réponses. Google propose désormais d'utiliser Gemini, son modèle d'IA générative, pour automatiser cette analyse. En chargeant simplement un fichier tableur et en formulant une instruction précise, les équipes peuvent extraire en quelques secondes des tendances et des résumés qui auraient exigé des heures de revue manuelle, voire qui seraient passés inaperçus. La méthode recommandée s'articule en quatre étapes. La première consiste à préparer les données : renommer les colonnes de façon explicite ("Feedback Text" plutôt que "Col_1"), supprimer les doublons, retirer les données de test internes et, impérativement, anonymiser toute information personnelle avant l'envoi. La fonctionnalité Smart Fill de Google Sheets peut accélérer cette mise en forme. Vient ensuite la rédaction d'un prompt contextualisé, par exemple : "Je suis spécialiste du support client. En utilisant ce tableur, identifiez les tendances dans nos retours d'enquête sur l'année écoulée." Gemini peut alors être invité à repérer les cinq à sept thèmes récurrents, fournir des exemples représentatifs, ou encore détecter des contradictions dans les attentes des utilisateurs. La troisième étape consiste à pousser l'analyse plus loin : distinguer les symptômes de surface des causes profondes. Le modèle peut, par exemple, reconnaître que des dizaines de plaintes sur une "fonctionnalité manquante" reflètent en réalité un problème de navigation dans l'interface, ou relier des réclamations sur des "frais inattendus" à un libellé de facturation ambigu plutôt qu'à une vraie modification tarifaire. Ce type d'usage illustre un tournant dans la relation entre les outils d'IA générative et les métiers opérationnels non techniques. Là où l'analyse de sentiment nécessitait autrefois des compétences en data science ou des plateformes spécialisées, des modèles comme Gemini abaissent radicalement la barrière d'entrée. Pour les entreprises qui traitent des milliers d'avis clients par mois, le gain de temps est substantiel, et la qualité d'analyse potentiellement supérieure à celle d'une équipe humaine soumise à la fatigue de la lecture répétitive. La question qui subsiste est celle de la validation humaine des recommandations générées : Gemini peut identifier des patterns, mais c'est aux équipes de juger si les actions proposées correspondent aux réalités terrain.

OutilsOutil
1 source
Comment analyser le sentiment client avec Google Gemini
483The Information AI 

Comment analyser le sentiment client avec Google Gemini

Les équipes de service client croulent sous les données non structurées : tickets d'assistance, commentaires d'enquêtes, avis d'applications. Jusqu'ici, analyser ces milliers de retours exigeait un travail manuel fastidieux de catégorisation dans des tableurs, un processus lent, subjectif et sujet à ce que les professionnels appellent le "sentiment drift", la tendance des analystes humains à modifier inconsciemment leurs critères d'évaluation après avoir examiné des centaines de données. Google Gemini propose désormais une approche radicalement différente : en chargeant un simple tableur dans le modèle d'IA générative et en lui soumettant une requête ciblée, les équipes peuvent extraire en quelques minutes des tendances et des résumés de patterns qui auraient nécessité plusieurs heures de travail manuel, voire auraient pu passer inaperçus. Le processus se déroule en quatre étapes concrètes. D'abord, préparer les données : renommer les colonnes de façon explicite ("Feedback Text" plutôt que "Col_1"), supprimer les doublons, retirer les données de test internes et anonymiser les informations personnelles avant tout import. Google Sheets facilite cette étape grâce à Smart Fill, qui détecte automatiquement les patterns de saisie. Ensuite, formuler un prompt précis qui contextualise le rôle de l'utilisateur et la nature des données, par exemple demander à Gemini d'identifier les cinq à sept thèmes récurrents sur une année, avec des exemples représentatifs et les tensions éventuelles entre attentes contradictoires des utilisateurs. Dans un troisième temps, Gemini peut aller plus loin en distinguant symptômes de surface et causes profondes : si des dizaines de clients signalent une "fonctionnalité manquante", le modèle peut détecter que le problème réel est sa mauvaise visibilité dans l'interface, ou relier des plaintes sur des "frais inattendus" à une communication tarifaire confuse plutôt qu'à un changement de prix réel. Cette approche s'inscrit dans une tendance plus large d'intégration de l'IA générative dans les outils d'analyse métier, où Google positionne Gemini comme un levier d'efficacité opérationnelle pour les équipes non techniques. L'enjeu dépasse la simple automatisation : il s'agit de rendre l'analyse qualitative scalable, c'est-à-dire applicable à des volumes de données impossibles à traiter humainement. Les entreprises qui adoptent ces workflows peuvent espérer réduire considérablement le temps entre la collecte du feedback client et la prise de décision produit. La limite reste toutefois celle de tout outil d'IA générative : la qualité des insights dépend directement de la qualité des données en entrée et de la précision des requêtes formulées, Gemini amplifie la rigueur analytique des équipes, mais ne la remplace pas.

OutilsTuto
1 source
Nemotron Labs : les enjeux des agents OpenClaw pour toutes les entreprises
484NVIDIA AI Blog 

Nemotron Labs : les enjeux des agents OpenClaw pour toutes les entreprises

En janvier 2026, le projet open source OpenClaw a franchi la barre des 100 000 étoiles sur GitHub, enregistrant plus de 2 millions de visiteurs en une seule semaine. En mars, il atteignait 250 000 étoiles, dépassant React pour devenir le projet le plus étoilé de l'histoire de GitHub en seulement 60 jours. Créé par Peter Steinberger, OpenClaw est un assistant IA autonome et persistant conçu pour fonctionner localement ou sur des serveurs privés, sans dépendre d'APIs ou d'infrastructures cloud tierces. Sa particularité réside dans son mode de fonctionnement : contrairement aux agents classiques qui s'exécutent à la demande et s'arrêtent, les "claws" tournent en continu en arrière-plan, consultent régulièrement une liste de tâches, agissent de façon autonome et n'alertent l'humain que lorsqu'une décision s'impose. Cette popularité fulgurante s'accompagne d'enjeux concrets pour les entreprises et les développeurs. Les chercheurs en sécurité ont rapidement soulevé des questions sur la gestion des données sensibles, l'authentification et les mises à jour de modèles dans des déploiements auto-hébergés. Des risques supplémentaires ont été identifiés, liés aux instances serveur non patchées ou aux contributions malveillantes dans les forks communautaires. C'est dans ce contexte que NVIDIA est entré en jeu, collaborant avec Steinberger pour renforcer la sécurité du projet : isolation des modèles, contrôle des accès aux données locales et vérification des contributions communautaires. NVIDIA a également lancé NemoClaw, une implémentation de référence qui installe en une seule commande OpenClaw, le runtime sécurisé NVIDIA OpenShell et les modèles ouverts Nemotron, avec des paramètres durcis pour le réseau, l'accès aux données et la sécurité globale. La montée en puissance d'OpenClaw illustre une tendance de fond dans l'évolution de l'IA. Après les phases prédictive, générative et de raisonnement, l'IA autonome constitue une quatrième vague qui s'installe à un rythme encore plus soutenu que les précédentes. Chaque phase a multiplié les besoins en inférence : l'IA générative a surpassé le prédictif, l'IA de raisonnement a encore multiplié les besoins par 100, et les agents autonomes à longue durée d'exécution pourraient les multiplier par 1 000 supplémentaires. Cette explosion de la demande de calcul ouvre des perspectives industrielles considérables : des chercheurs capables de travailler sur un problème toute la nuit sans supervision, des systèmes itérant sur des milliers de configurations de conception, ou des outils de monitoring capables de détecter et escalader des anomalies en temps réel. Le déploiement sécurisé de ces agents en entreprise reste cependant un chantier ouvert, que NemoClaw ambitionne de baliser.

OutilsOutil
1 source
RunPod Flash : un outil Python open source pour accélérer le développement IA sans conteneurs
485VentureBeat AI 

RunPod Flash : un outil Python open source pour accélérer le développement IA sans conteneurs

RunPod, la plateforme cloud spécialisée dans les GPU haute performance pour le développement IA, a lancé ce jeudi un nouvel outil open source baptisé RunPod Flash. Distribué sous licence MIT, cet outil Python vise à supprimer une contrainte jusqu'ici incontournable dans le développement serverless sur GPU : la conteneurisation Docker. Dans le cycle de développement traditionnel, un développeur devait écrire un Dockerfile, construire une image, la pousser vers un registre, puis attendre que l'environnement se déploie avant qu'une seule ligne de code puisse s'exécuter sur un GPU distant. Flash remplace ce processus par un moteur de build multiplateforme qui génère automatiquement un artefact Linux x86_64 depuis un Mac M-series, détecte la version Python locale, force les wheels binaires, et monte les dépendances directement à l'exécution sur la flotte serverless de RunPod. Le nouveau décorateur @Endpoint, pièce centrale de cette version GA, centralise la configuration de ce pipeline en un seul appel de fonction. L'impact concret est double. Pour les équipes de recherche, la suppression de ce que RunPod appelle la "taxe de packaging" réduit drastiquement les cycles d'itération : plus besoin de rebuilder et repousser une image à chaque modification de code. Pour les applications en production, Flash embarque des fonctionnalités de niveau entreprise, API HTTP avec load balancing basse latence, traitement par lots en file d'attente, stockage persistant multi-datacenter. L'outil permet également de construire des pipelines dits "polyglots" : un endpoint CPU bon marché peut prendre en charge le prétraitement des données avant de router automatiquement vers un GPU NVIDIA H100 ou B200 pour l'inférence. Cette architecture réduit aussi les "cold starts", ces délais à froid qui pénalisent les environnements serverless, en évitant d'initialiser de lourdes images conteneurisées à chaque requête. Derrière Flash se trouve une infrastructure réseau propriétaire SDN/CDN que RunPod a construite pour résoudre ce que son CTO Brennen Smith décrit comme le vrai problème du GPU cloud : non pas les processeurs eux-mêmes, mais le réseau et le stockage qui les relient. L'outil est explicitement conçu pour servir de substrat aux agents IA et assistants de code, Claude Code, Cursor, Cline sont cités nommément, leur permettant d'orchestrer et déployer du matériel distant de façon autonome. "Tout le monde parle d'IA agentique, mais il faut une colle solide pour que ces agents puissent réellement fonctionner", a déclaré Smith à VentureBeat. RunPod entre ainsi en compétition directe avec AWS Lambda et Modal sur le segment du serverless GPU, en pariant que la suppression de la friction de déploiement sera le facteur décisif pour les labs et équipes produit qui multiplient les expérimentations IA.

OutilsActu
1 source
AWS : guide complet pour migrer des LLMs en production d'IA générative
486AWS ML Blog 

AWS : guide complet pour migrer des LLMs en production d'IA générative

Amazon Web Services a publié un guide technique détaillant un cadre structuré pour migrer des modèles de langage (LLM) en production, baptisé "Generative AI Model Agility Solution". Conçu pour les équipes qui souhaitent passer d'un modèle à un autre, que ce soit entre différentes familles de LLM ou vers une version plus récente du même modèle, le dispositif repose sur trois étapes clés : évaluation du modèle source, migration et optimisation des prompts via Amazon Bedrock Prompt Optimization et l'outil Anthropic Metaprompt, puis évaluation du modèle cible. La durée totale d'une migration en suivant ce cadre varie de deux jours à deux semaines selon la complexité du cas d'usage. AWS met à disposition plusieurs exemples de fonctionnalités et de scénarios concrets pour faciliter la prise en main. La capacité à changer rapidement de modèle est devenue un enjeu stratégique pour les organisations qui déploient de l'IA en production : les performances évoluent vite, les coûts varient fortement d'un fournisseur à l'autre, et rester lié à un seul LLM expose à des risques opérationnels. Ce framework répond à ce problème en automatisant une grande partie du travail de comparaison : il fournit des métriques quantifiables sur le coût, la latence, la précision et la qualité, permettant des décisions fondées sur des données plutôt que sur des impressions. Il prend également en charge les cas où aucune réponse de référence ("ground truth") n'est disponible, en s'appuyant sur des indicateurs comme la pertinence des réponses, leur fidélité au contexte, ou la détection de biais et de contenus toxiques. Le lancement de ce guide s'inscrit dans une compétition intense entre fournisseurs de cloud pour capter les budgets IA des grandes entreprises. Amazon Bedrock, la plateforme d'accès aux LLM managés d'AWS, doit convaincre les organisations qu'elles peuvent migrer vers ses modèles sans friction excessive, notamment face à des concurrents comme Azure OpenAI ou Google Vertex AI. En intégrant nativement l'outil Metaprompt d'Anthropic, AWS mise sur la qualité des prompts comme levier différenciant, une approche cohérente avec les investissements massifs du groupe dans Anthropic. La publication de ce cadre open au niveau méthodologique signale aussi une volonté d'AWS de standardiser les pratiques de migration LLM avant que ce marché ne se fragmente davantage, en positionnant Bedrock comme la plateforme de destination naturelle pour les migrations de production.

OutilsOutil
1 source
Sun Finance automatise l'extraction d'identifiants et la détection de fraude avec l'IA générative sur AWS
487AWS ML Blog 

Sun Finance automatise l'extraction d'identifiants et la détection de fraude avec l'IA générative sur AWS

Sun Finance, fintech lettone fondée en 2017, a déployé en janvier 2026 un pipeline de vérification d'identité entièrement repensé grâce à l'intelligence artificielle générative d'AWS. L'entreprise, active dans neuf pays, traite un dossier de prêt toutes les 0,63 secondes et réalise plus de 4 millions d'évaluations par mois. Sur son marché des microcrédits, quelque 80 000 demandes sont soumises chaque mois, dont 60 % aboutissaient jusqu'ici dans des files d'attente de révision manuelle. En partenariat avec l'AWS Generative AI Innovation Center, Sun Finance a reconstruit son pipeline en combinant Amazon Bedrock, Amazon Textract et Amazon Rekognition. Le projet a duré 107 jours ouvrés au total, du lancement le 26 août 2025 à la mise en production le 22 janvier 2026, incluant un gel de deux semaines pendant les fêtes. Résultat : la précision d'extraction des données documentaires est passée de 79,7 % à 90,8 %, le coût unitaire par document a chuté de 91 %, et le temps de traitement est tombé de 20 heures à moins de 5 secondes. L'impact est immédiat et quantifiable. En éliminant la majorité des interventions manuelles, Sun Finance libère environ trois équivalents temps plein dédiés à la vérification dans une seule région. La réduction du coût par dossier rend désormais rentable l'expansion vers des segments de microcrédits à faible valeur unitaire, jusqu'ici bloqués par les contraintes économiques. Pour les clients, le passage de plusieurs heures d'attente à une réponse quasi instantanée transforme radicalement l'expérience de demande de prêt. Sur le plan de la fraude, la détection automatisée par recherche de similarité vectorielle permet d'identifier les schémas répétitifs utilisés par des demandeurs malveillants qui soumettaient de multiples dossiers avec des images légèrement modifiées, environ 10 % des demandes quotidiennes étaient frauduleuses. La première version du système de vérification d'identité de Sun Finance datait de 2019, déjà bâtie sur Rekognition et Textract. L'expansion vers des marchés émergents a mis en évidence ses limites : les langues locales sont sous-représentées dans les corpus d'entraînement des OCR traditionnels, générant des erreurs fréquentes sur des documents bilingues. Parmi les 60 % de dossiers nécessitant une révision manuelle, 80 % étaient dus à des incohérences entre les données extraites et celles saisies par les clients, et dans 60 % de ces cas, la faute revenait à l'OCR, non à l'utilisateur. La solution actuelle, fondée sur une combinaison de reconnaissance de caractères spécialisée et de structuration par grand modèle de langage, surpasse chaque outil pris isolément. Ce projet illustre une tendance de fond dans la fintech : l'IA générative ne se substitue pas aux outils OCR classiques, elle les complète pour atteindre un niveau de fiabilité industrielle que ni l'un ni l'autre n'atteignent seuls.

UESun Finance, fintech lettone opérant dans neuf pays dont plusieurs en Europe, illustre concrètement comment des acteurs européens du crédit en ligne peuvent automatiser la vérification d'identité et réduire la fraude documentaire grâce à l'IA générative, avec des résultats mesurables (−91 % de coût unitaire, précision passée de 79,7 % à 90,8 %).

OutilsOutil
1 source
Exploiter l'analyse IA à base d'agents sur Amazon SageMaker avec Amazon Athena et Amazon Quick
488AWS ML Blog 

Exploiter l'analyse IA à base d'agents sur Amazon SageMaker avec Amazon Athena et Amazon Quick

Amazon a dévoilé une architecture d'analyse de données intégrant de l'intelligence artificielle agentique sur Amazon SageMaker, combinant Amazon Athena et Amazon QuickSight pour permettre aux utilisateurs métier d'interroger des lacs de données complexes en langage naturel. La solution repose sur une architecture lakehouse construite à partir des jeux de données de référence TPC-H (100 Go hébergés sur S3), et s'appuie sur plusieurs couches technologiques : Amazon S3 comme stockage principal, AWS Glue pour le catalogage des métadonnées, Athena pour les requêtes SQL serverless, et QuickSight avec son moteur SPICE (Super-fast, Parallel, In-memory Calculation Engine) pour la visualisation et l'interface conversationnelle. Les données sont stockées en trois formats distincts, CSV, Apache Iceberg-Parquet avec support ACID et time-travel, et Amazon S3 Tables avec support natif Iceberg, afin d'illustrer la polyvalence d'une architecture data lake moderne. Un agent IA conversationnel, alimenté par des bases de connaissances enrichies via un crawler web, permet ensuite d'interroger ces données structurées et non structurées depuis une interface en langage naturel. L'enjeu principal est la démocratisation de l'accès aux données au sein des grandes organisations. Aujourd'hui, interroger un lac de données pétaoctet exige des compétences pointues en SQL, en modélisation de données et en outils de business intelligence, autant de barrières qui ralentissent la prise de décision dans des secteurs comme la finance, la santé, le retail ou la logistique. En substituant ces interfaces techniques par un agent conversationnel, Amazon permet à des profils non-techniques d'obtenir des insights directement exploitables sans passer par des équipes data. Pour les entreprises, cela signifie moins de goulots d'étranglement, des cycles d'analyse raccourcis, et une gouvernance des données maintenue grâce aux contrôles de sécurité intégrés dans l'écosystème AWS. Cette annonce s'inscrit dans une course plus large entre les grands fournisseurs cloud, AWS, Google et Microsoft, pour intégrer des agents IA directement dans leurs plateformes analytiques. Amazon capitalise ici sur son écosystème existant : QuickSight Q, lancé il y a plusieurs années comme interface NLP pour la BI, monte en puissance avec l'intégration de bases de connaissances et d'espaces collaboratifs (Quick Spaces). La combinaison d'Athena, qui facture à la requête sans serveur à maintenir, et d'agents capables de mélanger données structurées et documentation non structurée, positionne AWS comme un acteur sérieux dans l'analytics agentique d'entreprise. La prochaine étape logique sera l'automatisation complète du cycle analyse-décision-action, où l'agent ne se contente plus de répondre mais déclenche directement des workflows métier.

UELes entreprises européennes déployées sur AWS peuvent adopter cette architecture d'analytics agentique pour réduire leur dépendance aux équipes data, mais l'annonce ne cible pas spécifiquement le marché ou les régulations européennes.

OutilsOutil
1 source
Writer lance des agents IA capables d'agir de façon autonome, face à Amazon, Microsoft et Salesforce
489VentureBeat AI 

Writer lance des agents IA capables d'agir de façon autonome, face à Amazon, Microsoft et Salesforce

Writer, la plateforme d'agents IA pour les entreprises soutenue par Salesforce Ventures, Adobe Ventures et Insight Partners, a lancé le 30 avril 2026 un système de déclencheurs événementiels pour sa suite Writer Agent. Ce nouveau mécanisme permet à ses agents IA de surveiller en temps réel des signaux métier dans Gmail, Gong, Google Calendar, Google Drive, Microsoft SharePoint et Slack, puis d'exécuter automatiquement des workflows complexes en plusieurs étapes, sans qu'aucun humain n'ait à initier le processus. Le lancement comprend également un connecteur Adobe Experience Manager, un plugin d'observabilité Datadog et la prise en charge du chiffrement avec clés personnalisées (bring-your-own encryption keys). Selon Doris Jwo, vice-présidente Product Management chez Writer, le principe est simple : dès qu'un événement qualifié survient dans l'un de ces outils, un "playbook" prédéfini se déclenche et orchestre l'ensemble de la séquence de travail, sans intervention humaine. Ce passage du mode réactif au mode proactif représente une rupture structurelle dans la façon dont les entreprises utilisent l'IA. Jusqu'ici, même les plateformes les plus avancées exigeaient qu'un salarié ouvre une interface et formule une requête. Désormais, c'est l'agent qui surveille, détecte et agit. L'exemple concret fourni par Writer illustre bien l'enjeu : lorsqu'un brief créatif atterrit dans un dossier Google Drive dédié, le système déclenche automatiquement une cascade de playbooks qui rassemble la recherche, génère les visuels et prépare les livrables pour validation humaine, comprimant ainsi plusieurs heures de coordination Slack et de passages de relais entre équipes marketing. C'est précisément ce goulot d'étranglement humain que Writer dit avoir identifié comme principal frein à l'adoption à grande échelle de ses workflows automatisés. Writer n'est pas seul sur ce terrain. AWS, Salesforce et Microsoft accélèrent tous sur leurs propres plateformes agentiques, et la bataille pour devenir le système nerveux autonome des grandes entreprises ne fait que commencer. Writer avait introduit ses playbooks en novembre 2025 pour permettre aux équipes métier d'automatiser des tâches récurrentes sans écrire une ligne de code ; les déclencheurs événementiels en sont la prochaine évolution logique, transformant ces workflows de procédures manuelles en processus permanents et autonomes. La question qui reste ouverte, et qui agite l'ensemble de l'industrie, est celle de la gouvernance : jusqu'où les entreprises sont-elles prêtes à déléguer des décisions à des agents qui agissent seuls, en temps réel, sur des données sensibles et des outils critiques ? Les nouveaux contrôles de sécurité annoncés simultanément par Writer semblent être une réponse directe à cette préoccupation.

UELes entreprises européennes envisageant d'adopter ces agents autonomes devront évaluer leur conformité RGPD, notamment pour le traitement automatisé sans intervention humaine de données sensibles issues de Gmail, SharePoint ou Google Drive.

OutilsOutil
1 source
Box Automate : la fin des tâches répétitives en entreprise
490Le Big Data 

Box Automate : la fin des tâches répétitives en entreprise

Box a lancé Box Automate, une nouvelle solution d'automatisation intégrée à sa plateforme de gestion de contenu, avec pour ambition de transformer les documents statiques en déclencheurs d'actions autonomes. Développée en collaboration avec les modèles d'OpenAI, d'Anthropic et de Google, la solution repose sur un éditeur no-code basé sur le glisser-déposer, permettant à n'importe quel responsable de service de concevoir des flux de travail automatisés sans intervention du département informatique. Le système orchestre des agents IA spécialisés qui analysent le contenu des fichiers, extraient les métadonnées pertinentes et n'impliquent un humain que pour les décisions critiques. Parmi les premiers déploiements notables, Samsung utilise déjà l'outil pour automatiser l'onboarding de ses nouvelles recrues, en connectant des systèmes RH comme Workday et Greenhouse à Box DocGen pour générer des documents personnalisés en temps réel. L'enjeu central de Box Automate est de réduire drastiquement le délai entre la réception d'un document et l'action qui en découle, un goulot d'étranglement chronique dans la majorité des organisations. Les applications couvrent des fonctions très diverses : les services juridiques peuvent automatiser l'évaluation des risques contractuels, les équipes crédit croiser automatiquement les pièces justificatives pour instruire des dossiers de prêt, et les agences de recherche piloter la conformité de leurs rapports techniques. Aaron Levie, PDG de Box, positionne explicitement cette capacité d'automatisation du quotidien comme le véritable retour sur investissement de l'IA en entreprise, au-delà des usages ponctuels ou expérimentaux. Pour les utilisateurs finaux, le gain est immédiat : des traitements qui prenaient plusieurs jours peuvent désormais s'effectuer en quelques minutes. Box s'inscrit dans une tendance de fond qui voit les plateformes de gestion documentaire muer en véritables orchestrateurs de processus métier. Face à des concurrents comme Microsoft SharePoint ou Google Workspace qui intègrent eux aussi des couches d'automatisation IA, Box mise sur la flexibilité architecturale et la neutralité vis-à-vis des fournisseurs de modèles pour se différencier. Le choix d'une architecture ouverte, compatible avec plusieurs grands LLMs, permet à ses clients de bénéficier des avancées technologiques sans reconstruire leurs workflows internes. La commercialisation est déjà effective, avec une offre graduée selon les licences : les versions Business couvrent l'automatisation de base, tandis que l'Enterprise Advanced donne accès à l'orchestration complète par agents IA via Box AI Studio. La prochaine étape sera d'observer si ces promesses d'automatisation tiennent à l'échelle dans des environnements complexes, notamment sur les questions de gouvernance et de traçabilité des décisions prises par les agents.

UELes entreprises européennes utilisant Box peuvent automatiser leurs flux documentaires sans compétences techniques, mais devront évaluer la conformité RGPD des traitements automatisés par agents IA.

OutilsOutil
1 source
Guide des API, MCP et passerelles MCP
491AI News 

Guide des API, MCP et passerelles MCP

Les interfaces de programmation (API) et le Model Context Protocol (MCP) sont deux mécanismes permettant à des systèmes d'échanger des données, mais leur conception répond à des logiques fondamentalement différentes. Une API connecte deux applications selon un contrat rigide : la requête et la réponse sont toutes deux définies à l'avance dans le code, ce qui rend l'échange précis et prévisible, mais fragile dès qu'une des parties modifie son comportement. Le MCP, lui, a été conçu pour un consommateur d'un genre nouveau : les grands modèles de langage (LLM). Un serveur MCP expose trois types de capacités, des outils (actions que le modèle peut déclencher, comme créer un fichier ou interroger une base de données), des ressources (données lisibles en contexte) et des templates de prompts réutilisables. C'est le modèle lui-même qui décide, en fonction de la requête de l'utilisateur, quels outils ou ressources il juge pertinents. La distinction n'est pas qu'architecturale : elle a des conséquences directes sur les coûts et la précision des réponses de l'IA. Quand un LLM interroge une API classique, celle-ci peut renvoyer cinquante champs d'une fiche client alors que le modèle n'a besoin que du statut d'abonnement. Chaque octet inutile consomme des tokens, alourdit la facture d'inférence et dilue la réponse, le modèle peut s'appuyer sur des données non pertinentes et produire des réponses inexactes. Un outil MCP bien conçu retourne uniquement le nombre de clients abonnés à un service donné, sans envoyer l'historique complet des interactions. Pour les équipes qui déploient des assistants IA en entreprise, ce gain de précision et d'économie n'est pas négligeable sur des volumes de requêtes importants. Le MCP, standardisé par Anthropic en 2024, s'impose progressivement comme une couche d'abstraction centrale dans les architectures d'IA agentiques. Il ne remplace pas les API : dans de nombreux systèmes, un serveur MCP appelle lui-même des API en coulisses, mais filtre et formate les données avant de les transmettre au modèle. Cette approche, parfois désignée sous le terme de "MCP Gateway", permet de centraliser l'accès à de multiples sources de données via une interface unique. Les entreprises qui construisent des agents IA capables d'interroger des bases internes, de lire des documents ou de déclencher des actions métier se tournent de plus en plus vers cette architecture. Le choix entre API et MCP se résume ainsi : une API convient quand deux applications se connaissent parfaitement et échangent des données définies ; le MCP s'impose dès que le consommateur est un modèle d'IA dont les besoins varient selon les requêtes des utilisateurs.

OutilsTuto
1 source
Analyse de marchés publics : découvrez l’outil Odiana
492Le Big Data 

Analyse de marchés publics : découvrez l’outil Odiana

Le cabinet lyonnais Odialis a lancé Odiana, une plateforme d'intelligence artificielle destinée aux TPE et PME qui souhaitent accéder aux marchés publics sans se noyer dans la complexité administrative. Conçu pour scanner automatiquement les appels d'offres, l'outil extrait en quelques secondes les points de vigilance, les obligations contractuelles et les critères d'éligibilité de chaque dossier. Accessible dès 49 euros par mois, il s'appuie sur seize années d'expérience terrain accumulées par Odialis dans le conseil aux entreprises pour la commande publique. L'outil intègre également un accompagnement à la décision stratégique dite "Go / No Go", qui aide les dirigeants à arbitrer rapidement s'il vaut la peine de répondre à un appel d'offres, et guide ensuite la rédaction du mémoire technique pour maximiser les chances de succès. Pour les petites structures, l'accès aux contrats publics représente un obstacle réel : les dossiers sont volumineux, le vocabulaire juridique opaque, et le temps à y consacrer souvent disproportionné par rapport aux ressources disponibles. Odiana vise à combler ce fossé en automatisant la veille et la phase d'analyse préliminaire, deux tâches chronophages qui découragent de nombreux dirigeants. En réduisant le coût d'entrée technique, la plateforme pourrait permettre à des entreprises qui s'excluaient jusqu'ici du marché public de candidater de manière compétitive, élargissant de facto la concurrence dans un secteur dominé par les grands groupes. Sur le plan technique, Odiana a été conçue avec une architecture entièrement française, hébergée localement et conforme au RGPD, s'appuyant sur les modèles de langage de Mistral AI pour s'affranchir des juridictions étrangères, notamment américaines. Ce choix de souveraineté numérique répond à une demande croissante des acteurs économiques français soucieux de la confidentialité de leurs données stratégiques. Le projet a bénéficié du soutien de Bpifrance et de partenaires industriels comme La Poste. Odiana s'inscrit dans une tendance plus large d'outillage IA à destination des PME françaises, un segment que plusieurs acteurs cherchent à capter en combinant LLM souverains et expertise sectorielle verticale, plutôt qu'en proposant des outils généralistes.

UEOutil 100 % français (hébergement local, RGPD, modèles Mistral AI) soutenu par Bpifrance et La Poste, qui facilite l'accès des TPE/PME françaises aux marchés publics tout en renforçant la souveraineté numérique sur les données stratégiques d'entreprise.

OutilsOutil
1 source
IBM publie deux modèles Granite Speech 4.1 2B : ASR autorégressif avec traduction et édition non-autorégressive rapide
493MarkTechPost 

IBM publie deux modèles Granite Speech 4.1 2B : ASR autorégressif avec traduction et édition non-autorégressive rapide

IBM a mis en ligne deux nouveaux modèles de reconnaissance vocale open source, Granite Speech 4.1 2B et Granite Speech 4.1 2B-NAR, disponibles sur Hugging Face sous licence Apache 2.0. Ces modèles compacts d'environ 2 milliards de paramètres visent à résoudre un problème classique des équipes IA en entreprise : les systèmes de transcription automatique performants exigent généralement des ressources de calcul importantes, tandis que les solutions légères sacrifient la précision. Les deux modèles partagent une architecture en trois composants, un encodeur audio, un adaptateur de modalité et un modèle de langage, mais divergent sur le mécanisme de décodage. Le modèle standard prend en charge la transcription multilingue et la traduction bidirectionnelle en anglais, français, allemand, espagnol, portugais et japonais. La variante NAR (non-autorégressif) se concentre uniquement sur la transcription, sans le japonais ni la traduction, mais avec des temps de réponse nettement plus rapides. IBM a également lancé discrètement une troisième variante, Granite Speech 4.1 2B-Plus, qui ajoute l'attribution par locuteur et des horodatages au niveau du mot. Sur le leaderboard Open ASR d'avril 2026, le modèle principal affiche un taux d'erreur sur les mots (WER) moyen de 5,33%, avec 1,33% sur le benchmark LibriSpeech clean, des résultats compétitifs pour un modèle de cette taille. L'intérêt concret de ces modèles réside dans leur efficacité à l'inférence. La version NAR utilise un modèle de langage bidirectionnel de 1 milliard de paramètres qui corrige la transcription en une seule passe, sans générer les tokens un à un comme le font les architectures autorégressives classiques. Cela réduit considérablement la latence, ce qui en fait une option sérieuse pour les applications temps réel, centres d'appels, sous-titrage en direct, assistants vocaux embarqués. Pour les équipes qui ont besoin de traduction ou de transcription en japonais, le modèle autorégressif standard reste nécessaire, mais la version NAR offre un avantage décisif dès que la vitesse prime sur la polyvalence. IBM s'inscrit ici dans une tendance de fond : la course aux modèles de reconnaissance vocale ouverts et compétitifs s'est intensifiée depuis qu'OpenAI a publié Whisper en 2022. Plusieurs acteurs, dont Meta et Nvidia, ont depuis proposé leurs propres alternatives, chacun cherchant à optimiser le rapport précision/coût computationnel. La famille Granite, déjà connue pour ses modèles de langage orientés entreprise, s'étend désormais à l'audio avec une approche modulaire et documentée, ce qui facilite l'intégration dans des pipelines existants. La publication sous licence Apache 2.0 permet un usage commercial sans restriction, ce qui devrait accélérer l'adoption dans des secteurs comme la santé, la finance ou les médias, où la transcription précise et souveraine est un enjeu stratégique.

UELes entreprises européennes des secteurs santé, finance et médias peuvent déployer ces modèles en souveraineté complète grâce à la licence Apache 2.0, avec un support natif du français pour la transcription et la traduction.

OutilsOpinion
1 source
Plus besoin de bosser vos fichiers : Gemini crée des documents en quelques secondes
494Le Big Data 

Plus besoin de bosser vos fichiers : Gemini crée des documents en quelques secondes

Google a annoncé le 29 avril 2026 une nouvelle fonctionnalité pour son assistant Gemini : la génération directe de fichiers téléchargeables depuis l'interface de chat. Les utilisateurs peuvent désormais demander à Gemini de produire des documents Word, des feuilles Excel, des PDF et d'autres formats compatibles avec Google Workspace ou Microsoft Office, sans quitter la conversation. Il suffit de décrire son besoin en langage naturel, un rapport client, un CV, un tableau de données, et l'IA génère le fichier complet en quelques secondes, structuré et prêt à l'emploi. Aucun modèle à importer, aucune manipulation préalable requise. La fonctionnalité a été présentée par le compte officiel @GeminiApp sur X, accompagnée d'une vidéo montrant la création simultanée de plusieurs fichiers à partir d'une seule requête. Ce changement supprime une friction majeure dans les flux de travail quotidiens : le copier-coller entre Gemini et un logiciel de bureautique. Pour les professionnels qui utilisent l'IA comme outil de production, rédaction de rapports, construction de tableaux de bord, préparation de présentations, le gain de temps est substantiel. Ce qui prenait auparavant plusieurs logiciels et une série d'allers-retours se centralise désormais en un seul point de saisie. L'impact touche aussi bien les indépendants que les équipes en entreprise, notamment pour les tâches répétitives à faible valeur ajoutée. La nuance tient cependant à la qualité : générer vite ne garantit pas générer juste. Sans relecture humaine, les documents produits peuvent manquer de précision ou de pertinence contextuelle, en particulier pour des livrables destinés à des clients ou des décideurs. Cette annonce s'inscrit dans une tendance de fond chez les grands acteurs de l'IA générative : transformer les assistants conversationnels en outils de production à part entière, capables de remplacer non seulement la réflexion mais aussi l'exécution technique. Microsoft intègre Copilot directement dans Office depuis 2023, OpenAI pousse ses Canvas et ses outils de génération de contenu, et Google accélère l'intégration de Gemini dans Workspace. La bataille se joue désormais sur le terrain de la productivité concrète, mesurable en heures économisées par semaine. Pour Google, cette fonctionnalité renforce la position de Gemini face à ses concurrents directs, notamment ChatGPT et Copilot, sur le marché des assistants professionnels. Les suites logicielles traditionnelles comme Microsoft 365 ou Google Docs ne disparaissent pas pour autant, mais leur rôle évolue : de point d'entrée, elles deviennent potentiellement un simple format de sortie.

UELes professionnels français et européens peuvent immédiatement tester cette fonctionnalité pour réduire le temps consacré à la production documentaire bureautique.

OutilsOutil
1 source
L’IA brise les règles de la conception automobile : un travail de plusieurs mois se fait maintenant en quelques heures
495Presse-citron 

L’IA brise les règles de la conception automobile : un travail de plusieurs mois se fait maintenant en quelques heures

L'intelligence artificielle est en train de bouleverser les méthodes de conception automobile, compressant des cycles de travail de plusieurs mois en quelques heures seulement. Des outils d'IA générative permettent désormais de produire des modèles 3D complets à partir de simples croquis dessinés à la main par les designers. En parallèle, d'autres solutions calculent instantanément la traînée aérodynamique après chaque modification apportée à la silhouette d'un véhicule, une opération qui nécessitait autrefois des journées entières de simulation numérique. Pour les constructeurs, ces gains de temps représentent un avantage compétitif considérable. Le développement d'un véhicule, traditionnellement étalé sur plusieurs années, peut désormais être accéléré de façon significative, réduisant les coûts et permettant de tester un plus grand nombre de variantes. Les équipes de design et d'ingénierie peuvent itérer en temps réel, passant du croquis à l'évaluation physique sans attendre les longues phases de validation intermédiaire. Cette transformation s'inscrit dans une mutation plus profonde de l'industrie, portée par le concept de "véhicule défini par logiciel". L'IA générative, déjà très performante en développement logiciel, aide les constructeurs à produire plus rapidement les systèmes embarqués complexes que ces véhicules requièrent. Alors que la pression concurrentielle de Tesla et des fabricants chinois comme BYD s'intensifie, réduire les délais de mise sur le marché est devenu une priorité stratégique, faisant de l'IA un levier industriel autant qu'un simple outil de productivité.

UELes constructeurs européens comme Renault et Stellantis sont directement concernés par cette accélération des cycles de conception face à la pression concurrentielle chinoise.

OutilsOutil
1 source
Cursor lance un SDK TypeScript pour créer des agents de codage : VM cloud isolées, sous-agents, hooks et tarification à l'usage
496MarkTechPost 

Cursor lance un SDK TypeScript pour créer des agents de codage : VM cloud isolées, sous-agents, hooks et tarification à l'usage

Cursor, l'éditeur de code dopé à l'IA, a annoncé la bêta publique de son SDK TypeScript, baptisé Cursor SDK. Ce kit de développement donne aux ingénieurs un accès programmatique au même moteur d'exécution, à la même infrastructure et aux mêmes modèles qui alimentent l'application desktop, la CLI et l'interface web de Cursor. L'installation tient en une seule commande (npm install @cursor/sdk), et quelques lignes de TypeScript suffisent pour créer une instance d'agent, lui envoyer une tâche et streamer la réponse en retour. L'agent s'initialise via Agent.create(), qui accepte une clé API, un identifiant de modèle (comme composer-2) et une configuration d'exécution locale ou cloud. L'accès aux machines virtuelles cloud sandboxées est compris, et la facturation repose sur un modèle à la consommation de tokens. Ce qui change concrètement, c'est le passage de l'IA de code comme outil interactif à une infrastructure déployable. Jusqu'ici, utiliser les agents Cursor supposait d'être physiquement dans l'IDE. Désormais, ces mêmes agents peuvent être déclenchés depuis un pipeline CI/CD, un service backend, ou intégrés directement dans un produit tiers. Le SDK embarque le même "harness" que les produits Cursor : indexation de code, recherche sémantique, grep instantané, connexion à des serveurs MCP (Model Context Protocol) via stdio ou HTTP, et un système de sous-agents permettant de déléguer des sous-tâches à des agents nommés avec leurs propres modèles et instructions. Des hooks configurables via .cursor/hooks.json permettent en plus d'observer, contrôler ou étendre la boucle d'agent pour du logging, des garde-fous ou une orchestration personnalisée. Ce lancement illustre une tendance de fond dans l'industrie : les éditeurs d'outils IA de développement ne se contentent plus de vendre des assistants, ils veulent devenir la couche d'infrastructure sur laquelle d'autres produits s'appuient. Cursor entre ainsi en concurrence directe avec des frameworks d'orchestration d'agents comme LangGraph ou des solutions cloud comme les APIs d'Anthropic ou d'OpenAI, mais avec l'avantage d'un harness prêt à l'emploi qui évite aux équipes de reconstruire from scratch la gestion du contexte, le sandboxing et la compatibilité avec les nouveaux modèles. Alors que les agents de code automatisés deviennent une brique standard des workflows d'ingénierie, cette ouverture du SDK positionne Cursor comme un fournisseur d'infrastructure autant que comme un éditeur de code, un pivot stratégique qui pourrait redéfinir son modèle économique à mesure que la tarification par token s'impose.

UELes équipes d'ingénierie françaises et européennes peuvent intégrer ce SDK dans leurs pipelines CI/CD, mais aucun impact réglementaire ou institutionnel spécifique à la France ou à l'UE n'est impliqué.

OutilsOutil
1 source
PwC extrait des informations contractuelles grâce à l'annotation IA sur AWS
497AWS ML Blog 

PwC extrait des informations contractuelles grâce à l'annotation IA sur AWS

PwC a développé une solution d'intelligence artificielle baptisée AIDA (AI-Driven Annotation), déployée sur les services cloud d'Amazon Web Services, pour automatiser l'analyse de contrats juridiques et commerciaux. Conçue en collaboration avec les équipes internes du cabinet, cette plateforme combine des modèles de langage de grande taille (LLM) avec des workflows d'extraction automatisés afin de transformer des documents non structurés en données consultables et réutilisables. Concrètement, AIDA offre trois fonctionnalités principales : l'extraction basée sur des modèles personnalisables, un système de questions-réponses en langage naturel à l'échelle d'un seul document, et une interrogation globale sur des milliers de contrats en parallèle. Dans les déploiements clients déjà réalisés, la solution a permis de réduire le temps de relecture manuelle des contrats jusqu'à 90 %, et un grand studio de cinéma et de télévision a vu son temps de recherche de droits chuter de 90 % également. Pour les équipes juridiques, de conformité et d'achats, l'enjeu est considérable. Aujourd'hui, la majorité des entreprises s'appuient encore sur des recherches par mots-clés ou des systèmes de gestion contractuelle classiques, qui peinent à traiter des volumes importants de documents avec une précision constante. AIDA change cette équation en permettant à un utilisateur de poser une question en français ou en anglais sur une clause précise, et d'obtenir une réponse contextuelle assortie de citations directement liées aux passages sources. Cette capacité à interroger simultanément des milliers de contrats en langage naturel réduit les cycles de révision et accélère la prise de décision dans des secteurs comme l'immobilier, les médias ou les achats. Dans le secteur des médias et du divertissement par exemple, AIDA aide producteurs et distributeurs à identifier rapidement les droits de diffusion, de streaming ou de déclinaisons dérivées contenus dans des accords de licence complexes. Cette initiative s'inscrit dans une tendance de fond qui voit les grands cabinets de conseil et d'audit accélérer leur propre transformation par l'IA générative. PwC, comme ses concurrents directs McKinsey, Deloitte ou EY, investit massivement dans des outils propriétaires pour automatiser les tâches à forte intensité documentaire, tout en maintenant une supervision humaine sur les sorties générées par l'IA, ce que la solution impose explicitement avant toute utilisation juridique ou commerciale. Le recours à AWS positionne AIDA dans l'écosystème cloud dominant des grandes entreprises, facilitant son intégration avec des systèmes existants comme les référentiels de documents ou les plateformes de gestion contractuelle. À mesure que les volumes de données contractuelles continuent de croître, ce type d'outil pourrait redéfinir la structure même des équipes juridiques en entreprise, en réorientant les professionnels vers des tâches d'analyse stratégique plutôt que de traitement documentaire.

UEPwC France et ses clients européens peuvent directement adopter AIDA pour automatiser l'analyse contractuelle, la solution supportant explicitement le français pour les équipes juridiques locales.

OutilsOutil
1 source
RAG d'entreprise : pourquoi la recherche hybride a triplé face aux limites de passage à l'échelle
498VentureBeat AI 

RAG d'entreprise : pourquoi la recherche hybride a triplé face aux limites de passage à l'échelle

Au premier trimestre 2026, les entreprises ont cessé d'empiler de nouvelles couches techniques dans leurs systèmes de RAG (génération augmentée par récupération) pour se concentrer sur la réparation de celles qu'elles avaient déjà construites. C'est ce que révèlent les données VB Pulse collectées entre janvier et mars auprès d'organisations de plus de 100 employés, avec 45 à 58 répondants qualifiés par mois. Le chiffre le plus frappant : l'intention d'adopter la récupération hybride a triplé en un seul trimestre, passant de 10,3 % à 33,3 %. Parallèlement, les priorités budgétaires se sont inversées : les dépenses consacrées aux tests d'évaluation ont chuté de 32,8 % à 15,6 %, tandis que l'optimisation de la récupération progressait de 19 % à 28,9 %, dépassant pour la première fois l'évaluation comme premier poste d'investissement. Les bases de données vectorielles standalone, Weaviate, Milvus, Pinecone, Qdrant, ont toutes perdu des parts d'adoption, au profit de stacks maison qui atteignent désormais 35,6 % du marché. Ce basculement traduit un problème structurel que les entreprises ayant déployé massivement le RAG en 2025 rencontrent au même stade : l'architecture conçue pour la recherche documentaire simple ne tient pas à l'échelle des agents autonomes. La récupération hybride, qui combine embeddings denses, recherche lexicale sparse et couches de reranking, s'impose comme réponse de consensus car elle offre la précision et le contrôle d'accès que les workloads agentiques exigent en production. Steven Dickens, vice-président chez HyperFRAME Research, résume la situation vécue par les équipes data : gérer simultanément un store vectoriel, une base graphe et un système relationnel pour alimenter un seul agent représente un cauchemar opérationnel. La montée des stacks personnalisés n'est pas un rejet des solutions managées, mais une réponse à la fatigue de fragmentation. Ce tableau d'ensemble comporte pourtant des angles morts importants. Selon les données VB Pulse, 22,2 % des répondants qualifiés déclaraient en mars n'avoir aucun système RAG en production, contre 8,6 % en janvier, un signal que le rapport attribue à des organisations ayant suspendu ou jamais engagé leurs programmes, concentrées dans la santé, l'éducation et le secteur public. Ces secteurs affichent aussi les taux les plus élevés de budgets stagnants. À l'autre extrémité du spectre, certaines entreprises continuent de miser sur l'infrastructure vectorielle dédiée pour des cas d'usage exigeants : la société &AI fait tourner une recherche sémantique sur des centaines de millions de documents de contentieux en propriété intellectuelle, où l'ancrage de chaque résultat dans un document source réel n'est pas facultatif. Le marché du RAG en 2026 n'est donc pas uniforme : il se divise entre ceux qui reconstruisent ce qu'ils ont précipitamment déployé, ceux qui n'ont pas encore commencé, et ceux qui ont trouvé des cas d'usage suffisamment critiques pour justifier une infrastructure de précision.

OutilsActu
1 source
Organiser la mémoire des agents à grande échelle : patterns de conception par namespace dans AgentCore Memory
499AWS ML Blog 

Organiser la mémoire des agents à grande échelle : patterns de conception par namespace dans AgentCore Memory

Amazon a publié un guide technique détaillé sur la conception de namespaces dans AgentCore Memory, le système de mémoire à long terme intégré à Amazon Bedrock. La fonctionnalité, présentée dans un billet de blog officiel d'AWS, permet aux développeurs d'organiser les souvenirs de leurs agents IA sous forme de chemins hiérarchiques, similaires à des arborescences de fichiers. Concrètement, les préférences d'un utilisateur identifié comme customer-123 seront stockées sous /actor/customer-123/preferences/, tandis que les résumés de ses sessions individuelles seront rangés sous /actor/customer-123/session/session-789/summary/. Ces chemins sont générés automatiquement à partir de trois variables prédéfinies : {actorId} pour l'identifiant de l'utilisateur, {sessionId} pour la session en cours, et {memoryStrategyId} pour le type de stratégie mémoire utilisé. Le système prend en charge plusieurs stratégies superposées, notamment la mémoire sémantique pour les faits durables sur un utilisateur, et la mémoire de résumé pour les synthèses de sessions passées. L'enjeu est concret : sans organisation rigoureuse, les agents IA récupèrent du contexte non pertinent lors de leurs requêtes, ce qui dégrade la qualité des réponses et peut créer des failles de sécurité, notamment en exposant les souvenirs d'un utilisateur à un autre. Le système de namespaces résout ces deux problèmes à la fois. D'un côté, la structure hiérarchique permet une récupération à granularité variable : on peut interroger la mémoire d'une session précise, l'ensemble des préférences d'un utilisateur à travers toutes ses sessions, ou encore des données communes à tous les utilisateurs d'un même agent. De l'autre, AWS intègre des contrôles d'accès IAM natifs qui permettent de délimiter précisément qui peut lire ou écrire dans quelle portion de la mémoire, sans dupliquer le stockage physique. Les namespaces sont des partitions logiques au sein d'une même ressource mémoire, une approche que les équipes habituées aux clés de partition DynamoDB ou aux préfixes S3 reconnaîtront immédiatement. Ce guide s'inscrit dans une dynamique plus large : l'essor des agents IA en production crée une demande croissante pour des infrastructures mémoire robustes et sécurisées. Amazon Bedrock, qui concurrence directement les offres d'OpenAI, Google et Microsoft Azure dans l'espace des plateformes d'agents d'entreprise, cherche à se différencier par des primitives de bas niveau bien pensées. AgentCore Memory, présenté comme une brique fondamentale pour les agents à longue durée de vie, cible les équipes qui construisent des assistants client, des copilotes métier ou des agents autonomes nécessitant une continuité de contexte entre les sessions. La prochaine étape annoncée par AWS porte sur les patterns de récupération multi-niveaux et les stratégies d'isolation entre agents dans des architectures multi-tenants.

UEAmazon Bedrock étant déployé dans des régions AWS européennes, ces patterns de conception sont directement exploitables par les équipes françaises et européennes qui construisent des agents IA sur cette plateforme.

OutilsActu
1 source
IBM lance Bob pour sécuriser le codage IA en production, via routage multi-modèles et contrôles humains
500VentureBeat AI 

IBM lance Bob pour sécuriser le codage IA en production, via routage multi-modèles et contrôles humains

IBM a lancé hier à l'échelle mondiale Bob, sa plateforme de développement logiciel propulsée par l'intelligence artificielle. L'outil, conçu pour écrire, tester et gérer du code tout au long du cycle de développement, est déjà utilisé par plus de 80 000 employés d'IBM après avoir démarré avec seulement 100 utilisateurs internes à l'été 2025. Bob repose sur un routage multi-modèles : il peut s'appuyer sur les modèles Granite d'IBM, les modèles Claude d'Anthropic, ou encore ceux de la société française Mistral, ainsi que sur des modèles distillés plus légers. Les modèles open source comme Qwen d'Alibaba sont explicitement exclus. Selon IBM, certaines équipes ont économisé jusqu'à 70 % du temps sur certaines tâches, soit en moyenne dix heures par semaine. Neal Sundaresan, directeur général de l'automatisation et de l'IA chez IBM, résume la philosophie de la plateforme : « La capacité du modèle seule ne suffit pas. La façon dont vous le déployez, dont vous structurez le contexte, et dont vous maintenez les humains dans la boucle détermine si l'IA tient réellement ses promesses. » Ce qui distingue Bob de concurrents comme Cursor ou Claude Code, c'est le niveau de contrôle et de gouvernance qu'il impose sur les workflows agentiques. Là où d'autres outils placent le développeur au début de la tâche pour qu'il enchaîne les étapes manuellement, Bob introduit des points de contrôle humains structurés à intervalles réguliers, tout en permettant à des agents IA d'accomplir des tâches complexes en plusieurs étapes. Cette approche répond directement aux besoins des grandes entreprises, qui craignent les failles de sécurité et les défaillances d'orchestration lorsque des agents autonomes accèdent à des données en production. Pour les directions techniques et les équipes d'audit, la traçabilité et la capacité à intervenir à tout moment priment sur la vitesse. Cette annonce s'inscrit dans une tension croissante dans l'industrie entre deux visions de l'IA agentique. D'un côté, des systèmes ouverts et autonomes comme OpenClaw ou NemoClaw de Nvidia, qui poussent les limites de l'automatisation dans des environnements bac à sable. De l'autre, des plateformes comme Bob qui privilégient la fiabilité, l'auditabilité et la supervision humaine. OpenAI a récemment ajouté dans son Agents SDK un support pour des implémentations en bac à sable, tandis que Kilo lançait Kilo Claw centré sur la sécurité des agents autonomes. IBM, fort de ses décennies d'expérience dans les systèmes d'entreprise critiques, choisit délibérément la prudence. Sundaresan le dit sans détour : « Il vaut mieux ouvrir la grille lentement que de dire, 'oups, comment je la referme maintenant ?' »

UEMistral, startup française, est intégrée nativement comme l'un des modèles supportés par Bob aux côtés de Claude et Granite, lui offrant une vitrine directe auprès des 80 000 développeurs IBM et renforçant la crédibilité des LLMs européens dans les environnements enterprise critiques.

OutilsOutil
1 source