Aller au contenu principal

Dossier Anthropic — page 24

1261 articles · page 24 sur 26

Suivi d'Anthropic, le laboratoire qui a fait de la safety son positionnement : Claude, Mythos, Opus, partenariats Glasswing, IPO.

Accélérer les workflows de campagne grâce aux analyses d'Adobe Marketing Agent for Amazon Quick
1151AWS ML Blog OutilsOutil

Accélérer les workflows de campagne grâce aux analyses d'Adobe Marketing Agent for Amazon Quick

Adobe et Amazon ont annoncé une intégration entre Adobe Marketing Agent et Amazon Quick, la plateforme de chat IA d'Amazon Web Services, permettant aux équipes marketing d'interroger leurs données de campagne en langage naturel. Le système repose sur le protocole MCP (Model Context Protocol), une norme ouverte qui permet à Amazon Quick de se connecter à des serveurs distants, de découvrir les outils exposés et de les enregistrer comme actions disponibles dans le chat. Concrètement, un responsable marketing peut poser une question comme "quels sont mes segments d'audience les plus performants ?" et obtenir en quelques secondes un classement, un tableau ou une recommandation, sans quitter l'interface de conversation. L'intégration couvre cinq domaines fonctionnels : le suivi des campagnes, la planification, les insights d'audience (taille des profils, chevauchements entre segments), l'analyse des parcours client et la détection de conflits entre journeys avant leur mise en production. Pour les équipes marketing, l'enjeu est considérable : accéder à des données issues d'Adobe Real-Time CDP ou d'Adobe Customer Journey Analytics nécessitait jusqu'ici de naviguer entre plusieurs interfaces spécialisées ou de solliciter des équipes data. Cette intégration réduit ce délai à une simple question en chat, tout en maintenant des contrôles de gouvernance stricts, notamment l'isolation par tenant, la journalisation des audits, le principe de moindre privilège et une validation humaine obligatoire avant toute décision de lancement de campagne. Pour les organisations qui gèrent des dizaines de campagnes simultanées, la capacité à détecter automatiquement les conflits entre parcours clients représente un gain opérationnel direct, évitant qu'un même client reçoive des messages contradictoires depuis différentes campagnes actives. Cette annonce s'inscrit dans une tendance de fond qui voit les grandes plateformes marketing adopter massivement le protocole MCP, popularisé par Anthropic fin 2024, comme standard d'interopérabilité entre agents IA et sources de données métier. Adobe, qui cherche à positionner son Experience Platform comme la colonne vertébrale des stratégies data marketing des grandes entreprises, y voit un levier pour renforcer l'attractivité de sa suite CX Enterprise face à Salesforce et à l'écosystème Google Marketing. Amazon Quick, de son côté, consolide sa place dans l'espace des assistants IA d'entreprise en multipliant les connecteurs vers des applications tierces. L'accès à cette intégration requiert un abonnement Amazon Quick Enterprise et une licence Adobe couvrant au moins l'un des produits CX Enterprise, ce qui la réserve pour l'instant aux grands comptes disposant déjà des deux environnements.

UELes grandes entreprises françaises disposant à la fois d'une licence Adobe Experience Platform et d'Amazon Q Enterprise pourraient exploiter cette intégration, mais son accès reste limité aux grands comptes ayant les deux abonnements.

1 source
Le professeur de la productivité maximale : Anjney Midha, AMP
1152Latent Space 

Le professeur de la productivité maximale : Anjney Midha, AMP

Lors d'un épisode enregistré chez Periodic Labs à San Francisco, Anjney Midha, fondateur d'AMP et ancien architecte de la plateforme développeur de Discord, a livré une analyse décapante de l'efficacité réelle de l'infrastructure IA mondiale. Le constat de départ est frappant : xAI, le laboratoire d'Elon Musk, fonctionnerait à moins de 10 % de MFU (Model FLOPs Utilization), soit moins d'un dixième de la puissance de calcul théorique de ses GPU effectivement convertie en progrès d'entraînement. Pour comparaison, GPT-3 atteignait déjà 21 % de MFU, Gopher 32 %, PaLM 46 %, et les meilleurs systèmes actuels se situent entre 60 et 70 % selon Midha. AMP, la société qu'il dirige, ambitionne de construire un réseau de calcul indépendant capable de délivrer 1,2 GW en charge de base, avec une capacité de pointe visée à 6 GW. Ce chiffre de sous-utilisation illustre un problème structurel plus profond : acheter davantage de GPU ne garantit pas de meilleurs modèles. L'IA de frontière est avant tout un problème de systèmes, où l'ordonnancement, les réseaux, les noyaux logiciels, les pipelines de données et la fiabilité des clusters déterminent si les FLOPs théoriques se transforment en progrès réel. Midha rappelle qu'à Google, un taux d'utilisation de 95 % était traité comme une panne, tant l'optimisation était culturellement ancrée. Il propose le concept d'"outputmaxxing" comme nouvelle discipline à part entière : maximiser les sorties utiles par flop dépensé, plutôt que d'accumuler aveuglément de la capacité brute. À mesure que les organisations s'appuient sur des couches d'abstraction et des API, elles perdent de la performance à chaque niveau de la pile, sans toujours en mesurer les conséquences sur la qualité des modèles. Investisseur dans Anthropic, Mistral, Black Forest Labs et Periodic Labs, Midha a observé de près comment un excès de capital trop précoce peut fragiliser un laboratoire plutôt que le renforcer. AMP se positionne comme un opérateur de réseau de calcul indépendant, sur le modèle des gestionnaires de réseau électrique, permettant aux FLOPs de "circuler comme des mégawatts". Cette vision implique des protocoles ouverts, une intégration communautaire autour des centres de données, et des marchés de calcul où la demande interruptible remplace l'achat brut de capacité. Midha évoque également une "défaillance de marché" pointée par des recherches non publiées de DeepMind, et défend l'idée que la prédiction de fin de vie en médecine pourrait devenir l'une des applications les plus importantes de l'IA dans les prochaines années, un sujet qu'il suit depuis quatorze ans.

InfrastructureOpinion
1 source
Guide Claude Code 2026 : 25 fonctionnalités avec exemples et démo
1153MarkTechPost 

Guide Claude Code 2026 : 25 fonctionnalités avec exemples et démo

Un guide complet des 25 fonctionnalités de Claude Code a été publié à destination des ingénieurs IA, développeurs et data scientists, détaillant comment l'outil d'Anthropic a évolué d'un simple assistant en ligne de commande vers un système agentique structuré en couches. L'outil fonctionne dans le terminal, l'application desktop et les IDE, s'appuyant sur une boucle agentique capable de lire des fichiers, exécuter des commandes, modifier du code et appeler des outils externes. Cette architecture s'articule autour de primitives distinctes : les fichiers CLAUDE.md (constitution du projet lue à chaque session), les skills (fichiers SKILL.md invocables via une commande /nom), les sous-agents (instances spécialisées avec leurs propres fenêtres de contexte), les slash commands intégrées comme /init, /compact ou /review, les hooks (scripts déterministes déclenchés à des points précis du cycle de vie), et les serveurs MCP (Model Context Protocol) pour connecter Claude Code à GitHub, des bases de données ou des navigateurs. Les plugins regroupent l'ensemble en un bundle versionné installable en une commande. S'ajoutent des fonctionnalités comme les checkpoints automatiques avec retour arrière (deux appuis sur Échap), le mode Plan pour explorer sans exécuter, les modes de permission graduables, et Auto Mode, actuellement en aperçu recherche, qui utilise un classifieur Sonnet 4.6 distinct pour évaluer chaque action avant de l'autoriser ou de l'escalader. Pour les équipes techniques, cette architecture en couches change concrètement la manière de travailler sur des projets à long terme. Les sous-agents isolent les tâches verbeuses pour préserver la clarté du contexte principal, tandis que l'Agent SDK expose la même boucle de manière programmatique via query(), permettant d'intégrer /code-review ou d'autres commandes dans des scripts. Le mode headless (claude -p "requête") et l'entrée par pipe (cat logs.txt | claude -p) ouvrent la voie à l'intégration dans des pipelines CI, des jobs planifiés et des hooks pre-commit via GitHub Actions, sans terminal interactif. Ce guide s'inscrit dans une montée en puissance rapide de Claude Code depuis ses débuts expérimentaux. Anthropic a progressivement empilé des couches de contrôle, permissions granulaires, sandboxing, compaction de contexte pour les longues sessions, pour rendre possibles des workflows autonomes sans sacrifier les garde-fous. La concurrence s'est densifiée dans ce segment : GitHub Copilot Agent, Cursor et d'autres environnements agentiques se disputent les workflows des développeurs. Dans ce contexte, Claude Code mise sur la compositionnalité comme avantage différenciant, c'est-à-dire la capacité d'assembler des primitives simples (skills, hooks, MCP, plugins) en systèmes d'ingénierie largement automatisés, adaptés aux équipes qui veulent dépasser l'autocomplétion pour atteindre une véritable délégation de tâches.

OutilsOutil
1 source
Moonshot AI lance Kimi Code CLI : un agent de codage IA en ligne de commande, développé en TypeScript
1154MarkTechPost 

Moonshot AI lance Kimi Code CLI : un agent de codage IA en ligne de commande, développé en TypeScript

Moonshot AI, le laboratoire chinois d'intelligence artificielle, a publié Kimi Code CLI, un agent de codage open source conçu pour fonctionner directement dans le terminal. Distribué sous licence MIT et disponible sur GitHub, l'outil s'installe en une seule commande, sans prérequis Node.js, via un script officiel compatible macOS, Linux et Windows. Écrit en TypeScript et diffusé via npm, Kimi Code CLI succède à l'ancien kimi-cli et s'interface nativement avec les modèles Kimi de Moonshot AI, tout en restant compatible avec d'autres fournisseurs. L'agent est capable de lire et modifier du code, exécuter des commandes shell, explorer des fichiers, interroger des pages web, implémenter de nouvelles fonctionnalités, corriger des bugs, effectuer des refactorisations, répondre à des questions d'architecture et automatiser des tâches en lot. Par défaut, les opérations en lecture seule s'exécutent automatiquement, tandis que les modifications de fichiers ou les commandes shell demandent une confirmation explicite du développeur. L'agent adopte un modèle d'exécution dit "feedback-driven" : il planifie ses étapes, modifie le code, lance les tests et rapporte ses actions en boucle jusqu'à complétion. Parmi ses fonctionnalités distinctives, Kimi Code CLI intègre un support vidéo permettant de déposer un enregistrement d'écran directement dans le chat, une configuration native des serveurs MCP (Model Context Protocol) via la commande /mcp-config, ainsi qu'un système de sous-agents parallèles pour déléguer des tâches d'exploration, de planification ou de codage dans des contextes isolés. Des hooks de cycle de vie permettent d'auditer les décisions de l'agent ou de déclencher des notifications locales. Un mode plan (accessible via Shift-Tab ou --kimi --plan) génère un plan de recherche avant toute modification, et la commande /fork crée une branche expérimentale abandonnnable à tout moment. Kimi Code CLI s'inscrit dans une compétition croissante autour des agents de codage en terminal, un segment en pleine effervescence depuis l'émergence de Claude Code d'Anthropic, Aider ou encore Amp. La tendance de fond est celle de l'autonomisation progressive des outils de développement : les agents ne se contentent plus de suggérer du code, ils planifient, exécutent et itèrent de façon quasi-autonome sur des sessions longues. Moonshot AI, connu pour ses modèles Kimi aux capacités de contexte étendues, positionne cet outil comme une alternative sérieuse aux solutions occidentales dominantes, en ciblant notamment les développeurs souhaitant intégrer des LLMs dans leurs workflows sans quitter le terminal. L'accès au CLI est gratuit, mais l'utilisation des modèles nécessite une authentification OAuth Kimi Code ou une clé API Moonshot AI Open Platform.

UELes développeurs français et européens peuvent tester gratuitement cet agent open source, mais il ne cible pas spécifiquement le marché européen et n'a pas d'impact structurel sur la réglementation ou l'écosystème local.

💬 On ne comptait plus les CLI agents depuis Claude Code, mais celui-là mérite qu'on s'y arrête deux secondes. Le support vidéo natif et les sous-agents parallèles, c'est pas du remplissage de changelog, ça règle de vrais problèmes de workflow que les autres ont encore ignorés. Reste à voir si les modèles Kimi sont à la hauteur en dehors des benchmarks.

OutilsOutil
1 source
Microsoft Fara : lancer un agent Browser-Use dans Google Colab avec un endpoint OpenAI factice
1155MarkTechPost 

Microsoft Fara : lancer un agent Browser-Use dans Google Colab avec un endpoint OpenAI factice

Un tutoriel récemment publié décrit comment déployer Fara, l'agent de navigation web de Microsoft, directement depuis Google Colab sans nécessiter d'infrastructure dédiée. Le guide couvre l'ensemble du pipeline opérationnel : clonage du dépôt GitHub (github.com/microsoft/fara), installation des dépendances via pip, configuration du navigateur Playwright Firefox, puis exécution d'une tâche concrète telle que "ouvrir example.com et décrire le contenu de la page". L'approche centrale repose sur la création d'un point de terminaison fictif compatible avec l'API OpenAI, qui simule les réponses du vrai modèle Fara-7B. Ce serveur mock retourne des actions de navigation valides que Playwright exécute réellement dans le navigateur, reproduisant fidèlement la boucle complète de l'agent en conditions quasi-réelles, sans avoir à héberger un modèle de 7 milliards de paramètres. L'intérêt de cette méthode est de rendre le développement d'agents de navigation accessible sans GPU ni serveur dédié. En découplant la logique de l'agent du modèle de langage sous-jacent, les développeurs peuvent valider leurs flux de travail, déboguer leur code et tester des scénarios d'automatisation à moindre coût. La configuration reste entièrement portable : le même notebook peut être reconnecté à un vrai endpoint Fara-7B hébergé sur Azure AI Foundry, vLLM, LM Studio ou Ollama, en basculant une unique variable booléenne (USEREALFARA_ENDPOINT). Cette flexibilité entre backends réduit significativement le coût d'entrée pour les équipes qui souhaitent expérimenter l'automatisation web par IA sans s'engager d'emblée dans une infrastructure lourde. Les agents capables de piloter un navigateur de façon autonome constituent l'une des frontières les plus actives de l'IA appliquée en 2026. Anthropic a introduit son API "computer use" pour Claude, OpenAI a déployé son agent Operator, et Google explore des capacités similaires via Project Mariner. Microsoft, avec Fara, mise sur un modèle spécialisé entraîné spécifiquement pour piloter des interfaces web, une approche différente des solutions généralistes de ses concurrents. Le choix délibéré de la compatibilité avec le format OpenAI n'est pas anodin : il permet à Fara de s'intégrer dans l'écosystème d'outillage existant sans réécriture majeure. La publication de ce type de tutoriel accessible joue un rôle clé dans la démocratisation de ces technologies, en abaissant la barrière technique pour les développeurs indépendants et les équipes produit qui n'ont pas encore accès à des infrastructures d'inférence dédiées.

OutilsOutil
1 source
Tutoriel : affiner LFM2 avec QLoRA et DPO sur Google Colab
1156MarkTechPost 

Tutoriel : affiner LFM2 avec QLoRA et DPO sur Google Colab

Liquid AI a publié LFM2, un modèle de langage conçu pour fonctionner efficacement sur des appareils à ressources limitées, et un tutoriel complet détaille désormais comment le personnaliser sur Google Colab via une chaîne d'outils entièrement open source. Le workflow s'appuie sur QLoRA (Quantized Low-Rank Adaptation), qui permet de charger le modèle en précision 4 bits via bitsandbytes, réduisant drastiquement l'empreinte mémoire GPU. On part du checkpoint de base LFM2-1.2B, disponible sur Hugging Face sous l'identifiant LiquidAI/LFM2-1.2B, pour enchaîner deux étapes d'entraînement : d'abord un ajustement supervisé (SFT) sur 500 exemples du dataset HuggingFaceTB/smoltalk en 60 étapes, puis un alignement par préférences via DPO (Direct Preference Optimization) en 40 étapes supplémentaires. Les bibliothèques utilisées sont transformers (version 4.55 minimum), TRL, PEFT, accelerate et datasets. Un adaptateur LoRA de rang 16 est entraîné puis fusionné dans le modèle, produisant un checkpoint prêt au déploiement. Ce type de pipeline démocratise concrètement la personnalisation de modèles pour des développeurs sans infrastructure dédiée : l'ensemble du processus tient sur un GPU Colab gratuit ou pro, là où un fine-tuning classique nécessiterait plusieurs GPU A100. La combinaison SFT + DPO représente aujourd'hui la méthode de référence pour obtenir un modèle à la fois instruit (qui suit des consignes) et aligné (qui préfère des réponses de qualité à des réponses médiocres). L'intérêt particulier de LFM2 réside dans son architecture optimisée pour l'inférence on-device, ce qui rend ce tutoriel utile non seulement pour le prototypage cloud, mais aussi pour préparer des modèles embarqués sur mobile ou edge hardware. Liquid AI est une startup fondée en 2023 par des chercheurs du MIT, connue pour ses modèles Liquid Foundation Models (LFM) basés sur des architectures d'équations différentielles neuronales, alternatives aux transformeurs classiques. LFM2 marque une nouvelle génération de ces modèles, avec un accent mis sur l'efficacité computationnelle. Le recours à DPO plutôt qu'au classique RLHF (Reinforcement Learning from Human Feedback) s'inscrit dans une tendance forte depuis 2023 : DPO élimine le modèle de récompense intermédiaire, simplifiant l'entraînement tout en produisant des résultats comparables. La mise à disposition de ce guide complet avec code exécutable sur Colab s'inscrit dans une dynamique plus large de démocratisation du fine-tuning, portée par Hugging Face et la communauté open source, face aux modèles propriétaires d'OpenAI ou Anthropic qui restent des boîtes noires non personnalisables.

LLMsTuto
1 source
Sécuriser les agents IA avec des intercepteurs Policy et Lambda dans la passerelle Amazon Bedrock AgentCore
1157AWS ML Blog 

Sécuriser les agents IA avec des intercepteurs Policy et Lambda dans la passerelle Amazon Bedrock AgentCore

Amazon a enrichi son service Bedrock AgentCore Gateway de deux mécanismes de sécurité complémentaires destinés à contrôler le comportement des agents IA en entreprise. Le premier, appelé Policy, permet de définir des règles d'accès aux outils à l'aide de Cedar, un langage déclaratif d'Amazon qui évalue chaque requête selon un principal, une action et une ressource, puis délivre une décision déterministe d'autorisation ou de refus, automatiquement journalisée. Le second mécanisme, les intercepteurs Lambda, permet d'exécuter du code personnalisé avant ou après chaque appel d'outil, pour effectuer de la validation dynamique, de l'enrichissement de payload, des échanges de tokens ou du filtrage de réponses. Pour illustrer ces capacités, Amazon présente un agent de données baptisé "lakehouse data agent", conçu pour une compagnie d'assurance fictive. Cet agent permet à trois types d'utilisateurs, titulaires de contrats, experts en sinistres et administrateurs, d'interroger des données de réclamations stockées dans Amazon S3 Tables au format Apache Iceberg, via Amazon Athena et AWS Lake Formation. L'interface Streamlit authentifie les utilisateurs via Amazon Cognito et transmet des JWT à l'agent, qui expose cinq outils MCP distincts. Les métadonnées de rôles, les mappings IAM par tenant et la géographie des utilisateurs sont stockés dans Amazon DynamoDB. Ces nouvelles fonctionnalités répondent à un problème de gouvernance concret que rencontrent les grandes organisations déployant des agents IA à l'échelle. Contrairement aux applications traditionnelles qui exécutent une logique fixe, les agents pilotés par un LLM décident au moment de l'exécution quels outils invoquer, avec quels arguments et dans quel ordre. Il devient donc impossible d'auditer le graphe d'appels à l'avance. Sur des plateformes unifiées comptant des centaines d'agents et des milliers d'outils MCP répartis entre différentes équipes et unités métier, ce manque de contrôle crée un risque réel. La combinaison Cedar pour l'autorisation déterministe et Lambda pour la validation contextuelle dynamique, notamment basée sur la géographie de l'utilisateur, offre une architecture de sécurité en couches adaptée à cette réalité. Ce développement s'inscrit dans un mouvement plus large d'industrialisation de l'IA agentique au sein des entreprises, où les questions de sécurité et de conformité deviennent aussi critiques que la performance des modèles eux-mêmes. Le Model Context Protocol, promu initialement par Anthropic, s'impose progressivement comme standard d'interopérabilité entre agents et outils, et AWS prend position en intégrant nativement la gouvernance des outils MCP dans Bedrock. Lake Formation assure par ailleurs une sécurité au niveau des lignes et des colonnes directement à l'exécution des requêtes, garantissant que même un agent mal configuré ne puisse pas exfiltrer de données hors de son périmètre autorisé. La prochaine étape probable pour Amazon sera d'étendre ces mécanismes à des scénarios multi-agents, où la chaîne de confiance entre agents orchestrateurs et agents subalternes soulève des défis de sécurité encore plus complexes.

InfrastructureActu
1 source
Le défi de communication d'OpenAI
1158The Information AI 

Le défi de communication d'OpenAI

OpenAI traverse une période délicate sur le plan de la communication publique, alors que la compagnie se prépare à une introduction en bourse dans un climat politique de plus en plus hostile à l'industrie de l'IA. Depuis le départ de Hannah Wong, responsable des relations publiques, en décembre dernier, le poste est vacant et la recherche d'un remplaçant s'étire. La société a contacté plusieurs profils de haut niveau : Jill Hazelbaker, présidente et directrice des affaires corporate chez Uber ; Sarah O'Brien, qui gère les communications de l'ancien directeur design d'Apple Jony Ive ; et Aaron Zamost, ancien responsable communication chez Square. Aucun accord n'a été conclu à ce jour. Le problème n'est pas seulement de trouver le bon candidat : plusieurs d'entre eux auraient explicitement signalé aux représentants d'OpenAI que le poste est structurellement difficile à tenir. La raison principale est que le PDG Sam Altman et d'autres dirigeants disposent d'une grande liberté de parole publique, multipliant les apparitions médiatiques en suivant leur propre agenda. Dans un secteur où chaque déclaration d'un dirigeant peut déclencher une controverse majeure, l'absence d'un responsable communication expérimenté pour cadrer ces interventions représente un risque réel, d'autant qu'OpenAI a enchaîné plusieurs épisodes embarrassants ces derniers mois. La bataille que se livrent OpenAI, Anthropic et Google dépasse largement les modèles et les revenus : elle intègre désormais la perception publique comme variable stratégique à part entière. Alors qu'Anthropic et OpenAI avancent toutes deux vers une cotation en bourse, la confiance des investisseurs et du grand public devient un actif aussi précieux que la puissance de calcul. OpenAI, en particulier, semble plus exposée que ses concurrentes aux turbulences de communication, ce qui rend le recrutement d'un directeur des affaires publiques de premier plan d'autant plus urgent. Le défi sera de trouver quelqu'un capable de naviguer entre la culture de la liberté de parole qui caractérise la maison et les exigences d'un environnement réglementaire et politique de plus en plus scrutateur.

BusinessOpinion
1 source
Utilisateurs d’iPhone, vous pouvez maintenant précommander l’application Google AI Studio
1159Le Big Data 

Utilisateurs d’iPhone, vous pouvez maintenant précommander l’application Google AI Studio

Google a ouvert ce 21 mai 2026 les précommandes de l'application Google AI Studio sur l'App Store d'Apple, avec un lancement officiel programmé au 1er juillet prochain. L'application sera gratuite au téléchargement, même si certaines fonctionnalités avancées pourraient rester liées aux abonnements payants Gemini. Côté Android, la version Play Store était déjà disponible en préinscription depuis le 19 mai. Concrètement, l'application permet de créer, tester et prototyper des applications basées sur l'IA Gemini directement depuis un smartphone, en utilisant des commandes vocales ou du texte, sans écrire une seule ligne de code. Google met en avant plusieurs fonctionnalités orientées productivité mobile : synchronisation entre appareils, partage de projets simplifié, et une galerie communautaire regroupant des exemples créés par d'autres utilisateurs. Cette version mobile de Google AI Studio représente un changement de cible significatif pour l'outil, jusqu'ici réservé aux développeurs sur navigateur. En rendant le prototypage d'applications IA accessible depuis un iPhone ou un Android, Google élargit son audience bien au-delà des ingénieurs : designers, chefs de produit, entrepreneurs ou simples curieux peuvent désormais tester des idées en déplacement, sans environnement de développement. L'enjeu est de démocratiser la création d'outils IA, en réduisant la friction technique à son minimum. Pour l'industrie, cela accélère potentiellement les cycles d'idéation et de validation de produits, à condition que l'expérience mobile tienne ses promesses en termes de performance et de complétude par rapport à la version desktop. Cette annonce s'inscrit dans une stratégie d'expansion agressive de l'écosystème Gemini par Google, qui cherche à couvrir l'ensemble des points de contact numériques, navigateur, IDE, assistant, et maintenant smartphone. La firme de Mountain View fait face à une concurrence directe d'OpenAI, qui pousse ChatGPT sur mobile avec des fonctionnalités de plus en plus avancées, et d'Anthropic, qui développe ses propres interfaces pour Claude. Proposer un outil de prototypage IA natif sur iOS et Android est aussi une réponse à l'appétit croissant des professionnels pour des workflows IA nomades. Si le lancement du 1er juillet confirme les fonctionnalités annoncées, Google AI Studio mobile pourrait s'imposer rapidement comme un outil de référence pour quiconque souhaite expérimenter avec les modèles Gemini sans contrainte de lieu ni de configuration technique.

UELes professionnels et indépendants européens pourront prototyper des applications IA directement depuis leur smartphone dès le 1er juillet 2026, sans configuration technique ni environnement de développement.

OutilsOutil
1 source
Créer des agents IA pour la business intelligence avec Amazon Bedrock AgentCore
1160AWS ML Blog 

Créer des agents IA pour la business intelligence avec Amazon Bedrock AgentCore

OPLOG, entreprise turque spécialisée dans la logistique e-commerce pilotée par l'IA et la robotique, traite des millions de colis chaque mois en Turquie, au Royaume-Uni et en Allemagne pour des marques internationales et des marketplaces globales. Face à une fragmentation critique de ses données métier réparties entre HubSpot CRM, Microsoft Teams, Databricks et plusieurs autres systèmes indépendants, la société a développé une plateforme de business intelligence (BI) basée sur des agents IA déployés via Amazon Bedrock AgentCore. Concrètement, OPLOG a construit trois agents distincts à l'aide du Strands Agents SDK d'AWS, intégrés avec le modèle Claude Sonnet d'Anthropic et Amazon Bedrock Knowledge Bases pour la recherche par RAG. Les résultats mesurés sont nets : réduction de 35 % des cycles de vente, amélioration de 91 % de la complétude des données CRM, et réduction de 98 % du temps consacré à la recherche manuelle. L'impact opérationnel est significatif pour toute organisation B2B confrontée à des silos de données. Avant ce système, les équipes d'OPLOG passaient plusieurs heures par jour à extraire manuellement des rapports de systèmes disparates, à synthétiser l'information et à préparer des mises à jour. Les rapports hebdomadaires manquaient 60 % des opportunités commerciales, les deals ayant déjà évolué avant que l'analyse soit disponible. Désormais, trois agents autonomes prennent en charge ces tâches en temps réel : le Deal Analyzer Agent tourne selon un calendrier aligné sur l'activité commerciale et analyse les deals HubSpot récents pour vérifier leur conformité méthodologique, en remontant les résultats directement dans Microsoft Teams. Le Sales Coach Agent réagit aux webhooks HubSpot lorsqu'un deal change de stade, valide les champs requis selon le modèle commercial (B2C, B2B, ou mixte), et crée automatiquement des tâches pour les données manquantes. Un troisième agent, dont le détail n'est pas entièrement publié, complète le dispositif côté recherche de prospects. Ce déploiement s'inscrit dans une tendance de fond : les grandes plateformes cloud cherchent à faire des agents IA le nouveau standard de l'automatisation d'entreprise. Amazon Bedrock AgentCore, l'environnement d'exécution managé d'AWS pour agents IA, vise à simplifier ce type d'architecture en éliminant la gestion d'infrastructure tout en offrant scalabilité et traçabilité. Le choix de Claude Sonnet (Anthropic) comme moteur de raisonnement positionne AWS dans une logique de multi-partenariat avec les principaux labs IA. Pour des entreprises comme OPLOG, dont la croissance rapide dépasse les capacités des outils BI traditionnels, cette approche par agents spécialisés et indépendants offre une voie pragmatique vers l'automatisation sans refonte complète du système d'information.

UEOPLOG, présent en Allemagne et au Royaume-Uni, illustre une architecture d'agents IA applicable aux entreprises logistiques et B2B européennes pour automatiser leur BI et réduire les silos de données.

OutilsOutil
1 source
Comment créer des pipelines de génération de graphes de connaissances à partir de texte avec kg-gen, NetworkX et des visualisations interactives
1161MarkTechPost 

Comment créer des pipelines de génération de graphes de connaissances à partir de texte avec kg-gen, NetworkX et des visualisations interactives

Une équipe de chercheurs de l'Université Stanford a publié un tutoriel complet présentant kg-gen, une bibliothèque Python open source permettant de générer automatiquement des graphes de connaissances à partir de texte non structuré. Le workflow décrit s'appuie sur trois outils principaux : kg-gen pour l'extraction des entités et relations, NetworkX pour l'analyse des structures de graphes, et PyVis ainsi que Matplotlib pour la visualisation interactive. Le processus repose sur un modèle de langage configuré via LiteLLM, une couche d'abstraction qui permet de brancher indifféremment GPT-4o-mini d'OpenAI, Claude d'Anthropic, Gemini de Google ou des modèles locaux via Ollama. À partir d'un texte simple, « Linda est la mère de Josh, Ben est son frère, Andrew son père, Josh étudie à Stanford », kg-gen identifie automatiquement les entités (Linda, Josh, Ben, Stanford) et les relations sémantiques qui les lient sous forme de triplets sujet-prédicat-objet. Pour les passages plus longs, la bibliothèque intègre un mécanisme de découpage par chunks de 800 caractères et un algorithme de clustering qui regroupe les entités synonymes, évitant ainsi les doublons lorsqu'un même concept apparaît sous plusieurs formes dans le texte source. L'intérêt concret de cet outil réside dans sa capacité à transformer des corpus textuels volumineux et désordonnés en structures de données navigables et interrogeables. Pour les équipes data, les chercheurs ou les développeurs travaillant sur des bases documentaires, cela représente un gain significatif : là où il fallait annoter manuellement les relations entre concepts, kg-gen automatise l'extraction en quelques lignes de code. Le graphe résultant peut ensuite être analysé avec NetworkX pour identifier les nœuds les plus connectés, détecter des communautés thématiques, ou mesurer la centralité de certains acteurs dans un corpus. La visualisation interactive via PyVis permet de naviguer dans le graphe directement dans un notebook Jupyter ou un navigateur, ce qui ouvre des usages en veille technologique, en analyse de réseaux d'influence ou en construction de bases de connaissances pour des systèmes RAG. kg-gen a été développé à Stanford et s'appuie en interne sur DSPy, un framework de programmation déclarative pour les LLM, pour garantir des sorties structurées et reproductibles. LiteLLM, qui sert de couche de routage, supporte une quarantaine de fournisseurs de modèles, ce qui rend le pipeline indépendant d'un prestataire unique. Ce tutoriel s'inscrit dans une tendance plus large visant à combiner les grands modèles de langage avec des représentations symboliques du savoir, à mi-chemin entre les approches purement neuronales et les systèmes expert classiques. Plusieurs grandes entreprises tech explorent cette direction pour améliorer la fiabilité des réponses de leurs IA, notamment en réduisant les hallucinations en ancrant le raisonnement dans un graphe de faits vérifiables. La prochaine étape naturelle du projet consiste à fusionner des graphes issus de sources multiples, un problème d'alignement d'entités que kg-gen aborde également dans les sections avancées du tutoriel.

OutilsTuto
1 source
Étendre la mémoire conversationnelle de Kiro CLI avec Amazon Bedrock AgentCore Memory
1162AWS ML Blog 

Étendre la mémoire conversationnelle de Kiro CLI avec Amazon Bedrock AgentCore Memory

Amazon Web Services a présenté une solution pour doter Kiro CLI d'une mémoire conversationnelle persistante entre les sessions, en s'appuyant sur Amazon Bedrock AgentCore Memory. Kiro CLI est l'interface en ligne de commande qui permet aux développeurs d'interagir directement depuis leur terminal avec les agents IA de Kiro, l'IDE agentique d'AWS. Le problème résolu est concret : chaque nouvelle session repart de zéro, forçant le développeur à réexpliquer le contexte de son projet, ses préférences et ses conventions à chaque démarrage. La solution repose sur un serveur MCP (Model Context Protocol) personnalisé, open source et disponible sur GitHub, qui fait le pont entre Kiro CLI et le service managé Bedrock AgentCore Memory. Ce serveur expose trois catégories d'outils : des outils conversationnels pour stocker et retrouver l'historique par sujet ou période, des outils de supervision pour consulter les statistiques d'utilisation mémoire, et des outils d'administration pour supprimer des sessions ou des données ciblées. La récupération du contexte repose sur une stratégie à deux niveaux : une recherche sémantique via l'API retrievememoryrecords d'AgentCore Memory, avec repli automatique sur une correspondance directe dans les contenus bruts si le premier niveau n'a pas encore terminé son indexation. L'impact pour les équipes de développement travaillant sur des bases de code volumineuses est direct. Un développeur qui revient sur un projet après plusieurs jours n'a plus besoin de réexpliquer l'architecture, les contraintes métier ou ses préférences de style à l'agent IA : celui-ci retrouve automatiquement les sessions précédentes, identifiables par des formulations naturelles comme "hier soir" ou "la semaine dernière". Cette continuité de contexte réduit la friction cognitive et le temps perdu en répétition, deux freins majeurs à l'adoption productive des outils IA dans les workflows de développement au quotidien. Amazon Bedrock AgentCore Memory est un service entièrement managé lancé par AWS pour répondre à un besoin croissant dans l'écosystème des agents IA : la persistance de la mémoire à long terme. Jusqu'ici, les agents IA des IDEs et des outils de développement souffraient d'une amnésie structurelle entre les sessions, limitant leur utilité réelle sur des projets complexes et de longue durée. Le Model Context Protocol, standardisé par Anthropic, est devenu le mécanisme central d'extensibilité pour les agents IA, permettant à des services tiers d'exposer des capacités via une interface unifiée. AWS positionne ainsi AgentCore Memory comme une brique d'infrastructure réutilisable pour tout éditeur souhaitant ajouter de la mémoire à ses propres agents MCP-compatibles. La mise à disposition du code source en exemple sur GitHub signale une volonté d'adoption large, au-delà de Kiro, vers l'ensemble des clients AWS qui construisent des outils agentiques sur Bedrock.

OutilsOutil
1 source
L'IA a enrichi une infime part de la Silicon Valley et laissé les autres s'interroger sur leur place
1163The Decoder 

L'IA a enrichi une infime part de la Silicon Valley et laissé les autres s'interroger sur leur place

Environ 10 000 personnes dans la Silicon Valley ont amassé des fortunes de plus de 20 millions de dollars grâce au boom de l'intelligence artificielle, selon Deedy Das, associé chez Menlo Ventures. Ces nouveaux riches se concentrent autour d'un petit nombre d'entreprises devenues le centre de gravité du secteur : Anthropic, OpenAI, xAI d'Elon Musk, Meta et Nvidia. Une poignée de salariés arrivés au bon moment, avec les bons titres de poste, ont vu leurs stock-options se transformer en patrimoine générationnel en l'espace de deux ou trois ans. Pour tous les autres, le tableau est bien différent. Les cadres intermédiaires se sentent évincés, coincés entre une direction qui capte toute la valeur et des outils d'IA qui automatisent progressivement leurs fonctions. Le sentiment dominant n'est pas l'enthousiasme mais une forme de désorientation : même parmi les gagnants, Das observe un "manque profond de sens", comme si l'enrichissement brutal avait court-circuité toute notion de trajectoire professionnelle normale. Ceux qui n'ont pas eu accès aux bonnes actions au bon moment regardent cette redistribution depuis l'extérieur, sans filet. Ce phénomène s'inscrit dans une dynamique d'hyperconcentration propre aux cycles technologiques, mais amplifiée par la rapidité exceptionnelle de la montée en puissance de l'IA générative. Les valorisations stratosphériques d'OpenAI et d'Anthropic ont créé des effets de richesse inédits pour un cercle très étroit d'initiés, ravivant le débat sur l'inégalité structurelle au coeur même d'une industrie qui se présente volontiers comme vecteur de progrès universel.

UELe phénomène d'hyperconcentration des richesses générées par l'IA alimente en Europe le débat sur la redistribution des bénéfices technologiques et renforce les arguments en faveur de mécanismes fiscaux spécifiques à l'IA.

💬 10 000 personnes qui deviennent millionnaires, et les autres qui regardent passer le train. C'est le cycle tech classique, sauf que là l'accélération était tellement brutale que même les gens "bien placés" dans les boîtes concernées n'ont pas tous eu leur part. Ce qui me frappe, c'est ce "manque de sens" que ressent même ceux qui ont gagné au loto des stock-options : quand la richesse arrive trop vite, elle court-circuite tout le reste.

SociétéOpinion
1 source
Comment construire un système d'agents IA avec routage dynamique des outils, planification et injection de contexte
1164MarkTechPost 

Comment construire un système d'agents IA avec routage dynamique des outils, planification et injection de contexte

Un tutoriel récemment publié détaille la construction complète d'un système d'agent IA de type MCP (Model Context Protocol) en Python, depuis la configuration jusqu'à l'exécution de tâches réelles. Le système repose sur un serveur d'outils modulaire qui expose des capacités structurées : recherche web via DuckDuckGo, récupération de documents locaux par similarité TF-IDF, chargement de jeux de données et exécution de code Python. Le tout s'appuie sur l'API OpenAI avec le modèle gpt-4.1-mini, et mobilise des bibliothèques comme Pydantic pour la validation des schémas, scikit-learn pour la recherche vectorielle, et Rich pour l'affichage console. Les paramètres globaux limitent volontairement l'agent à trois appels d'outils maximum par tâche, cinq résultats web, et trois documents récupérés, afin de maintenir des performances prévisibles. Ce que ce tutoriel apporte de concret, c'est une réponse au problème central des agents IA en production : comment éviter qu'un agent appelle n'importe quel outil dans n'importe quel contexte. Le système implémente un routeur hybride qui combine des heuristiques simples et du raisonnement LLM pour décider dynamiquement quels outils rendre visibles selon la tâche en cours. Un agent qui répond à une question factuelle simple ne voit pas les outils d'exécution de code ; un agent qui analyse des données n'a pas accès à la recherche web si elle est inutile. Cette exposition sélective réduit les coûts d'inférence, améliore la traçabilité des décisions, et limite la surface d'erreur, trois enjeux critiques pour quiconque déploie des agents dans un environnement professionnel. Le Model Context Protocol, popularisé par Anthropic en novembre 2024 comme standard ouvert pour connecter les LLM à des outils externes, cherche à résoudre un problème de fragmentation : chaque développeur réinventait sa propre façon de brancher des modèles à des APIs ou des bases de données. Ce tutoriel illustre comment les principes MCP, notamment l'injection de contexte structuré, les politiques de routage et le contrôle d'accès aux outils, peuvent être implémentés sans framework propriétaire, en Python pur. À mesure que les systèmes multi-agents se multiplient dans les entreprises, cette approche d'exposition minimale et contrôlée des capacités s'impose comme une bonne pratique d'architecture, opposée aux agents monolithiques qui ont accès à tout et dont le comportement devient difficile à auditer ou à reproduire.

💬 Le routage sélectif des outils, c'est exactement ce qui manque à 90% des démos d'agents qu'on voit tourner. Un agent qui n'expose que ce dont il a besoin pour la tâche en cours, c'est pas glamour, mais c'est ce qui fait la différence entre un prototype et quelque chose qu'on peut vraiment auditer en prod. Reste à voir si les gens implémentent ça sérieusement ou si c'est encore du "best practice" qu'on lit le dimanche et qu'on oublie le lundi.

OutilsTuto
1 source
Agent View débarque sur Claude Code : votre armée d’agents IA en une vue
1165Le Big Data 

Agent View débarque sur Claude Code : votre armée d’agents IA en une vue

Anthropic a lancé une nouvelle fonctionnalité appelée Agent View pour son outil Claude Code, disponible dès la version 2.1.139 de l'application. Accessible via la commande claude agents dans le terminal, cette interface regroupe l'ensemble des sessions d'agents actives dans un tableau de bord unique intégré directement à l'environnement de développement. Elle est disponible pour tous les abonnements Pro, Max, Team et Enterprise, ainsi que via l'API Claude, dans le respect des limites de débit habituelles. Les administrateurs d'organisation disposent par ailleurs de la possibilité de désactiver la fonctionnalité depuis les paramètres centraux. Chaque ligne du tableau de bord représente une session Claude Code avec son état en temps réel : en cours, en attente de réponse humaine, terminée, inactive, arrêtée ou en échec. Pour les équipes de développeurs qui orchestrent plusieurs tâches simultanées, Agent View change concrètement la façon de travailler. Jusqu'ici, gérer plusieurs agents en parallèle signifiait jongler entre de multiples fenêtres de terminal, sans vue d'ensemble claire sur l'état de chaque processus. Désormais, un développeur peut lancer en parallèle des agents chargés de correctifs, de tests, de revues de code ou de mises à jour, passer de l'un à l'autre sans friction, reprendre une session suspendue à tout moment, et surtout identifier immédiatement les agents qui nécessitent une intervention humaine. Ce gain de visibilité est particulièrement précieux dans les environnements d'intégration continue où le temps perdu à chercher quelle tâche est bloquée peut coûter cher. Cette mise à jour s'inscrit dans une stratégie plus large qu'Anthropic mène depuis plusieurs mois pour transformer Claude Code en véritable plateforme de gestion d'agents IA pour les équipes techniques. L'entreprise avait déjà introduit successivement les sous-agents, les équipes d'agents, les compétences personnalisées, les hooks, les commandes à distance, les tâches programmées et une version web de Claude Code. Agent View est en quelque sorte la pièce qui manquait : elle consolide tous ces blocs épars en une interface cohérente. Anthropic cherche clairement à sortir Claude Code du statut d'assistant à l'écriture de code pour en faire un outil d'orchestration de workflows autonomes, en concurrence directe avec des environnements comme GitHub Copilot Workspace ou les solutions agentiques de Google DeepMind. La question qui reste ouverte est celle de la fiabilité à grande échelle : plus les agents sont nombreux et autonomes, plus la capacité à détecter rapidement les échecs devient critique, et c'est précisément ce que vise Agent View.

OutilsOutil
1 source
Miro utilise Amazon Bedrock pour améliorer le routage des bugs logiciels et réduire le délai de résolution de plusieurs jours à quelques heures
1166AWS ML Blog 

Miro utilise Amazon Bedrock pour améliorer le routage des bugs logiciels et réduire le délai de résolution de plusieurs jours à quelques heures

Miro, la plateforme de collaboration visuelle utilisée par plus de 95 millions d'utilisateurs dans le monde, a développé un système d'intelligence artificielle baptisé BugManager pour automatiser le tri et l'affectation des rapports de bugs à ses équipes d'ingénierie. Avant cette solution, une part significative des bugs manquait les délais internes de résolution, principalement à cause d'erreurs d'affectation et de multiples réassignations entre équipes. L'entreprise estimait ces dysfonctionnements à 42 années cumulées de productivité perdue chaque année. BugManager a été développé en partenariat avec l'équipe AWS Prototyping and Cloud Engineering (PACE) et s'appuie sur Amazon Bedrock, Amazon Nova Pro et Claude Sonnet 4 d'Anthropic. Le résultat est saisissant : six fois moins de réassignations entre équipes, et un temps de résolution réduit de plusieurs jours à quelques heures. L'impact est d'abord opérationnel : les développeurs passent moins de temps à gérer des tickets mal orientés et peuvent se concentrer sur la résolution réelle des problèmes. Pour une organisation comptant près de 100 équipes, chacune responsable d'une portion spécifique du produit, un mauvais routage engendre des investigations redondantes, de la frustration, et des retards visibles pour les utilisateurs finaux. En passant d'une logique de classification traditionnelle à une approche basée sur la génération augmentée par récupération (RAG), Miro s'affranchit également de la nécessité de réentraîner ses modèles à chaque réorganisation interne, ce qui représente un gain stratégique considérable dans un environnement où les équipes fusionnent, se créent ou évoluent régulièrement. Les approches précédentes de Miro reposaient sur des modèles fine-tunés comme BERT ou GPT, qui se dégradaient rapidement dès que la structure organisationnelle changeait, faute de données d'entraînement suffisantes pour les nouvelles configurations. BugManager adopte une architecture radicalement différente : lorsqu'un bug est soumis, le système commence par analyser les éléments non textuels (captures d'écran, enregistrements vidéo) via les capacités multimodales d'Amazon Nova Pro, puis enrichit le rapport via des bases de connaissances contenant des tickets Jira déjà résolus, des pull requests GitHub, de la documentation Confluence et des fichiers README. Claude Sonnet 4, via Amazon Bedrock, synthétise ensuite ces informations pour affecter le bug à l'équipe la plus pertinente, sans nécessiter aucun réentraînement. Cette approche "zero-training" représente une tendance de fond dans l'industrie : déléguer la classification complexe à des grands modèles de langage enrichis de contexte métier, plutôt que de maintenir des pipelines d'entraînement coûteux et fragiles.

UELe modèle architectural RAG sans réentraînement décrit constitue une référence concrète applicable par les équipes d'ingénierie françaises et européennes cherchant à automatiser leur gestion de tickets sans pipeline ML coûteux.

OutilsOutil
1 source
GPT-6 déjà teasé par le PDG : OpenAI passe à la vitesse supérieure
1167Le Big Data 

GPT-6 déjà teasé par le PDG : OpenAI passe à la vitesse supérieure

Quelques jours à peine après le lancement de GPT-5.5, le PDG d'OpenAI Sam Altman a publié le 28 avril 2026 sur X une capture d'écran évoquant l'entraînement de GPT-6, avec la mention humoristique « encore plus de gobelins ». Ce teasing inattendu est né d'un bug désormais célèbre dans la communauté tech : depuis GPT-5.1, les modèles d'OpenAI glissaient régulièrement des gobelins, gremlins, trolls et autres créatures fantastiques dans leurs réponses, un comportement qui s'est amplifié de façon notable entre les versions GPT-5.2 et GPT-5.4. Face aux moqueries croissantes sur les réseaux sociaux, OpenAI a fini par intégrer des instructions explicites dans GPT-5.5 pour lui interdire de mentionner ces créatures. C'est cette révélation, découverte par des utilisateurs fouillant les paramètres du modèle, qui a mis le feu aux poudres sur X et poussé Altman à y répondre avec sa propre blague. Au-delà du trait d'humour, la sortie d'Altman a suffi à relancer les spéculations sur le calendrier de sortie de GPT-6. Le PDG n'a fourni aucune date, aucune fonctionnalité précise, aucun engagement formel. Pourtant, dans un secteur où chaque communication du dirigeant d'OpenAI est analysée au millimètre, la simple mention du nom GPT-6 dans un contexte public suffit à signaler que la prochaine génération est au moins en cours de développement actif. Pour les entreprises et développeurs qui intègrent les API d'OpenAI dans leurs produits, cela signifie que la fenêtre entre deux générations majeures continue de se réduire, comprimant les cycles d'adaptation. OpenAI traverse une période d'accélération intense sur son calendrier de sorties : GPT-4o, GPT-4.5, GPT-5, puis GPT-5.1 à 5.5 en l'espace de quelques mois, une cadence sans précédent dans l'histoire du laboratoire. Cette multiplication de versions intermédiaires traduit à la fois la pression concurrentielle exercée par Anthropic, Google DeepMind et les acteurs open source comme Meta, et la volonté d'OpenAI d'itérer rapidement en production plutôt qu'en laboratoire fermé. Les indices accumulés ces derniers mois sur GPT-6 suggèrent une architecture plus stable, une mémoire longue terme améliorée et une intégration plus profonde avec les fichiers et applications tierces. Quant aux gobelins, leur disparition officielle de GPT-5.5 illustre un problème récurrent dans l'entraînement des grands modèles de langage : des comportements émergents inattendus, difficiles à anticiper et à corriger sans instructions explicites.

UELes développeurs et entreprises européens intégrant les API d'OpenAI devront adapter leurs cycles de maintenance à une cadence de sorties qui continue de s'accélérer.

LLMsOpinion
1 source
Le pari risqué de Larry
1168The Verge AI 

Le pari risqué de Larry

Oracle se positionne aujourd'hui comme l'un des baromètres les plus fiables pour mesurer l'état réel du marché de l'intelligence artificielle. La société fondée par Larry Ellison, bien connue pour ses bases de données et ses logiciels d'entreprise, a opéré un virage stratégique radical vers l'IA, d'une nature singulière dans le paysage technologique actuel. Contrairement à OpenAI ou Anthropic, Oracle ne construit pas de modèles fondamentaux. Elle n'est pas non plus un pure player de l'infrastructure cloud nouvelle génération comme CoreWeave, même si elle s'est lancée sur le marché du bare-metal. Oracle reste avant tout une entreprise de logiciels en mode SaaS, qui a misé massivement sur une vision très précise de ce que sera l'IA demain. Ce pari est d'autant plus audacieux que le coeur historique d'Oracle, ses licences logicielles traditionnelles, connaît un déclin progressif. L'entreprise, l'une des plus anciennes du secteur tech avec Microsoft pour seul concurrent comparable en âge, a donc choisi de réinventer son modèle plutôt que de gérer une descente contrôlée. Pour les investisseurs et les analystes, Oracle devient ainsi un indicateur de choix : si son pari IA tient, c'est que la demande enterprise pour l'IA est profonde et durable ; si les résultats déçoivent, le signal sera difficile à ignorer pour l'ensemble du secteur. L'enjeu dépasse Oracle elle-même. Les grandes entreprises traditionnelles du logiciel cherchent toutes à se repositionner face aux nouveaux entrants de l'IA, et Oracle représente le cas le plus tranché de cette transition forcée. Sa capacité à convertir sa base clients historique en revenus IA, tout en concurrençant AWS, Azure et Google Cloud sur l'infrastructure, définira si les acteurs legacy peuvent survivre dans l'écosystème IA ou s'ils seront progressivement marginalisés.

UELes entreprises européennes clientes d'Oracle pourraient être indirectement affectées par ce pivot stratégique, mais l'article ne traite pas d'un impact spécifique sur le marché français ou européen.

BusinessOpinion
1 source
Créer des workflows LLM traçables et évalués avec Promptflow, Prompty et OpenAI
1169MarkTechPost 

Créer des workflows LLM traçables et évalués avec Promptflow, Prompty et OpenAI

Un tutoriel publié récemment détaille la construction d'un pipeline LLM complet et prêt pour la production, en s'appuyant sur trois outils clés : Promptflow, le format Prompty, et l'API OpenAI, le tout déployé dans un environnement Google Colab. Le workflow s'articule autour de plusieurs briques : une connexion sécurisée à OpenAI via un backend keyring alternatif, un fichier Prompty structuré servant de composant LLM central (ici GPT-4o-mini, avec une température de 0,2 et un maximum de 350 tokens), puis un flux de type "flex flow" basé sur une classe Python qui combine un prétraitement déterministe avec le raisonnement du modèle. Le système permet d'injecter des hints calculés dans les réponses du modèle, d'activer une traçabilité pas-à-pas de chaque exécution, de lancer des requêtes unitaires ou en batch, et de générer des sorties dans un format structuré. La chaîne se conclut par un pipeline d'évaluation automatisé dans lequel un LLM joue le rôle de juge pour noter les réponses produites face à des réponses attendues. L'intérêt de cette approche est double : elle apporte de la traçabilité à chaque étape d'un pipeline LLM, un manque criant dans beaucoup de déploiements actuels, et elle industrialise l'évaluation en remplaçant la validation manuelle par un juge automatisé. Pour les équipes qui cherchent à passer du prototype au système en production, ce type d'architecture garantit qu'on peut auditer, déboguer et améliorer le comportement du modèle de façon systématique. La combinaison d'un outil déterministe (le calcul sécurisé) et d'un raisonnement LLM dans un même flow illustre aussi comment orchestrer des agents hybrides, sujet central du moment dans le développement d'applications IA. Promptflow est un framework open source lancé par Microsoft en 2023, initialement pensé pour Azure AI Studio mais disponible en local. Il répond à un besoin croissant dans l'industrie : les équipes ne manquent plus de modèles, mais d'outils pour structurer, tester et maintenir des workflows LLM dans la durée. Le format Prompty, introduit plus récemment, standardise la définition des appels au modèle en séparant la configuration (modèle, paramètres, connexion) du template de prompt, ce qui facilite la réutilisation et la gouvernance. Avec l'essor du concept de LLM-as-a-judge, popularisé notamment par des travaux de Lmsys et repris par OpenAI et Anthropic dans leurs propres systèmes d'évaluation, le tutoriel s'inscrit dans une tendance de fond : automatiser non seulement la génération, mais aussi le contrôle qualité des sorties, condition nécessaire pour une adoption enterprise sérieuse de l'IA générative.

OutilsTuto
1 source
Tutoriel OpenMythos : Transformers à profondeur récurrente, calcul adaptatif et routage par mélange d'experts
1170MarkTechPost 

Tutoriel OpenMythos : Transformers à profondeur récurrente, calcul adaptatif et routage par mélange d'experts

Une bibliothèque Python open source baptisée OpenMythos propose une reconstruction théorique de l'architecture dite "Claude Mythos", une approche de raisonnement approfondi qui mise sur l'itération computationnelle plutôt que sur l'augmentation du nombre de paramètres. Publiée sur PyPI sous le nom open-mythos, elle permet de construire des modèles de langage dotés d'un mécanisme de profondeur récurrente, où la même couche de traitement est traversée plusieurs fois en boucle. Le tutoriel publié explore deux variantes du mécanisme d'attention : GQA (Grouped Query Attention) et MLA (Multi-head Latent Attention), compare leur empreinte mémoire respective, entraîne un modèle sur une tâche de parité binaire, et inspecte l'utilisation des experts dans des couches de type Mixture-of-Experts (MoE). Les expériences montrent que MLA réduit la taille du cache KV d'un facteur d'environ 2 par rapport à GQA pour une séquence de 64 tokens sur 4 boucles. L'enjeu central de l'architecture est ce que les auteurs appellent la "depth extrapolation" : la capacité à augmenter le nombre de boucles de raisonnement au moment de l'inférence, sans réentraîner le modèle. Un modèle entraîné avec 4 itérations peut ainsi être utilisé avec 8 ou 16 boucles pour améliorer ses performances sur des tâches complexes, sans modifier aucun paramètre. Ce paradigme s'inscrit dans la tendance plus large du "test-time compute", qui consiste à allouer davantage de calcul au moment de la génération plutôt qu'à l'entraînement. Le tutoriel valide également la stabilité numérique du modèle via les propriétés spectrales de la matrice de mise à jour récurrente, un point critique pour éviter l'explosion ou la disparition des gradients dans les boucles profondes. Le module ACT (Adaptive Computation Time) permet en outre au modèle de décider dynamiquement combien d'itérations sont nécessaires pour chaque token. Cette publication s'inscrit dans un contexte de forte effervescence autour des architectures alternatives aux transformeurs classiques. La référence à "Claude Mythos" suggère une inspiration directe des travaux d'Anthropic, même si le projet reste une reconstruction théorique non officielle. Le champ des architectures récurrentes profondes connaît un regain d'intérêt depuis 2024, porté par des travaux comme les Recurrent Depth Transformers de Google DeepMind et les architectures hybrides SSM/attention. OpenMythos se positionne comme un outil pédagogique et expérimental pour explorer ces idées, à destination de chercheurs et d'ingénieurs qui cherchent à comprendre comment atteindre des capacités de raisonnement plus profondes sans multiplier les paramètres, une piste particulièrement pertinente dans un contexte où l'entraînement de modèles frontières est devenu prohibitif pour la majorité des acteurs.

RecherchePaper
1 source
Bilan AIE Europe et thèse des Agent Labs : épisode croisé Unsupervised Learning x Latent Space (2026)
1171Latent Space 

Bilan AIE Europe et thèse des Agent Labs : épisode croisé Unsupervised Learning x Latent Space (2026)

Enregistré quelques jours après la conférence AIE Europe 2026, un épisode spécial du podcast Unsupervised Learning a réuni Jacob Effron et Shawn Wang, plus connu sous le pseudonyme "swyx", figure centrale de la communauté AI engineering, pour faire le point un an après leur premier épisode croisé avec Latent Space. Les deux animateurs ont passé en revue l'ensemble du paysage IA : infrastructure agentique, guerres du code, formation de modèles spécialisés, valorisations débridées, et ce que signifie vendre à des agents plutôt qu'à des humains. Parmi les points saillants : le playbook des "agent labs", qui consiste à démarrer avec des modèles frontier, à se spécialiser sur un domaine, puis à entraîner ses propres modèles une fois que les données, les volumes d'usage et les économies de latence le justifient. Des entreprises comme Cursor et Cognition sont citées comme exemples concrets de cette trajectoire. Ce que l'épisode documente, c'est la maturation accélérée d'un marché encore en phase d'exploration intensive. L'infrastructure IA a contraint ses acteurs à se réinventer chaque année, tandis que les entreprises applicatives ont mieux résisté à la volatilité des modèles en s'ancrant dans des workflows métier précis. La spécialisation de domaine, la distillation et l'amélioration du contexte ("context engineering") émergent comme leviers de différenciation réels, pas de simples arguments marketing. Le marché du coding IA, l'une des catégories à la croissance la plus rapide, illustre cette dynamique : Anthropic, OpenAI, Cursor et Cognition y ont tous prospéré, mais seule une poignée de noms s'impose comme gagnants réels, un mystère que l'épisode laisse en partie ouvert. La mémoire et la personnalisation sont identifiées comme le prochain grand vecteur de différenciation produit, dans un monde où les modèles récompensent encore trop la fréquence de mention plutôt que la pertinence contextuelle. L'épisode s'inscrit dans un moment charnière : les grands labos frontier tentent d'envahir les verticaux comme la finance et la santé, mais laissent encore de l'espace aux entreprises focalisées qui contrôlent le workflow et le "dernier kilomètre" utilisateur. Swyx se dit plus optimiste qu'avant sur l'open source et sur l'émergence de hardware non-Nvidia, soulignant que chaque accélération de 10x en inférence peut débloquer des expériences produit inédites. L'épisode a été enregistré avant l'annonce de l'accord Cursor-xAI, ce qui lui donne rétrospectivement une valeur de document pré-rupture, un instantané du marché juste avant que la consolidation ne s'accélère davantage. Le marché du coding est présenté comme le modèle préfigurant la trajectoire de toutes les autres verticales IA.

UELa conférence AIE Europe 2026 fournit le cadre géographique, mais l'analyse porte essentiellement sur des acteurs américains ; les startups et développeurs européens peuvent s'inspirer du playbook des 'agent labs' pour calibrer leur propre trajectoire de spécialisation.

BusinessOpinion
1 source
1172VentureBeat AI 

Von recommande tous les grands modèles IA pour l'analyse des revenus, et automatise leur combinaison

Von, une nouvelle plateforme d'intelligence artificielle lancée par l'équipe derrière Rattle, une startup spécialisée dans l'automatisation des processus, s'attaque à un paradoxe bien connu dans les entreprises tech : si les outils comme Claude Code ou Cursor ont radicalement transformé le quotidien des développeurs, les équipes commerciales restent, elles, prisonnières de silos de données, de saisies manuelles dans les CRM et de reportings approximatifs. Fondée par Sahil Aggarwal, Von se positionne non pas comme une solution ponctuelle supplémentaire, mais comme une "couche d'intelligence" unifiée pour les équipes Go-To-Market. La plateforme commence par construire un "graphe de contexte" de l'entreprise en ingérant des données structurées issues de CRM comme Salesforce et HubSpot, ainsi que des données non structurées provenant d'enregistreurs d'appels (Gong, Zoom, Chorus), de fils de messagerie et de documentation interne. Elle s'appuie ensuite sur une architecture multi-modèles : Claude d'Anthropic pour le raisonnement de haut niveau, ChatGPT pour le traitement massif de données, et Gemini de Google pour la génération de contenus créatifs comme les présentations et rapports. Lors d'une démonstration, Von a analysé 101 comptes PME pour identifier les risques de désabonnement en un peu plus de trois minutes, une tâche qu'un analyste humain effectuerait en une à deux semaines. L'enjeu est considérable pour les opérations commerciales. L'un des problèmes chroniques des équipes de vente est l'écart entre ce qui est enregistré dans un CRM et ce qui s'est réellement dit lors d'un appel client. Von résout ce problème en croisant automatiquement les transcriptions d'appels avec les données Salesforce, permettant d'identifier des incohérences dans les raisons de pertes de deals ou d'évaluer la santé d'une opportunité commerciale sur la base du sentiment réel exprimé, et non d'une mise à jour manuelle d'un commercial. La plateforme génère également des fiches de briefing pré-appel, des analyses de victoires et défaites commerciales regroupées par thèmes, et automatise les tâches administratives Salesforce à faible valeur ajoutée. En agissant comme un "Data Scientist IA" ou un "VP RevOps" virtuel, Von promet de libérer les équipes des tâches de reporting répétitives pour les recentrer sur la vente. Ce positionnement s'inscrit dans une tendance plus large de l'IA d'entreprise : après avoir conquis les workflows techniques, les grandes plateformes cherchent à s'implanter dans les fonctions commerciales et opérationnelles, historiquement moins automatisées. Von hérite de l'expertise de Rattle dans l'intégration des outils de vente, ce qui lui confère une connaissance fine des flux de données GTM. Le choix d'une stratégie "mixture of models" plutôt que d'un modèle unique reflète une maturité technique croissante dans l'industrie, où l'optimisation coût-performance dicte désormais l'architecture des solutions. La prochaine étape pour Von sera de démontrer sa capacité à s'imposer face à des acteurs établis comme Clari, Gong ou Salesforce Einstein dans un marché de l'intelligence des revenus déjà très concurrentiel et en pleine consolidation.

OutilsOutil
1 source
1173AWS ML Blog 

Simulateur d'outils : tests à grande échelle pour agents IA

Amazon Web Services a lancé ToolSimulator, un framework de simulation d'outils propulsé par des LLM, intégré au SDK Strands Evals. Disponible dès maintenant, cet outil permet aux développeurs de tester en profondeur les agents IA qui dépendent d'API externes, de bases de données ou de services MCP, sans jamais déclencher d'appels réels. Concrètement, un développeur qui teste un agent de réservation de vols peut simuler des recherches, des confirmations et des annulations avec des données réalistes et cohérentes, sans envoyer de vraie requête à une compagnie aérienne. L'installation se résume à une commande pip install strands-evals, et aucun compte AWS n'est requis pour exécuter les simulations localement. L'enjeu est considérable pour les équipes qui industrialisent des agents IA. Tester contre des API en production expose des données personnelles, risque de déclencher des actions irréversibles comme l'envoi d'e-mails ou la modification de bases de données, et se heurte aux limites de débit qui rendent impraticable le passage à l'échelle sur des centaines de scénarios de test. Les mocks statiques, l'alternative habituelle, s'avèrent insuffisants dès qu'un agent enchaîne plusieurs appels dont le deuxième dépend de l'état laissé par le premier. ToolSimulator résout ce problème en maintenant un état partagé cohérent entre les appels successifs : une écriture affecte les lectures suivantes, exactement comme dans un système réel. Les schémas de réponse peuvent être imposés via des modèles Pydantic, ce qui garantit la validité structurelle des sorties simulées et permet de détecter les bugs d'intégration tôt dans le cycle de développement. Ce lancement s'inscrit dans la montée en maturité de l'outillage autour des agents IA autonomes, un segment en pleine explosion depuis l'essor des modèles capables d'utiliser des outils externes. AWS positionne Strands Evals comme une réponse aux besoins des équipes qui passent du prototype à la production : l'absence de cadre de test robuste est aujourd'hui l'un des principaux freins à ce passage. ToolSimulator rejoint un écosystème d'évaluation d'agents qui comprend déjà des solutions comme LangSmith d'Anthropic ou les environnements de sandbox d'OpenAI, mais mise sur l'intégration native avec le SDK Strands et la génération adaptative de réponses par LLM plutôt que sur des templates figés. La prochaine étape naturelle sera d'étendre ces capacités aux workflows MCP complexes et aux agents multi-modaux, à mesure que les cas d'usage en production se diversifient.

OutilsOutil
1 source
1174AWS ML Blog 

Commandes omnicanales avec Amazon Bedrock AgentCore et Amazon Nova 2 Sonic

Amazon a présenté une architecture complète pour construire des systèmes de commande vocale omnicanaux en s'appuyant sur deux de ses services cloud : Amazon Bedrock AgentCore, une plateforme dédiée au déploiement d'agents IA en production, et Amazon Nova 2 Sonic, un modèle de fondation speech-to-speech disponible via Amazon Bedrock. La solution permet à une application de traiter des commandes vocales en temps réel sur plusieurs points de contact simultanément, application mobile, site web et interface vocale, tout en maintenant le contexte conversationnel entre les échanges. L'infrastructure s'appuie sur AWS CDK pour le déploiement, le protocole MCP (Model Context Protocol) pour connecter l'agent IA aux services métier, et une série de services managés : Amazon Cognito pour l'authentification OAuth 2.0, API Gateway pour exposer les endpoints REST, AWS Lambda pour la logique métier, DynamoDB pour le stockage des profils et commandes, et AWS Location Services pour les recommandations géolocalisées de points de retrait. L'intérêt principal de cette architecture réside dans sa capacité à isoler chaque composant pour les faire évoluer indépendamment. AgentCore Runtime exécute chaque session utilisateur dans une microVM isolée, ce qui garantit qu'un pic de charge sur une session n'affecte pas les autres, un problème classique des systèmes vocaux en production. Le MCP standardise la communication entre l'agent et les services backend, ce qui permet de modifier ou d'étendre la logique métier sans réécrire le code d'intégration. Pour les équipes qui construisent des expériences de commande vocale à grande échelle, restauration rapide, retail, logistique, cette séparation claire entre la couche IA, le frontend et le backend réduit significativement la complexité opérationnelle et les risques de régression lors des mises à jour. La publication de cette solution s'inscrit dans une compétition intense autour des agents IA en production. Google, Microsoft et des acteurs comme Anthropic proposent leurs propres infrastructures agentiques, mais AWS mise sur l'intégration native avec son écosystème de services cloud existants comme différenciateur clé. Nova 2 Sonic, le modèle speech-to-speech au coeur du système, représente l'entrée d'Amazon dans les interfaces vocales conversationnelles en temps réel, un segment où OpenAI s'est imposé avec GPT-4o Voice. En publiant ce tutoriel complet avec une architecture de restaurant fictive comme backend d'exemple, Amazon cherche à accélérer l'adoption par les développeurs et à établir AgentCore comme standard de fait pour le déploiement d'agents IA sur AWS. Les prochaines étapes logiques incluront probablement l'extension à d'autres modalités et l'intégration avec des systèmes de caisse et d'inventaire existants.

OutilsOutil
1 source
1175Le Big Data 

AIDA : l’IA de Starburst pour une entreprise réellement data-driven

Starburst a annoncé le lancement d'AIDA (AI Data Assistant), un assistant analytique conçu pour permettre aux entreprises d'interroger leurs données distribuées sans migration préalable ni compromis sur la sécurité. Développé par la société fondée par Justin Borgman, cet outil s'adresse aux organisations qui peinent à exploiter leur patrimoine informationnel fragmenté entre clouds multiples et serveurs locaux. Contrairement aux interfaces classiques qui se contentent de convertir une question en requête SQL, AIDA repose sur le cadre "ReAct" : l'assistant décompose chaque demande métier, analyse les métadonnées disponibles et valide ses propres étapes de raisonnement avant de formuler une réponse. Résultat : des analyses ancrées dans les données réelles plutôt que des approximations générées par des modèles de langage mal contextualisés. La solution s'adapte également au profil de l'interlocuteur, offrant une profondeur technique aux analystes et des indicateurs directement actionnables aux dirigeants. L'impact concret se mesure d'abord dans la performance opérationnelle et financière des entreprises. En connectant AIDA à des outils comme Slack ou Jira via le protocole ouvert MCP, les organisations automatisent des flux de travail critiques jusqu'ici trop rigides. Les premiers cas d'usage documentés portent sur la rétention client, grâce à une détection plus fine des signaux faibles d'insatisfaction, et sur la correction d'erreurs de facturation rendues visibles en croisant contrats et consommation réelle. Pour les directions techniques, la compatibilité avec les principaux moteurs d'IA du marché, OpenAI, Anthropic et AWS Bedrock, élimine le risque d'enfermement propriétaire et permet une maîtrise des coûts adaptée à chaque secteur. Des garde-fous configurables filtrent par ailleurs les sujets sensibles et protègent les données personnelles, levant ainsi les blocages de conformité qui freinent habituellement les projets d'innovation interne. Ce lancement s'inscrit dans une tendance de fond : les entreprises disposent de volumes de données considérables mais restent incapables d'en extraire de la valeur à cause de l'éclatement des infrastructures. Starburst, spécialisé dans les moteurs de requêtes distribuées basés sur Trino, élargit ici son positionnement vers la couche conversationnelle, un terrain de plus en plus disputé entre acteurs du data warehouse, éditeurs de business intelligence et grandes plateformes cloud. En affirmant, par la voix de Borgman, que "la valeur réside dans la donnée elle-même plutôt que dans le modèle", Starburst tente de se différencier des solutions d'IA générative généralistes en misant sur la fiabilité analytique. La prochaine étape sera de démontrer, à grande échelle et dans des environnements de production exigeants, que ce raisonnement augmenté tient ses promesses face aux géants déjà positionnés sur ce créneau.

OutilsOutil
1 source
Le tokenmaxxing commence peut-être déjà à reculer
1176The Information AI 

Le tokenmaxxing commence peut-être déjà à reculer

Chez Meta, un phénomène insolite a récemment été mis en lumière par The Information : des employés se livrent à une compétition interne baptisée "Claudeonomics", un classement mesurant qui consomme le plus de tokens d'IA dans son travail quotidien. Le record récent appartient à un employé ayant utilisé 328,5 milliards de tokens sur une période de 30 jours, ce qui représente une facture potentielle de près de 2 millions de dollars aux tarifs publics d'Anthropic. Ce comportement, surnommé "tokenmaxxing", consiste à maximiser délibérément sa consommation d'IA pour signaler son implication et sa productivité à l'entreprise. Ce phénomène révèle une fracture croissante entre les géants technologiques ultra-capitalisés et le reste des entreprises. Si Meta peut absorber des dépenses d'IA colossales pour ses ingénieurs, la grande majorité des organisations ne dispose pas de tels budgets. Le tokenmaxxing risque ainsi de devenir un indicateur trompeur de performance, encourageant une consommation artificielle plutôt qu'une utilisation réellement productive des outils d'IA. Ce cas intervient dans un contexte où les entreprises tech cherchent à quantifier l'adoption interne de l'IA et à mesurer le retour sur investissement de leurs abonnements aux modèles comme Claude d'Anthropic ou GPT d'OpenAI. La course aux classements internes illustre une tension plus profonde : comment distinguer l'usage pertinent de l'IA d'une simple démonstration ostentatoire ? À mesure que les coûts des modèles diminuent, cette dynamique pourrait évoluer, mais pour l'instant, le tokenmaxxing reste un luxe réservé aux plus grands acteurs de la Silicon Valley.

SociétéOpinion
1 source
Google intègre le support MCP dans Colab pour permettre l'exécution cloud d'agents IA
1177InfoQ AI 

Google intègre le support MCP dans Colab pour permettre l'exécution cloud d'agents IA

Google a publié le Colab MCP Server, un outil open source qui permet aux agents d'intelligence artificielle d'interagir directement avec Google Colab via le Model Context Protocol (MCP). Cette intégration donne aux agents la capacité d'exécuter du code, de lancer des notebooks et de piloter des environnements cloud Colab sans intervention humaine, en passant par une interface standardisée que les principaux frameworks d'agents reconnaissent nativement. L'enjeu est concret : les développeurs qui construisent des agents IA se heurtent régulièrement à deux problèmes, la puissance de calcul disponible localement et la sécurité des exécutions. En déportant ces tâches vers Colab, les agents peuvent faire tourner des modèles lourds, traiter des jeux de données volumineux ou exécuter du code potentiellement risqué dans un environnement isolé et géré par Google, sans exposer la machine du développeur. Cela ouvre la voie à des workflows d'automatisation bien plus ambitieux, notamment pour les équipes qui n'ont pas accès à des GPU dédiés. Ce lancement s'inscrit dans la montée en puissance du Model Context Protocol, standard initialement proposé par Anthropic et rapidement adopté par l'ensemble de l'industrie comme protocole commun pour connecter les agents aux outils externes. Google, qui avait déjà intégré MCP dans plusieurs de ses produits, étend ainsi sa surface de compatibilité avec l'écosystème agent. Le fait que le serveur soit open source suggère une volonté d'ancrer Colab comme infrastructure de référence pour l'exécution agentique dans le cloud.

UELes équipes européennes de développement IA peuvent déléguer l'exécution agentique à un environnement cloud isolé, facilitant le développement sans infrastructure GPU dédiée.

OutilsOutil
1 source
[Tuto] Utiliser des IA génératives en local et influence du GPU sur les performances
1178Next INpact 

[Tuto] Utiliser des IA génératives en local et influence du GPU sur les performances

Faire tourner un grand modèle de langage sur sa propre machine est désormais accessible à quiconque dispose d'un ordinateur suffisamment puissant. Des outils comme Ollama permettent d'installer et d'utiliser localement des LLM tels que Mistral, LLaMA ou Qwen, sans connexion internet et sans envoyer la moindre donnée à un serveur tiers. L'article propose un tutoriel pas à pas pour configurer cet environnement en local, accompagné d'un comparatif de performances entre deux configurations : un serveur équipé de 24 cœurs CPU sans GPU, et un autre disposant d'une carte graphique dédiée. Le résultat est sans appel : l'écart de vitesse d'inférence entre les deux setups est énorme, le GPU surclassant massivement le CPU seul pour ce type de charge de travail. L'enjeu central est la confidentialité des données. Utiliser ChatGPT, Claude ou Le Chat implique d'envoyer ses requêtes sur les serveurs d'OpenAI, Anthropic ou Mistral, où elles peuvent potentiellement servir à l'entraînement ou à l'amélioration des modèles. Pour les professionnels manipulant des données sensibles, documents juridiques, médicaux, financiers, code propriétaire, cette dépendance aux infrastructures cloud représente un risque réel. L'exécution locale supprime complètement ce vecteur : le modèle tourne sur la machine de l'utilisateur, les données n'en sortent jamais. C'est aussi une question d'autonomie : pas de quota d'API, pas d'abonnement mensuel, pas de coupure de service. Deux contraintes techniques conditionnent la faisabilité de cette approche. D'abord la mémoire : les poids d'un modèle de 7 milliards de paramètres occupent environ 4 à 8 Go selon le niveau de quantisation, tandis qu'un modèle de 70 milliards en requiert facilement 40 Go ou plus. Ensuite la puissance de calcul : un GPU accélère les opérations matricielles qui constituent le cœur de l'inférence, là où un CPU seul produit des réponses lentes et difficilement utilisables en pratique. Cette architecture locale n'est pas nouvelle, la communauté open source travaille dessus depuis la publication de LLaMA par Meta en 2023, mais elle est devenue beaucoup plus accessible grâce à des outils comme Ollama, LM Studio ou llama.cpp, qui abstraient la complexité technique. L'essor des modèles compacts et quantisés (3B, 7B, 14B paramètres) rend aujourd'hui possible une expérience satisfaisante même sur du matériel grand public, à condition de disposer d'une carte graphique avec suffisamment de VRAM.

UELes professionnels européens soumis au RGPD peuvent éliminer le risque d'envoi de données sensibles vers des serveurs américains en exécutant leurs modèles en local.

OutilsTuto
1 source
Top 10 des entreprises IA : qui domine vraiment la révolution mondiale ?
1179Le Big Data 

Top 10 des entreprises IA : qui domine vraiment la révolution mondiale ?

Une poignée de géants technologiques concentre aujourd'hui l'essentiel de la puissance de l'intelligence artificielle mondiale. Microsoft, en tête, a réalisé un pivot stratégique majeur en investissant plusieurs milliards de dollars dans OpenAI, le laboratoire créateur de ChatGPT. En échange de ce partenariat exclusif, la firme de Redmond intègre les modèles GPT dans l'ensemble de son écosystème sous la marque Copilot : Windows, la suite Office, GitHub et ses outils de cybersécurité. Son cloud Azure sert simultanément de plateforme d'entraînement pour OpenAI et d'infrastructure pour les entreprises souhaitant déployer leurs propres applications d'IA. Alphabet, maison mère de Google, incarne quant à elle une présence encore plus ancienne dans le domaine : en 2017, ses chercheurs ont publié "Attention Is All You Need", le papier fondateur de l'architecture transformer sur laquelle reposent aujourd'hui la quasi-totalité des grands modèles de langage. Nvidia, OpenAI, Meta, Amazon, Apple, Anthropic et d'autres acteurs complètent ce cercle restreint qui contrôle modèles, puces et infrastructure cloud. Ce niveau de concentration a des conséquences directes sur l'ensemble de l'économie numérique. En contrôlant à la fois les algorithmes et l'infrastructure, ces entreprises deviennent les principaux distributeurs d'IA pour des centaines de millions d'utilisateurs et pour les entreprises qui cherchent à automatiser leurs processus. Microsoft et Google, en particulier, transforment des logiciels déjà massivement adoptés en interfaces d'intelligence artificielle, rendant l'adoption quasi-transparente pour l'utilisateur final. Les entreprises qui souhaitent développer leurs propres solutions d'IA se retrouvent en grande partie dépendantes de l'infrastructure cloud de ces mêmes acteurs, renforçant ainsi leur position dominante sur toute la chaîne de valeur, de la recherche fondamentale jusqu'à la distribution commerciale. Cette domination est le fruit de décennies d'investissement massif dans la recherche et l'infrastructure. Google Finance cette transformation depuis les années 2010 via DeepMind et Google Brain, tandis que Microsoft a su reconvertir sa position de leader du logiciel d'entreprise en levier d'adoption de l'IA générative. La barrière à l'entrée est désormais astronomique : entraîner un grand modèle de langage compétitif nécessite des dizaines de milliers de GPU et des investissements se chiffrant en milliards de dollars, ce que seuls quelques acteurs peuvent se permettre. La question qui se pose pour la suite est double : comment les régulateurs, notamment en Europe avec l'AI Act, vont-ils encadrer cette concentration de pouvoir technologique, et quels nouveaux entrants, à l'image d'Anthropic ou Mistral, parviendront à s'imposer face à des géants qui ont pris plusieurs longueurs d'avance ?

UELa concentration du pouvoir IA entre quelques géants américains renforce la dépendance des entreprises européennes à des infrastructures cloud étrangères, un enjeu central de l'AI Act et une menace directe pour la souveraineté numérique de l'UE.

BusinessActu
1 source
Les chatbots IA progressent sept fois plus vite que les réseaux sociaux, mais restent quatre fois moins fréquentés
1180The Decoder 

Les chatbots IA progressent sept fois plus vite que les réseaux sociaux, mais restent quatre fois moins fréquentés

Le trafic vers les chatbots d'intelligence artificielle croît sept fois plus vite que celui des réseaux sociaux, mais reste quatre fois inférieur en volume total, selon une analyse publiée par Similarweb. Ces données portent sur les principales plateformes de conversation IA, dont ChatGPT d'OpenAI, Gemini de Google et Claude d'Anthropic, et révèlent des différences notables entre ces deux catégories de services numériques, notamment dans les habitudes d'utilisation selon les appareils et les comportements des utilisateurs. Ce rythme de croissance exceptionnel illustre l'adoption massive et rapide des outils d'IA conversationnelle par le grand public, mais l'écart de volume avec les réseaux sociaux rappelle que ces derniers restent ancrés dans le quotidien numérique de milliards de personnes. Pour les acteurs du secteur tech, cela signifie que le marché de l'IA conversationnelle est encore loin de sa maturité et que les marges de progression restent considérables. La question des usages par appareil est particulièrement stratégique : les chatbots sont aujourd'hui davantage utilisés sur ordinateur, là où les réseaux sociaux dominent sur mobile. Cette dynamique s'inscrit dans un contexte de compétition intense entre les grandes plateformes d'IA, qui multiplient les mises à jour et les nouvelles fonctionnalités pour capter des parts de marché. Les réseaux sociaux, eux, ont bénéficié de deux décennies d'intégration dans les usages quotidiens. Si la trajectoire actuelle se maintient, l'écart de trafic entre les deux catégories pourrait se réduire significativement dans les prochaines années, à mesure que l'IA s'intègre dans davantage d'applications et de flux de travail professionnels.

SociétéOutil
1 source
Composants d'un agent de codage
1181Ahead of AI 

Composants d'un agent de codage

Les agents de codage comme Claude Code ou le Codex CLI d'OpenAI sont devenus des outils incontournables pour les développeurs, mais leur fonctionnement repose sur une architecture précise que peu d'articles détaillent. Un agent de codage n'est pas simplement un grand modèle de langage (LLM) auquel on pose des questions : c'est un LLM enveloppé dans une couche logicielle appelée "harness" (ou cadre agentique), qui orchestre les appels au modèle, gère les outils disponibles, maintient un état en mémoire et décide quand s'arrêter. Cette distinction est fondamentale : le modèle est le moteur, mais le harness est la transmission, le tableau de bord et les roues réunies. Un agent de codage comprend six composants principaux — la boucle de contrôle, la gestion du contexte, les outils (lecture/écriture de fichiers, exécution de code, recherche), la mémoire, la gestion des prompts et la continuité entre sessions longues. Ce cadre explique pourquoi Claude Code ou Codex semblent nettement plus capables que le même modèle sous-jacent utilisé dans une interface de chat ordinaire. La différence n'est pas dans les paramètres du modèle, mais dans le système qui l'entoure : la stabilité du cache de prompts, l'accès au contexte du dépôt Git, la boucle de feedback itérative après exécution du code, et la gestion de sessions qui peuvent durer des heures. Pour les développeurs et les équipes d'ingénierie, cela signifie que choisir un outil de codage assisté par IA revient autant à évaluer l'architecture du harness qu'à comparer les benchmarks des modèles. Un modèle plus puissant dans un harness médiocre produira des résultats inférieurs à un modèle modeste bien intégré. Il convient également de distinguer trois notions souvent confondues : le LLM classique génère des tokens ; le modèle de raisonnement est un LLM entraîné à produire des traces de réflexion intermédiaires et à s'auto-vérifier (à l'image de o1 ou de QwQ), ce qui le rend plus puissant mais plus coûteux à l'inférence ; l'agent, lui, est une boucle de contrôle qui appelle le modèle répétitivement dans un environnement, en mettant à jour son état à chaque itération. Le harness de codage est un cas spécialisé de harness agentique, orienté vers les tâches de génie logiciel — gestion du contexte de code, exécution, débogage itératif. Des systèmes comme Claude Code d'Anthropic ou Codex CLI d'OpenAI illustrent cette catégorie, et la tendance de fond est claire : les progrès les plus décisifs en IA appliquée ne viennent plus seulement des modèles eux-mêmes, mais de l'ingénierie des systèmes qui les entourent.

OutilsOpinion
1 source
Construire des systèmes à base d'agents prêts pour la production avec Z.AI GLM-5 : raisonnement, appel d'outils et streaming
1182MarkTechPost 

Construire des systèmes à base d'agents prêts pour la production avec Z.AI GLM-5 : raisonnement, appel d'outils et streaming

Z.AI a publié un tutoriel complet présentant les capacités avancées de son modèle GLM-5, conçu pour construire des systèmes agentiques prêts pour la production. Le guide couvre l'intégralité du cycle de développement : configuration via le SDK Z.AI (compatible avec l'interface OpenAI), réponses en streaming, mode de raisonnement approfondi (dit "thinking mode"), conversations multi-tours, appels de fonctions, sorties structurées, et construction d'un agent multi-outils complet. L'installation se fait via pip avec les paquets zai-sdk et openai, et l'authentification repose sur une clé API obtenue gratuitement sur z.ai. Dès les premières lignes de code, GLM-5 répond à des questions techniques — comme expliquer l'architecture Mixture-of-Experts en trois phrases — avec une consommation de tokens détaillée et un contrôle fin via les paramètres temperature et max_tokens. Ce qui distingue GLM-5 des modèles classiques est son mode de raisonnement enchaîné (chain-of-thought), qui expose le processus interne du modèle avant de fournir une réponse finale. Sur des problèmes logiques ou mathématiques — l'exemple du fermier avec 17 moutons dont "tous sauf 9 s'enfuient" illustre le piège classique de la lecture rapide — le modèle affiche séparément son raisonnement intermédiaire et sa conclusion. Cette transparence est particulièrement précieuse pour les équipes qui déploient des agents autonomes dans des contextes critiques : débogage plus facile, auditabilité améliorée, et meilleure confiance dans les décisions du modèle. Le streaming en temps réel des tokens, géré chunk par chunk, rend l'expérience utilisateur fluide même pour des réponses longues et complexes. GLM-5 s'inscrit dans la dynamique actuelle d'ouverture des modèles chinois à l'écosystème international. Z.AI, filiale de Zhipu AI — laboratoire issu de l'Université Tsinghua — positionne GLM-5 comme un concurrent direct aux modèles d'OpenAI et Anthropic, avec une compatibilité API volontairement calquée sur le standard OpenAI pour faciliter la migration. La prise en charge native du function calling et des sorties structurées permet d'intégrer GLM-5 dans des pipelines d'automatisation complexes sans couche d'adaptation. Alors que les entreprises cherchent à diversifier leurs dépendances vis-à-vis des fournisseurs américains, ce type de modèle — accessible, documenté, et compatible avec les outils existants — représente une alternative crédible pour les développeurs européens et asiatiques construisant des applications d'IA en production.

UEGLM-5 offre aux développeurs européens une alternative compatible OpenAI pour diversifier leurs dépendances vis-à-vis des fournisseurs américains, accessible gratuitement via une clé API.

LLMsTuto
1 source
Fidji Simo d'OpenAI rachète le podcast TBPN malgré sa campagne contre les projets parallèles
1183The Information AI 

Fidji Simo d'OpenAI rachète le podcast TBPN malgré sa campagne contre les projets parallèles

Fidji Simo, directrice générale du déploiement de l'AGI chez OpenAI, a annoncé jeudi l'acquisition de TBPN, un podcast technologique quotidien très suivi, animé par John Coogan et Jordi Hays. Cette décision intervient alors que Simo s'est imposée ces dernières semaines comme la figure de la rigueur au sein d'OpenAI, à mesure que la startup s'approche d'une introduction en bourse prévue fin 2025. Selon les informations communiquées aux équipes, les deux animateurs conserveront leur indépendance éditoriale tout en jouant un rôle de conseil auprès de l'entreprise en matière de marketing et de communication. La nouvelle a été si inattendue que certains employés d'OpenAI ont cru à un poisson d'avril en retard. L'acquisition surprend d'autant plus qu'elle contraste frontalement avec le discours que Simo tient en interne depuis plusieurs semaines. Le mois dernier, elle avait adressé un message de mise en garde aux équipes : OpenAI ne peut plus se permettre de courir après des "quêtes secondaires" qui détournent l'entreprise de ses priorités. Dans la foulée, Sora, l'outil de génération vidéo gourmand en ressources de calcul, a été abandonné. Une fonctionnalité de paiement express dans ChatGPT, à laquelle Simo s'était montrée sceptique, a également été retirée, et les plans permettant à ChatGPT de générer du contenu érotique ont été mis en suspens indéfiniment. Acquérir un podcast populaire dans ce contexte représente donc une rupture de ton notable. OpenAI, valorisé à 300 milliards de dollars après sa dernière levée de fonds de 40 milliards en mars 2025, cherche à soigner son image publique avant son entrée en bourse. La relation avec les médias et la maîtrise du récit sont devenues des enjeux stratégiques pour une entreprise sous intense scrutin réglementaire et concurrentiel. Intégrer TBPN dans son giron pourrait s'interpréter comme une tentative de capter directement une audience tech influente, dans un contexte où la guerre de perception entre OpenAI, Google, Anthropic et Meta se joue aussi sur les canaux informels. La question de l'indépendance éditoriale promise restera centrale pour la crédibilité de cette opération.

BusinessOpinion
1 source
Codex propose désormais une tarification plus flexible pour les équipes
1184OpenAI Blog 

Codex propose désormais une tarification plus flexible pour les équipes

OpenAI a annoncé l'ajout d'une option de facturation à l'usage pour Codex, son agent de programmation, disponible désormais pour les abonnés ChatGPT Business et Enterprise. Ce modèle tarifaire vient compléter les formules d'abonnement existantes et permet aux équipes de ne payer que ce qu'elles consomment réellement, sans engagement forfaitaire fixe. Ce changement facilite concrètement l'adoption de Codex dans les entreprises qui hésitaient à s'engager sur un abonnement avant d'évaluer leur usage réel. Les équipes de développement peuvent désormais tester l'outil à petite échelle, mesurer le retour sur investissement, puis augmenter progressivement leur consommation sans friction tarifaire. C'est particulièrement pertinent pour les grandes organisations où les déploiements se font par étapes et nécessitent des validations budgétaires successives. Codex s'inscrit dans la stratégie d'OpenAI pour conquérir le marché des outils de développement, en concurrence directe avec GitHub Copilot (Microsoft), Cursor et Claude d'Anthropic. La tarification à l'usage est devenue un standard dans ce secteur, les entreprises préférant une corrélation directe entre coût et valeur produite. Cette flexibilité tarifaire devrait accélérer la pénétration de Codex dans les équipes techniques enterprise, segment où la friction à l'adoption reste le principal frein.

UELes équipes de développement européennes abonnées à ChatGPT Business ou Enterprise peuvent désormais adopter Codex sans engagement forfaitaire, réduisant la friction budgétaire pour les DSI soumis à des cycles de validation stricts.

OutilsOutil
1 source
Z.ai lance GLM-5V-Turbo : un modèle multimodal de vision et de code optimisé pour les workflows d'ingénierie à base d'agents
1185MarkTechPost 

Z.ai lance GLM-5V-Turbo : un modèle multimodal de vision et de code optimisé pour les workflows d'ingénierie à base d'agents

Zhipu AI (Z.ai), laboratoire d'intelligence artificielle chinois, a lancé GLM-5V-Turbo, un nouveau modèle de vision multimodale spécialement conçu pour la génération de code et les workflows d'ingénierie logicielle. Ce modèle se distingue par une architecture dite de fusion multimodale native, associant un encodeur visuel CogViT à une architecture MTP (Multi-Token Prediction), avec une fenêtre de contexte de 200 000 tokens. Il est capable de traiter simultanément des images, des vidéos, des maquettes de design et des documents techniques complexes, tout en produisant du code syntaxiquement rigoureux. Son entraînement repose sur une technique de reinforcement learning conjoint sur plus de 30 tâches distinctes couvrant le raisonnement STEM, l'ancrage visuel, l'analyse vidéo et l'utilisation d'outils externes. Ce lancement répond à un problème structurel bien connu dans le domaine des modèles vision-langage : le « effet de balançoire », où les gains en perception visuelle se font au détriment des capacités de programmation logique. En optimisant conjointement ces deux dimensions, GLM-5V-Turbo ouvre la voie à des agents d'interface graphique (GUI agents) véritablement opérationnels — des systèmes capables de « voir » un écran et d'en déduire les actions ou le code nécessaire pour y interagir. Concrètement, cela permet à un développeur de soumettre une capture d'écran d'un bug ou une maquette de fonctionnalité, et d'obtenir directement le code correspondant, sans passer par une description textuelle intermédiaire. L'intégration avec OpenClaw, framework open source pour agents GUI, et avec Claude Code, l'outil de programmation assistée d'Anthropic, renforce son positionnement dans des pipelines d'automatisation logicielle à haute capacité. Ce modèle s'inscrit dans une compétition mondiale de plus en plus intense autour des modèles multimodaux orientés code, où des acteurs comme Google (Gemini), OpenAI (GPT-4o) et Anthropic (Claude) investissent massivement. La stratégie de Z.ai se distingue par une spécialisation assumée : plutôt que de viser un usage généraliste, GLM-5V-Turbo cible explicitement les workflows agentiques, en s'intégrant dès le départ dans des écosystèmes d'outils existants. Cette approche de « deep adaptation » pourrait s'avérer décisive pour les équipes d'ingénierie cherchant à automatiser des tâches visuellement complexes — déploiement d'environnements, analyse de sessions enregistrées, génération de code à partir de maquettes — sans sacrifier la précision logique indispensable au développement logiciel professionnel.

LLMsActu
1 source
OpenAI renonce à son mode érotique pour ChatGPT
1186TechCrunch AI 

OpenAI renonce à son mode érotique pour ChatGPT

OpenAI a renoncé à son projet de mode de contenu érotique pour ChatGPT, devenant ainsi la dernière d'une série d'initiatives abandonnées par la startup en l'espace d'une semaine. La fonctionnalité, qui aurait permis à ChatGPT de générer des contenus pour adultes explicites, n'a jamais été officiellement lancée à grande échelle avant d'être écartée. Cette décision illustre les tensions croissantes au sein d'OpenAI entre sa volonté d'élargir les cas d'usage de ses modèles — et donc ses revenus — et les contraintes éthiques, réglementaires et d'image de marque qui pèsent sur l'entreprise. Un tel mode aurait pu ouvrir un marché lucratif, mais exposait également OpenAI à des critiques sur la protection des mineurs et la modération des contenus. Ce recul s'inscrit dans un contexte plus large de repositionnement stratégique pour OpenAI, qui jongle entre sa mission déclarée de développer une IA bénéfique pour l'humanité et une pression commerciale intense pour diversifier ses sources de revenus. Plusieurs projets annexes ont été abandonnés en parallèle, sans explication publique détaillée, suggérant une remise à plat interne des priorités alors que la concurrence avec Anthropic, Google et Meta s'intensifie.

UELes réglementations européennes sur la protection des mineurs et le cadre de l'AI Act auraient rendu ce type de contenu particulièrement risqué à déployer dans l'UE.

BusinessOpinion
1 source
Un aperçu des outils en ligne de commande
1187Ben's Bites 

Un aperçu des outils en ligne de commande

Les agents d'intelligence artificielle fonctionnent en combinant un modèle de langage avec des outils concrets — et les interfaces en ligne de commande (CLI) constituent leur outil de prédilection. Concrètement, un agent peut exécuter une séquence de commandes bash pour renommer 400 photos produit selon un format SKU précis, les redimensionner en 1200x1200 pixels, les trier dans des sous-dossiers par catégorie, puis vérifier le résultat — le tout en quelques secondes, là où un humain y passerait plusieurs heures. Chaque étape correspond à une commande réelle : ls pour lister les fichiers, mkdir pour créer les dossiers, mogrify pour redimensionner les images, mv pour déplacer et renommer. L'agent enchaîne ces opérations de façon autonome, interprète les sorties, et s'adapte à ce qu'il découvre. Ce mécanisme de "tool use" est au cœur de ce qui distingue un agent d'un simple chatbot. Plus on lui donne accès à des CLIs spécialisées — Stripe CLI pour les données de paiement, Playwright pour contrôler un navigateur web, AWS CLI pour gérer une infrastructure cloud, Vercel CLI pour déployer un site en une commande — plus ses capacités s'étendent. Un agent équipé de bash seul peut organiser des fichiers ; ajoutez Stripe et il peut analyser vos revenus ; ajoutez Playwright et il peut naviguer sur le web ; ajoutez Vercel et il peut déployer ce qu'il vient de construire. C'est cette combinaison d'outils qui définit concrètement ce qu'un agent est capable d'accomplir. Des outils comme Claude Code permettent d'ailleurs de voir les commandes défiler en temps réel, ou de les retrouver via un panneau extensible. Ce modèle technique s'inscrit dans une période d'accélération notable pour les outils d'agents IA. Anthropic vient justement de lancer un "auto mode" pour Claude Code, un régime intermédiaire entre la validation manuelle de chaque action et l'exécution sans aucune permission — une réponse directe aux tensions entre autonomie et sécurité dans les workflows développeurs. En parallèle, les connecteurs Claude pour les outils professionnels sont désormais disponibles sur mobile, et Anthropic travaille sur une fonctionnalité "auto-dream" dédiée à la compaction de mémoire des agents pendant la nuit. Claude Code peut également envoyer des messages iMessage pour notifier l'utilisateur en cours de tâche. Ces annonces illustrent une tendance de fond : les grands labs ne cherchent plus seulement à améliorer les modèles, mais à rendre les agents réellement opérationnels dans des environnements de production réels, avec des garde-fous calibrés pour des usages professionnels quotidiens.

OutilsOutil
1 source
OpenAI suspend son chatbot érotique pour une durée indéterminée
1188The Verge AI 

OpenAI suspend son chatbot érotique pour une durée indéterminée

OpenAI a mis en suspens "indéfiniment" son projet de mode adulte pour ChatGPT, selon des informations du Financial Times. Cette fonctionnalité aurait permis des conversations à caractère érotique et sexualisé avec l'IA. La décision intervient après des résistances internes importantes — employés et investisseurs ont exprimé leurs inquiétudes quant aux effets néfastes que ce type de contenu pourrait avoir sur la société, en particulier les populations vulnérables. Ce recul s'inscrit dans un mouvement plus large de recentrage stratégique chez OpenAI. En décembre dernier, le PDG Sam Altman avait déclenché un "code rouge" interne pour concentrer les équipes sur les produits phares de l'entreprise. Dans ce sillage, OpenAI a également abandonné Sora, sa plateforme de génération vidéo par IA, invoquant des "discussions internes sur les priorités de recherche". Ces choix signalent une volonté de ne pas disperser les ressources sur des projets secondaires au moment où la concurrence avec Google, Anthropic et d'autres acteurs s'intensifie. La question du contenu adulte généré par IA reste cependant un marché en pleine expansion, avec des plateformes spécialisées comme Character.AI ou Replika qui s'y sont déjà engouffrées. OpenAI avait initialement envisagé ce segment comme une source de revenus supplémentaires face à ses coûts d'infrastructure colossaux. En y renonçant, la société fait le pari que la crédibilité institutionnelle et la confiance des entreprises clientes pèsent davantage que les gains potentiels d'un marché jugé trop risqué sur le plan réputationnel.

BusinessOpinion
1 source
Productivité CMS : WordPress.com transforme les agents IA en véritables gestionnaires de contenu
1189ZDNET FR 

Productivité CMS : WordPress.com transforme les agents IA en véritables gestionnaires de contenu

WordPress.com a annoncé une mise à jour majeure de son intégration avec les agents d'intelligence artificielle, permettant désormais à des outils comme ChatGPT ou Claude d'effectuer des opérations d'écriture complètes sur les sites hébergés. Concrètement, ces agents peuvent créer de nouveaux articles, modifier du contenu existant, gérer les médias et administrer les paramètres du CMS — des capacités jusqu'ici réservées aux utilisateurs humains connectés via l'interface classique. Ce changement marque un tournant dans la manière dont les équipes éditoriales et les créateurs de contenu peuvent déléguer des tâches répétitives à l'IA. Un rédacteur peut désormais demander à son assistant IA de publier directement un billet, de corriger une série d'articles ou de réorganiser une taxonomie, sans quitter son environnement de travail. Pour les agences et les entreprises gérant plusieurs sites, le gain de productivité potentiel est considérable. Cette évolution s'inscrit dans la montée en puissance des agents autonomes capables d'interagir avec des systèmes tiers via des protocoles standardisés comme le MCP (Model Context Protocol) d'Anthropic. Automattic, la société derrière WordPress.com, rejoint ainsi un écosystème croissant de plateformes SaaS qui ouvrent leurs API aux agents IA — une tendance qui soulève également des questions sur la sécurité des accès et la gouvernance éditoriale automatisée.

UELes agences et créateurs de contenu européens utilisant WordPress.com peuvent désormais déléguer la gestion éditoriale à des agents IA, avec des implications pour la gouvernance des contenus publiés en Europe.

OutilsOutil
1 source
OpenAI a mis Sora en retrait pour sa stratégie entreprise
1190AI Business 

OpenAI a mis Sora en retrait pour sa stratégie entreprise

OpenAI a décidé de mettre fin à Sora, son modèle de génération vidéo, malgré le succès viral rencontré lors de son lancement. L'application avait suscité un engouement massif du grand public, mais elle consomme une quantité considérable de ressources de calcul. La raison est stratégique : OpenAI cherche à se repositionner comme un fournisseur enterprise, ciblant les grandes entreprises plutôt que les consommateurs. Dans ce modèle, les projets gourmands en compute qui ne génèrent pas de revenus suffisants deviennent un frein. Sacrifier Sora permet de concentrer l'infrastructure sur des offres B2B rentables comme GPT-4o et les API professionnelles. Cette décision illustre la tension croissante entre l'image grand public d'OpenAI et ses ambitions commerciales, dans un contexte où la course aux ressources GPU s'intensifie face à des concurrents comme Anthropic et Google.

BusinessOpinion
1 source
Le nouveau mode automatique de Claude Code cherche à équilibrer sécurité et rapidité
1191The Decoder 

Le nouveau mode automatique de Claude Code cherche à équilibrer sécurité et rapidité

Anthropic a lancé un nouveau mode "Auto Mode" pour Claude Code, son outil de développement assisté par IA. Jusqu'ici, les développeurs devaient choisir entre approuver manuellement chaque action exécutée par l'outil ou désactiver complètement les vérifications de sécurité — deux extrêmes peu satisfaisants. Ce nouveau mode intermédiaire cherche à trouver le bon équilibre entre sécurité et fluidité d'utilisation. Il permettrait à Claude Code d'agir de façon autonome pour les opérations courantes, tout en sollicitant une confirmation humaine pour les actions potentiellement risquées. Claude Code s'inscrit dans la vague des agents de développement IA capables d'écrire, modifier et exécuter du code de façon semi-autonome. La question du contrôle humain est centrale dans ce secteur, où trop de friction freine l'adoption et trop d'autonomie pose des risques réels.

OutilsOutil
1 source
OpenAI prévoit de presque doubler ses effectifs d'ici 2026 pour accélérer son offensive sur le marché entreprise
1192The Decoder 

OpenAI prévoit de presque doubler ses effectifs d'ici 2026 pour accélérer son offensive sur le marché entreprise

OpenAI prévoit de presque doubler ses effectifs pour atteindre 8 000 employés d'ici fin 2026, dans le cadre d'une offensive majeure sur le marché de l'IA en entreprise. Ce secteur est aussi convoité par Anthropic, qui y gagne régulièrement du terrain.

UEL'expansion d'OpenAI sur le marché entreprise intensifie la concurrence pour les DSI européens qui évaluent des solutions d'IA, mais sans impact réglementaire direct sur la France ou l'UE.

BusinessActu
1 source
1193Frandroid 

OpenAI veut créer une « super-app » en fusionnant ChatGPT, Atlas, Sora et Codex au sein d’un seul et même logiciel

OpenAI envisage de fusionner ses principaux services — ChatGPT, Atlas, Sora et Codex — en une seule "super-app" unifiée. Cette décision stratégique intervient dans un contexte de concurrence accrue avec Anthropic. L'objectif est de regrouper l'ensemble de l'offre d'OpenAI au sein d'une unique application.

BusinessActu
1 source
119401net 

Le Mac devrait avoir droit à une application Gemini

Google travaille sur une application Mac native pour Gemini, comblant ainsi son retard face à la concurrence. Actuellement, les utilisateurs Mac doivent passer par un navigateur web pour accéder à Gemini, contrairement à OpenAI et Anthropic qui proposent déjà des applications macOS dédiées.

OutilsOutil
1 source
The Download : les nouveaux projets d'IA du Pentagone et les réacteurs nucléaires de nouvelle génération
1195MIT Technology Review 

The Download : les nouveaux projets d'IA du Pentagone et les réacteurs nucléaires de nouvelle génération

Le Pentagone prépare des environnements sécurisés pour permettre à des entreprises d'IA comme Anthropic d'entraîner leurs modèles sur des données classifiées, notamment des rapports de surveillance et évaluations de champ de bataille — une évolution majeure qui soulève de nouveaux risques de sécurité. Par ailleurs, la prochaine vague de réacteurs nucléaires de nouvelle génération pose des défis inédits en matière de gestion des déchets radioactifs, avec une grande diversité de designs impliquant autant de types de déchets potentiels. Enfin, des sous-marins narco sans équipage, équipés de terminaux Starlink et de pilotes automatiques nautiques, pourraient transformer le trafic de cocaïne colombien en permettant d'acheminer de plus grandes quantités sur de plus longues distances sans risque de capture pour les passeurs.

SécuritéActu
1 source
Critiques sur les règles : Les employés dénoncent un xAI au ralenti en raison de l'agitation constante
1196Ars Technica AI 

Critiques sur les règles : Les employés dénoncent un xAI au ralenti en raison de l'agitation constante

Les employés d'xAI se plaignent de son échec dû à une instabilité constante, entraînant de nouvelles licenciements et l'arrivée de "résolveurs" de SpaceX et Tesla pour auditer la startup. Ce dernier revirement survient après le succès d'Anthropic et OpenAI avec leurs outils de codage en IA, qui ont bouleversé l'industrie du logiciel. Elon Musk intensifie la pression suite à l'acquisition d'xAI par SpaceX pour 1,25 milliard de dollars, visant un important listing boursier en juin. Musk vise à lancer des centres de données en IA dans l'espace, construire des usines sur la Lune et coloniser Mars.

BusinessActu
1 source
Claude peut désormais créer des graphiques et visualisations interactifs directement dans le chat
1197The Decoder 

Claude peut désormais créer des graphiques et visualisations interactifs directement dans le chat

Anthropic lance une nouvelle fonctionnalité bêta pour Claude : la génération de graphiques, diagrammes et visualisations interactifs directement dans la conversation. Cette capacité permet aux utilisateurs d'obtenir des représentations visuelles de données sans quitter l'interface de chat.

OutilsOutil
1 source
Kernels Personnalisés pour Tous, grâce à Codex et Claude
1198HuggingFace Blog 

Kernels Personnalisés pour Tous, grâce à Codex et Claude

Titre: Puces personnalisées pour tous, grâce à Codex et Claude Résumé: Codex, issu de OpenAI, et Claude, développé par Anthropic, offrent désormais des noyaux personnalisables pour améliorer les performances des systèmes d'IA, permettant aux utilisateurs de moduler les paramètres en fonction de leurs besoins spécifiques.

UECodex et Claude, deux IA avancées, facilitent l'accès aux noyaux personnalisables pour améliorer les systèmes d'IA, impactant potentiellement les entreprises françaises et européennes telles qu'OVHcloud, en les aidant à optimiser leurs services cloud, tout en respectant les réglementations strictes comme le RGPD.

RobotiqueOutil
1 source
Nous avons fait appel à Claude pour affiner un LLM open source
1199HuggingFace Blog 

Nous avons fait appel à Claude pour affiner un LLM open source

Titre: Nous avons fait appel à Claude pour affiner un grand langage modélisé à source ouverte Résumé: Claude, un système avancé de traitement du langage développé par Anthropic, a été utilisé pour améliorer un modèle de langage open source. Ce processus d'affinage a permis d'augmenter les performances du modèle, notamment dans la compréhension et la génération de texte.

UEClaude d'Anthropic utilisé pour affiner un LLM open source, améliorant potentiellement les capacités des entreprises françaises et européennes en traitement du langage naturel, tout en respectant les exigences du RGPD et de l'AI Act.

LLMsOutil
1 source
Cohere sur les Fournisseurs d'Inférence Hugging Face 🔥
1200HuggingFace Blog 

Cohere sur les Fournisseurs d'Inférence Hugging Face 🔥

Traduction et résumé : Titre : Cohere sur les fournisseurs d'inférence Hugging Face 🔥 Cohere, un modèle linguistique avancé développé par Anthropic, est désormais accessible via les fournisseurs d'inférence de Hugging Face. Cela permet aux utilisateurs d'exploiter les capacités de compréhension et de génération de texte de Cohere directement dans les pipelines de traitement du langage naturel de Hugging Face, offrant ainsi une intégration transparente et une facilité d'utilisation. Mots clés : Cohere, Anthropic, modèle linguistique, Hugging Face, fournisseurs d'inférence, traitement du langage naturel.

UECohere, un modèle linguistique avancé d'Anthropic accessible via Hugging Face, améliore l'IA NLP pour les entreprises européennes en offrant une intégration transparente et une facilité d'utilisation, potentiellement renforçant la conformité avec le RGPD grâce à des capacités de traitement de données textuelles avancées.

RechercheOutil
1 source