Aller au contenu principal

Outils

50 sur 1215 articles

Les meilleurs outils IA : applications, produits et services propulsés par l'intelligence artificielle.

Le nouveau Colab CLI de Google permet aux développeurs et agents IA d'exécuter Python sur des GPU et TPU distants depuis le terminal
1MarkTechPost OutilsOutil

Le nouveau Colab CLI de Google permet aux développeurs et agents IA d'exécuter Python sur des GPU et TPU distants depuis le terminal

L'équipe Google AI a publié cette semaine le Colab CLI, un outil en ligne de commande qui connecte le terminal local d'un développeur aux runtimes distants de Google Colab. Disponible en open source sous licence Apache 2.0 et installable en une seule commande via uv tool install, l'outil permet d'allouer des sessions de calcul cloud depuis le terminal avec des options matérielles allant du CPU classique aux GPU T4, L4, A100 et H100, ainsi qu'aux puces TPU v5e1 et v6e1. L'interface repose sur un petit ensemble de commandes : colab new pour provisionner une session, colab exec pour exécuter du code Python depuis un fichier local ou l'entrée standard, colab stop pour libérer la machine virtuelle, et colab download ou colab log pour récupérer les résultats sous forme de notebooks .ipynb, fichiers Markdown ou JSONL. Google fournit également un fichier COLAB_SKILL.md qui donne aux agents IA un contexte intégré sur l'utilisation du CLI. Ce qui rend ce lancement significatif, c'est moins la fonctionnalité elle-même que la cible visée : les agents IA. Le Colab CLI est explicitement conçu pour que des outils comme Claude Code, Codex ou l'agent maison Antigravity puissent piloter des pipelines de machine learning de bout en bout sans intervention humaine. Google en fait la démonstration avec un exemple concret : le fine-tuning du modèle Gemma 3 1B via QLoRA sur un jeu de données Text-to-SQL, réalisé par l'agent Antigravity en cinq commandes, sans qu'un seul paramètre de provisionnement cloud ne soit saisi manuellement. Le modèle affiné est ensuite téléchargé localement et prêt à être servi. Pour les développeurs travaillant sur des machines sans GPU, le CLI permet aussi d'externaliser l'entraînement vers le cloud sans quitter leur environnement de travail habituel. Google Colab existe depuis 2017 comme environnement de notebooks Python basé sur le navigateur, largement utilisé dans la communauté recherche et éducation pour son accès gratuit ou peu coûteux aux accélérateurs. Le CLI ne remplace pas cette interface web, il cible un usage radicalement différent : les workflows scriptés, automatisés et pilotés par des agents. Cette distinction reflète une tendance plus large dans l'outillage IA : les agents de codage comme Claude Code ou Codex ont besoin d'accéder à des ressources de calcul sans passer par des interfaces graphiques pensées pour des humains. En positionnant Colab comme une infrastructure compatible avec ces agents, Google s'inscrit dans la course aux plateformes d'exécution pour l'IA agentique, un espace où AWS, Modal et RunPod cherchent aussi à capter les développeurs qui automatisent leurs pipelines ML.

1 source
Meta lance Hatch, son premier agent IA payant, jusqu'à 200 dollars par mois
2The Decoder 

Meta lance Hatch, son premier agent IA payant, jusqu'à 200 dollars par mois

Meta prépare un agent IA payant baptisé "Hatch", dont le prix pourrait atteindre 200 dollars par mois. Il s'agirait du premier produit IA payant de l'entreprise, marquant un tournant dans sa stratégie commerciale. Concrètement, l'utilisateur décrit ses besoins en langage courant, et Hatch se charge du reste : créer des outils fonctionnels, planifier des rendez-vous, envoyer des e-mails. Le produit se positionne comme un assistant autonome capable d'agir, et non simplement de répondre. Pour Meta, l'enjeu est considérable. La société, dont l'essentiel des revenus provient de la publicité, cherche à diversifier ses sources de revenus alors qu'elle investit des dizaines de milliards de dollars dans l'infrastructure IA. Un abonnement à 200 dollars par mois cible clairement les professionnels et les entreprises prêts à payer pour gagner en productivité. Si Hatch trouve son marché, il pourrait offrir à Meta un flux de revenus récurrent, plus prévisible que les recettes publicitaires soumises aux cycles économiques. Mark Zuckerberg mise depuis plusieurs années sur l'IA comme axe de transformation de Meta, après avoir englouti des milliards dans le métavers avec des résultats décevants. L'essor des agents IA capables d'effectuer des tâches complexes de façon autonome est devenu le nouveau terrain de compétition entre les géants technologiques. OpenAI, Google et Anthropic ont tous lancé ou annoncé des offres similaires. Avec Hatch, Meta entre directement dans ce marché premium des agents IA, là où les marges sont potentiellement bien plus élevées que dans la publicité classique.

UELes professionnels et PME européens, notamment français, seront concernés par cette offre payante dès son déploiement en Europe, dans un contexte où Meta est déjà soumis à l'AI Act et au DMA.

💬 200 dollars par mois, de la part de la boîte qui t'a habitué au tout-gratuit depuis 20 ans, c'est un vrai pivot. Bon, sur le papier, les agents autonomes OpenAI et Anthropic font ça depuis un moment, donc Meta ne révolutionne rien. Ce qui est intéressant, c'est que Zuckerberg reconnaît enfin que la pub seule ne remboursera pas ses 60 milliards investis dans l'IA.

OutilsOutil
1 source
Un nouveau modèle vocal open source écoute en continu et décide toutes les 0,4 secondes de parler ou de se taire
3The Decoder 

Un nouveau modèle vocal open source écoute en continu et décide toutes les 0,4 secondes de parler ou de se taire

Un nouveau modèle vocal open source baptisé Audio Interaction vient d'être publié avec ses poids, son code source et ses instructions de déploiement sur GitHub, sous licence Apache 2.0. Sa particularité technique est de prendre une décision toutes les 0,4 secondes : parler ou se taire. Contrairement à la plupart des assistants vocaux actuels, il n'attend pas la fin d'un enregistrement pour répondre, mais écoute en continu un flux audio pour transcrire, traduire, converser et détecter des sons du quotidien comme une toux. Les données d'entraînement seront publiées séparément dans un second temps. Cette approche représente un changement de paradigme pour les interfaces vocales. Les modèles comme GPT-4o ou Qwen3.5-Omni fonctionnent encore en mode tour par tour : ils attendent que l'utilisateur finisse de parler avant de traiter la demande. Audio Interaction brise cette contrainte en analysant le flux sonore en temps réel, ce qui ouvre la voie à des interactions bien plus naturelles, notamment pour les assistants embarqués, les outils d'accessibilité ou les applications de traduction simultanée. La licence Apache 2.0 le rend immédiatement utilisable par des développeurs et des entreprises sans restriction commerciale. Le modèle s'inscrit dans une course intense autour de l'audio nativement multimodal, accélérée par la présentation de GPT-4o en mai 2024. L'ouverture complète de la chaîne, des poids aux données, reste encore rare dans ce domaine dominé par des solutions propriétaires, et pourrait stimuler une vague de recherche indépendante sur les modèles vocaux en temps réel. La publication imminente des données d'entraînement permettra à la communauté de reproduire et d'affiner les résultats de manière transparente.

UELes développeurs et entreprises européens peuvent adopter librement ce modèle vocal sous licence Apache 2.0 pour intégrer des interfaces vocales temps réel dans leurs applications, sans restriction commerciale.

💬 0,4 secondes pour décider de parler ou se taire, c'est le détail qui change tout. Le mode tour par tour des assistants actuels casse l'illusion à chaque échange, et là on a enfin une alternative ouverte avec les poids, le code, et une Apache 2.0 qui ne bloque personne. Les données d'entraînement arrivent "dans un second temps", bon, j'attends de voir si c'est complet.

OutilsActu
1 source
Moonshot AI lance Kimi Code CLI : un agent de codage IA en ligne de commande, développé en TypeScript
4MarkTechPost 

Moonshot AI lance Kimi Code CLI : un agent de codage IA en ligne de commande, développé en TypeScript

Moonshot AI, le laboratoire chinois d'intelligence artificielle, a publié Kimi Code CLI, un agent de codage open source conçu pour fonctionner directement dans le terminal. Distribué sous licence MIT et disponible sur GitHub, l'outil s'installe en une seule commande, sans prérequis Node.js, via un script officiel compatible macOS, Linux et Windows. Écrit en TypeScript et diffusé via npm, Kimi Code CLI succède à l'ancien kimi-cli et s'interface nativement avec les modèles Kimi de Moonshot AI, tout en restant compatible avec d'autres fournisseurs. L'agent est capable de lire et modifier du code, exécuter des commandes shell, explorer des fichiers, interroger des pages web, implémenter de nouvelles fonctionnalités, corriger des bugs, effectuer des refactorisations, répondre à des questions d'architecture et automatiser des tâches en lot. Par défaut, les opérations en lecture seule s'exécutent automatiquement, tandis que les modifications de fichiers ou les commandes shell demandent une confirmation explicite du développeur. L'agent adopte un modèle d'exécution dit "feedback-driven" : il planifie ses étapes, modifie le code, lance les tests et rapporte ses actions en boucle jusqu'à complétion. Parmi ses fonctionnalités distinctives, Kimi Code CLI intègre un support vidéo permettant de déposer un enregistrement d'écran directement dans le chat, une configuration native des serveurs MCP (Model Context Protocol) via la commande /mcp-config, ainsi qu'un système de sous-agents parallèles pour déléguer des tâches d'exploration, de planification ou de codage dans des contextes isolés. Des hooks de cycle de vie permettent d'auditer les décisions de l'agent ou de déclencher des notifications locales. Un mode plan (accessible via Shift-Tab ou --kimi --plan) génère un plan de recherche avant toute modification, et la commande /fork crée une branche expérimentale abandonnnable à tout moment. Kimi Code CLI s'inscrit dans une compétition croissante autour des agents de codage en terminal, un segment en pleine effervescence depuis l'émergence de Claude Code d'Anthropic, Aider ou encore Amp. La tendance de fond est celle de l'autonomisation progressive des outils de développement : les agents ne se contentent plus de suggérer du code, ils planifient, exécutent et itèrent de façon quasi-autonome sur des sessions longues. Moonshot AI, connu pour ses modèles Kimi aux capacités de contexte étendues, positionne cet outil comme une alternative sérieuse aux solutions occidentales dominantes, en ciblant notamment les développeurs souhaitant intégrer des LLMs dans leurs workflows sans quitter le terminal. L'accès au CLI est gratuit, mais l'utilisation des modèles nécessite une authentification OAuth Kimi Code ou une clé API Moonshot AI Open Platform.

UELes développeurs français et européens peuvent tester gratuitement cet agent open source, mais il ne cible pas spécifiquement le marché européen et n'a pas d'impact structurel sur la réglementation ou l'écosystème local.

💬 On ne comptait plus les CLI agents depuis Claude Code, mais celui-là mérite qu'on s'y arrête deux secondes. Le support vidéo natif et les sous-agents parallèles, c'est pas du remplissage de changelog, ça règle de vrais problèmes de workflow que les autres ont encore ignorés. Reste à voir si les modèles Kimi sont à la hauteur en dehors des benchmarks.

OutilsOutil
1 source
NVIDIA publie Nemotron 3.5 ASR : un modèle de transcription temps réel en 40 langues, optimisé pour le streaming
5MarkTechPost 

NVIDIA publie Nemotron 3.5 ASR : un modèle de transcription temps réel en 40 langues, optimisé pour le streaming

NVIDIA a lancé Nemotron 3.5 ASR, un modèle de reconnaissance vocale automatique en streaming capable de transcrire 40 variantes linguistiques en temps réel depuis un seul checkpoint de 600 millions de paramètres. Publié en open weights sur Hugging Face sous licence OpenMDW-1.1, le modèle repose sur une architecture Cache-Aware FastConformer-RNNT qui intègre nativement la ponctuation et les majuscules, sans étape de post-traitement supplémentaire. Il couvre des langues aussi variées que l'anglais, le français, l'espagnol, l'arabe, le japonais, le coréen, le mandarin, le hindi ou le thaï, avec un mode de détection automatique de la langue (targetlang=auto) permettant de traiter des flux audio multilingues sans composant externe. La latence est configurable à l'inférence via un paramètre unique (attcontext_size), offrant des modes allant de 80 ms ultra-basse latence jusqu'à 1,12 seconde pour une précision maximale, sans nécessiter de réentraînement. Ce modèle s'attaque directement à l'un des principaux obstacles au déploiement industriel de la transcription vocale en temps réel : la complexité opérationnelle. Jusqu'ici, couvrir plusieurs langues imposait de maintenir autant de modèles distincts, de gérer des pipelines de détection de langue séparés, et de choisir entre latence et précision via des checkpoints différents. Nemotron 3.5 ASR supprime ces trois frictions en un seul déploiement. Pour les équipes produit qui développent des outils de sous-titrage en direct, des assistants vocaux multilingues ou des plateformes de transcription à grande échelle, cela représente une réduction significative de l'infrastructure et du coût d'exploitation. Le fait qu'il soit disponible gratuitement en self-hosting change également la donne face aux services cloud payants comme Nova-3 de Deepgram (~0,0077 $/min) ou Scribe v2 Realtime d'ElevenLabs (~0,28 $/heure). NVIDIA opère depuis plusieurs années une montée en puissance dans le domaine des modèles de traitement du langage parlé, notamment via sa division Nemotron Speech. Ce lancement s'inscrit dans une compétition intense entre acteurs open source et solutions propriétaires : Whisper large-v3 d'OpenAI reste la référence en transcription batch (99 langues, MIT), mais n'est pas natif au streaming ; AssemblyAI (Universal-3 Pro) et Speechmatics se positionnent sur le streaming temps réel, mais avec des couvertures linguistiques plus étroites ou des API fermées. NVIDIA entre dans ce segment avec un modèle à la fois performant, polyglotte et librement hébergeable, ce qui pourrait accélérer son adoption dans les environnements souverains ou à contraintes de confidentialité forte. La prochaine étape probable sera l'intégration dans les pipelines NIM (NVIDIA Inference Microservices) pour simplifier encore le déploiement en production.

UELe modèle couvre explicitement le français parmi ses 40 variantes linguistiques, et son mode self-hosting gratuit facilite le déploiement dans des environnements européens soumis aux exigences de souveraineté des données, réduisant la dépendance aux API cloud américaines payantes.

💬 Un seul checkpoint pour 40 langues en streaming, ponctuation et majuscules intégrées nativement : c'est le genre de truc qu'on attendait depuis 2 ans. Couvrir plusieurs langues en temps réel imposait jusqu'ici de gérer autant de modèles distincts plus un détecteur de langue en amont, bref une usine à gaz. Et là, en self-hosting gratuit face à Deepgram à 0,0077 $ la minute, les équipes qui hésitaient vont vite trancher.

OutilsOpinion
1 source
Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents
6VentureBeat AI 

Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents

Lors de sa conférence Build 2026, Microsoft a dévoilé cette semaine une série d'annonces destinées à ancrer les agents d'intelligence artificielle au cœur des systèmes d'entreprise. La firme a présenté Microsoft IQ, une couche contextuelle unifiée couvrant GitHub Copilot, Microsoft Foundry et Copilot Studio, ainsi que des API Work IQ dont le lancement est prévu le 16 juin. S'y ajoutent Fabric IQ pour les données métier structurées, Foundry IQ pour la récupération d'informations à travers les bases de connaissances d'entreprise et le web en temps réel, et Web IQ, un moteur de recherche conçu spécifiquement pour les agents. Microsoft a également introduit Scout, un assistant personnel de travail autonome, et annoncé sept nouveaux modèles maison regroupés sous la famille MAI, dont MAI-Thinking-1, optimisés pour l'efficience en tokens et la personnalisation sur données propriétaires. En parallèle, Claude Opus 4.8 d'Anthropic est désormais disponible sur Azure Foundry, aux côtés des modèles OpenAI GPT, témoignant d'une stratégie délibérée de choix multiple de modèles. Ces annonces marquent un tournant dans la façon dont Microsoft positionne son infrastructure IA : ce n'est plus l'accès à un modèle puissant qui fait la différence, mais la capacité à donner aux agents un contexte fiable, une identité, une mémoire et un accès sécurisé aux données d'entreprise. Pour les DSI et équipes techniques, cela se traduit concrètement par la possibilité de déployer des agents gérés dans Foundry, avec gestion automatique du dimensionnement et de la conteneurisation, sans avoir à construire cette infrastructure from scratch. L'enjeu est de taille : les entreprises qui parviennent à brancher leurs agents sur leurs données internes et leurs workflows existants pourront automatiser des processus complexes à grande échelle, là où les expériences pilotes restaient jusqu'ici cantonnées à des cas d'usage isolés. Marco Casalaina, VP Products Core AI et "AI Futurist" de Microsoft, est au cœur de cette stratégie. Ancien responsable de l'équipe Einstein AI chez Salesforce et diplômé en informatique de Cornell, il a rejoint Microsoft début 2022 pour prendre la tête des Azure Cognitive Services avant d'étendre son périmètre à l'ensemble des outils pour développeurs IA, incluant Foundry, VS Code, GitHub et GitHub Copilot. Son rôle de futuriste a une définition très concrète chez Microsoft : il est systématiquement le premier à tester chaque nouvelle fonctionnalité en provenance de toutes les équipes de la firme. Cette position d'observatoire lui permet de tracer ce qu'il appelle "le futur immédiat", c'est-à-dire l'horizon à douze mois des capacités agentiques. La compétition pour devenir la plateforme de référence des agents d'entreprise est désormais ouverte, avec Google et AWS comme principaux rivaux dans une course où le contexte, la gouvernance et l'intégration des données deviennent les véritables différenciateurs.

UELes entreprises européennes peuvent évaluer les API Work IQ sur Azure (lancement le 16 juin) et les modèles MAI pour l'automatisation de leurs workflows internes, avec des enjeux de souveraineté des données à considérer.

💬 Microsoft assume enfin que la guerre se joue sur la plomberie, pas sur les modèles. Donner aux agents un contexte fiable, une identité et un accès sécurisé aux données internes, c'est précisément ce qui bloquait les pilotes depuis deux ans. Et avoir Claude d'Anthropic sur Azure aux côtés d'OpenAI, c'est malin : un argument de neutralité que Google et AWS n'ont pas encore.

OutilsOutil
1 source
Les agents IA apprennent en cours de tâche, mais pas pour toute l'équipe
7VentureBeat AI 

Les agents IA apprennent en cours de tâche, mais pas pour toute l'équipe

Les agents d'intelligence artificielle peinent à devenir de véritables outils d'équipe. Selon une étude interne d'Asana, 75 % des travailleurs du savoir utilisent déjà l'IA au quotidien, mais seulement 5 % des entreprises déclarent en avoir tiré des gains de productivité mesurables. La raison principale : lorsqu'un collaborateur corrige ou améliore un agent, en affinant ses instructions, en lui fournissant un contexte plus précis, cette amélioration s'évapore dès qu'un collègue ouvre le même outil. Chaque utilisateur repart de zéro, entraînant en pratique une version différente du même agent selon la personne qui l'interroge. Arnab Bose, directeur produit d'Asana, résume le problème : les fournisseurs de modèles progressent rapidement sur le raisonnement et les boucles de correction, mais échouent à intégrer le contexte de travail d'entreprise d'une manière intelligible et partageable entre humains. Ce défaut architectural a des conséquences concrètes dans les workflows multi-agents, devenus la norme dans les grandes organisations : des agents qui se contredisent, des tâches répétées inutilement, des versions incohérentes de la réalité selon les équipes. Sriharsha Chintalapani, cofondateur et directeur technique de Collate, souligne que les agents sont extrêmement sensibles à la qualité des instructions reçues : un utilisateur expérimenté obtient de meilleurs résultats parce qu'il formule des prompts plus précis et donne de meilleurs retours correctifs, que l'agent mémorise et applique aux interactions suivantes. Ce mécanisme fonctionne bien pour un usage individuel, mais devient un avantage inégalement distribué dès qu'il s'agit d'un usage collectif. Neej Gore, directeur des données de Zeta Global, défend l'idée d'une mémoire partagée qui agirait comme une intelligence composée, s'enrichissant à chaque interaction et bénéficiant à toute l'organisation. La réponse d'Asana consiste à placer la mémoire partagée au coeur de sa plateforme Agentic Work Management : toute correction apportée par un membre de l'équipe s'applique automatiquement à l'ensemble des utilisateurs, via un graphe de contexte injecté directement dans les agents opérant dans son système. Plus besoin que chaque collaborateur maîtrise l'ingénierie des prompts. Mais la question de qui contrôle cette mémoire, ce qui y est stocké et comment elle reste cohérente quand plusieurs agents et utilisateurs y écrivent simultanément reste largement sans réponse dans l'industrie. Chintalapani avance que la piste la plus prometteuse consiste à construire des agents capables de récupérer la mémoire de manière relationnelle, en fonction du contexte précis de chaque requête, une approche que seules quelques organisations disposant de ressources importantes sont aujourd'hui en mesure de mettre en oeuvre.

UELes entreprises européennes déployant des agents IA en équipe font face au même problème architectural de mémoire non partagée, mais aucune réponse réglementaire ou solution propre au marché France/UE n'est évoquée.

OutilsOutil
1 source
Comment les agents C3 AI automatisent la maintenance prédictive chez Shell
8AI News 

Comment les agents C3 AI automatisent la maintenance prédictive chez Shell

Shell et C3 AI ont annoncé un approfondissement de leur partenariat pour faire franchir une nouvelle étape à la maintenance industrielle : passer de la simple détection d'anomalies à une automatisation complète du cycle de maintenance, pilotée par des agents d'intelligence artificielle autonomes. Le groupe énergétique s'appuie déjà sur la suite C3 AI Reliability Suite pour surveiller plus de 30 000 équipements critiques répartis dans ses opérations en amont et en aval. Désormais, des agents IA prendront en charge l'intégralité du processus, depuis le premier signal d'alerte jusqu'à la clôture de l'ordre de travail, sans nécessiter de supervision humaine constante. Stephen Ehikian, président de C3 AI, évoque des centaines de millions de dollars de valeur économique générée grâce à la réduction des arrêts non planifiés. L'enjeu concret est de résoudre le "dernier kilomètre" de la maintenance prédictive, un problème bien connu dans l'industrie : beaucoup d'entreprises savent anticiper les pannes, mais peinent à transformer ces alertes en actions rapides et efficaces. Jusqu'ici, les ingénieurs de Shell devaient encore manuellement analyser les alertes, identifier la cause racine et rédiger les ordres de travail. Les nouveaux agents IA prennent en charge cette séquence de façon autonome. À la détection d'une anomalie sur une pompe, une turbine ou un compresseur, l'agent collecte les données de contexte pertinentes, notamment l'historique de maintenance récent, les conditions environnementales et les variables de processus en amont, puis propose un plan d'action étayé. L'opérateur humain peut approuver ou corriger la recommandation. Avec le temps, Shell pourra automatiser entièrement la réponse à certaines catégories d'alertes. Le délai entre la prédiction de la panne et l'intervention effective se réduit, ce qui améliore directement le taux de disponibilité des équipements et protège la production. Cette évolution s'inscrit dans une trajectoire progressive. Shell utilisait initialement le machine learning pour détecter des patterns inhabituels dans les flux de données temps réel issus de ses capteurs industriels, combinés aux données métier de son ERP SAP. La plateforme C3 AI sert de socle d'intégration entre ces sources hétérogènes, à haute fréquence et à fort volume. La couche agentique vient s'y greffer, avec des agents configurables par équipement, chacun disposant d'objectifs et de réponses autorisées définis par les opérateurs. L'intégration native avec SAP est centrale : l'agent travaille directement dans les workflows que les planificateurs humains utilisent déjà, ce qui garantit la fluidité opérationnelle. Ce partenariat illustre la montée en puissance de l'IA agentique dans les secteurs industriels lourds, où la fiabilité des infrastructures a des conséquences directes sur la sécurité, les coûts d'exploitation et la continuité de production à l'échelle mondiale.

UEShell, dont le siège est établi aux Pays-Bas, déploie ces agents IA dans ses opérations mondiales incluant ses sites de production et raffineries européens, avec un impact potentiel sur les coûts de maintenance industrielle en Europe.

OutilsOutil
1 source
Trapilot AI veut remplacer les outils SEO traditionnels avec une plateforme AI-native
9Le Big Data 

Trapilot AI veut remplacer les outils SEO traditionnels avec une plateforme AI-native

Trapilot AI, une startup américaine, a annoncé le lancement de ce qu'elle présente comme la première plateforme de services SEO entièrement AI-native. Contrairement aux outils classiques comme Semrush ou Ahrefs qui produisent des données et des recommandations, cette plateforme s'appuie sur plus de douze agents IA spécialisés pour exécuter directement les tâches opérationnelles du référencement naturel. Une fois un domaine connecté à Google Search Console, au CMS et aux objectifs commerciaux de l'entreprise, la plateforme prend en charge l'ensemble du cycle : identification des opportunités, production de briefs éditoriaux, génération de tickets techniques, recommandations de balisage structuré, plans de maillage interne et scénarios de SEO programmatique. Les décisions stratégiques, positionnement de marque, gestion des risques liés aux mises à jour d'algorithme Google, validation des actions à fort impact, restent sous contrôle humain. L'enjeu est considérable pour les équipes marketing. Depuis une décennie, le SEO repose sur une logique d'empilement d'outils : chaque étape du processus requiert une plateforme distincte, et transformer les données en résultats concrets mobilise des ressources humaines importantes. Trapilot AI parie que la valeur ne réside plus dans les tableaux de bord mais dans l'exécution automatisée des actions qui en découlent. Cette logique rejoint directement la thèse publiée par Sequoia Capital dans son analyse "Services are the New Software", selon laquelle les entreprises dépensent bien davantage en services qu'en logiciels, et que les marchés les plus prometteurs sont ceux où l'IA peut exécuter des tâches complexes plutôt que simplement assister les utilisateurs. Pour les équipes marketing des PME ou des scale-ups sans département SEO structuré, une telle plateforme pourrait représenter un levier de compétitivité significatif. La startup s'inscrit dans une vague plus large de plateformes dites "AI-native" qui cherchent à remplacer des catégories entières de logiciels SaaS par des systèmes agentiques. Le marché du SEO, estimé à plusieurs milliards de dollars et dominé par des acteurs établis comme Semrush, Moz ou Ahrefs, constitue une cible naturelle pour ce type de disruption : ses processus sont largement standardisables, ses livrables mesurables, et ses utilisateurs habitués à payer des abonnements récurrents élevés. La question qui reste ouverte est celle de la fiabilité des agents face à la complexité algorithmique de Google et aux spécificités sectorielles de chaque client. Trapilot AI n'a pas encore communiqué sur ses métriques de performance réelles ni sur sa base clients, ce qui rend difficile toute évaluation indépendante de ses promesses à ce stade.

OutilsOutil
1 source
Perplexity AI lance un orchestrateur d'inférence hybride pour PC : répartition automatique entre local et cloud
10MarkTechPost 

Perplexity AI lance un orchestrateur d'inférence hybride pour PC : répartition automatique entre local et cloud

Perplexity AI a présenté lors du Computex 2026 ce qu'elle décrit comme le premier orchestrateur d'inférence hybride local-serveur, une technologie destinée à son produit Perplexity Computer. Le principe : un modèle d'IA compact installé sur l'appareil de l'utilisateur analyse chaque tâche entrante et décide automatiquement si elle doit être exécutée en local ou envoyée vers un modèle frontier dans le cloud. La fonctionnalité arrivera en juillet 2026, d'abord sur Windows, tandis que la version Mac de Personal Computer est déjà disponible depuis avril 2026 avec une liste d'attente ouverte pour Windows. L'orchestrateur est compatible avec les puces Intel Core Ultra Series 3 et les GPU NVIDIA RTX Spark, et fonctionne indépendamment du modèle utilisé. Perplexity Computer, lancé en février 2026 sur abonnement Max à 200 dollars par mois, peut coordonner jusqu'à 20 modèles d'IA dans un même flux de travail. L'enjeu principal de cette architecture est la gouvernance des données dans les environnements professionnels. Jusqu'ici, les systèmes d'IA agentiques obligeaient les utilisateurs à choisir entre puissance de calcul et confidentialité. Le nouvel orchestrateur supprime ce compromis en automatisant la décision : les données sensibles comme les fichiers financiers, les dossiers de santé ou les documents personnels restent sur l'appareil, tandis que les tâches nécessitant une puissance de calcul élevée sont envoyées vers les serveurs de Perplexity. Le système demande l'autorisation de l'utilisateur avant tout envoi de données sensibles vers le cloud, ce qui répond directement aux exigences de conformité et de traçabilité que posent les entreprises face aux outils d'IA. Pour les équipes qui hésitaient à adopter des agents IA par crainte des fuites de données, c'est un argument concret. Cette annonce s'inscrit dans une course plus large à l'IA sur appareil, où Apple, Microsoft, Google et de nombreux fabricants de puces cherchent à convaincre que le traitement local est l'avenir. Perplexity, qui s'est imposé comme un acteur sérieux de la recherche IA avec plusieurs centaines de millions de dollars levés, tente ici de se différencier sur le segment des agents autonomes, un marché encore naissant mais très disputé. L'idée de faire du modèle local un chef d'orchestre plutôt qu'un simple exécutant est une évolution architecturale notable : ce n'est plus seulement "quel modèle utiliser" mais "où chaque morceau de la tâche doit-il s'exécuter". Si la promesse tient à l'usage réel, ce type d'orchestration pourrait devenir la norme pour tout système agentique voulant combiner performance, coût maîtrisé et confidentialité.

UEL'architecture hybride local-cloud, en maintenant les données sensibles sur l'appareil, pourrait faciliter l'adoption par les entreprises européennes soumises au RGPD qui hésitaient à déployer des agents IA.

💬 L'IA locale comme simple accélérateur, ça fait deux ans qu'on en entend parler. Ce qui change ici, c'est de mettre le petit modèle en position de chef d'orchestre qui décide ce qui part dans le cloud, avec demande explicite pour les fichiers sensibles, et pour les équipes enterprise bloquées par le RGPD, c'est l'argument concret qui manquait. Les 200 dollars par mois sur abonnement Max, c'est par contre un vrai filtre à l'entrée.

OutilsOutil
1 source
Amazon shopping génère en temps réel par IA des images de produits qui… n’existent pas
11Next INpact 

Amazon shopping génère en temps réel par IA des images de produits qui… n’existent pas

Amazon a dévoilé huit nouvelles fonctionnalités de recherche visuelle dans son application mobile de shopping, dont trois reposent sur l'intelligence artificielle générative. La plus remarquée, et la plus controversée, génère en temps réel des images de produits qui n'existent pas, directement dans la barre de recherche, à mesure que l'utilisateur tape ses mots-clés. Chaque lettre ajoutée déclenche une nouvelle vague d'images IA qui évoluent et s'affinent dynamiquement. Mihir Bhanot, directeur d'Amazon Search, présente la chose comme un pont entre « l'imagination et la découverte de produits ». La fonctionnalité est déjà disponible dans les catégories Mode et Maison, avec une extension progressive prévue. La réaction de la presse spécialisée a été quasi unanimement négative. TechCrunch parle de « l'une des utilisations les plus discutables de l'IA à ce jour », The Verge raille un commerçant qui « invente de faux produits pour orienter les résultats de recherche », et 9to5Google qualifie la fonctionnalité de « ridiculement stupide ». Les critiques sont doubles : d'abord, un risque de confusion pour les acheteurs qui pourraient croire trouver exactement le produit affiché, pour découvrir ensuite qu'il n'existe pas. Ensuite, un gaspillage massif de ressources de calcul : puisque les images sont régénérées à chaque frappe, la quasi-totalité de celles produites ne serviront jamais, Amazon aurait pu utiliser des photos réelles de produits réels, ce que les acheteurs en ligne recherchent précisément. Cette décision intervient dans un contexte où Amazon investit massivement dans l'IA générative pour moderniser son expérience d'achat face à la concurrence de Google Shopping et de TikTok. L'entreprise cherche à rendre son interface plus « ludique », selon ses propres termes, mais la ligne entre innovation utile et gadget coûteux semble ici franchie. Le choix de générer des images à la volée plutôt qu'en fin de saisie multiplie inutilement la charge computationnelle, et donc les coûts d'infrastructure. La question que plusieurs observateurs posent en filigrane est celle de la destination de ces millions d'images générées : Amazon, qui ne précise pas si elles sont stockées ou supprimées, pourrait y voir une opportunité de constituer des bases de données visuelles propriétaires. Ce déploiement illustre une tendance plus large dans l'industrie tech : l'intégration de l'IA générative comme argument marketing, parfois au détriment de l'expérience utilisateur réelle.

UELes utilisateurs d'Amazon en France et en Europe pourraient être exposés à cette fonctionnalité lors de son déploiement progressif, avec un risque de confusion entre images générées et produits réellement disponibles à l'achat.

OutilsOutil
1 source
Microsoft Fara : lancer un agent Browser-Use dans Google Colab avec un endpoint OpenAI factice
12MarkTechPost 

Microsoft Fara : lancer un agent Browser-Use dans Google Colab avec un endpoint OpenAI factice

Un tutoriel récemment publié décrit comment déployer Fara, l'agent de navigation web de Microsoft, directement depuis Google Colab sans nécessiter d'infrastructure dédiée. Le guide couvre l'ensemble du pipeline opérationnel : clonage du dépôt GitHub (github.com/microsoft/fara), installation des dépendances via pip, configuration du navigateur Playwright Firefox, puis exécution d'une tâche concrète telle que "ouvrir example.com et décrire le contenu de la page". L'approche centrale repose sur la création d'un point de terminaison fictif compatible avec l'API OpenAI, qui simule les réponses du vrai modèle Fara-7B. Ce serveur mock retourne des actions de navigation valides que Playwright exécute réellement dans le navigateur, reproduisant fidèlement la boucle complète de l'agent en conditions quasi-réelles, sans avoir à héberger un modèle de 7 milliards de paramètres. L'intérêt de cette méthode est de rendre le développement d'agents de navigation accessible sans GPU ni serveur dédié. En découplant la logique de l'agent du modèle de langage sous-jacent, les développeurs peuvent valider leurs flux de travail, déboguer leur code et tester des scénarios d'automatisation à moindre coût. La configuration reste entièrement portable : le même notebook peut être reconnecté à un vrai endpoint Fara-7B hébergé sur Azure AI Foundry, vLLM, LM Studio ou Ollama, en basculant une unique variable booléenne (USEREALFARA_ENDPOINT). Cette flexibilité entre backends réduit significativement le coût d'entrée pour les équipes qui souhaitent expérimenter l'automatisation web par IA sans s'engager d'emblée dans une infrastructure lourde. Les agents capables de piloter un navigateur de façon autonome constituent l'une des frontières les plus actives de l'IA appliquée en 2026. Anthropic a introduit son API "computer use" pour Claude, OpenAI a déployé son agent Operator, et Google explore des capacités similaires via Project Mariner. Microsoft, avec Fara, mise sur un modèle spécialisé entraîné spécifiquement pour piloter des interfaces web, une approche différente des solutions généralistes de ses concurrents. Le choix délibéré de la compatibilité avec le format OpenAI n'est pas anodin : il permet à Fara de s'intégrer dans l'écosystème d'outillage existant sans réécriture majeure. La publication de ce type de tutoriel accessible joue un rôle clé dans la démocratisation de ces technologies, en abaissant la barrière technique pour les développeurs indépendants et les équipes produit qui n'ont pas encore accès à des infrastructures d'inférence dédiées.

OutilsOutil
1 source
Les 15 meilleurs outils de vibe coding en 2026 : prix, fonctionnalités et cas d'usage
13MarkTechPost 

Les 15 meilleurs outils de vibe coding en 2026 : prix, fonctionnalités et cas d'usage

En 2026, le "vibe coding" s'est imposé comme l'approche dominante du développement logiciel assisté par IA. Le principe, popularisé par Andrej Karpathy, ancien directeur de l'IA chez Tesla et OpenAI, consiste à décrire en langage naturel ce que l'on veut construire, puis à laisser un agent IA générer le code correspondant. Le développeur fixe la direction et valide le résultat, l'agent prend en charge l'essentiel de l'implémentation. Une comparaison récente de quinze outils phares illustre la diversité des approches disponibles : des plateformes agents complètes comme Atoms, qui mobilise une équipe d'agents spécialisés couvrant architecture, SEO et intégration Stripe pour livrer une application prête à déployer, jusqu'aux IDE natifs IA comme Cursor, qui conserve le développeur au coeur du code tout en automatisant les modifications multi-fichiers via son "Agent Mode". D'autres acteurs majeurs figurent dans ce panorama : Replit, environnement entièrement navigateur sans installation locale, idéal pour le prototypage rapide ; Claude Code d'Anthropic, interface en ligne de commande avec mémoire de projet persistante ; GitHub Copilot, désormais capable d'exécuter des tâches complètes depuis une invite en langage naturel ; et Windsurf avec son agent Cascade orienté collaboration en temps réel. Cette évolution réduit concrètement le coût du passage de l'idée au prototype. Un fondateur peut désormais tester un concept sans recruter une équipe d'ingénieurs. Un développeur expérimenté peut déléguer le code répétitif pour se concentrer sur l'architecture. Les cycles d'itération raccourcissent, les boucles de feedback se resserrent. Pour l'industrie, cela signifie que la barrière technique à la création de logiciels s'abaisse significativement, ce qui ouvre le développement à des profils non-ingénieurs tout en augmentant la productivité des développeurs chevronnés. Le choix entre ces outils repose sur un arbitrage central : jusqu'où déléguer à l'agent et combien garder de contrôle sur le code produit. Le vibe coding s'inscrit dans une tendance plus large portée par la montée en puissance des grands modèles de langage, notamment ceux d'Anthropic, OpenAI et Google, qui alimentent la plupart de ces outils. La capacité d'un outil à comprendre une base de code existante, à gérer des projets de grande taille, et à s'intégrer dans des workflows de revue via des pull requests devient un critère de sélection clé, en particulier pour les équipes d'entreprise soumises à des règles strictes en matière de confidentialité des données. La prochaine étape probable est l'automatisation complète de bout en bout, de la spécification produit au déploiement en production, un territoire où Atoms se positionne déjà, mais que Cursor, Copilot et Replit approchent chacun par des voies différentes. Le développeur de 2026 choisit moins son langage que son niveau d'autonomie accordé à la machine.

OutilsOutil
1 source
Vous débutez en musculation ? Cette IA veut vous éviter une blessure dès le premier jour
14Le Big Data 

Vous débutez en musculation ? Cette IA veut vous éviter une blessure dès le premier jour

Des chercheurs des universités Drexel et Michigan State ont développé BioCoach, un prototype d'intelligence artificielle destiné à prévenir les blessures en musculation. Le système fonctionne via la caméra d'un smartphone : il analyse en temps réel la biomécanique de l'utilisateur, identifie les articulations sollicitées pendant chaque exercice et détecte les erreurs de posture avant qu'elles ne causent de douleurs. Pour une série de pompes, BioCoach cible spécifiquement les épaules, les coudes et les poignets, et peut suggérer des corrections précises comme augmenter l'angle de flexion d'un coude ou ajuster l'amplitude d'un mouvement. Le projet est né en partie d'un constat issu de la pandémie : aux États-Unis, les blessures liées à l'exercice à domicile ont fortement augmenté pendant cette période, non pas à cause du matériel utilisé, mais principalement en raison de mauvaises postures adoptées sans supervision. Ce qui distingue BioCoach des applications de fitness existantes, c'est sa capacité à fournir des explications anatomiques contextualisées plutôt que des alertes génériques. Là où la plupart des outils se contentent de répéter des consignes vagues comme « gardez le dos droit », ce prototype combine deux modèles : l'un analyse l'apparence visuelle et les mouvements, l'autre reconstruit un squelette en trois dimensions pour étudier les angles articulaires et les phases du mouvement. Le système explique ensuite les conséquences mécaniques concrètes d'un geste mal exécuté, ce qui représente une avancée pédagogique réelle, notamment pour les débutants qui ne disposent pas des bases anatomiques pour distinguer une exécution correcte d'une posture risquée. Selon les chercheurs, BioCoach surpasse plusieurs solutions développées par de grands acteurs technologiques sur la qualité des explications et la précision des retours anatomiques. Le contexte est celui d'un marché du coaching sportif numérique en pleine expansion, alimenté par la généralisation des appareils connectés et la démocratisation de l'entraînement à domicile. Plusieurs entreprises technologiques travaillent déjà sur des systèmes d'analyse du mouvement, mais la plupart restent coûteux ou nécessitent des capteurs dédiés. L'approche de BioCoach, qui repose uniquement sur une caméra de smartphone, abaisserait considérablement la barrière d'accès. Pour l'heure, le projet reste un prototype de recherche académique, sans application grand public disponible ni calendrier de commercialisation annoncé. La prochaine étape consiste vraisemblablement à valider le système sur des populations plus larges et dans des conditions d'entraînement variées, avant d'envisager une intégration dans des plateformes fitness existantes ou une sortie autonome sur les stores applicatifs.

OutilsOutil
1 source
Meta lance un agent IA pour le commerce conversationnel
15AI News 

Meta lance un agent IA pour le commerce conversationnel

Meta a lancé Business Agent, un système d'intelligence artificielle conçu pour automatiser le commerce conversationnel directement au sein de ses applications de messagerie. Intégré nativement à Instagram, Messenger et bientôt WhatsApp, cet agent logiciel permet aux marques de retail mondiales de traiter des transactions et de gérer des demandes de support client sans intervention humaine. Contrairement aux chatbots classiques, l'outil va bien au-delà de la réponse automatique : il guide un acheteur tout au long du processus de paiement depuis la découverte d'un produit sur Instagram jusqu'à la confirmation de commande, le tout sans jamais quitter l'application. Meta le présente comme une "équipe infinie" pour les opérateurs du commerce de détail, disponible vingt-quatre heures sur vingt-quatre et capable d'absorber des volumes massifs d'interactions clients. L'impact concret est double. D'un côté, l'architecture élimine les taux d'abandon de panier élevés liés aux redirections vers des portails de paiement externes, un problème chronique du commerce en ligne. De l'autre, elle libère les équipes humaines des tickets répétitifs de premier niveau, leur permettant de se concentrer sur les cas complexes et la rétention client. Le système s'appuie sur des modèles qui apprennent en continu des interactions consommateurs, améliorant ses recommandations produit sans nécessiter de reprogrammation manuelle constante. Les mises à jour de catalogues, notamment lors des changements de saison, se synchronisent automatiquement avec l'interface conversationnelle, ce qui répond directement aux contraintes des retailers à forte volatilité de gamme. Ce déploiement marque une rupture stratégique avec les plateformes tierces de service client : en intégrant l'agent directement dans l'écosystème Meta, la firme de Menlo Park exploite le graphe social et l'historique d'interactions de chaque utilisateur, un niveau de profilage consommateur que les API externes peinent à reproduire. Cette profondeur d'intégration facilite aussi le traitement sécurisé des paiements en chat natif. Reste que des défis majeurs d'implémentation attendent les entreprises : la qualité des données alimentant le système est déterminante, une documentation produit mal structurée génère des interactions médiocres et érode la confiance des clients. Les grandes entreprises devront en outre évaluer la compatibilité du service managé avec leurs bases CRM existantes. Les équipes techniques devront définir des limites opérationnelles strictes et des protocoles de transfert vers des agents humains pour éviter que les clients ne se retrouvent piégés dans des boucles conversationnelles, source directe de frustration et de dommages réputationnels. La sécurité de l'authentification, notamment pour les opérations sensibles comme les retours produit, constitue un autre chantier critique avant tout lancement à grande échelle.

UELes retailers français et européens présents sur Instagram et WhatsApp pourront accéder à cet agent commercial, mais le niveau de profilage consommateur décrit soulève des questions de compatibilité avec le RGPD.

Cette IA trouve un produit sur Amazon sans connaître son nom (mais il y a un couac)
16Le Big Data 

Cette IA trouve un produit sur Amazon sans connaître son nom (mais il y a un couac)

Amazon a lancé une nouvelle fonctionnalité sur son application Shopping pour iOS et Android permettant aux utilisateurs de retrouver un produit sans en connaître le nom exact. Le principe est simple : l'utilisateur décrit le produit recherché en langage naturel dans la barre de recherche, et l'IA génère instantanément des visuels représentatifs correspondant à cette description. Ces images apparaissent dès les premiers mots saisis et évoluent en temps réel à mesure que l'utilisateur précise ses critères, couleur, texture, matière, motif. La fonction est disponible dès maintenant, mais uniquement aux États-Unis et principalement dans les catégories mode et décoration intérieure, avec une extension prévue à d'autres univers. Amazon a également présenté en parallèle « Acheter par style », un outil qui génère des tenues complètes sous forme de collages IA à partir d'une simple description vestimentaire, avec des suggestions associées à des styles comme « chic exécutif » ou « luxe urbain ». Cette fonctionnalité s'attaque à un problème concret du e-commerce : le fossé entre ce qu'un acheteur visualise et les mots qu'il utilise pour le chercher. L'exemple avancé par Amazon est parlant, quelqu'un qui cherche un tapis en sisal sans connaître ce terme peut simplement décrire « tapis en fibres naturelles résistant » et obtenir des résultats pertinents. Même si les images générées ne représentent pas directement des articles disponibles à la vente, elles servent de pont vers des produits similaires en stock. Pour Amazon, l'enjeu est commercial avant tout : réduire la friction dans le parcours d'achat pour convertir davantage d'intentions floues en achats effectifs. Cette nouveauté s'inscrit dans une stratégie d'intégration massive de l'IA à chaque étape de l'expérience Amazon. Le géant du commerce en ligne déploie depuis plusieurs mois un écosystème d'outils IA complémentaires : Rufus, son chatbot intégré qui répond aux questions sur les produits ; Lens Live, qui permet de pointer la caméra de son smartphone vers un objet aperçu en rue pour recevoir des recommandations similaires ; et « Aide à choisir », qui analyse l'historique d'achats pour anticiper les besoins futurs. La recherche visuelle par description vient combler l'angle mort restant, celui du produit imaginé mais innommable. Le déploiement progressif, d'abord aux États-Unis et sur deux catégories, laisse penser qu'Amazon teste la technologie avant un déploiement mondial, avec en ligne de mire la transformation de son moteur de recherche en un véritable assistant d'achat conversationnel et visuel.

UEFonctionnalité déployée uniquement aux États-Unis pour l'instant, sans impact direct pour les consommateurs ou retailers français et européens à court terme.

OutilsOutil
1 source
Scout, l'Autopilot à base d'agents de Microsoft pour l'ensemble de M365
17AI News 

Scout, l'Autopilot à base d'agents de Microsoft pour l'ensemble de M365

Microsoft a présenté Scout lors de sa conférence Build 2026 cette semaine, le positionnant comme le premier représentant d'une nouvelle catégorie d'agents autonomes qu'il nomme "Autopilots". Testé en interne par des employés de Microsoft avant d'être étendu à un groupe restreint de clients et d'organisations membres du programme Frontier, Scout opère au sein de l'écosystème Microsoft 365 : Outlook, OneDrive, SharePoint et Teams. L'agent planifie des réunions, signale des messages prioritaires, génère des événements de calendrier et anticipe les échéances en bloquant des créneaux dans l'agenda d'un utilisateur pour dégager du temps de travail concentré. Il apprend progressivement les habitudes et préférences de chaque utilisateur pour affiner ses priorités. Techniquement, Scout repose sur OpenClaw, un projet open source développé en un week-end par Peter Steinberger, et Microsoft s'est engagé à contribuer en retour à ce projet. L'annonce a été rédigée par Omar Shahine, vice-président de Microsoft Scout, vétéran de Redmond dont le parcours inclut les divisions Windows Live, OneDrive et Mac Office. Pour accéder à Scout, les entreprises doivent être inscrites au programme Frontier, disposer d'une configuration Intune, d'une licence GitHub Copilot active et soumettre une attestation d'acceptation explicite. Scout représente une évolution significative dans la manière dont les outils de productivité intègrent l'automatisation. Contrairement à un simple assistant réactif, un Autopilot possède sa propre identité numérique, ce qui permet à plusieurs agents de coexister avec des règles de gouvernance distinctes : une instance personnelle et une instance professionnelle peuvent fonctionner en parallèle avec des droits différenciés selon le contexte. Pour les équipes informatiques, l'intégration via Microsoft Entra permet de vérifier l'identité des agents et de s'assurer qu'ils respectent les politiques de sécurité internes. La protection des données s'appuie sur Microsoft Purview, les identifiants liés aux identités machines étant masqués dans les journaux de diagnostics. Les actions jugées sensibles par l'algorithme requièrent systématiquement une validation humaine, ce qui préserve un contrôle sur les décisions à fort impact. La notion d'Autopilot s'inscrit dans la course que se livrent les grandes plateformes pour intégrer des agents réellement autonomes dans les flux de travail professionnels. Microsoft, qui a massivement investi dans l'IA générative depuis son partenariat avec OpenAI, cherche à différencier sa suite Copilot en y ajoutant une couche d'agentivité persistante et contextuelle. En bâtissant Scout sur une base open source et en promettant d'y contribuer, l'entreprise adopte une posture d'ouverture inhabituelle dans ce segment très compétitif. La prochaine étape sera l'élargissement progressif du programme Frontier et l'extension des capacités de Scout au-delà de Microsoft 365 vers d'autres surfaces applicatives, à mesure que les essais en conditions réelles permettront d'affiner la gestion des risques de sécurité identifiés lors des tests internes.

UELes entreprises françaises et européennes utilisant Microsoft 365 devront évaluer les implications de gouvernance et de conformité (RGPD, AI Act) liées à l'adoption d'agents autonomes dotés d'une identité numérique propre.

OutilsOutil
1 source
Vous ne savez pas quoi acheter ? L’IA d’Amazon s’en charge
18Le Big Data 

Vous ne savez pas quoi acheter ? L’IA d’Amazon s’en charge

Amazon a lancé aux États-Unis une nouvelle fonctionnalité de recherche visuelle par intelligence artificielle, disponible dans l'application Amazon Shopping sur iOS et Android. Le principe repose sur la génération d'images à partir de descriptions textuelles vagues : un utilisateur saisit des mots évocateurs, une couleur, une texture, une ambiance, et l'IA produit des visuels correspondant à l'idée qu'il a en tête. Ces images ne sont pas des produits vendus directement, mais un clic permet d'accéder à des articles similaires disponibles sur la plateforme. Amazon déploie également une fonction baptisée "Acheter par style", qui transforme une recherche classique en collages de tenues complètes assortis d'étiquettes comme "chic exécutif" ou "luxe urbain". L'outil fonctionne en priorité sur les catégories vêtements et maison, deux univers où l'apparence précède souvent le nom exact du produit. L'impact est immédiat pour des millions de consommateurs qui peinent à formuler ce qu'ils cherchent. Le cas emblématique cité par Amazon illustre bien l'enjeu : un tapis en fibres de sisal, dont on visualise la texture sans retrouver le mot. Jusqu'ici, cela signifiait des recherches approximatives, des filtres mal ajustés et souvent une capitulation frustrante. Désormais, l'IA comble ce vide lexical et raccourcit le chemin vers l'achat. Pour Amazon, le gain est structurel : intervenir au moment où l'envie est encore floue, avant le choix, avant la comparaison, avant même que l'utilisateur sache ce qu'il veut précisément. La fonction "Acheter par style" va plus loin encore en transformant la recherche d'un seul article en exposition à une silhouette entière, multipliant ainsi les opportunités d'achat au sein d'une même session. Cette nouveauté s'inscrit dans une stratégie IA déjà dense chez Amazon. L'assistant Rufus répond aux questions sur les produits, Lens Live identifie des articles en scannant des objets du quotidien, et la fonction "Aide à choisir" exploite l'historique d'achats pour anticiper les prochaines acquisitions. Ensemble, ces outils dessinent un commerce où la friction disparaît progressivement entre l'envie et le paiement. La question sous-jacente est celle de l'autonomie du consommateur : à mesure que l'IA réduit l'effort de recherche, elle réduit aussi les moments de délibération. Amazon, premier acteur mondial du e-commerce avec plus de 310 milliards de dollars de revenus en 2024, n'a jamais caché son objectif de maximiser la conversion. Ces fonctionnalités, aussi pratiques soient-elles, transforment le panier en moodboard et le moteur de recherche en prescripteur de désirs, un glissement dont l'industrie du retail tout entière observe attentivement les effets.

OutilsOutil
1 source
Amazon déploie son assistant shopping IA chez les enseignes, dont Kate Spade
19AI News 

Amazon déploie son assistant shopping IA chez les enseignes, dont Kate Spade

Amazon commercialise désormais sa technologie d'assistant shopping par intelligence artificielle auprès d'autres enseignes de distribution, via un nouvel outil baptisé Agentic Shopping Assistant, construit sur AWS. Kate Spade, filiale du groupe Tapestry, figure parmi les premiers retailers à l'adopter, en déployant un "AI Gift Concierge" capable de guider les clients dans leurs achats cadeaux via une interface conversationnelle. Selon Amazon, plus de 300 millions de clients ont utilisé son propre assistant shopping l'année dernière, générant près de 12 milliards de dollars de ventes incrémentales. La société affirme que les enseignes peuvent déployer ces agents conversationnels "en quelques semaines" plutôt qu'en plusieurs années si elles partaient de zéro. L'offre comprend une architecture technique, du code prêt à l'emploi, et un accompagnement par des experts AWS et des intégrateurs partenaires. Le système repose sur Amazon Bedrock pour les applications d'IA générative, AgentCore pour l'orchestration des agents, et OpenSearch pour la recherche et la récupération de données. L'enjeu commercial est significatif : Amazon indique que les sessions de shopping conversationnel génèrent des taux de conversion 3,5 fois supérieurs aux recherches traditionnelles par mots-clés. Pour Kate Spade, l'assistant cible précisément le moment d'achat cadeau, un contexte que 53 % des consommateurs jugent stressant selon les données internes d'Amazon. Fabio Luzzi, directeur des données et de l'analytique chez Tapestry, a expliqué que l'outil est né d'une écoute directe des consommateurs. Le groupe a testé l'assistant pendant environ deux mois et demi avant de le rendre accessible au grand public. En offrant cette technologie clé en main à d'autres retailers, Amazon transforme ses infrastructures IA en service commercial à part entière, potentiellement accessible à n'importe quelle marque dotée d'un budget AWS. Ce lancement s'inscrit dans une accélération plus large de la stratégie IA d'Amazon. En mai 2026, la société avait déjà déployé Alexa for Shopping aux États-Unis, permettant aux utilisateurs de poser des questions d'achat directement dans la barre de recherche Amazon et d'obtenir des réponses conversationnelles. Cette fonctionnalité fusionne Rufus, l'assistant shopping lancé en 2024, et Alexa+. En externalisant cette technologie via AWS, Amazon cherche à s'imposer comme la couche d'infrastructure IA du commerce en ligne mondial, face à des concurrents comme Google Shopping ou les solutions propres développées par de grands retailers. La question centrale pour l'industrie est désormais de savoir si ce modèle d'assistant conversationnel deviendra la norme d'expérience d'achat en ligne, et dans quelle mesure Amazon captera une part des transactions réalisées sur des sites tiers.

UELes enseignes de distribution françaises et européennes peuvent désormais déployer des assistants shopping conversationnels clé en main via cette offre AWS, sans investissement pluriannuel en R&D propriétaire.

💬 Le playbook AWS, version shopping : tu bâtis une infra pour toi, ça marche, tu la revends à tout le monde. Les 3,5x de conversion, bon, c'est Amazon qui le dit, mais même à moitié ça reste sérieux. Kate Spade c'est juste le logo de lancement, dans six mois c'est la moitié du retail mondial qui tourne sur un agent Bedrock sans le savoir.

OutilsOutil
1 source
Meta lance Business Agent pour automatiser les ventes et le support client
20Le Big Data 

Meta lance Business Agent pour automatiser les ventes et le support client

Meta a annoncé le 3 juin 2026 le lancement de Business Agent, un assistant conversationnel alimenté par l'intelligence artificielle conçu pour automatiser les ventes, le support client et certaines tâches opérationnelles sur WhatsApp, Messenger et Instagram. Le groupe déploie également une infrastructure associée, baptisée plateforme Meta Business Agent, qui permet aux entreprises de créer et personnaliser leurs propres agents IA connectés à des outils tiers comme Shopify, Zendesk ou Shopee. Dès le lancement, plus d'un million d'entreprises ont accès à ce dispositif via les canaux de messagerie de Meta. Le déploiement commence gratuitement, avec des formules payantes annoncées pour les prochains mois, adaptées à différentes tailles de structures, des PME aux grands groupes. Avec plus d'un milliard de conversations quotidiennes entre entreprises et consommateurs sur ses plateformes, Meta transforme ces échanges en interfaces commerciales actives. Business Agent peut répondre aux demandes clients, recommander des produits, qualifier des prospects, prendre des rendez-vous et conclure des ventes, tout en s'adaptant à la langue et au ton propre à chaque marque. Contrairement aux chatbots traditionnels limités à des scénarios fixes, cet agent suit une logique d'exécution multi-tâches au sein d'une même conversation, avec la possibilité pour les entreprises de définir à quel moment un collaborateur humain doit reprendre la main. En interne, l'outil génère également des résumés des conversations manquées et des analyses des interactions récentes, réduisant la charge opérationnelle liée aux échanges répétitifs. Cette offensive s'inscrit dans une course accélérée entre les grandes plateformes technologiques pour monétiser leurs audiences via des agents IA. Meta, fort d'une base d'utilisateurs sans équivalent sur la messagerie mondiale, cherche à convertir cette présence en infrastructure commerciale incontournable pour les entreprises. La plateforme concurrence directement des solutions comme Google Business Messages ou les intégrations Salesforce Einstein, en misant sur la simplicité de déploiement et l'ubiquité de WhatsApp, dominant dans de nombreux marchés hors États-Unis. À terme, Meta prévoit d'étendre les capacités de Business Agent à la veille concurrentielle, aux études de marché, à la gestion d'agenda et à l'analyse de données produits, positionnant progressivement cet outil comme un assistant stratégique complet pour les équipes commerciales et marketing.

UELes entreprises françaises utilisant WhatsApp Business, très répandu en France et en Europe, peuvent désormais déployer des agents IA pour automatiser leur service client et leurs ventes directement dans leurs canaux de messagerie existants.

OutilsOutil
1 source
Projet Solara : Microsoft veut remplacer la bonne vieille informatique par des agents IA
21Next INpact 

Projet Solara : Microsoft veut remplacer la bonne vieille informatique par des agents IA

Microsoft a dévoilé le projet Solara lors de sa conférence BUILD, une plateforme ambitieuse visant à faire des agents IA le nouveau paradigme central de l'informatique. Steven Bathiche, directeur de l'Applied Sciences Group chez Microsoft, a présenté ce système comme une infrastructure "de la puce au cloud" capable de faire tourner plusieurs agents spécialisés en parallèle. Pour matérialiser cette vision, Microsoft a conçu deux prototypes en collaboration avec ses partenaires Qualcomm et MediaTek : un badge connecté équipé d'un écran tactile, d'un microphone, d'une caméra, d'une connexion 5G et d'un lecteur d'empreintes digitales, ainsi qu'un terminal de bureau compact, évoquant un radio-réveil ou un écran connecté de cuisine, conçu pour rester en permanence accessible à côté d'un PC et pouvant se transformer en poste Windows 365 lorsqu'il est branché à un moniteur externe. L'enjeu est considérable pour Microsoft : la société parie que l'interaction utilisateur va fondamentalement basculer des applications traditionnelles vers des agents capables d'interpréter des intentions et de coordonner logiciels et services en arrière-plan, sans qu'aucune interface graphique classique ne soit nécessaire. Ce faisant, Microsoft se positionne pour contrôler la couche d'abstraction qui remplacera ses propres produits historiques, Windows, Office, dont la pertinence s'érode dans ce scénario. L'entreprise tente ainsi de ne pas se retrouver dans la position de Kodak face au numérique : elle préfère cannibaliser elle-même son modèle plutôt que de le laisser faire par ses concurrents. Ce virage s'inscrit dans une course industrielle plus large où plusieurs acteurs cherchent à définir l'appareil post-smartphone. OpenAI et le designer Jony Ive travaillent eux aussi sur un dispositif centré sur l'IA, qui pourrait selon l'analyste Ming-Chi Kuo ressembler à un smartphone classique. Le risque pour Microsoft reste que ses prototypes Solara ressemblent à des réinventions de catégories déjà existantes : un badge qui rappelle un smartphone miniature, un terminal de bureau qui n'est pas sans évoquer un Google Nest Hub ou un Amazon Echo Show. L'histoire de l'informatique, du métavers aux Google Glass, montre que les ruptures de paradigme annoncées avec fracas peinent souvent à convaincre le grand public, qui finit par revenir au smartphone. La pertinence de Solara dépendra moins de la qualité des prototypes que de la capacité des agents IA à tenir leurs promesses d'autonomie et de fiabilité dans des usages quotidiens réels.

UEL'adoption d'agents IA comme couche d'abstraction principale soulèverait des enjeux de souveraineté numérique pour l'Europe, notamment en termes de dépendance accrue envers des écosystèmes propriétaires étrangers.

OutilsOpinion
1 source
Google lance Dreambeans, cette appli IA crée des petites histoires basées sur votre vie
22Le Big Data 

Google lance Dreambeans, cette appli IA crée des petites histoires basées sur votre vie

Google a lancé le 3 juin 2026 Dreambeans, une application mobile expérimentale développée par Google Labs qui génère chaque matin entre 10 et 14 histoires personnalisées à partir des données de l'utilisateur. Pendant la nuit, l'application analyse le contenu de Gmail, Google Agenda, Google Photos, YouTube et l'historique de recherche pour produire des récits illustrés par intelligence artificielle. Ces histoires peuvent prendre la forme d'une recommandation de café détectée dans les recherches récentes, d'informations liées à un voyage planifié dans l'agenda, ou d'idées inspirées des vidéos regardées sur YouTube. Certains récits vont jusqu'à proposer une action concrète, comme réserver une place pour un événement. Les illustrations sont générées grâce au modèle Nano Banana 2 de Google, et peuvent intégrer les visages de l'utilisateur ou de ses proches en s'appuyant sur le regroupement facial de Google Photos. Pour l'instant, l'application est réservée aux abonnés Google AI Ultra résidant aux États-Unis et âgés d'au moins 18 ans. L'application incarne une philosophie délibérément opposée au modèle dominant des réseaux sociaux : au lieu d'un flux infini conçu pour maximiser le temps passé sur l'écran, Dreambeans propose une poignée d'histoires quotidiennes puis encourage l'utilisateur à reprendre sa journée. Cette approche pourrait résonner auprès d'utilisateurs de plus en plus critiques envers les mécaniques addictives des plateformes classiques. En pratique, l'impact reste cependant très circonscrit : l'accès est conditionné à un abonnement Google AI Ultra facturé 100 dollars par mois, soit l'offre la plus coûteuse de Google, ce qui réduit considérablement le nombre d'utilisateurs potentiels à court terme. Google reconnaît par ailleurs que l'application reste un projet expérimental, avec des recommandations parfois peu pertinentes et des visuels qui peuvent s'avérer inexacts. Dreambeans s'inscrit dans la stratégie plus large de Google autour de ce qu'il appelle l'"intelligence personnelle", soit la capacité à croiser les données des différents services Google pour offrir une expérience hyper-contextualisée. L'application arrive dans un moment où les géants technologiques cherchent à valoriser leurs écosystèmes fermés face à la concurrence de nouveaux entrants en IA. La question de la vie privée est centrale : Google indique que les utilisateurs contrôlent quels services sont connectés à Dreambeans et peuvent effacer leurs données à tout moment, et que les paramètres de l'appli n'influencent pas Gemini ni le mode IA de Google. Un système de retour d'expérience est intégré pour affiner les résultats. La prochaine étape sera de déterminer si ce positionnement, intime, limité, et payant, séduira au-delà du cercle des early adopters fortunés, ou si Google élargira progressivement l'accès à d'autres marchés.

OutilsOutil
1 source
OpenJarvis : un framework local pour agents IA personnels avec outils, mémoire et apprentissage
23MarkTechPost 

OpenJarvis : un framework local pour agents IA personnels avec outils, mémoire et apprentissage

Des chercheurs de l'Université Stanford et de Lambda Labs ont publié en mai 2026 OpenJarvis, un framework open-source conçu pour faire tourner des agents IA personnels entièrement en local, sans recours au cloud. Disponible sur GitHub avec déjà plus de 5 400 étoiles, le projet s'appuie sur onze modèles locaux issus de quatre familles (Qwen3.5, Gemma4, Nemotron, Granite) et supporte des moteurs d'inférence variés comme Ollama, vLLM ou llama.cpp. Les performances mesurées sur 508 tâches réparties en huit benchmarks montrent que les modèles configurés via OpenJarvis se situent à seulement 3,2 points de pourcentage en dessous des meilleurs modèles cloud, Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro, tout en affichant une latence quatre fois plus faible et un coût marginal par requête environ 800 fois inférieur. Ce résultat change concrètement l'équation pour les développeurs et les entreprises qui cherchent à déployer des agents IA sans dépendre d'APIs tierces. OpenJarvis décompose un système d'IA personnelle en cinq primitives indépendantes et interchangeables, le modèle, le moteur d'inférence, la logique d'agent, les outils et la mémoire, puis l'optimiseur d'apprentissage, toutes configurables via un unique fichier TOML appelé "spec". Cette architecture permet à un même comportement d'agent de fonctionner sur un Mac Mini M4 comme sur une station de travail NVIDIA DGX Spark, sans réécrire les prompts. L'installation tient en une seule commande et prend environ trois minutes sur une connexion correcte. La contribution la plus originale du projet réside dans la "LLM-guided spec search", une méthode d'optimisation hybride locale-cloud : un modèle frontier agit comme enseignant au moment de la configuration, en analysant les traces d'exécution, diagnostiquant les échecs et proposant des modifications coordonnées sur l'ensemble des primitives. Une modification n'est acceptée que si elle améliore les cas défaillants sans provoquer de régressions ailleurs, avec une tolérance par défaut de 1%. Une fois optimisé, le système tourne entièrement en local sans aucun appel cloud. À 100 requêtes par jour, le coût amorti de cet enseignant descend sous 0,001 dollar par requête au bout de six mois. Cette approche multi-primitive récupère 13 à 32 points de pourcentage de l'écart cloud-local, contre seulement 5 points pour les optimiseurs de prompts classiques, à un coût d'optimisation 7 à 11 fois inférieur aux méthodes antérieures comme DSPy ou LoRA. Le projet s'inscrit dans un contexte où les modèles locaux gèrent déjà 88,7% des requêtes conversationnelles courantes selon une étude antérieure de la même équipe, et où l'efficacité des modèles embarqués a progressé de 5,3 fois entre 2023 et 2025.

UELes entreprises européennes soumises au RGPD peuvent déployer des agents IA performants entièrement en local sans transférer leurs données vers des services cloud américains, réduisant leur exposition aux risques de non-conformité et renforçant leur souveraineté numérique.

💬 3,2 points de moins que Claude Opus ou GPT-5, pour un coût 800 fois inférieur : à ce ratio, la question n'est plus "cloud ou local". Le truc malin c'est la spec search guidée, tu laisses un frontier calibrer ta config une fois, puis plus aucun appel cloud ensuite. Bon, faudra voir si leurs 508 tâches de benchmark ressemblent à ce qu'on rencontre vraiment en prod.

OutilsOutil
1 source
Microsoft veut rendre les utilisateurs accros à son agent IA Scout
24Next INpact 

Microsoft veut rendre les utilisateurs accros à son agent IA Scout

Microsoft a présenté Scout lors de sa conférence Build 2026, un agent IA autonome et permanent conçu pour s'intégrer profondément dans l'écosystème Microsoft 365. Contrairement à Copilot, qui répond à des sollicitations ponctuelles, Scout agit de manière proactive : il surveille Teams, Outlook, OneDrive, SharePoint, le calendrier et les e-mails pour anticiper les besoins de l'utilisateur. Concrètement, il peut repérer des réunions importantes, organiser automatiquement des rendez-vous, bloquer des créneaux dans l'agenda pour boucler un projet, préparer des documents avant une réunion ou signaler qu'une décision traîne et risque de faire déraper un planning. Scout possède aussi sa propre identité traçable : toutes ses actions sont journalisées et les opérations critiques nécessitent une validation humaine. Selon des documents internes publiés par 404media, plus de 1 000 employés Microsoft l'utilisent déjà, dont le PDG Satya Nadella. L'agent est pour l'instant en aperçu privé, mais le document interne révèle qu'il s'est imposé comme "l'un des outils internes les plus demandés chez Microsoft, sans annonce officielle, sans marketing". Cette approche représente un changement de paradigme dans l'usage professionnel de l'IA. Là où Copilot restait un assistant réactif, Scout ambitionne de devenir un collaborateur permanent qui apprend les habitudes de travail, identifie les projets prioritaires et anticipe les tâches récurrentes. Pour les entreprises clientes de Microsoft 365, cela signifie un agent qui réduit la charge cognitive des équipes en automatisant la coordination et la gestion du temps, deux des principaux goulots d'étranglement dans les organisations. L'enjeu commercial est considérable : Microsoft a investi des milliards dans ses infrastructures IA et cherche à transformer cet investissement en adoption massive au sein des entreprises. Ce qui rend le lancement de Scout particulièrement significatif, c'est la technologie qui le propulse : OpenClaw, une bibliothèque open source devenue une référence dans le monde des agents autonomes capables de manipuler des applications, des fichiers et des services en continu. Ironie du calendrier, Microsoft avertissait encore en février 2026 des risques de sécurité liés à OpenClaw, jugeant la technologie trop risquée pour les environnements d'entreprise en raison de ses privilèges étendus. L'éditeur a depuis changé de position et s'engage désormais à contribuer directement au projet, affirmant qu'il va "ajouter la sécurité, la gouvernance et l'intégration Microsoft 365" à la base existante. Ce revirement contraste avec l'approche de Meta, qui développe sa propre alternative propriétaire baptisée Hatch depuis qu'OpenAI a recruté Peter Steinberger, le créateur d'OpenClaw. Microsoft choisit l'intégration là où Meta choisit la bifurcation, un pari qui pourrait s'avérer décisif dans la course aux agents d'entreprise.

UEMicrosoft 365 étant massivement déployé dans les entreprises françaises et européennes, l'arrivée de Scout soulève des questions concrètes pour les DSI sur la gouvernance d'agents IA autonomes ayant accès aux données internes.

💬 En février, Microsoft nous expliquait qu'OpenClaw était trop dangereux pour les environnements d'entreprise. Quatre mois après, c'est la même techno qui fait tourner Scout en prod chez Satya Nadella, sans annonce officielle, juste des gens qui l'adoptent en interne. Ce revirement, ça en dit plus sur la pression concurrentielle que sur une vraie conviction technique.

OutilsOutil
1 source
OpenAI va fusionner Codex et ChatGPT… et la super app va (peut-être) arriver aujourd’hui
25Le Big Data 

OpenAI va fusionner Codex et ChatGPT… et la super app va (peut-être) arriver aujourd’hui

OpenAI a confirmé son intention de fusionner Codex et ChatGPT au sein d'une plateforme unique, selon des déclarations faites début juin 2026. Alexander Embiricos, responsable des produits entreprise chez OpenAI, a reconnu publiquement que le maintien de deux applications distinctes n'avait plus de sens. La société a annoncé que l'intégration de Codex dans ChatGPT interviendrait dans les prochaines semaines, sans préciser de date exacte ni les modalités techniques de cette fusion. Le 3 juin, OpenAI a publié sur X un message cryptique, "Il est temps de s'envoler", interprété par de nombreux observateurs comme une annonce imminente liée à Codex. Un signe avant-coureur existe déjà côté mobile : l'application ChatGPT sur iPhone peut désormais accéder à une instance de Codex installée sur Mac, laissant présager une intégration plus profonde à venir sur les autres plateformes. Cette convergence aurait des conséquences directes pour les développeurs et les entreprises qui utilisent aujourd'hui les deux outils séparément. L'objectif affiché par OpenAI est simple : l'utilisateur ne devrait plus avoir à choisir quelle application est la mieux adaptée à sa tâche. Un assistant de codage avancé et un modèle de conversation généraliste dans un seul environnement réduirait la friction, simplifierait les workflows et renforcerait la position d'OpenAI face à des concurrents qui proposent déjà des expériences plus unifiées. Pour les entreprises abonnées aux offres OpenAI, cela pourrait aussi signifier une rationalisation des licences et une meilleure cohérence entre les différents usages professionnels de l'IA. Codex, lancé par OpenAI comme agent de codage autonome capable de lire des dépôts GitHub, d'écrire et tester du code de manière indépendante, avait été déployé comme produit à part entière en mai 2025. Son existence séparée de ChatGPT reflétait une stratégie de segmentation par cas d'usage, aujourd'hui remise en question à mesure que les modèles de langage deviennent plus polyvalents. Anthropic suit une approche similaire avec Claude, où toutes les capacités, qu'il s'agisse d'analyse, de code ou de conversation, sont centralisées dans une seule interface. Si OpenAI opte pour une fusion complète, la question du nom reste ouverte : certains utilisateurs proposent "Chatex" ou "CodeGPT", sans qu'OpenAI n'ait tranché. Il reste également incertain si Codex survivra comme application autonome ou sera entièrement absorbé dans ChatGPT, une décision qui pourrait influencer l'adoption par les développeurs habitués à l'environnement actuel.

UELes développeurs et entreprises européens utilisant actuellement Codex et ChatGPT séparément pourraient bénéficier d'une rationalisation de leurs licences et d'un workflow unifié, sans impact réglementaire direct pour la France ou l'UE.

OutilsOutil
1 source
Le modèle tabulaire NEXUS de Fundamental est désormais disponible sur Amazon SageMaker JumpStart
26AWS ML Blog 

Le modèle tabulaire NEXUS de Fundamental est désormais disponible sur Amazon SageMaker JumpStart

Amazon Web Services vient d'annoncer la disponibilité de NEXUS, le modèle de fondation développé par la startup Fundamental, sur Amazon SageMaker JumpStart. NEXUS est un "Large Tabular Model" conçu spécifiquement pour les données structurées -- tableurs, bases de données relationnelles, systèmes ERP et CRM -- là où réside la majorité des données critiques des entreprises. Contrairement aux LLMs classiques, il a été pré-entraîné sur des milliards de tâches de prédiction réelles issues de datasets structurés. Il peut être déployé en tant qu'endpoint SageMaker managé sur une instance ml.p5en.48xlarge équipée de 8 GPU NVIDIA H200, avec accès via un SDK Python compatible scikit-learn incluant des estimateurs NEXUSClassifier et NEXUSRegressor. NEXUS s'attaque à un problème concret que rencontrent quotidiennement les équipes data des grandes entreprises : générer des prédictions fiables à partir de données tabulaires prend habituellement entre trois et six mois de travail pour une équipe de data scientists, entre le feature engineering, l'entraînement, la validation et le déploiement. Fundamental promet de ramener ce délai à quelques jours. L'un des atouts clés du modèle est son architecture déterministe : là où les LLMs produisent des réponses différentes à des questions identiques, NEXUS garantit des résultats reproductibles pour chaque prédiction individuelle. Il gère nativement les nombres, catégories, dates et textes sans prétraitement manuel, tolère les données manquantes, traite des datasets de plusieurs milliards de lignes sans troncature, et reconnaît que l'ordre des colonnes ne change pas la sémantique des données -- une propriété appelée permutation invariance, absente des architectures transformer classiques. Ce lancement s'inscrit dans une tendance plus large de spécialisation des modèles de fondation par type de données. Si les LLMs comme GPT-4 ou Claude ont démontré leur puissance sur le texte et les modèles de diffusion sur les images, les données tabulaires sont longtemps restées le terrain des approches ML traditionnelles -- gradient boosting, random forests -- ou de tentatives maladroites d'adapter des LLMs à des formats pour lesquels ils n'étaient pas conçus. La tokenisation numérique dans les LLMs introduit en effet des erreurs de contexte qui les rendent peu fiables sur des données structurées à haute précision. Fundamental parie que les données tabulaires méritent leur propre classe de modèles de fondation, et l'intégration avec SageMaker JumpStart lui donne accès à l'écosystème cloud d'AWS pour une diffusion à grande échelle auprès des entreprises. Le modèle est distribué via AWS Marketplace, positionnant clairement Fundamental sur le marché B2B des outils data enterprise.

OutilsOutil
1 source
Monako : Ces lunettes connectées ne veulent pas filmer vos vacances, elles veulent coder
27Le Big Data 

Monako : Ces lunettes connectées ne veulent pas filmer vos vacances, elles veulent coder

La startup Monako a annoncé des lunettes connectées baptisées Monako Glass, pensées non pas pour le grand public mais spécifiquement pour les développeurs qui travaillent avec des agents de codage comme Claude Code ou OpenAI Codex. Le produit, annoncé le 2 juin 2026 via un tweet de la cofondatrice Candy Liu, se présente comme un ordinateur Linux miniature intégré dans une monture de 48 grammes, compatible avec des verres correcteurs. Le principe : lancer une session de développement sur un ordinateur portable, la transférer vers les lunettes sans interrompre le travail en cours, et laisser l'agent IA continuer à opérer pendant que la caméra intégrée lui fournit du contexte visuel sur l'environnement réel. Une précommande est ouverte à 19 dollars, positionnée davantage comme un ticket d'intérêt que comme une commande ferme, la vidéo complète de présentation n'ayant pas encore été publiée. L'enjeu concret est réel : lorsqu'un agent IA travaille sur une tâche longue, fermer son ordinateur pour se déplacer ou assister à une réunion interrompt brutalement le flux de travail. Ces lunettes promettent une continuité entre le bureau, un atelier, un trajet ou une réunion, en gardant l'agent actif et visible dans le champ de vision. Pour les développeurs qui intègrent de plus en plus ces outils dans leur quotidien, la proposition a du sens. Le poids annoncé de 48 grammes rapproche le produit d'une monture classique, ce qui distingue Monako des tentatives précédentes de lunettes connectées souvent abandonnées après quelques semaines d'usage à cause de leur inconfort. Monako arrive dans un contexte où les agents de programmation autonomes se multiplient et gagnent en sophistication, portés par des modèles comme GPT-4o et Claude 3. L'idée de déporter ces agents sur un dispositif portable s'inscrit dans une tendance plus large : reconfigurer l'ordinateur non plus comme une machine fixe mais comme un assistant intégré au corps et au regard. Pourtant, les questions décisives restent sans réponse : autonomie de la batterie, qualité d'affichage, latence, confidentialité de la caméra, et sécurité des sessions de code potentiellement sensibles. Ces détails séparent une vraie innovation d'un prototype convaincant sur papier. L'histoire des lunettes connectées, des Google Glass aux modèles plus récents, rappelle que le fossé entre la démonstration et l'usage quotidien reste difficile à franchir. Monako a l'avantage d'un positionnement ciblé et crédible, mais devra démontrer que son Linux embarqué tient ses promesses dans des conditions réelles avant de convaincre les développeurs de coder le nez dans leurs verres.

OutilsOutil
1 source
Simplifier les enquêtes de satisfaction des employés avec l'application Google Gemini
28The Information AI 

Simplifier les enquêtes de satisfaction des employés avec l'application Google Gemini

Les équipes RH des grandes entreprises passent parfois des semaines à construire leurs enquêtes de satisfaction interne, puis des semaines supplémentaires à dépouiller manuellement les résultats. Google propose désormais un guide pratique pour intégrer Gemini dans ce processus en quatre étapes : conception des questions, révision avant diffusion, nettoyage automatisé des données brutes, puis analyse des tendances. Concrètement, un responsable RH peut soumettre à Gemini un simple prompt, "génère une liste de questions pour notre enquête d'engagement à l'échelle de l'entreprise", et obtenir en quelques secondes un premier brouillon exploitable, qu'il peut affiner en dialoguant avec l'outil. Le système accepte également l'import de sondages passés pour en reproduire le ton et identifier les priorités déjà établies. Une fois les réponses collectées, Gemini peut nettoyer un tableur en une seule instruction : remplacer les noms manquants par "Anonyme", harmoniser les labels géographiques, supprimer les lignes incomplètes, et exporter un fichier propre prêt à l'analyse. L'enjeu est de réduire drastiquement le délai entre la collecte du feedback et la prise de décision concrète. Dans les cycles traditionnels, le nettoyage et l'analyse des données représentent une part disproportionnée du temps total, au détriment de l'action. En automatisant les tâches répétitives, reformatage, standardisation, détection de tendances dans les verbatims, Gemini permet aux équipes RH de se concentrer sur l'interprétation et les décisions managériales. Pour les organisations de taille importante, où une enquête annuelle peut générer des milliers de réponses libres difficiles à traiter, ce gain de temps n'est pas marginal : il détermine souvent si les insights arrivent à temps pour influencer les cycles budgétaires ou les réorganisations en cours. Ce guide s'inscrit dans la stratégie de Google visant à imposer Gemini comme assistant de productivité dans les environnements professionnels, en concurrence directe avec Microsoft Copilot, désormais intégré à la suite Microsoft 365. La bataille se joue précisément sur ce terrain des usages RH et opérationnels, où les gains de temps sont mesurables et les arguments commerciaux faciles à défendre auprès des directions. Google prend soin de préciser que Gemini ne remplace pas l'expertise humaine, le concept de "human-in-the-loop" est explicitement mentionné, ce qui reflète aussi une posture défensive face aux critiques sur l'automatisation excessive des processus sensibles. Les prochaines étapes probables incluent une intégration plus profonde avec Google Workspace Forms et Sheets, pour que l'ensemble du cycle enquête se déroule sans quitter l'écosystème Google.

OutilsOutil
1 source
Les conséquences imprévues du retour de Codex
29The Information AI 

Les conséquences imprévues du retour de Codex

Le retour de Codex, l'agent de codage d'OpenAI, provoque des effets inattendus au sein même de l'entreprise. Repositionné comme outil polyvalent pour les travailleurs de la connaissance, Codex connaît un regain d'intérêt notable depuis plusieurs semaines, comme l'a souligné mardi Denise Dresser, directrice des revenus d'OpenAI. De nombreux développeurs migrent depuis Claude Code d'Anthropic vers Codex, qu'OpenAI a rendu plus performant sur des tâches longues et complexes. Mais c'est en interne que l'impact se mesure le plus : les ingénieurs d'OpenAI sont passés de deux ou trois modifications de code par jour à plus de dix, selon deux personnes proches du dossier. Cette explosion de productivité a rapidement saturé les systèmes internes gérant la vaste base de code de l'entreprise, provoquant des pannes. Chaque modification déclenche en effet des milliers d'heures de tests automatisés exécutés en parallèle sur de nombreuses machines, destinés à vérifier que le code fonctionne correctement et ne contient ni bug ni faille de sécurité. Multiplier par cinq le volume quotidien de commits a surchargé une infrastructure de validation qui n'était pas dimensionnée pour absorber ce rythme. C'est un paradoxe révélateur : l'outil censé accélérer le développement finit par bloquer la livraison. Cet épisode illustre un défi structurel que l'ensemble de l'industrie tech va devoir affronter à mesure que les agents de codage s'imposent dans les workflows professionnels. Les pipelines CI/CD, les systèmes de revue de code et les infrastructures de test ont été conçus pour un rythme humain. Avec des agents capables de multiplier la cadence de production, c'est toute la chaîne d'intégration qui devient un goulot d'étranglement. OpenAI se retrouve ainsi en première ligne d'un problème d'échelle que ses propres outils ont créé, et dont la résolution conditionnera l'adoption large des agents autonomes dans les grandes organisations.

OutilsOpinion
1 source
Déployer l’IA dans le secteur financier : premiers pas et écueils à éviter
30FrenchWeb 

Déployer l’IA dans le secteur financier : premiers pas et écueils à éviter

L'adoption de l'intelligence artificielle dans le secteur financier s'accélère, mais les équipes qui se lancent sans méthode se heurtent rapidement à des obstacles coûteux. Selon un guide pratique publié sur FW.MEDIA, la clé du succès réside dans la sélection rigoureuse des cas d'usage initiaux : il vaut mieux cibler un ou deux chantiers à fort impact, capables de produire des résultats concrets dès les premières semaines, plutôt que de vouloir tout automatiser d'un coup. L'objectif est de soulager rapidement les équipes opérationnelles sur des tâches répétitives, et ainsi démontrer la valeur de l'IA en interne avant d'aller plus loin. L'un des enseignements majeurs de ces déploiements est que les choix d'infrastructure pèsent bien davantage que la liste des fonctionnalités IA retenues. Un système fragmenté, où les données financières sont dispersées dans des silos déconnectés, bride mécaniquement les capacités de tout modèle, aussi performant soit-il. C'est précisément le problème qu'Airwallex cherche à adresser en réunissant paiements, gestion des dépenses et opérations financières sur une plateforme unique, offrant ainsi à l'IA un socle de données cohérent pour fonctionner efficacement. Le secteur financier est sous pression croissante pour moderniser ses opérations face à la concurrence des fintechs et aux attentes réglementaires. Mais la transformation IA y est particulièrement délicate : les enjeux de conformité, de sécurité des données et de fiabilité des décisions automatisées sont considérables. Les acteurs qui réussissent sont ceux qui traitent l'IA comme un projet d'infrastructure à long terme, et non comme un simple ajout de fonctionnalités sur des systèmes existants vieillissants.

UELe cadre réglementaire européen (DORA, AI Act) renforce la pertinence de ces recommandations pour les établissements financiers français et européens cherchant à déployer l'IA de manière conforme.

OutilsOutil
1 source
Un badge d’accès dopé à l’IA : le gadget de Microsoft qui voit, écoute et accompagne les salariés
31Le Big Data 

Un badge d’accès dopé à l’IA : le gadget de Microsoft qui voit, écoute et accompagne les salariés

Microsoft a présenté lors de sa conférence Build un prototype de badge d'entreprise dopé à l'intelligence artificielle, baptisé Project Solara. Cet objet, conçu comme un compagnon de terrain connecté à Copilot, embarque un écran tactile, une caméra latérale, un microphone, un capteur d'empreintes digitales, du Wi-Fi et de la 5G. Steven Bathiche, expert technique chez Microsoft, a démontré sur scène comment demander à Copilot de repérer des prises de vue, de les retoucher et de les envoyer directement à une équipe. Un second prototype, lui destiné à rester sur un bureau, intègre des capteurs de présence à ultra-large bande capables de détecter l'approche de l'utilisateur, et se synchronise avec le PC principal via Bluetooth pour permettre de basculer des tâches entre les deux appareils. L'ambition de Microsoft est claire : faire sortir ses agents d'IA des interfaces logicielles pour les ancrer dans le monde physique, doté d'yeux, d'oreilles et d'une connexion permanente. La cible prioritaire n'est pas le cadre devant son écran, mais les travailleurs de première ligne, infirmières, employés de magasin, techniciens de terrain, pour qui un assistant capable de lire une scène en temps réel représente un gain concret. Le badge tire sa force du format lui-même : c'est un objet déjà accepté, voire ignoré, dans la plupart des organisations, ce qui facilite son adoption. Mais cette même discrétion soulève des questions immédiates sur la vie privée : un badge avec caméra et micro porté en permanence au travail franchit rapidement la ligne entre outil d'assistance et dispositif de surveillance. Cette annonce s'inscrit dans une stratégie plus large que Microsoft déploie depuis plusieurs années : après les PC Copilot, les agents logiciels autonomes et l'intégration de l'IA dans Microsoft 365, l'entreprise cherche à coloniser tous les points de contact du quotidien professionnel. Le mouvement n'est pas isolé, lunettes connectées, pendentifs IA et autres wearables fleurissent chez des concurrents comme Meta ou des startups spécialisées. Microsoft mise ici sur le monde de l'entreprise plutôt que sur le grand public, avec des secteurs comme la santé ou la distribution en ligne de mire. Le projet reste à ce stade un concept sans date de commercialisation annoncée, mais il signale une direction : si les agents d'IA doivent devenir vraiment utiles hors des bureaux, ils auront besoin d'un support physique. Microsoft parie que ce support pourrait se porter autour du cou.

UELe port permanent d'un badge caméra-micro en entreprise se heurterait directement au RGPD et au droit du travail français, qui encadrent strictement la surveillance des salariés et imposent un consentement explicite pour toute collecte de données biométriques ou audio sur le lieu de travail.

OutilsOutil
1 source
OpenAI transforme Codex en assistant IA pour les employés de bureau
32Le Big Data 

OpenAI transforme Codex en assistant IA pour les employés de bureau

OpenAI a annoncé le 2 juin 2026 une refonte majeure de Codex, son assistant IA jusqu'ici centré sur le développement logiciel, pour l'étendre aux métiers de bureau. La plateforme comptabilise désormais plus de 5 millions d'utilisateurs actifs hebdomadaires, soit six fois plus qu'en février lors du lancement de son application desktop. Si les développeurs restent majoritaires, les travailleurs du savoir représentent déjà près de 20 % de la base d'utilisateurs et affichent une croissance trois fois plus rapide. OpenAI introduit six modules métier spécialisés couvrant l'analyse de données, la création de contenu, la vente, le design produit, l'investissement en actions et la banque d'investissement. Une fonctionnalité baptisée Sites permet désormais de publier les résultats générés sous forme de sites web interactifs hébergés dans le cloud, en s'appuyant sur des partenaires comme Wix, Replit, Figma et Lovable. Des annotations contextuelles permettent aussi aux utilisateurs de cibler précisément une zone d'un document pour des commandes plus précises. Ces évolutions traduisent une bascule stratégique pour OpenAI : ne plus se limiter à l'outillage des développeurs, mais s'imposer comme fournisseur d'infrastructure IA pour l'ensemble des fonctions d'une entreprise. En intégrant directement des logiques opérationnelles métier dans Codex, OpenAI cherche à réduire la friction d'adoption pour des profils non techniques, rendant l'outil exploitable sans configuration avancée. L'enjeu est considérable : si les travailleurs du savoir maintiennent leur rythme de croissance, ils pourraient représenter la majorité des utilisateurs dans moins d'un an, transformant Codex en plateforme de productivité de masse plutôt qu'en simple assistant de programmation. Cette offensive sur le marché entreprise s'inscrit dans un contexte de compétition accrue. Anthropic multiplie depuis plusieurs mois les agents IA spécialisés pour les organisations, tandis que Microsoft intègre Copilot dans toute sa suite Office. OpenAI capitalise ici sur sa base grand public pour accélérer l'adoption professionnelle, une approche bottom-up qui contraste avec les déploiements top-down habituels du secteur B2B. Trois semaines avant cette annonce, la société avait lancé OpenAI Deployment Company, une coentreprise dédiée aux clients entreprises adossée à plus de 4 milliards de dollars. La convergence de ces deux initiatives dessine une ambition claire : faire de Codex le système d'exploitation IA des entreprises, en rivalisant directement avec Salesforce, ServiceNow et les suites Microsoft 365 sur leur propre terrain.

UEL'expansion de Codex aux métiers de bureau intensifie la concurrence sur le marché européen des outils de productivité IA, où les entreprises françaises devront arbitrer entre cette plateforme et les suites déjà déployées comme Microsoft 365 Copilot.

💬 Codex qui lâche les développeurs pour aller chercher les commerciaux et les banquiers d'investissement, c'est un pivot net. La vraie lecture c'est qu'OpenAI veut rejouer le coup de Salesforce sur son propre terrain, avec une base de 5 millions d'utilisateurs déjà acquis et une approche bottom-up qui court-circuite les cycles de vente à 18 mois. Reste à voir si les modules métier tiennent en prod.

OutilsOutil
1 source
Comment choisir son assistant IA pour maximiser la productivité des développeurs
33InfoQ AI 

Comment choisir son assistant IA pour maximiser la productivité des développeurs

Sepehr Khosravi, ingénieur senior, a présenté une analyse comparative des outils d'assistance à la programmation basés sur l'intelligence artificielle, en se concentrant notamment sur Cursor et Claude Code. Sa présentation explore des techniques concrètes destinées aux développeurs expérimentés : l'ingénierie de contexte, la définition de règles personnalisées, et les intégrations via le protocole MCP (Model Context Protocol). Il s'appuie sur des benchmarks issus de situations réelles pour évaluer les forces et limites respectives de ces outils. L'enjeu est de taille pour les équipes de développement : ces copilotes IA promettent des gains de productivité significatifs, mais leur adoption non maîtrisée peut mener à une dégradation de la qualité du code. Khosravi propose un cadre stratégique permettant aux ingénieurs de tirer parti de ces outils sans sacrifier la lisibilité, la maintenabilité ou les standards de leur base de code. La question n'est plus de savoir si adopter ces assistants, mais comment le faire intelligemment. Cette réflexion s'inscrit dans un marché des copilotes IA en pleine ébullition, où GitHub Copilot, Cursor, Claude Code et d'autres outils se disputent l'adoption des développeurs professionnels. L'émergence du protocole MCP, porté notamment par Anthropic, ouvre de nouvelles possibilités d'intégration entre les LLM et les environnements de développement. Les choix faits aujourd'hui par les équipes techniques auront des conséquences durables sur leurs pratiques et leur architecture logicielle.

OutilsOutil
1 source
Snowflake lance Horizon Catalog pour sécuriser l’IA générative en entreprise
34Le Big Data 

Snowflake lance Horizon Catalog pour sécuriser l’IA générative en entreprise

Au Snowflake Summit 2026, tenu à San Francisco début juin, l'éditeur américain Snowflake a présenté Horizon Catalog, une plateforme unifiée conçue pour encadrer le déploiement de l'IA générative en entreprise. La nouveauté phare est Horizon Context, une couche sémantique centralisée qui standardise le contexte métier, données financières, commerciales, opérationnelles, pour garantir que chaque application, utilisateur ou agent IA s'appuie sur une définition commune des indicateurs clés. Le gestionnaire d'actifs BlackRock figure parmi les premiers clients à avoir adopté la solution, pour assurer la cohérence de ses analyses IA à travers ses environnements de données mondiaux. Snowflake complète l'offre avec Semantic Studio et Semantic View Autopilot, des outils qui automatisent la création et la maintenance de vues sémantiques cohérentes, sans exiger de solide expertise SQL. L'enjeu dépasse la simple organisation des données : selon les chiffres avancés par Snowflake, près des deux tiers des organisations citent aujourd'hui la cybersécurité comme le principal frein au déploiement à grande échelle de l'IA générative. Les agents autonomes capables d'accéder à des données sensibles, d'exécuter des actions métier et d'interagir avec plusieurs systèmes internes en même temps exposent des surfaces d'attaque que les modèles de sécurité traditionnels, conçus pour des utilisateurs humains, ne couvrent pas. Snowflake répond avec Agent Identity, un mécanisme qui attribue une identité vérifiée à chaque agent avant tout accès aux données, permettant de tracer, auditer et gouverner chaque action selon des règles définies. Des dispositifs de détection proactive contre les tentatives de jailbreak et autres attaques visant les modèles IA viennent compléter ce cadre. La sortie d'Horizon Catalog s'inscrit dans une compétition intense entre les grandes plateformes de données pour capter les budgets IA des entreprises. Snowflake, historiquement positionné sur l'entrepôt de données cloud, se repositionne comme couche d'infrastructure de confiance pour l'IA, un terrain où il affronte directement Databricks, Microsoft Fabric et Google BigQuery. La promesse d'une "vérité d'entreprise" unifiée répond à un problème concret : dans de nombreuses organisations, les mêmes métriques produisent des chiffres différents selon les outils, ce qui rend les recommandations des agents IA peu fiables, voire contradictoires. En automatisant la gouvernance sémantique et en sécurisant les identités des agents, Snowflake cherche à transformer ce point de friction en argument commercial différenciant, alors que les entreprises passent de l'expérimentation IA à des déploiements en production à grande échelle.

UELes entreprises européennes déployant des agents IA en production pourraient s'appuyer sur ces mécanismes de gouvernance sémantique et d'identité des agents pour répondre aux exigences de conformité RGPD et de l'AI Act.

💬 Le problème ciblé ici, c'est pas du marketing : dans beaucoup d'organisations, la même métrique donne des chiffres différents selon l'outil, et ça rend les agents IA peu crédibles en prod. La partie Agent Identity m'intéresse davantage que la couche sémantique, parce qu'on allait droit dans le mur côté traçabilité avec des agents autonomes qui trifouillent les données sans laisser de traces auditables. BlackRock comme client de référence, c'est bien, mais reste à voir si ça tient quand c'est pas une multinationale avec 50 ingénieurs data pour piloter le déploiement.

OutilsActu
1 source
Nous Research publie Hermes Desktop : une interface native multiplateforme pour Hermes Agent v0.15.2 avec sortie en streaming
35MarkTechPost 

Nous Research publie Hermes Desktop : une interface native multiplateforme pour Hermes Agent v0.15.2 avec sortie en streaming

Nous Research a lancé en prévisualisation publique Hermes Desktop, une application native disponible sur macOS, Windows et Linux, qui offre pour la première fois une interface graphique à son agent IA open source Hermes. Jusqu'ici limité à une interface en ligne de commande et à des passerelles de messagerie, Hermes Agent v0.15.2 dispose désormais d'une fenêtre native avec affichage en streaming des réponses, prévisualisation en temps réel des pages web, fichiers et sorties d'outils, un navigateur de fichiers, ainsi que des entrées et sorties vocales. L'application partage entièrement son cœur avec le CLI existant : configuration, clés API, sessions, compétences et mémoire sont communs à toutes les surfaces. Une conversation démarrée dans le bureau peut reprendre dans le terminal, et inversement, sans duplication d'état. Hermes Desktop a été démontré pour la première fois lors du keynote GTC de Jensen Huang avant d'être rendu disponible le 2 juin 2026. Ce lancement marque une étape importante dans l'accessibilité des agents IA autonomes pour le grand public. Hermes n'est pas un simple assistant de chat : c'est un agent qui planifie, exécute des actions et maintient un état persistant entre les sessions. La boucle d'apprentissage fermée le distingue des outils classiques : après une tâche complexe, l'agent génère des compétences réutilisables qui s'améliorent d'elles-mêmes lors des usages ultérieurs. La mémoire est gérée par l'agent lui-même, avec rappel inter-sessions via recherche FTS5 et résumé par LLM. En supprimant le prérequis du terminal, Nous Research ouvre Hermes à une population bien plus large d'utilisateurs non techniques, ce qui pourrait accélérer l'adoption des agents IA dans des flux de travail professionnels quotidiens. Nous Research s'inscrit dans une compétition croissante autour des agents IA autonomes et multiplateformes, face à des acteurs comme Anthropic avec Claude Code ou OpenAI avec ses capacités agentiques. Hermes se connecte à Telegram, Discord, Slack, WhatsApp, Signal, Email et CLI depuis une seule passerelle, avec un planificateur cron intégré et une délégation à des sous-agents isolés. L'exécution est sandboxée via cinq backends : local, Docker, SSH, Singularity et Modal. L'interopérabilité avec le Model Context Protocol (MCP) permet d'intégrer des outils externes. Pour les API, Nous Portal propose quatre niveaux d'abonnement (Free, Plus, Super, Ultra) donnant accès à plus de 300 modèles et à un Tool Gateway unifié qui route la recherche web via Firecrawl, la génération d'images via FAL et la synthèse vocale via OpenAI. Les prochaines questions porteront sur la stabilité hors prévisualisation et sur la capacité de la startup à tenir face aux ressources des géants du secteur.

OutilsOutil
1 source
Pour contrer le scraping des IA, Strava verrouille les accès à son API
36Next INpact 

Pour contrer le scraping des IA, Strava verrouille les accès à son API

Strava impose désormais son abonnement payant à 9,99 euros par mois comme condition d'accès à son API pour tout nouveau développeur. La plateforme de suivi sportif, qui comptait 185 000 développeurs l'an dernier et en dénombre aujourd'hui 241 000, a annoncé cette semaine une refonte complète de son programme développeur. Les inscrits actuels sans abonnement disposeront d'un délai de 90 jours à compter du 30 juin pour se conformer aux nouvelles règles. Au 1er septembre, Strava supprimera également des points d'accès API historiques, notamment ceux permettant de récupérer des données sur les clubs sportifs, au motif que "le niveau d'engagement de la communauté ne justifie plus les ressources nécessaires à leur maintenance". Par ailleurs, les profils publics et certaines données communautaires, jusqu'ici accessibles sans authentification, nécessiteront désormais un compte développeur. Ces mesures répondent à une dégradation concrète des performances de la plateforme causée par des abus massifs. Strava signale une hausse de 448% des candidatures à son programme développeur depuis janvier, des intermédiaires API ayant enfreint ses conditions d'utilisation, et des robots d'IA qui "détournent" l'interface de programmation pour constituer des jeux de données d'entraînement. Les outils de vibe-coding, qui génèrent automatiquement des applications sollicitant l'API à grande échelle, aggravent la situation. Ces pratiques pénalisent les 241 000 développeurs légitimes dont les applications, souvent centrées sur l'analyse de performances sportives, dépendent de la disponibilité et de la rapidité de l'API. Pour encadrer les usages IA sans les interdire, Strava adopte également le protocole MCP (Model Context Protocol), standard permettant aux assistants IA d'accéder à des données de façon structurée et contrôlée. Le contexte n'est pas anodin : Strava a déposé un dossier d'introduction en bourse début février, et la protection de ses données constitue un argument fort auprès des investisseurs. La plateforme cherche un équilibre difficile là où Reddit a échoué, en ayant fait grimper le prix de son API au point d'anéantir quasiment l'ensemble des applications tierces. Michael Martin, directeur général de Strava, revendique une approche différente : "Nous voulons que les utilisateurs gardent la maîtrise de leurs données, mais nous souhaitons également que l'écosystème de développeurs continue de prospérer." La décision s'inscrit dans un mouvement plus large où les plateformes détentrices de données propriétaires, de Reddit à Twitter en passant par Strava, reprennent le contrôle face à un secteur IA qui s'est longtemps comporté comme si les règles habituelles du web ne le concernaient pas.

UELes développeurs européens utilisant l'API Strava pour des applications de suivi sportif devront souscrire un abonnement à 9,99 €/mois avant fin septembre 2026, sous peine de perdre l'accès à leur infrastructure de données.

OutilsOpinion
1 source
Traduction vocale et B2B : les chiffres à retenir de l’étude DeepL
37Le Big Data 

Traduction vocale et B2B : les chiffres à retenir de l’étude DeepL

DeepL a publié les résultats d'une étude menée auprès de 1 021 actifs du secteur tertiaire en France, portant sur l'usage des outils d'IA linguistique en milieu professionnel. Les données révèlent un taux d'adhésion élevé : 89 % des utilisateurs constatent un effet positif sur leur communication professionnelle, 52 % estiment que ces outils ont contribué à leur évolution de carrière, et 59 % mentionnent l'émergence de nouvelles opportunités commerciales à l'international. L'étude pointe également vers la prochaine frontière du secteur : 93 % des répondants identifient un intérêt professionnel concret à la traduction vocale en temps réel, notamment pour les visioconférences, les rendez-vous commerciaux et les réunions multilingues. Dans ce contexte, DeepL a lancé sa suite Voice-to-Voice, avec des intégrations natives pour Zoom et Microsoft Teams ainsi que des API permettant d'embarquer la traduction vocale directement dans les applications métiers. L'enjeu dépasse la simple traduction de mots : c'est la charge cognitive des échanges multilingues que ces outils cherchent à éliminer. Parler dans une langue étrangère mobilise une partie de l'attention qui devrait être consacrée au fond de la discussion. Une solution de traduction vocale instantanée permettrait aux professionnels de se concentrer sur le contenu plutôt que sur la formulation, réduisant la pression psychologique des négociations ou présentations en langue étrangère. Pour les entreprises opérant à l'international, cela représente un avantage compétitif mesurable : fluidifier les échanges avec des partenaires, clients ou équipes étrangères sans dépendre de la maîtrise linguistique individuelle des collaborateurs. DeepL s'impose sur un marché de la traduction professionnelle en pleine consolidation, face à des acteurs comme Google Translate, Microsoft Translator ou des startups spécialisées. La société allemande a bâti sa réputation sur la qualité linguistique, notamment sa capacité à restituer les nuances et le registre des textes, ce qui lui permet de cibler les entreprises exigeantes plutôt que le grand public. L'étude, basée sur un communiqué de presse, sert clairement à légitimer le lancement de la suite Voice-to-Voice, mais les chiffres reflètent une tendance réelle : les entreprises ne cherchent plus seulement à traduire des documents, elles veulent rendre la communication orale internationale aussi naturelle qu'un échange en langue maternelle. Les freins identifiés, qualité des traductions, protection des données, confidentialité des conversations vocales, dessinent précisément les critères sur lesquels se jouera la bataille commerciale dans les prochains mois.

UEDeepL, entreprise allemande, cible directement le marché professionnel français et européen avec sa suite Voice-to-Voice intégrée à Zoom et Teams, offrant aux entreprises de l'UE un levier concret pour fluidifier leurs échanges commerciaux internationaux multilingues.

OutilsOutil
1 source
Solara : Microsoft lance son propre système d’exploitation pour l’IA
38Le Big Data 

Solara : Microsoft lance son propre système d’exploitation pour l’IA

Le 2 juin 2026, lors de sa conférence Build, Microsoft a dévoilé Solara, une nouvelle plateforme logicielle conçue spécifiquement pour alimenter une catégorie émergente d'appareils centrés sur l'intelligence artificielle. Contrairement à ce que l'on pourrait attendre du géant de Redmond, Solara ne repose pas sur Windows mais sur Android, choix délibéré pour s'adapter aux contraintes matérielles des appareils compacts et peu énergivores. Pour illustrer le concept, Microsoft a présenté deux prototypes : un écran connecté comparable à un Amazon Echo Show, équipé de reconnaissance faciale pour accéder à différents agents IA, et un badge portable intégrant caméra, lecteur d'empreintes et transcription en temps réel, activable d'une simple pression pour donner à l'agent la capacité de voir, d'entendre et de comprendre l'utilisateur. Ces deux dispositifs ne seront pas commercialisés directement par Microsoft, mais serviront de modèles de référence pour les fabricants tiers. L'enjeu de Solara dépasse la simple annonce produit : Microsoft tente de définir les règles d'une nouvelle catégorie d'appareils, celle des gadgets IA autonomes, dont l'industrie technologique parle depuis des années sans avoir trouvé de formule viable. En positionnant Solara comme une plateforme pensée "dès le départ" pour des agents intelligents, l'entreprise cherche à répliquer ce que Google a accompli avec Android dans le mobile : imposer un socle commun que les fabricants adoptent massivement. Des partenaires comme AccuWeather, Best Buy, CVS Healthcare et Target participent déjà à des programmes pilotes, ce qui suggère un intérêt réel du côté des entreprises prêtes à intégrer ces interfaces dans leurs environnements professionnels et commerciaux. Le choix d'Android révèle une inflexion culturelle significative chez Microsoft, qui reconnaît implicitement que Windows n'est plus la réponse universelle à tous les usages. Depuis l'explosion des grands modèles de langage en 2022-2023, l'industrie cherche le facteur de forme idéal pour les agents IA : ni smartphone, ni ordinateur classique, mais un objet intermédiaire, permanent et contextuel. Microsoft, qui a massivement investi dans OpenAI et intégré Copilot dans l'ensemble de sa suite logicielle, cherche maintenant à étendre son influence jusqu'à la couche matérielle. Solara reste toutefois à un stade précoce de développement, et le succès du projet dépendra de la capacité des fabricants partenaires à produire des appareils convaincants, accessibles et suffisamment utiles pour justifier une adoption à grande échelle.

UESi Solara s'impose comme standard de référence, les fabricants d'appareils européens pourraient être amenés à l'adopter, mais aucun partenaire ni enjeu réglementaire européen n'est mentionné à ce stade.

OutilsOpinion
1 source
Les leaders du logiciel industriel créent des ingénieurs IA autonomes et sécurisés avec NVIDIA NIM
39NVIDIA AI Blog 

Les leaders du logiciel industriel créent des ingénieurs IA autonomes et sécurisés avec NVIDIA NIM

NVIDIA a présenté cette semaine NemoClaw lors du GTC Taipei, en marge du salon COMPUTEX, en compagnie d'une douzaine de partenaires logiciels industriels. NemoClaw est un blueprint open source destiné à construire des agents IA autonomes, spécialisés et capables de fonctionner sur de longues durées. Il s'appuie sur OpenShell, un runtime sécurisé qui contrôle l'accès de chaque agent aux fichiers, réseaux et outils via des politiques de sécurité granulaires. La plateforme intègre un routeur de modèles, les bibliothèques NVIDIA NeMo, et supporte plusieurs frameworks d'orchestration comme OpenClaw et Hermes. Elle peut être déployée sur les DGX Spark, en datacenter d'entreprise ou dans le cloud. Cadence, Dassault Systèmes, Siemens et Synopsys figurent parmi les premiers à s'y appuyer pour construire leurs propres agents d'ingénierie. Cadence développe ainsi un agent RTL autonome capable d'orchestrer ChipStack pour la conception et la vérification de circuits numériques, réduisant le temps de vérification RTL de plusieurs semaines à quelques heures. Siemens intègre NemoClaw dans Fuse EDA AI Agent pour les workflows de conception de semi-conducteurs, circuits imprimés et circuits intégrés 3D. Synopsys, de son côté, démontre sur le show floor de COMPUTEX une application à l'optimisation thermique de systèmes de refroidissement GPU avec Ansys Icepak. L'enjeu industriel est considérable : si le calcul accéléré a déjà réduit les temps de simulation de plusieurs semaines à quelques heures, les workflows adjacents, conception assistée par ordinateur, maillage, configuration des simulations, post-traitement, rédaction de rapports, restaient encore largement manuels et chronophages. NemoClaw vise à automatiser cette chaîne complète. Pour les secteurs de l'automobile, de l'aérospatiale, des semi-conducteurs et de la fabrication, la promesse est une compression drastique des cycles de développement produit, avec des agents capables d'explorer des milliers de variantes de conception de manière autonome, de nuit comme de jour, là où une équipe d'ingénieurs aurait besoin de semaines. Au-delà des grands éditeurs, des startups s'emparent également de NemoClaw pour des cas d'usage pointus. Flexcompute utilise OpenShell pour ses agents Tidy3D et PhotonForge dédiés à la conception optique co-packagée, en combinant simulations optiques, électriques et thermiques pour explorer des milliers de variantes et produire des composants plus performants à moindre consommation énergétique, une technologie qu'NVIDIA utilise elle-même pour concevoir ses propres dispositifs photoniques. Luminary s'en sert pour automatiser la génération de données d'entraînement et les boucles d'apprentissage de modèles physiques IA. Neural Concept déploie un agent pour la conception de moteurs électriques enchaînant simulations électromagnétiques, structurelles et vibratoires. Cette mobilisation simultanée d'acteurs majeurs et de startups autour d'une même plateforme signale que NVIDIA cherche à imposer NemoClaw comme standard de facto de l'ingénierie autonome, à l'image de ce que CUDA a représenté pour le calcul GPU.

UEDassault Systèmes, entreprise française de référence dans la CAO industrielle (CATIA, SolidWorks), figure parmi les premiers partenaires de NemoClaw, ce qui pourrait accélérer l'adoption de l'ingénierie autonome dans les filières aérospatiale et automobile européennes.

OutilsActu
1 source
Dans les coulisses de la fusion de Codex et ChatGPT par OpenAI
40The Information AI 

Dans les coulisses de la fusion de Codex et ChatGPT par OpenAI

Au début de l'année 2025, après qu'Anthropic a lancé la préversion de son outil de programmation Claude Code, OpenAI a pris conscience qu'il s'était fait dépasser par son rival dans le domaine du code. La réaction a été rapide : l'entreprise a constitué une équipe dédiée, placée sous la direction de Thibault Sottiaux, avec pour mission de rattraper le retard et de développer des outils d'IA spécifiquement orientés vers la programmation. Dix-huit mois plus tard, ce travail a abouti à un constat inattendu : Codex, l'outil de codage d'OpenAI, surpasse ChatGPT sur de nombreuses tâches concrètes, notamment les missions longues et à plusieurs étapes, l'utilisation d'outils externes, ou encore la manipulation de feuilles de calcul complexes. Cette supériorité de Codex pose une question stratégique majeure pour OpenAI : pourquoi maintenir deux produits distincts quand l'un excelle là où l'autre montre ses limites ? La décision de fusionner Codex et ChatGPT vise à offrir une expérience unifiée, capable de basculer intelligemment entre raisonnement général et exécution technique de haut niveau, un atout déterminant pour les développeurs professionnels qui cherchent à automatiser des flux de travail entiers. Cette évolution s'inscrit dans une compétition féroce entre OpenAI et Anthropic pour la domination du marché des assistants de programmation. Claude Code a mis la pression sur tout le secteur, poussant OpenAI à repenser l'architecture même de ses produits. La consolidation de Codex dans ChatGPT pourrait redéfinir ce que les utilisateurs attendent d'un assistant IA polyvalent, à mesure que la frontière entre chatbot et agent autonome s'efface.

OutilsOpinion
1 source
Scout : le nouveau OpenClaw de Microsoft qui automatise tout
41Le Big Data 

Scout : le nouveau OpenClaw de Microsoft qui automatise tout

Microsoft a présenté Scout lors de sa conférence Build 2026, un nouvel assistant IA autonome intégré directement dans l'environnement Microsoft 365. Conçu pour aller bien au-delà du chatbot classique, Scout peut accéder aux e-mails, calendriers et services Microsoft afin d'exécuter des tâches automatiquement : organiser des réunions, préparer des ordres du jour, gérer des tâches administratives courantes. L'outil est actuellement disponible via le programme Frontier de Microsoft, mais nécessite un abonnement GitHub Copilot pour y accéder. Contrairement aux assistants ponctuels, Scout apprend les habitudes de travail de chaque utilisateur au fil du temps : il est personnalisable, peut recevoir un prénom choisi par l'utilisateur, et s'ajuste selon les retours réguliers qu'on lui transmet. Les utilisateurs pourront également créer leurs propres compétences et scénarios d'automatisation pour l'adapter à des besoins métier très spécifiques. L'enjeu pour Microsoft est considérable. Avec des centaines de millions de professionnels qui utilisent quotidiennement la suite Microsoft 365, intégrer un agent capable d'anticiper les besoins et d'agir sans attendre d'instruction représente un changement de paradigme dans la productivité au bureau. Ce n'est plus l'assistant qui répond aux questions, mais celui qui prend des initiatives : surveiller un calendrier surchargé, détecter un conflit de planning, préparer un briefing avant une réunion. Pour les entreprises, les gains de temps potentiels sont réels, mais la question du contrôle se pose immédiatement. Microsoft affirme avoir intégré plusieurs mécanismes de sécurité : un système de vérification continue du respect des règles définies par l'utilisateur et l'organisation, ainsi qu'un journal d'audit enregistrant chaque action significative. Plus un agent gagne en autonomie, plus les conséquences d'une erreur peuvent être lourdes, ce qui rend ces garde-fous essentiels à la crédibilité du produit. Scout s'inscrit dans une tendance de fond qui s'est accélérée depuis le début 2026, portée notamment par OpenClaw, le projet qui a popularisé l'idée d'agents IA agissant de manière vraiment autonome sans attendre d'instructions humaines explicites. Microsoft reprend explicitement cette architecture conceptuelle et l'adapte à son écosystème propriétaire, une stratégie déjà utilisée avec succès pour GitHub Copilot. La bataille dans l'industrie IA ne porte plus sur les chatbots les plus fluides, mais sur les agents les plus capables d'agir dans le monde réel. Google, Amazon et des dizaines de startups travaillent sur des approches similaires. Ce que Scout tente de résoudre, c'est le problème de la confiance : convaincre les utilisateurs professionnels de déléguer une partie de leur organisation quotidienne à un système automatisé, avec suffisamment de transparence et de contrôle pour que cette délégation soit acceptable.

UEL'intégration d'agents autonomes accédant aux e-mails et calendriers dans Microsoft 365, suite utilisée par des millions de professionnels européens, soulève des questions concrètes de conformité RGPD pour les entreprises françaises et européennes.

💬 C'est le genre de truc qu'on attendait depuis deux ans. Microsoft reprend l'idée des agents autonomes, l'ancre dans 365 où les données sont déjà là, et du coup ça tient mieux que les démos sur terminal vide qu'on nous sert depuis 2024. Reste que laisser un agent gérer tes mails et ton calendrier, ça demande un niveau de confiance que la plupart des boîtes françaises ne sont pas encore prêtes à accorder.

Perplexity AI présente son système d'inférence hybride local-cloud au Computex 2026
42VentureBeat AI 

Perplexity AI présente son système d'inférence hybride local-cloud au Computex 2026

Perplexity AI, la startup de recherche valorisée à 20 milliards de dollars, a présenté lundi soir au salon Computex 2026 ce qu'elle décrit comme le premier orchestrateur d'inférence hybride local-cloud du marché. Le PDG Aravind Srinivas a fait la démonstration en direct aux côtés de Lip-Bu Tan, directeur général d'Intel, lors du keynote de l'entreprise. Sur scène, le système traitait des documents financiers confidentiels en répartissant automatiquement les tâches: les informations sensibles restaient sur l'appareil, équipé d'un processeur Intel Core Ultra Série 3, tandis que les raisonnements complexes étaient envoyés vers des modèles cloud. La nouveauté n'est pas qu'un modèle tourne en local, mais que le système décide lui-même, en temps réel et en cours d'exécution, quelle partie de chaque tâche doit rester sur la machine et laquelle peut rejoindre le cloud. Selon la société, aucun produit n'avait jusqu'ici automatisé cette décision de routage. La fonctionnalité sera disponible dans les prochaines semaines. L'enjeu concret est celui de la confidentialité des données dans un contexte d'agents IA de plus en plus autonomes. En demandant une validation utilisateur avant d'envoyer des éléments sensibles vers le cloud, Perplexity répond directement aux inquiétudes des entreprises sur la gouvernance des données dans les systèmes agentiques. Pour les professionnels manipulant des informations médicales, juridiques ou financières, cette architecture permet de bénéficier de la puissance des grands modèles de langage comme Claude, Gemini ou GPT sans renoncer au contrôle sur les données les plus critiques. C'est un compromis que ni les solutions purement locales ni les agents entièrement cloud ne proposaient jusqu'ici. Cette annonce s'inscrit dans une trajectoire de produit accélérée depuis le début de l'année. Le 25 février, Perplexity lançait Computer, un agent multi-modèles orchestrant 19 modèles d'IA différents, entièrement dans le cloud. En mars, lors de sa conférence développeurs Ask 2026, la startup introduisait Personal Computer, une application Mac hybride capable d'accéder au système de fichiers local dans un environnement sécurisé et auditable. Le système présenté à Computex franchit une étape supplémentaire: l'orchestrateur raisonne désormais sur le lieu d'exécution de chaque fragment de tâche, pas seulement sur le choix du modèle. La démonstration intervient dans un contexte industriel particulièrement favorable, Computex 2026 étant dominé par le thème de l'IA embarquée: quelques heures plus tôt, Jensen Huang avait dévoilé le RTX Spark, une puce Arm Nvidia intégrant un GPU Blackwell avec 6 144 coeurs CUDA, 128 Go de mémoire LPDDR5X et une bande passante de 300 Go/s, conçue pour une nouvelle génération de PC nativement IA.

UELes entreprises européennes soumises au RGPD pourraient bénéficier directement de cette architecture hybride, qui permet de maintenir les données sensibles en local tout en accédant aux grands modèles cloud, répondant aux exigences de souveraineté et de gouvernance des données imposées par la réglementation européenne.

OutilsOpinion
1 source
OpenAI enrichit Codex avec des plugins spécialisés pour en faire une application grand public
43The Decoder 

OpenAI enrichit Codex avec des plugins spécialisés pour en faire une application grand public

OpenAI étend les capacités de Codex en y intégrant des plugins spécialisés selon les métiers, ciblant notamment l'analyse de données, les équipes commerciales et la banque d'investissement. L'outil, initialement conçu comme un assistant de programmation, compte désormais cinq millions d'utilisateurs hebdomadaires, dont un sur cinq n'est pas développeur. Ce segment non-technique connaît une croissance trois fois supérieure à celle de la base de développeurs traditionnelle. Ce basculement démographique révèle une ambition claire d'OpenAI : transformer Codex en application professionnelle généraliste, capable de s'intégrer dans des flux de travail très divers sans exiger de compétences techniques. Pour les entreprises, cela signifie que des équipes entières, des analystes financiers aux commerciaux, pourraient bientôt s'appuyer sur un outil de génération de code et d'automatisation sans passer par la case développement. L'enjeu est considérable : démocratiser l'automatisation au sein des organisations. Cette expansion s'inscrit dans une course plus large que se livrent les grandes plateformes d'IA pour capter le marché des outils de productivité professionnelle. Microsoft, Google et Salesforce investissent massivement dans des agents métiers similaires. OpenAI cherche à asseoir Codex comme une couche transversale dans les entreprises, bien au-delà de son positionnement initial d'IDE intelligent. L'ajout de plugins sectoriels est une réponse directe à la demande croissante d'automatisation sans code, un marché estimé à plusieurs dizaines de milliards de dollars dans les prochaines années.

UELes équipes professionnelles européennes (finance, analyse, commercial) pourraient adopter Codex comme couche d'automatisation sans code, dans un marché où Microsoft et Google proposent déjà des offres concurrentes bien implantées en Europe.

OutilsOutil
1 source
Sites : l’outil de Codex qui transforme vos idées en applications et sites web en un clic
44Le Big Data 

Sites : l’outil de Codex qui transforme vos idées en applications et sites web en un clic

OpenAI a annoncé le 2 juin 2026 une nouvelle fonctionnalité pour Codex baptisée Sites, qui permet de transformer une description textuelle en application web interactive hébergée en ligne. L'outil génère automatiquement des interfaces fonctionnelles, tableaux de bord de suivi de projet, planificateurs financiers, espaces collaboratifs, hubs de lancement produit, accessibles via une URL partageable. Sites est déployé en priorité sur les plans Business et Enterprise avant une ouverture plus large. La même annonce s'inscrit dans un rapport publié ce jour par OpenAI, révélant que Codex dépasse désormais 5 millions d'utilisateurs actifs par semaine, soit une croissance multipliée par six depuis le lancement de son application de bureau en février 2026. L'impact le plus significatif de Sites concerne l'élargissement du public capable de créer des outils numériques. Jusqu'ici, produire une application nécessitait un enchaînement d'étapes techniques, maquettage, développement, tests, intégration, souvent inaccessibles sans équipe dédiée. En automatisant ce processus par l'IA, OpenAI ouvre la création d'applications à des profils non techniques : analystes, designers, équipes marketing, responsables commerciaux. Ces professionnels représentent déjà une part importante de l'audience de Codex, qu'ils utilisent pour automatiser des tâches répétitives ou produire des contenus complexes. Sites prolonge cette logique en leur donnant accès à des livrables concrets et partageables, sans écrire une ligne de code. Cette annonce s'inscrit dans une tendance de fond où les grands acteurs de l'IA cherchent à capturer un marché bien au-delà des développeurs. Codex, lancé initialement comme assistant de programmation, s'est progressivement repositionné en outil de productivité généraliste pour les travailleurs du savoir. La concurrence dans ce segment est dense : des plateformes no-code comme Webflow ou Bubble, mais aussi des rivaux directs comme GitHub Copilot, Cursor ou encore Claude d'Anthropic. OpenAI mise sur l'intégration native de la génération de code et d'interface dans un seul workflow conversationnel pour se différencier. Reste que les questions de sécurité, de maintenance à long terme et de personnalisation avancée demeurent entières, des domaines où l'expertise humaine conserve sa valeur, et qui pourraient freiner l'adoption en entreprise pour des cas d'usage critiques.

UELes professionnels européens non-techniques, analystes, équipes marketing, responsables commerciaux, peuvent désormais créer et partager des applications web fonctionnelles sans compétences en développement, réduisant la dépendance aux équipes techniques pour des outils internes.

OutilsOutil
1 source
Les agents IA d'entreprise fragmentent les données : Microsoft répond avec Microsoft IQ et Rayfin
45VentureBeat AI 

Les agents IA d'entreprise fragmentent les données : Microsoft répond avec Microsoft IQ et Rayfin

Microsoft a présenté lors de sa conférence Build 2026 deux nouvelles solutions destinées à résoudre un problème croissant dans les entreprises : la prolifération des silos de données générés par les agents IA. La première, Microsoft IQ, étend Fabric IQ en une couche de contexte unifiée regroupant quatre sources d'information distinctes : Work IQ (emails, réunions, flux de travail internes), Foundry IQ (bases de connaissances et procédures institutionnelles), Fabric IQ (état opérationnel en temps réel via Fabric Real-Time Intelligence), et Web IQ (signaux en provenance du web public). La seconde, Rayfin, est un SDK et CLI open-source qui déploie les applications générées par des agents directement dans Microsoft Fabric, acheminant automatiquement leurs données vers Microsoft OneLake plutôt que vers des backends isolés. Ces annonces interviennent dans un contexte révélateur : selon le VB Pulse Q1 2026 RAG Infrastructure Market Tracker, la proportion d'organisations de plus de 100 employés utilisant une approche hybride de récupération d'information a triplé entre janvier et mars 2026, passant de 10,3 % à 33,3 %. L'enjeu est considérable pour les équipes techniques et les directions des systèmes d'information. Chaque nouvel agent IA déployé repart aujourd'hui de zéro, sans mémoire du fonctionnement de l'organisation, des règles métier applicables ou de l'emplacement des données. Microsoft IQ vise à éliminer ce problème en offrant un point d'accès unique à l'ensemble du contexte organisationnel, qu'un développeur peut connecter en une seule étape d'intégration. De son côté, Rayfin s'attaque à l'autre versant du problème : les outils de développement assistés par IA génèrent des applications à un rythme que les équipes data ne peuvent plus gouverner, chacune créant par défaut un nouveau silo. Microsoft positionne explicitement Rayfin contre Supabase et Neon, les backends compatibles Postgres que ces outils utilisent spontanément, en substituant à ces solutions une infrastructure soumise aux politiques de conformité de Fabric. Cette double offensive s'inscrit dans une compétition acharnée entre les grands acteurs des plateformes de données d'entreprise, tous engagés dans la même course vers une couche de contexte partagée pour agents. Amir Netz, directeur technique de Microsoft Fabric, résume l'ambition avec une métaphore : comme l'écran vert de Matrix construisait la réalité dans laquelle évoluaient les agents du film, la plateforme data doit désormais "créer la réalité pour les agents à partir des données". La relation entre Rayfin et Microsoft IQ est présentée comme bidirectionnelle : un agent construit une application en puisant dans l'ontologie organisationnelle, et les données produites par cette application viennent enrichir l'ontologie pour les agents suivants. Les ontologies de Fabric IQ sont attendues en disponibilité générale dans les prochains mois, et l'exécution réelle de cette vision reste encore à démontrer à l'échelle.

UELes entreprises européennes utilisant Microsoft Fabric devront évaluer la conformité de ces nouvelles architectures de données centralisées avec le RGPD avant tout déploiement à grande échelle.

OutilsOpinion
1 source
TinyFish lance BigSet : un système multi-agents open source qui construit des jeux de données structurés à partir de descriptions en langage naturel
46MarkTechPost 

TinyFish lance BigSet : un système multi-agents open source qui construit des jeux de données structurés à partir de descriptions en langage naturel

TinyFish vient de publier BigSet, un système multi-agents open source sous licence AGPL-3.0, conçu pour automatiser la construction de jeux de données structurés à partir du web en langage naturel. Le principe est simple : l'utilisateur décrit en une phrase les données qu'il souhaite obtenir, par exemple "les entreprises YC actuellement en train de recruter des ingénieurs, avec leur stade de financement, leur localisation et le nombre de postes ouverts", et BigSet se charge d'inférer le schéma, de collecter les données sur le web, de dédupliquer les résultats et d'exporter le tout en CSV ou XLSX. Le code source complet est disponible sur GitHub. La génération d'un dataset prend entre 2 et 5 minutes, le temps que les agents effectuent de vraies recherches web. Une fonctionnalité de rafraîchissement automatique permet de maintenir les données à jour selon une cadence paramétrable : 30 minutes, 6 heures, 12 heures, quotidienne ou hebdomadaire. L'architecture repose sur un pipeline en cinq étapes clairement séparées. Claude Sonnet 4.6, accessible via OpenRouter, intervient en premier pour inférer le schéma : noms de colonnes, types de données, clés primaires et sources potentielles, avant tout accès web. Un agent orchestrateur basé sur Qwen (qwen/qwen3.7-max, via OpenRouter) identifie ensuite les entités correspondant à la description. Des sous-agents sont alors déployés en parallèle, chacun responsable d'une seule ligne du tableau final, avec un budget plafonné à 6 appels d'outils. Chaque agent utilise TinyFish Fetch pour récupérer le contenu des pages, extrait les champs pertinents, puis insère la ligne avec une attribution de source traçable. La déduplication par clé primaire est appliquée avant l'export final. La stack technique s'appuie sur Next.js 16, React 19, Fastify, TypeScript, Convex pour la base de données, et Mastra pour l'orchestration des workflows IA. BigSet s'attaque à un problème persistant dans le travail avec les données web : la fragmentation du pipeline entre identification des sources, scraping, conception du schéma, déduplication et planification des mises à jour. Ces étapes restent manuelles et chronophages, que l'on construise un dataset ou cent. En abstrayant l'ensemble de cette chaîne derrière une description en langage naturel, TinyFish cible directement les analystes, journalistes de données, équipes produit et chercheurs qui ont besoin de tableaux structurés sans vouloir maintenir une infrastructure de scraping. Le système est auto-hébergé via Docker, ce qui répond aussi aux préoccupations de confidentialité des données. TinyFish, qui développe par ailleurs ses propres outils de recherche et de fetch web, positionne BigSet comme une couche d'abstraction entre un besoin en données et une table exploitable, dans un écosystème où les agents IA commencent à remplacer les pipelines ETL traditionnels.

OutilsOutil
1 source
Détection d'objets avec Amazon Nova 2 Lite
47AWS ML Blog 

Détection d'objets avec Amazon Nova 2 Lite

Amazon a intégré à son service Bedrock un nouveau modèle multimodal, Nova 2 Lite, capable de détecter des objets dans des images via de simples instructions en langage naturel. Concrètement, il suffit de spécifier les éléments à repérer, une "voiture", une "personne", un "défaut", et le modèle retourne les coordonnées précises de chaque objet sous forme de JSON structuré, avec des boîtes englobantes normalisées sur une échelle de 0 à 1 000. Le déploiement repose sur trois services AWS : Bedrock pour l'inférence, Lambda pour l'exécution serverless, et API Gateway pour exposer l'endpoint. Le coût est particulièrement bas : 0,0003 dollar pour mille tokens en entrée et 0,0025 dollar pour mille tokens en sortie, ce qui revient à environ 5,69 dollars pour 10 000 images. Une intégration complète prend entre 30 et 45 minutes, sans aucun entraînement de modèle nécessaire. L'intérêt principal est d'éliminer la barrière d'entrée de la vision par ordinateur traditionnelle. Jusqu'ici, mettre en place un système de détection d'objets exigeait des pipelines de données, une infrastructure d'entraînement, des ressources de calcul significatives et souvent une équipe dédiée de data scientists, un investissement prohibitif pour les petites structures. Nova 2 Lite rend cette capacité accessible à n'importe quel développeur Python maîtrisant boto3, sans expertise en machine learning. Les cas d'usage couverts sont concrets : contrôle qualité en fabrication pour repérer des défauts sur une chaîne de production, comptage de cultures en agriculture, suivi de colis en logistique. La précision repose sur le prompt engineering, la façon dont on formule la demande au modèle conditionne directement la qualité des détections. Cette annonce s'inscrit dans une tendance de fond : les grands modèles de fondation multimodaux absorbent progressivement des tâches qui relevaient auparavant de pipelines spécialisés entraînés sur mesure. Amazon positionne Nova 2 Lite comme une alternative crédible aux solutions de computer vision classiques comme AWS Rekognition ou des bibliothèques comme YOLO, en misant sur la flexibilité du langage naturel plutôt que sur des catégories prédéfinies. Le fait que les coordonnées soient retournées dans un format standardisé et que l'architecture soit entièrement serverless facilite l'intégration dans des workflows existants. La prochaine étape logique pour les équipes adoptant cette approche sera d'évaluer les limites de précision face à des cas complexes, occlusions, objets de petite taille, scènes encombrées, là où les modèles spécialisés conservent encore un avantage.

OutilsOutil
1 source
Le plan de GitHub pour les agents, par Kyle Daigle
48Latent Space 

Le plan de GitHub pour les agents, par Kyle Daigle

Kyle Daigle, directeur des opérations de GitHub, a accordé une longue interview au podcast AI Engineer World's Fair, enregistrée en marge de Microsoft Build, pour expliquer comment l'essor des agents de code transforme en profondeur la plateforme. Le chiffre clé de l'entretien : les contributions générées par des agents ont bondi de 1 400 % en 2026, une explosion qui se traduit concrètement par une multiplication massive des commits, des pull requests, des builds et des charges sur l'infrastructure GitHub, conçue à l'origine pour des développeurs humains travaillant à vitesse humaine. Face à cette pression, GitHub a connu des épisodes d'indisponibilité remarqués. Daigle détaille les outils que son équipe a déployés en interne : WorkIQ, des flux de travail Copilot intégrés dans Slack, Teams et l'e-mail, le protocole MCP, une nouvelle application de bureau Copilot, une interface CLI, et des agents cloud. Il décrit aussi sa propre routine du week-end, où il pilote jusqu'à quinze agents en parallèle pour préparer ses décisions stratégiques en consultant l'historique de contexte de l'entreprise. L'enjeu dépasse largement la fiabilité d'une plateforme : c'est la définition même du développeur et du logiciel qui est en train de changer. Quand n'importe quelle idée déclenche automatiquement un build, les systèmes CI/CD actuels atteignent leurs limites. Les mainteneurs de projets open source, eux, se retrouvent submergés de contributions automatiques de faible qualité, que Daigle qualifie de « slop forks ». GitHub doit donc inventer de nouveaux mécanismes de confiance, révision assistée par IA, système de parrainage, requêtes de prompt, pour préserver le contrat social qui a fait le succès de l'open source. Par ailleurs, Copilot n'est plus seulement un outil d'autocomplétion : il évolue vers un agent ambiant capable d'agir sur un contexte d'entreprise complet, ce qui redéfinit des fonctions comme celle de chef de cabinet ou d'analyste. GitHub aborde cette transition avec une histoire particulière : près de vingt ans de couches d'infrastructure accumulées, des webhooks aux Actions, en passant par le rachat de npm et l'intégration de Dependabot et de Semmle pour la sécurité de la chaîne d'approvisionnement. GitHub Actions, initialement pensé pour l'automatisation des workflows de développement, est devenu de facto une couche de calcul généraliste sur laquelle les agents s'appuient. Daigle reconnaît que cette évolution « casse » GitHub d'une façon inédite, mais il y voit aussi une opportunité : les anciens développeurs reconvertis dans le management pourraient avoir un avantage structurel dans cette ère où comprendre le code redevient une compétence décisionnelle clé. La prochaine étape, selon lui, est de faire en sorte que GitHub « agisse comme Kyle veut qu'il agisse », c'est-à-dire transformer la plateforme en système d'exploitation personnel pour agents.

UEL'essor des agents de code redéfinit les pratiques DevOps des équipes techniques européennes, qui devront adapter leurs workflows CI/CD et leur gouvernance des contributions open source face à la multiplication des commits automatisés.

OutilsOpinion
1 source
OpenAI met à jour Codex : les agents peuvent créer des espaces de travail interactifs via Sites et plugins par rôle
49VentureBeat AI 

OpenAI met à jour Codex : les agents peuvent créer des espaces de travail interactifs via Sites et plugins par rôle

OpenAI a annoncé mardi une mise à jour majeure de sa plateforme agentique Codex, avec l'introduction de plusieurs fonctionnalités destinées à conquérir le monde de l'entreprise : des plugins sectoriels, un outil d'édition ciblée baptisé "Annotations", et une fonctionnalité d'hébergement web rapide appelée "Sites". Cette évolution transforme délibérément Codex, jusqu'ici perçu comme un assistant spécialisé pour développeurs, en environnement de travail quotidien pour les professionnels non-techniques. Parmi les 5 millions d'utilisateurs hebdomadaires de la plateforme, les non-développeurs, analystes financiers, marketeurs, opérationnels, chercheurs, représentent désormais environ 20% de la base et adoptent l'outil trois fois plus vite que les ingénieurs traditionnels. La fonctionnalité Annotations résout un problème concret qui freinait l'adoption en entreprise : jusqu'ici, demander à l'IA de modifier un graphique ou un calcul dans un tableur forçait le modèle à réécrire l'intégralité du fichier, détruisant souvent la mise en forme et introduisant des erreurs. Annotations isole précisément le segment sélectionné par l'utilisateur, un bloc de cellules dans un modèle financier, par exemple, et exécute les modifications sans toucher aux formules, styles ou dépendances environnantes. En parallèle, OpenAI déploie six plugins métier qui agrègent 62 applications professionnelles et 110 compétences automatisées dès le départ : un plugin Data Analytics connecte Snowflake, Databricks et Tableau ; le plugin Creative Production intègre Figma, Canva et Shutterstock ; le plugin Sales synchronise Salesforce, HubSpot, Slack et Clay ; le plugin Finance bancaire agrège des flux institutionnels comme Moody's, FactSet, PitchBook et S&P pour automatiser la modélisation financière et la préparation de pitch books. Le calendrier de cette annonce n'est pas anodin : elle intervient précisément au moment où Microsoft, principal investisseur mais concurrent direct d'OpenAI, ouvre sa conférence annuelle Build à San Francisco, où plusieurs outils de productivité enterprise concurrents sont attendus. Elle suit aussi de près la progression rapide d'Anthropic sur ce même segment, via Claude et Claude Code, auprès des travailleurs du savoir. OpenAI cherche à positionner Codex comme la référence pour l'automatisation des tâches de col blanc, avant que le marché des agents IA d'entreprise ne se structure autour d'autres acteurs. La stratégie est claire : ne plus réserver l'IA agentique aux équipes techniques, mais en faire un couche opérationnelle transversale, accessible à chaque département sans intervention du service informatique.

UELes entreprises françaises et européennes peuvent désormais déployer Codex dans leurs workflows métier, finance, marketing, ventes, sans ressources techniques dédiées, ce qui accélère concrètement l'adoption de l'IA agentique dans les organisations non technologiques.

OutilsOutil
1 source
Baz améliore la précision de la revue de code par agents IA grâce à Amazon Bedrock AgentCore
50AWS ML Blog 

Baz améliore la précision de la revue de code par agents IA grâce à Amazon Bedrock AgentCore

Baz, une startup spécialisée dans l'automatisation des revues de code, a développé un agent IA capable de vérifier non seulement la qualité technique du code, mais aussi sa conformité aux spécifications produit et aux maquettes de design. Baptisé Spec Review Agent, ce système repose sur Amazon Bedrock et Amazon Bedrock AgentCore, les services d'IA managés d'AWS. Concrètement, l'agent s'active automatiquement à l'ouverture d'une pull request GitHub, interroge simultanément Figma pour récupérer les spécifications visuelles et Jira pour les exigences fonctionnelles, puis décompose l'ensemble en critères vérifiables. Il spawne ensuite des sous-agents parallèles, un par exigence, qui analysent le code source et interagissent avec l'environnement de prévisualisation via l'outil AgentCore Browser Tool, capable d'inspecter le DOM, de simuler des interactions utilisateur et de comparer visuellement l'interface rendue avec les maquettes Figma. L'enjeu est considérable pour les équipes de développement modernes. Jusqu'ici, la vérification qu'une fonctionnalité correspondait réellement à ce que le product owner avait demandé ou que le designer avait conçu reposait entièrement sur des tests manuels effectués par des équipes QA. Ces vérifications prenaient des heures, introduisaient des incohérences d'une release à l'autre et s'appuyaient sur une connaissance interne non documentée et donc fragile. En automatisant cette couche de validation, Baz cherche à supprimer le délai systématique entre la livraison du code et la détection des écarts, réduisant ainsi les régressions et accélérant les cycles de mise en production. Pour les équipes engineering qui travaillent à haute vélocité, c'est potentiellement une transformation profonde du workflow de review, qui passe d'une vérification de syntaxe à une validation de comportement réel. Ce projet s'inscrit dans une tendance plus large d'industrialisation des agents IA dans le cycle de développement logiciel, après l'émergence des assistants de génération de code comme GitHub Copilot. Amazon Bedrock AgentCore, lancé récemment par AWS, propose des primitives spécifiquement conçues pour l'orchestration d'agents multi-étapes en production, incluant la navigation web autonome, la gestion de la mémoire et l'exécution de code dans des environnements isolés. Baz exploite ces capacités pour bâtir une infrastructure d'orchestration déployée sur Amazon EKS, avec un Application Load Balancer en entrée. La prochaine étape logique pour ce type de système sera d'étendre la couverture au-delà des critères d'acceptation Jira et des maquettes Figma, vers des dimensions comme la performance ou l'accessibilité, transformant progressivement la revue de code en audit produit complet piloté par l'IA.

OutilsOutil
1 source