Aller au contenu principal

Outils — page 3

1357 articles · page 3 sur 28

Les meilleurs outils IA : applications, produits et services propulsés par l'intelligence artificielle.

Nous Research lance Hermes Agent Profile Builder : identité, modèle, compétences et serveurs MCP dans un tableau de bord unique
101MarkTechPost OutilsOutil

Nous Research lance Hermes Agent Profile Builder : identité, modèle, compétences et serveurs MCP dans un tableau de bord unique

Nous Research a publié le Profile Builder pour son agent open source Hermes, une interface graphique intégrée au tableau de bord local du projet accessible depuis un navigateur à l'adresse 127.0.0.1:9119. Jusqu'ici, configurer un agent Hermes demandait plusieurs étapes en ligne de commande : définir une identité, choisir un modèle et un fournisseur, activer des compétences, connecter des serveurs MCP. Le Profile Builder regroupe toutes ces opérations dans un formulaire guidé en cinq étapes. Le premier champ définit le nom et la description de l'agent, le nom servant également d'alias de commande dans le terminal. Viennent ensuite le choix du modèle et du fournisseur parmi Nous Portal, OpenRouter, NVIDIA, OpenAI ou tout endpoint compatible OpenAI, puis l'activation des compétences intégrées, l'installation depuis un catalogue externe via le Skills Hub, et enfin l'ajout de serveurs MCP par URL ou par commande locale. Chaque configuration produit un profil isolé : un répertoire autonome contenant son propre fichier config.yaml, ses variables d'environnement, son fichier de personnalité SOUL.md, sa mémoire, ses sessions, ses tâches planifiées et sa base de données d'état. L'intérêt principal de cette approche est la possibilité de faire tourner plusieurs agents spécialisés sur une même machine sans qu'ils partagent le moindre état. Un agent dédié au code et un agent de veille documentaire restent rigoureusement cloisonnés : mémoire séparée, credentials distincts, verrous sur les tokens pour éviter les conflits d'accès. Concrètement, un développeur peut configurer un assistant de programmation couplé à un modèle de code, un serveur MCP pour le système de fichiers et des compétences Git, pendant qu'un second profil gère une veille automatisée avec des compétences d'extraction web. Le builder abaisse significativement le seuil d'entrée : là où la configuration CLI exigeait de connaître chaque commande dans le bon ordre, le formulaire guide l'utilisateur sans supposer de familiarité avec l'outillage interne. Hermes est l'agent auto-améliorant open source de Nous Research, disponible en CLI, en application desktop et sur des plateformes de messagerie. Les compétences de l'agent reposent sur des fichiers SKILL.md dont seules les descriptions courtes sont chargées par défaut, le contenu complet n'étant consulté qu'en cas de besoin, ce qui évite d'alourdir les requêtes. Les serveurs MCP, conformes au protocole Model Context Protocol, permettent d'exposer des outils externes, qu'il s'agisse de services HTTP distants ou de processus stdio locaux. Le Profile Builder n'écrase pas le CLI, il en reproduit la logique dans une interface plus accessible : les deux chemins écrivent dans les mêmes fichiers de profil. Cette sortie s'inscrit dans une tendance plus large où les projets d'agents open source cherchent à réduire la friction de configuration pour toucher un public plus large que les seuls développeurs familiers de la ligne de commande.

1 source
Gemini 3.5 Translate va faire tomber la barrière des langues
102Le Big Data 

Gemini 3.5 Translate va faire tomber la barrière des langues

Google a dévoilé le 9 juin 2026 Gemini 3.5 Translate, aussi appelé Gemini 3.5 Live Translate, un modèle audio capable de traduire des conversations orales en temps réel dans plus de 70 langues et plus de 2 000 combinaisons linguistiques. Contrairement aux systèmes précédents qui attendaient la fin d'une phrase complète avant de produire une traduction, ce nouveau modèle écoute, traite et restitue le flux audio en continu, avec un décalage de quelques secondes seulement. L'outil est déployé dans Google Traduction sur Android et iOS, dans Google Meet, et accessible aux développeurs via l'API Gemini Live. Google affirme également que le modèle conserve l'intonation, le rythme et la hauteur de voix du locuteur original, ce qui doit rendre la traduction moins mécanique. La technologie intègre aussi SynthID, un filigrane numérique embarqué dans le signal audio pour identifier les contenus générés par IA. La détection automatique des langues évite à l'utilisateur de changer manuellement les réglages lorsqu'un interlocuteur passe d'une langue à une autre. L'enjeu dépasse largement la conversation touristique. Pour les entreprises opérant à l'international, Gemini 3.5 Translate ouvre la possibilité de réunions multilingues sans interprète externe, sans sous-titres approximatifs et sans anglais comme langue pivot imposée. Google Meet bénéficiait déjà d'une traduction partielle, mais le système restait très dépendant de l'anglais comme langue intermédiaire ; le passage à plus de 2 000 paires directes représente un changement d'architecture significatif. Pour les développeurs, l'accès via l'API Gemini Live signifie que cette capacité peut s'intégrer dans des applications de mobilité, des services clients automatisés ou des plateformes de communication, ce qui élargit considérablement l'usage potentiel au-delà des produits Google eux-mêmes. La traduction en temps réel est un problème que l'industrie technologique tente de résoudre depuis des décennies, mais les systèmes actuels peinent encore dans les conditions réelles : bruits ambiants, accents marqués, expressions idiomatiques, locuteurs multiples. Google assure avoir entraîné Gemini 3.5 Translate spécifiquement sur ces scénarios difficiles, mais les démonstrations en conditions contrôlées restent insuffisantes pour valider la promesse. L'intégration de SynthID révèle par ailleurs une tension inhérente à la technologie : un modèle capable de reproduire fidèlement le ton et le rythme d'une voix humaine soulève des questions légitimes sur les usages détournés, notamment la falsification de propos. Microsoft avec Teams, Amazon avec Chime et des acteurs spécialisés comme Interprefy sont déjà positionnés sur ce marché. L'annonce de Google confirme que la traduction vocale en temps réel va devenir une fonctionnalité standard dans les outils de communication professionnels dans les prochains mois.

UELes entreprises européennes opérant dans un contexte multilingue (l'UE compte 24 langues officielles) pourraient réduire leur dépendance aux interprètes professionnels via Google Meet et l'API, tandis que l'intégration de SynthID s'inscrit dans les exigences de traçabilité du contenu IA prévues par l'AI Act.

💬 Le passage à 2 000 paires directes sans l'anglais comme pivot, c'est le truc qui m'intéresse vraiment dans cette annonce, parce que c'est un changement d'architecture, pas juste une mise à jour. La démo en conditions propres va toujours marcher, la vraie question c'est ce que ça donne avec un accent fort, du bruit et trois personnes qui se coupent la parole. Et qu'un modèle reproduise fidèlement ta voix en temps réel... SynthID c'est bien, mais on se comprend.

OutilsOpinion
1 source
Pourquoi l'IA qui fonctionne en laboratoire échoue souvent en production, et comment y remédier
103VentureBeat AI 

Pourquoi l'IA qui fonctionne en laboratoire échoue souvent en production, et comment y remédier

La majorité des entreprises ne manquent pas d'ambition pour expérimenter l'intelligence artificielle, elles échouent à la faire fonctionner en conditions réelles. C'est le constat que dresse un responsable de l'organisation AI Foundations de Capital One, la grande banque américaine, dans une tribune publiée mi-2026. Selon lui, la vraie rupture ne se situe pas dans l'adoption des derniers modèles, mais dans le passage du prototype prometteur au système fiable à l'échelle de production. Les environnements d'entreprise restent complexes, fragmentés et averse au risque, ce qui suffit à faire dérailler la plupart des initiatives dès qu'elles quittent le laboratoire. La réponse de Capital One passe par une intégration délibérée de la recherche fondamentale et du développement appliqué au sein d'une même organisation. Plutôt que de laisser la recherche académique déconnectée des contraintes opérationnelles, latence réelle, données de production, besoins métier concrets, la banque impose une boucle de feedback permanente entre chercheurs et équipes terrain. Cette approche a notamment permis de combiner des architectures multi-agents pour que des agents IA spécialisés coordonnent des tâches distinctes en parallèle, comme analyser le contexte client et préparer de la documentation simultanément. Le résultat concret : Chat Concierge, un service d'achat automobile qui ne se contente pas de répondre à des questions mais prend des actions au nom du client, simulant un raisonnement humain. La banque cite également des avancées en détection de fraude, personnalisation et expériences digitales. Sur le plan méthodologique, l'article distingue trois étapes que les organisations doivent traiter comme de véritables filtres, non comme des formalités. Une preuve de concept doit produire un signal objectif mesurable, pas une présentation de ce qu'on "pourrait" faire. Un pilote dont l'échec est impossible n'est pas un pilote : il doit élargir le périmètre et tester si la solution aide réellement un humain à travailler mieux. Enfin, la mise en production est décrite comme un sport collectif qui dépasse la seule résolution du problème algorithmique. Ce cadre, défendu par Capital One dans un contexte de forte pression à montrer des retours sur investissement concrets en IA, reflète une tendance plus large dans l'industrie financière : après des années d'expérimentation, les grandes institutions cherchent à industrialiser leurs capacités IA en posant des processus de validation rigoureux plutôt qu'en multipliant les démos spectaculaires.

OutilsOpinion
1 source
Comment les équipes de pointe réinventent le développement natif IA
104AWS ML Blog 

Comment les équipes de pointe réinventent le développement natif IA

Six ingénieurs. Soixante-seize jours. Un projet initialement calibré pour trente développeurs travaillant douze à dix-huit mois. C'est le résultat concret obtenu par une équipe d'Amazon Bedrock qui a reconstruit de fond en comble le moteur d'inférence de la plateforme en moins d'un trimestre. La productivité individuelle a bondi d'environ 20 fois, mesurée par la vélocité de commits normalisée : de 2 commits par développeur par semaine à 40. L'équipe a livré plus de code en production en cinq mois que lors de tous les projets cumulés des dix années précédentes. Dans un deuxième cas, l'équipe Prime Video Financial Systems a conduit un sprint de dix jours en chambre close, zéro interruption, aucune astreinte, aucun autre projet en parallèle. Sur cette fenêtre, six ingénieurs ont produit 556 commits contre une base de référence de 96, ramenant l'estimation initiale d'un projet de 90 semaines à 24 semaines, soit environ 6 fois le débit habituel et une accélération de 4 fois. Ces gains ne sont pas des cas isolés : les équipes les plus avancées atteignent des facteurs de 4,5x en moyenne, parfois supérieurs à 10x. Ces résultats bouleversent une hypothèse couramment admise : que les agents IA avaient déjà transformé le développement logiciel. En réalité, si le nombre de commits a explosé dans l'industrie, le rythme de livraison en production n'a pas suivi. Le vrai goulot d'étranglement n'est pas la capacité de génération des agents, mais leur accès à la connaissance nécessaire pour prendre de bonnes décisions, et la volonté des équipes de restructurer leur travail en conséquence. Ce que ces équipes ont réalisé, c'est un changement de paradigme : passer de tâches discrètes à des objectifs pilotés par des résultats, faire tourner plusieurs agents en parallèle, et organiser les systèmes pour que l'IA puisse avancer de manière autonome en dehors des heures ouvrées. Amazon a mené ces expériences sur des centaines d'équipes d'ingénierie et a identifié au moins trois approches reproductibles : une initiative pionnière confiée à des experts sur un défi précis, un sprint structuré sur un plan bien défini, et une expérimentation en conditions réelles divisant les équipes entre méthodes classiques et workflows adaptés à l'IA. Ce que ces trois voies ont en commun, c'est de traiter l'adoption de l'IA comme un investissement d'ingénierie à part entière, et non comme un simple déploiement d'outil. Le modèle des "équipes frontières", selon la terminologie d'Amazon, n'est pas réservé aux grands laboratoires ou aux géants technologiques : il émerge dans tous les secteurs et toutes les tailles d'entreprise, à condition d'accepter de repenser en profondeur la façon dont le logiciel est construit.

OutilsOutil
1 source
Microsoft SkillOpt : optimisation de prompts, analyse d'évolution des compétences et comparaison aux références
105MarkTechPost 

Microsoft SkillOpt : optimisation de prompts, analyse d'évolution des compétences et comparaison aux références

Microsoft a publié SkillOpt, un framework open source conçu pour optimiser automatiquement les "skills", des prompts structurés qui guident le comportement des modèles de langage. Un tutoriel de référence détaille son implémentation complète sur le benchmark SearchQA, un jeu de questions-réponses fondé sur des extraits de documents. Le pipeline utilise GPT-4o comme modèle optimiseur et GPT-4o-mini comme modèle cible, en s'appuyant sur l'API OpenAI via une compatibilité Azure. Le workflow d'optimisation enchaîne six étapes distinctes : rollout (génération de réponses), reflection (analyse des erreurs), aggregation (consolidation des observations), selection (choix des meilleures améliorations), updating (réécriture du prompt) et validation-based gating (validation avant d'accepter chaque nouvelle version du skill). Le tutoriel tourne avec un échantillon limité à 24 exemples, sur deux epochs avec des batchs de 8, pour contenir les coûts en tokens. Ce que rend possible SkillOpt est significatif : plutôt que d'ajuster les poids d'un modèle par entraînement classique, coûteux et nécessitant des GPU, il optimise uniquement le texte du prompt par itération automatique. Cela permet à n'importe quel développeur d'améliorer les performances d'un modèle sur une tâche précise sans toucher à l'infrastructure d'entraînement. L'outil mesure l'évolution de la précision en "hard accuracy" et "soft accuracy" à chaque cycle, offre un suivi de l'usage cumulatif en tokens, et visualise l'historique des modifications du skill. Cette transparence donne aux équipes un contrôle fin sur le compromis entre coût et gain de performance, un avantage concret pour les produits IA en production. SkillOpt s'inscrit dans une tendance plus large portée par Microsoft Research : l'optimisation automatique de prompts, parfois appelée "prompt engineering automatisé" ou APO (Automatic Prompt Optimization). Des travaux antérieurs comme DSPy de Stanford ou ProTeGi avaient ouvert cette voie, mais SkillOpt mise sur une architecture modulaire et une compatibilité avec les backends Azure OpenAI et OpenAI standard pour maximiser l'adoption en entreprise. La publication du code sur GitHub sous forme de dépôt clonable avec dépendances pip illustre la volonté de Microsoft d'ancrer cet outil dans les workflows MLOps existants. L'enjeu à terme est d'industrialiser l'amélioration continue des agents IA sans intervention humaine à chaque itération, une capacité qui deviendra centrale à mesure que les entreprises déploient des systèmes LLM à grande échelle.

UELes équipes IA européennes déployant des agents LLM sur Azure OpenAI peuvent adopter SkillOpt pour automatiser l'amélioration continue de leurs prompts sans coûts d'entraînement supplémentaires.

OutilsOutil
1 source
Créer un assistant de réparation d'équipements alimenté par l'IA avec Amazon Bedrock AgentCore
106AWS ML Blog 

Créer un assistant de réparation d'équipements alimenté par l'IA avec Amazon Bedrock AgentCore

Amazon Web Services a publié un tutoriel détaillé présentant la construction d'un assistant de réparation d'équipements agricoles propulsé par l'IA, en s'appuyant sur son service Amazon Bedrock AgentCore. L'assistant est conçu pour permettre aux techniciens de terrain de diagnostiquer des pannes de machines lourdes, d'identifier les pièces nécessaires et d'accéder aux procédures de réparation approuvées par les fabricants, le tout via un langage naturel. Techniquement, la solution repose sur plusieurs briques AWS : le runtime AgentCore associé au Strands Agents SDK, le modèle de fondation Amazon Nova 2 Lite pour l'inférence, une Knowledge Base Bedrock pour la génération augmentée par récupération (RAG), et AgentCore Memory pour la persistance des conversations entre sessions. Le frontend React est hébergé sur AWS Amplify, tandis qu'Amazon Cognito gère l'authentification des utilisateurs. Les données de documentation, manuels constructeurs, catalogues de pièces, guides de réparation, sont indexées dans Amazon S3, interrogées via Amazon OpenSearch Serverless pour la recherche vectorielle, avec Amazon Titan Embeddings pour la correspondance sémantique. Les tickets d'intervention sont stockés dans Amazon DynamoDB. La portée concrète de cet outil est significative pour un secteur où chaque heure d'immobilisation d'une machine pendant les récoltes peut se chiffrer en milliers d'euros de pertes. Aujourd'hui, un technicien envoyé sur site sans la bonne pièce doit souvent repartir, revenir, et multiplier les déplacements, allongeant le temps d'arrêt de manière coûteuse. En permettant un diagnostic précis en amont, avec accès instantané aux manuels techniques du fabricant et aux nomenclatures de pièces, l'assistant réduit ce cycle. La mémoire inter-sessions d'AgentCore est particulièrement utile : le technicien peut reprendre une conversation là où il l'avait laissée, sans répéter le contexte de la panne à chaque nouvelle interaction. Cette publication s'inscrit dans la stratégie agressive d'AWS pour imposer Bedrock AgentCore comme plateforme de référence pour le déploiement d'agents IA en production. Lancé en 2025, AgentCore vise à simplifier l'hébergement, la mémoire et l'observabilité des agents, des points de friction majeurs dans les projets IA réels. La concurrence est vive : Vertex AI de Google, Azure AI Foundry de Microsoft, et des frameworks open-source comme LangGraph cherchent tous à capter ce marché. En publiant des cas d'usage sectoriels concrets, ici l'agritech, après d'autres dans la santé ou la finance, AWS tente de démontrer la maturité opérationnelle de sa plateforme face à des besoins métier exigeants. La prochaine étape logique pour ce type de solution serait l'intégration de données IoT temps réel issues des capteurs des machines, pour passer du diagnostic assisté au diagnostic prédictif.

UELes développeurs et entreprises agritech européens peuvent s'appuyer sur ce tutoriel pour construire des assistants de maintenance similaires adaptés au parc de machines agricoles de l'UE.

OutilsOutil
1 source
Google Gemini rencontre de gros problèmes, que se passe-t-il vraiment ?
107Le Big Data 

Google Gemini rencontre de gros problèmes, que se passe-t-il vraiment ?

Le 10 juin 2026, Google Gemini a été frappé par une panne significative touchant des milliers d'utilisateurs aux États-Unis et au Royaume-Uni. Les premières difficultés ont été signalées à partir de 6h11 heure de l'Est (11h11 GMT), avec une montée rapide des remontées sur Downdetector : environ 480 signalements côté américain et 440 côté britannique en quelques heures. Les utilisateurs se heurtent à deux codes d'erreur spécifiques, 1076 et 1099, aussi bien sur l'interface web que sur l'application mobile. Le premier semble lié à un problème de session ou de communication avec la conversation en cours, le second pointe vers une défaillance côté serveur. La panne touche indistinctement les comptes Google Workspace et les comptes grand public, ce qui exclut une simple limite de quota individuel. L'impact est concret pour tous ceux qui utilisent Gemini dans leur workflow quotidien : rédaction d'emails, préparation de briefs, assistance à des réunions ou aide aux devoirs. Ce qui aggrave la situation, c'est le décalage flagrant entre l'expérience vécue par les utilisateurs et la communication officielle de Google : la page de statut des services affiche toujours un fonctionnement normal, tandis que l'outil renvoie des erreurs à chaque nouvelle invite. Certains utilisateurs signalent qu'une deuxième tentative immédiate peut parfois fonctionner, mais ce contournement reste aléatoire et inutilisable en production. L'absence de reconnaissance officielle laisse les utilisateurs sans visibilité sur la durée et la cause de l'incident. Cette panne survient dans un contexte de concurrence extrêmement tendue entre les grands acteurs de l'IA générative. Google positionne Gemini comme son produit phare face à ChatGPT d'OpenAI et Claude d'Anthropic, et l'intègre progressivement dans l'ensemble de ses services professionnels et grand public. Une indisponibilité non communiquée, même partielle, érode la confiance des entreprises qui envisagent de s'appuyer sur ces outils dans des contextes critiques. Google n'avait toujours pas publié d'explication ni reconnu officiellement un incident global au moment des premiers constats. La situation devrait se clarifier dans les heures suivantes selon l'évolution du volume de signalements et une éventuelle communication de l'entreprise.

UELes utilisateurs français et européens de Gemini peuvent être affectés par cette panne, qui compromet la fiabilité de l'outil pour les usages professionnels quotidiens.

OutilsActu
1 source
NotebookLM de Google intègre désormais un ordinateur cloud avec exécution de code et recherche à base d'agents
108The Decoder 

NotebookLM de Google intègre désormais un ordinateur cloud avec exécution de code et recherche à base d'agents

Google a annoncé une mise à jour majeure de NotebookLM, son outil de recherche et de synthèse documentaire. La nouvelle version tourne désormais sur Gemini 2.5 Flash et dispose d'un ordinateur cloud dédié capable d'exécuter du code directement depuis l'interface. Plus significatif encore, NotebookLM peut désormais trouver ses propres sources de manière autonome via Google Search, sans que l'utilisateur ait à importer manuellement des documents. Lors des tests internes, le nouveau système a surpassé l'ancienne version dans 78,2 % des cas. Ces évolutions transforment NotebookLM d'un simple outil d'analyse documentaire en un véritable agent de recherche autonome. La capacité d'exécution de code ouvre la voie à des analyses de données directement dans l'outil, sans passer par un environnement externe. L'intégration native à Google Search signifie que les utilisateurs n'ont plus besoin de sélectionner manuellement leurs sources : l'outil explore le web et construit lui-même sa base documentaire. Pour les chercheurs, journalistes, consultants ou étudiants, cela réduit considérablement le temps de préparation avant d'obtenir une synthèse exploitable. NotebookLM avait été lancé par Google en 2023 comme outil expérimental de prise de notes augmentée par l'IA, avant de connaître un succès inattendu, notamment grâce à sa fonctionnalité de podcast audio généré automatiquement. Cette montée en puissance vers l'agentique s'inscrit dans la tendance générale des grands acteurs de l'IA à doter leurs outils de capacités d'action autonome. Google positionne ainsi NotebookLM comme un concurrent direct des assistants de recherche comme Perplexity ou les modes "deep research" de ChatGPT et Gemini Advanced.

UELes professionnels et chercheurs en France et en Europe gagnent accès à un agent de recherche autonome capable d'explorer le web et d'exécuter du code, réduisant significativement le temps de préparation documentaire.

OutilsOutil
1 source
Siri intègre Google mais reste inaccessible dans une grande partie du monde
109AI News 

Siri intègre Google mais reste inaccessible dans une grande partie du monde

Paragraphe 1 (LES FAITS): Lors de la conférence WWDC 2026, Apple a présenté Siri AI, un assistant reconstruit à partir de zéro après des années de sous-performance. Ce nouveau Siri maintient des conversations véritablement multi-étapes, utilise les informations dans le mail, les messages et la bibliothèque photo, traite des requêtes en direct provenant de Web, et exécute des tâches à travers diverses applications. Apple attribue également une application dédiée au assistant, ainsi qu'une intégration système-large, avec les iPhone affichant l'activité de Siri dans l'Dynamic Island pendant les demandes. Cependant, la partie la plus intéressante se trouve dans les petits caractères : qui fournit réellement le puissance à Siri AI et qui y a accès. Paragraphe 2 (POURQUOI C'EST IMPORTANT): Apple a collaboré avec Google et la famille de modèles Gemini pour développer les prochaines générations de modèles Apple Foundation qui alimentent ses expériences Apple Intelligence, y compris l'architecture sur laquelle repose Siri AI. Bien que Craig Federighi, vice-président principal de la technologie logicielle chez Apple, ait affirmé que "la vie privée dans l'IA est non négociable", cette décision soulève des préoccupations stratégiques. En faisant appel à Google pour son cœur intelligent, Apple reconnaît ne pas pouvoir maintenir le rythme de la course aux modèles avancés seul, et cela a des implications pour les ambitions d'IA souveraine discutées dans le monde entier. De plus, Google déploie activement Gemini sur Android, Workspace et ses propres appareils, ce qui laisse Apple dans une position délicate. Paragraphe 3 (LE CONTEXTE): Cette annonce intervient alors que Tim Cook prépare à céder sa place de PDG à John Ternus. La structure de la conférence a mis l'accent sur les mises à jour plutôt que sur les nouveautés, symbolisant une transition pour Apple. L'exclusion de Siri AI en chinois, au sein de l'UE et le manque de calendrier pour d'autres langues montrent des limitations dans la portée géographique initiale du nouvel assistant. Cela soulève des questions sur les compromis nécessaires lorsqu'une entreprise doit s'appuyer sur ses rivaux pour atteindre ses objectifs, même avec une puissance de calcul et un budget considérables. L'avenir de Siri AI, reste incertain, alors que les conséquences de cette décision reverberent au-delà des frontières d'Apple.

UESiri AI est explicitement exclu de l'UE au lancement, privant les utilisateurs européens d'iPhone des nouvelles fonctionnalités de l'assistant et soulevant des interrogations sur la conformité avec l'AI Act.

💬 Apple reconstruit Siri de zéro, et la vraie info c'est que Google fournit les fondations. Après des années à prêcher la vie privée souveraine, appeler Google à la rescousse, c'est admettre que la course aux modèles est trop chère, même pour eux. Et nous, en Europe, on n'y a pas accès au lancement, ce qui est presque une info en soi.

OutilsOpinion
1 source
Les meilleurs agents de codage IA et plateformes de développement en 2026 : Atoms, Devin, Windsurf, Cursor, Warp et plus encore comparés
110MarkTechPost 

Les meilleurs agents de codage IA et plateformes de développement en 2026 : Atoms, Devin, Windsurf, Cursor, Warp et plus encore comparés

En 2026, le développement logiciel a basculé : les ingénieurs ne tapent plus la majorité de leur code à la main, mais décrivent leur intention, et des agents intelligents exécutent le travail. Un panorama publié par MarkTechPost recense les plateformes les plus influentes de cet écosystème en pleine explosion. Parmi elles, Atoms se distingue en déployant non pas un agent unique, mais une équipe coordonnée couvrant la gestion de produit, l'architecture système, le développement full-stack, le SEO et l'analyse de données. Son mode Race envoie simultanément un prompt à plusieurs modèles pour retenir la meilleure réponse. Devin AI, développé par Cognition, opère comme un ingénieur logiciel autonome : à partir d'une tâche en langage naturel ou d'un ticket lié, il planifie, exécute dans un environnement cloud sandboxé doté d'un shell, d'un navigateur et d'un éditeur, puis ouvre des pull requests. Windsurf, également signé Cognition, est un éditeur de code agentique basé sur VS Code dont l'agent Cascade lit l'intégralité d'un dépôt, applique des modifications multi-fichiers et vérifie les changements contre les tests. Des outils plus spécialisés complètent le tableau : GitHub Copilot pour l'autocomplétion en temps réel, Magic Patterns pour la génération de composants d'interface, Uizard pour le prototypage UI/UX à partir de croquis ou de captures d'écran, Replit Agent pour coder directement dans un navigateur sans configuration locale, et Galileo AI pour l'évaluation et l'observabilité des agents en production. L'impact de cette mutation est structurel. Les équipes réduites peuvent désormais couvrir des périmètres fonctionnels bien plus larges sans augmenter leurs effectifs, tandis que les cycles de développement s'accélèrent considérablement, de l'idée au prototype fonctionnel parfois en quelques heures. Pour les startups et les PME, des plateformes comme Replit Agent ou Atoms effacent la barrière de l'infrastructure : pas besoin d'environnement local configuré ni d'expertise DevOps pour passer de la description d'un produit à une application déployable avec authentification, base de données et paiements intégrés. La montée d'outils comme Galileo, dédiés à l'observabilité des agents, signale également que l'industrie prend au sérieux les risques de mise en production de systèmes autonomes, en imposant des garde-fous sur la sélection des outils, la latence et les coûts. Cette transformation s'inscrit dans une dynamique plus profonde amorcée dès 2023 avec l'explosion des modèles de code comme Codex et CodeLlama, suivie d'une course à l'agent autonome qui a pris de la vitesse en 2024 et 2025. Cognition est l'acteur à surveiller, ayant réussi à positionner à la fois Devin et Windsurf dans les premières places du marché. GitHub reste incontournable grâce à son intégration native dans les workflows existants, mais la concurrence s'intensifie, avec des outils qui ne se contentent plus d'assister le développeur mais cherchent à le remplacer sur des tâches bien délimitées. La prochaine frontière est celle de la supervision : dans combien de temps les entreprises feront-elles confiance à ces agents pour déployer en production sans validation humaine systématique ?

OutilsOutil
1 source
McDonald's teste un système de commande au drive propulsé par l'IA de Google
111AI News 

McDonald's teste un système de commande au drive propulsé par l'IA de Google

McDonald's teste depuis plusieurs semaines un nouveau système de commande vocale par intelligence artificielle dans ses restaurants drive-thru américains. Baptisé ArchIQ et surnommé "Archy", le dispositif a été dévoilé lors de la convention mondiale de la chaîne et est actuellement déployé dans cinq établissements aux États-Unis dont les adresses n'ont pas été communiquées. Développé en partenariat avec Google, le système accepte les commandes en anglais et en espagnol, gère les modifications de commande en temps réel et affiche le total avant de demander au client d'avancer. Selon le compte X McFranchisee, géré par un franchisé McDonald's, ArchIQ a déjà traité plus d'un million de transactions, avec environ 90 % des commandes traitées sans intervention humaine. Le système serait également capable de reconnaître les clients réguliers et de proposer leur commande habituelle, bien que McDonald's n'ait pas fourni de détails techniques sur ce mécanisme. En amont du déploiement, les restaurants américains reçoivent des unités Google Edge Cloud pour faire tourner l'infrastructure. L'enjeu est considérable pour une entreprise qui a enregistré 37 milliards de dollars de ventes à ses membres fidélité en 2025, soit une hausse de 20 %, avec près de 210 millions d'utilisateurs actifs sur 90 jours dans 70 marchés. ArchIQ s'inscrit dans le plan de croissance "McDonald's > NEXT", dont l'objectif est d'améliorer les opérations en restaurant et la rentabilité par unité. Le système ne se limite pas à la prise de commande: il surveille les équipements, alerte les managers en cas de panne de congélateur ou de goulot d'étranglement en cuisine, combinant outil de vente et support opérationnel. Le PDG Chris Kempczinski a reconnu dans une note interne que l'automatisation progressive du parcours client réduit les occasions d'interaction avec le personnel, ce qui, selon lui, élève le niveau d'exigence pour les moments où ce contact a lieu. Ce test intervient après l'échec d'une précédente expérimentation menée avec IBM dans plus de cent restaurants, abandonnée en 2024 suite à de nombreuses erreurs de commande, dont un cas devenu viral où le système aurait ajouté pour plus de 250 dollars de nuggets à la commande d'un client. McDonald's avait alors annoncé vouloir continuer d'explorer la technologie de commande vocale malgré cette déconvenue. La chaîne n'est pas seule sur ce terrain: Taco Bell et Wendy's ont également annoncé des systèmes similaires. Le trafic drive-thru est resté négatif tout au long de 2025, oscillant entre -5 % et -8 % selon QSR Magazine, ce qui renforce la pression sur les opérateurs pour optimiser leurs coûts. Si une partie des internautes ayant visionné les démonstrations d'ArchIQ dit préférer l'interaction avec un employé, McDonald's n'a pas encore communiqué de calendrier pour étendre le dispositif au-delà des cinq sites pilotes.

OutilsOutil
1 source
Le nouvel Siri d'Apple : plus qu'un assistant, une couche applicative pour les entreprises
112VentureBeat AI 

Le nouvel Siri d'Apple : plus qu'un assistant, une couche applicative pour les entreprises

Apple a dévoilé lundi une refonte profonde de Siri lors de sa conférence annuelle pour développeurs WWDC 2026, transformant l'assistant vocal en une couche d'interface IA transversale à l'ensemble de ses systèmes d'exploitation. Disponible sur iPhone, iPad, Mac, Apple Watch et Vision Pro, le nouveau Siri s'appuie sur quatre mécanismes techniques clés : les App Entities (qui exposent le contenu applicatif), l'index sémantique Spotlight, les App Intents et App Schemas (qui définissent les actions disponibles en langage naturel), et les View Annotations (qui associent les éléments visibles à l'écran à des objets applicatifs). Concrètement, un développeur qui adopte ces frameworks peut permettre à Siri d'accéder au contenu de son application, de le résumer, de le modifier ou d'agir dessus, sans que l'utilisateur ait besoin d'ouvrir l'app, de naviguer dans ses menus ni de taper une requête précise. L'impact pour les entreprises et les éditeurs de logiciels professionnels est considérable. Une société utilisant un CRM, un outil de gestion de projets, une solution de facturation ou un service desk sur appareils Apple pourrait voir ses flux de travail radicalement transformés : un employé pourrait demander à voix haute à Siri de résumer un fil client, d'ajouter une facture à ses dépenses ou de planifier un suivi sur une tâche en cours, directement depuis l'écran qu'il consulte. Apple ajoute également AppIntentsTesting, un framework de test qui valide les actions App Intents via la même infrastructure que Siri et Spotlight, sans nécessiter d'automatisation d'interface graphique. C'est un signal fort : les intégrations Siri ne seront plus des démos isolées, mais des fonctionnalités testables et intégrables dans les pipelines de développement classiques. Cette évolution s'inscrit dans une stratégie plus large d'Apple pour concurrencer les assistants d'entreprise de Google, Microsoft et Salesforce sur leur propre terrain. Là où les précédentes versions de Siri imposaient des structures de commandes rigides et des phrases d'invocation explicites, le nouveau modèle délègue aux développeurs la description sémantique de leurs données et capacités, laissant au système le soin de les rendre accessibles en langage naturel. Pour les éditeurs SaaS ciblant la productivité, la collaboration, la santé, la logistique ou les opérations terrain sur plateformes Apple, l'adoption de ces frameworks pourrait rapidement devenir un critère de compétitivité, voire une exigence de base des appels d'offres entreprise. La question n'est plus de savoir si Siri peut faire office de chatbot, mais si les applications métier sont prêtes à s'y connecter.

UELes éditeurs SaaS français et européens ciblant les environnements Apple devront évaluer l'intégration des nouveaux frameworks Siri pour rester compétitifs dans les appels d'offres entreprise sur plateformes Apple.

OutilsOutil
1 source
iOS 27 : 5 choses incroyables que votre iPhone fera tout seul grâce à l’IA
113Le Big Data 

iOS 27 : 5 choses incroyables que votre iPhone fera tout seul grâce à l’IA

Apple a présenté iOS 27 lors de sa conférence annuelle, une mise à jour qui place l'intelligence artificielle au coeur du système d'exploitation mobile. La nouveauté principale est Siri AI, une refonte complète de l'assistant vocal reposant sur la nouvelle génération d'Apple Intelligence. Pour les requêtes complexes, Siri s'appuie sur Gemini, le modèle de Google, tout en conservant les traitements dans l'infrastructure Private Cloud Compute d'Apple afin de préserver la confidentialité des données. Concrètement, l'assistant comprend désormais le contexte personnel de l'utilisateur : il peut retrouver l'heure d'un rendez-vous fixé par message, enchaîner plusieurs actions entre applications distinctes, localiser une adresse dans un email, l'ajouter à un contact, puis ouvrir l'itinéraire dans Plans, sans aucune intervention manuelle. L'application Photos intègre également de nouvelles fonctions IA : recadrage spatial pour modifier la composition d'un cliché après la prise de vue, outil Extend pour générer les éléments manquants en bordure d'image, et Clean Up pour effacer des objets indésirables en quelques secondes. Chaque image retouchée par IA reçoit un filigrane invisible SynthID. Safari, lui, pourra surveiller des pages web et alerter l'utilisateur lorsqu'un produit baisse de prix ou revient en stock. Enfin, iOS 27 est capable de remplacer automatiquement les mots de passe faibles directement sur les sites concernés. L'importance de cette mise à jour tient à son ambition d'automatiser des tâches jusqu'ici fragmentées entre plusieurs applications et plusieurs gestes. Pour les utilisateurs, cela signifie moins de friction au quotidien : plus besoin de jongler entre Messages, Contacts et Plans pour une simple question d'adresse. La surveillance de prix dans Safari s'adresse directement aux acheteurs réguliers en ligne, un marché colossal. Le remplacement automatique de mots de passe faibles touche à la sécurité de masse, un problème que les gestionnaires de mots de passe n'ont jamais réussi à résoudre complètement faute d'adoption. Pour l'industrie, Apple franchit une étape en intégrant un modèle tiers, Gemini de Google, dans son écosystème fermé, signal fort d'une évolution vers des architectures hybrides même chez les acteurs les plus verticalement intégrés. Cette direction n'est pas surprenante au regard des annonces des dernières années : Apple avait lancé Apple Intelligence en 2024 avec des fonctions jugées timides, puis accéléré ses partenariats avec OpenAI pour ChatGPT dans Siri. L'intégration de Gemini marque une deuxième alliance stratégique notable, révélant qu'Apple préfère désormais multiplier les fournisseurs de modèles plutôt que de tout développer en interne. La concurrence avec Google et Samsung, qui intègrent eux aussi l'IA dans leurs systèmes mobiles, pousse l'ensemble du secteur vers des assistants capables d'actions multi-applications. iOS 27 sera vraisemblablement disponible à l'automne 2026 avec les nouveaux iPhone, et l'enjeu sera de savoir si ces fonctions tiendront leurs promesses dans l'usage réel, là où Apple a parfois déçu par le passé.

UELes millions d'utilisateurs iPhone en France et en UE accéderont à ces fonctions IA à l'automne 2026, sous réserve des adaptations imposées par le RGPD et l'AI Act pour les traitements de données personnelles.

OutilsOutil
1 source
Premier avis de sinistre automatisé : Strands Agents et Amazon Bedrock AgentCore pour un traitement intelligent des déclarations
114AWS ML Blog 

Premier avis de sinistre automatisé : Strands Agents et Amazon Bedrock AgentCore pour un traitement intelligent des déclarations

Amazon Web Services a présenté un système d'automatisation de la déclaration de sinistre initiale (FNOL, ou "First Notice of Loss") combinant deux de ses technologies : le SDK open source Strands Agents et l'outil Amazon Bedrock AgentCore Browser Tool. Le dispositif s'appuie également sur Amazon Nova Act, un client capable d'interpréter des instructions en langage naturel pour piloter des interfaces web. Concrètement, Nova Act orchestre les interactions avec les portails de gestion de sinistres, ouvrir un dossier non traité, déclencher une analyse d'images, tandis que les agents construits avec Strands Agents appliquent les règles métier propres à l'assurance : interprétation des preuves, corrélation entre différents types de médias, évaluation de la complexité du dossier. Les modèles de fondation sont servis via Amazon Bedrock, et les sessions de navigation sont gérées dans des environnements Chrome isolés, avec enregistrement et visualisation en temps réel pour garantir la traçabilité. L'enjeu est considérable pour les compagnies d'assurance. À chaque déclaration de sinistre, les experts reçoivent un ensemble hétérogène d'informations non structurées : photos prises sur le terrain, vidéos panoramiques des dégâts, documents scannés, notes dictées ou enregistrées. Avant même de pouvoir exercer leur jugement, ils doivent naviguer dans des portails, vérifier l'exhaustivité des pièces justificatives et interpréter manuellement chaque élément. Les estimations sectorielles indiquent que cette phase de validation représente une part significative du temps d'un expert lors du traitement initial d'un dossier. Lors de pics de sinistres, catastrophes naturelles, vagues saisonnières, ces délais s'accumulent, créent des files d'attente et dégradent l'expérience client. Le système proposé délivre aux experts des dossiers pré-analysés, avec les preuves étiquetées et contextualisées, prêts pour la prise de décision plutôt que pour la validation. Cette initiative s'inscrit dans un mouvement plus large d'automatisation des processus assurantiels par l'IA générative, un secteur où les grands acteurs du cloud, AWS, Microsoft Azure, Google Cloud, se livrent une concurrence intense pour conquérir les équipes claims et underwriting. L'approche d'AWS est notable car elle ne cherche pas à remplacer l'expert humain mais à éliminer le travail répétitif d'écran, en préservant la supervision et l'auditabilité. Les données d'intake étiquetées deviennent également un actif opérationnel durable, utilisable pour affiner le routage des dossiers, détecter des patterns de fraude ou améliorer les workflows sur l'ensemble du cycle de vie des sinistres. La prochaine étape naturelle sera l'intégration avec des systèmes de gestion de sinistres existants comme Guidewire ou Duck Creek, où la valeur de l'automatisation multimodale sera pleinement testée à l'échelle.

UELes assureurs européens pourraient adopter ces outils pour automatiser le traitement initial des sinistres, mais la conformité RGPD et la souveraineté des données constituent des obstacles réglementaires à évaluer avant tout déploiement.

OutilsOutil
1 source
Créer un assistant de triage d'incidents basé sur des agents avec Amazon Q et New Relic
115AWS ML Blog 

Créer un assistant de triage d'incidents basé sur des agents avec Amazon Q et New Relic

Amazon Quick, la plateforme d'agents IA d'Amazon Web Services, vient de présenter une intégration native avec New Relic et Asana permettant d'automatiser la gestion d'incidents en production. Le principe : un ingénieur de garde envoie un simple prompt en langage naturel, par exemple "Le service checkout est lent et génère des erreurs serveur en production, vérifie les dernières 24 heures et génère un rapport de cause racine", et l'agent orchestre automatiquement cinq outils d'investigation New Relic en parallèle. Il identifie les alertes critiques, quantifie l'impact utilisateur, analyse les logs d'erreurs, détecte les transactions défaillantes, et traduit des questions en langage naturel vers le NRQL, le langage de requête propriétaire de New Relic. En sortie, l'agent produit un rapport de cause racine complet avec les liens vers les preuves, puis crée automatiquement une tâche dans le projet Asana "SRE Incident Triage" pour assurer la passation entre équipes. L'accès nécessite un abonnement Amazon Quick Professional avec des droits Author ou supérieurs. L'enjeu principal est la réduction du MTTR, le temps moyen de résolution d'incident, indicateur clé pour les équipes SRE. Lors des tests internes menés sur les propres applications de New Relic, l'agent a significativement compressé la phase de collecte des preuves, qui représente souvent la part la plus chronophage d'une intervention. Concrètement, cela réduit le risque de perte de connaissances lors des changements de garde, impose un standard d'investigation uniforme à toute la rotation on-call, et accélère la résolution effective. Pour les DSI et responsables ingénierie, la promesse est claire : moins de temps perdu à jongler entre des outils disparates sous pression, et une traçabilité immédiate de chaque incident. Cette intégration s'inscrit dans une tendance de fond : l'outillage des agents IA avec des connecteurs natifs vers les plateformes d'observabilité et de gestion de projet. New Relic, qui positionne son MCP Server comme pont entre ses données et les agents IA, rejoint ainsi un écosystème croissant autour du protocole MCP popularisé par Anthropic. Amazon Quick, de son côté, étend sa bibliothèque de connecteurs enterprise, avec New Relic et Asana déjà intégrés nativement. Le pattern décrit dans cet article, triage d'incidents, n'est qu'une illustration d'une capacité plus large : connecter n'importe quel flux de travail métier à un agent conversationnel. La prochaine étape logique serait d'étendre cette approche à d'autres outils d'observabilité comme Datadog ou Grafana, et à d'autres systèmes de ticketing comme Jira ou PagerDuty, à mesure que l'écosystème MCP se standardise.

OutilsOutil
1 source
Apple Intelligence : comment Siri AI voit vraiment votre écran iPhone ?
116Le Big Data 

Apple Intelligence : comment Siri AI voit vraiment votre écran iPhone ?

Le 8 juin 2026, Tim Cook a officialisé la prochaine génération d'Apple Intelligence, qui dote Siri d'une capacité inédite : lire et comprendre en temps réel ce qui s'affiche à l'écran de l'iPhone, de l'iPad, du Mac et de l'Apple Vision Pro. Concrètement, l'assistant peut désormais détecter une adresse dans un message et l'ajouter automatiquement à un contact, identifier une invitation et proposer d'organiser la suite, ou encore interagir avec des éléments visuels affichés dans n'importe quelle application. Sur Vision Pro, Siri peut même répondre en fonction de l'environnement physique regardé par l'utilisateur. Apple parle de "conscience de l'écran" pour qualifier cette capacité : l'assistant ne se contente plus d'écouter des commandes vocales, il interprète le contexte visuel de l'appareil. Ce basculement représente une rupture nette avec le Siri passif lancé en 2011. L'assistant devient un agent contextuel capable d'agir dans les applications, pas seulement de répondre à côté. Pour les utilisateurs professionnels, cela signifie concrètement moins de copier-coller entre apps, moins de recherches manuelles dans les mails ou les messages, et un assistant qui anticipe les actions probables plutôt que d'attendre une instruction explicite. Pour Apple, c'est aussi un enjeu stratégique majeur face à OpenAI, Google et Microsoft, qui ont tous intégré des assistants à forte conscience contextuelle dans leurs écosystèmes. Le retard de Siri sur ces concurrents est documenté depuis des années ; Apple Intelligence est censé combler cet écart en s'appuyant sur l'intégration matériel-logiciel propre à Apple. La question centrale reste celle de la vie privée. Un assistant qui lit les écrans, les messages, les photos et les mails concentre un volume considérable d'informations personnelles. Apple défend un modèle de traitement en local prioritaire, complété par son Private Cloud Compute pour les requêtes plus lourdes, avec la promesse que les données ne sont ni stockées ni accessibles à Apple. Ce cadre technique s'inscrit dans une stratégie de différenciation vis-à-vis de Google et Microsoft, perçus comme plus collecteurs de données. Mais la crédibilité de ces garanties sera testée à l'usage, notamment par les régulateurs européens qui scrutent déjà les pratiques des géants tech en matière d'IA embarquée. Si Apple réussit à convaincre que Siri peut être à la fois utile et discret, elle dispose d'un avantage concurrentiel durable. Dans le cas contraire, chaque mise à jour risque de raviver un débat que la marque préférerait clore une bonne fois pour toutes.

UELes régulateurs européens, qui scrutent déjà les pratiques des géants tech en matière d'IA embarquée, devront évaluer si le traitement des données par Apple Intelligence respecte le RGPD et l'AI Act.

OutilsOutil
1 source
Hey Siri, voici l'IA
117Ben's Bites 

Hey Siri, voici l'IA

Apple a officiellement lancé Siri AI, son assistant d'intelligence artificielle nouvelle génération, présenté comme une réponse directe aux assistants conversationnels comme ChatGPT. Décrit par ses concepteurs comme l'équivalent d'un ChatGPT vieux d'environ un an, Siri AI intègre la dictée avancée, l'analyse d'images et une capacité d'interaction avec des applications tierces comme Messages et Maps. Le système repose sur une architecture hybride mêlant modèles locaux et modèles cloud, certains fournis par Google via Gemini, le tout regroupé sous la famille de modèles maison AFM 3. En parallèle, OpenAI a mis à jour le système de mémoire de ChatGPT avec une troisième itération baptisée Dreaming v3, qui améliore le rappel d'informations, respecte mieux les préférences à long terme de l'utilisateur et se corrige au fil du temps. Google, de son côté, a annoncé une refonte de NotebookLM : son interface de chat passe d'un système RAG classique à une architecture agentique baptisée Antigravity, dans laquelle chaque carnet dispose désormais d'un ordinateur cloud dédié capable d'exécuter du code pour analyser les fichiers uploadés, le tout propulsé par les derniers modèles Gemini 3.5. Ces annonces simultanées illustrent l'intensification de la course aux assistants IA dans le grand public. Pour Apple, l'enjeu est considérable : Siri, longtemps moqué pour ses lacunes face aux assistants concurrents, revient avec une architecture modernisée intégrant notamment des modèles Gemini, ce qui marque une rupture symbolique pour une entreprise habituellement centrée sur ses propres technologies. Côté Anthropic, une publication de blog affirme que les développeurs écrivent désormais huit fois plus de code grâce à Claude qu'ils ne le faisaient en 2025, une statistique qui redéfinirait radicalement la productivité dans le secteur logiciel si elle se confirme. L'entreprise révèle également que le code généré par Claude est utilisé pour entraîner les prochaines versions du modèle, une boucle d'amélioration continue qui accélère la progression des capacités. Cursor, l'éditeur de code augmenté par IA, a aussi franchi une étape avec Canvas, une fonctionnalité permettant de créer des applications internes, tableaux de bord et rapports partageables directement depuis l'outil. Cette séquence d'annonces intervient dans un contexte de consolidation rapide du marché. OpenAI a discrètement déposé un S-1 confidentiel auprès des autorités boursières américaines tout en affirmant ne pas être pressé d'entrer en bourse, et a défini trois priorités pour sa prochaine phase : construire un chercheur IA autonome, accélérer la croissance économique et offrir à chaque habitant de la planète un AGI personnel. Ces objectifs ambitieux coexistent avec une pression réglementaire croissante : Anthropic plaide pour la création d'un mécanisme permettant de suspendre le développement de l'IA si des risques l'exigeaient. Le marché des agents IA connaît par ailleurs une structuration accélérée, avec des acteurs comme Firecrawl qui proposent désormais des workflows installables pour automatiser des tâches web répétitives, signalant une industrialisation progressive de l'outillage agentique dans les entreprises.

UELes nouveaux assistants IA d'Apple (Siri AI avec Gemini intégré) et Google (NotebookLM agentique) seront déployés en Europe sous contrainte de l'AI Act et du RGPD, notamment pour le traitement cloud des données personnelles.

💬 Apple qui intègre Gemini dans Siri, c'est une capitulation symbolique habillée en "architecture hybride". Mais au moins ils ne mentent pas sur leur retard : "l'équivalent d'un ChatGPT vieux d'un an", c'est une com' étonnamment lucide pour eux. Reste à voir si l'intégration apps tierces tient hors démo.

Apple : le nouveau Siri est-il enfin meilleur que ChatGPT ?
118Le Big Data 

Apple : le nouveau Siri est-il enfin meilleur que ChatGPT ?

Apple a profité de la WWDC 2026 pour dévoiler Siri AI, une refonte complète de son assistant vocal disponible sur iPhone, Mac, iPad, Apple Watch et Vision Pro. Cette nouvelle version introduit des conversations plus naturelles, une compréhension du contexte personnel, la capacité d'analyser le contenu affiché à l'écran, une recherche web en temps réel, et surtout la possibilité d'enchaîner des actions dans plusieurs applications sans intervention manuelle. L'assistant peut désormais retrouver une réservation dans un ancien e-mail, identifier une photo précise ou extraire une adresse depuis une conversation iMessage, des capacités qui le rapprochent directement de ce que proposent ChatGPT, Gemini ou Claude depuis plusieurs années. L'atout distinctif de Siri AI réside dans son intégration native à l'écosystème Apple : là où ChatGPT fournit une réponse textuelle, Siri peut agir directement sur l'appareil, croiser des données entre applications et intervenir à partir de ce qui est visible à l'écran, sans que l'utilisateur ouvre une application dédiée. Cette fluidité opérationnelle représente un avantage réel pour les dizaines de millions d'utilisateurs Apple qui jonglent quotidiennement entre Mail, Messages, Photos et les apps tierces. Cependant, ChatGPT conserve une avance significative sur les tâches de raisonnement complexe et de génération de texte élaboré, domaines où OpenAI capitalise plusieurs années d'expérience avec ses grands modèles de langage. Apple en est visiblement conscient : l'annonce la plus révélatrice de la WWDC 2026 n'est pas Siri lui-même, mais le système baptisé "Extensions" qui permet à l'utilisateur de déléguer une question à ChatGPT, Gemini ou Claude lorsque Siri atteint ses limites. Cette ouverture à la concurrence peut se lire comme du pragmatisme, Apple offre une expérience unifiée sans forcer ses utilisateurs à choisir, mais elle ressemble aussi à un aveu de la part d'une entreprise qui a accumulé un retard considérable sur l'IA générative depuis 2022. Plutôt que d'affronter frontalement OpenAI, Google et Anthropic sur leur terrain, Apple repositionne Siri en hub d'accès à plusieurs intelligences artificielles, une stratégie qui mise sur la distribution et l'intégration matérielle plutôt que sur la puissance brute du modèle.

UELes dizaines de millions d'utilisateurs européens d'appareils Apple disposeront d'un assistant IA nativement intégré à leurs données personnelles, ce qui soulève des questions de conformité RGPD et AI Act sur l'agrégation cross-application et les transferts vers des serveurs américains.

💬 Ce qui m'a frappé à la WWDC, c'est pas Siri lui-même, c'est le système Extensions. Apple admet tranquillement qu'il n'a pas le meilleur modèle, et au lieu de se battre sur ce terrain, il devient la couche d'interface entre toi et ChatGPT ou Claude, en s'appuyant sur ce qu'il fait vraiment bien : l'intégration matérielle. Pas glorieux comme aveu, mais c'est probablement la stratégie la plus réaliste qu'Apple pouvait adopter en 2026.

OutilsOutil
1 source
Recherche IA : Semrush et Infidigit veulent aider les marques à gagner en visibilité
119Le Big Data 

Recherche IA : Semrush et Infidigit veulent aider les marques à gagner en visibilité

Semrush et l'agence indienne Infidigit ont annoncé un partenariat stratégique visant à aider les marques à maintenir leur visibilité à l'ère de la recherche pilotée par l'intelligence artificielle. Le partenariat s'articule autour de la plateforme AI Optimization (AIO) de Semrush, qui analyse la présence des marques dans les environnements de recherche IA en s'appuyant sur plus de 261 millions de suggestions, 32 bases de données régionales et plus de 36 millions de marques indexées. Infidigit, qui revendique plus de 200 marques accompagnées à l'international et 95 distinctions sectorielles, intégrera ces données dans ses stratégies de SEO, de GEO (Generative Engine Optimization), de contenu et d'optimisation du taux de conversion. L'objectif déclaré est de relier directement la présence d'une marque dans les réponses générées par l'IA à des indicateurs commerciaux mesurables : conversions, revenus, parts de marché. L'enjeu dépasse la simple question du référencement classique. Selon Semrush, 37 % des consommateurs commencent désormais leurs recherches via des outils d'IA plutôt que sur Google ou Bing, et 60 % des recherches mobiles se terminent aujourd'hui sans clic vers un site web, l'utilisateur obtenant sa réponse directement depuis l'interface de l'assistant. Pour les entreprises, cela signifie qu'une part croissante des décisions d'achat se forge avant même que le consommateur ne visite leur site. Être absent des réponses générées par un LLM ou un moteur de réponse revient donc à disparaître d'une phase décisive du parcours client. Semrush avance également que les visiteurs issus des moteurs de recherche IA convertiraient 4,4 fois plus vite que ceux issus de la recherche organique traditionnelle. Ce partenariat s'inscrit dans une recomposition plus large du secteur du marketing digital, où le concept de GEO, optimiser sa présence non plus pour les algorithmes de classement de Google, mais pour les modèles de langage qui synthétisent l'information, commence à s'imposer comme discipline à part entière. Pour Kaushal Thakkar, fondateur et PDG d'Infidigit, ce moment représente le changement le plus profond dans la découverte de marques depuis l'émergence de Google comme moteur dominant. La bonne nouvelle pour les équipes SEO : les analyses de Semrush indiquent que plus de 80 % des réponses générées par l'IA s'appuient sur des sources bénéficiant d'une forte autorité SEO. Les fondamentaux du référencement restent pertinents, mais doivent être complétés par des stratégies spécifiques au GEO pour garantir qu'une marque soit non seulement indexée, mais activement citée et recommandée par les systèmes d'IA au moment où se construit la décision d'achat.

OutilsOutil
1 source
Facebook équipe les créateurs d’une IA… et ça inquiète
120Le Big Data 

Facebook équipe les créateurs d’une IA… et ça inquiète

Meta a annoncé le 4 juin 2026 le déploiement de Creator Assistant, un assistant IA intégré directement à Facebook et destiné aux créateurs de contenu. L'outil fonctionne comme un chatbot conversationnel : il analyse les statistiques d'un compte, les formats qui performent, les tendances d'engagement et l'évolution de l'audience, puis formule des recommandations personnalisées. Concrètement, un créateur peut lui poser des questions directes, pourquoi une publication a mieux marché qu'une autre, quel format publier ensuite, comment améliorer l'engagement, sans avoir à fouiller dans les tableaux de bord analytiques de la plateforme. L'assistant est censé apprendre au fil des échanges et adapter ses conseils selon les priorités déclarées : croissance d'audience, engagement ou monétisation. L'arrivée de cet outil répond à une réalité concrète : être créateur sur Facebook est devenu un travail à part entière, avec ses contraintes d'adaptation permanente à l'algorithme, ses formats qui évoluent sans cesse et ses statistiques à interpréter en permanence. Pour des milliers de créateurs, influenceurs, médias indépendants, marques, associations, qui gèrent seuls leur présence sur la plateforme, un assistant capable de synthétiser ces signaux représente un gain de temps potentiellement significatif. Meta positionne Creator Assistant comme un coach de contenu intégré, capable de transformer une analyse complexe en recommandations actionnables sans expertise technique particulière. Le lancement soulève pourtant des questions que l'emballage soigné de l'annonce ne dissipe pas. Pour fonctionner, Creator Assistant doit accéder à l'ensemble des données stratégiques d'un compte : contenus publiés, performances historiques, comportements d'audience, objectifs de croissance. Ces informations constituent précisément la valeur compétitive d'une présence en ligne, et Meta, qui possède déjà les règles algorithmiques de la plateforme ainsi que l'infrastructure publicitaire, en serait désormais également le conseiller. La question n'est pas anodine pour une entreprise dont la réputation en matière de gestion des données personnelles reste fragilisée par une décennie de controverses. S'y ajoute le risque inhérent aux assistants génératifs : formuler des recommandations erronées avec une confiance trompeuse, ce qui dans le cas d'une stratégie de contenu peut se traduire par une perte de visibilité ou d'audience. Creator Assistant s'inscrit dans une tendance plus large chez Meta, intégrer l'IA à chaque couche de Facebook, mais ce mouvement pose une question structurelle : jusqu'où est-il raisonnable de déléguer sa stratégie éditoriale à la plateforme qui en contrôle simultanément les règles, les données et maintenant les conseils ?

UECreator Assistant implique un accès élargi de Meta aux données stratégiques des créateurs européens, renforçant les préoccupations RGPD déjà soulevées par les régulateurs de l'UE face aux pratiques de la plateforme.

OutilsOutil
1 source
Tutoriel NVIDIA cuTile en Python : noyaux GPU tuilés pour vecteurs et matrices dans Colab
121MarkTechPost 

Tutoriel NVIDIA cuTile en Python : noyaux GPU tuilés pour vecteurs et matrices dans Colab

NVIDIA a lancé cuTile Python, une interface de programmation GPU par tuiles permettant d'écrire des kernels de style CUDA directement en Python, sans passer par le C++. Un tutoriel détaillé, conçu pour fonctionner sur Google Colab, guide les développeurs à travers trois exemples progressifs : addition de vecteurs, addition de matrices et multiplication de matrices. L'environnement requiert au minimum le pilote NVIDIA R580 et le CUDA Toolkit 13.1, des prérequis que Colab ne satisfait pas toujours en configuration standard. Le package s'installe via PyPI sous le nom cuda-tile[tileiras], et le tutoriel intègre un mode de repli automatique sur PyTorch pour garantir l'exécutabilité du notebook même lorsque les conditions du runtime ne sont pas réunies. L'enjeu est considérable pour la communauté des développeurs en machine learning et en IA. Jusqu'ici, écrire des kernels GPU personnalisés et hautement optimisés exigeait de maîtriser le CUDA C++, un langage bas niveau réservé à un profil d'ingénieur très spécialisé. cuTile Python abaisse cette barrière en exposant une abstraction par tuiles directement en Python, le langage de référence de l'écosystème IA. Concrètement, les développeurs peuvent désormais contrôler finement comment les tenseurs sont chargés, calculés et stockés en mémoire GPU, puis comparer les performances de leurs kernels personnalisés avec les opérations standard de PyTorch. Ce niveau de contrôle, auparavant réservé à des équipes spécialisées dans des laboratoires comme Google DeepMind ou Meta FAIR, devient accessible à un cercle bien plus large de praticiens. Cette initiative s'inscrit dans une tendance de fond chez NVIDIA à rendre son écosystème CUDA plus accessible aux développeurs Python, face à la montée en puissance de compilateurs alternatifs comme Triton d'OpenAI ou JAX de Google. Triton, intégré nativement à PyTorch depuis 2022, avait déjà ouvert cette voie en permettant d'écrire des opérations GPU optimisées en Python pur. cuTile se positionne comme la réponse directe de NVIDIA, en s'appuyant sur son propre stack logiciel et ses nouvelles générations de pilotes. Le fait que le tutoriel soit explicitement conçu pour Colab, l'environnement de notebooks gratuit de Google, signale une stratégie d'adoption large : abaisser le coût d'entrée pour que les étudiants, chercheurs et ingénieurs puissent expérimenter sans infrastructure dédiée. La prochaine étape naturelle sera l'intégration de cuTile dans les frameworks d'entraînement majeurs comme HuggingFace Accelerate ou PyTorch Lightning, ce qui pourrait redéfinir comment les équipes optimisent leurs pipelines à grande échelle.

OutilsTuto
1 source
L'IA s'apprête à remplacer les interfaces, et les dirigeants d'entreprise ne sont pas prêts
122VentureBeat AI 

L'IA s'apprête à remplacer les interfaces, et les dirigeants d'entreprise ne sont pas prêts

Les agents d'intelligence artificielle sont en train de rendre obsolète la forme même du logiciel d'entreprise. Là où un salarié devait autrefois jongler entre un CRM, un outil de prévision, un tableau de bord support et plusieurs fils de discussion pour comprendre la situation d'un compte client, il lui suffira bientôt de poser une question à un agent unique : "Qu'est-ce qui nécessite mon attention aujourd'hui ?" L'agent identifie les comptes à risque, explique pourquoi, résume les interactions récentes, rédige des actions de suivi et déclenche les workflows suivants. Ce n'est plus une interface que l'on pilote, c'est un système qui comprend l'intention et agit en conséquence. L'enjeu dépasse largement l'expérience utilisateur. Pour qu'un agent réponde correctement à "Pourquoi le churn augmente-t-il dans notre segment entreprise ?", il ne suffit pas qu'il sache où se trouvent les données clients. Il doit comprendre comment l'entreprise définit le churn, quels comptes entrent dans la catégorie "entreprise", si les données d'utilisation produit sont plus fiables que les enquêtes, ce que les tickets support indiquent, et si la réponse varie selon la géographie. Cela signifie que les définitions, les règles métier et les hypothèses implicites qui donnent du sens aux données doivent être formalisées, documentées et cohérentes à l'échelle de l'organisation. La couche sémantique, longtemps considérée comme un problème technique réservé aux équipes data, devient une question stratégique de direction générale. Les entreprises qui laisseront chaque département former son propre agent avec sa propre version de la réalité obtiendront de l'inexactitude à grande échelle. Les dashboards ne disparaissent pas parce que les graphiques deviennent inutiles, mais parce que le reporting statique devient trop lent pour les besoins opérationnels réels. Cette transition soulève aussi un nouveau problème de gouvernance. Tant que l'IA se contentait de répondre à des questions, contrôler ses accès était déjà difficile mais gérable. Dès que les agents commencent à agir, émettre un remboursement, réapprovisionner des stocks ou envoyer un e-mail à un client, les conséquences d'une erreur changent de nature. Les entreprises qui ont investi dans des fondations solides, des définitions partagées, des accès gouvernés, une traçabilité claire et des workflows documentés seront celles capables de déployer ces agents avec confiance. Les autres risquent d'automatiser leurs propres incohérences. La course à l'IA agentique est donc aussi, fondamentalement, une course à la maturité organisationnelle.

OutilsOutil
1 source
Apple veut de nouveau sauver le soldat Siri, cette fois avec l’aide de Google
123Next INpact 

Apple veut de nouveau sauver le soldat Siri, cette fois avec l’aide de Google

Apple a profité de sa WWDC 2026 pour dévoiler « Siri AI », une refonte complète de son assistant vocal intégré à iOS 27, iPadOS 27, macOS 27 et visionOS 27. La nouveauté centrale : Apple s'appuie désormais sur les modèles de langage de Google pour alimenter Siri, deux ans après des débuts catastrophiques avec Apple Intelligence. L'assistant rebaptisé sera d'abord accessible aux développeurs via les bêtas immédiates des nouveaux systèmes, mais les utilisateurs grand public devront patienter jusqu'à « plus tard dans l'année », en version bêta. La compatibilité est limitée au matériel récent : iPhone 15 Pro et 16e au minimum, iPad mini A17 Pro, Air ou Pro M1, Mac M1, et Apple Watch Series 10 ou Ultra 2. Le lancement se fera en anglais uniquement, les autres langues suivant ultérieurement. Le changement est loin d'être universel. Les utilisateurs européens d'iPhone et d'iPad sont explicitement exclus du déploiement initial, Apple invoquant la nécessité d'aligner ses pratiques avec le Digital Markets Act de l'Union européenne. C'est un coup dur pour une base d'utilisateurs importante, qui devra attendre qu'Apple trouve un accord avec Bruxelles sur les questions de vie privée et de sécurité. La dépendance assumée aux modèles Google constitue elle-même un aveu : Apple ne dispose pas, en interne, d'une capacité LLM suffisante pour rivaliser avec Google, OpenAI ou Meta sur ce terrain. Lors de la keynote, les temps de réflexion de Siri ont été visibles et jugés longs, ce qui suggère que les défis techniques ne sont pas entièrement résolus. Apple était déjà passé par ce script exactement il y a deux ans, à la WWDC 2024, avec des promesses similaires sur un assistant contextuel, capable de comprendre l'écran, les données personnelles et de naviguer sur le web, promesses largement non tenues. La crise autour de Siri avait été profonde, avec des critiques internes et publiques sur le retard accumulé face à des concurrents comme Google Assistant ou ChatGPT. Cette fois, le constructeur mise sur le partenariat Google et sur des démonstrations non coupées au montage pour regagner la confiance. Parmi les fonctions concrètes annoncées : la gestion de séquences complexes en langage naturel depuis la Dynamic Island, l'extension de l'intelligence visuelle à l'app Appareil photo avec reconnaissance de plats ou partage d'addition, et une intégration plus profonde au contexte personnel (photos, emails, messages). Si les promesses se concrétisent à l'automne, Apple aura enfin livré ce qu'elle vendait depuis 2024, mais l'Europe, elle, attendra encore.

UELes utilisateurs français et européens d'iPhone et d'iPad sont explicitement exclus du déploiement initial de Siri AI en raison du Digital Markets Act, et devront attendre qu'Apple trouve un accord avec Bruxelles sur les questions de vie privée avant d'accéder aux nouvelles fonctionnalités.

💬 Apple qui s'appuie sur Google pour faire tourner Siri, c'est l'aveu le plus net de toute la keynote. Les features annoncées semblent enfin là, pas juste des slides, et les démos non coupées au montage changent un peu la perception. Sauf qu'on est en Europe, donc on repassera encore, le temps qu'Apple règle son cas avec Bruxelles.

Siri AI : quelles sont les nouveautés qui arrivent avec iOS 27 ?
124Le Big Data 

Siri AI : quelles sont les nouveautés qui arrivent avec iOS 27 ?

Lors de la WWDC 2026, Apple a officiellement présenté Siri AI, une version profondément repensée de son assistant vocal, qui sera intégrée à iOS 27. Cette refonte va bien au-delà d'une simple mise à jour : l'assistant gagne la capacité de comprendre le contexte affiché à l'écran, d'effectuer des recherches dans les messages, e-mails, photos et notes personnelles, et d'accéder au web pour répondre à des questions d'actualité. Siri dispose désormais d'une application dédiée qui synchronise l'historique des conversations sur tous les appareils Apple liés au même compte iCloud, permettant de reprendre une discussion commencée sur Mac directement sur iPhone ou iPad. L'assistant intègre aussi un mode visuel dans l'appareil photo, capable d'analyser un objet, un document ou un plat en temps réel, ainsi que des fonctions d'écriture générative pour rédiger ou améliorer des textes. Ces évolutions changent concrètement la nature de Siri, qui passe d'un assistant à commandes vocales à un agent capable de raisonner sur le contexte de l'utilisateur. La capacité à retrouver une information enfouie dans des semaines de conversations ou à déduire une action depuis ce qui s'affiche à l'écran, ce qu'Apple appelle la "conscience de l'écran", représente un saut fonctionnel significatif. Pour les utilisateurs, cela signifie moins de recherches manuelles dans les applications et des interactions plus fluides entre les services Apple. Pour l'industrie, c'est un signal fort : Apple entre de plein pied dans la compétition des assistants IA contextuels, un terrain jusqu'ici dominé par ChatGPT, Gemini et Claude. Siri accuse depuis plusieurs années un retard perçu face aux assistants concurrents, régulièrement moqué pour sa rigidité et son incapacité à gérer des requêtes complexes. Apple a tenté une première réponse avec Apple Intelligence en 2024, mais les résultats sont restés en deçà des attentes. Avec iOS 27, la firme de Cupertino fait un pari plus ambitieux, en intégrant la compréhension du langage naturel, la mémoire inter-appareils et l'accès au web dans un seul assistant natif. L'enjeu est double : convaincre les utilisateurs Apple que leur écosystème peut rivaliser avec les outils IA tiers, et reprendre la main dans un marché où les assistants intelligents deviennent un critère d'achat déterminant. Les prochains mois de déploiement, et les retours des premiers utilisateurs, diront si cette promesse tient face à l'usage réel.

UELes millions d'utilisateurs iPhone en France bénéficieront des nouvelles fonctionnalités Siri, bien qu'Apple ait historiquement restreint certaines fonctions IA en Europe pour se conformer au RGPD et à l'AI Act.

OutilsOutil
1 source
Google vient (encore) de rendre NotebookLM plus intelligent
125Le Big Data 

Google vient (encore) de rendre NotebookLM plus intelligent

Google a déployé le 8 juin 2026 une mise à jour majeure de NotebookLM, son outil d'assistance à la recherche, en l'alimentant avec le modèle Gemini 3.5. La nouveauté la plus structurante est l'intégration directe de la recherche Google dans le flux de travail : l'utilisateur peut désormais démarrer un projet sans importer aucun document au préalable. Une simple question suffit pour que l'outil parte lui-même chercher des sources sur le Web, les évalue et en propose une sélection. L'utilisateur conserve la main sur les sources effectivement intégrées, mais le service ne se contente plus de traiter de la matière fournie, il participe activement à sa collecte. Par ailleurs, NotebookLM intègre désormais un environnement cloud sécurisé basé sur la plateforme Antigravity de Google, qui lui permet d'exécuter du code, de manipuler des jeux de données, de produire des analyses et de générer des graphiques. Les exports couvrent maintenant PDF, feuilles Excel, présentations PowerPoint, tableaux CSV et visualisations d'images. Cette mise à jour est réservée, au lancement, aux abonnés Google AI Ultra. Ces évolutions changent concrètement la nature de l'outil. NotebookLM glisse du statut de résumeur de documents vers celui d'assistant de recherche agentique, capable de couvrir l'intégralité du flux de travail : collecte, analyse, synthèse, présentation. Pour les chercheurs, étudiants et professionnels qui traitent de gros volumes d'information, la combinaison recherche autonome et exécution de code représente un gain de temps substantiel. La possibilité d'exporter directement vers les formats bureautiques standards réduit les frictions entre la phase exploratoire et la phase de restitution, deux moments qui exigent aujourd'hui souvent des outils distincts. La limite reste la nécessité de vérifier les sorties de l'IA, en particulier les analyses de données, même lorsque le système paraît sûr de lui. NotebookLM avait été lancé en version expérimentale en 2023 avant d'être rendu public en 2024, en s'appuyant sur le principe du RAG, réponses ancrées dans des documents fournis par l'utilisateur plutôt que dans les données d'entraînement seules. Cette contrainte le distinguait des assistants généralistes, mais le limitait aussi à ce que l'utilisateur apportait. Le virage agentique annoncé ici place Google en concurrence directe avec des outils comme Perplexity ou les modes de recherche avancés de ChatGPT, qui misent eux aussi sur la capacité à aller chercher l'information de façon autonome. Google dispose d'un avantage structurel évident : son moteur de recherche. L'intégration native de cette infrastructure dans NotebookLM pourrait lui conférer une pertinence documentaire difficile à égaler pour ses concurrents, à condition que l'expérience utilisateur suive et que le produit sorte de sa niche d'abonnés premium.

UEDisponible aux abonnés européens d'AI Ultra, cette mise à jour n'a pas d'impact institutionnel ou réglementaire spécifique pour la France ou l'UE.

💬 C'est exactement le virage qu'on attendait depuis que Perplexity a prouvé qu'aller chercher les sources soi-même, ça change tout. Google avait cet avantage depuis le début, son propre moteur, il l'intègre enfin là où ça compte. Bon, pour l'instant c'est AI Ultra only, donc faut pas s'attendre à ce que ça déferle tout de suite.

OutilsOutil
1 source
Apple annonce un assistant vocal plus conversationnel, surnommé « Siri AI »
126Ars Technica AI 

Apple annonce un assistant vocal plus conversationnel, surnommé « Siri AI »

Apple a officiellement présenté la refonte majeure de son assistant vocal Siri lors de sa conférence annuelle WWDC, filmée en avance comme à son habitude. Baptisée "Siri AI", cette nouvelle version s'inscrit dans le cadre plus large du programme "Apple Intelligence" dont le lancement avait été plusieurs fois repoussé. La mise à jour sera déployée cet automne via les mises à jour des systèmes d'exploitation Apple. Elle s'accompagne d'une intégration plus poussée des modèles d'IA embarqués, désormais alimentés en partie par Google, ainsi qu'une cohérence renforcée entre iOS, macOS et les autres plateformes de la marque. Le changement central porte sur la nature même de l'interaction : Siri ne se limite plus à des requêtes ponctuelles isolées, mais devient capable de mener des conversations continues, en jonglant entre différentes applications et contextes au fil d'un même échange. Lors des démonstrations, les cadres d'Apple ont montré l'assistant passer d'une tâche à une autre sans rupture, illustrant ce que la firme appelle une "expérience conversationnelle entièrement nouvelle". Pour les utilisateurs, cela représente un changement de paradigme : l'assistant devient un interlocuteur persistant plutôt qu'un outil de commande vocale. Apple tente ainsi de rattraper son retard face à des concurrents comme Google, OpenAI ou Microsoft, qui ont multiplié les annonces d'IA générative depuis 2023. Le vice-président senior Craig Federighi a d'ailleurs choisi de se démarquer explicitement, en critiquant implicitement cette course effrénée et en positionnant Apple comme un acteur centré sur l'utilisateur plutôt que sur la technologie pour elle-même. Ce discours, combiné au partenariat avec Google pour les modèles de fondation, soulève des questions sur la dépendance d'Apple à des tiers pour ses ambitions en IA, et sur la capacité de la marque à tenir ses promesses lors du déploiement effectif cet automne.

UELe déploiement de Siri AI sur les millions d'appareils Apple utilisés en France et en Europe soulève des questions de dépendance aux modèles Google, un axe susceptible d'intéresser les régulateurs européens au titre du DMA.

💬 Apple prend enfin le virage conversationnel, et c'est plus crédible que leurs annonces des deux dernières années. Bon, sur le papier, le coup du "pas de hype, on pense à l'utilisateur" sonne creux quand tu as signé un deal avec Google pour les modèles de fond. Reste à voir si ça tient à l'automne, ou si on se retrouve encore avec une démo parfaite et un rollout en demi-teinte.

Gemini 3.5 et Antigravity arrivent dans Google NotebookLM
127Ars Technica AI 

Gemini 3.5 et Antigravity arrivent dans Google NotebookLM

Google a annoncé une mise à jour majeure de NotebookLM, son outil d'analyse de documents propulsé par l'IA, en le faisant basculer vers Gemini 3.5 Flash, le modèle présenté lors du Google I/O 2025. Cette nouvelle version s'accompagne d'une prise en charge élargie des types de fichiers, d'une intégration web simplifiée pour ajouter des sources en ligne, et du support intégré d'Antigravity, un framework interne de Google. Selon l'entreprise, les tests comparatifs menés entre l'ancienne version basée sur Gemini 3.1 et la nouvelle donnent à NotebookLM un taux de victoire moyen de 65 % sur cinq dimensions d'évaluation clés : précision et qualité, support multilingue, analyse de grands documents, création de documents, et recherche avancée. Cette mise à jour compte pour les entreprises qui utilisent NotebookLM pour traiter de gros volumes de documents : Gemini 3.5 Flash promet des gains de vitesse significatifs et une réduction des coûts liés aux tokens, tout en maintenant une qualité de sortie comparable ou supérieure à la génération précédente. Pour les professionnels qui s'appuient sur l'outil pour synthétiser des rapports, analyser des contrats ou préparer de la documentation, les améliorations sur le multilingue et l'analyse de longs documents sont particulièrement concrètes. NotebookLM a été lancé en 2023, au tout début de l'explosion des outils d'IA générative, à une époque où Google multipliait les expérimentations sans nécessairement les pérenniser. Le fait que le produit soit non seulement maintenu mais régulièrement enrichi témoigne de son adoption réelle auprès des utilisateurs. Le déploiement de Gemini 3.5 Flash au-delà des API pour développeurs vers des produits grand public comme NotebookLM illustre la stratégie de Google : amortir les coûts de ses modèles les plus récents en les diffusant rapidement dans l'ensemble de son écosystème, face à une concurrence de plus en plus serrée de la part d'OpenAI, Anthropic et Microsoft.

UELes améliorations du support multilingue de NotebookLM bénéficient directement aux utilisateurs francophones et européens qui analysent des documents dans leur langue native.

OutilsOutil
1 source
Apple rend enfin Siri intelligent avec Siri AI (mais pas tout de suite en Europe…)
12801net 

Apple rend enfin Siri intelligent avec Siri AI (mais pas tout de suite en Europe…)

Apple s'apprête à transformer radicalement Siri en 2026, en intégrant l'intelligence artificielle générative ainsi que le modèle Gemini de Google au coeur de son assistant vocal. Cette refonte majeure dotера Siri d'une interface redessinée, d'une voix personnalisable et d'une capacité de compréhension contextuelle nettement améliorée, capable de produire des réponses plus précises et adaptées aux besoins de chaque utilisateur. Une nouvelle application dédiée permettra également de consulter l'historique complet des conversations et de synchroniser toutes les interactions sur l'ensemble des appareils Apple. Cette mise à jour représente un tournant pour Apple, qui accuse un retard significatif face à des concurrents comme OpenAI avec ChatGPT, Google avec Gemini ou Microsoft avec Copilot. L'intégration de l'IA générative devrait transformer Siri d'un assistant limité en un véritable copilote numérique capable de raisonner, d'enchaîner des tâches complexes et de maintenir le fil d'une conversation sur la durée. Pour les quelque 2 milliards d'utilisateurs d'appareils Apple dans le monde, cela représente un changement d'usage potentiellement profond. Le déploiement ne sera cependant pas immédiat ni universel : l'Europe, soumise aux contraintes réglementaires du Digital Markets Act, devra attendre une date encore indéfinie avant d'accéder à ces fonctionnalités. Ce retard illustre la tension croissante entre les ambitions des géants technologiques américains et le cadre législatif européen. Apple avait déjà retardé plusieurs fonctions d'Apple Intelligence dans l'Union européenne pour des raisons similaires, laissant les utilisateurs du Vieux Continent en marge des dernières avancées de la plateforme.

UELes utilisateurs européens d'appareils Apple devront attendre une date indéfinie avant d'accéder aux nouvelles fonctionnalités de Siri AI, le Digital Markets Act imposant des contraintes réglementaires qui excluent temporairement l'UE de ce déploiement majeur.

💬 Siri avec du raisonnement contextuel et Gemini derrière, c'est quand même pas rien pour 2 milliards d'appareils. Apple accusait un retard visible depuis des années, tout le monde le voyait, et là c'est enfin du concret. En Europe on attend encore, le DMA fait son travail, et on commence à s'y habituer.

OutilsOpinion
1 source
L'optimisation mathématique là où l'intuition échoue : des décisions à grande échelle
129AWS ML Blog 

L'optimisation mathématique là où l'intuition échoue : des décisions à grande échelle

Face aux décisions d'entreprise trop complexes pour l'intuition humaine, optimiser des milliers de routes de livraison, coordonner des centaines de robots en usine sans collision, gérer les plannings d'un hôpital 24h/24 en respectant toutes les contraintes réglementaires, des organisations de premier plan se tournent vers l'optimisation mathématique, une branche spécialisée de l'IA distincte du machine learning. L'équipe scientifique du AWS Generative AI Innovation Center accompagne ces entreprises en combinant expertise en modélisation mathématique, informatique quantique et calcul haute performance, entièrement déployés sur l'infrastructure AWS. Parmi les cas concrets, le Fidelity Center for Applied Technology (FCAT) illustre bien l'enjeu : leurs modèles de machine learning produisaient déjà de solides prédictions pour les décisions d'investissement et la gestion du risque, mais manquaient d'interprétabilité. En collaborant avec l'Innovation Center, FCAT a intégré l'explicabilité directement dans la construction des modèles, sans sacrifier leur précision prédictive, et en produisant des cadres réutilisables pour les développements futurs. Ce que l'optimisation mathématique apporte, que le machine learning ne peut pas fournir seul, c'est une réponse définitive et prouvablement optimale, et non une approximation probabiliste. Le machine learning est une IA inductive : il apprend des régularités à partir de milliers d'exemples pour produire des prédictions. L'optimisation est déductive : elle applique des principes mathématiques à un problème spécifique pour délivrer la meilleure décision possible compte tenu de toutes les contraintes réelles. Là où un algorithme prédictif dira "cet itinéraire est probablement efficace", l'optimisation répond "voici l'itinéraire optimal en intégrant chaque contrainte de votre système". Pour des opérations soumises à des limites physiques, des fenêtres horaires serrées ou des exigences réglementaires non négociables, cette différence est décisive. L'essor de ces approches s'inscrit dans une transformation plus large de l'IA d'entreprise, qui cherche à dépasser la simple prédiction pour atteindre la prescription, dire non pas ce qui va se passer, mais ce qu'il faut faire. Les pipelines dits "predict-then-optimize" combinent les deux disciplines : le machine learning prédit la demande future, l'optimisation mathématique détermine ensuite le plan d'action optimal à partir de ces prévisions. AWS positionne son Innovation Center comme un accélérateur de cette convergence, en prenant en charge la complexité scientifique que peu d'entreprises peuvent internaliser. La compétition pour maîtriser ces outils s'intensifie dans la logistique, la finance, la santé et l'industrie manufacturière, secteurs où une décision sous-optimale à grande échelle se chiffre en millions, et où l'IA prescriptive commence à supplanter les règles métier manuelles comme standard opérationnel.

OutilsOutil
1 source
Amazon Nova Sonic : évaluer un agent vocal à grande échelle, sans microphone
130AWS ML Blog 

Amazon Nova Sonic : évaluer un agent vocal à grande échelle, sans microphone

Amazon a publié le Nova Sonic Test Harness, un framework open source conçu pour automatiser les tests des agents vocaux construits sur son modèle Amazon Nova Sonic. Jusqu'ici, la seule méthode disponible pour les équipes de développement consistait à faire parler physiquement une personne à l'agent et à écouter les réponses, scénario par scénario. Avec 50 scénarios de conversation testés sur 3 personas utilisateurs distincts, cela représente 150 tests manuels, chacun prenant plusieurs minutes en temps réel. Multiplié par chaque modification de prompt ou de configuration d'outil, le coût en temps devient prohibitif. Le harness résout ce problème en simulant des conversations complètes multi-tours sans microphone, en évaluant les résultats via des techniques de jugement par LLM, et en détectant les cas d'hallucination audio, c'est-à-dire les situations où le texte généré et l'audio produit divergent, par exemple "15h00" à l'écrit contre "15h30" à l'oral. L'enjeu est considérable pour les entreprises qui déploient des agents vocaux dans des flux critiques comme la prise de rendez-vous, la gestion de commandes ou le support client. Sans framework d'évaluation automatisé, l'optimisation des prompts devient un travail à l'aveugle : impossible de savoir si une modification améliore ou dégrade le comportement de l'agent sur l'ensemble des cas d'usage avant un déploiement en production. Le harness permet désormais de lancer une suite de régression complète avant chaque mise à jour, de mesurer si l'agent gère correctement les cas limites sur des centaines de scénarios, et de détecter des régressions subtiles, comme un agent qui cesserait de confirmer une réservation, avant qu'un vrai client ne les rencontre. Les agents vocaux posent des défis techniques fondamentalement différents des chatbots textuels, ce qui explique pourquoi les outils d'évaluation existants ne s'adaptent pas directement. Les modèles speech-to-speech maintiennent une connexion full-duplex persistante avec flux audio et texte bidirectionnels simultanés, incompatible avec les outils HTTP classiques. Leurs réponses sont non-déterministes, le comportement pertinent se manifeste sur plusieurs tours de conversation, et les sessions expirent après environ huit minutes, nécessitant une gestion de la reconnexion et du replay d'historique. Amazon positionne Nova Sonic comme sa réponse aux besoins croissants des entreprises en matière d'interfaces vocales intelligentes, un marché en forte expansion où Google, Microsoft et des acteurs spécialisés comme ElevenLabs se disputent les contrats. La publication en open source du harness vise à abaisser la barrière d'adoption en offrant aux développeurs un outil de test professionnel dès le départ.

OutilsOutil
1 source
Comment booster l’engagement grâce à l’agent IA d’assistance client du Marketing Hub de HubSpot ?
131Le Big Data 

Comment booster l’engagement grâce à l’agent IA d’assistance client du Marketing Hub de HubSpot ?

HubSpot a intégré dans son Marketing Hub un agent conversationnel baptisé Breeze Customer Agent, disponible pour les abonnés aux niveaux Professional et Enterprise de l'ensemble de ses hubs. Cet outil s'appuie sur les données centralisées du CRM pour répondre aux visiteurs en temps réel, qualifier des leads et résoudre des problèmes courants, vingt-quatre heures sur vingt-quatre. Les chiffres publiés par HubSpot sont frappants : l'agent prend en charge 91 % des sessions de chat, résout 75 % des interactions sans intervention humaine, et réduit de 40 % le temps moyen de traitement des tickets d'assistance. En un an, sa capacité à clore des dossiers complexes de façon autonome est passée de 20 % à 70 %, selon les analyses internes de l'entreprise. Contrairement à un chatbot à scénario fixe, Breeze apprend en continu à partir de la base de connaissances, des articles d'aide, des pages web et des PDF fournis par l'entreprise. Il peut également exécuter des actions concrètes comme vérifier un statut de commande ou réinitialiser un mot de passe. L'impact opérationnel se traduit directement sur les équipes : les conseillers humains se trouvent dégagés des requêtes répétitives ou à faible valeur ajoutée, et peuvent concentrer leur expertise sur les dossiers complexes nécessitant de l'empathie ou de la négociation. Pour les directions marketing et commerciales, l'enjeu va au-delà du simple désengorgement des files d'attente. Les prospects qualifiés par l'agent au fil des échanges affichent un taux de conversion final trois fois supérieur à celui des formulaires issus de la recherche organique classique, ce qui transforme chaque interaction de support en opportunité commerciale mesurable. Déployé sur des pages d'atterrissage ou un blog, l'agent oriente les visiteurs vers des contenus pertinents, valide des inscriptions à des webinaires et convertit du trafic anonyme en contacts identifiés et scorés dans le CRM. Ce lancement s'inscrit dans une vague d'intégration des agents IA dans les plateformes CRM et marketing, où Salesforce, Zendesk et Intercom se livrent une concurrence serrée sur le terrain de l'automatisation du service client. HubSpot mise sur son avantage de données unifiées : en connectant l'agent directement au CRM, il élimine la friction habituelle entre les outils de support et les outils de vente. La progression spectaculaire du taux de résolution autonome en douze mois illustre aussi la maturité croissante des grands modèles de langage appliqués à des contextes métier précis. La prochaine étape logique pour HubSpot serait d'étendre les capacités d'action de l'agent, au-delà des réinitialisations de mot de passe, vers des workflows transactionnels plus complexes comme la gestion de renouvellements ou la personnalisation d'offres en temps réel.

UELes entreprises européennes abonnées à HubSpot Marketing Hub Professional ou Enterprise peuvent déployer cet agent pour automatiser leur service client et améliorer la qualification de leads sans intégration tierce.

OutilsOutil
1 source
Aviva utilise l'IA pour bloquer 230 millions de livres de fraude à l'assurance
132AI News 

Aviva utilise l'IA pour bloquer 230 millions de livres de fraude à l'assurance

Aviva, l'un des plus grands assureurs britanniques, a détecté un montant record de 230 millions de livres sterling de fraudes à l'assurance en 2025, et l'entreprise attribue cette performance à un système de détection basé sur l'intelligence artificielle qu'elle a développé en interne. Ce chiffre dépasse les années précédentes et reflète une réalité alarmante : les fraudeurs utilisent désormais eux-mêmes des outils d'IA générative pour fabriquer des preuves, photos d'accidents de voiture générées de toutes pièces, faux rapports médicaux, factures de réparation fictives, avec un niveau de réalisme suffisant pour tromper un gestionnaire de sinistres humain sous pression. Un individu ou un petit groupe peut aujourd'hui produire les documents justificatifs de dizaines de dossiers à valeur élevée sans quitter son bureau, armé d'un simple abonnement à un service d'IA. Face à cette industrialisation de la fraude, Aviva a déployé un système de contre-mesure opérant à la même échelle et à la même vitesse que la menace. Son IA analyse des millions de points de données issus de sinistres passés et en cours pour établir ce à quoi ressemble une demande légitime. Lorsqu'un nouveau dossier arrive, le système effectue une vérification croisée en temps réel : les dommages visibles sur les photos correspondent-ils à la physique de l'accident décrit ? Les horodatages des documents sont-ils cohérents ? L'immatriculation du véhicule apparaît-elle dans d'autres dossiers suspects ? Le coût des réparations est-il anormal par rapport à des milliers de cas similaires dans la même région ? Ce niveau d'analyse forensique serait impossible à réaliser manuellement sur les milliers de sinistres traités chaque jour. Aviva insiste sur le fait que son système reste un outil d'aide à la décision : l'IA filtre et signale les anomalies, mais des enquêteurs humains statuent en dernier ressort, ce qui préserve l'équité et la transparence du processus. La fraude détectée ne provient pas uniquement de réseaux criminels organisés. Une part significative du montant de 230 millions de livres correspond à ce que l'industrie appelle l'inflation des sinistres : des garagistes qui gonflent les devis, des assurés qui surévaluent des biens volés ou exagèrent des blessures mineures. Ce phénomène, plus diffus et plus difficile à prouver, est également dans le viseur de l'IA d'Aviva, qui compare systématiquement chaque devis reçu avec des bases de données de prix du marché pour le même modèle, la même pièce, la même région. Le cas Aviva illustre un basculement structurel dans le secteur assurantiel : l'IA générative a abaissé le coût d'entrée dans la fraude sophistiquée, forçant les assureurs à industrialiser leur propre défense. D'autres grands acteurs du secteur, AXA, Allianz, Zurich, observent de près ce modèle, qui pourrait rapidement devenir la norme dans toute entreprise exposée à des demandes massives de remboursement ou de compensation.

UELes assureurs européens AXA et Allianz observent attentivement ce modèle de détection IA, susceptible de devenir la norme dans le secteur assurantiel européen face à l'industrialisation de la fraude par l'IA générative.

💬 C'est l'escalade classique, mais à une vitesse qui fait un peu peur. Les fraudeurs ont pris la GenAI en premier pour fabriquer des preuves à la chaîne, et Aviva a dû sortir un système capable de vérifier à la même échelle, en temps réel. Pour AXA et Allianz qui regardent de loin, c'est pas un modèle inspirant, c'est une contrainte.

OutilsOutil
1 source
Weis Markets adopte les chariots intelligents d'Instacart dans ses magasins
133AI News 

Weis Markets adopte les chariots intelligents d'Instacart dans ses magasins

Weis Markets, chaîne de supermarchés basée en Pennsylvanie avec 199 magasins, déploie les chariots intelligents Caper Carts d'Instacart dans plusieurs de ses points de vente. Ces chariots embarquent des caméras orientées vers le panier, des balances certifiées, des systèmes de géolocalisation et un écran tactile. Leur logiciel repose sur de l'IA entraînée sur plus de 1,6 milliard de commandes en ligne, combinée à du calcul embarqué sur l'appareil. Les clients peuvent suivre leurs dépenses en temps réel, accéder à des coupons géolocalisés, se connecter à leur compte Weis Rewards pour cumuler des avantages fidélité, et consulter une fonction "Buy It Again" qui affiche leurs achats habituels. Greg Zeh, directeur des systèmes d'information de Weis, présente ces chariots comme un moyen de fluidifier l'expérience en rayon tout en connectant les données du magasin physique à celles de la vente en ligne. Ce déploiement illustre l'accélération d'Instacart sur le segment des magasins connectés, après une période centrée sur la livraison à domicile. Les Caper Carts sont désormais présents dans plus de 100 villes, répartis dans 15 États américains, chez une douzaine d'enseignes dont Kroger, Schnucks et les bannières Wakefern comme ShopRite et Fairway Market. Des données opérationnelles commencent à émerger : chez Schnucks, un magasin équipé de seulement 10 chariots intelligents pour 160 classiques a vu ces derniers traiter plus de 10 % des ventes lors des journées chargées, selon Retail Dive. Pour les distributeurs, l'enjeu est double : améliorer l'expérience client tout en capturant des données comportementales en magasin jusqu'ici inaccessibles. Weis ne mise pas uniquement sur les chariots : en décembre 2025, la chaîne a finalisé le déploiement du système ELERA Security Suite de Toshiba sur les caisses libre-service de l'ensemble de ses 199 magasins, avec reconnaissance des fruits et légumes et outils anti-démarque inconnue basés sur l'IA embarquée. Plus de 94 % des clients ont utilisé la fonction de reconnaissance des produits. En parallèle, Albertsons, qui exploite plus de 2 000 magasins sous les enseignes Safeway, Jewel-Osco et ACME, a développé en interne un outil de contrôle qualité par vision artificielle pour détecter les fruits abîmés ou moisis avant leur mise en rayon, en commençant par les fraises et les raisins. Ce système, construit sur la plateforme Google Cloud Gemini Enterprise avec Vision AI, vise à standardiser les inspections dans les centres de distribution. La grande distribution américaine engage ainsi une transformation profonde de ses opérations, en intégrant l'IA à chaque étape de la chaîne, du centre logistique jusqu'au chariot du client.

OutilsOutil
1 source
☕️ Ubuntu : vers de la reconnaissance vocale pour tous les champs texte
134Next INpact 

☕️ Ubuntu : vers de la reconnaissance vocale pour tous les champs texte

Canonical prévoit d'intégrer la reconnaissance vocale directement dans les champs texte d'Ubuntu, une fonctionnalité annoncée fin mai par Jon Seager, vice-président de l'ingénierie chez Canonical, lors du dernier Ubuntu Summit. Cette capacité, qui permettrait de dicter du texte dans la quasi-totalité des champs de saisie du système, est ciblée pour Ubuntu 26.10, la version attendue en octobre 2026, sous réserve que les tests se déroulent dans les délais. Seager a également mentionné deux autres fonctions dans le même registre : l'amélioration automatique de l'autofocus de la webcam et la qualité audio du microphone. Ces trois fonctionnalités seront traitées localement par un LLM embarqué, sans précision sur le modèle retenu. Techniquement, l'ensemble sera conditionné par un paquet Snap, que l'utilisateur pourra supprimer s'il ne souhaite pas utiliser ces services. L'apport le plus immédiat concerne l'accessibilité : permettre aux personnes ayant des difficultés motrices ou visuelles d'interagir avec n'importe quelle application via la voix, sans dépendre d'un logiciel tiers ou d'un service cloud. En intégrant cette capacité au niveau du système d'exploitation plutôt que de l'application, Canonical contourne la fragmentation habituelle des solutions d'accessibilité sous Linux, où la couverture varie fortement d'un environnement de bureau à l'autre. Pour les utilisateurs ordinaires, la dictée vocale universelle représente également un gain de productivité concret. Le fait que le traitement soit entièrement local élimine les problèmes de confidentialité liés à l'envoi de données audio vers des serveurs distants, ce qui distingue l'approche de Canonical de solutions comme la dictée Google ou Whisper en mode API. Cette annonce s'inscrit dans un contexte plus large de repositionnement de Canonical autour de l'IA, amorcé en avril dernier et accompagné de son lot de scepticisme dans la communauté open source. Le débat central porte sur la compatibilité des modèles d'IA avec les valeurs du logiciel libre : connaître les poids d'un modèle ne suffit pas, selon Seager, à garantir la transparence à laquelle l'écosystème libre est habitué, ce qui implique une attention particulière aux licences. Canonical semble pour l'instant adopter une stratégie prudente, ajoutant des cas d'usage concrets et limités plutôt que de viser immédiatement un "système agentique" comme le suggèrent ses propres éléments de communication. Une question pratique reste ouverte : un modèle local pèse souvent plusieurs gigaoctets, et l'installeur d'Ubuntu ne semble pas prévoir d'étape permettant à l'utilisateur de choisir explicitement quels services IA il souhaite activer, ce qui pourrait alourdir significativement l'empreinte de stockage de l'installation par défaut.

UEUbuntu étant largement déployé dans les administrations publiques et entreprises européennes, l'approche de traitement vocal entièrement local répond directement aux exigences RGPD en évitant l'envoi de données audio vers des serveurs tiers.

OutilsOutil
1 source
Pourquoi les stablecoins pourraient devenir la monnaie native des agents IA
135FrenchWeb 

Pourquoi les stablecoins pourraient devenir la monnaie native des agents IA

L'essor des agents d'intelligence artificielle autonomes soulève une question concrète que l'économie numérique n'avait jamais eu à résoudre : comment un logiciel peut-il payer un autre logiciel, en temps réel, sans intervention humaine ? Cette problématique, encore théorique il y a trois ans, est désormais au centre des discussions dans les écosystèmes tech et crypto. Les stablecoins, ces cryptomonnaies indexées sur des devises stables comme le dollar, s'imposent comme la réponse la plus sérieuse pour permettre ces transactions machine-à-machine à grande échelle. L'infrastructure bancaire traditionnelle, conçue pour des humains dotés d'une identité légale, est structurellement inadaptée aux besoins des agents IA : délais de règlement incompatibles avec des traitements en millisecondes, exigences KYC inapplicables à un logiciel, montants minimaux de transaction prohibitifs pour des micropaiements de fractions de centimes. Les stablecoins, en revanche, fonctionnent nativement sur des blockchains programmables, permettant des transferts instantanés et quasi-gratuits entre systèmes autonomes, sans intermédiaire humain ni compte bancaire requis. Cette convergence s'inscrit dans l'accélération du mouvement dit "agentic AI", porté activement par Anthropic, OpenAI et Google, dont les agents auront bientôt besoin d'accéder à des API tierces, des services cloud ou d'autres agents spécialisés contre paiement. Les émetteurs de stablecoins comme Circle (USDC) et Tether (USDT) perçoivent ce marché comme un vecteur de croissance considérable, d'autant que la régulation américaine clarifie progressivement le cadre légal de ces instruments, renforçant leur légitimité pour des usages institutionnels et automatisés.

UELe règlement MiCA, déjà en vigueur dans l'UE, encadre les stablecoins comme l'USDC et pourrait faciliter leur adoption par les entreprises européennes développant des agents IA autonomes.

OutilsOpinion
1 source
ZoomMate connecte les conversations aux workflows
136Le Big Data 

ZoomMate connecte les conversations aux workflows

Zoom a dévoilé ZoomMate et son AI Productivity Suite, deux nouvelles offres destinées à transformer les conversations professionnelles en actions concrètes au sein des workflows d'entreprise. Présentées comme un "espace de travail intelligent", ces solutions s'appuient sur un moteur de recherche capable d'interroger simultanément les données stockées dans Zoom et dans une dizaine d'applications tierces : Salesforce, Jira, ServiceNow, Slack, Workday, Microsoft 365 et Google Workspace sont notamment intégrés. L'objectif est de permettre aux équipes de retrouver instantanément une information issue d'une réunion, de déclencher des tâches, de planifier des rendez-vous ou de mettre à jour des dossiers directement depuis l'interface Zoom. L'AI Productivity Suite ajoute une couche de génération documentaire : présentations, comptes rendus, feuilles de calcul et propositions commerciales peuvent être produits automatiquement à partir du contenu des échanges, chaque document restant traçable jusqu'à la conversation qui l'a engendré. L'enjeu pour les entreprises est réel : une part considérable de la valeur produite lors des réunions se perd faute de mécanismes efficaces pour en extraire et redistribuer l'information. En reliant directement les échanges aux outils opérationnels, Zoom cherche à réduire la friction entre décision et exécution, un problème chronique dans les organisations distribuées qui jonglent entre visioconférence, CRM, gestion de projet et messagerie. Si les promesses sont tenues, les équipes commerciales pourraient mettre à jour un compte Salesforce en sortant d'un appel client, ou les développeurs créer un ticket Jira dès la fin d'une réunion de sprint, sans changer d'outil. Zoom insiste également sur le respect des règles de sécurité et des permissions définies par chaque organisation, un argument central pour convaincre les DSI dans des contextes réglementés. Ces annonces s'inscrivent dans une transformation stratégique profonde de Zoom, dont la croissance explosive pendant la pandémie a brutalement ralenti avec le retour au bureau. Confronté à la concurrence de Microsoft Teams, qui dispose déjà de Copilot intégré à tout l'écosystème 365, et de Google Meet, Zoom ne peut plus se contenter d'être une application de visioconférence. L'entreprise cherche à se repositionner comme une plateforme de productivité à part entière, un terrain où elle affronte directement des acteurs bien établis. L'intégration de l'IA générative dans le cœur du produit est désormais le passage obligé pour justifier les licences entreprise et enrayer le churn. ZoomMate représente le pari que la richesse des conversations professionnelles captées sur la plateforme constitue un avantage différenciant, à condition que les intégrations tierces fonctionnent avec la fiabilité que les équipes métier exigent au quotidien.

UELes entreprises françaises et européennes utilisant Zoom pourraient automatiser leurs workflows entre réunions et outils métier (CRM, gestion de projet), sous réserve que les intégrations tierces respectent les contraintes réglementaires locales.

OutilsOutil
1 source
Microsoft AI lance MAI-Transcribe-1.5 : 2,4 % de taux d'erreur et transcriptions longues jusqu'à 5x plus rapides
137MarkTechPost 

Microsoft AI lance MAI-Transcribe-1.5 : 2,4 % de taux d'erreur et transcriptions longues jusqu'à 5x plus rapides

Microsoft a dévoilé la semaine dernière MAI-Transcribe-1.5, la deuxième génération de son modèle de reconnaissance vocale développé en interne. Ce système de transcription automatique prend en charge 43 langues, contre 25 pour la version précédente, avec dix-huit nouvelles langues ajoutées sans dégradation des performances, dont le bengali, le tamoul, le télougou côté Asie du Sud, et l'ukrainien, le grec ou le catalan côté Europe. Sur le benchmark multilingue FLEURS, Microsoft revendique la première place parmi les modèles du marché. Sur le classement Artificial Analysis, le modèle affiche un taux d'erreur par mot (WER) de 2,4 %, ce qui le place troisième dans un champ concurrentiel. En vitesse, il est capable de transcrire une heure d'audio en moins de 15 secondes et se révèle jusqu'à 5 fois plus rapide que des modèles comparables comme Gemini 3.1, Scribe v2 ou GPT-4o-Transcribe sur des fichiers longs. MAI-Transcribe-1.5 est intégré à Copilot, Teams, GitHub et Dynamics 365 Contact Centre, et disponible via Foundry, la plateforme de modèles de Microsoft. La fonctionnalité qui mérite le plus d'attention est le « keyword biasing », ou biais par entités nommées. Les transcripteurs génériques trébuchent régulièrement sur les vocabulaires métiers, noms propres, termes médicaux, acronymes internes, précisément là où les erreurs coûtent le plus cher. MAI-Transcribe-1.5 permet de fournir jusqu'à 200 mots-clés personnalisés que le modèle prend en compte lors de la transcription, sans forcer mécaniquement les correspondances mais en s'appuyant sur le contexte. Résultat : une réduction de 30 % du WER sur FLEURS lorsque ce mécanisme est activé. Sur les réunions d'entreprise, dans les centres d'appels ou les environnements de santé, cette capacité change concrètement la qualité des transcriptions produites. La détection automatique de la langue parlée, sans paramétrage manuel, complète l'ensemble pour des flux d'entrée non structurés. La course aux modèles de transcription s'est considérablement intensifiée depuis que OpenAI a popularisé Whisper et que des acteurs comme AssemblyAI ou ElevenLabs ont investi le segment entreprise. Microsoft, fort de son infrastructure Azure et de son intégration profonde dans les outils de productivité, cherche à imposer une solution maison plutôt que de dépendre de fournisseurs tiers. Le passage de 25 à 43 langues, avec une couverture renforcée des langues d'Asie du Sud, reflète aussi une ambition de croissance sur des marchés où l'anglais n'est pas dominant. Pour les équipes qui traitent des archives audio volumineuses en batch, médias, justice, santé, support client, un facteur de vitesse de 5x sur les fichiers longs n'est pas anecdotique : il réduit directement les coûts d'infrastructure et les délais de traitement à grande échelle.

UELes entreprises européennes intégrées à l'écosystème Microsoft (Teams, Dynamics 365) bénéficieront directement de ces gains de précision et de vitesse, avec un support renforcé des langues européennes comme le grec, le catalan et l'ukrainien.

OutilsOpinion
1 source
Google Research intègre un RAG à base d'agents dans Gemini Enterprise pour les requêtes multi-étapes
138MarkTechPost 

Google Research intègre un RAG à base d'agents dans Gemini Enterprise pour les requêtes multi-étapes

L'équipe Google Research a présenté le 5 juin 2026 un nouveau cadre de récupération augmentée par agents, intégré directement à la plateforme Gemini Enterprise Agent. Cette architecture, désormais disponible en préversion publique sous le nom Cross-Corpus Retrieval, s'attaque à une limite bien connue des systèmes de recherche d'entreprise : l'incapacité à enchaîner plusieurs étapes de raisonnement sur des sources de données distinctes. Concrètement, là où un système RAG classique échoue face à une requête du type "Quelles sont les spécifications du serveur utilisé dans le Projet X ?" (parce qu'il trouve un identifiant mais ne sait pas aller chercher les specs dans une deuxième base), le nouveau système orchestre une série d'agents spécialisés. Un Orchestrateur délègue la tâche, un Agent Planificateur identifie les sources pertinentes, un Agent Réécriture de Requêtes décompose la question en sous-requêtes précises, et un Agent de Diffusion envoie ces requêtes en parallèle. Sur le benchmark FramesQA, un corpus de 824 questions et 2 676 documents PDF, le système affiche un gain de précision factuelle allant jusqu'à 34 % par rapport au RAG standard, avec de meilleures performances également sur des jeux de données propriétaires internes à Google. Ce qui distingue fondamentalement cette architecture de ses concurrentes, c'est la présence d'un Agent de Contexte Suffisant, pièce centrale du dispositif. Plutôt que de générer une réponse dès que le premier cycle de recherche se termine, cet agent inspecte les résultats, compare un brouillon intermédiaire aux extraits récupérés, et produit un journal détaillé des lacunes identifiées, avec des raisons et des feedbacks explicites. Si des informations manquent, le cycle repart : la requête est reformulée, de nouvelles sources sont explorées. Ce mécanisme d'itération évite deux défauts symétriques : la réponse incomplète présentée comme définitive, et la capitulation prématurée du modèle face à un contexte insuffisant. Pour une question médicale portant à la fois sur les médicaments de sortie, les restrictions alimentaires et les allergies d'un patient, le système ne s'arrête pas à deux éléments sur trois, il continue jusqu'à ce que les trois soient vérifiés. Google positionne cette avancée dans un contexte de concurrence intense sur les agents d'entreprise, un marché où Microsoft, Salesforce et plusieurs startups spécialisées investissent massivement. Le problème des requêtes multi-sources, dit "multi-hop", est depuis plusieurs années l'un des obstacles majeurs à l'adoption des LLM en environnement professionnel réel, où les données sont fragmentées entre bases de connaissances, systèmes CRM, dossiers PDF et notes cliniques. En intégrant cette capacité directement dans Gemini Enterprise Agent Platform plutôt que de la proposer comme une bibliothèque tierce, Google cherche à ancrer ses modèles au coeur des infrastructures de données des grandes organisations, tout en améliorant la fiabilité des réponses là où elle est la plus critique.

UELes entreprises européennes utilisant Gemini Enterprise peuvent accéder en préversion à cette architecture multi-corpus, susceptible d'améliorer l'adoption des LLM dans des secteurs à données fragmentées comme la santé ou la finance.

💬 Le truc intéressant, c'est l'agent de contexte suffisant : il sait ce qu'il lui manque, relance la recherche, et ne s'arrête pas avant d'avoir les trois éléments sur trois. C'est exactement ce qui casse les RAG classiques en prod, pas le retrieval en lui-même. Que Google l'intègre directement dans la plateforme plutôt qu'en lib tierce, ça dit tout sur leur stratégie d'ancrage infrastructure.

OutilsOutil
1 source
ChatGPT : OpenAI prépare sa plus grande transformation depuis son lancement
139Le Big Data 

ChatGPT : OpenAI prépare sa plus grande transformation depuis son lancement

OpenAI prépare une refonte profonde de ChatGPT, son assistant conversationnel lancé en novembre 2022, avec l'ambition de le transformer en une "super-application" multifonction. Selon des informations publiées début juin 2026, la plateforme ne se limiterait plus à la conversation textuelle mais intégrerait de manière renforcée des outils de génération d'images, des capacités d'agents IA autonomes capables d'exécuter des tâches complexes, et des partenariats approfondis avec des services tiers comme Canva ou Booking.com. L'outil de codage Codex, déjà lancé par OpenAI, serait également mis davantage en avant dans cette nouvelle architecture. L'objectif déclaré : faire de ChatGPT un point d'entrée unique pour une large palette d'usages numériques, du travail créatif au développement logiciel en passant par la planification de voyages. Cette transformation répond à une logique économique autant que technologique. Les entreprises représentent déjà près de 40 % des revenus d'OpenAI, et la société vise à accroître cette proportion dans les prochains mois. En centralisant davantage de services au sein d'une seule plateforme, OpenAI espère augmenter l'engagement des utilisateurs professionnels, généralement plus disposés à payer pour des outils qui leur font gagner du temps. Codex, l'assistant dédié au développement informatique, illustre cette stratégie : il gagne rapidement du terrain auprès des développeurs, un segment à forte valeur monétisable. Pour les utilisateurs grand public, l'intégration de partenaires comme Booking.com ou Canva pourrait réduire le besoin de passer d'une application à l'autre, augmentant ainsi la durée et la fréquence d'utilisation de ChatGPT. Cette évolution s'inscrit dans un contexte de concurrence IA intense. Google avec Gemini, Anthropic avec Claude, Meta avec ses modèles open-source et des dizaines de startups se disputent le même espace. OpenAI, valorisé à plus de 300 milliards de dollars lors de sa dernière levée de fonds en 2025, doit justifier cette valorisation auprès d'investisseurs qui attendent une croissance des revenus récurrents, notamment en vue d'une introduction en bourse anticipée. La stratégie de la super-application n'est pas nouvelle dans la tech : WeChat en Chine a démontré qu'un écosystème fermé et centralisé peut générer une dépendance utilisateur extrêmement rentable. Pour OpenAI, l'enjeu est de réussir cette transition sans aliéner sa base d'utilisateurs actuels, habitués à un outil simple et direct, tout en convainquant les entreprises partenaires que l'intégration dans l'écosystème ChatGPT vaut l'investissement.

UELe partenariat avec Booking.com (Amsterdam) illustre l'intégration d'acteurs européens dans l'écosystème ChatGPT, mais l'impact direct sur les entreprises françaises ou les régulations européennes reste diffus.

💬 La stratégie super-application, c'est le WeChat playbook appliqué à l'IA, et sur le papier ça tient la route. Ce qui m'intéresse vraiment là-dedans, c'est moins Booking.com que Codex : si les devs adoptent massivement l'outil, OpenAI touche le segment le plus monétisable qui soit. Reste à voir si les utilisateurs lambda voudront bien troquer la simplicité actuelle contre une plateforme fourre-tout.

OutilsOpinion
1 source
☕️ Google teste le remplacement des résultats de recherche classiques par le mode IA dans Chrome
140Next INpact 

☕️ Google teste le remplacement des résultats de recherche classiques par le mode IA dans Chrome

Google expérimente actuellement un réglage dans la version Canary (alpha) de Chrome qui remplacerait l'affichage traditionnel des résultats de recherche par son AI Mode, le chatbot conversationnel propulsé par les mêmes modèles que Gemini. Ce paramètre, accessible via chrome://flags sous le nom "Fulfill Searchbox Queries in AI Mode", a été découvert par le site Windows Report. Concrètement, il inverse le comportement par défaut : toute requête saisie dans la barre de recherche ouvre directement le mode IA, reléguant les résultats classiques sous forme de liens web à un clic supplémentaire sur un bouton "All". Le développeur Google ayant implémenté ce flag précise qu'il s'agit d'une phase d'"exploration" et qu'aucun déploiement en production n'est prévu à ce stade. L'enjeu est considérable pour l'écosystème web. Les AI Overviews, ces résumés générés automatiquement qui s'affichent déjà en tête des résultats Google, sont régulièrement accusés de priver les sites d'information et les éditeurs de trafic organique en répondant directement aux questions sans inciter au clic. Un basculement vers un mode IA par défaut amplifierait massivement ce phénomène, rendant encore moins nécessaire la visite des sources originales. Pour les médias, blogs et sites e-commerce dont le modèle économique repose sur le trafic Google, ce serait un changement structurel majeur. À l'inverse, pour les utilisateurs, cela représenterait une expérience plus fluide et conversationnelle, dans la lignée de ce que proposent déjà Perplexity ou ChatGPT Search. Google se trouve dans une position délicate depuis l'émergence des moteurs de recherche alimentés par IA. Des millions d'utilisateurs ont commencé à délaisser le moteur traditionnel au profit de ChatGPT ou Perplexity pour leurs recherches, ce qui menace directement le coeur du modèle publicitaire du groupe Alphabet. En réponse, Google intègre de l'IA à grande vitesse dans tous ses services, au risque d'accélérer la désintermédiation du web que ses propres produits contribuent à créer. Le niveau de finition du flag découvert, avec la prise en charge des raccourcis clavier Ctrl+clic et clic molette pour ouvrir des onglets, suggère que le travail dépasse le simple prototypage. La formulation prudente du développeur, "pas prévu à ce stade", laisse la porte ouverte à une mise en production future, peut-être progressive ou géographiquement limitée, à mesure que Google mesure l'appétit des utilisateurs pour ce changement radical d'interface.

UELes éditeurs et médias français dont le modèle économique repose sur le trafic organique Google risquent une réduction structurelle de leur audience si ce mode IA devient le comportement par défaut dans Chrome.

💬 C'est le truc que tous les éditeurs redoutent depuis deux ans. Google est dans une position impossible : continuer à faire semblant que son moteur et ses résumés IA coexistent pacifiquement, ou basculer pour de vrai et tarir définitivement le trafic organique du web. Le flag est trop avancé pour que le "pas prévu en prod" tienne très longtemps.

Optimisation de prompts par réflexion avec GEPA : multi-composants, feedback structuré et validation
141MarkTechPost 

Optimisation de prompts par réflexion avec GEPA : multi-composants, feedback structuré et validation

GEPA, un framework d'optimisation de prompts par évolution réflexive, permet d'améliorer automatiquement les instructions données à un modèle de langage en analysant ses erreurs et en générant des variantes plus performantes. Dans un tutoriel récent, des développeurs ont mis en oeuvre cette approche pour résoudre des problèmes arithmétiques formulés en langage naturel. L'architecture repose sur deux modèles distincts : GPT-4o-mini d'OpenAI comme modèle d'exécution des tâches, et GPT-4.1 comme modèle de réflexion chargé d'améliorer les prompts. Le système démarre avec un prompt initial faible, génère un benchmark déterministe de 18 problèmes (réductions commerciales, distances de voyage, calculs de portefeuille, opérations en chaîne), puis itère jusqu'à un budget maximal de 100 appels métriques. Le dataset est séparé en 12 exemples d'entraînement et 6 de validation pour mesurer la généralisation. Ce qui distingue GEPA d'une simple optimisation manuelle, c'est sa capacité à faire évoluer simultanément plusieurs composantes d'un prompt. Ici, ce ne sont pas seulement les instructions générales qui changent, mais aussi les règles de format de sortie, les deux évoluant ensemble comme un système couplé. Le modèle de réflexion reçoit un retour structuré et actionnable sur les raisons précises de l'échec d'un prompt candidat, ce qui lui permet de cibler ses corrections plutôt que de procéder à l'aveugle. Cette boucle d'amélioration automatisée réduit considérablement le travail manuel de prompt engineering, un processus qui peut prendre des heures à des équipes entières chez des entreprises déployant des LLMs en production. Pour les ingénieurs et les chercheurs, cela signifie qu'un système peut apprendre de ses propres erreurs de façon systématique, sans intervention humaine à chaque itération. Le prompt engineering automatisé représente l'un des axes de recherche les plus actifs dans l'écosystème des modèles de langage. Des frameworks comme DSPy de Stanford, TextGrad ou encore APE (Automatic Prompt Engineer) ont ouvert cette voie ces deux dernières années, cherchant à remplacer l'intuition humaine par une optimisation guidée par des métriques. GEPA se positionne dans cette lignée en y ajoutant la dimension réflexive : le modèle n'optimise pas à l'aveugle, il comprend pourquoi un prompt échoue. L'utilisation de LiteLLM comme couche d'abstraction permet en outre de brancher n'importe quel fournisseur de modèles, ce qui rend l'approche agnostique à l'infrastructure. À mesure que les LLMs s'intègrent dans des pipelines critiques, la capacité à optimiser automatiquement les prompts sur des benchmarks maison devient un avantage concurrentiel direct, réduisant les coûts d'inférence et améliorant la fiabilité sans multiplier les appels humains en boucle.

💬 Le prompt engineering à la main, c'est des heures perdues à tâtonner pour gagner 3% de perf. Ce qui distingue GEPA des frameworks similaires (DSPy, TextGrad, APE), c'est que le système comprend pourquoi un prompt rate avant de proposer mieux, pas juste une variation à l'aveugle. Reste à voir si ça tient sur des tâches moins propres que des problèmes arithmétiques, mais le principe, là, il est solide.

OutilsTuto
1 source
OpenAI annonce la fin du chat et projette de transformer ChatGPT en application d'agents autonomes
142The Decoder 

OpenAI annonce la fin du chat et projette de transformer ChatGPT en application d'agents autonomes

OpenAI prépare la refonte la plus ambitieuse de ChatGPT depuis son lancement en novembre 2022. L'entreprise entend transformer son chatbot en une "superapp" intégrant des outils de programmation, des agents autonomes et des applications partenaires comme Canva et Booking.com. En interne, la formule circule sans détour : "Le chat est mort." La direction considère que l'ère des échanges textuels à la demande est révolue, et que l'avenir appartient à des systèmes capables d'accomplir des tâches de manière autonome, sans que l'utilisateur n'ait à intervenir à chaque étape. Ce pivot stratégique marque un tournant majeur pour l'industrie. Jusqu'ici, ChatGPT fonctionnait principalement comme un assistant répondant à des questions. Demain, il devrait gérer des workflows entiers : réserver un voyage, écrire et déployer du code, concevoir un visuel, en s'appuyant sur des intégrations directes avec des services tiers. Pour les utilisateurs professionnels, cela représente un saut qualitatif considérable, et pour les plateformes partenaires comme Canva ou Booking.com, une opportunité de distribution massive via l'une des applications les plus utilisées au monde. Cette réorientation s'inscrit dans une course mondiale aux agents IA que se livrent les principaux laboratoires. Google pousse Gemini vers les mêmes usages autonomes, Anthropic développe les capacités agentiques de Claude, et des startups comme Cursor ou Cognition ciblent directement les développeurs. OpenAI, qui revendique plus de 500 millions d'utilisateurs hebdomadaires sur ChatGPT, dispose d'un avantage de distribution considérable pour imposer ce nouveau paradigme, mais devra convaincre que ses agents sont suffisamment fiables pour qu'on leur délègue des tâches à enjeux réels.

UEL'intégration de Booking.com (entreprise néerlandaise) comme partenaire de la superapp ChatGPT soulève des questions de dépendance des acteurs européens du tourisme et du numérique envers une plateforme américaine dominante, dans un contexte où l'AI Act encadre précisément les systèmes d'IA à usage général de grande diffusion.

💬 Le "chat is dead", j'y crois à moitié. La direction où ça va est claire, les agents autonomes c'est l'évolution logique, mais déléguer une réservation d'hôtel ou un déploiement de code à un système qui hallucine encore sur des trucs basiques, ça va demander du temps. Ce qui m'intéresse vraiment c'est le modèle de distribution : 500 millions d'utilisateurs hebdomadaires, c'est une rampe de lancement que personne d'autre n'a.

OutilsOpinion
1 source
Perplexity lance "Search as Code" : les modèles d'IA peuvent désormais écrire leurs propres pipelines de recherche
143The Decoder 

Perplexity lance "Search as Code" : les modèles d'IA peuvent désormais écrire leurs propres pipelines de recherche

Perplexity a dévoilé une nouvelle architecture baptisée "Search as Code" qui redéfinit la façon dont les modèles d'IA effectuent des recherches en ligne. Plutôt que de s'appuyer sur des API de recherche figées aux paramètres prédéfinis, le système permet aux agents IA de rédiger eux-mêmes leurs propres routines de recherche en Python, directement dans un environnement sandbox sécurisé. Le modèle gère en autonomie le filtrage des résultats et la déduplication des sources, sans passer par des interfaces rigides. Résultat annoncé: une réduction des coûts en tokens pouvant atteindre 85%, et des performances supérieures à celles d'OpenAI et d'Anthropic sur plusieurs benchmarks de référence. L'enjeu est considérable pour les entreprises qui intègrent la recherche web dans leurs pipelines d'IA. Jusqu'ici, les agents devaient s'adapter aux contraintes imposées par des APIs standardisées, souvent peu optimisées pour des requêtes complexes ou itératives. En donnant au modèle la main sur sa propre logique de recherche, Perplexity promet des réponses plus précises, moins de redondances et une facture computationnelle drastiquement réduite, ce qui ouvre la voie à des déploiements à grande échelle. Cette annonce s'inscrit dans une course effrénée entre Perplexity, OpenAI et Anthropic autour du "web search" intégré aux LLMs, un marché stratégique depuis que les moteurs de recherche traditionnels voient leur modèle menacé par les assistants IA. Perplexity, valorisé à plusieurs milliards de dollars, mise sur l'innovation architecturale pour se distinguer face à des concurrents disposant de ressources bien supérieures.

UELes développeurs et entreprises européens intégrant la recherche web dans leurs pipelines d'IA pourraient bénéficier d'une réduction significative des coûts computationnels grâce à cette nouvelle architecture.

💬 85% de réduction sur les tokens, c'est le genre de chiffre qui fait lever les yeux au ciel, et pourtant le concept tient la route. Laisser le modèle écrire lui-même sa routine de recherche plutôt que de le contraindre dans une API figée, c'est une idée simple qui résout un vrai problème. Reste à voir ce que ça donne sur des cas limites en prod, parce que les benchmarks contre Anthropic et OpenAI, c'est toujours un peu l'arroseur arrosé.

OutilsOutil
1 source
Les 21 meilleurs outils IA sans code ou low-code en 2026
144MarkTechPost 

Les 21 meilleurs outils IA sans code ou low-code en 2026

En 2026, les plateformes sans code et low-code ont franchi un cap décisif : elles ne se contentent plus de glisser-déposer des composants, elles génèrent des applications complètes à partir d'une simple phrase. Un panorama de 21 outils représentatifs de cette nouvelle génération illustre l'ampleur du basculement. Parmi les plus notables, Lovable produit une application web full-stack, frontend React, backend, base de données, authentification, depuis une description en langage naturel, avec déploiement en un clic et synchronisation GitHub bidirectionnelle. Bolt.new, développé par StackBlitz, fonctionne sur le même principe mais en exposant le code source, ce qui permet aux développeurs d'intervenir directement. Replit combine un environnement de développement navigateur avec un agent autonome capable de scaffolding, de construction et de déploiement. Du côté des outils mobiles, Adalo génère des binaires conformes à l'App Store depuis un prompt, tandis que Glide transforme des feuilles de calcul en interfaces applicatives. Sur le terrain de l'automatisation, Zapier reste la référence avec ses milliers de connecteurs SaaS, désormais complétés par des agents IA pilotables en langage naturel, et n8n propose une alternative open-source auto-hébergeable pour les équipes soucieuses de la souveraineté de leurs données. Ce mouvement redessine profondément l'accès au développement logiciel. Des entrepreneurs sans équipe technique peuvent désormais mettre en production un produit monétisable, avec authentification utilisateur, paiement Stripe et hébergement intégré, en quelques minutes, comme le propose Atoms. Pour les grandes organisations, ces outils accélèrent la création d'outils internes, de portails clients et d'automatisations métier sans mobiliser des développeurs seniors. L'enjeu n'est plus seulement la vitesse : c'est la démocratisation de la capacité à construire, tester et itérer sur des produits numériques à une échelle inédite. Les équipes produit et design, en particulier, gagnent une autonomie réelle grâce à des outils comme v0 de Vercel, spécialisé dans la génération de frontends Next.js. Cette convergence entre no-code et IA générative s'est accélérée depuis l'émergence des grands modèles de langage en 2023, qui ont permis d'interpréter des intentions exprimées en prose et de les traduire en architectures logicielles cohérentes. Le marché se segmente désormais clairement entre les constructeurs d'interfaces visuelles (Bubble, Softr, Adalo), les générateurs de code full-stack (Lovable, Bolt.new, Replit), et les orchestrateurs d'agents et d'automatisations (Zapier, Make, n8n). La prochaine frontière sera probablement la maintenance autonome : des agents capables non seulement de construire une application, mais de la faire évoluer en réponse aux comportements utilisateurs, sans intervention humaine.

UELes équipes européennes soucieuses de souveraineté des données peuvent s'appuyer sur n8n, alternative open-source auto-hébergeable, pour répondre aux contraintes RGPD sans dépendre de plateformes américaines.

💬 Le saut est réel. Pour les équipes produit qui n'avaient pas de dev en interne, un MVP avec auth et Stripe en quelques minutes, c'était de la science-fiction il y a deux ans. Ce qu'on verra d'ici 6 mois, c'est si ces apps tiennent face aux vrais besoins métier, pas juste les exemples propres qu'on voit en démo.

OutilsOutil
1 source
Le nouveau Colab CLI de Google permet aux développeurs et agents IA d'exécuter Python sur des GPU et TPU distants depuis le terminal
145MarkTechPost 

Le nouveau Colab CLI de Google permet aux développeurs et agents IA d'exécuter Python sur des GPU et TPU distants depuis le terminal

L'équipe Google AI a publié cette semaine le Colab CLI, un outil en ligne de commande qui connecte le terminal local d'un développeur aux runtimes distants de Google Colab. Disponible en open source sous licence Apache 2.0 et installable en une seule commande via uv tool install, l'outil permet d'allouer des sessions de calcul cloud depuis le terminal avec des options matérielles allant du CPU classique aux GPU T4, L4, A100 et H100, ainsi qu'aux puces TPU v5e1 et v6e1. L'interface repose sur un petit ensemble de commandes : colab new pour provisionner une session, colab exec pour exécuter du code Python depuis un fichier local ou l'entrée standard, colab stop pour libérer la machine virtuelle, et colab download ou colab log pour récupérer les résultats sous forme de notebooks .ipynb, fichiers Markdown ou JSONL. Google fournit également un fichier COLAB_SKILL.md qui donne aux agents IA un contexte intégré sur l'utilisation du CLI. Ce qui rend ce lancement significatif, c'est moins la fonctionnalité elle-même que la cible visée : les agents IA. Le Colab CLI est explicitement conçu pour que des outils comme Claude Code, Codex ou l'agent maison Antigravity puissent piloter des pipelines de machine learning de bout en bout sans intervention humaine. Google en fait la démonstration avec un exemple concret : le fine-tuning du modèle Gemma 3 1B via QLoRA sur un jeu de données Text-to-SQL, réalisé par l'agent Antigravity en cinq commandes, sans qu'un seul paramètre de provisionnement cloud ne soit saisi manuellement. Le modèle affiné est ensuite téléchargé localement et prêt à être servi. Pour les développeurs travaillant sur des machines sans GPU, le CLI permet aussi d'externaliser l'entraînement vers le cloud sans quitter leur environnement de travail habituel. Google Colab existe depuis 2017 comme environnement de notebooks Python basé sur le navigateur, largement utilisé dans la communauté recherche et éducation pour son accès gratuit ou peu coûteux aux accélérateurs. Le CLI ne remplace pas cette interface web, il cible un usage radicalement différent : les workflows scriptés, automatisés et pilotés par des agents. Cette distinction reflète une tendance plus large dans l'outillage IA : les agents de codage comme Claude Code ou Codex ont besoin d'accéder à des ressources de calcul sans passer par des interfaces graphiques pensées pour des humains. En positionnant Colab comme une infrastructure compatible avec ces agents, Google s'inscrit dans la course aux plateformes d'exécution pour l'IA agentique, un espace où AWS, Modal et RunPod cherchent aussi à capter les développeurs qui automatisent leurs pipelines ML.

💬 Ce qui m'intéresse, c'est pas le CLI en lui-même : c'est le COLAB_SKILL.md livré avec, un fichier d'instructions taillé pour que des agents comme Claude Code sachent louer un H100 et lancer un fine-tuning sans intervention humaine. Google ne fait pas un outil pour les développeurs, il fait un outil pour que les agents des développeurs aient accès à du calcul cloud sans passer par une interface pensée pour des humains. Reste à voir ce que ça coûte en crédits Colab quand un agent part en vrille à 3h du mat.

OutilsOutil
1 source
Meta lance Hatch, son premier agent IA payant, jusqu'à 200 dollars par mois
146The Decoder 

Meta lance Hatch, son premier agent IA payant, jusqu'à 200 dollars par mois

Meta prépare un agent IA payant baptisé "Hatch", dont le prix pourrait atteindre 200 dollars par mois. Il s'agirait du premier produit IA payant de l'entreprise, marquant un tournant dans sa stratégie commerciale. Concrètement, l'utilisateur décrit ses besoins en langage courant, et Hatch se charge du reste : créer des outils fonctionnels, planifier des rendez-vous, envoyer des e-mails. Le produit se positionne comme un assistant autonome capable d'agir, et non simplement de répondre. Pour Meta, l'enjeu est considérable. La société, dont l'essentiel des revenus provient de la publicité, cherche à diversifier ses sources de revenus alors qu'elle investit des dizaines de milliards de dollars dans l'infrastructure IA. Un abonnement à 200 dollars par mois cible clairement les professionnels et les entreprises prêts à payer pour gagner en productivité. Si Hatch trouve son marché, il pourrait offrir à Meta un flux de revenus récurrent, plus prévisible que les recettes publicitaires soumises aux cycles économiques. Mark Zuckerberg mise depuis plusieurs années sur l'IA comme axe de transformation de Meta, après avoir englouti des milliards dans le métavers avec des résultats décevants. L'essor des agents IA capables d'effectuer des tâches complexes de façon autonome est devenu le nouveau terrain de compétition entre les géants technologiques. OpenAI, Google et Anthropic ont tous lancé ou annoncé des offres similaires. Avec Hatch, Meta entre directement dans ce marché premium des agents IA, là où les marges sont potentiellement bien plus élevées que dans la publicité classique.

UELes professionnels et PME européens, notamment français, seront concernés par cette offre payante dès son déploiement en Europe, dans un contexte où Meta est déjà soumis à l'AI Act et au DMA.

💬 200 dollars par mois, de la part de la boîte qui t'a habitué au tout-gratuit depuis 20 ans, c'est un vrai pivot. Bon, sur le papier, les agents autonomes OpenAI et Anthropic font ça depuis un moment, donc Meta ne révolutionne rien. Ce qui est intéressant, c'est que Zuckerberg reconnaît enfin que la pub seule ne remboursera pas ses 60 milliards investis dans l'IA.

OutilsOutil
1 source
Un nouveau modèle vocal open source écoute en continu et décide toutes les 0,4 secondes de parler ou de se taire
147The Decoder 

Un nouveau modèle vocal open source écoute en continu et décide toutes les 0,4 secondes de parler ou de se taire

Un nouveau modèle vocal open source baptisé Audio Interaction vient d'être publié avec ses poids, son code source et ses instructions de déploiement sur GitHub, sous licence Apache 2.0. Sa particularité technique est de prendre une décision toutes les 0,4 secondes : parler ou se taire. Contrairement à la plupart des assistants vocaux actuels, il n'attend pas la fin d'un enregistrement pour répondre, mais écoute en continu un flux audio pour transcrire, traduire, converser et détecter des sons du quotidien comme une toux. Les données d'entraînement seront publiées séparément dans un second temps. Cette approche représente un changement de paradigme pour les interfaces vocales. Les modèles comme GPT-4o ou Qwen3.5-Omni fonctionnent encore en mode tour par tour : ils attendent que l'utilisateur finisse de parler avant de traiter la demande. Audio Interaction brise cette contrainte en analysant le flux sonore en temps réel, ce qui ouvre la voie à des interactions bien plus naturelles, notamment pour les assistants embarqués, les outils d'accessibilité ou les applications de traduction simultanée. La licence Apache 2.0 le rend immédiatement utilisable par des développeurs et des entreprises sans restriction commerciale. Le modèle s'inscrit dans une course intense autour de l'audio nativement multimodal, accélérée par la présentation de GPT-4o en mai 2024. L'ouverture complète de la chaîne, des poids aux données, reste encore rare dans ce domaine dominé par des solutions propriétaires, et pourrait stimuler une vague de recherche indépendante sur les modèles vocaux en temps réel. La publication imminente des données d'entraînement permettra à la communauté de reproduire et d'affiner les résultats de manière transparente.

UELes développeurs et entreprises européens peuvent adopter librement ce modèle vocal sous licence Apache 2.0 pour intégrer des interfaces vocales temps réel dans leurs applications, sans restriction commerciale.

💬 0,4 secondes pour décider de parler ou se taire, c'est le détail qui change tout. Le mode tour par tour des assistants actuels casse l'illusion à chaque échange, et là on a enfin une alternative ouverte avec les poids, le code, et une Apache 2.0 qui ne bloque personne. Les données d'entraînement arrivent "dans un second temps", bon, j'attends de voir si c'est complet.

OutilsActu
1 source
Moonshot AI lance Kimi Code CLI : un agent de codage IA en ligne de commande, développé en TypeScript
148MarkTechPost 

Moonshot AI lance Kimi Code CLI : un agent de codage IA en ligne de commande, développé en TypeScript

Moonshot AI, le laboratoire chinois d'intelligence artificielle, a publié Kimi Code CLI, un agent de codage open source conçu pour fonctionner directement dans le terminal. Distribué sous licence MIT et disponible sur GitHub, l'outil s'installe en une seule commande, sans prérequis Node.js, via un script officiel compatible macOS, Linux et Windows. Écrit en TypeScript et diffusé via npm, Kimi Code CLI succède à l'ancien kimi-cli et s'interface nativement avec les modèles Kimi de Moonshot AI, tout en restant compatible avec d'autres fournisseurs. L'agent est capable de lire et modifier du code, exécuter des commandes shell, explorer des fichiers, interroger des pages web, implémenter de nouvelles fonctionnalités, corriger des bugs, effectuer des refactorisations, répondre à des questions d'architecture et automatiser des tâches en lot. Par défaut, les opérations en lecture seule s'exécutent automatiquement, tandis que les modifications de fichiers ou les commandes shell demandent une confirmation explicite du développeur. L'agent adopte un modèle d'exécution dit "feedback-driven" : il planifie ses étapes, modifie le code, lance les tests et rapporte ses actions en boucle jusqu'à complétion. Parmi ses fonctionnalités distinctives, Kimi Code CLI intègre un support vidéo permettant de déposer un enregistrement d'écran directement dans le chat, une configuration native des serveurs MCP (Model Context Protocol) via la commande /mcp-config, ainsi qu'un système de sous-agents parallèles pour déléguer des tâches d'exploration, de planification ou de codage dans des contextes isolés. Des hooks de cycle de vie permettent d'auditer les décisions de l'agent ou de déclencher des notifications locales. Un mode plan (accessible via Shift-Tab ou --kimi --plan) génère un plan de recherche avant toute modification, et la commande /fork crée une branche expérimentale abandonnnable à tout moment. Kimi Code CLI s'inscrit dans une compétition croissante autour des agents de codage en terminal, un segment en pleine effervescence depuis l'émergence de Claude Code d'Anthropic, Aider ou encore Amp. La tendance de fond est celle de l'autonomisation progressive des outils de développement : les agents ne se contentent plus de suggérer du code, ils planifient, exécutent et itèrent de façon quasi-autonome sur des sessions longues. Moonshot AI, connu pour ses modèles Kimi aux capacités de contexte étendues, positionne cet outil comme une alternative sérieuse aux solutions occidentales dominantes, en ciblant notamment les développeurs souhaitant intégrer des LLMs dans leurs workflows sans quitter le terminal. L'accès au CLI est gratuit, mais l'utilisation des modèles nécessite une authentification OAuth Kimi Code ou une clé API Moonshot AI Open Platform.

UELes développeurs français et européens peuvent tester gratuitement cet agent open source, mais il ne cible pas spécifiquement le marché européen et n'a pas d'impact structurel sur la réglementation ou l'écosystème local.

💬 On ne comptait plus les CLI agents depuis Claude Code, mais celui-là mérite qu'on s'y arrête deux secondes. Le support vidéo natif et les sous-agents parallèles, c'est pas du remplissage de changelog, ça règle de vrais problèmes de workflow que les autres ont encore ignorés. Reste à voir si les modèles Kimi sont à la hauteur en dehors des benchmarks.

OutilsOutil
1 source
NVIDIA publie Nemotron 3.5 ASR : un modèle de transcription temps réel en 40 langues, optimisé pour le streaming
149MarkTechPost 

NVIDIA publie Nemotron 3.5 ASR : un modèle de transcription temps réel en 40 langues, optimisé pour le streaming

NVIDIA a lancé Nemotron 3.5 ASR, un modèle de reconnaissance vocale automatique en streaming capable de transcrire 40 variantes linguistiques en temps réel depuis un seul checkpoint de 600 millions de paramètres. Publié en open weights sur Hugging Face sous licence OpenMDW-1.1, le modèle repose sur une architecture Cache-Aware FastConformer-RNNT qui intègre nativement la ponctuation et les majuscules, sans étape de post-traitement supplémentaire. Il couvre des langues aussi variées que l'anglais, le français, l'espagnol, l'arabe, le japonais, le coréen, le mandarin, le hindi ou le thaï, avec un mode de détection automatique de la langue (targetlang=auto) permettant de traiter des flux audio multilingues sans composant externe. La latence est configurable à l'inférence via un paramètre unique (attcontext_size), offrant des modes allant de 80 ms ultra-basse latence jusqu'à 1,12 seconde pour une précision maximale, sans nécessiter de réentraînement. Ce modèle s'attaque directement à l'un des principaux obstacles au déploiement industriel de la transcription vocale en temps réel : la complexité opérationnelle. Jusqu'ici, couvrir plusieurs langues imposait de maintenir autant de modèles distincts, de gérer des pipelines de détection de langue séparés, et de choisir entre latence et précision via des checkpoints différents. Nemotron 3.5 ASR supprime ces trois frictions en un seul déploiement. Pour les équipes produit qui développent des outils de sous-titrage en direct, des assistants vocaux multilingues ou des plateformes de transcription à grande échelle, cela représente une réduction significative de l'infrastructure et du coût d'exploitation. Le fait qu'il soit disponible gratuitement en self-hosting change également la donne face aux services cloud payants comme Nova-3 de Deepgram (~0,0077 $/min) ou Scribe v2 Realtime d'ElevenLabs (~0,28 $/heure). NVIDIA opère depuis plusieurs années une montée en puissance dans le domaine des modèles de traitement du langage parlé, notamment via sa division Nemotron Speech. Ce lancement s'inscrit dans une compétition intense entre acteurs open source et solutions propriétaires : Whisper large-v3 d'OpenAI reste la référence en transcription batch (99 langues, MIT), mais n'est pas natif au streaming ; AssemblyAI (Universal-3 Pro) et Speechmatics se positionnent sur le streaming temps réel, mais avec des couvertures linguistiques plus étroites ou des API fermées. NVIDIA entre dans ce segment avec un modèle à la fois performant, polyglotte et librement hébergeable, ce qui pourrait accélérer son adoption dans les environnements souverains ou à contraintes de confidentialité forte. La prochaine étape probable sera l'intégration dans les pipelines NIM (NVIDIA Inference Microservices) pour simplifier encore le déploiement en production.

UELe modèle couvre explicitement le français parmi ses 40 variantes linguistiques, et son mode self-hosting gratuit facilite le déploiement dans des environnements européens soumis aux exigences de souveraineté des données, réduisant la dépendance aux API cloud américaines payantes.

💬 Un seul checkpoint pour 40 langues en streaming, ponctuation et majuscules intégrées nativement : c'est le genre de truc qu'on attendait depuis 2 ans. Couvrir plusieurs langues en temps réel imposait jusqu'ici de gérer autant de modèles distincts plus un détecteur de langue en amont, bref une usine à gaz. Et là, en self-hosting gratuit face à Deepgram à 0,0077 $ la minute, les équipes qui hésitaient vont vite trancher.

OutilsOpinion
1 source
Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents
150VentureBeat AI 

Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents

Lors de sa conférence Build 2026, Microsoft a dévoilé cette semaine une série d'annonces destinées à ancrer les agents d'intelligence artificielle au cœur des systèmes d'entreprise. La firme a présenté Microsoft IQ, une couche contextuelle unifiée couvrant GitHub Copilot, Microsoft Foundry et Copilot Studio, ainsi que des API Work IQ dont le lancement est prévu le 16 juin. S'y ajoutent Fabric IQ pour les données métier structurées, Foundry IQ pour la récupération d'informations à travers les bases de connaissances d'entreprise et le web en temps réel, et Web IQ, un moteur de recherche conçu spécifiquement pour les agents. Microsoft a également introduit Scout, un assistant personnel de travail autonome, et annoncé sept nouveaux modèles maison regroupés sous la famille MAI, dont MAI-Thinking-1, optimisés pour l'efficience en tokens et la personnalisation sur données propriétaires. En parallèle, Claude Opus 4.8 d'Anthropic est désormais disponible sur Azure Foundry, aux côtés des modèles OpenAI GPT, témoignant d'une stratégie délibérée de choix multiple de modèles. Ces annonces marquent un tournant dans la façon dont Microsoft positionne son infrastructure IA : ce n'est plus l'accès à un modèle puissant qui fait la différence, mais la capacité à donner aux agents un contexte fiable, une identité, une mémoire et un accès sécurisé aux données d'entreprise. Pour les DSI et équipes techniques, cela se traduit concrètement par la possibilité de déployer des agents gérés dans Foundry, avec gestion automatique du dimensionnement et de la conteneurisation, sans avoir à construire cette infrastructure from scratch. L'enjeu est de taille : les entreprises qui parviennent à brancher leurs agents sur leurs données internes et leurs workflows existants pourront automatiser des processus complexes à grande échelle, là où les expériences pilotes restaient jusqu'ici cantonnées à des cas d'usage isolés. Marco Casalaina, VP Products Core AI et "AI Futurist" de Microsoft, est au cœur de cette stratégie. Ancien responsable de l'équipe Einstein AI chez Salesforce et diplômé en informatique de Cornell, il a rejoint Microsoft début 2022 pour prendre la tête des Azure Cognitive Services avant d'étendre son périmètre à l'ensemble des outils pour développeurs IA, incluant Foundry, VS Code, GitHub et GitHub Copilot. Son rôle de futuriste a une définition très concrète chez Microsoft : il est systématiquement le premier à tester chaque nouvelle fonctionnalité en provenance de toutes les équipes de la firme. Cette position d'observatoire lui permet de tracer ce qu'il appelle "le futur immédiat", c'est-à-dire l'horizon à douze mois des capacités agentiques. La compétition pour devenir la plateforme de référence des agents d'entreprise est désormais ouverte, avec Google et AWS comme principaux rivaux dans une course où le contexte, la gouvernance et l'intégration des données deviennent les véritables différenciateurs.

UELes entreprises européennes peuvent évaluer les API Work IQ sur Azure (lancement le 16 juin) et les modèles MAI pour l'automatisation de leurs workflows internes, avec des enjeux de souveraineté des données à considérer.

💬 Microsoft assume enfin que la guerre se joue sur la plomberie, pas sur les modèles. Donner aux agents un contexte fiable, une identité et un accès sécurisé aux données internes, c'est précisément ce qui bloquait les pilotes depuis deux ans. Et avoir Claude d'Anthropic sur Azure aux côtés d'OpenAI, c'est malin : un argument de neutralité que Google et AWS n'ont pas encore.

OutilsOutil
1 source