Aller au contenu principal

Dossier Microsoft — page 9

1107 articles · page 9 sur 23

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

Traiter des PDF et en extraire des insights : concevoir un pipeline intelligent avec les services IA générative d'AWS
401AWS ML Blog OutilsOutil

Traiter des PDF et en extraire des insights : concevoir un pipeline intelligent avec les services IA générative d'AWS

Amazon Web Services a dévoilé une architecture complète de traitement intelligent de documents reposant sur ses services d'IA générative, notamment Amazon Bedrock Data Automation (BDA). Ce service unifié permet d'extraire des informations structurées depuis des documents multimodaux, PDF, images, vidéos, fichiers audio, avec une capacité allant jusqu'à 3 000 pages et 500 Mo par requête API. Contrairement aux solutions OCR classiques qui se limitent à l'extraction de texte brut, BDA analyse le contexte, classe automatiquement chaque section d'un document dans la bonne catégorie, l'associe au bon modèle de traitement, et fournit des scores de confiance sur les données extraites. L'architecture s'appuie sur quatre couches intégrées : ingestion des fichiers via Amazon S3, extraction et stockage avec DynamoDB, couche d'intelligence sémantique via Amazon Bedrock Knowledge Base, et coordination agentique par des agents spécialisés hébergés sur Amazon Bedrock AgentCore Runtime, orchestrés par AWS Step Functions. Pour les organisations qui traitent chaque jour des millions de documents, contrats juridiques, dossiers médicaux, factures, déclarations d'assurance, cette solution répond à un goulot d'étranglement majeur : l'intervention humaine obligatoire dans les pipelines traditionnels. En automatisant la classification, la normalisation et la validation des données, BDA réduit les coûts opérationnels, accélère les délais de traitement et limite les erreurs de saisie. La capacité à relier plusieurs documents entre eux via une base de connaissances sémantique permet également des analyses croisées impossibles avec les approches OCR conventionnelles, ouvrant la voie à des cas d'usage comme l'audit automatisé de contrats ou l'analyse comparative de rapports financiers. Ce lancement s'inscrit dans une course que se livrent les grands fournisseurs cloud, AWS, Microsoft Azure et Google Cloud, pour proposer des pipelines documentaires clé en main à destination des entreprises. AWS positionne BDA comme une réponse directe aux limites des solutions point-à-point qui nécessitaient jusqu'ici d'assembler manuellement des modèles OCR, des LLM et des orchestrateurs distincts. En intégrant l'ensemble dans une API unifiée au sein de Bedrock, Amazon cherche à réduire la friction technique pour les équipes data et à accélérer l'adoption de l'IA générative dans des secteurs très réglementés comme la finance, la santé et le droit. Les prochaines évolutions attendues concernent l'élargissement des formats supportés et le renforcement des capacités d'analyse de graphiques et de visualisations complexes embarqués dans les documents.

UELes entreprises européennes des secteurs réglementés (finance, santé, droit) peuvent adopter BDA via AWS pour automatiser leurs pipelines documentaires, sous réserve de conformité RGPD quant au stockage des données dans les régions AWS européennes.

1 source
ZoomMate connecte les conversations aux workflows
402Le Big Data 

ZoomMate connecte les conversations aux workflows

Zoom a dévoilé ZoomMate et son AI Productivity Suite, deux nouvelles offres destinées à transformer les conversations professionnelles en actions concrètes au sein des workflows d'entreprise. Présentées comme un "espace de travail intelligent", ces solutions s'appuient sur un moteur de recherche capable d'interroger simultanément les données stockées dans Zoom et dans une dizaine d'applications tierces : Salesforce, Jira, ServiceNow, Slack, Workday, Microsoft 365 et Google Workspace sont notamment intégrés. L'objectif est de permettre aux équipes de retrouver instantanément une information issue d'une réunion, de déclencher des tâches, de planifier des rendez-vous ou de mettre à jour des dossiers directement depuis l'interface Zoom. L'AI Productivity Suite ajoute une couche de génération documentaire : présentations, comptes rendus, feuilles de calcul et propositions commerciales peuvent être produits automatiquement à partir du contenu des échanges, chaque document restant traçable jusqu'à la conversation qui l'a engendré. L'enjeu pour les entreprises est réel : une part considérable de la valeur produite lors des réunions se perd faute de mécanismes efficaces pour en extraire et redistribuer l'information. En reliant directement les échanges aux outils opérationnels, Zoom cherche à réduire la friction entre décision et exécution, un problème chronique dans les organisations distribuées qui jonglent entre visioconférence, CRM, gestion de projet et messagerie. Si les promesses sont tenues, les équipes commerciales pourraient mettre à jour un compte Salesforce en sortant d'un appel client, ou les développeurs créer un ticket Jira dès la fin d'une réunion de sprint, sans changer d'outil. Zoom insiste également sur le respect des règles de sécurité et des permissions définies par chaque organisation, un argument central pour convaincre les DSI dans des contextes réglementés. Ces annonces s'inscrivent dans une transformation stratégique profonde de Zoom, dont la croissance explosive pendant la pandémie a brutalement ralenti avec le retour au bureau. Confronté à la concurrence de Microsoft Teams, qui dispose déjà de Copilot intégré à tout l'écosystème 365, et de Google Meet, Zoom ne peut plus se contenter d'être une application de visioconférence. L'entreprise cherche à se repositionner comme une plateforme de productivité à part entière, un terrain où elle affronte directement des acteurs bien établis. L'intégration de l'IA générative dans le cœur du produit est désormais le passage obligé pour justifier les licences entreprise et enrayer le churn. ZoomMate représente le pari que la richesse des conversations professionnelles captées sur la plateforme constitue un avantage différenciant, à condition que les intégrations tierces fonctionnent avec la fiabilité que les équipes métier exigent au quotidien.

UELes entreprises françaises et européennes utilisant Zoom pourraient automatiser leurs workflows entre réunions et outils métier (CRM, gestion de projet), sous réserve que les intégrations tierces respectent les contraintes réglementaires locales.

OutilsOutil
1 source
Apple présente la troisième génération de ses modèles de fondation
403Apple Machine Learning 

Apple présente la troisième génération de ses modèles de fondation

Apple a dévoilé la troisième génération de ses Apple Foundation Models (AFM), une famille de cinq modèles d'intelligence artificielle développés en collaboration avec Google. Ces modèles, présentés comme le coeur de la prochaine version d'Apple Intelligence, couvrent un spectre allant des modèles fonctionnant directement sur l'appareil jusqu'aux modèles hébergés sur des serveurs via l'infrastructure Private Cloud Compute. Ils alimenteront notamment une refonte complète de Siri ainsi qu'une série d'outils intelligents intégrés aux systèmes d'exploitation Apple. Ce partenariat avec Google marque un tournant stratégique pour Apple, qui avait jusqu'ici développé ses modèles en interne. L'enjeu est considérable : Apple doit rattraper son retard sur des concurrents comme OpenAI, Google et Microsoft dans la course aux assistants IA natifs. En distribuant le traitement entre l'appareil local et le cloud sécurisé, Apple cherche à offrir des capacités IA avancées sans sacrifier la confidentialité des données, un argument différenciateur central face à des services cloud classiques. Cette annonce s'inscrit dans la stratégie Apple Intelligence lancée en 2024, dont le déploiement progressif avait suscité des critiques sur la lenteur des livraisons. La collaboration avec Google est particulièrement significative : les deux entreprises, habituellement rivales sur les moteurs de recherche et les systèmes mobiles, s'associent ici sur la couche infrastructure IA. La famille de cinq modèles suggère une segmentation fine des cas d'usage, de la compréhension vocale embarquée aux tâches complexes nécessitant de la puissance serveur.

UEL'architecture vie-privée-first d'Apple (traitement local via Private Cloud Compute) s'aligne avec les exigences du RGPD, ce qui pourrait faciliter l'adoption d'Apple Intelligence par les entreprises et institutions européennes soucieuses de la souveraineté des données.

LLMsOpinion
1 source
Perplexity AI lance un orchestrateur d'inférence hybride pour PC : répartition automatique entre local et cloud
404MarkTechPost 

Perplexity AI lance un orchestrateur d'inférence hybride pour PC : répartition automatique entre local et cloud

Perplexity AI a présenté lors du Computex 2026 ce qu'elle décrit comme le premier orchestrateur d'inférence hybride local-serveur, une technologie destinée à son produit Perplexity Computer. Le principe : un modèle d'IA compact installé sur l'appareil de l'utilisateur analyse chaque tâche entrante et décide automatiquement si elle doit être exécutée en local ou envoyée vers un modèle frontier dans le cloud. La fonctionnalité arrivera en juillet 2026, d'abord sur Windows, tandis que la version Mac de Personal Computer est déjà disponible depuis avril 2026 avec une liste d'attente ouverte pour Windows. L'orchestrateur est compatible avec les puces Intel Core Ultra Series 3 et les GPU NVIDIA RTX Spark, et fonctionne indépendamment du modèle utilisé. Perplexity Computer, lancé en février 2026 sur abonnement Max à 200 dollars par mois, peut coordonner jusqu'à 20 modèles d'IA dans un même flux de travail. L'enjeu principal de cette architecture est la gouvernance des données dans les environnements professionnels. Jusqu'ici, les systèmes d'IA agentiques obligeaient les utilisateurs à choisir entre puissance de calcul et confidentialité. Le nouvel orchestrateur supprime ce compromis en automatisant la décision : les données sensibles comme les fichiers financiers, les dossiers de santé ou les documents personnels restent sur l'appareil, tandis que les tâches nécessitant une puissance de calcul élevée sont envoyées vers les serveurs de Perplexity. Le système demande l'autorisation de l'utilisateur avant tout envoi de données sensibles vers le cloud, ce qui répond directement aux exigences de conformité et de traçabilité que posent les entreprises face aux outils d'IA. Pour les équipes qui hésitaient à adopter des agents IA par crainte des fuites de données, c'est un argument concret. Cette annonce s'inscrit dans une course plus large à l'IA sur appareil, où Apple, Microsoft, Google et de nombreux fabricants de puces cherchent à convaincre que le traitement local est l'avenir. Perplexity, qui s'est imposé comme un acteur sérieux de la recherche IA avec plusieurs centaines de millions de dollars levés, tente ici de se différencier sur le segment des agents autonomes, un marché encore naissant mais très disputé. L'idée de faire du modèle local un chef d'orchestre plutôt qu'un simple exécutant est une évolution architecturale notable : ce n'est plus seulement "quel modèle utiliser" mais "où chaque morceau de la tâche doit-il s'exécuter". Si la promesse tient à l'usage réel, ce type d'orchestration pourrait devenir la norme pour tout système agentique voulant combiner performance, coût maîtrisé et confidentialité.

UEL'architecture hybride local-cloud, en maintenant les données sensibles sur l'appareil, pourrait faciliter l'adoption par les entreprises européennes soumises au RGPD qui hésitaient à déployer des agents IA.

💬 L'IA locale comme simple accélérateur, ça fait deux ans qu'on en entend parler. Ce qui change ici, c'est de mettre le petit modèle en position de chef d'orchestre qui décide ce qui part dans le cloud, avec demande explicite pour les fichiers sensibles, et pour les équipes enterprise bloquées par le RGPD, c'est l'argument concret qui manquait. Les 200 dollars par mois sur abonnement Max, c'est par contre un vrai filtre à l'entrée.

OutilsOutil
1 source
OpenAI : Sam Altman voit l'IA proactive comme la prochaine grande étape après les chatbots et les agents
405The Decoder 

OpenAI : Sam Altman voit l'IA proactive comme la prochaine grande étape après les chatbots et les agents

Sam Altman, PDG d'OpenAI, a esquissé sa vision de la prochaine grande étape de l'intelligence artificielle : une "IA proactive" capable d'agir de manière autonome en arrière-plan, sans attendre qu'un utilisateur lui soumette une requête. Contrairement aux chatbots actuels, qui répondent à des questions ponctuelles, ou aux agents IA, qui exécutent des tâches déclenchées par l'humain, cette nouvelle génération d'outils surveillerait en continu l'environnement de travail et prendrait des initiatives de façon indépendante. Altman a également promis d'aider les entreprises à "obtenir plus de valeur pour moins de dépenses", au moment où les budgets IA explosent dans les organisations. Cette vision répond à deux problèmes concrets que rencontrent actuellement les entreprises : la flambée des coûts liés au déploiement de l'IA à grande échelle, et le fait que la majorité des employés ne savent tout simplement pas quoi demander à ces outils. Une IA qui agit sans être sollicitée pourrait contourner ce frein à l'adoption, en rendant les bénéfices accessibles même aux utilisateurs non techniques. L'enjeu est considérable : transformer l'IA d'un outil optionnel en infrastructure permanente du travail quotidien. Ce positionnement s'inscrit dans une course intense entre les grands acteurs du secteur. Google, Microsoft et Anthropic développent tous des systèmes d'agents et d'automatisation de plus en plus autonomes. La promesse d'une IA proactive soulève néanmoins des questions sérieuses sur la supervision humaine, la confidentialité des données et la responsabilité des décisions prises sans intervention humaine, des enjeux que l'industrie devra adresser pour convaincre les entreprises d'aller plus loin.

UELes entreprises européennes devront anticiper des enjeux de conformité RGPD et AI Act face à des systèmes IA agissant en arrière-plan sans déclenchement humain explicite.

LLMsOpinion
1 source
Meta traque les moindres gestes de ses employés pour nourrir son IA : ils ont dit stop
406Le Big Data 

Meta traque les moindres gestes de ses employés pour nourrir son IA : ils ont dit stop

Meta a dû reculer face à la fronde interne provoquée par son programme MCI (Model Capability Initiative), un dispositif de surveillance des employés lancé en avril 2026 et destiné à entraîner ses intelligences artificielles. Selon une note interne relayée par The Information et des publications consultées par Reuters, l'entreprise a annoncé plusieurs ajustements : renforcement des protections de la vie privée, possibilité pour certains salariés de demander une exemption, et introduction d'une fonction permettant de suspendre le suivi pendant 30 minutes. Concrètement, MCI enregistre les mouvements de souris, les clics, la navigation dans les menus et surveille plus de 200 applications et sites web sur les ordinateurs des employés américains. L'objectif déclaré est de développer des agents IA capables d'exécuter de manière autonome des tâches informatiques du quotidien. Mais des analyses internes ont révélé que la collecte allait bien au-delà : modifications de code, cycles de mise en veille, historiques de navigation, contenus copiés-collés dans le presse-papiers, et même des échanges par e-mail ou Google Chat impliquant des collègues situés hors des États-Unis. Meta a par ailleurs reconnu que certaines de ces données avaient été stockées sous une forme moins sécurisée que prévu, et que le logiciel provoquait des pics de consommation internet pouvant épuiser un forfait mensuel en quelques jours. L'ampleur de la révolte illustre les limites d'une approche qui traite les salariés comme source de données d'entraînement sans leur consentement éclairé. Le porte-parole Dave Arnold a insisté sur le fait que MCI cible les interactions avec les ordinateurs et non le contenu affiché, mais les journaux techniques examinés en interne contredisent partiellement cette affirmation. Pour les employés concernés, les enjeux sont doubles : une atteinte directe à la vie privée sur leurs outils de travail, et un précédent qui pourrait normaliser une surveillance de masse au sein des grandes entreprises tech. Pour le secteur plus largement, cette résistance pose une question de fond : jusqu'où les entreprises peuvent-elles mobiliser leurs propres effectifs comme matière première pour l'IA sans déclencher une opposition organisée ? Meta n'est pas seule à chercher des données comportementales réalistes pour entraîner des agents IA capables de piloter des interfaces graphiques. Microsoft, Google et Anthropic travaillent tous sur des systèmes similaires. La différence, c'est que Meta a choisi de collecter ces données directement sur les machines de ses propres employés, court-circuitant le recours à des datasets publics ou à des utilisateurs volontaires. Cette stratégie révèle une pression croissante sur les labos d'IA pour produire des agents "computer use" compétitifs, dans un calendrier serré. Les concessions annoncées par Meta ressemblent davantage à un ajustement tactique qu'à une remise en cause du programme : MCI continue de fonctionner, et la collecte de comportements humains réels demeure au coeur de la course aux agents autonomes.

UELa collecte incluait des données d'employés hors États-Unis, exposant potentiellement Meta à des sanctions RGPD et posant un précédent sur la légalité de la surveillance des salariés dans les entreprises tech opérant en Europe.

ÉthiqueActu
1 source
OpenAI met à jour Codex : les agents peuvent créer des espaces de travail interactifs via Sites et plugins par rôle
407VentureBeat AI 

OpenAI met à jour Codex : les agents peuvent créer des espaces de travail interactifs via Sites et plugins par rôle

OpenAI a annoncé mardi une mise à jour majeure de sa plateforme agentique Codex, avec l'introduction de plusieurs fonctionnalités destinées à conquérir le monde de l'entreprise : des plugins sectoriels, un outil d'édition ciblée baptisé "Annotations", et une fonctionnalité d'hébergement web rapide appelée "Sites". Cette évolution transforme délibérément Codex, jusqu'ici perçu comme un assistant spécialisé pour développeurs, en environnement de travail quotidien pour les professionnels non-techniques. Parmi les 5 millions d'utilisateurs hebdomadaires de la plateforme, les non-développeurs, analystes financiers, marketeurs, opérationnels, chercheurs, représentent désormais environ 20% de la base et adoptent l'outil trois fois plus vite que les ingénieurs traditionnels. La fonctionnalité Annotations résout un problème concret qui freinait l'adoption en entreprise : jusqu'ici, demander à l'IA de modifier un graphique ou un calcul dans un tableur forçait le modèle à réécrire l'intégralité du fichier, détruisant souvent la mise en forme et introduisant des erreurs. Annotations isole précisément le segment sélectionné par l'utilisateur, un bloc de cellules dans un modèle financier, par exemple, et exécute les modifications sans toucher aux formules, styles ou dépendances environnantes. En parallèle, OpenAI déploie six plugins métier qui agrègent 62 applications professionnelles et 110 compétences automatisées dès le départ : un plugin Data Analytics connecte Snowflake, Databricks et Tableau ; le plugin Creative Production intègre Figma, Canva et Shutterstock ; le plugin Sales synchronise Salesforce, HubSpot, Slack et Clay ; le plugin Finance bancaire agrège des flux institutionnels comme Moody's, FactSet, PitchBook et S&P pour automatiser la modélisation financière et la préparation de pitch books. Le calendrier de cette annonce n'est pas anodin : elle intervient précisément au moment où Microsoft, principal investisseur mais concurrent direct d'OpenAI, ouvre sa conférence annuelle Build à San Francisco, où plusieurs outils de productivité enterprise concurrents sont attendus. Elle suit aussi de près la progression rapide d'Anthropic sur ce même segment, via Claude et Claude Code, auprès des travailleurs du savoir. OpenAI cherche à positionner Codex comme la référence pour l'automatisation des tâches de col blanc, avant que le marché des agents IA d'entreprise ne se structure autour d'autres acteurs. La stratégie est claire : ne plus réserver l'IA agentique aux équipes techniques, mais en faire un couche opérationnelle transversale, accessible à chaque département sans intervention du service informatique.

UELes entreprises françaises et européennes peuvent désormais déployer Codex dans leurs workflows métier, finance, marketing, ventes, sans ressources techniques dédiées, ce qui accélère concrètement l'adoption de l'IA agentique dans les organisations non technologiques.

OutilsOutil
1 source
Avec Anthropic, OpenAI et SpaceX, Wall Street s’apprête à vivre son plus grand cycle technologique depuis Internet
408FrenchWeb 

Avec Anthropic, OpenAI et SpaceX, Wall Street s’apprête à vivre son plus grand cycle technologique depuis Internet

Wall Street se prépare à entrer dans ce qui pourrait être le plus grand cycle d'introductions en Bourse depuis la bulle Internet des années 2000, porté par trois géants technologiques encore privés : Anthropic, OpenAI et SpaceX. Ces entreprises, valorisées chacune à des centaines de milliards de dollars, concentrent une attention inédite de la part des investisseurs institutionnels et des marchés publics, qui n'ont jusqu'ici pu y accéder qu'indirectement. Aucune date officielle n'a été annoncée, mais les signaux se multiplient indiquant que la fenêtre d'introduction se rapproche. L'enjeu est considérable pour les marchés financiers : une cotation d'OpenAI ou d'Anthropic représenterait une occasion rare pour les investisseurs particuliers et les fonds classiques d'entrer au capital des acteurs centraux de la révolution IA. Cela redistribuerait les flux de capitaux aujourd'hui concentrés chez quelques fonds de capital-risque et fonds souverains, tout en offrant une liquidité aux premiers actionnaires et employés de ces sociétés. Pendant plus d'une décennie, les entreprises technologiques les plus prometteuses ont délibérément évité la Bourse, préférant lever des dizaines de milliards en privé auprès de SoftBank, des fonds du Golfe ou de Microsoft, qui a investi plus de 13 milliards de dollars dans OpenAI. Cette stratégie a permis de croître sans la pression des marchés trimestriels, mais les valorisations atteignent désormais des niveaux qui rendent une sortie en Bourse quasi inévitable pour offrir de la liquidité aux investisseurs historiques et financer la prochaine phase d'expansion.

UELes fonds institutionnels et investisseurs particuliers européens pourraient pour la première fois accéder directement aux principaux acteurs de l'IA via les marchés publics, redistribuant des flux de capitaux aujourd'hui monopolisés par quelques fonds américains et fonds souverains du Golfe.

BusinessOpinion
1 source
Workday et Google Cloud déploient des agents IA pour les RH et la finance
409Le Big Data 

Workday et Google Cloud déploient des agents IA pour les RH et la finance

Workday et Google Cloud ont annoncé le 29 mai 2026 une extension significative de leur partenariat, visant à intégrer les agents IA de Workday directement dans Gemini Enterprise, la suite collaborative de Google. Concrètement, l'agent Sana Self-Service de Workday s'imbrique désormais dans l'environnement Google que les collaborateurs utilisent au quotidien. Un salarié peut ainsi consulter son solde de congés, récupérer un bulletin de paie ou soumettre une demande d'absence sans jamais ouvrir l'interface Workday. Les managers gagnent eux aussi en autonomie : approbation de feuilles de temps, lancement d'évaluations de performance, accès aux objectifs d'équipe, tout cela depuis une interface conversationnelle unique. Côté finance, les utilisateurs peuvent interroger les politiques de dépenses et initier des démarches administratives sans changer d'outil. L'annonce confirme par ailleurs que Gemini devient le modèle d'IA par défaut de Sana dans Workday, remplaçant les solutions précédemment utilisées. L'enjeu est considérable pour les grandes organisations, qui souffrent depuis des années d'une fragmentation logicielle coûteuse : les équipes jonglent quotidiennement entre suites RH, ERP financiers, outils collaboratifs et plateformes analytiques pour accomplir des tâches souvent élémentaires. En ancrant les agents directement dans les outils de travail existants, Workday et Google Cloud cherchent à éliminer ces frictions et à accélérer l'exécution des processus métiers. Pour les directions RH et financières, qui manipulent des données sensibles soumises à des réglementations strictes, l'intégration apporte aussi les capacités de raisonnement avancé, le support multimodal et le traitement multilingue de Gemini, tout en maintenant les garde-fous métier, les règles d'approbation et les contrôles de conformité propres à Workday. Ce rapprochement s'inscrit dans une tendance de fond qui voit les grands éditeurs de logiciels d'entreprise transformer leurs plateformes en orchestrateurs d'agents IA. Workday, qui gère les ressources humaines et les finances de milliers de grandes entreprises mondiales, dispose d'un levier stratégique majeur : ses données métier structurées, longtemps cloisonnées dans ses interfaces propriétaires. En ouvrant ces données aux agents via Gemini, l'éditeur américain positionne sa plateforme comme un nœud central des architectures multi-agents qui émergent dans les grands groupes. Pour Google Cloud, faire de Gemini le moteur par défaut de Sana représente une victoire commerciale et un signal fort envoyé à l'ensemble de l'écosystème enterprise, dans un marché où Microsoft, avec Copilot intégré à Office 365 et Dynamics, exerce une pression concurrentielle intense. Les prochaines étapes du partenariat devraient porter sur l'orchestration de workflows plus complexes, impliquant plusieurs agents agissant en coordination sur des processus bout-en-bout.

UELes grandes entreprises françaises et européennes utilisant Workday et Google Workspace pourraient réduire la fragmentation logicielle de leurs équipes RH et finance grâce à cette intégration.

OutilsOutil
1 source
Nvidia présente RTX Spark comme la puce qui rend enfin les agents IA locaux viables sur Windows
410The Decoder 

Nvidia présente RTX Spark comme la puce qui rend enfin les agents IA locaux viables sur Windows

Nvidia a présenté le RTX Spark, une puce conçue pour rendre les agents IA locaux véritablement utilisables sur les PC Windows portables. La puce combine un GPU Blackwell avec un processeur Grace basé sur l'architecture Arm, jusqu'à 128 Go de mémoire partagée et une puissance de calcul annoncée à 1 000 TOPS en FP4. Les premiers appareils équipés du RTX Spark seront commercialisés à partir de l'automne 2026 par ASUS, Dell, HP, Lenovo, Microsoft Surface et MSI. Le RTX Spark vise directement les puces Apple Silicon et les processeurs Qualcomm Snapdragon X qui dominent aujourd'hui le segment des PC dits "AI". Disposer de 128 Go de mémoire partagée est un atout décisif : cela permet de faire tourner en local des modèles de langage de grande taille, sans recourir au cloud, avec une latence réduite et une confidentialité des données préservée. Pour les entreprises et les développeurs, cette configuration ouvre la voie à des agents IA autonomes fonctionnant directement sur l'appareil de l'utilisateur, sans dépendance à une connexion Internet. Ce lancement s'inscrit dans la bataille que se livrent les fabricants de puces pour capter le marché des ordinateurs portables à capacités IA embarquées. Apple a pris une avance significative avec ses puces M-series, notamment grâce à leur architecture à mémoire unifiée. Qualcomm a répondu avec les Snapdragon X Elite sur Windows. Nvidia, dont la domination est historiquement liée aux datacenters et aux GPU discrets, cherche à s'imposer dans le segment mobile avec une approche intégrée CPU-GPU inédite sous Windows. L'automne 2026 marquera un test grandeur nature pour cette stratégie face à des concurrents déjà bien installés.

UELes PC équipés du RTX Spark arriveront en Europe à l'automne 2026, offrant aux entreprises françaises et européennes des capacités d'IA locale sans dépendance au cloud, un atout direct en contexte RGPD.

InfrastructureActu
1 source
ElegantVLA : apprendre quand raisonner pour des modèles vision-langage-action (VLA) efficaces
411arXiv cs.RO 

ElegantVLA : apprendre quand raisonner pour des modèles vision-langage-action (VLA) efficaces

Une équipe de chercheurs a publié le 29 mai 2026 un article préprint sur arXiv (2605.29438) présentant ElegantVLA, un cadre d'inférence adaptatif conçu pour accélérer les modèles de type Vision-Language-Action (VLA) sans modifier ni réentraîner le modèle de base. Le principe repose sur un ordonnanceur léger qui observe en temps réel la similarité des représentations temporelles, les signaux de mouvement du robot et la progression de l'épisode, puis alloue dynamiquement la charge de calcul entre l'encodeur visuel, le LLM et la tête d'action. Deux niveaux de granularité sont gérés : cinq modes de calcul Vision-LLM, allant de la recomputation complète à la réutilisation temporelle multi-pas, et trois modes de débruitage pour la génération d'actions, qui recyclent les états intermédiaires lors des phases de mouvement stable. Sur le modèle GR00T de NVIDIA sur six tâches réelles, ElegantVLA réduit la charge de calcul d'un facteur 2,18x et fait passer la fréquence de contrôle de 13,8 Hz à 26,3 Hz ; sur CogACT, le gain en vitesse atteint 3,77x. L'enjeu est direct pour les équipes qui cherchent à déployer des VLA en manipulation réelle : la fréquence de contrôle est un goulot d'étranglement critique dans les tâches nécessitant une réactivité fine, et doubler cette fréquence sans retoucher le modèle sous-jacent change fondamentalement le rapport coût-performance du déploiement. Le résultat contredit partiellement l'hypothèse dominante selon laquelle accélérer un VLA impose obligatoirement un compromis sur la qualité du raisonnement : en concentrant la puissance de calcul sur les phases sensibles aux objectifs, à l'image du contrôle moteur humain, le système préserve la précision là où elle compte. C'est un argument concret en faveur de l'inférence adaptative plutôt que des modèles distillés ou quantifiés à la hache. Les VLA généralistss comme GR00T (NVIDIA) ou CogACT (Microsoft Research) souffrent structurellement d'un coût d'inférence élevé dû à l'empilement d'un backbone vision-langage massif et d'une tête d'action itérative à chaque pas de contrôle. Les approches existantes d'accélération, élagage, distillation, cache KV statique, traitent tous les pas de contrôle de façon uniforme, ignorant que les besoins en raisonnement varient fortement au cours d'un épisode. ElegantVLA se positionne comme une surcouche plug-in compatible avec l'ensemble de l'écosystème VLA moderne, sans modifier les pipelines d'entraînement. La prochaine étape naturelle sera de valider l'approche sur des tâches longue durée et des environnements non structurés, là où la variabilité des phases est maximale et où le gain potentiel est le plus difficile à quantifier.

RechercheOpinion
1 source
Anthropic lance Claude Opus 4.8 : workflows dynamiques, mode rapide moins cher et limite de 1 000 sous-agents
412MarkTechPost 

Anthropic lance Claude Opus 4.8 : workflows dynamiques, mode rapide moins cher et limite de 1 000 sous-agents

Anthropic a lancé Claude Opus 4.8 accompagné de deux nouvelles fonctionnalités pour Claude Code : les workflows dynamiques et une mise à jour du mode rapide. Les workflows dynamiques permettent d'orchestrer des centaines de sous-agents en parallèle via un script JavaScript que Claude génère automatiquement à partir d'une description de tâche. Un runtime exécute ce script en arrière-plan, libérant la fenêtre de contexte de Claude des résultats intermédiaires, qui restent stockés dans des variables du script. Chaque exécution est plafonnée à 16 agents simultanés et 1 000 agents au total. La fonctionnalité est disponible sur les plans Max, Team et Enterprise (désactivée par défaut sur Enterprise), ainsi que via l'API Claude, Amazon Bedrock, Vertex AI et Microsoft Foundry, à partir de la version 2.1.154 de Claude Code. En parallèle, le mode rapide pour Opus 4.8 est annoncé trois fois moins cher que pour Opus 4.7 (facturé 30/150 dollars par million de tokens en entrée/sortie), tout en offrant des vitesses de génération 2,5 fois supérieures. Les deux fonctionnalités sont disponibles en aperçu de recherche. Pour les développeurs confrontés à des migrations ou des audits de grande envergure, les workflows dynamiques élargissent considérablement ce qu'un agent peut accomplir en une seule session. Anthropic illustre le potentiel avec l'exemple de Jarred Sumner, qui a porté le runtime Bun du langage Zig vers Rust en 11 jours : environ 750 000 lignes de Rust générées, 99,8 % du test suite existant passé, avec des centaines d'agents travaillant en parallèle et deux réviseurs par fichier. La logique adversariale intégrée, où certains agents produisent des résultats et d'autres les réfutent jusqu'à convergence, vise une qualité inaccessible en un seul passage. Un job interrompu reprend là où il s'était arrêté dans la même session, les agents terminés retournant leurs résultats en cache. Le mode rapide répond à un besoin distinct : conserver la qualité Opus pour le débogage interactif et l'itération rapide, sans subir les délais habituels des grands modèles. Ces annonces s'inscrivent dans la course à l'agent autonome que se livrent Anthropic, OpenAI et Google depuis début 2025. Après avoir repositionné Claude Code comme plateforme de développement, Anthropic fait de l'orchestration multi-agents une fonctionnalité centrale de son offre. Le plafond de 1 000 agents par exécution et le statut d'aperçu de recherche des deux fonctionnalités témoignent d'une prudence réelle face à l'inflation des coûts en tokens, puisqu'une seule exécution peut générer des milliers d'appels. Le mode rapide, financé par des crédits d'utilisation séparés du forfait inclus, envoie un signal commercial clair : Anthropic cherche à monétiser la vitesse comme axe différenciant, là où ses concurrents misent davantage sur le prix. Les prochaines étapes probables incluent une stabilisation tarifaire et une extension des workflows vers des interfaces no-code, à mesure qu'Anthropic affine les garde-fous nécessaires à une adoption plus large.

UELa réduction de prix du mode rapide (3 fois moins cher que pour Opus 4.7) bénéficie directement aux développeurs européens utilisant Claude Code via l'API ou les plateformes cloud.

LLMsOpinion
1 source
Merck et Mastercard obtiennent des résultats concrets avec les agents IA : l'infrastructure d'abord
413VentureBeat AI 

Merck et Mastercard obtiennent des résultats concrets avec les agents IA : l'infrastructure d'abord

Merck accélère sa recherche médicamenteuse d'un tiers et produit ses supports marketing conformes 70 à 80 % plus vite grâce à des agents d'intelligence artificielle, selon Sean Finnerty, vice-président des plateformes digitales du groupe pharmaceutique américain, qui s'exprimait lors d'un récent événement AI Impact Series. Concrètement, les brouillons de campagnes marketing générés par l'IA sont conformes à la réglementation à 99 %, réduisant les cycles de révision de plusieurs mois à quelques jours. En recherche scientifique, un cycle de découverte médicamenteuse a été raccourci d'un tiers, soit environ un an gagné avant qu'un traitement n'atteigne les patients. Derrière ces résultats, une infrastructure imposante : 2 500 comptes AWS, de nombreux abonnements Microsoft Azure, des intégrations Google Cloud Platform, 47 sites périphériques et des centaines de bases de données stockant plusieurs pétaoctets de données structurées et non structurées, répartis entre Oracle, SQL, Excel, transcriptions téléphoniques et autres dépôts. Ces gains ne sont pas tombés du ciel. Finnerty insiste sur un principe qu'il nomme la stratégie "plomberie d'abord" : avant de déployer des agents, il faut bâtir l'infrastructure qui les rend fiables, sécurisés et interopérables. Sans cela, chaque projet isolé devient une dette technique. Pour Merck, l'enjeu est particulièrement fort dans le domaine réglementaire : une campagne vaccinale dans l'État de Géorgie répond à des règles différentes de celle lancée au Canada, et la moindre erreur peut avoir des conséquences légales. L'IA prend désormais en charge les premières ébauches, là où des équipes humaines effectuaient auparavant de longues boucles de validation, libérant du temps pour des tâches à plus forte valeur ajoutée. La leçon tirée par Merck s'appuie directement sur l'expérience du passage au cloud dans les années 2010, une période que Finnerty décrit comme chaotique, mais dont les entreprises qui ont correctement posé les bases ont finalement tiré le meilleur parti. Le groupe s'appuie aujourd'hui sur plusieurs solutions en parallèle, Databricks, Amazon Redshift et d'autres, car "il n'existe pas de solution unique pour résoudre chaque problème". L'objectif affiché est d'intégrer ces couches d'infrastructure aux protocoles émergents comme MCP (Model Context Protocol) et A2A (Agent2Agent), pour permettre aux agents de fonctionner de façon fluide quelle que soit la plateforme cloud sous-jacente. Avec des milliers d'agents à venir selon Finnerty, la question de leur enregistrement, de leur sécurisation et de leur accès aux bonnes données devient un enjeu stratégique autant que technique.

UELes entreprises pharmaceutiques et financières européennes, soumises à des réglementations strictes similaires, peuvent s'inspirer de cette approche 'infrastructure d'abord' pour sécuriser leurs déploiements d'agents IA à grande échelle.

InfrastructureOpinion
1 source
Les meilleures plateformes d'authentification pour agents IA et serveurs MCP en 2026
414MarkTechPost 

Les meilleures plateformes d'authentification pour agents IA et serveurs MCP en 2026

Le Model Context Protocol (MCP), lancé par Anthropic en novembre 2024, s'est imposé en moins d'un an comme le standard de facto de l'écosystème agentique. OpenAI l'a adopté en mars 2025, Microsoft a annoncé son support dans Copilot Studio le même mois, et fin 2025 les téléchargements cumulés des SDK Python et TypeScript dépassaient 97 millions par mois. En décembre 2025, Anthropic a cédé le protocole à l'Agentic AI Foundation, hébergée par la Linux Foundation, pour en faire un bien commun de l'industrie. Gartner projette que 40 % des applications d'entreprise intégreront des agents IA spécialisés d'ici fin 2026, contre moins de 5 % aujourd'hui. Cette explosion soulève un problème central resté sans solution robuste : l'authentification. Quand un agent IA se contente de répondre à des questions, la sécurité d'accès reste anecdotique. Quand il lit des e-mails, met à jour des CRM, écrit dans des bases de données et appelle des API externes de façon autonome, l'authentification devient une infrastructure critique, et le coût d'une faille peut être considérable. La spécification MCP pour les déploiements HTTP protégés est précise : OAuth 2.1 avec PKCE est obligatoire, tous les endpoints doivent fonctionner en HTTPS, les métadonnées du serveur d'autorisation doivent être découvrables par les clients, et les mécanismes Protected Resource Metadata (RFC 9728) ainsi que Resource Indicators (RFC 8707) doivent être implémentés pour éviter la confusion d'audience des tokens. Plusieurs fournisseurs connus ne répondent pas encore à toutes ces exigences. C'est dans ce contexte que deux plateformes se distinguent : WorkOS, ciblant les équipes d'ingénierie enterprise, combine OAuth 2.1 compatible MCP avec SSO, SCIM, journaux d'audit et une autorisation granulaire (Fine-Grained Authorization) permettant de restreindre un agent à des outils précis plutôt qu'à un service entier. Stytch, filiale de Twilio, s'adresse aux équipes SaaS B2B déployant sur Cloudflare Workers et souhaitant ajouter l'authentification MCP sans migrer toute leur stack existante. L'enjeu dépasse le simple choix d'une bibliothèque. L'émergence des agents autonomes redéfinit la granularité des droits d'accès : il ne s'agit plus de savoir si un utilisateur peut accéder à une application, mais si un agent peut appeler un outil spécifique dans un service donné, dans un contexte précis, avec une traçabilité complète. Les acteurs comme Okta, Microsoft Entra ou des annuaires internes restent en jeu, mais les nouvelles plateformes comme WorkOS visent à s'y connecter plutôt qu'à les remplacer. Avec 40 % des applications enterprise concernées d'ici dix-huit mois, la fenêtre pour standardiser ces pratiques est courte, et les choix d'architecture faits aujourd'hui conditionneront la sécurité des systèmes agentiques pour les années à venir.

UELes entreprises européennes déployant des agents IA autonomes devront adopter ces standards d'authentification pour satisfaire aux exigences de traçabilité et d'auditabilité imposées par l'AI Act.

💬 L'auth pour agents, c'était le truc qu'on remettait à plus tard tant que les agents répondaient juste à des questions. Là, avec des systèmes qui lisent des mails, poussent dans des CRM et appellent des API externes sans supervision, c'est de l'infrastructure critique, et WorkOS a bien vu que le vrai sujet c'est l'autorisation à l'outil (pas à l'application, à l'outil spécifique). Reste à voir si les équipes qui déploient aujourd'hui vont s'y plier avant le premier incident sérieux.

OutilsOpinion
1 source
Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI
415Le Big Data 

Anthropic pourrait dépenser 1,25 milliard $ par mois sur l’infrastructure xAI

Anthropic s'apprête à verser jusqu'à 1,25 milliard de dollars par mois à xAI, la société d'intelligence artificielle d'Elon Musk, pour accéder à sa puissance de calcul. L'accord, révélé dans un dépôt S-1 de SpaceX auprès de la SEC, porte sur l'achat de la totalité de la production du centre de données Colossus 1, situé près de Memphis, dans le Tennessee. Le contrat court jusqu'en mai 2029 et pourrait représenter jusqu'à 45 milliards de dollars de revenus cumulés pour xAI, les deux parties conservant toutefois une option de résiliation avec un préavis de 90 jours. L'accord fait suite à une première annonce, quelques semaines plus tôt, selon laquelle Anthropic avait sécurisé 300 mégawatts de capacité de calcul auprès de xAI, une décision déjà jugée surprenante par le marché. Pour Anthropic, l'accès garanti à des milliers de GPU sur plusieurs années répond à une contrainte structurelle : les modèles génératifs de nouvelle génération exigent des volumes de calcul massifs, aussi bien pour l'entraînement que pour l'inférence et les usages professionnels en temps réel. Alors que la demande des entreprises s'emballe plus vite que l'offre mondiale en puces avancées, verrouiller plusieurs années de capacité permet au créateur de Claude de réduire sa dépendance aux grands fournisseurs cloud traditionnels, Amazon Web Services, Microsoft Azure et Google Cloud. L'accord réduit également le risque de goulots d'étranglement à mesure qu'Anthropic étend ses déploiements dans les produits et workflows d'entreprises. Pour xAI, en revanche, ce contrat s'inscrit dans une stratégie de monétisation agressive de sa capacité excédentaire. Selon les documents de SpaceX, l'accord permet de rentabiliser des serveurs sous-utilisés, une situation qui coïncide avec un ralentissement rapporté de l'usage de Grok, l'assistant IA de xAI, ces derniers mois. Ce modèle positionne xAI dans la catégorie des "néoclouds" : des acteurs qui construisent d'abord une infrastructure pour leurs propres modèles, puis revendent la capacité disponible à d'autres entreprises du secteur, accélérant ainsi l'amortissement des coûts colossaux liés aux GPU Nvidia et aux centres de données énergivores. Paradoxalement, la transaction illustre aussi une évolution du marché : deux concurrents directs sur le segment des modèles génératifs coopèrent désormais sur l'infrastructure, signe que les investissements nécessaires à la course à l'IA dépassent ce que même les leaders du secteur peuvent absorber seuls.

InfrastructureOpinion
1 source
Nvidia bat tous les records et SpaceX vise des horizons illimités
416The Information AI 

Nvidia bat tous les records et SpaceX vise des horizons illimités

Nvidia a publié mercredi des résultats trimestriels qui dépassent une fois de plus les attentes les plus optimistes. Sur le premier trimestre de son exercice fiscal 2027, couvrant le mois d'avril, le géant des puces pour l'intelligence artificielle a enregistré une croissance de ses revenus de 85 % par rapport à la même période de l'année précédente. Plus impressionnant encore, la société prévoit une accélération à 95 % pour le trimestre suivant. La trésorerie générée illustre cette puissance industrielle : le free cash flow du seul trimestre s'élève à 48,6 milliards de dollars, soit la moitié de ce que Nvidia avait produit sur l'ensemble de l'exercice 2026. Ces chiffres témoignent d'une demande en puces IA qui ne montre aucun signe de ralentissement, portée par les investissements massifs des hyperscalers comme Microsoft, Google ou Amazon dans leurs infrastructures de calcul. L'accélération de la croissance, qui passe de 66 % l'an dernier à 85 % puis à un objectif de 95 %, suggère que le pic de ce cycle d'investissement n'a pas encore été atteint. Pour l'industrie technologique, Nvidia s'impose chaque trimestre davantage comme une infrastructure critique, au même titre que les réseaux électriques pour l'économie traditionnelle. Pourtant, la journée du mercredi a été dominée par une autre nouvelle : SpaceX a officiellement déposé ses documents d'introduction en bourse, rendant publique pour la première fois la structure financière de l'entreprise d'Elon Musk. L'opération est attendue comme la plus grande IPO de l'histoire des marchés américains, et les médias financiers suivent chaque étape depuis des mois. OpenAI prépare également sa propre entrée en bourse. Ces deux échéances pourraient redéfinir les valorisations de référence pour les entreprises d'IA et de technologie spatiale, dans un contexte boursier particulièrement attentif aux actifs liés à l'intelligence artificielle.

UELa croissance soutenue du marché des puces IA renforce la dépendance structurelle de l'Europe aux fournisseurs américains, limitant la souveraineté technologique des acteurs français et européens.

💬 48 milliards de free cash flow en un seul trimestre, c'est la moitié de ce que Nvidia produisait sur un an entier il y a peu. Ce qui frappe, c'est pas le chiffre, c'est l'accélération : on attendait le pic depuis des mois, et c'est l'inverse qui se passe, 95 % de croissance prévue au prochain trimestre. Pour l'Europe, c'est un problème qui se creuse tranquillement, parce que cette infrastructure-là on ne la construit pas chez nous.

BusinessActu
1 source
L'équipe Qwen d'Alibaba lance Qwen3.5-LiveTranslate-Flash : interprétation multimodale en temps réel dans 60 langues avec une latence de 2,8 secondes
417MarkTechPost 

L'équipe Qwen d'Alibaba lance Qwen3.5-LiveTranslate-Flash : interprétation multimodale en temps réel dans 60 langues avec une latence de 2,8 secondes

L'équipe Qwen d'Alibaba a lancé le 20 mai 2026 son nouveau modèle Qwen3.5-LiveTranslate-Flash, conçu pour l'interprétation simultanée en temps réel. Ce système prend en charge 60 langues en entrée, propose une sortie vocale dans 29 langues, et affiche une latence de seulement 2,8 secondes. Par rapport à son prédécesseur direct, Qwen3-LiveTranslate-Flash, le gain est considérable : l'ancien modèle ne couvrait que 18 langues d'entrée pour environ 3 secondes de délai, ce qui représente un triplement de la couverture linguistique et une réduction mesurable de la latence. La clé de cette rapidité réside dans une technique de segmentation sémantique : plutôt qu'attendre la fin d'une phrase complète, le modèle identifie le moment précis où un fragment de discours contient suffisamment de sens pour engager la traduction, et diffuse la sortie en continu pendant que l'interlocuteur parle encore. Ce modèle change la donne pour plusieurs secteurs professionnels. D'abord, parce qu'il intègre la vision comme signal d'entrée au même titre que l'audio : le système analyse simultanément le texte affiché à l'écran, les objets physiques présents dans le cadre, les mouvements des lèvres et les gestes. Dans un environnement réel, salle de conférence bruyante, salon professionnel, visioconférence dégradée, cette redondance visuelle permet au modèle de combler les ambiguïtés phonétiques que l'audio seul ne peut pas résoudre. Ensuite, le modèle clone en temps réel les caractéristiques vocales de l'orateur original : une seule phrase suffit pour que la voix traduite conserve les traits acoustiques de la personne qui parle, sans substituer une synthèse générique et robotique. Enfin, les développeurs peuvent injecter à l'exécution un glossaire de termes spécialisés, noms de médicaments, références juridiques, terminologie technique, ce qui réduit drastiquement les erreurs sur le vocabulaire de niche, un problème chronique des API de traduction grand public. Alibaba positionne ce modèle dans un segment où peu d'acteurs sont présents avec des solutions complètes : l'interprétation simultanée multimodale à faible latence. Les benchmarks FLEURS et CoVoST2, deux références académiques pour la traduction de la parole en conditions réelles, placent Qwen3.5-LiveTranslate-Flash devant les principales alternatives commerciales actuelles. La course à la latence est devenue le nouvel enjeu structurant de la traduction automatique en direct, après des années dominées par la seule qualité de traduction. D'autres acteurs comme Google, Microsoft et des startups spécialisées comme Wordly ou Interprefy opèrent sur ce terrain, mais peu proposent simultanément la clonage vocal, la fusion audio-vidéo et la personnalisation du vocabulaire dans un seul modèle déployable via API. Les suites probables incluent une intégration dans les plateformes de visioconférence professionnelle et les outils de streaming multilingue, où la demande d'expériences interprétées "invisibles" ne cesse de croître.

UELes institutions et entreprises européennes opérant en environnement multilingue, notamment les organisations internationales, cabinets juridiques et plateformes de visioconférence, pourraient intégrer cette API pour réduire les coûts d'interprétation simultanée humaine.

OutilsOpinion
1 source
Plus besoin de micro, Alexa+ se lance maintenant dans les podcasts IA
418Le Big Data 

Plus besoin de micro, Alexa+ se lance maintenant dans les podcasts IA

Amazon a dévoilé le 18 mai 2026 une nouvelle fonctionnalité intégrée à son assistant Alexa+, baptisée Alexa Podcasts. Le principe est simple : l'utilisateur formule une demande vocale sur un sujet de son choix, l'IA collecte des informations, rédige une structure narrative et génère un épisode audio complet en quelques minutes, avec des voix synthétiques conçues pour imiter le ton et le style d'animateurs humains. Aucun script, aucun micro, aucun montage requis. Les utilisateurs peuvent en outre personnaliser le résultat en ajustant la longueur, le ton ou le style de l'épisode après une première génération. Pour renforcer la fiabilité des contenus produits, Amazon affirme s'appuyer sur des partenariats avec plusieurs grands médias américains, dont Reuters, le Washington Post et Business Insider. Cette annonce illustre une évolution majeure dans la manière dont les plateformes technologiques conçoivent leurs assistants vocaux. Alexa ne se positionne plus comme un simple outil de commande ou de recherche, mais comme un producteur de contenu autonome. Pour les utilisateurs, l'enjeu est concret : le podcast est un format audio qui explose depuis plusieurs années, mais dont la production reste coûteuse en temps et en ressources. Automatiser ce processus ouvre la porte à une consommation d'information entièrement personnalisée et à la demande, calquée sur les goûts et les besoins de chaque individu. Pour les créateurs de contenu et les médias traditionnels, en revanche, la menace est réelle : si n'importe qui peut générer un épisode en quelques secondes, la valeur perçue du travail éditorial humain se trouve directement challengée. Cette fonctionnalité s'inscrit dans une stratégie plus large d'Amazon visant à transformer Alexa+ en plateforme de contenu génératif. La firme évoque déjà des extensions proches : des briefings d'actualité entièrement personnalisés ou des podcasts générés à partir des propres documents de l'utilisateur, comme des emails ou des agendas. Ce virage rejoint une tendance de fond dans l'industrie, où Google, Apple et Microsoft misent également sur des assistants capables de produire plutôt que de simplement répondre. La question de la fiabilité reste cependant entière. Les partenariats avec des médias établis constituent un garde-fou, mais l'expérience accumulée avec les grands modèles de langage montre qu'une source sérieuse ne suffit pas à éliminer les hallucinations ou les raccourcis factuels. C'est précisément sur ce terrain que se jouera la crédibilité d'Alexa Podcasts sur le long terme.

UELes créateurs de podcasts et médias européens, dont français, font face à une concurrence directe d'un outil de génération audio à la demande déployé par Amazon sur leurs marchés.

💬 Ce qui me frappe, c'est pas la technique, c'est la vitesse à laquelle Amazon banalise la production audio. Pour un créateur de podcast, le sujet n'est plus de savoir si Alexa peut faire ça à sa place, c'est de trouver quoi apporter qu'une IA ne fabrique pas en 3 minutes. Les partenariats avec Reuters et le Washington Post, c'est le minimum syndical pour pas se faire atomiser en conférence de presse par les hallucinations.

CréationOutil
1 source
☕️ Le pape lance une commission sur l’intelligence artificielle
419Next INpact 

☕️ Le pape lance une commission sur l’intelligence artificielle

Le pape Léon XIV a annoncé dimanche 18 mai 2026 la création d'une commission vaticane dédiée à l'intelligence artificielle, chargée de coordonner la réponse de l'Église catholique au développement de ces technologies. Cette annonce intervient quelques jours avant la publication de la première encyclique du souverain pontife, prévue pour le 25 mai, dont le contenu reste confidentiel mais qui doit tracer les orientations morales de l'Église sur plusieurs sujets contemporains, dont l'IA. La commission a pour mandat explicite d'examiner la technologie, ses effets potentiels sur les êtres humains et l'humanité entière, ainsi que les préoccupations de l'Église concernant la dignité de chaque personne. Cette initiative traduit une volonté d'institutionnaliser la réflexion éthique catholique sur l'IA à un moment où la technologie s'impose dans tous les secteurs de la société. Pour des centaines de millions de fidèles catholiques dans le monde, cette commission pourrait constituer un cadre de référence moral face à des outils dont l'adoption est souvent plus rapide que la réflexion éthique. L'Église se positionne ainsi non pas comme un acteur technologique, mais comme une autorité morale capable d'interpeller gouvernements et entreprises sur les garde-fous nécessaires, notamment en matière de dignité humaine, de travail et d'usage responsable des données. Cette démarche s'inscrit dans un contexte plus large où les grands développeurs d'IA cherchent activement des repères éthiques auprès des traditions religieuses et philosophiques. Des entreprises comme Google, Microsoft ou des startups spécialisées ont multiplié les consultations avec des leaders religieux de toutes confessions. Le Vatican lui-même avait déjà pris position sur le sujet par le passé, Léon XIV ayant notamment demandé aux prêtres de ne pas utiliser l'IA pour rédiger leurs homélies. Avec cette commission permanente et l'encyclique à venir, l'Église catholique franchit un cap en dotant sa réflexion d'une structure institutionnelle durable, susceptible de peser dans les débats réglementaires internationaux.

UELa commission vaticane et la future encyclique pourraient peser dans les débats réglementaires européens sur l'éthique de l'IA, notamment sur les exigences de dignité humaine déjà inscrites dans l'AI Act.

ÉthiqueOpinion
1 source
ChatGPT veut accéder à votre compte bancaire pour analyser vos dépenses
420The Decoder 

ChatGPT veut accéder à votre compte bancaire pour analyser vos dépenses

OpenAI vient de lancer une fonctionnalité permettant aux abonnés ChatGPT Pro aux États-Unis de connecter leur compte bancaire directement à l'assistant, via l'intégration du service financier Plaid. Une fois la liaison établie, ChatGPT peut analyser les transactions réelles de l'utilisateur pour fournir des conseils personnalisés sur ses dépenses, comme signaler des achats récurrents de repas livrés ou identifier des abonnements oubliés. La fonctionnalité repose sur GPT-5.5 Thinking, la version raisonnement du modèle, et doit progressivement s'étendre à l'ensemble des utilisateurs. OpenAI précise toutefois que l'outil ne constitue pas un conseiller financier agréé. L'enjeu est considérable : accéder aux données bancaires d'un utilisateur transforme ChatGPT d'un assistant généraliste en un outil d'accompagnement financier personnalisé, capable de remplacer, ou du moins de concurrencer, des applications dédiées comme Mint ou YNAB. Pour les utilisateurs Pro, qui paient déjà 200 dollars par mois, cela représente une valeur ajoutée tangible. Pour l'industrie, c'est un signal clair qu'OpenAI cible désormais les services financiers personnels, un secteur traditionnellement réservé aux banques et aux fintechs. Cette annonce s'inscrit dans la stratégie d'OpenAI de transformer ChatGPT en super-application capable de gérer tous les aspects du quotidien numérique. La question de la confiance et de la sécurité des données reste centrale : confier ses relevés bancaires à une IA soulève des interrogations réglementaires, notamment en Europe où le RGPD et la directive PSD2 encadrent strictement ce type d'accès. La compétition avec Google, Microsoft et les acteurs fintech comme Intuit s'annonce intense.

UELa fonctionnalité est actuellement limitée aux États-Unis, mais son expansion potentielle en Europe se heurterait au RGPD et à la directive PSD2, qui encadrent strictement l'accès aux données bancaires, rendant un déploiement immédiat peu probable.

💬 Connecter son compte bancaire à ChatGPT, c'est le genre de fonctionnalité qui semble évidente une fois qu'on la voit, et que personne n'avait osé lancer avant. Le vrai sujet c'est la confiance : filer ses relevés à OpenAI, c'est un pari énorme sur leur sérieux en matière de sécurité. En Europe, le RGPD et PSD2 bloqueront ça encore un bon moment, mais ça donne le cap.

Anthropic lance Claude pour les PME afin d'intégrer l'IA dans vos outils du quotidien
421The Decoder 

Anthropic lance Claude pour les PME afin d'intégrer l'IA dans vos outils du quotidien

Anthropic a lancé "Claude for Small Business", une offre dédiée aux petites entreprises qui regroupe quinze workflows agentiques et des intégrations natives avec des outils de gestion largement répandus comme QuickBooks, PayPal et HubSpot. La société déploie simultanément des formations gratuites en ligne et une tournée d'ateliers dans dix villes américaines, afin d'accompagner concrètement les entrepreneurs dans la prise en main de ces nouvelles fonctionnalités. L'initiative cible un segment souvent délaissé par les grandes offres IA d'entreprise : les PME et TPE qui utilisent déjà ces logiciels de comptabilité, de paiement ou de CRM au quotidien, mais sans exploiter leur potentiel d'automatisation. En intégrant Claude directement dans ces outils, Anthropic cherche à réduire la friction d'adoption : pas besoin d'une équipe technique, l'IA s'active là où le travail se fait déjà. L'impact potentiel est significatif, car QuickBooks comptabilise à lui seul plusieurs millions de petites entreprises clientes aux États-Unis. Cette offensive s'inscrit dans une compétition féroce pour capter le marché des PME, où OpenAI, Google et Microsoft positionnent également leurs modèles via des partenariats avec des éditeurs de logiciels. Anthropic, longtemps perçu comme orienté grands comptes et recherche, signale ainsi une volonté claire d'élargir sa base d'utilisateurs vers le tissu économique plus diffus des indépendants et petites structures. La tournée nationale de workshops suggère une stratégie de croissance fondée autant sur l'éducation que sur la technologie.

UELes PME françaises utilisant HubSpot, PayPal ou QuickBooks pourraient accéder aux intégrations Claude, mais la tournée d'ateliers et la stratégie d'accompagnement restent exclusivement ciblées sur le marché américain.

OutilsOutil
1 source
Gemini Intelligence : 7 choses que votre Android va (enfin) faire à votre place
422Le Big Data 

Gemini Intelligence : 7 choses que votre Android va (enfin) faire à votre place

Google a officiellement présenté Gemini Intelligence le 12 mai 2026 lors de l'Android Show, l'édition I/O de sa conférence annuelle. Annoncé par le PDG Sundar Pichai, ce système transforme Android en ce que Google appelle un "système d'intelligence" proactif, réservé dans un premier temps à ses appareils les plus avancés. Concrètement, Gemini Intelligence regroupe plusieurs fonctionnalités distinctes : l'automatisation de tâches multi-étapes entre applications (trouver un programme dans Gmail, ajouter les livres requis dans un panier, réserver un VTC), une analyse visuelle permettant à l'IA de "voir" l'écran ou de traiter une photo pour déclencher une action sur une app tierce comme Expedia, une intégration dans Chrome prévue fin juin pour résumer des articles et comparer des contenus web, une fonction Chrome Auto Browse capable de remplir des formulaires de réservation de manière autonome, et un système d'Autofill intelligent baptisé Personal Intelligence qui croise les données de plusieurs applications connectées pour pré-remplir les formulaires en un geste. Une fonctionnalité nommée Rambler permet également de convertir des notes vocales en texte structuré et soigné. L'enjeu central est le passage de l'assistant réactif à l'agent autonome : l'IA n'attend plus les instructions pas à pas, elle prend en charge une intention globale et orchestre les applications nécessaires pour l'accomplir. Pour les utilisateurs, cela représente une réduction concrète du temps passé sur des tâches répétitives et cognitives légères, réservations, formulaires, recherches multi-sources, qui fragmentent l'attention au quotidien. Pour Google, c'est une réponse directe à Apple Intelligence et aux assistants IA intégrés que Microsoft déploie dans Windows, dans une course au contrôle du "layer" d'intelligence posé au-dessus du système d'exploitation. La promesse de confidentialité des données, traitées localement ou sous contrôle explicite de l'utilisateur, est présentée comme un différenciateur face aux craintes liées aux agents ayant accès aux données personnelles. Cette annonce s'inscrit dans une accélération générale des systèmes d'agents IA en 2025-2026, après des années de promesses non tenues sur les assistants vocaux. Google avait déjà expérimenté des fonctionnalités similaires avec Duplex, qui réservait des restaurants par téléphone dès 2018, mais la puissance des LLM récents rend ces capacités généralisables à pratiquement n'importe quel contexte. La bataille se joue désormais sur l'intégration profonde dans l'OS et dans le navigateur : Chrome Auto Browse, en automatisant la navigation web, ouvre une brèche dans le modèle publicitaire traditionnel basé sur les clics humains, ce qui pourrait à terme redessiner l'économie du web. Les premières fonctionnalités sont attendues cet été, sans date précise communiquée pour l'ensemble du déploiement.

UELes fonctionnalités d'accès croisé aux données personnelles entre applications soulèvent des questions de conformité avec le RGPD, notamment concernant la transparence du consentement et les limites effectives du traitement local des données utilisateurs sur les appareils Android en Europe.

OutilsOutil
1 source
Google DeepMind présente un pointeur de souris IA propulsé par Gemini, capable de capturer le contexte visuel et sémantique autour du curseur
423MarkTechPost 

Google DeepMind présente un pointeur de souris IA propulsé par Gemini, capable de capturer le contexte visuel et sémantique autour du curseur

Google DeepMind a présenté cette semaine un pointeur de souris dopé à l'intelligence artificielle, propulsé par Gemini, capable de comprendre non seulement où l'utilisateur pointe, mais aussi ce qu'il pointe et pourquoi c'est pertinent. Le système est encore expérimental, mais deux démonstrations sont d'ores et déjà accessibles dans Google AI Studio : l'une pour éditer une image, l'autre pour identifier des lieux sur une carte, toutes deux utilisables en pointant et en parlant à voix haute. Une intégration plus profonde, baptisée Magic Pointer, est en cours de déploiement dans Chrome, et une autre est prévue pour Googlebook, la nouvelle gamme d'ordinateurs portables Gemini de Google annoncée simultanément cette semaine. Le problème que cherche à résoudre DeepMind est connu de quiconque a déjà essayé d'utiliser un assistant IA en pleine session de travail : les outils actuels vivent dans leur propre fenêtre, obligeant l'utilisateur à interrompre son flux pour décrire manuellement ce qu'il regardait, coller une question dans un chatbot, puis importer la réponse dans son document d'origine. Le pointeur IA brise ce cycle en transmettant au modèle un contexte visuel et sémantique en temps réel, dérivé de la position du curseur et de l'état de survol, sans que l'utilisateur ait à formuler ce contexte en texte. Concrètement, cela permet de pointer un tableau de statistiques et demander une version en camembert, de survoler une recette pour en doubler les ingrédients, ou de pointer un PDF pour en obtenir un résumé en points à coller directement dans un email. Cette initiative s'inscrit dans une tendance plus large chez les grandes plateformes technologiques : rendre l'IA ambiante plutôt que cloisonnée dans une fenêtre de chat. Depuis l'émergence des grands modèles de langage grand public, la friction principale reste l'interface : les modèles sont puissants, mais les utilisateurs doivent sérialiser manuellement leur environnement en texte pour les actionner. DeepMind formalise quatre principes de conception pour y remédier, dont "maintenir le flux" (l'IA suit l'utilisateur là où il travaille, sans détour) et "montrer et dire" (le pointeur capte le contexte visuel, remplaçant les prompts détaillés par un simple geste). Microsoft avance en parallèle avec Copilot intégré à Windows, tandis qu'Apple mise sur des capacités similaires avec Apple Intelligence. Avec l'annonce simultanée des laptops Googlebook et le déploiement dans Chrome, Google positionne Gemini comme une couche système universelle, ce qui pourrait redéfinir profondément la manière dont des centaines de millions d'utilisateurs interagissent avec leur ordinateur au quotidien.

UEL'intégration d'une IA ambiante dans les navigateurs et systèmes d'exploitation pourrait modifier les pratiques numériques de millions d'utilisateurs européens, soulevant des questions sur la dépendance aux grandes plateformes et la conformité au RGPD.

OutilsOutil
1 source
Perceptron Mk1 présente un modèle d'analyse vidéo très performant, 80 à 90 % moins cher qu'Anthropic, OpenAI et Google
424VentureBeat AI 

Perceptron Mk1 présente un modèle d'analyse vidéo très performant, 80 à 90 % moins cher qu'Anthropic, OpenAI et Google

La startup américaine Perceptron Inc. a lancé ce mois-ci son modèle d'analyse vidéo par intelligence artificielle, baptisé Mk1 (pour "Mark One"), à un prix qui bouleverse les standards du marché : 0,15 dollar par million de tokens en entrée et 1,50 dollar par million en sortie via son API. Ces tarifs représentent une réduction de 80 à 90 % par rapport aux principaux concurrents propriétaires, soit Claude Sonnet 4.5 d'Anthropic, GPT-5 d'OpenAI et Gemini 3.1 Pro de Google, ce dernier étant facturé autour de 3 dollars le million de tokens en coût combiné. Fondée il y a deux ans et pilotée par Armen Aghajanyan, ex-chercheur chez Meta FAIR et Microsoft, l'entreprise a consacré seize mois à développer une architecture multimodale conçue de zéro pour comprendre le monde physique. Sur les benchmarks de référence, Mk1 atteint 85,1 sur EmbSpatialBench, devançant le modèle Robotics-ER 1.5 de Google (78,4), et signe 72,4 sur RefSpatialBench contre seulement 9,0 pour GPT-5m et 2,2 pour Sonnet 4.5. Sur VSI-Bench, dédié au raisonnement temporel vidéo, Mk1 enregistre 88,5, le meilleur score parmi tous les modèles comparés. Ce positionnement ouvre concrètement l'analyse vidéo avancée à des usages industriels à grande échelle, jusqu'ici freinés par les coûts. Des secteurs comme la sécurité physique, la production de contenu marketing, la recherche comportementale ou le contrôle qualité en fabrication peuvent désormais envisager un déploiement massif sans budget prohibitif. La capacité du modèle à traiter des flux vidéo natifs à 2 images par seconde sur une fenêtre de contexte de 32 000 tokens, tout en maintenant la continuité temporelle des objets entre les frames, représente un bond technique par rapport aux modèles de vision classiques qui traitent la vidéo comme une succession d'images fixes déconnectées. L'analyse vidéo par IA reste aujourd'hui une niche technique dominée par quelques acteurs disposant de ressources considérables. Perceptron s'inscrit dans une tendance plus large où des startups spécialisées cherchent à attaquer des segments précis du marché des modèles fondamentaux, en ciblant ce que l'entreprise appelle la "frontière d'efficience", soit le rapport optimal entre performance et coût. Face à des géants comme Google, OpenAI et Anthropic qui développent des modèles généralistes onéreux, cette approche verticale centrée sur la compréhension du monde physique, incluant la causalité, la dynamique des objets et les lois de la physique, constitue un pari stratégique distinct. Une démo publique est disponible pour tester le modèle, et l'entreprise vise clairement les contrats enterprise à fort volume plutôt que la recherche exploratoire.

OutilsOpinion
1 source
Personal Computer : le « Claude Cowork » de Perplexity est enfin accessible à tous
425Le Big Data 

Personal Computer : le « Claude Cowork » de Perplexity est enfin accessible à tous

Perplexity a ouvert au grand public son application Mac, jusqu'ici réservée à un accès limité, en y intégrant une fonctionnalité centrale baptisée Personal Computer. Disponible dès maintenant en téléchargement direct depuis le site de Perplexity (l'App Store n'est pas encore de la partie), l'application embarque les fonctions de base attendues, recherche web, pièces jointes, dictée vocale, mais c'est l'agent autonome Personal Computer qui concentre l'essentiel de l'attention. Ce système s'exécute directement sur le Mac de l'utilisateur, accède aux fichiers locaux, aux applications natives macOS, aux outils connectés et au web, et prend en charge des tâches complexes de manière indépendante. Concrètement, l'utilisateur ouvre ses Notes, appuie sur CMD, formule une instruction, gérer une liste de tâches, réorganiser un dossier, extraire des informations, et l'agent s'en charge sans intervention supplémentaire. Mieux encore, il fonctionne en continu : une tâche lancée depuis un iPhone continuera de s'exécuter sur le Mac à domicile, même en l'absence de l'utilisateur. Pour les professionnels qui jonglent quotidiennement entre dizaines d'applications, de fichiers et de sources d'information, ce type d'agent représente un gain de temps potentiellement significatif. Perplexity positionne Personal Computer comme une couche d'automatisation qui réduit la friction entre l'intention et l'exécution : plutôt que de passer d'un outil à l'autre, l'utilisateur délègue la séquence entière à l'agent. Le fait que le système reste sous contrôle, il ne prend pas de décision critique sans validation, chaque action est réversible, et les validations sont possibles depuis n'importe quel appareil, répond directement aux craintes liées à l'autonomie des IA. Ce design "human-in-the-loop" devient progressivement un standard implicite dans ce segment. Personal Computer n'évolue pas dans un vide concurrentiel. Anthropic propose une fonctionnalité comparable avec Claude Cowork, capable lui aussi de piloter des tâches sur la machine locale de l'utilisateur. Microsoft, Apple et Google poussent leurs propres agents d'automatisation dans leurs systèmes d'exploitation respectifs. Ce que Perplexity tente ici, c'est de s'imposer comme une couche d'intelligence transversale, indépendante de l'écosystème natif, en s'appuyant sur sa réputation dans la recherche augmentée. L'absence sur l'App Store reste un frein à l'adoption grand public, mais elle reflète probablement les contraintes imposées par Apple sur les applications accédant aux fichiers système et aux processus locaux. Les prochains mois diront si Personal Computer parvient à fidéliser au-delà des early adopters ou si la bataille des agents de bureau se gagne surtout sur l'intégration OS native.

💬 L'absence sur l'App Store, c'est le signal qu'on zappe vite. Perplexity essaie de s'intercaler comme couche d'IA transversale là où Apple, Microsoft et Google jouent à domicile avec l'OS sous les pieds. Ce genre de pari se gagne rarement, et leur réputation dans la recherche va devoir peser vraiment lourd pour compenser.

OutilsOutil
1 source
Au-delà de ChatGPT : les outils d’IA les plus utilisés dans les bureaux français
426Le Big Data 

Au-delà de ChatGPT : les outils d’IA les plus utilisés dans les bureaux français

Selon un sondage Ifop publié en 2025, 43 % des actifs français déclarent utiliser des outils d'intelligence artificielle générative dans leur travail, et 29 % d'entre eux estiment que leur productivité a progressé de plus de 40 % grâce à ces solutions. Si ChatGPT domine encore largement avec 72 % des utilisateurs, l'écosystème s'est considérablement diversifié : Gemini de Google rassemble 20 % des utilisateurs professionnels, suivi de Microsoft Copilot (12 %), Mistral AI (6 %) et l'outil chinois DeepSeek. Au-delà des assistants conversationnels généralistes, d'autres catégories d'outils s'imposent dans les bureaux français : Notion AI pour la structuration de l'information et la documentation automatisée, Motion et Clockwise pour la planification intelligente des tâches et des agendas, ou encore Power BI et Microsoft Copilot pour transformer des données brutes en tableaux de bord interactifs accessibles en langage naturel. Ces chiffres révèlent une transformation profonde des pratiques professionnelles en France. L'IA n'est plus un outil expérimental réservé aux équipes tech : elle s'intègre dans les flux de travail quotidiens des secteurs aussi variés que la finance, la logistique, le marketing ou les administrations publiques. Microsoft Copilot, directement intégré à Word, Excel et Outlook, s'est imposé dans les grandes entreprises précisément parce qu'il ne demande aucun changement d'outil. Google Gemini progresse dans les organisations déjà équipées de Workspace. Pour les non-experts en données, la capacité à interroger un tableau Excel en français courant représente un gain d'autonomie réel, qui redistribue les compétences analytiques au sein des équipes. Cette montée en puissance de l'IA dans les bureaux français s'inscrit dans un contexte de double tension : entre efficacité et souveraineté des données. Face aux géants américains, plusieurs organisations françaises se tournent vers Mistral AI, principale alternative européenne, dont les modèles sont entraînés et hébergés en Europe, un argument décisif pour les acteurs soumis au RGPD ou à des contraintes de sécurité renforcées. Hugging Face, plateforme open-source fondée à Paris et désormais valorisée à plusieurs milliards de dollars, attire les entreprises qui veulent contrôler leurs pipelines d'IA sans dépendre d'une API propriétaire. L'adoption reste néanmoins inégale selon les secteurs : si les startups et les équipes marketing expérimentent rapidement, les industries plus régulées avancent avec prudence. La prochaine étape sera probablement moins le choix de l'outil que la capacité des organisations à former leurs salariés et à intégrer ces solutions dans des processus métiers cohérents.

UEL'adoption de l'IA dans 43 % des actifs français interroge directement la souveraineté des données face aux géants américains, et renforce le positionnement de Mistral AI et Hugging Face comme alternatives européennes conformes au RGPD.

💬 29 % qui déclarent +40 % de productivité, si c'est vrai, on parle d'un choc comparable à l'arrivée d'Excel dans les bureaux. Ce qui m'intéresse dans ces chiffres, c'est pas le classement des outils, c'est que Copilot tient son rang sans rien demander à personne, juste en restant dans Word et Outlook. La vraie question maintenant, c'est pas quel outil choisir, c'est qui va former les gens à s'en servir vraiment.

SociétéOutil
1 source
Les émissions de gaz à effet de serre des data centers pourraient dépasser celles de nations entières
427Ars Technica AI 

Les émissions de gaz à effet de serre des data centers pourraient dépasser celles de nations entières

Onze campus de centres de données en cours de construction aux États-Unis sont associés à des projets de centrales au gaz naturel dont les émissions combinées pourraient dépasser 129 millions de tonnes de gaz à effet de serre par an, soit plus que l'ensemble des émissions du Maroc en 2024. Ces chiffres proviennent de documents de demandes de permis atmosphériques examinés par WIRED, soumis auprès d'agences étatiques américaines. Les infrastructures concernées alimenteront des centres de données au service de quelques-unes des entreprises d'IA les plus puissantes du pays : OpenAI, Meta, Microsoft et xAI figurent parmi les bénéficiaires identifiés. Ces projets sont soit déjà annoncés, soit en cours de construction. Ce que révèlent ces chiffres dépasse largement un problème local : ils illustrent le coût climatique concret de la course mondiale à l'IA. La particularité de ces installations est qu'elles contournent le réseau électrique public pour alimenter directement et exclusivement les centres de données, un modèle dit "behind-the-meter". Résultat : leurs émissions échappent aux mécanismes habituels de régulation et de comptabilisation carbone. Pour les consommateurs, la dynamique est aussi préoccupante : cette stratégie est partiellement motivée par la volonté des géants technologiques d'éviter d'alourdir les factures d'électricité des ménages, qui subissent déjà une résistance publique croissante face à la hausse des tarifs. Cette tendance s'inscrit dans un contexte de saturation du réseau électrique américain : les délais de raccordement aux opérateurs traditionnels s'allongent considérablement, poussant les développeurs de centres de données à produire leur propre énergie. Les projets listés ne représentent selon WIRED que la partie émergée de l'iceberg, alors que les grandes entreprises technologiques s'engagent dans des centaines de nouveaux centres à travers le pays. La question de la compatibilité entre les objectifs climatiques des États-Unis et l'expansion effrénée de l'infrastructure IA se pose désormais avec une acuité nouvelle, au moment où plusieurs États commencent à examiner plus attentivement les permis accordés à ces projets énergétiques hors réseau.

UEL'UE, engagée dans des objectifs climatiques contraignants et le reporting carbone obligatoire, pourrait faire face à des pressions similaires si le modèle d'alimentation directe hors réseau se généralise dans ses propres projets d'infrastructure IA.

InfrastructureActu
1 source
Google lance ses puces TPU 8, trois fois plus puissantes, pour accélérer l'entraînement IA et réduire les coûts cloud
428Interesting Engineering 

Google lance ses puces TPU 8, trois fois plus puissantes, pour accélérer l'entraînement IA et réduire les coûts cloud

Google a dévoilé la huitième génération de ses Tensor Processing Units lors de la conférence Google Cloud Next, en introduisant deux puces d'IA distinctes : la TPU 8t, dédiée à l'entraînement des modèles, et la TPU 8i, optimisée pour l'inférence. La TPU 8t peut s'étendre jusqu'à 9 600 puces dans un seul superpod, atteignant 121 exaflops de puissance de calcul, soit près de trois fois les performances de la génération précédente, baptisée Ironwood. Elle vise un taux de "goodput" supérieur à 97 %, c'est-à-dire un temps de calcul productif maximisé, limitant les pauses dues aux pannes ou aux goulots d'étranglement. La TPU 8i, quant à elle, embarque 288 Go de mémoire haute bande passante et 384 Mo de SRAM on-chip, et affiche une amélioration de 80 % du rapport performance/dollar par rapport à la génération précédente, permettant de traiter presque deux fois plus de charge à coût équivalent. Les deux puces seront disponibles en accès général via Google Cloud d'ici la fin de l'année. Cette annonce marque une rupture dans la façon dont l'industrie conçoit l'infrastructure IA. En séparant les cas d'usage entraînement et inférence en deux architectures matérielles distinctes, Google reconnaît que les charges de travail modernes ont des profils radicalement différents. Les agents IA, qui enchaînent des raisonnements, appellent des outils et interagissent en boucle avec d'autres modèles, exigent des temps de réponse très courts et une mémoire rapide proche du processeur, ce que la TPU 8i cible directement. Pour les entreprises clientes, le gain de performance par dollar est concret : gérer deux fois plus d'utilisateurs simultanés sans augmenter la facture cloud change l'équation économique du déploiement de modèles à grande échelle. Google développe ses TPU depuis 2016 pour ses propres systèmes internes, dont Gemini, mais les ouvre désormais plus largement aux clients cloud face à une demande explosive en calcul IA. La stratégie est claire : offrir une alternative intégrée à l'écosystème Nvidia en combinant silicium propriétaire, réseaux personnalisés, frameworks logiciels et services cloud en un seul stack. Les deux puces supportent JAX, PyTorch, SGLang et vLLM, abaissant la barrière à la migration pour les développeurs. Sur le plan énergétique, les TPU 8 offrent jusqu'à deux fois plus de performance par watt que la génération Ironwood et utilisent un refroidissement liquide de quatrième génération. La bataille pour l'infrastructure IA de prochaine génération s'intensifie, avec Google, Microsoft, Amazon et Meta qui investissent massivement dans leurs propres puces pour réduire leur dépendance à Nvidia tout en contrôlant les coûts d'exploitation à long terme.

UELes entreprises européennes déployant des modèles IA sur Google Cloud pourraient bénéficier d'une réduction significative de leurs coûts d'inférence grâce au gain de 80 % du rapport performance/dollar annoncé pour les TPU 8i.

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents
429NVIDIA AI Blog 

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents

NVIDIA et Google Cloud ont annoncé cette semaine, lors de la conférence Google Cloud Next à Las Vegas, une nouvelle étape majeure dans leur partenariat vieux de plus de dix ans. Au cœur de l'annonce : le lancement des instances bare-metal A5X, alimentées par les systèmes rack NVIDIA Vera Rubin NVL72, qui promettent un coût d'inférence jusqu'à dix fois inférieur et un débit de tokens dix fois plus élevé par mégawatt par rapport à la génération précédente. Ces infrastructures s'appuient sur les interconnexions NVIDIA ConnectX-9 SuperNICs couplées au réseau Google Virgo de nouvelle génération, permettant de déployer des clusters allant jusqu'à 80 000 GPU Rubin sur un site unique, et jusqu'à 960 000 GPU dans une configuration multisite. Par ailleurs, Google Cloud met en préversion les modèles Gemini sur Google Distributed Cloud avec les GPU NVIDIA Blackwell et Blackwell Ultra, ainsi que des machines virtuelles confidentielles garantissant le chiffrement des données en cours d'utilisation. Des acteurs comme OpenAI et Thinking Machines Lab utilisent déjà ces infrastructures pour des charges d'inférence massives, notamment pour faire tourner ChatGPT. Ces annonces représentent un saut qualitatif significatif pour les entreprises qui cherchent à industrialiser l'IA agentique et l'IA physique, c'est-à-dire les systèmes capables d'agir de manière autonome dans des environnements réels, comme les robots ou les jumeaux numériques en usine. La réduction drastique des coûts d'inférence change concrètement l'équation économique pour les développeurs d'applications IA à grande échelle. La possibilité de déployer les modèles Gemini en environnement souverain, sur des données sensibles restant chiffrées y compris pendant leur traitement, répond à une exigence croissante des entreprises et des gouvernements en matière de conformité et de confidentialité. L'intégration de modèles ouverts NVIDIA Nemotron dans la plateforme Gemini Enterprise Agent Platform élargit également les options des équipes techniques qui souhaitent combiner modèles propriétaires et open source. Ce partenariat s'inscrit dans une compétition intense entre les grands fournisseurs de cloud pour capter les budgets d'infrastructure IA, qui se chiffrent désormais en dizaines de milliards de dollars annuellement. Google Cloud cherche à rattraper son retard sur AWS et Microsoft Azure, qui ont pris de l'avance sur l'hébergement des charges d'entraînement et d'inférence des grands modèles de langage. En s'associant étroitement à NVIDIA, dont les GPU dominent encore largement le marché de l'accélération IA, Google se positionne comme une plateforme de référence pour la prochaine vague, celle des agents autonomes et de la robotique industrielle. La feuille de route annoncée, avec la transition de Blackwell vers Vera Rubin, suggère que la cadence d'innovation s'accélère et que les entreprises devront adapter leur infrastructure régulièrement pour rester compétitives.

UELe déploiement souverain de Gemini sur Google Distributed Cloud avec chiffrement des données en cours d'utilisation répond aux exigences RGPD des entreprises européennes traitant des données sensibles.

InfrastructureOpinion
1 source
Nvidia Rubin Ultra : le GPU qui transformera les AI Factories en 2027
430Le Big Data 

Nvidia Rubin Ultra : le GPU qui transformera les AI Factories en 2027

Nvidia a officiellement confirmé le lancement de son prochain GPU phare, le Rubin Ultra, prévu pour 2027. Successeur du Blackwell Ultra, cette puce repose sur une architecture en chiplets de type MCM (Multi-Chip Module) assemblant quatre dies gravés en nœud N2 chez TSMC, pour un total d'environ 336 milliards de transistors. Elle s'intègre dans la plateforme Vera, un écosystème complet où le GPU collabore avec le processeur Vera, doté de 88 cœurs, via une interconnexion NVLink-C2C sans latence. Le tout est relié par le nouveau commutateur NVLink 6, conçu pour des vitesses de transfert inédites à l'échelle des racks de serveurs. La mémoire intégrée atteint 1 To de HBM4e répartis sur 12 stacks, avec une bande passante annoncée à 22 To/s, soit un bond considérable par rapport aux générations précédentes. Ce niveau de performance change concrètement la donne pour les entreprises qui entraînent ou déploient des grands modèles de langage. Avec 1 To de mémoire embarquée sur une seule puce, il devient possible de charger des modèles entiers sans recourir à des échanges lents entre composants, l'un des goulots d'étranglement structurels des infrastructures actuelles. L'architecture en chiplets apporte par ailleurs une modularité absente des puces monolithiques : la montée en charge des clusters de serveurs devient plus fluide, et chaque unité de calcul peut fonctionner en coordination étroite avec les autres. Pour les opérateurs de data centers et les hyperscalers, le Rubin Ultra ne représente pas un simple upgrade de performance, mais une refonte de ce que l'on appelle désormais les "AI Factories", ces infrastructures entièrement conçues autour des besoins du calcul IA. Nvidia accélère son calendrier de manière visible : le Rubin Ultra arrivera en 2027, mais son architecture est déjà documentée et ses partenariats hardware (TSMC N2, HBM4e) sont scellés, signalant une volonté de garder plusieurs générations d'avance sur ses concurrents AMD et Intel, ainsi que sur les puces maison développées par Google (TPU), Amazon (Trainium) et Microsoft (Maia). La transition vers les chiplets, longtemps réservée aux CPU, marque un tournant pour les GPU de datacenter. L'intégration verticale de la plateforme Vera, qui lie hardware et software de façon indissociable, rappelle la stratégie d'Apple avec ses puces M, mais appliquée à l'échelle des supercalculateurs industriels. Les entreprises qui visent ces infrastructures devront consentir des investissements massifs, mais la dépendance à l'écosystème Nvidia, déjà forte via CUDA, ne fera que s'approfondir avec cette nouvelle génération.

UELes opérateurs européens de data centers et les hyperscalers devront planifier dès maintenant des investissements massifs pour 2027, tout en s'enfermant davantage dans l'écosystème Nvidia via CUDA et la plateforme Vera.

InfrastructureOpinion
1 source
Meta formerait des agents IA en surveillant les souris et claviers de ses employés
431Ars Technica AI 

Meta formerait des agents IA en surveillant les souris et claviers de ses employés

Meta va commencer à collecter les mouvements de souris, clics et frappes clavier de ses employés américains pour entraîner ses futurs agents d'intelligence artificielle. L'initiative, baptisée Model Capability Initiative, a été annoncée en interne via des mémos publiés par l'équipe Meta Superintelligence Labs et révélée par Reuters. Le logiciel de suivi fonctionnera sur des applications et sites web professionnels spécifiques, et prendra également des captures d'écran périodiques pour fournir du contexte aux données d'entraînement. Selon le mémo interne, "c'est là où tous les employés de Meta peuvent aider nos modèles à s'améliorer simplement en faisant leur travail quotidien." Cette approche vise à produire des données d'entraînement de haute qualité pour les agents IA, c'est-à-dire des systèmes capables d'accomplir des tâches complexes de manière autonome sur un ordinateur. Reproduire fidèlement les comportements humains réels dans des environnements de travail concrets est un défi majeur pour ce type d'IA, et les données synthétiques ou publiques ne suffisent plus. En utilisant le travail quotidien de milliers d'employés comme source de données, Meta espère accélérer le développement d'agents capables de naviguer dans des interfaces réelles. Cette initiative s'inscrit dans une course effrénée entre les grandes entreprises technologiques pour développer des agents IA performants, un marché que Microsoft, Google et OpenAI ciblent également activement. La question de la surveillance des employés à des fins commerciales soulève néanmoins des questions éthiques et juridiques, notamment en matière de consentement et de vie privée au travail. Il reste à voir si Meta étendra ce programme à ses employés hors des États-Unis, où les réglementations comme le RGPD européen imposent des contraintes bien plus strictes.

UELe RGPD impose un consentement explicite pour la collecte de données comportementales des employés, rendant une extension de ce programme aux salariés européens de Meta juridiquement très complexe, voire impossible sans refonte du dispositif.

ÉthiqueActu
1 source
La mise à jour de Codex pose les bases de la « superapp » d’OpenAI
432Next INpact 

La mise à jour de Codex pose les bases de la « superapp » d’OpenAI

OpenAI a livré hier une mise à jour majeure de Codex, son application dédiée au développement logiciel, disponible sur macOS depuis février 2026 et sur Windows depuis mars. Ce logiciel, qui permet aux développeurs d'utiliser un agent IA spécialisé dans la programmation via une interface graphique ou en ligne de commande, s'enrichit de capacités inédites : intégration avec n'importe quelle application Mac, déploiement de plusieurs agents en tâche de fond, navigateur web embarqué avec annotations directes sur les pages, génération de visuels d'interface via le modèle gpt-image-1.5, gestion de multiples terminaux en simultané, connexion à des environnements distants par SSH (encore en alpha), et une bibliothèque élargie à plus de 90 modules d'extension connectant Codex à des services comme Slack, Notion, GitLab ou CodeRabbit. L'application gère désormais la planification de tâches longues et conserve le contexte des conversations pour reprendre un travail sans que l'utilisateur ait à tout réexpliquer. Ce qui rend cette mise à jour stratégiquement significative dépasse la simple liste de fonctionnalités : Thibault Sottiaux, responsable de Codex chez OpenAI, a confirmé à Ars Technica que Codex est la brique fondatrice de la future « superapp » qu'OpenAI construit depuis plusieurs mois. L'objectif est de créer un point d'entrée universel capable de répondre aux besoins de tous les profils d'utilisateurs, développeurs, professionnels et grand public, en servant d'intermédiaire entre l'utilisateur et l'ensemble de son environnement numérique. Concrètement, cela signifie qu'un agent pourrait détecter une décision prise dans Slack, récupérer les détails dans Notion, vérifier l'état du code existant et proposer automatiquement une liste d'actions, sans intervention humaine pour reconstituer le contexte. Cette ambition s'inscrit dans une course intense entre les grandes plateformes d'IA à la captation de l'interface quotidienne des utilisateurs. OpenAI affronte ici directement Anthropic avec Claude Code, mais aussi Microsoft, Google et les acteurs spécialisés du développement assisté. La stratégie choisie, construire la superapp « au grand jour » en faisant évoluer un outil déjà adopté par les développeurs, présente l'avantage de valider chaque brique en conditions réelles avant d'élargir le public cible. Le navigateur intégré, par exemple, laisse entrevoir une possible mise en retrait d'Atlas, le propre navigateur qu'OpenAI développait en parallèle. L'enjeu à terme est considérable : celui qui parvient à s'imposer comme couche d'orchestration entre l'utilisateur, ses outils et ses données détient un levier d'influence considérable sur l'ensemble du flux de travail numérique.

UELes développeurs français et européens peuvent adopter dès maintenant les nouvelles fonctionnalités de Codex, mais l'impact reste indirect, sans implications réglementaires ou institutionnelles propres à l'UE.

Les bons résultats de TSMC confirment l'élan de l'IA
433The Information AI 

Les bons résultats de TSMC confirment l'élan de l'IA

TSMC, le géant taïwanais de la fabrication de puces électroniques, a publié jeudi ses résultats du premier trimestre 2026 avec une croissance de revenus de 40,6%, dépassant le haut de sa fourchette de prévisions. Le PDG C.C. Wei a relevé l'objectif de croissance annuel à plus de 30%, et déclaré que "la demande liée à l'IA continue d'être extrêmement robuste." Cette évaluation repose sur les retours directs des clients de TSMC, au premier rang desquels Nvidia, ainsi que des grandes firmes cloud qui achètent ces puces. Ces résultats constituent un signal fort pour l'ensemble du secteur technologique. Si TSMC, qui fabrique les puces pour pratiquement tous les grands acteurs de l'IA, affiche une telle croissance, cela laisse présager des résultats solides pour les grandes entreprises tech qui publieront leurs chiffres trimestriels plus tard en avril. Les marchés ont déjà anticipé cette dynamique : depuis fin mars, Microsoft a progressé de 18%, Nvidia de 20%, et le Nasdaq dans son ensemble de 16%. La vigueur de TSMC s'inscrit dans un contexte de multiplication des signaux haussiers autour de l'IA, malgré les incertitudes macroéconomiques mondiales. Le fabricant taïwanais occupe une position unique dans la chaîne de valeur : il est le maillon indispensable entre les concepteurs de puces comme Nvidia ou AMD et les déploiements massifs des hyperscalers comme Microsoft Azure, Google Cloud ou Amazon AWS. La robustesse de sa demande suggère que les investissements en infrastructure IA ne montrent aucun signe de ralentissement, alimentant l'optimisme avant une saison de résultats qui s'annonce décisive pour valider, ou nuancer, l'enthousiasme des marchés.

InfrastructureOpinion
1 source
434VentureBeat AI 

Une étude Databricks montre que les agents multi-étapes surpassent le RAG mono-requête sur des sources multiples

Une équipe de recherche de Databricks a publié des résultats montrant que les agents multi-étapes surpassent systématiquement les systèmes RAG classiques lorsque les questions nécessitent de croiser données structurées et contenu non structuré. Testés sur neuf tâches de connaissance d'entreprise, les agents multi-étapes affichent des gains de 20% ou plus sur le benchmark STaRK de Stanford, qui couvre trois domaines semi-structurés : les données produits Amazon, le Microsoft Academic Graph et une base de connaissances biomédicale. Sur ce dernier domaine, l'écart de performance atteint 38%. Pour s'assurer que ces gains ne s'expliquent pas simplement par la qualité du modèle sous-jacent, Databricks a réexécuté les baselines STaRK publiées en utilisant un modèle de fondation plus récent et plus puissant : ce modèle plus fort a quand même perdu face à l'agent multi-étapes, confirmant que le problème est architectural. Le problème fondamental des systèmes RAG à passage unique est leur incapacité à décomposer une requête hybride, c'est-à-dire une question qui mélange un filtre structuré précis avec une recherche sémantique ouverte. Une question telle que "Quels produits ont vu leurs ventes baisser ces trois derniers mois, et quels problèmes connexes remontent dans les avis clients ?" exige d'interroger simultanément un entrepôt SQL et des documents non structurés, puis de combiner les résultats. Un système RAG classique ne peut pas scinder cette requête, router chaque partie vers la bonne source de données et synthétiser le tout. Michael Bendersky, directeur de la recherche chez Databricks, résume ainsi la limite : "RAG fonctionne, mais ça ne passe pas à l'échelle. Si vous voulez comprendre pourquoi vos ventes baissent, il faut aider l'agent à voir les tables et les données commerciales. Votre pipeline RAG sera incompétent pour cette tâche." Pour répondre à ce problème, Databricks a conçu le Supervisor Agent, implémentation concrète de cette approche de recherche. Son architecture repose sur trois mécanismes : la décomposition parallèle des outils, où l'agent lance simultanément des requêtes SQL et des recherches vectorielles avant d'analyser les résultats combinés ; l'auto-correction, qui lui permet de détecter un échec de récupération, de reformuler la requête et d'emprunter un autre chemin, comme lorsqu'il exécute une jointure SQL pour trouver un auteur ayant exactement 115 publications sur un sujet précis ; et une configuration déclarative en langage naturel, qui permet de connecter n'importe quelle nouvelle source de données sans ré-entraînement. Ces travaux s'appuient sur les recherches antérieures de Databricks sur les retrievers instruits, qui avaient déjà amélioré la récupération sur données non structurées via des requêtes enrichies de métadonnées, et marquent une extension logique vers les sources relationnelles que les entreprises utilisent le plus au quotidien.

RecherchePaper
1 source
435MIT Technology Review 

The Download : l'état de l'IA et la protection des ours par drones

Le rapport annuel Stanford AI Index 2026, publié cette semaine, dresse un état des lieux chiffré de l'intelligence artificielle mondiale et confirme une réalité fracturée. Parmi ses données les plus frappantes : 73 % des experts américains estiment que l'IA a un impact positif sur l'emploi, contre seulement 23 % du grand public. Cet écart se retrouve dans les domaines de la santé et de l'économie. Par ailleurs, un homme du Texas a été inculpé pour tentative de meurtre sur la personne de Sam Altman, PDG d'OpenAI, après avoir lancé un cocktail Molotov sur sa résidence vendredi dernier. Le suspect aurait détenu une liste d'autres dirigeants de l'industrie de l'IA. Dans le même temps, un mémo interne leaked révèle qu'OpenAI planifie une offensive directe contre son concurrent Anthropic, tout en accusant Microsoft d'avoir "limité sa capacité" à atteindre ses clients, et en cultivant une alliance naissante avec Amazon. Ces développements illustrent les tensions profondes qui traversent l'écosystème IA. Le fossé entre experts et grand public n'est pas anodin : ceux qui utilisent l'IA au quotidien pour le code et les tâches techniques la voient à son meilleur, tandis que le reste de la population fait face à une expérience bien plus inégale. Ce décalage de perception alimente des débats politiques et sociaux mal calibrés. Sur le front compétitif, la rivalité entre grands laboratoires s'intensifie à un moment critique : les meilleurs agents IA n'accomplissent encore que la moitié des tâches complexes qu'un expert humain avec un doctorat peut réaliser, selon une étude publiée dans Nature. L'IA commence néanmoins à transformer les mathématiques en prouvant de nouveaux résultats à un rythme soutenu, et trouve des failles logicielles plus vite qu'elles ne peuvent être corrigées, ce qui représente un risque réel d'exploitation par des hackers. Le rapport Stanford s'inscrit dans un contexte où la rivalité sino-américaine en matière d'IA s'accélère et où les percées de modèles se succèdent plus vite que les capacités de régulation. Les inscriptions en informatique aux États-Unis chutent massivement, une tendance attribuée en partie à la dévaluation perçue du diplôme face aux outils de codage automatisés. Meta s'apprête quant à elle à dépasser Google en revenus publicitaires en 2026, devenant ainsi la première plateforme mondiale de publicité numérique, signe du repositionnement des géants tech autour de l'IA. L'index Stanford rappelle que derrière les annonces spectaculaires, la technologie évolue plus vite que les institutions, les entreprises et les individus ne peuvent s'y adapter.

UELe rapport Stanford AI Index 2026 met en évidence un fossé de perception entre experts et grand public sur l'impact de l'IA sur l'emploi, un enjeu central pour les politiques européennes de régulation et d'adaptation au marché du travail.

SociétéActu
1 source
Cisco en négociations pour acquérir la startup de sécurité IA Astrix pour au moins 250 millions de dollars
436The Information AI 

Cisco en négociations pour acquérir la startup de sécurité IA Astrix pour au moins 250 millions de dollars

Cisco est en négociations avancées pour acquérir Astrix Security, une startup israélienne de cybersécurité fondée il y a cinq ans, pour un montant compris entre 250 et 350 millions de dollars. Cette somme représenterait une prime d'au moins 25 % par rapport à la dernière valorisation de la société, estimée à environ 200 millions de dollars. Astrix commercialise des logiciels permettant de surveiller et sécuriser les agents IA, ces programmes capables d'agir automatiquement au nom des utilisateurs sur leurs appareils. Cette acquisition potentielle illustre l'urgence croissante pour les grandes entreprises technologiques de se doter d'outils face aux risques que posent les agents IA. En quelques mois, leur adoption a explosé dans les environnements professionnels, soulevant des questions inédites de sécurité : un agent mal configuré ou compromis peut accéder à des données sensibles, exécuter des actions non autorisées ou servir de vecteur d'attaque. Pour les entreprises clientes de Cisco, disposer d'une couche de protection dédiée devient rapidement une priorité opérationnelle. Cisco s'inscrit dans une tendance de fond : les grands éditeurs de logiciels, de Microsoft à Palo Alto Networks, cherchent à intégrer des capacités de sécurité spécifiques aux agents IA, soit en développant leurs propres fonctionnalités, soit en rachetant des startups spécialisées. Fondée en Israël, qui reste un vivier mondial de talents en cybersécurité, Astrix a su se positionner tôt sur ce créneau émergent. Si l'accord se conclut, il signalerait que la sécurisation des agents IA est désormais considérée comme un marché à part entière, et non plus un simple ajout aux solutions existantes.

UELes entreprises européennes clientes de Cisco pourraient bénéficier de capacités renforcées pour sécuriser leurs agents IA, un besoin croissant dans les environnements professionnels soumis au RGPD et à l'AI Act.

SécuritéActu
1 source
437Le Big Data 

Nvidia vs Meta : qui contrôle vraiment l’IA en 2026 ?

En 2026, deux géants se livrent une bataille ouverte pour le contrôle de l'infrastructure de l'intelligence artificielle mondiale. D'un côté, Nvidia capte entre 80 et 90 % du marché des GPU pour centres de données, enchaînant les trimestres records grâce à une demande pour ses puces Blackwell qui dépasse toutes les prévisions. De l'autre, Meta, dirigé par Mark Zuckerberg, a décidé de rompre sa dépendance à ce fournisseur unique en annonçant jusqu'à 135 milliards de dollars d'investissements en capital pour 2026, dont un contrat historique de 6 gigawatts de puces AMD. Le marché mondial de l'IA générative devrait franchir 100 milliards de dollars d'ici fin 2026, porté par une adoption professionnelle massive : près de 80 % des entreprises prévoient d'intégrer des API d'IA ou de déployer des modèles personnalisés dans leurs processus. Les revenus issus des applications mobiles boostées à l'IA devraient doubler entre 2024 et 2026, avec une répartition géographique marquée : 37,3 milliards de dollars pour les États-Unis (+60 %), 14,7 milliards pour la Chine (+72 %), et une projection de 20 milliards pour la France à horizon 2030. L'enjeu dépasse la simple guerre commerciale entre deux entreprises. Ce que Meta cherche à construire, c'est une souveraineté technologique sur sa propre pile IA, de l'infrastructure physique jusqu'aux modèles. Tant que Nvidia reste le passage obligé pour tout acteur sérieux de l'IA, le géant de Menlo Park reste exposé à des pénuries, des hausses de prix et des délais de livraison qu'il ne contrôle pas. La diversification vers AMD n'est pas un choix technique anodin : c'est un signal politique adressé à toute l'industrie. En parallèle, les joueurs grand public risquent de subir les conséquences de cette course aux serveurs IA, Nvidia orientant clairement sa production vers les centres de données au détriment du segment gaming. La véritable forteresse de Nvidia ne réside pas dans ses puces mais dans son écosystème logiciel CUDA, standard industriel dominant depuis plus de quinze ans, que la concurrence peine à détrôner malgré des investissements considérables. L'architecture Rubin, attendue en succession des Blackwell, devrait creuser encore l'écart en termes de performances brutes. Meta n'est pas seul dans cette tentative de diversification : Google avec ses TPU, Amazon avec ses Trainium, et Microsoft via ses investissements dans OpenAI cherchent tous à réduire leur exposition à un seul fournisseur. La question qui structure désormais toute la filière est celle des infrastructures : les réseaux électriques, les capacités de refroidissement et les chaînes d'approvisionnement en semi-conducteurs peuvent-ils absorber une demande qui double tous les dix-huit mois ? C'est sur ce terrain physique, autant que logiciel, que se jouera la prochaine phase de la course à l'IA.

UELes entreprises européennes restent structurellement dépendantes de l'écosystème Nvidia/CUDA pour leurs projets IA, rendant leur accès à l'infrastructure coûteux et soumis aux arbitrages de production d'acteurs hors UE.

InfrastructureOpinion
1 source
438AWS ML Blog 

AWS Agent Registry : la gestion des agents à grande échelle désormais en prévisualisation

Amazon Web Services a lancé en preview l'AWS Agent Registry, une nouvelle fonctionnalité intégrée à sa plateforme Amazon Bedrock AgentCore, conçue pour permettre aux entreprises de découvrir, partager et réutiliser leurs agents IA à grande échelle. Disponible dès maintenant via la console AgentCore, les SDK AWS et une API dédiée, le registre centralise les métadonnées de chaque agent, outil, serveur MCP, compétence d'agent ou ressource personnalisée sous forme de fiches structurées. Chaque entrée documente l'auteur, les protocoles supportés, les capacités exposées et les modalités d'invocation. Le registre prend en charge nativement les standards ouverts MCP (Model Context Protocol) et A2A, et peut indexer des agents hébergés n'importe où : sur AWS, chez d'autres fournisseurs cloud ou dans des environnements on-premises. Il est également accessible comme serveur MCP, ce qui le rend interrogeable directement depuis des clients compatibles comme Kiro ou Claude Code. L'enjeu est considérable pour les entreprises qui opèrent des centaines ou des milliers d'agents simultanément. Sans registre central, trois problèmes se cumulent : l'invisibilité (personne ne sait ce qui existe), l'absence de gouvernance (n'importe qui peut publier n'importe quoi), et la duplication (plusieurs équipes reconstruisent les mêmes capacités en parallèle). AWS Agent Registry répond à ces trois défis en un seul endroit. La recherche hybride combine correspondance par mots-clés et compréhension sémantique : une requête sur "traitement de paiements" remonte ainsi des outils étiquetés "facturation" ou "invoicing", même s'ils portent des noms différents. Pour les organisations avec des fournisseurs d'identité tiers, un accès basé sur OAuth permet aux équipes de construire leurs propres interfaces de découverte sans dépendre des credentials IAM d'AWS. Ce lancement s'inscrit dans une tendance de fond : l'industrialisation des architectures multi-agents, où les organisations ne déploient plus un ou deux agents expérimentaux mais des écosystèmes entiers interconnectés. AWS positionne AgentCore comme la couche d'infrastructure universelle pour ces systèmes, indépendante du modèle, du framework ou du fournisseur cloud. Le registre est la pièce manquante qui transforme une collection d'agents dispersés en un actif organisationnel géré, versionné et auditable. La roadmap annoncée prévoit des workflows d'approbation pour la publication, des capacités de monitoring en production et des mécanismes de retrait des agents obsolètes. Dans un secteur où OpenAI, Google et Microsoft développent leurs propres orchestrateurs d'agents, AWS mise sur l'ouverture et l'interopérabilité comme différenciateurs pour conquérir les grandes entreprises déjà ancrées dans des architectures hybrides.

UELes entreprises européennes déployant des agents IA sur AWS peuvent désormais centraliser leur gouvernance et audit, facilitant la conformité aux exigences de traçabilité de l'AI Act.

InfrastructureOpinion
1 source
OpenAI prévoit que le marché publicitaire atteindra 102 milliards de dollars d'ici 2030
439The Information AI 

OpenAI prévoit que le marché publicitaire atteindra 102 milliards de dollars d'ici 2030

OpenAI mise désormais sur la publicité comme principal moteur de revenus d'ici 2030, avec des projections atteignant 102 milliards de dollars. Selon des prévisions financières internes du premier trimestre 2026, qui n'avaient pas encore été rendues publiques, la société s'attend à générer environ 2,4 milliards de dollars de revenus publicitaires cette année, puis à quadrupler ce chiffre dès 2025 pour approcher les 11 milliards. Ces estimations dépassent largement les projections établies il y a un an, qui tablaient sur 1,6 milliard cette année et 5,9 milliards l'année suivante pour les utilisateurs non abonnés. Ce repositionnement stratégique signale un tournant majeur dans le modèle économique d'OpenAI. Jusqu'ici fortement dépendante des abonnements ChatGPT et des contrats API avec les entreprises, la société cherche à diversifier ses sources de revenus à grande échelle. Faire de la publicité le premier poste de revenus d'ici 2030 implique de transformer ses plateformes en espaces publicitaires capables de rivaliser avec les géants du secteur, ce qui pourrait profondément modifier l'expérience utilisateur de ses produits grand public. OpenAI entre ainsi en concurrence directe avec Google, Meta et Microsoft sur un marché publicitaire dominé par quelques acteurs. La société, valorisée à 157 milliards de dollars après sa dernière levée de fonds, fait face à des dépenses colossales en infrastructure et doit trouver des relais de croissance au-delà des abonnements. L'intégration de la publicité dans ses produits reste toutefois à préciser techniquement et éthiquement, notamment sur la question de la personnalisation des données dans un contexte d'IA générative.

UELe virage publicitaire d'OpenAI pourrait soulever des questions de conformité au RGPD si ChatGPT exploite les données des utilisateurs européens à des fins de ciblage publicitaire.

BusinessOpinion
1 source
Le trafic issu des LLM convertit à 30-40 % et la plupart des entreprises n'en tirent pas parti
440VentureBeat AI 

Le trafic issu des LLM convertit à 30-40 % et la plupart des entreprises n'en tirent pas parti

Le trafic généré par les grands modèles de langage (LLM) convertit à un taux de 30 à 40 %, soit deux à trois fois plus que le trafic SEO classique, selon plusieurs observations terrain rapportées en 2026. Pourtant, la majorité des entreprises n'optimisent pas encore leur contenu pour ce canal. Un nouveau paradigme émerge : l'AEO (Answer Engine Optimization), aussi appelé GEO (Generative Engine Optimization). Là où le SEO visait des mots-clés, des classements et des clics, l'AEO vise à être compris, sélectionné et cité par des agents IA comme Claude Code, Microsoft Copilot, Perplexity, Google Vertex ou AutoGen. Ces systèmes ne "naviguent" pas le web comme un humain : ils analysent l'intention de l'utilisateur en tenant compte du contexte et de la mémoire des sessions passées, puis synthétisent une réponse directe sans que l'utilisateur ne visite nécessairement le site source. Dustin Engel, fondateur du cabinet Elegant Disruption, résume : "L'AEO est la couche de découverte suivante" -- une "découverte zéro clic" où la citabilité remplace la visibilité. L'impact est concret et immédiat pour les équipes marketing, commerciales et les éditeurs de contenu. Lorsqu'un agent synthétise une réponse, le taux de clic vers le site de l'entreprise chute, mais la qualité du trafic résiduel explose. Adam Yang, de la plateforme Quora, estime que l'AEO est déjà devenu le comportement par défaut pour toute requête où l'utilisateur veut une réponse synthétisée : comparaisons de produits, recommandations de méthodes, analyses de marché. Google Overviews accélère cette dynamique côté grand public. "Le SEO n'est pas mort," précise Yang, "mais l'objectif d'optimisation a changé : il ne s'agit plus d'apparaître en page 1, mais d'être cité dans la réponse." Pour les entreprises, cela signifie repenser leur façon de structurer l'information : contenus concis, factuels, bien structurés, conçus pour être extraits et cités par une machine plutôt que parcourus par un humain. Ce changement s'inscrit dans une évolution plus profonde de la façon dont les professionnels travaillent. Wyatt Mayham, analyste chez Northwest AI Consulting, indique qu'il n'utilise "quasiment plus" la recherche traditionnelle pour ses besoins professionnels, et que cette proportion se rapproche de zéro chaque mois. Son cabinet a notamment développé une fonction Claude Skills qui, avant chaque appel de prospection, déclenche automatiquement un agent qui agrège le profil LinkedIn du contact, scrape le site de son entreprise, interroge des sources comme ZoomInfo, et produit une fiche synthétique avec revenus, taille d'équipe et signaux d'achat. Le modèle "cherche, lis, décide" évolue vers "l'agent récupère, l'agent résume, l'humain valide" -- et bientôt, "l'agent agit, l'humain contrôle". Les entreprises qui n'adaptent pas leur stratégie de contenu à cette nouvelle réalité risquent de devenir invisibles dans un écosystème où c'est désormais la machine qui choisit ses sources.

UELes entreprises françaises et européennes produisant du contenu web doivent adapter leur stratégie éditoriale vers l'AEO pour rester visibles dans un écosystème où les agents IA deviennent le principal point d'entrée des requêtes professionnelles.

BusinessOpinion
1 source
ChatGPT, Gemini, Claude… Pika donne un visage (et une voix) à toutes vos IA !
441Le Big Data 

ChatGPT, Gemini, Claude… Pika donne un visage (et une voix) à toutes vos IA !

Pika Labs a lancé le 2 avril 2026 PikaStream 1.0, un modèle temps réel qui transforme n'importe quel agent IA -- ChatGPT, Claude, Gemini ou autre -- en interlocuteur visible et vocal dans une visioconférence. Concrètement, l'outil permet à un agent IA de rejoindre une réunion Google Meet sous forme d'avatar animé, avec une voix clonée en quelques secondes d'enregistrement. Le tarif annoncé est de 0,20 dollar la minute d'utilisation. Le module principal, pikastream-video-meeting, est distribué en open source sur GitHub dans le cadre d'une initiative plus large baptisée Pika Skills, un ensemble de briques modulaires destinées à étendre les capacités des agents IA. L'intégration ne requiert pas de configuration complexe : il suffit de partager un lien de réunion pour que l'agent prenne le relais. Ce que PikaStream change fondamentalement, c'est le passage de l'IA textuelle à l'IA incarnée. Jusqu'ici, interagir avec un modèle comme Claude ou Gemini restait confiné à une interface de chat, parfois augmentée de la voix, mais sans présence visuelle. PikaStream franchit ce cap en dotant l'agent d'un avatar cohérent avec l'identité de l'utilisateur ou de son entreprise, d'une voix personnalisée et d'une mémoire persistante des échanges passés. L'agent sait avec qui il travaille, ce qui a déjà été discuté, et maintient une personnalité stable d'une réunion à l'autre. Il peut aussi agir en direct pendant l'appel -- chercher un document, rédiger un compte rendu, mettre à jour un outil de gestion de projet ou envoyer un e-mail -- sans interrompre la conversation. Pour les équipes distribuées, cela ouvre la possibilité de déléguer les réunions de routine à un agent, réduisant la fatigue liée aux appels vidéo répétitifs. La sortie de PikaStream s'inscrit dans une course plus large entre les acteurs de l'IA à rendre leurs modèles physiquement présents dans les workflows professionnels. Des projets comme Microsoft Copilot ou les agents vocaux d'OpenAI explorent des territoires proches, mais PikaStream se distingue par son approche ouverte et son interopérabilité explicite avec les agents existants, quelle que soit leur origine. Le choix de l'open source est stratégique : en laissant les développeurs adapter et enrichir le module, Pika Labs mise sur une adoption rapide dans les environnements techniques, là où les solutions fermées butent souvent sur des résistances d'intégration. Les questions éthiques restent cependant ouvertes -- cloner une voix et un visage pour qu'une IA parle en votre nom en réunion soulève des enjeux de consentement, d'authenticité et de responsabilité qui n'ont pas encore de réponse réglementaire claire. La prochaine étape probable sera l'intégration avec d'autres plateformes de visioconférence comme Zoom ou Microsoft Teams.

UELa technologie de clonage vocal et d'avatar IA soulève des enjeux de consentement et d'authenticité non encadrés par l'AI Act européen, dont les dispositions sur les systèmes d'identification biométrique pourraient s'appliquer à ce type d'usage professionnel.

OutilsOutil
1 source
TensorWave peut-il dépasser l'avantage concurrentiel de Nvidia ?
442The Information AI 

TensorWave peut-il dépasser l'avantage concurrentiel de Nvidia ?

Nick Tatarchuk, fondateur de la startup TensorWave, a organisé mercredi à San Francisco un événement intitulé Beyond Summit, anciennement appelé Beyond CUDA. Ce changement de nom n'est pas anodin : l'édition précédente, tenue à San Jose en 2025 lors de la conférence GTC de Nvidia, avait attiré des centaines de participants désireux de discuter des alternatives au logiciel de Nvidia. Cette année, des sponsors et participants potentiels ont exprimé des réticences à s'associer à un événement aussi explicitement positionné contre le géant des puces. Tatarchuk lui-même reconnaît cette pression, d'autant que sa salle habituelle à San Jose avait été réservée pour plusieurs années... par Nvidia. L'événement réunit des startups qui développent des compilateurs, des noyaux et des couches d'optimisation pour concurrencer l'écosystème logiciel de Nvidia, dont plusieurs ont figuré dans les classements Top 50 Startups de 2024 et 2025. L'enjeu central est CUDA, la plateforme logicielle de Nvidia considérée comme son véritable fossé concurrentiel : elle simplifie radicalement l'utilisation du matériel Nvidia pour l'entraînement et l'inférence de modèles d'IA. Mais ce monopole commence à se fissurer. OpenAI et Meta ont récemment annoncé des accords importants avec AMD, rival direct de Nvidia, pour utiliser ses puces dans leurs infrastructures d'IA. Tatarchuk affirme que des laboratoires d'IA commencent désormais à réaliser des entraînements à grande échelle sur du matériel AMD, une pratique qui était à peine évoquée publiquement il y a encore peu. Pour la première fois depuis des années, des clients seraient prêts à envisager sérieusement des alternatives à CUDA, estime-t-il : "Il y a tellement d'entreprises sophistiquées qui n'ont pas besoin de CUDA." Ce mouvement s'inscrit dans un contexte de transformation profonde de l'industrie du calcul pour l'IA. La domination de Nvidia, dont les GPU représentent l'essentiel du marché de l'entraînement des grands modèles, est contestée à la fois par des fabricants de puces alternatifs et par un écosystème logiciel naissant. En parallèle, une autre initiative illustre l'effervescence du secteur : à l'université Stanford, un cours universitaire de premier cycle sur l'infrastructure IA est devenu un événement majeur, surnommé le "Compute Coachella". Le cours, complet, réunit cette semaine Jensen Huang (Nvidia), Lisa Su (AMD), Sam Altman (OpenAI), Satya Nadella (Microsoft) et Andrej Karpathy comme intervenants. Il est enseigné par Anjney Midha, ancien associé d'Andreessen Horowitz et investisseur précoce d'Anthropic, et Michael Abbott, ancien responsable ingénierie chez Apple, tous deux impliqués dans AMP, une initiative visant à faciliter l'accès aux ressources de calcul pour les entreprises.

UEL'émergence d'alternatives viables à CUDA pourrait à terme réduire la dépendance des entreprises et laboratoires européens envers Nvidia pour leurs infrastructures d'entraînement IA.

InfrastructureActu
1 source
On a testé Perplexity Computer : c’est révolutionnaire, mais ça coute cher
44301net 

On a testé Perplexity Computer : c’est révolutionnaire, mais ça coute cher

Perplexity a lancé Perplexity Computer, un agent IA capable de prendre le contrôle d'un PC Windows pour exécuter des tâches complexes de façon autonome, sans intervention humaine. Pour évaluer ses capacités réelles, les testeurs ont tenté une expérience concrète : créer intégralement une boutique Shopify en laissant l'IA tout faire, de la configuration initiale à la mise en ligne des produits. Le résultat est mitigé : l'outil est techniquement impressionnant, mais les coûts d'utilisation s'envolent rapidement, bien avant que le projet ne soit abouti. L'enjeu est significatif pour quiconque envisage de déléguer des tâches administratives ou e-commerce à une IA. Perplexity Computer représente une nouvelle génération d'agents dits "computer use", capables de naviguer dans des interfaces graphiques, remplir des formulaires et enchaîner des actions comme le ferait un humain. Mais le modèle économique repose sur un usage à la session ou au crédit, ce qui rend les opérations longues et répétitives particulièrement onéreuses pour des résultats encore incomplets. Cette publication s'inscrit dans une course intense entre Anthropic, OpenAI et désormais Perplexity pour imposer des agents capables d'automatiser le travail sur ordinateur. Anthropic a son propre "computer use" via Claude, Microsoft intègre Copilot dans Windows, et OpenAI pousse ses Operators. Perplexity, connu pour son moteur de recherche génératif, cherche à élargir son positionnement bien au-delà de la simple réponse aux requêtes. La question centrale reste la même pour tous : à quel prix l'automatisation devient-elle vraiment rentable ?

💬 Le "computer use", ça fait deux ans qu'on attend que ça soit vraiment utilisable, et le test Shopify est exactement le bon filtre : si l'IA ne finit pas la tâche et que la note s'emballe avant, le modèle économique est cassé. Pas la techno, le modèle. Facturer à la session des tâches qui peuvent durer des heures, c'est juste pas viable pour des workflows réels. Reste à voir qui va trouver la bonne structure tarifaire en premier, parce que la course est lancée.

OutilsOutil
1 source
Gemma 4 : intelligence multimodale de pointe sur appareil
444HuggingFace Blog 

Gemma 4 : intelligence multimodale de pointe sur appareil

Google DeepMind a lancé Gemma 4, sa nouvelle génération de modèles open source, disponible depuis début avril 2025. Cette famille comprend quatre variantes allant de 1 milliard à 27 milliards de paramètres, toutes capables de traiter texte et images simultanément. Les modèles sont disponibles sur Hugging Face, Google AI Studio et Kaggle, avec des licences permissives autorisant leur usage commercial. La particularité de Gemma 4 réside dans sa capacité multimodale optimisée pour les appareils locaux, depuis les smartphones jusqu'aux ordinateurs personnels, sans dépendance à un serveur distant. Le modèle 27B affiche des performances comparables à des systèmes bien plus volumineux sur les benchmarks de raisonnement et de vision, tandis que le 1B peut tourner directement sur mobile, ouvrant la voie à des applications IA entièrement hors ligne. Cette sortie s'inscrit dans la compétition ouverte qui oppose Google à Meta, Microsoft et Mistral sur le segment des modèles open source embarqués. Depuis Gemma 1 en février 2024, Google a accéléré le rythme de ses publications pour ne pas céder ce terrain stratégique à Llama. La course aux modèles multimodaux légers devient un enjeu central pour l'IA souveraine et les usages professionnels sans connectivité cloud.

UELes modèles embarqués sans dépendance cloud s'alignent avec les exigences d'IA souveraine portées par l'UE, facilitant des déploiements professionnels conformes au RGPD sans transfert de données vers des serveurs tiers.

LLMsOpinion
1 source
Améliorer la qualité et la robustesse des systèmes de synthèse vocale basés sur les LLM
445Amazon Science 

Améliorer la qualité et la robustesse des systèmes de synthèse vocale basés sur les LLM

Les chercheurs d'Amazon ont publié le 1er avril 2026 une série d'avancées techniques destinées à résoudre trois problèmes persistants dans les systèmes de synthèse vocale basés sur des grands modèles de langage (LLM) : la fuite d'accent en mode polyglotte, le manque d'expressivité, et les défaillances de fiabilité. Pour corriger la fuite d'accent — phénomène où la voix clonée d'un locuteur anglophone garde un accent étranger en passant au français ou à l'allemand — l'équipe a appliqué une technique d'adaptation à faible rang (LoRA) pour affiner leurs modèles sur des données fortement pondérées vers les langues cibles. Pour l'expressivité, ils ont eu recours au guidage sans classifieur (CFG), une méthode issue des modèles de diffusion, pour générer des échantillons audio de référence synthétiques plus expressifs, utilisés ensuite comme conditionnement à l'inférence. Les résultats, mesurés selon le protocole d'écoute MUSHRA, montrent une amélioration de 5 % à 20 % sur neuf paramètres régionaux couvrant l'anglais, le français, l'italien, l'allemand et l'espagnol, par rapport à la génération de modèles précédente. Ces améliorations ont des implications concrètes pour tous les acteurs qui déploient des assistants vocaux, des systèmes de navigation, ou des outils d'accessibilité à l'échelle internationale. La possibilité de cloner une voix enregistrée dans une seule langue et de la déployer nativement dans plusieurs autres — sans perte d'identité vocale ni accent résiduel — réduit drastiquement les coûts de production de contenu audio multilingue. Le troisième axe de travail, la fiabilité, s'attaque à un défaut structurel des LLM : leur génération autorégressive, token par token, sans modélisation explicite de la durée, provoque des répétitions hallucinées, des coupures inattendues et des prononciations incohérentes. Amazon indique travailler sur ce point, bien que les détails techniques associés n'aient pas encore été entièrement divulgués. La synthèse vocale neuronale a franchi un cap majeur ces deux dernières années avec l'émergence de systèmes capables de cloner une voix à partir de quelques secondes d'audio. Des acteurs comme ElevenLabs, OpenAI avec sa voix Vox, ou encore Microsoft ont largement popularisé cette technologie, mais la barrière multilingue reste un point faible commun. Amazon, via ses divisions Alexa et AWS Polly, a un intérêt commercial direct à résoudre ce problème à grande échelle pour ses marchés européens et latino-américains. L'approche LoRA pour le fine-tuning ciblé par locale permet de mutualiser un modèle de base tout en l'adaptant à faible coût — une architecture qui pourrait devenir standard dans le secteur. Les prochaines étapes probables incluent l'extension à des langues à tons comme le mandarin ou le japonais, où la fuite d'accent pose des défis encore plus complexes.

UELes améliorations du clonage vocal multilingue (français, allemand, italien, espagnol) réduisent directement les coûts de production audio pour les entreprises et services européens déployant des assistants vocaux ou outils d'accessibilité.

💬 La fuite d'accent, c'était le truc qu'on acceptait comme une fatalité dans le clonage vocal multilingue, et ça m'a toujours semblé être un problème évitable. Amazon montre que LoRA + un dataset bien pesé règle une bonne partie du problème, et les +5 à 20 % sur MUSHRA, tu peux pas ignorer ça. Le volet fiabilité reste flou (les hallucinations audio, c'est un vrai sujet en prod), mais sur la partie multilingue, ils livrent enfin du concret.

RecherchePaper
1 source
Apple change de cap : Siri va regrouper ChatGPT, Gemini et toutes les IA !
446Le Big Data 

Apple change de cap : Siri va regrouper ChatGPT, Gemini et toutes les IA !

Apple prépare une transformation majeure de Siri avec iOS 27, prévu pour l'été 2026. Selon Mark Gurman, journaliste de Bloomberg et source fiable sur Apple depuis des années, l'entreprise développerait un système d'extensions permettant à n'importe quel chatbot disponible sur l'App Store de s'interfacer directement avec Siri. Concrètement, des assistants comme Claude d'Anthropic, Google Gemini ou d'autres IA tierces pourraient être sollicités via Siri comme intermédiaire : l'utilisateur précise quel modèle utiliser, et Siri relaie la requête. Cette ouverture marquerait la fin de l'exclusivité dont bénéficie actuellement ChatGPT d'OpenAI, intégré depuis iOS 18. Apple travaille depuis 2024 sur cette version refondue, parfois appelée Siri 2.0, qui inclurait également une application Siri dédiée, une interface repensée dans la Dynamic Island, et une fusion avec Spotlight Search. Pour les utilisateurs, l'impact serait considérable : Siri deviendrait un hub centralisé capable de mobiliser des dizaines de modèles spécialisés selon la tâche — analyse de documents, génération de contenu, planification, code. Plus besoin de jongler entre applications : un seul point d'entrée vocal donnerait accès à l'ensemble de l'écosystème IA disponible sur iPhone et iPad. Pour Apple, l'enjeu financier est tout aussi important : la firme prélèverait une commission sur les abonnements souscrits via l'App Store pour accéder aux IA tierces, transformant Siri en levier de monétisation de l'explosion des assistants intelligents. Cette stratégie permettrait à Apple de rivaliser directement avec Amazon Alexa, Microsoft Copilot et Meta AI, sans avoir à développer elle-même des modèles de pointe. Ce pivot s'inscrit dans un contexte délicat pour Apple sur le terrain de l'IA. L'entreprise a accumulé du retard face à Google, Microsoft et OpenAI, et Siri a longtemps été moqué pour ses limitations face à des concurrents bien plus capables. Le partenariat avec OpenAI, annoncé à la WWDC 2024, était une première réponse, mais insuffisante pour couvrir l'ensemble des usages. L'ouverture à tous les chatbots via un modèle d'extensions — similaire à ce qu'Apple a fait avec les widgets ou les extensions de clavier — serait une façon de contourner le problème sans avoir à choisir un seul gagnant. Des questions réglementaires se poseront inévitablement : l'acheminement de données personnelles vers de multiples fournisseurs d'IA soulève des enjeux de confidentialité que les autorités européennes notamment scruteront de près. Apple devra démontrer que cette ouverture reste compatible avec ses engagements en matière de protection des données, un pilier central de son image de marque.

UEL'acheminement de données personnelles vers de multiples fournisseurs d'IA via Siri soulève des questions de conformité RGPD que la CNIL et les autorités européennes devront examiner.

OutilsOpinion
1 source
NVIDIA GTC : l'Omniverse au service de l'IA physique
447NVIDIA AI Blog 

NVIDIA GTC : l'Omniverse au service de l'IA physique

Lors de la conférence GTC la semaine dernière, NVIDIA a présenté plusieurs avancées majeures pour ce que l'entreprise appelle l'« ère de l'IA physique » — une phase où robots, véhicules autonomes et usines intelligentes passent de déploiements isolés à des systèmes industriels à grande échelle. Au cœur de ces annonces figurent trois nouveaux modèles de frontière : Cosmos 3 pour la modélisation du monde réel, Isaac GR00T N1.7 dédié aux compétences des robots humanoïdes, et Alpamayo 1.5 pour la conduite autonome. NVIDIA a également lancé deux blueprints open source : le Physical AI Data Factory Blueprint, destiné à produire des données d'entraînement à partir de simulations, et l'Omniverse DSX Blueprint, une architecture de référence pour créer des jumeaux numériques d'usines d'IA complètes. Des partenaires comme FieldAI, Hexagon Robotics, Skild AI et Teradyne Robotics utilisent déjà ces outils, tandis que Microsoft Azure et Nebius sont les premiers clouds à proposer le blueprint en mode clé en main. L'enjeu central de ces annonces est de résoudre un problème structurel de l'IA physique : les données réelles ne suffisent plus. Le monde réel est imprévisible, les cas limites sont innombrables, et les pipelines de collecte restent fragmentés. NVIDIA positionne donc la puissance de calcul elle-même comme une fabrique de données — transformant des scènes simulées en datasets massifs, diversifiés et hautement qualifiés. Pour les développeurs de robots et de véhicules autonomes, cela signifie pouvoir entraîner des modèles sur des millions de situations synthétiques sans dépendre d'une collecte terrain coûteuse. Parallèlement, l'Omniverse DSX Blueprint permet aux opérateurs d'usines d'IA de simuler thermiques, réseaux électriques et charges réseau avant même d'installer le premier serveur — réduisant les délais et les dépassements de budget sur des infrastructures qui coûtent des centaines de millions de dollars. Ces développements s'inscrivent dans une stratégie plus large de NVIDIA pour imposer son écosystème comme couche universelle de l'IA industrielle. Le format OpenUSD — langage de description de scènes 3D initialement développé par Pixar — joue un rôle clé en permettant de convertir des fichiers CAO d'ingénierie en environnements de simulation directement exploitables. Des frameworks open source comme OpenClaw viennent compléter la pile en orchestrant des agents autonomes capables de gérer des workflows complexes sur des machines dédiées. Avec l'intégration de partenaires cloud majeurs et d'une dizaine d'acteurs industriels, NVIDIA consolide une position de plateforme incontournable à un moment où la compétition pour contrôler l'infrastructure de l'IA physique — robots, voitures, usines — s'intensifie face à des concurrents comme Google DeepMind, Boston Dynamics et les constructeurs automobiles investissant massivement dans leurs propres systèmes embarqués.

UELes industriels et startups européens en robotique ou véhicules autonomes peuvent accéder via Microsoft Azure aux blueprints open source NVIDIA pour entraîner des modèles sur données synthétiques, réduisant leur dépendance coûteuse à la collecte terrain.

InfrastructureOpinion
1 source
IA pratique : cessez de confier vos secrets aux services d’IA
448ZDNET FR 

IA pratique : cessez de confier vos secrets aux services d’IA

OpenAI, Google, Microsoft et d'autres géants du cloud proposent des services d'intelligence artificielle capables d'analyser des documents, rédiger des emails et automatiser des tâches complexes — mais à quel prix pour la confidentialité ? Chaque texte soumis à ces plateformes transite par des serveurs distants, où il peut être stocké, analysé par des ingénieurs pour améliorer les modèles, ou exposé lors de violations de données. Des entreprises comme Samsung ont déjà subi des fuites après que des employés ont collé du code source propriétaire dans ChatGPT, illustrant concrètement ce risque souvent sous-estimé. Pour les professionnels manipulant des données sensibles — contrats juridiques, dossiers médicaux, informations financières ou secrets industriels — utiliser des services d'IA cloud sans précautions revient à confier ses dossiers à un tiers inconnu. Les conditions d'utilisation de la plupart des plateformes autorisent explicitement l'usage des données soumises pour entraîner ou améliorer leurs modèles, sauf opt-out explicite. Les risques sont amplifiés dans les secteurs régulés : une fuite peut entraîner des sanctions RGPD pouvant atteindre 4 % du chiffre d'affaires annuel mondial, voire engager la responsabilité pénale. Des alternatives existent : déploiement de modèles en local via des outils comme Ollama ou LM Studio, utilisation d'offres cloud avec garanties de confidentialité renforcées (Azure OpenAI avec data residency, Mistral AI en souverain européen), ou anonymisation systématique avant soumission. La montée en puissance des modèles locaux performants — Llama 3, Mistral, Gemma — rend désormais viables ces approches pour de nombreux cas d'usage professionnels, réduisant la dépendance aux services cloud tout en préservant la confidentialité des données critiques.

UELes entreprises françaises et européennes sont directement exposées aux sanctions RGPD (jusqu'à 4 % du CA mondial) en cas de fuite de données via des services IA cloud, et peuvent se tourner vers Mistral AI comme alternative souveraine européenne.

SécuritéOpinion
1 source
Sanders et AOC proposent d'interdire la construction de centres de données
449TechCrunch AI 

Sanders et AOC proposent d'interdire la construction de centres de données

Le sénateur Bernie Sanders et la représentante Alexandria Ocasio-Cortez ont déposé des projets de loi complémentaires visant à suspendre la construction de nouveaux centres de données aux États-Unis, tant que le Congrès n'aura pas adopté une réglementation globale sur l'intelligence artificielle. Cette initiative place un frein direct à l'expansion effrénée des infrastructures IA, dont la construction mobilise des milliards de dollars et consomme d'énormes quantités d'eau et d'électricité. En liant l'autorisation de construire à l'adoption d'un cadre législatif, Sanders et Ocasio-Cortez cherchent à forcer le débat réglementaire avant que le déploiement ne devienne irréversible. La proposition s'inscrit dans un mouvement croissant de méfiance envers la course aux infrastructures IA, portée notamment par des géants comme Microsoft, Google et Amazon, dont les projets de centres de données se multiplient à travers le pays.

UECette initiative législative américaine pourrait inspirer des parlementaires européens à lier l'expansion des datacenters à l'avancement du cadre réglementaire IA au sein de l'UE.

RégulationReglementation
1 source
Trustpilot s'associe à des entreprises d'IA face au déclin de la recherche traditionnelle
450AI News 

Trustpilot s'associe à des entreprises d'IA face au déclin de la recherche traditionnelle

Trustpilot s'associe avec de grandes entreprises e-commerce pour valoriser ses données d'avis auprès des agents IA, alors que les clics provenant des recherches basées sur l'IA ont bondi de 1 490 % en un an. Le PDG Adrian Blair vise une marge opérationnelle de 30 % d'ici 2030, portée en partie par l'utilisation de son contenu par les LLMs — Trustpilot était le 5e domaine le plus cité dans ChatGPT en janvier 2026. Dans ce contexte, Amazon, Walmart, Shopify et Microsoft multiplient les partenariats avec OpenAI, Google et PayPal pour permettre des transactions directement depuis les interfaces d'IA comme Gemini ou Copilot.

UETrustpilot, entreprise cotée à Londres, se positionne comme source de données fiables pour les LLMs, ce qui pourrait renforcer son influence sur le marché européen des avis en ligne face aux géants américains.

BusinessOpinion
1 source