Aller au contenu principal

Dossier OpenAI — page 22

1854 articles · page 22 sur 38

Toute l'actualité d'OpenAI : nouvelles versions de ChatGPT et GPT, stratégie produit, partenariats, controverses et décisions de Sam Altman.

Pourquoi Canva ne considere pas ChatGPT et Claude comme une menace
1051The Information AI BusinessOpinion

Pourquoi Canva ne considere pas ChatGPT et Claude comme une menace

Canva, la plateforme de design graphique valorisée à 42 milliards de dollars, affiche une sérénité notable face à l'émergence des outils de design propulsés par l'intelligence artificielle. Alors que des concurrents comme Figma s'inquiètent ouvertement de la menace que représente Claude Design, le nouvel outil lancé par Anthropic, Canva adopte une posture radicalement différente. Anwar Haneef, responsable de l'écosystème chez Canva, décrit explicitement Claude Design comme « un produit complémentaire » plutôt que comme un rival direct. Selon lui, si ces outils IA permettent d'obtenir rapidement une première ébauche, les utilisateurs se heurtent rapidement à leurs limites dès qu'il s'agit d'affiner le résultat, de collaborer en équipe, d'intégrer des ressources graphiques ou d'appliquer une charte de marque. « Claude n'est pas conçu pour ça ; il est conçu pour l'idéation », a-t-il déclaré. Cette position n'est pas qu'une pirouette diplomatique : Canva affirme disposer de données concrètes pour étayer l'idée qu'Anthropic et OpenAI sont des alliés plutôt que des concurrents. L'argument central repose sur la complémentarité des usages : les LLM excellent dans la génération rapide de concepts et de brouillons, tandis que Canva reste indispensable pour la phase d'exécution professionnelle, notamment grâce à ses fonctionnalités collaboratives, ses bibliothèques d'assets et ses outils de gestion de marque. Pour les équipes marketing et communication, ce sont deux étapes distinctes d'un même flux de travail. Cette divergence d'appréciation du risque entre Canva et Figma illustre une tension plus large dans l'industrie tech. De nombreuses entreprises qui s'appuient sur les modèles d'Anthropic ou d'OpenAI pour construire leurs propres applications craignent que ces fournisseurs de modèles ne finissent par les court-circuiter en lançant des produits concurrents directement intégrés. La stratégie de Canva consiste à parier sur la complexité des workflows professionnels comme rempart naturel contre la désintermédiation, une logique qui sera mise à l'épreuve à mesure que les capacités des agents IA s'élargissent.

1 source
Le fonds IA de Bernie Sanders ? Une idée plus courante qu’on le croit
1052Next INpact 

Le fonds IA de Bernie Sanders ? Une idée plus courante qu’on le croit

Bernie Sanders a publié début juin 2026 une tribune dans le New York Times proposant de créer un fonds souverain américain de l'IA, l'American A.I. Sovereign Wealth Fund Act. Le principe : obliger les grandes entreprises du secteur à céder 50 % de leurs actions à un fonds géré dans l'intérêt commun, permettant à l'ensemble de la population américaine de détenir une part de sociétés comme OpenAI, Anthropic ou xAI. Sanders argue que ces technologies reposent sur des données personnelles et des œuvres protégées extraites « sans permission, sans crédit, sans compensation », et que leur création doit donc être considérée comme une ressource publique. L'IA n'est pas encore rentable : le site isaiprofitable.com, qui traque les investissements tech versus les revenus générés, l'indique clairement, et les documents qu'OpenAI vient de soumettre à la SEC en vue d'une probable introduction en bourse confirment des pertes massives. La proposition vise un problème concret et immédiat : des entreprises justifient déjà des plans sociaux par les gains de productivité que l'IA leur procure, redistribuant les bénéfices vers les actionnaires plutôt que vers les salariés ou la société. Sanders veut court-circuiter cette dynamique en donnant aux citoyens un droit de regard direct sur l'orientation de ces technologies, et surtout une part des gains financiers lorsqu'ils se matérialiseront. Elon Musk venait de devenir le premier « trillionaire » de l'histoire grâce à l'entrée en bourse de SpaceX, cette concentration de richesse sert de toile de fond à la proposition du sénateur, qui veut éviter que les milliers de milliards potentiellement générés par l'IA ne profitent qu'à une poignée d'individus déjà ultra-riches. Ce qui est frappant, c'est que l'idée traverse les clivages politiques habituels. D'après le média NOTUS, l'administration Trump elle-même aurait approché plusieurs grandes entreprises d'IA pour prendre des participations au capital, dans un contexte où OpenAI et Anthropic préparent leurs IPO. L'État avait déjà pris 9,9 % du capital d'Intel il y a un an. Sam Altman a lui-même suggéré par le passé un fonds donnant à chaque citoyen une part de la croissance économique tirée par l'IA, et Musk s'est prononcé favorablement, à sa manière lapidaire, sur X. Sanders, lui, légifère à l'approche des élections de mi-mandat de novembre 2026, donnant à sa proposition une dimension électorale évidente. La vraie question reste ouverte : un fonds en actions a-t-il un sens si l'IA ne génère pas encore de profits, et qui contrôle réellement l'orientation des entreprises quand l'État en devient actionnaire ?

💬 Ce qui est fascinant, c'est que Sanders, Musk et Trump arrivent (presque) au même endroit par des chemins opposés : l'État doit tenir une part de l'IA. Ça dit quelque chose sur l'ampleur du truc, quand les antagonistes se rejoignent sur le principe. La vraie fragilité de la proposition, c'est le timing : distribuer des actions d'entreprises qui brûlent des milliards, c'est partager un pari, pas une rente.

RégulationReglementation
1 source
MiMo Code de Xiaomi, outil de codage IA open source, surpasse Claude Code sur les tâches de plus de 200 étapes
1053VentureBeat AI 

MiMo Code de Xiaomi, outil de codage IA open source, surpasse Claude Code sur les tâches de plus de 200 étapes

Xiaomi a publié le 10 juin 2026 MiMo Code V0.1.0, un assistant de programmation propulsé par IA qui fonctionne directement dans le terminal. L'équipe MiMo de la marque chinoise affirme que cet outil surpasse Claude Code d'Anthropic sur les tâches longues et complexes, notamment celles dépassant 200 étapes successives. Selon des benchmarks publiés dans leur blog technique, MiMo Code couplé au modèle MiMo-V2.5-Pro obtient 82 % sur SWE-bench Verified contre 79 % pour Claude Code avec Claude Sonnet 4.6, 62 % contre 55 % sur SWE-bench Pro, et 73 % contre 69 % sur Terminal Bench 2. L'outil est disponible sur GitHub sous licence MIT, s'installe en une seule commande sur macOS et Linux, et inclut un accès gratuit limité au modèle multimodal MiMo-V2.5, doté d'une fenêtre de contexte d'un million de tokens sans inscription requise. Le projet est un fork d'OpenCode, enrichi par Xiaomi d'une architecture mémoire propriétaire. Ce qui distingue MiMo Code de ses concurrents, c'est précisément sa réponse à un problème bien connu des développeurs utilisant des agents IA sur de longues sessions : la dégradation progressive des performances à mesure que la fenêtre de contexte se remplit. Xiaomi a conçu un système de mémoire persistante à quatre couches, alimenté par SQLite FTS5, couvrant la mémoire projet (un fichier MEMORY.md permanent), des points de contrôle de session, des notes temporaires et des journaux de progression par tâche. L'originalité du système réside dans le déploiement d'un sous-agent indépendant, le "checkpoint-writer", qui prend des notes en temps réel sans interrompre l'agent principal. Deux mécanismes complètent l'ensemble : une commande /dream qui, toutes les sept jours environ, consolide les sessions passées en mémoire long terme, et une fonction "distill" qui identifie les flux de travail répétitifs pour les automatiser. L'arrivée de MiMo Code s'inscrit dans une course mondiale au meilleur agent de programmation, où Anthropic, OpenAI et Google se disputent la première place. Xiaomi, encore peu présent dans l'écosystème des outils développeurs en Occident, tente ici une percée directe sur un segment stratégique. L'approche open source sous licence MIT et l'accès gratuit au modèle sont clairement conçus pour attirer rapidement une base d'utilisateurs et générer des retours terrain. Les chiffres avancés s'appuient toutefois sur une étude interne portant sur 576 développeurs, ce qui appelle une certaine prudence avant validation indépendante. Xiaomi n'a pas publié de comparaisons face à Codex d'OpenAI ni aux outils de Google, deux absences notables qui limitent la portée de ces résultats. La vraie question est désormais de savoir si la communauté open source s'appropriera l'outil et si les performances annoncées résisteront à des audits externes.

UELes développeurs français et européens peuvent installer et tester gratuitement cet agent de codage open source sous licence MIT, sans impact réglementaire ou institutionnel direct pour la France ou l'UE.

OutilsOutil
1 source
Perplexity intègre Deep Research dans son agent informatique, en distribuant les sous-tâches sur plus de 20 modèles de pointe
1054MarkTechPost 

Perplexity intègre Deep Research dans son agent informatique, en distribuant les sous-tâches sur plus de 20 modèles de pointe

Perplexity a intégré sa fonctionnalité Deep Research à son système d'orchestration multi-modèles baptisé Computer, une évolution majeure annoncée en juin 2026. Là où l'ancienne version exécutait une séquence fixe de recherches, la nouvelle décompose automatiquement chaque question complexe en sous-tâches, qu'elle distribue ensuite à plus de 20 modèles d'IA en parallèle. Le moteur de raisonnement central est Claude Opus 4.6, tandis que des sous-agents spécialisés, dont Gemini, prennent en charge des pans spécifiques de l'analyse. Le résultat n'est plus un simple résumé : Deep Research dans Computer produit des rapports complets avec citations vérifiées, des présentations et des tableurs interactifs, entièrement générés et modifiables au sein de l'environnement Computer. Une capacité distinctive, baptisée Search as Code, permet au modèle d'écrire lui-même le code qui pilote la recherche, exécutant des milliers d'appels de récupération en parallèle dans un environnement sandbox, avec filtrage, déduplication et reclassement des sources à la volée. Les gains de performance publiés par Perplexity illustrent l'ampleur du bond. Sur le benchmark BrowseComp d'OpenAI, qui teste la capacité à retrouver des informations difficiles à localiser par navigation web, le score passe de 40,7 % à 83,8 %, soit plus du doublement. Sur Humanity's Last Exam, un test d'expertise académique pluridisciplinaire conçu par le Center for AI Safety et Scale AI, le taux grimpe de 36,4 % à 50,5 %. Ces chiffres positionnent la nouvelle version comme l'une des solutions de recherche agentique les plus performantes du marché. Concrètement, un professionnel peut demander une comparaison des marges bénéficiaires des grands fabricants de puces IA sur cinq ans, une cartographie des différences entre le RGPD européen et les lois américaines sur la vie privée, ou une synthèse des essais cliniques sur l'impact cardiovasculaire des médicaments amaigrissants, et recevoir en retour un livrable structuré, prêt à l'emploi. Computer avait été lancé fin février 2026 comme plateforme cloud de coordination d'agents IA. L'intégration de Deep Research s'inscrit dans une course effrénée entre les acteurs de la recherche augmentée par l'IA, où Perplexity affronte directement Google, OpenAI et Anthropic sur le terrain de la recherche agentique complexe. La fonctionnalité est disponible pour les abonnés Perplexity Max, mais les développeurs peuvent y accéder de façon programmatique via l'Agent API en mode pay-as-you-go, avec un preset deep-research intégré au SDK officiel et une compatibilité avec le SDK OpenAI via l'endpoint POST /v1/responses. L'ouverture aux développeurs signal que Perplexity positionne cette infrastructure non comme un produit grand public isolé, mais comme une couche de recherche que d'autres applications pourront exploiter directement, ce qui pourrait redéfinir la manière dont les outils professionnels intègrent l'accès à l'information.

UELes professionnels et développeurs européens disposent d'un accès API à une couche de recherche agentique capable de traiter des sujets réglementaires comme le RGPD, sans impact institutionnel ou réglementaire direct sur la France ou l'UE.

OutilsOutil
1 source
Anthropic prend ses partenaires commerciaux de court
1055The Information AI 

Anthropic prend ses partenaires commerciaux de court

Quelques semaines avant le lancement de Claude Design en avril 2026, Anthropic a approché Figma et Canva pour qu'elles participent en tant que "partenaires" à l'annonce de son nouvel outil d'IA, conçu pour créer des maquettes graphiques et des prototypes d'applications logicielles. Ces deux entreprises, clientes historiques d'Anthropic, y voyaient une occasion de mettre en valeur la complémentarité de leurs produits. Mais quelques jours avant le lancement, Figma s'est retirée des négociations, et Mike Krieger, directeur produit d'Anthropic, a simultanément quitté le conseil d'administration de Figma, signalant une rupture franche entre deux acteurs jusqu'alors alignés. La raison de cette fracture tient aux changements de dernière minute apportés par Anthropic à sa feuille de route : la version finale de Claude Design s'est révélée bien plus concurrentielle avec les offres phares de Figma et de Canva qu'elle ne l'était initialement. Pour ces plateformes, l'enjeu est direct : Anthropic ne se contente plus de fournir une infrastructure d'IA, elle entre sur leur terrain commercial, celui de la création graphique et du prototypage rapide, segments où Figma domine avec des dizaines de millions d'utilisateurs professionnels. Cette situation illustre une tension croissante dans l'écosystème de l'IA générative, où les fournisseurs de modèles de base cherchent à capturer de la valeur au niveau applicatif, empiétant sur leurs propres partenaires. Le départ de Krieger du board de Figma marque symboliquement la fin d'une relation symbiotique et soulève des questions sur la gouvernance de ces alliances stratégiques. Pour Anthropic, qui cherche à diversifier ses revenus face à la concurrence d'OpenAI et Google, l'expansion vers les outils créatifs représente un pari risqué mais cohérent avec sa trajectoire de croissance.

UELa stratégie d'intégration verticale d'Anthropic vers les outils de création menace les acteurs européens du design numérique et crée une incertitude pour les professionnels du secteur qui ont construit leurs workflows sur ces plateformes, sans alternative européenne de référence.

BusinessOpinion
1 source
Microsoft SkillOpt : optimisation de prompts, analyse d'évolution des compétences et comparaison aux références
1056MarkTechPost 

Microsoft SkillOpt : optimisation de prompts, analyse d'évolution des compétences et comparaison aux références

Microsoft a publié SkillOpt, un framework open source conçu pour optimiser automatiquement les "skills", des prompts structurés qui guident le comportement des modèles de langage. Un tutoriel de référence détaille son implémentation complète sur le benchmark SearchQA, un jeu de questions-réponses fondé sur des extraits de documents. Le pipeline utilise GPT-4o comme modèle optimiseur et GPT-4o-mini comme modèle cible, en s'appuyant sur l'API OpenAI via une compatibilité Azure. Le workflow d'optimisation enchaîne six étapes distinctes : rollout (génération de réponses), reflection (analyse des erreurs), aggregation (consolidation des observations), selection (choix des meilleures améliorations), updating (réécriture du prompt) et validation-based gating (validation avant d'accepter chaque nouvelle version du skill). Le tutoriel tourne avec un échantillon limité à 24 exemples, sur deux epochs avec des batchs de 8, pour contenir les coûts en tokens. Ce que rend possible SkillOpt est significatif : plutôt que d'ajuster les poids d'un modèle par entraînement classique, coûteux et nécessitant des GPU, il optimise uniquement le texte du prompt par itération automatique. Cela permet à n'importe quel développeur d'améliorer les performances d'un modèle sur une tâche précise sans toucher à l'infrastructure d'entraînement. L'outil mesure l'évolution de la précision en "hard accuracy" et "soft accuracy" à chaque cycle, offre un suivi de l'usage cumulatif en tokens, et visualise l'historique des modifications du skill. Cette transparence donne aux équipes un contrôle fin sur le compromis entre coût et gain de performance, un avantage concret pour les produits IA en production. SkillOpt s'inscrit dans une tendance plus large portée par Microsoft Research : l'optimisation automatique de prompts, parfois appelée "prompt engineering automatisé" ou APO (Automatic Prompt Optimization). Des travaux antérieurs comme DSPy de Stanford ou ProTeGi avaient ouvert cette voie, mais SkillOpt mise sur une architecture modulaire et une compatibilité avec les backends Azure OpenAI et OpenAI standard pour maximiser l'adoption en entreprise. La publication du code sur GitHub sous forme de dépôt clonable avec dépendances pip illustre la volonté de Microsoft d'ancrer cet outil dans les workflows MLOps existants. L'enjeu à terme est d'industrialiser l'amélioration continue des agents IA sans intervention humaine à chaque itération, une capacité qui deviendra centrale à mesure que les entreprises déploient des systèmes LLM à grande échelle.

UELes équipes IA européennes déployant des agents LLM sur Azure OpenAI peuvent adopter SkillOpt pour automatiser l'amélioration continue de leurs prompts sans coûts d'entraînement supplémentaires.

OutilsOutil
1 source
Le nouveau mode Lockdown de ChatGPT permet de désactiver l'accès web pour protéger contre les injections de prompt
1057The Decoder 

Le nouveau mode Lockdown de ChatGPT permet de désactiver l'accès web pour protéger contre les injections de prompt

OpenAI a introduit un nouveau mode de sécurité pour ChatGPT baptisé "Lockdown Mode", ou mode verrouillé. Une fois activé, ce paramètre désactive automatiquement l'accès au web, la fonctionnalité Deep Research ainsi que l'Agent Mode, les trois vecteurs principaux par lesquels des données sensibles peuvent quitter le périmètre d'une session de travail. La mesure cible directement les attaques par injection de prompt, une technique par laquelle un contenu malveillant glissé dans un document ou une page web manipule le modèle pour qu'il exfiltre des informations confidentielles vers un tiers. La protection n'est toutefois pas totale. OpenAI reconnaît que le Lockdown Mode ne bloque pas l'attaque en amont, mais uniquement sa dernière étape, celle où les données quittent effectivement le système. En d'autres termes, un modèle peut toujours être manipulé par une injection de prompt, mais sans accès au web ni aux agents autonomes, il ne peut pas transmettre le résultat à l'extérieur. Pour les entreprises qui traitent des données réglementées, des contrats sensibles ou des informations personnelles, ce verrou représente néanmoins une couche de défense pratique et activable sans compétences techniques particulières. L'injection de prompt reste aujourd'hui l'un des problèmes non résolus les plus sérieux de l'IA générative, en particulier à mesure que les assistants gagnent en autonomie et en capacités d'action sur le web. L'émergence de modes "agents" chez OpenAI, Anthropic et Google accroît mécaniquement la surface d'attaque. Le Lockdown Mode est une réponse pragmatique plutôt qu'une solution de fond, et sa disponibilité signale qu'OpenAI commence à prendre au sérieux les usages professionnels à risque.

UELes entreprises européennes traitant des données personnelles sous RGPD peuvent activer ce mode pour réduire le risque d'exfiltration de données sensibles via des injections de prompt dans ChatGPT.

💬 C'est une bonne nouvelle pour les entreprises, mais faut pas se raconter des histoires : ça ne bloque pas l'injection elle-même, juste la fuite. Le modèle peut quand même se faire manipuler, il ne peut juste plus rien envoyer vers l'extérieur. Utile, pas suffisant.

NVIDIA Nemotron 3 Ultra est désormais disponible sur Amazon SageMaker JumpStart
1058AWS ML Blog 

NVIDIA Nemotron 3 Ultra est désormais disponible sur Amazon SageMaker JumpStart

NVIDIA a annoncé la disponibilité immédiate de son modèle Nemotron 3 Ultra sur Amazon SageMaker JumpStart, permettant un déploiement en un clic sans gestion d'infrastructure. Le modèle repose sur une architecture hybride Transformer-Mamba de type Mixture-of-Experts (MoE), avec 550 milliards de paramètres au total dont seulement 55 milliards actifs par passe de calcul. Optimisé pour le format de précision NVFP4, il affiche une vitesse d'inférence cinq fois supérieure aux modèles équivalents et réduit les coûts jusqu'à 30 % pour les charges de travail agentiques. Il supporte des contextes allant jusqu'à un million de tokens, ce qui en fait l'un des modèles open source les plus ambitieux disponibles à ce jour sur une plateforme cloud grand public. Ce lancement cible directement les systèmes d'IA agentiques, une catégorie en pleine expansion où un modèle ne répond pas à une simple question mais planifie, appelle des outils, délègue des tâches à des sous-agents et itère sur des centaines de tours de dialogue. C'est précisément là que les modèles classiques montrent leurs limites : chaque étape supplémentaire alourdit le coût en tokens et en calcul. L'architecture MoE de Nemotron 3 Ultra contourne ce problème en n'activant qu'une fraction des paramètres à chaque passage, maintenant un débit élevé même sur des contextes très longs. Pour les entreprises qui automatisent des workflows complexes, orchestration d'agents, génération et débogage de code sur de vastes dépôts, recherche documentaire approfondie, cela se traduit concrètement par des tâches menées à terme avec une cohérence préservée et une facture cloud maîtrisée. NVIDIA positionne Nemotron 3 Ultra dans une stratégie plus large visant à s'imposer comme fournisseur de référence pour l'IA agentique d'entreprise, un segment où la concurrence s'intensifie entre OpenAI, Anthropic, Google et des acteurs open source comme Meta avec Llama. Le partenariat avec AWS et l'intégration native dans SageMaker JumpStart abaissent significativement la barrière à l'entrée pour les équipes techniques qui souhaitent tester ou déployer le modèle sans configurer de stack d'inférence from scratch. Les instances GPU requises, notamment les ml.p5en.48xlarge, restent coûteuses à l'heure, ce qui signifie que l'usage restera concentré sur des cas professionnels à forte valeur ajoutée. La disponibilité dès le jour zéro sur JumpStart suggère également un accord commercial étroit entre NVIDIA et Amazon, deux acteurs dont l'alliance dans le domaine de l'infrastructure IA se renforce à mesure que la course aux agents autonomes s'accélère.

UELes équipes R&D et développeurs européens accèdent désormais à l'un des plus grands modèles open source du marché via une plateforme cloud grand public, sans configuration d'infrastructure spécifique.

LLMsOpinion
1 source
Microsoft veut rendre les utilisateurs accros à son agent IA Scout
1059Next INpact 

Microsoft veut rendre les utilisateurs accros à son agent IA Scout

Microsoft a présenté Scout lors de sa conférence Build 2026, un agent IA autonome et permanent conçu pour s'intégrer profondément dans l'écosystème Microsoft 365. Contrairement à Copilot, qui répond à des sollicitations ponctuelles, Scout agit de manière proactive : il surveille Teams, Outlook, OneDrive, SharePoint, le calendrier et les e-mails pour anticiper les besoins de l'utilisateur. Concrètement, il peut repérer des réunions importantes, organiser automatiquement des rendez-vous, bloquer des créneaux dans l'agenda pour boucler un projet, préparer des documents avant une réunion ou signaler qu'une décision traîne et risque de faire déraper un planning. Scout possède aussi sa propre identité traçable : toutes ses actions sont journalisées et les opérations critiques nécessitent une validation humaine. Selon des documents internes publiés par 404media, plus de 1 000 employés Microsoft l'utilisent déjà, dont le PDG Satya Nadella. L'agent est pour l'instant en aperçu privé, mais le document interne révèle qu'il s'est imposé comme "l'un des outils internes les plus demandés chez Microsoft, sans annonce officielle, sans marketing". Cette approche représente un changement de paradigme dans l'usage professionnel de l'IA. Là où Copilot restait un assistant réactif, Scout ambitionne de devenir un collaborateur permanent qui apprend les habitudes de travail, identifie les projets prioritaires et anticipe les tâches récurrentes. Pour les entreprises clientes de Microsoft 365, cela signifie un agent qui réduit la charge cognitive des équipes en automatisant la coordination et la gestion du temps, deux des principaux goulots d'étranglement dans les organisations. L'enjeu commercial est considérable : Microsoft a investi des milliards dans ses infrastructures IA et cherche à transformer cet investissement en adoption massive au sein des entreprises. Ce qui rend le lancement de Scout particulièrement significatif, c'est la technologie qui le propulse : OpenClaw, une bibliothèque open source devenue une référence dans le monde des agents autonomes capables de manipuler des applications, des fichiers et des services en continu. Ironie du calendrier, Microsoft avertissait encore en février 2026 des risques de sécurité liés à OpenClaw, jugeant la technologie trop risquée pour les environnements d'entreprise en raison de ses privilèges étendus. L'éditeur a depuis changé de position et s'engage désormais à contribuer directement au projet, affirmant qu'il va "ajouter la sécurité, la gouvernance et l'intégration Microsoft 365" à la base existante. Ce revirement contraste avec l'approche de Meta, qui développe sa propre alternative propriétaire baptisée Hatch depuis qu'OpenAI a recruté Peter Steinberger, le créateur d'OpenClaw. Microsoft choisit l'intégration là où Meta choisit la bifurcation, un pari qui pourrait s'avérer décisif dans la course aux agents d'entreprise.

UEMicrosoft 365 étant massivement déployé dans les entreprises françaises et européennes, l'arrivée de Scout soulève des questions concrètes pour les DSI sur la gouvernance d'agents IA autonomes ayant accès aux données internes.

💬 En février, Microsoft nous expliquait qu'OpenClaw était trop dangereux pour les environnements d'entreprise. Quatre mois après, c'est la même techno qui fait tourner Scout en prod chez Satya Nadella, sans annonce officielle, juste des gens qui l'adoptent en interne. Ce revirement, ça en dit plus sur la pression concurrentielle que sur une vraie conviction technique.

OutilsOutil
1 source
Trump veut (enfin) réguler l’IA… mais seulement si les géants de la tech veulent bien
1060Le Big Data 

Trump veut (enfin) réguler l’IA… mais seulement si les géants de la tech veulent bien

Donald Trump a signé mardi un décret autorisant les entreprises d'intelligence artificielle à partager leurs modèles les plus avancés avec le gouvernement fédéral avant leur lancement public. La mesure phare du texte fixe une fenêtre maximale de 30 jours de partage volontaire avant mise à disposition du public, une version allégée par rapport au projet initial, qui prévoyait entre 14 et 90 jours. Plusieurs agences fédérales devront en parallèle développer un système d'évaluation des capacités cybernétiques avancées de ces modèles. Les entreprises participantes bénéficieront de certaines protections en matière de confidentialité, mais leur participation reste entièrement facultative. Le décret prévoit également un renforcement des défenses fédérales face aux menaces liées à l'IA, notamment pour les infrastructures critiques. Ce texte marque un tournant notable dans la posture de l'administration Trump, jusqu'ici farouchement opposée à toute forme de régulation de l'IA au nom de la compétitivité américaine face à la Chine. Trump avait d'ailleurs repoussé la signature d'une première version du décret, craignant qu'elle ne bride l'innovation nationale. La version adoptée reçoit le soutien d'organisations spécialisées dans la sécurité de l'IA : Brad Carson, président d'Americans for Responsible Innovation, y voit la preuve que la Maison-Blanche prend désormais ces risques au sérieux, tandis que Brendan Steinhauser, dirigeant d'Alliance for Secure AI, appelle le Congrès à transformer ces mesures volontaires en obligations légales, ce que le décret lui-même exclut explicitement. Ce changement de cap s'inscrit dans un contexte de prise de conscience progressive des risques que font peser les modèles de frontier sur la sécurité nationale. Un élément concret a pu peser dans la balance : en avril, Anthropic a déployé de manière limitée son modèle Mythos, qui aurait permis d'identifier des milliers de vulnérabilités critiques dans les principaux systèmes d'exploitation et navigateurs web. Par ailleurs, Google, Microsoft et xAI ont déjà accepté le mois dernier de soumettre leurs modèles à l'examen du Centre pour les normes et l'innovation en IA (CAISI), rattaché au département du Commerce. OpenAI et Anthropic avaient pris un engagement similaire dès 2024, sous l'administration Biden. Le vrai test de ce décret sera donc la prochaine saison de lancements majeurs : sans obligation légale, tout repose sur la bonne volonté d'acteurs dont les intérêts commerciaux restent la priorité.

UELe décret américain, entièrement fondé sur le volontariat, contraste avec l'approche contraignante de l'AI Act européen et pourrait peser sur les discussions de convergence réglementaire transatlantique.

RégulationReglementation
1 source
Les agents de recherche IA ont tendance à confirmer leurs connaissances existantes plutôt qu'à explorer le web
1061The Decoder 

Les agents de recherche IA ont tendance à confirmer leurs connaissances existantes plutôt qu'à explorer le web

Les principaux agents de recherche IA, dont GPT-5.4 d'OpenAI et Kimi K2.6 de Moonshot AI, n'effectuent pas autant de recherches web réelles qu'ils le laissent entendre. C'est la conclusion d'une étude menée par des chercheurs de l'Institut de technologie de Harbin, qui ont développé un nouveau benchmark temporel appelé LiveBrowseComp. Ce test se distingue des évaluations classiques en ne posant des questions que sur des événements survenus au cours des 90 derniers jours, soit une fenêtre temporelle postérieure aux données d'entraînement des modèles. Les résultats sont révélateurs : dès que les modèles ne peuvent plus s'appuyer sur leur mémoire d'entraînement, leurs performances s'effondrent et les classements habituels sont bouleversés. Cela signifie que ces agents, présentés comme de puissants outils de recherche en ligne, se contentent en réalité d'utiliser le web pour confirmer ce qu'ils savent déjà, plutôt que de véritablement explorer et synthétiser des informations récentes. Pour les entreprises et professionnels qui s'y fient pour une veille ou une analyse d'actualité, c'est une limitation critique. Ce constat intervient alors que les éditeurs d'IA rivalisent pour positionner leurs modèles comme des assistants de recherche autonomes capables de naviguer sur internet. Les benchmarks traditionnels, construits sur des données historiques, masquaient cette faiblesse structurelle. LiveBrowseComp introduit une contrainte temporelle qui force une évaluation plus honnête des capacités réelles de navigation web. L'enjeu est de taille : si les classements sont rebattus sur cette base, la confiance accordée aux agents IA pour des tâches de recherche actuelle devra être sérieusement réévaluée.

UELes entreprises et professionnels européens qui s'appuient sur ces agents pour de la veille ou de l'analyse d'actualité doivent réévaluer leur fiabilité pour tout contenu postérieur aux données d'entraînement.

💬 C'est prouvé maintenant : ces agents ne cherchent pas vraiment, ils confirment ce qu'ils savent. Le benchmark de Harbin est malin, poser uniquement des questions sur les 90 derniers jours c'est une façon élégante de court-circuiter la mémoire d'entraînement, et du coup les classements habituels volent en éclats. Si tu t'appuies là-dessus pour une vraie veille, je te laisse tirer les conclusions.

RecherchePaper
1 source
Une entreprise aurait dépensé 500 millions de dollars en Claude en un mois, faute de limites d'utilisation
1062The Decoder 

Une entreprise aurait dépensé 500 millions de dollars en Claude en un mois, faute de limites d'utilisation

Une entreprise dont l'identité n'a pas été divulguée aurait dépensé 500 millions de dollars en licences Claude en l'espace d'un seul mois, selon des informations rapportées par The Decoder. La cause serait aussi simple que coûteuse : aucun plafond d'utilisation n'avait été configuré. Le déploiement de l'IA d'Anthropic s'est ainsi propagé sans contrôle au sein de l'organisation, accumulant des appels au modèle à un rythme que personne n'avait anticipé ni encadré. Ce cas illustre une réalité que les directions informatiques commencent à découvrir à leurs dépens : l'adoption rapide de l'IA générative, sans gouvernance technique, peut transformer une promesse de productivité en gouffre financier. Sans expertise en sélection de modèles, en ingénierie du contexte ou en optimisation des requêtes, chaque usage superflu s'additionne silencieusement. Les coûts d'inférence, souvent perçus comme marginaux à l'échelle individuelle, deviennent massifs à l'échelle d'une grande organisation sans garde-fous. L'incident s'inscrit dans une période où les entreprises signent des contrats pluriannuels avec Anthropic, OpenAI ou Google pour intégrer leurs modèles en profondeur dans leurs flux de travail. Anthropic, valorisée à plus de 60 milliards de dollars, compte parmi ses clients des géants de la tech et de la finance qui déploient Claude à grande échelle. Cette anecdote, quelle que soit son exactitude, pointe vers un enjeu structurel : la maîtrise des coûts liés à l'IA est désormais une compétence critique, au même titre que la cybersécurité ou la gestion de l'infrastructure cloud.

UELes entreprises françaises et européennes déployant des LLMs à grande échelle s'exposent au même risque de dérive budgétaire en l'absence de gouvernance technique et de plafonds d'utilisation.

💬 500 millions en un mois parce que personne n'a pensé à mettre un plafond, c'est presque admirable comme négligence. Ce qui me frappe, c'est que ça va arriver à beaucoup d'autres, et pas seulement aux géants : dès qu'on déploie un modèle en interne sans rate limiting ni monitoring des coûts, la facture monte en silence. La gouvernance des APIs LLM, c'est devenu aussi critique que la gestion des droits IAM, et la plupart des équipes ne l'ont pas encore intégré.

Pourquoi Claude Opus 4.8 change vraiment la donne (tests et benchmarks) ?
1063Le Big Data 

Pourquoi Claude Opus 4.8 change vraiment la donne (tests et benchmarks) ?

Anthropic a lancé Claude Opus 4.8 le 28 mai 2026, seulement 41 jours après la version 4.7, un rythme inhabituel dans un secteur où les nouvelles versions majeures nécessitent généralement plusieurs mois. Disponible au même prix que son prédécesseur, ce modèle affiche des progrès mesurables sur plusieurs benchmarks clés : 84 % sur Online-Mind2Web, qui évalue les interactions autonomes avec des interfaces numériques, et des gains notables sur Terminal-Bench 2.1, dédié à la programmation en ligne de commande. Plus frappant encore, les évaluations internes d'Anthropic indiquent que le modèle est environ quatre fois moins susceptible de laisser passer des erreurs dans son propre code qu'Opus 4.7. Sur le plan fonctionnel, les utilisateurs de Claude AI ont désormais accès à cinq niveaux de raisonnement ajustables, tandis que Claude Code intègre les Dynamic Workflows, permettant de planifier des tâches complexes en mobilisant plusieurs sous-agents en parallèle sur de larges bases de code. Ce qui distingue Opus 4.8 ne réside pas uniquement dans les scores, mais dans un changement de philosophie profond : le modèle a été conçu pour mieux reconnaître ses propres limites et signaler ses incertitudes plutôt que de produire des réponses erronées avec assurance. Dans un contexte professionnel où une IA trop confiante peut induire en erreur des équipes entières, cette prudence constitue une valeur ajoutée concrète. Pour les développeurs qui utilisent Claude Code dans des pipelines agentiques, la réduction des erreurs non détectées et la capacité à orchestrer des sous-agents en parallèle ouvrent des cas d'usage jusqu'ici trop risqués pour être déployés en production. Le gain d'efficacité est également tangible : le modèle atteint des résultats équivalents en moins d'étapes intermédiaires, ce qui réduit les coûts d'inférence sur les longues tâches. Cette version s'inscrit dans une période de concurrence intense entre Anthropic, OpenAI et Google, où chaque éditeur cherche à dominer le segment des agents autonomes. La version 4.7 avait suscité des critiques sur ses comportements imprévisibles et sa tendance à l'excès de confiance, des défauts qui nuisaient à l'adoption en entreprise. En répondant directement à ces reproches en moins de six semaines, Anthropic signale qu'il est capable d'itérer aussi vite que ses rivaux sans sacrifier la fiabilité. La question qui demeure ouverte est celle de la durabilité de ce rythme : à 41 jours par version, l'entreprise devra démontrer que la qualité peut tenir la cadence.

UELes équipes de développement européennes utilisant Claude Code dans des pipelines agentiques bénéficient des améliorations de fiabilité et de la réduction des coûts d'inférence, sans impact réglementaire ou institutionnel spécifique à la France ou l'UE.

💬 41 jours entre deux versions majeures, c'est du jamais vu chez Anthropic. Ce qui compte vraiment là-dedans, c'est pas les scores (on peut faire dire ce qu'on veut aux benchmarks), c'est que le modèle est maintenant conçu pour signaler ses incertitudes plutôt que d'affirmer des erreurs avec aplomb, et en pipeline agentique, c'est la différence entre un outil qu'on ose déployer en prod et un truc qu'on surveille en permanence. Reste à voir si ce rythme tient dans 3 mois.

LLMsOpinion
1 source
Anthropic dévoile des agents IA pour automatiser les tâches financières
1064Le Big Data 

Anthropic dévoile des agents IA pour automatiser les tâches financières

Anthropic a dévoilé le 5 mai 2026 une suite de dix agents IA spécialisés dans l'automatisation des tâches financières complexes. Construits sur Claude Opus 4.7, ces agents ciblent les banques, sociétés de gestion d'actifs et équipes finance d'entreprise. Ils couvrent un spectre large : préparation de pitchs commerciaux, analyse de résultats d'entreprises, suivi de marchés, modélisation financière, rapprochement comptable, clôture mensuelle, audit d'états financiers et vérification KYC. Chaque agent combine des compétences métiers, des connecteurs de données et des sous-agents spécialisés. Sur le benchmark Finance Agent de Vals AI, Anthropic revendique un score de 64,37 % pour Claude Opus 4.7, ce qui en ferait le modèle le plus performant du marché sur les usages financiers selon l'entreprise. En parallèle, Anthropic intègre nativement Claude à Microsoft 365 via des modules complémentaires pour Excel, PowerPoint et Word, avec une extension Outlook annoncée prochainement. Une fonctionnalité appelée Dispatch permet également d'assigner des tâches à distance par message ou commande vocale, l'agent poursuivant alors le travail en arrière-plan sur les fichiers locaux. L'enjeu opérationnel est considérable pour les services financiers, où une part significative du temps des analystes est absorbée par des tâches répétitives à faible valeur ajoutée. L'intégration native avec Microsoft 365 est particulièrement stratégique : Claude peut construire un modèle financier dans Excel, le transférer automatiquement dans PowerPoint et générer une présentation qui se met à jour en temps réel quand les données changent. Dans Word, il peut adapter des notes de crédit aux standards internes d'une institution. La continuité contextuelle entre applications, argument central d'Anthropic, élimine la friction habituelle : les analystes n'ont plus à réexpliquer leur travail lorsqu'ils changent d'outil. Pour les institutions qui souhaiteraient personnaliser les agents, Anthropic permet d'adapter les modèles aux règles de conformité, politiques de risque ou méthodes d'évaluation propres à chaque organisation. Cette offensive s'inscrit dans une compétition féroce entre les grands laboratoires d'IA pour s'implanter durablement dans les workflows des services financiers, secteur perçu comme l'un des plus rentables pour les déploiements à grande échelle. Anthropic s'appuie sur des connecteurs vers les plateformes de données de référence du secteur, FactSet, S&P Capital IQ, PitchBook, Morningstar, LSEG, pour crédibiliser son offre face à des acteurs comme OpenAI ou Microsoft Copilot, déjà bien installés dans les grandes institutions. D'après le Wall Street Journal, la demande des institutions financières pour des outils IA pleinement intégrés dans les processus métiers est en forte croissance, et Anthropic cherche à se positionner non plus comme un fournisseur de modèle, mais comme une véritable plateforme opérationnelle. Le déploiement en quelques jours promis par l'entreprise reste à vérifier à l'échelle, mais le signal envoyé au marché est clair : Claude vise désormais le cœur des opérations financières.

UELes institutions financières européennes (banques, sociétés de gestion d'actifs) peuvent accéder à ces agents via Microsoft 365, mais devront évaluer leur conformité avec l'AI Act et les réglementations sectorielles avant tout déploiement à grande échelle.

💬 C'est le virage qu'on attendait : Anthropic arrête d'être un fournisseur de modèle pour devenir une plateforme métier à part entière. L'intégration dans M365, avec Claude qui garde le fil entre Excel, PowerPoint et Word sans qu'on lui réexplique tout à chaque changement d'outil, c'est là que ça peut vraiment mordre face à Copilot. Le 64,37% sur le benchmark Finance, bon, c'est leur propre terrain de jeu, faut attendre les vrais déploiements pour voir si ça tient.

OutilsOutil
1 source
Anthropic lance dix agents IA pour la finance, dans la course aux revenus avant introduction en bourse
1065The Decoder 

Anthropic lance dix agents IA pour la finance, dans la course aux revenus avant introduction en bourse

Anthropic vient de lancer dix agents d'intelligence artificielle préconfigurés destinés au secteur financier, couvrant des tâches clés comme la recherche d'investissement, les vérifications de conformité et de risque, ainsi que la comptabilité financière. Ces modèles prêts à l'emploi s'adressent directement aux banques d'investissement, aux gestionnaires d'actifs et aux compagnies d'assurance, qui peuvent les déployer sans développement sur mesure. L'annonce s'inscrit dans une offensive commerciale accélérée de la startup californienne, valorisée à plus de 60 milliards de dollars après sa dernière levée de fonds. Ce lancement marque un pivot stratégique important : Anthropic ne se contente plus de vendre un accès brut à son modèle Claude, mais propose désormais des solutions verticales clés en main pour des secteurs à forte valeur ajoutée. Pour les institutions financières, l'enjeu est considérable, automatiser des processus jusqu'ici réservés à des équipes d'analystes coûteux représente des économies potentielles de plusieurs millions de dollars par an. La rapidité de traitement des données réglementaires et des rapports de risque pourrait également réduire les délais de conformité, un avantage concurrentiel direct. Ce mouvement s'explique aussi par la pression croissante sur Anthropic de démontrer une trajectoire de revenus solide en vue d'une éventuelle introduction en bourse. OpenAI suit une logique similaire en multipliant les offres entreprise et les partenariats sectoriels. Les deux acteurs se livrent désormais une bataille frontale pour capturer les budgets technologiques des grandes institutions financières mondiales, un marché estimé à plusieurs dizaines de milliards de dollars.

UELes banques et gestionnaires d'actifs européens sont des cibles directes de ces agents préconfigurés, susceptibles d'accélérer l'adoption de l'IA dans la conformité et la gestion des risques financiers.

💬 Anthropic arrête de vendre de la farine et commence à vendre du pain. Dix agents préconfigurés pour la finance, c'est exactement ce que les DSI attendaient depuis deux ans, parce qu'une API brute ça demande des mois de dev interne avant de créer de la valeur. Reste à voir si ces agents tiennent vraiment face aux workflows réels des banques, ou si c'est un produit nickel en démo et chantier en prod.

OutilsOutil
1 source
Un plan d'action pour utiliser l'IA au service de la démocratie
1066MIT Technology Review 

Un plan d'action pour utiliser l'IA au service de la démocratie

Depuis l'invention de l'imprimerie jusqu'à l'essor des médias de masse, chaque révolution de l'information a reconfiguré les formes de gouvernance. Nous entrons aujourd'hui dans une transformation d'une ampleur comparable : l'intelligence artificielle est en train de devenir le principal intermédiaire par lequel les citoyens se forment une opinion et participent à la vie démocratique. Les moteurs de recherche sont déjà largement pilotés par des algorithmes, mais la prochaine génération d'assistants IA ira bien plus loin : elle synthétisera l'information, la mettra en cadre et la présentera avec autorité. Pour un nombre croissant de personnes, interroger une IA deviendra le réflexe par défaut pour se faire une opinion sur un candidat, une loi ou une personnalité publique. Parallèlement, les agents IA personnels commencent à agir au nom de leurs utilisateurs : ils mènent des recherches, rédigent des courriers, soutiennent des causes, et peuvent même orienter des décisions aussi concrètes que le vote sur un référendum ou la réponse à un courrier administratif. Ce double mouvement pose des risques considérables pour les démocraties. L'expérience des réseaux sociaux a déjà montré qu'un algorithme optimisé pour l'engagement, sans agenda politique explicite, peut produire polarisation et radicalisation. Un agent IA qui connaît vos préférences et vos angoisses, conçu pour vous garder actif, expose aux mêmes dérives, avec une subtilité supplémentaire : il se présente comme votre allié, parle en votre nom, et gagne précisément en confiance par cette proximité. À l'échelle collective, les effets deviennent encore plus imprévisibles. Des recherches montrent que des agents individuellement neutres peuvent, en interagissant à grande échelle, générer des biais collectifs. Un espace public où chacun dispose d'un agent personnalisé, parfaitement accordé à ses convictions existantes, n'est plus un espace public : c'est un archipel de mondes privés, chacun cohérent en lui-même, mais collectivement hostile à la délibération partagée qu'exige la démocratie. Cette transformation ne s'annonce pas : elle est déjà en cours, portée par des choix de conception effectués aujourd'hui dans les laboratoires et les départements produit des grandes entreprises technologiques. Les institutions démocratiques ont été conçues pour un monde où le pouvoir se construisait différemment, à une vitesse différente. Trois mutations simultanées les bousculent désormais : la façon dont les citoyens accèdent à la vérité, la façon dont ils exercent leur agentivité civique, et la façon dont se structurent les délibérations collectives. Des acteurs comme Google, OpenAI, Anthropic ou Meta façonnent, souvent sans en avoir pleinement conscience, les nouvelles infrastructures de l'opinion publique. La question n'est plus de savoir si l'IA redéfinira la citoyenneté, mais si les sociétés se donneront les moyens d'en orienter les conséquences avant que les règles du jeu ne soient écrites sans elles.

UELes institutions démocratiques européennes doivent adapter leur cadre réglementaire face aux agents IA qui médiatisent l'opinion publique et risquent de fragmenter la délibération civique des citoyens.

💬 Le problème avec les réseaux sociaux, c'était un algo sans visage qui optimisait dans le vide. Là, c'est un agent qui te connaît, qui parle en ton nom, et qui gagne ta confiance précisément parce qu'il est "de ton côté". C'est une marche de plus, et pas la plus petite.

SociétéOpinion
1 source
Une étude influente sur ChatGPT dans l'éducation retirée pour irrégularités
1067Ars Technica AI 

Une étude influente sur ChatGPT dans l'éducation retirée pour irrégularités

Une étude affirmant que ChatGPT améliore les résultats scolaires des étudiants vient d'être rétractée par son éditeur, Springer Nature, près d'un an après sa publication initiale. L'éditeur a invoqué des "incohérences" dans l'analyse statistique et un manque de confiance dans les conclusions tirées. La recherche en question prétendait quantifier l'effet de ChatGPT sur les performances d'apprentissage, la perception pédagogique et la pensée de haut niveau des étudiants, en s'appuyant sur une méta-analyse de 51 études antérieures. Elle comparait des groupes expérimentaux ayant utilisé ChatGPT à des groupes témoins n'y ayant pas eu recours, avant d'en extraire une taille d'effet globale favorable à l'outil d'OpenAI. Le problème, c'est que cette étude avait déjà fait un tour complet des réseaux sociaux et cumulé des centaines de citations académiques avant d'être invalidée. Ben Williamson, maître de conférences au Centre for Research in Digital Education de l'Université d'Édimbourg, souligne qu'elle était perçue par beaucoup "comme l'une des premières preuves solides et de haut niveau que ChatGPT, et l'IA générative en général, bénéficie aux apprenants." Sa rétractation laisse donc un vide là où une certitude semblait s'être installée, et soulève des questions sur la fiabilité des données qui circulent dans le débat public sur l'IA en éducation. Cet épisode s'inscrit dans un contexte plus large de pression pour justifier rapidement l'intégration de l'IA dans les salles de classe, alors même que les outils évoluent plus vite que la recherche capable de les évaluer sérieusement. Les méta-analyses sont souvent perçues comme des références solides, mais elles héritent des biais et des lacunes des études qu'elles agrègent. Le fait que des centaines de chercheurs et de décideurs aient cité ce travail avant sa rétractation illustre un risque systémique: les affirmations favorables à l'IA en éducation trouvent un écho rapide, tandis que les correctifs arrivent trop tard pour contrebalancer leur influence.

UELa rétractation fragilise la base empirique des politiques d'intégration de l'IA dans l'éducation en Europe, où de nombreux décideurs institutionnels s'appuyaient sur ce type d'études pour justifier leurs orientations pédagogiques.

SociétéPaper
1 source
Anthropic vise Wall Street : un partenariat à 1,5 milliard pour dominer l’IA financière
1068Le Big Data 

Anthropic vise Wall Street : un partenariat à 1,5 milliard pour dominer l’IA financière

Anthropic finalise une coentreprise d'environ 1,5 milliard de dollars avec plusieurs géants de Wall Street pour déployer ses outils d'intelligence artificielle auprès des entreprises détenues par des fonds de capital-investissement. Selon le Wall Street Journal, les piliers de cette structure sont Anthropic, le fonds Blackstone et Hellman & Friedman, chacun prêt à injecter environ 300 millions de dollars. Goldman Sachs participerait en tant qu'investisseur fondateur avec une mise estimée à 150 millions. L'annonce officielle était attendue le 5 mai 2026. Simultanément, Anthropic pousse ses investisseurs à se positionner sous 48 heures sur un nouveau tour de table d'environ 50 milliards de dollars, qui valoriserait la startup à quelque 900 milliards, soit plus du double de sa valorisation de 380 milliards atteinte en février dernier. Cette coentreprise ouvre à Anthropic l'accès à un segment particulièrement lucratif : les sociétés sous LBO, c'est-à-dire rachetées à crédit par des fonds de private equity, constituent un terrain idéal pour standardiser des usages à forte valeur ajoutée. Automatisation des opérations, analyse prédictive, optimisation des coûts, pilotage financier en temps réel : les fonds d'investissement cherchent précisément ces leviers pour améliorer la rentabilité de leurs portefeuilles. En s'y insérant directement, Anthropic ne vend plus seulement de la technologie, il s'intègre dans les mécanismes de création de valeur des fonds eux-mêmes. La pression exercée sur les investisseurs pour qu'ils se décident en moins de deux jours témoigne d'un rapport de force inversé : la demande dépasse l'offre, au point que certains acteurs historiques préfèrent attendre l'introduction en bourse, annoncée plus tard en 2026, pour matérialiser leurs gains. Derrière cette accélération se trouve un impératif industriel : financer l'infrastructure de calcul colossale qu'exige l'IA générative avancée. Les revenus récurrents issus de la coentreprise et les alliances nouées avec les plus grands acheteurs de technologie permettent à Anthropic de consolider sa position sans dépendre uniquement des cycles de levée de fonds. Le chiffre d'affaires annuel de la startup aurait récemment dépassé les 30 milliards de dollars, avec des projections internes proches de 40 milliards. La comparaison avec OpenAI s'impose : ce dernier a levé 122 milliards de dollars début 2025 pour une valorisation post-money de 852 milliards. En visant 900 milliards, Anthropic ambitionne de dépasser son principal rival sur le terrain de la crédibilité financière autant que technologique. Pour les acteurs B2B, la capacité à structurer des écosystèmes industriels prend désormais le pas sur la seule performance des modèles.

UELes entreprises européennes sous LBO pourraient être exposées indirectement aux outils Anthropic si leurs fonds d'investissement rejoignent la coentreprise, mais aucun acteur européen n'est directement impliqué dans l'accord.

BusinessOpinion
1 source
xAI lance Grok 4.3 à prix cassé et une nouvelle suite de clonage vocal rapide et puissante
1069VentureBeat AI 

xAI lance Grok 4.3 à prix cassé et une nouvelle suite de clonage vocal rapide et puissante

xAI, la société d'intelligence artificielle fondée par Elon Musk, a lancé mercredi Grok 4.3, son nouveau grand modèle de langage propriétaire, accompagné d'une suite de clonage vocal. Le modèle est désormais accessible à tous via l'API xAI et la plateforme OpenRouter, après une phase de test en avril réservée aux abonnés SuperGrok (30 dollars par mois) et X Premium+ (40 dollars par mois, avec 50 % de réduction les deux premiers mois). Le coup de force commercial tient à sa tarification : 1,25 dollar par million de tokens en entrée et 2,50 dollars par million en sortie, soit deux à deux fois et demie moins cher que son prédécesseur Grok 4.2, facturé 2 et 6 dollars respectivement. Techniquement, Grok 4.3 intègre un raisonnement permanent et non désactivable, une fenêtre de contexte d'un million de tokens, et des capacités agentiques inédites : le modèle peut désormais utiliser des outils professionnels de façon autonome, générer des fichiers Excel multi-onglets avec calculs automatiques ou produire des rapports PDF de douze pages avec mise en page complète, logos et tableaux structurés. Ce positionnement tarifaire agressif constitue l'atout central de xAI face à ses concurrents. En proposant des performances en progression significative sur les benchmarks tiers par rapport à Grok 4.2, tout en maintenant un coût nettement inférieur aux modèles d'OpenAI et d'Anthropic, xAI vise clairement les développeurs et les entreprises sensibles au prix. Les capacités agentiques représentent une rupture qualitative : le modèle ne se contente plus de répondre à des questions, il exécute des tâches complexes en plusieurs étapes de façon autonome. Un exemple documenté montre Grok 4.3 consacrer six minutes et vingt-deux secondes à construire un analyseur DPS sous forme de tableur multi-feuilles, un niveau d'exécution qui dépasse largement la génération de texte classique. Ce lancement intervient dans un contexte tendu pour xAI : les dix cofondateurs originaux et des dizaines de chercheurs ont quitté la société ces derniers mois, tandis que Grok se retrouvait distancé par les modèles de OpenAI, Anthropic, Google, DeepSeek, Kimi (Moonshot) et Qwen (Alibaba). Malgré la progression enregistrée, la firme d'évaluation indépendante Artificial Analysis place toujours Grok 4.3 en dessous du niveau de l'état de l'art fixé par OpenAI et Anthropic. Elon Musk est par ailleurs actuellement en procès contre son ancien associé Sam Altman, cofondateur d'OpenAI. Dans cette bataille frontale pour le marché des LLM, xAI semble avoir choisi une stratégie de volume par les prix plutôt que la course aux benchmarks, pariant que l'accessibilité économique et les nouvelles fonctionnalités agentiques suffiront à conquérir une base d'utilisateurs fidèle face à des concurrents aux modèles plus puissants mais plus coûteux.

LLMsOpinion
1 source
Claude, l’IA d’ANTHROPIC, entend redessiner l’architecture de la création en s’intégrant aux outils d’Adobe, Ableton et Autodesk
1070FrenchWeb 

Claude, l’IA d’ANTHROPIC, entend redessiner l’architecture de la création en s’intégrant aux outils d’Adobe, Ableton et Autodesk

Anthropic a annoncé l'intégration de son assistant Claude dans plusieurs des logiciels les plus utilisés par les professionnels créatifs, notamment Adobe, Ableton et Autodesk. Ces connecteurs, développés via le protocole MCP (Model Context Protocol) qu'Anthropic a ouvert à des partenaires tiers, permettent à Claude d'opérer directement à l'intérieur des interfaces de Photoshop, de Pro Tools ou de Fusion 360, sans que l'utilisateur ait besoin de basculer vers une application externe. L'annonce s'inscrit dans une vague d'intégrations que la société multiplie depuis début 2026 pour ancrer Claude dans des flux de production réels. L'enjeu dépasse la simple assistance à la rédaction : Claude peut désormais lire le contexte d'un projet en cours, suggérer des modifications sur des calques, générer des variations musicales ou proposer des ajustements paramétriques dans des modèles 3D. Pour les studios, agences et indépendants, cela réduit concrètement le nombre d'allers-retours entre outils et accélère les phases d'idéation et de prototypage. C'est un changement de paradigme pour des secteurs où le temps de production est directement lié à la rentabilité. Cette stratégie répond à une pression croissante d'OpenAI, Google et des éditeurs logiciels eux-mêmes, qui développent leurs propres couches d'IA natives. En s'appuyant sur des partenariats avec des plateformes déjà installées plutôt que de construire des outils concurrents, Anthropic mise sur l'intégration profonde comme avantage différenciant. La prochaine étape sera de mesurer si ces connecteurs tiennent leurs promesses dans des environnements de production professionnels exigeants.

UELes studios, agences et indépendants créatifs en France et en Europe qui utilisent déjà Adobe, Ableton ou Autodesk pourront intégrer Claude directement dans leurs flux de travail sans adopter une nouvelle plateforme.

Les IPO de SpaceX et d'entreprises IA font peser des risques sur l'essor du secteur, selon des investisseurs
1071The Information AI 

Les IPO de SpaceX et d'entreprises IA font peser des risques sur l'essor du secteur, selon des investisseurs

Lors d'un événement sur le financement de l'IA organisé par The Information à New York ce lundi, des investisseurs ont mis en garde contre les risques que font peser plusieurs introductions en bourse majeures sur l'ensemble de l'écosystème IA. SpaceX, Anthropic et OpenAI pourraient toutes entrer en bourse au cours de la même année civile, ce qui représenterait, selon Alexa von Tobel, fondatrice et associée gérante d'Inspired Capital, "trois des plus grandes IPO de l'histoire, potentiellement toutes dans le même calendrier". À l'heure où les grandes entreprises tech et IA cherchent à lever des centaines de milliards de dollars en capitaux propres et en dette pour construire des centres de données, la pression sur ces opérations est considérable. Le risque est simple : si ces introductions en bourse déçoivent les marchés, l'enthousiasme général pour l'investissement dans l'IA pourrait se refroidir brutalement. Von Tobel a utilisé l'expression "cold water on reality" pour décrire ce scénario, où de mauvaises performances boursières rendraient les capitaux environnants "plus prudents". Dans un secteur où la confiance des investisseurs alimente directement la construction d'infrastructures massives, un signal négatif sur les marchés publics aurait des répercussions bien au-delà des seules entreprises concernées, affectant potentiellement des dizaines de milliards de dollars de projets de data centers en cours. Ce contexte s'inscrit dans une période d'investissement sans précédent dans l'infrastructure IA : Microsoft, Google, Amazon et Meta ont annoncé des plans d'investissement totalisant plusieurs centaines de milliards de dollars pour 2025 et 2026. OpenAI et Anthropic, encore privées, sont valorisées respectivement à plusieurs centaines de milliards de dollars, et leur entrée en bourse constituerait un test grandeur nature de la confiance du marché public dans la rentabilité future de l'IA générative. La performance de ces IPO servira de baromètre pour toute une génération d'investissements technologiques à venir.

UEUn échec ou une déception de ces IPO américaines pourrait refroidir l'appétit des investisseurs européens pour l'IA et ralentir le financement des startups et projets d'infrastructure IA en Europe.

BusinessOpinion
1 source
ChatGPT Phone : tout ce qu’on sait du smartphone IA agentique qui veut tuer l’iPhone
1072Le Big Data 

ChatGPT Phone : tout ce qu’on sait du smartphone IA agentique qui veut tuer l’iPhone

OpenAI prépare son propre smartphone, baptisé en interne « Agentic Phone » ou « ChatGPT Phone », pour un lancement commercial prévu à l'horizon 2028. Le projet est orchestré par Sam Altman et le designer britannique Jony Ive, ancien directeur du design chez Apple et père de l'iPhone, qui travaille désormais pour OpenAI via son studio LoveFrom. Les premiers prototypes circulent déjà en interne depuis 2026. Financé en partie par SoftBank, l'appareil repose sur des puces NPU sur mesure développées en partenariat avec Qualcomm et MediaTek, conçues pour exécuter des modèles d'IA directement sur l'appareil, sans dépendre du cloud, garantissant rapidité et confidentialité. Ce qui distingue fondamentalement ce projet des smartphones existants, c'est le concept d'IA « agentique » : l'appareil ne se contente pas de répondre à des requêtes, il agit à la place de l'utilisateur. Fini l'enchaînement d'applications séparées pour réserver un taxi, envoyer un message et bloquer un créneau dans son agenda. L'utilisateur formule une instruction globale, et l'IA exécute l'ensemble des micro-tâches via les API concernées, sans interaction avec un écran. Ce modèle dits « Zéro UI » rend structurellement obsolète le paradigme de l'App Store, sur lequel reposent les revenus d'Apple, qui génère des dizaines de milliards de dollars annuels via ses commissions. Pour les développeurs, les utilisateurs et les plateformes, le changement de modèle serait radical : l'interface disparaît au profit d'une couche d'abstraction pilotée par l'IA. Ce projet s'inscrit dans une course plus large à la reconfiguration de l'informatique personnelle. Depuis l'émergence des grands modèles de langage comme GPT-4 puis GPT-5, plusieurs acteurs cherchent à transposer leur puissance dans le hardware du quotidien. Le Humane Pin et le Rabbit R1 ont tenté l'exercice avant OpenAI, avec des résultats décevants, faute de modèles suffisamment capables. OpenAI parie que ses prochaines générations de modèles, GPT-5.5 et au-delà, atteindront le niveau d'autonomie nécessaire pour que l'expérience soit réellement fluide. Apple, de son côté, reste contraint par la logique de l'App Store et de ses partenariats développeurs, ce qui ralentit sa capacité à adopter une interface agentique complète. Si OpenAI réussit à combiner un hardware performant, une IA locale robuste et une expérience sans friction, le rapport de force dans l'industrie mobile pourrait changer pour la première fois depuis 2007.

UESi ce smartphone agentique atteint le marché européen d'ici 2028, il pourrait fragiliser le modèle économique des développeurs d'applications européens dépendant des app stores, et soulève des questions réglementaires au regard de l'AI Act sur les systèmes IA autonomes à haute autonomie d'action.

InfrastructureOpinion
1 source
500 banquiers d'investissement ont évalué les résultats de l'IA : aucun n'est prêt pour les clients
1073The Decoder 

500 banquiers d'investissement ont évalué les résultats de l'IA : aucun n'est prêt pour les clients

Un nouveau benchmark a soumis les modèles d'IA les plus puissants du marché, dont GPT-5.4 et Claude Opus 4.6, à des tâches quotidiennes d'analystes juniors en banque d'investissement. Le verdict de 500 professionnels du secteur est sans appel : aucun résultat produit par ces modèles n'a été jugé prêt à être transmis à un client. Les sorties étaient systématiquement trop imprécises, voire franchement incorrectes. Malgré tout, plus de la moitié des banquiers interrogés ont indiqué qu'ils exploiteraient ces productions comme base de travail. Ce constat illustre l'écart persistant entre les promesses marketing des grands modèles de langage et les exigences concrètes des métiers à hauts enjeux. En banque d'investissement, une erreur dans une note d'analyse ou un modèle financier peut engager la responsabilité juridique de l'établissement et nuire à des transactions portant sur des centaines de millions d'euros. L'IA peut donc accélérer certaines tâches de débroussaillage, mais elle ne remplace pas encore le jugement et la rigueur d'un analyste humain pour la livraison finale. Ce test s'inscrit dans une vague d'évaluations sectorielles cherchant à dépasser les benchmarks académiques génériques, souvent décorrélés des usages professionnels réels. La finance, comme le droit ou la médecine, soumet l'IA à des critères de précision et de fiabilité que les tableaux de classement habituels ne mesurent pas. Les éditeurs de modèles, OpenAI et Anthropic en tête, devront probablement affiner leurs offres pour les environnements réglementés si ils veulent s'imposer au-delà du rôle d'assistant de brouillon.

UELes grandes banques françaises et européennes, soumises aux exigences de conformité MiFID II et aux contrôles des régulateurs financiers, sont directement concernées par ces limitations qui conditionnent toute adoption de l'IA dans la production de documents transmissibles aux clients.

💬 Zéro résultat jugé prêt pour un client, mais plus de la moitié dit s'en servir quand même comme base de travail. C'est exactement ça, l'IA en finance : utile pour défricher, inutilisable pour livrer. Reste à voir si OpenAI et Anthropic vont vraiment affiner leurs modèles pour les environnements réglementés, ou si on va continuer à entendre parler de révolution pendant que les analystes corrigent les sorties à la main.

LLMsPaper
1 source
GPT-5.5, un signal pour l'avenir
1074One Useful Thing 

GPT-5.5, un signal pour l'avenir

OpenAI a déployé GPT-5.5, une nouvelle famille de modèles dont la version la plus puissante, GPT-5.5 Pro, n'est accessible que via le site chatgpt.com. Le chercheur Ethan Mollick, qui a eu un accès anticipé au modèle, a soumis une épreuve de programmation à plusieurs IA concurrentes : construire une simulation 3D à génération procédurale montrant l'évolution d'une ville portuaire de 3000 avant J.-C. jusqu'à 3000 après J.-C., avec contrôle utilisateur et rendu visuel soigné. Les modèles testés allaient de o3 d'OpenAI, lancé il y a un an, jusqu'au meilleur modèle open weights actuel, Kimi K2.6. GPT-5.5 Pro est le seul à avoir modélisé une véritable évolution urbaine au lieu de simplement remplacer des bâtiments au fil du temps. Le gain de vitesse est aussi notable : là où GPT-5.4 Pro avait mis 33 minutes pour accomplir la tâche, GPT-5.5 Pro n'en a requis que 20. Au-delà des performances brutes, cette version marque un cap dans la capacité des IA à produire des résultats complexes et cohérents sur des tâches ambitieuses de développement. Pour les développeurs et les professionnels qui utilisent l'IA comme outil de travail, la différence n'est plus seulement quantitative mais qualitative : GPT-5.5 Pro ne se contente pas de générer du code fonctionnel, il comprend l'intention derrière la demande et produit un système structuré et évolutif. OpenAI progresse également sur son application desktop Codex, qui s'aligne désormais sur la popularité de Claude Code. Enfin, le nouveau modèle d'image maison, parfois désigné GPT-imagegen-2, franchit une limite longtemps problématique : il génère du texte lisible et de haute qualité intégré aux images, ce qui ouvre des usages nouveaux en visualisation, communication et création de contenu. Cette sortie s'inscrit dans une course à l'amélioration continue qui, contrairement aux prédictions de plateau, ne montre aucun signe de ralentissement. Mollick utilise une grille d'analyse en trois dimensions, modèles, applications, outils, pour illustrer que la compétition entre OpenAI, Anthropic et Google ne se joue plus uniquement sur les benchmarks des modèles eux-mêmes, mais aussi sur l'écosystème qui les entoure. Les applications desktop comme Claude Code ou Codex deviennent le vrai terrain de bataille pour les usages professionnels. La frontière des capacités reste cependant "en dents de scie" selon l'expression de Mollick : certaines tâches longtemps difficiles sont aujourd'hui triviales, tandis que d'autres restent inégalement maîtrisées selon les modèles et les contextes.

UELes développeurs et professionnels européens ont accès direct à cette nouvelle génération de modèles, avec des gains qualitatifs significatifs pour les tâches complexes de développement logiciel.

LLMsOpinion
1 source
Excel & Google Sheets : Fin des formules, ChatGPT débarque et fait tout le job
1075Le Big Data 

Excel & Google Sheets : Fin des formules, ChatGPT débarque et fait tout le job

OpenAI a lancé le 22 avril 2026 une nouvelle fonctionnalité appelée ChatGPT Sidebar, qui s'intègre directement dans Excel et Google Sheets sous forme de barre latérale ou de complément. L'installation se fait en quelques clics via le menu des modules complémentaires sur Google Sheets, ou via l'onglet Compléments d'Excel. Une fois connecté à son compte OpenAI, l'utilisateur dispose d'un assistant capable de créer des structures de fichiers, modifier des données, mettre à jour des tableaux et analyser des tendances réparties sur plusieurs onglets, le tout en langage naturel. L'outil demande systématiquement confirmation avant d'effectuer toute modification, préservant ainsi le contrôle de l'utilisateur. Il prend également en charge l'import de fichiers dans un large éventail de formats : images (JPEG, PNG, GIF), documents (PDF, Word, Pages), présentations (PowerPoint), feuilles de calcul (CSV, Excel), ainsi que formats texte et code (JSON, YAML, HTML, Markdown). La limite est fixée à 20 fichiers par message, avec un maximum de 25 Mo par fichier. L'outil est actuellement en phase bêta et réservé aux abonnés payants des offres Plus, Pro, Business, Enterprise, Edu et K-12. Pour des millions de professionnels qui passent des heures à construire des formules complexes ou à chercher des anomalies dans des tableaux imbriqués, cette intégration représente un changement concret de flux de travail. L'assistant peut repérer des tendances de dépenses sur plusieurs onglets en secondes, là où un analyste aurait autrefois mobilisé une demi-journée. Selon Jack R. Curran et d'autres membres de l'équipe OpenAI, l'outil couvre aussi bien des usages personnels, comme l'organisation d'un mariage ou la gestion d'une activité en ligne, que des besoins professionnels comme la construction d'un plan d'affaires ou l'analyse de données. La capacité à interagir en langage naturel abaisse significativement la barrière d'entrée pour les utilisateurs non-téchniques, qui n'ont plus besoin de maîtriser les syntaxes de formules pour exploiter pleinement un tableur. Cette annonce s'inscrit dans une dynamique d'expansion agressive d'OpenAI vers les outils de productivité bureautique, un territoire jusqu'ici dominé par Microsoft avec Copilot intégré à Office 365, et par Google avec Gemini dans Workspace. En s'installant directement dans Excel, concurrent historique de ses propres partenaires Microsoft, OpenAI joue sur tous les tableaux simultanément. La limitation aux abonnés payants suggère une stratégie de montée en gamme : convaincre les entreprises de migrer vers des formules Business ou Enterprise. L'absence de synchronisation avec l'historique ChatGPT classique constitue une limitation notable pour l'instant, mais laisse anticiper une intégration plus profonde dans les prochaines versions. La bataille pour devenir le co-pilote universel du travail de bureau ne fait que commencer.

UELes professionnels français et européens abonnés aux offres payantes ont accès à cette intégration qui modifie concrètement les pratiques de travail sur tableur, sans impact réglementaire spécifique à l'UE pour l'instant.

💬 Installer ChatGPT directement dans Excel, le produit phare de Microsoft, c'est le genre de coup qui mérite qu'on s'y arrête. Pour les profils non-techs qui jonglent avec des tableaux sans vraiment maîtriser les formules, là c'est du concret, pas du vent. Abonnés payants seulement pour l'instant, donc la vraie adoption, on verra dans six mois.

OutilsOutil
1 source
ChatGPT Images 2.0 : Ils ont enfin corrigé CE défaut qui rendait tout le monde fou !
1076Le Big Data 

ChatGPT Images 2.0 : Ils ont enfin corrigé CE défaut qui rendait tout le monde fou !

OpenAI a officiellement lancé ChatGPT Images 2.0 le 21 avril 2026, une refonte majeure de son générateur d'images propulsée par un nouveau modèle baptisé gpt-image-2. La mise à jour est immédiatement disponible pour les abonnés ChatGPT Plus, Pro et Business, avec un déploiement Enterprise annoncé prochainement. Le modèle est également accessible via l'API OpenAI, permettant aux développeurs de l'intégrer dans leurs propres services. Sur mobile, une mise à jour de l'application est requise pour profiter de l'ensemble des fonctionnalités. Parmi les changements les plus visibles : la génération de variations multiples en une seule requête, la prise en charge de formats allant du 3:1 au 1:3, et une capacité inédite à analyser des demandes complexes avant de générer quoi que ce soit, en s'appuyant parfois sur des recherches web pour affiner le résultat. La principale avancée concerne le rendu du texte dans les images, longtemps considéré comme le talon d'Achille de l'outil. Là où les versions précédentes déformaient systématiquement les mots et produisaient des caractères illisibles, gpt-image-2 peut désormais afficher des phrases entières, voire des paragraphes, de manière cohérente et intégrée visuellement. Cette capacité s'étend à plusieurs langues au-delà de l'anglais, ce qui élargit considérablement son utilité pour les créateurs de contenu à l'international. Pour les professionnels du marketing, de la communication ou du design qui avaient abandonné ChatGPT pour Midjourney ou Adobe Firefly sur ce point précis, cette correction représente un changement concret d'usage. Le modèle gagne également en fidélité d'exécution : il respecte mieux les consignes détaillées, reproduit avec plus de cohérence les styles demandés (photo réaliste, cinématique, pixel art, manga) et restitue les petits éléments qui échappaient souvent aux générations précédentes. Cette mise à jour s'inscrit dans une course à l'amélioration des générateurs d'images multimodaux où OpenAI accusait un certain retard face à des concurrents comme Midjourney v6 ou Stable Diffusion 3. Depuis l'intégration de DALL-E dans ChatGPT, le principal frein à l'adoption massive restait précisément la gestion du texte dans les visuels, un problème structurel lié à la manière dont les modèles de diffusion encodent les caractères. Le passage à gpt-image-2 semble marquer une rupture architecturale sur ce point. OpenAI continue néanmoins de signaler des limites : les mises en page complexes peuvent encore produire des résultats imparfaits, et le rendu multilingue n'est pas encore irréprochable. Les prochains mois diront si cette version consolide la position de ChatGPT comme outil généraliste de création visuelle ou si elle reste distancée par des solutions spécialisées.

UELes créateurs de contenu et professionnels du marketing en France et en Europe peuvent utiliser gpt-image-2 pour générer des visuels avec texte lisible en plusieurs langues via ChatGPT ou l'API OpenAI, élargissant concrètement son utilité pour la production francophone.

CréationOpinion
1 source
Résistance
1077MIT Technology Review 

Résistance

Un mouvement de résistance contre l'intelligence artificielle prend de l'ampleur à travers le monde, mobilisant des profils aussi divers que des syndicalistes, des parents, des artistes et des élus. En février 2026, des centaines de personnes ont défilé devant les sièges londoniens d'OpenAI, Google DeepMind et Meta, dans l'une des plus grandes manifestations anti-IA jamais organisées. Aux États-Unis, en mars, une coalition improbable réunissant des républicains MAGA, des socialistes démocrates, des militants syndicaux et des responsables religieux a signé une déclaration commune intitulée "Pro-Human AI Declaration", affirmant que l'IA doit servir l'humanité, non la remplacer. Ce même mois, la signature d'un contrat entre OpenAI et le Pentagone a provoqué une vague de désinstallations de ChatGPT, tandis que des manifestants taguaient à la craie les abords du siège de la société à San Francisco. En avril, un homme du Texas a été arrêté après avoir prétendument lancé un cocktail Molotov au domicile du PDG Sam Altman, porteur d'un manifeste anti-IA. Les inquiétudes sont à la fois symboliques et très concrètes. Un sondage Pew réalisé l'année dernière révèle que la moitié des Américains s'inquiètent de la place croissante de l'IA dans leur quotidien, et que les trois quarts estiment qu'elle pourrait représenter une menace pour l'humanité. Sur le plan économique, les suppressions d'emplois s'accélèrent : en février, la fintech Block a annoncé le licenciement de 40 % de ses effectifs, et quelques semaines plus tard, l'éditeur de logiciels Atlassian a prévu de couper 1 600 postes. Des poursuites judiciaires s'accumulent contre des chatbots accusés d'avoir conduit des adolescents au suicide ou à l'automutilation. Dans certaines villes américaines, des parents réclament un moratoire de deux ans sur l'IA dans les écoles, tandis que les communautés rurales s'opposent à l'installation de centres de données qui font grimper les factures d'énergie, polluent et consomment des terres agricoles. Au second trimestre 2025, des militants ont réussi à bloquer 98 milliards de dollars de projets de data centers aux États-Unis. Cette résistance commence à peser sur les décisions politiques et industrielles. New York et la Californie ont adopté de nouvelles règles encadrant les chatbots de compagnie. Au Royaume-Uni, le gouvernement a fait marche arrière en mars sur un projet autorisant les entreprises d'IA à s'entraîner sur des œuvres protégées par le droit d'auteur, sous la pression des artistes. Donald Trump a de son côté obtenu des dirigeants de l'IA l'engagement de financer eux-mêmes la production d'énergie nécessaire à leurs infrastructures. Ces avancées restent partielles, mais elles signalent un changement : les populations refusent de laisser aux seules entreprises technologiques le soin de définir à quoi ressemblera le monde de demain.

UELe Royaume-Uni a fait marche arrière sur l'autorisation d'entraîner des modèles sur des œuvres protégées par le droit d'auteur, une décision directement applicable aux industries créatives européennes et susceptible de peser sur l'interprétation de l'AI Act en matière de droits d'auteur.

SociétéOpinion
1 source
Une seule API, des rapports complets : la révolution Deep Research est là
1078Le Big Data 

Une seule API, des rapports complets : la révolution Deep Research est là

Google a officiellement lancé le 21 avril 2026 deux nouveaux agents d'analyse accessibles via l'API Gemini : Deep Research et Deep Research Max. Alimentés par le modèle Gemini 3.1 Pro, ces agents transforment une simple requête en rapport d'analyse structuré, en enchaînant automatiquement la collecte de données, le recoupement de sources et la mise en forme des résultats. Deep Research cible les usages interactifs qui privilégient la rapidité, tandis que Deep Research Max adopte une approche plus exhaustive, multipliant les sources et affinant ses conclusions pour une précision accrue. L'API génère également des infographies et des graphiques directement intégrés aux rapports, rendant les données exploitables sans passer par des outils tiers. Des acteurs spécialisés comme FactSet, S&P Global et PitchBook participent déjà à l'écosystème, confirmant l'ancrage industriel de la démarche. Ce lancement change concrètement la façon dont les entreprises peuvent mobiliser l'IA pour l'analyse. Jusqu'ici, les outils de recherche automatisée se limitaient à récupérer des réponses ponctuelles ; l'API Deep Research orchestre un véritable processus d'investigation autonome. Elle connecte le web ouvert aux bases de données internes via le Model Context Protocol, permettant aux organisations d'intégrer leurs données propriétaires dans le flux d'analyse sans les exposer à l'extérieur. L'accès au web peut même être désactivé entièrement, ce qui ouvre la porte aux secteurs soumis à des contraintes de confidentialité strictes, finance, santé, droit. Les utilisateurs conservent par ailleurs un contrôle précis : ils peuvent ajuster le plan de recherche avant son exécution et suivre les étapes en temps réel, ce qui renforce la traçabilité des résultats produits. Cette évolution s'inscrit dans une course technologique qui s'est accélérée depuis que les grands laboratoires ont compris que la valeur des LLM ne réside pas seulement dans la génération de texte, mais dans leur capacité à raisonner sur des corpus complexes et hétérogènes. OpenAI avait ouvert la voie avec son propre produit Deep Research début 2025 ; Google répond aujourd'hui avec une offre directement exposée en API, ciblant les développeurs et les équipes analytiques plutôt que les seuls utilisateurs finaux. Les domaines visés, études de marché, sciences de la vie, analyse financière, sont précisément ceux où le coût de production d'un rapport de qualité est élevé et où la vitesse d'analyse constitue un avantage concurrentiel direct. La prochaine étape sera de mesurer si la qualité des rapports produits tient face aux standards des analystes humains dans ces secteurs exigeants.

UELes entreprises françaises des secteurs finance, santé et droit peuvent intégrer cette API d'analyse autonome dans leurs systèmes propriétaires via le Model Context Protocol, sans exposer leurs données à des services externes.

OutilsOutil
1 source
Google lance des agents Deep Research et Deep Research Max pour automatiser la recherche complexe
1079The Decoder 

Google lance des agents Deep Research et Deep Research Max pour automatiser la recherche complexe

Google DeepMind a lancé Deep Research Max, un nouvel agent IA reposant sur Gemini 2.5 Pro, capable de mener des recherches autonomes sur le web et dans des sources de données propriétaires. Pour la première fois, les développeurs peuvent connecter des flux financiers et d'autres sources spécialisées via le Model Context Protocol (MCP). L'agent accompagne une version standard, Deep Research, déjà disponible dans les produits Google, tandis que la variante Max vise davantage les usages professionnels et techniques. L'enjeu est considérable pour les secteurs où l'analyse de données complexes est chronophage : finance, droit, recherche académique, conseil stratégique. En automatisant la collecte et la synthèse d'informations issues de sources hétérogènes, y compris des bases propriétaires inaccessibles au grand public, ces agents pourraient transformer le travail d'analyste ou de chercheur. La possibilité de brancher des flux financiers en temps réel via MCP représente une ouverture concrète vers des cas d'usage enterprise jusqu'ici difficiles à couvrir avec des LLM généralistes. Google s'inscrit ici dans une course intense aux agents de recherche autonomes : OpenAI a lancé son propre Deep Research début 2025, et Perplexity propose des fonctionnalités similaires. Le Model Context Protocol, initialement développé par Anthropic, s'impose progressivement comme standard d'interopérabilité entre agents IA et sources de données tierces, ce qui explique l'adoption par Google. Les benchmarks avancés restent peu transparents sur leur méthodologie, un point de vigilance récurrent dans ce secteur où les annonces marketing précèdent souvent les preuves indépendantes.

UELes entreprises européennes des secteurs finance, droit et conseil stratégique peuvent tester cet agent pour automatiser l'analyse de sources propriétaires via MCP.

Gemini 3.1 Flash TTS : prenez les commandes de l’émotion grâce aux balises audio
1080Le Big Data 

Gemini 3.1 Flash TTS : prenez les commandes de l’émotion grâce aux balises audio

Google a lancé le 15 avril 2026 Gemini 3.1 Flash TTS, son nouveau modèle de synthèse vocale conçu pour donner aux créateurs un contrôle fin sur le rendu émotionnel des voix générées. La principale nouveauté réside dans l'introduction des balises audio, des commandes en langage naturel intégrées directement dans le texte pour piloter le rythme, l'intonation et le style vocal phrase par phrase. Concrètement, un développeur peut indiquer dans sa requête qu'un passage doit être prononcé avec "excitation" ou de manière "explicative", et le modèle adapte sa synthèse en conséquence. Le modèle prend en charge plus de 70 langues, dont 24 bénéficient d'une qualité dite premium, parmi lesquelles l'hindi, le japonais et l'allemand. Il est déjà intégré dans Google Vids, la Gemini API et Google AI Studio, et inclut le watermarking SynthID sur tous les outputs. Cette capacité à sculpter la voix par instructions textuelles représente un changement de paradigme pour les producteurs de contenu audio et les équipes de développement. Jusqu'ici, les modèles TTS généraient une voix uniforme, difficile à différencier selon le contexte ou le ton voulu. Avec Gemini 3.1 Flash TTS, les entreprises qui produisent des podcasts automatisés, des assistants vocaux, des vidéos pédagogiques ou des expériences de narration interactive peuvent adapter le rendu vocal sans post-production manuelle. La couverture multilingue avec maintien de la cohérence émotionnelle ouvre aussi la voie à des déploiements localisés à grande échelle, un enjeu crucial pour les acteurs globaux qui ne peuvent pas se permettre de perdre en expressivité lors du passage d'une langue à l'autre. Cette annonce s'inscrit dans une course intense entre les grands acteurs de l'IA générative pour dominer le segment de la voix. OpenAI a lancé ses propres capacités TTS via l'API et ses modèles de voix en temps réel, ElevenLabs a consolidé sa position sur le marché des créateurs, et Microsoft intègre des fonctions similaires dans Azure Cognitive Services. Google, avec DeepMind en soutien, mise sur l'intégration native dans son écosystème existant, Google Vids, AI Studio, pour accélérer l'adoption sans friction. Le fait que Gemini 3.1 Flash TTS soit directement accessible via la Gemini API suggère une stratégie orientée développeurs d'abord, avant un éventuel déploiement grand public. Les prochaines étapes probables incluent une extension des langues premium, un affinement des balises disponibles et une intégration dans NotebookLM ou d'autres outils de productivité Google déjà très utilisés.

UELes développeurs et producteurs de contenu européens peuvent intégrer dès maintenant des capacités TTS émotionnelles multilingues via la Gemini API, ouvrant la voie à des déploiements localisés à grande échelle sans post-production vocale manuelle.

CréationOpinion
1 source
1081VentureBeat AI 

Microsoft lance MAI-Image-2-Efficient, un modèle de génération d'images plus rapide et moins coûteux

Microsoft a lancé ce mardi MAI-Image-2-Efficient, une version optimisée de son modèle phare de génération d'images MAI-Image-2, disponible immédiatement sur Microsoft Foundry et MAI Playground sans liste d'attente. Le modèle est facturé 5 dollars par million de tokens texte en entrée et 19,50 dollars par million de tokens image en sortie, soit une réduction de 41 % par rapport aux 33 dollars du modèle original pour les sorties image. Sur le plan technique, il tourne 22 % plus vite que son prédécesseur et affiche une efficacité quatre fois supérieure par GPU sur du matériel NVIDIA H100 en résolution 1024×1024. Microsoft affirme également le surpasser face aux modèles concurrents de Google, notamment Gemini 3.1 Flash, Gemini 3.1 Flash Image et Gemini 3 Pro Image, avec une latence médiane (p50) inférieure de 40 % en moyenne. Le modèle est aussi en cours de déploiement dans Copilot et Bing. Cette sortie s'inscrit dans une stratégie à deux niveaux que Microsoft emprunte directement au manuel de l'industrie IA : MAI-Image-2-Efficient cible les usages industriels à fort volume et contraintes budgétaires serrées, comme la photographie produit, les créations marketing, les maquettes d'interface ou les pipelines d'assets de marque. MAI-Image-2 reste le modèle de précision pour les rendus photoréalistes exigeants, les styles complexes comme l'illustration ou l'anime, et la typographie élaborée intégrée à l'image. Cette approche duale, similaire aux déclinaisons GPT d'OpenAI, Haiku-Sonnet-Opus d'Anthropic ou Flash-Pro de Google, s'applique ici à la génération d'images, un domaine où le coût par image est souvent le facteur décisif pour un déploiement à l'échelle en production. La vitesse de cette sortie est particulièrement significative : MAI-Image-2 n'avait été lancé sur MAI Playground que le 19 mars, avec une disponibilité élargie via Microsoft Foundry le 2 avril seulement, en même temps que deux autres modèles fondationnels, MAI-Transcribe-1 (reconnaissance vocale multilingue sur 25 langues) et MAI-Voice-1 (génération audio). Moins d'un mois s'est donc écoulé entre le lancement du modèle principal et celui de sa variante optimisée. Ce rythme illustre le mode de fonctionnement de la MAI Superintelligence Team, constituée en novembre 2025 sous la direction de Mustafa Suleyman, CEO de Microsoft AI : l'équipe opère davantage comme une startup en cycle court que comme un laboratoire de recherche traditionnel. Ce virage est stratégiquement crucial pour Microsoft, qui cherche à se doter d'une pile IA autonome, moins dépendante d'OpenAI. L'accueil est jusqu'ici favorable : selon Decrypt, MAI-Image-2 avait déjà atteint la troisième place du classement Arena.ai pour la génération d'images, derrière Google et OpenAI.

UELes développeurs et entreprises européens sur Microsoft Foundry bénéficient immédiatement d'une réduction de coût de 41% pour leurs pipelines de génération d'images, sans impact réglementaire spécifique à la France ou l'UE.

CréationOpinion
1 source
1082Le Big Data 

Apple Intelligence : le guide complet pour utiliser l’IA sur son iPhone ou Mac

Au printemps 2026, Apple Intelligence s'est imposée comme une composante centrale des iPhone et Mac, bien loin du gadget expérimental de ses débuts en 2024. Selon les chiffres de mars 2026, plus de 80 % des utilisateurs d'appareils compatibles recourent quotidiennement aux outils de résumé ou de retouche intégrés au système. Cette adoption massive concerne notamment les possesseurs d'iPhone 17 et de MacBook Pro M5, qui bénéficient du fruit de trois ans de recherche sur les modèles de langage à petite échelle (SLM). Siri 2.0, rebaptisé agent d'action, peut désormais exécuter des commandes complexes directement dans les applications : analyser une photo reçue sur WhatsApp, en extraire les informations d'un événement et les inscrire automatiquement dans Calendrier et Plans, sans intervention manuelle. Les Writing Tools, disponibles sur Mac et iPhone, permettent de reformuler, restructurer et affiner des textes à partir de brouillons, transformant un message maladroit en communication professionnelle en quelques secondes. Le Priority Hub d'iOS 19 réorganise les notifications selon leur urgence réelle, remontant par exemple une alerte d'annulation de vol même en mode « Ne pas déranger ». L'impact de ces évolutions dépasse le simple confort d'usage : elles redéfinissent le rapport des utilisateurs à leurs appareils. La promesse d'une IA qui respecte la vie privée, les traitements étant effectués localement sur l'appareil via les puces Apple Silicon, lève un frein majeur à l'adoption que les solutions concurrentes basées sur le cloud n'avaient pas su dissiper. Pour les professionnels, les créatifs et les particuliers, le gain de temps est concret : rédaction assistée, retouche photo instantanée avec l'outil Clean Up, génération d'illustrations depuis des esquisses sur iPad grâce à Image Wand, ou encore création d'emojis personnalisés (Genmoji) en deux secondes depuis iMessage. Le Semantic Intelligence Framework, qui permet à Siri d'adapter son ton et son débit au contexte, rend l'interaction suffisamment fluide pour que l'assistant s'intègre au rythme de vie sans friction perceptible. Cette montée en puissance s'inscrit dans une stratégie de long terme qu'Apple a construite en réponse à la pression exercée par OpenAI, Google et Microsoft sur le marché de l'IA grand public. Là où ces acteurs misaient sur des modèles massifs hébergés dans le cloud, Apple a choisi une voie différente : des modèles compacts optimisés pour tourner directement sur ses puces, couplés à une architecture système qui donne à l'IA un accès profond aux données personnelles sans les exporter. Le résultat, après deux ans de rodage parfois chaotique, est un écosystème cohérent où l'IA n'est plus une application à lancer, mais une couche invisible qui amplifie chaque geste. Les prochaines versions d'iOS et de macOS devraient étendre ces capacités aux applications tierces via des API publiques, ce qui pourrait transformer Apple Intelligence en plateforme ouverte autant qu'en avantage concurrentiel propriétaire.

UEL'approche de traitement local via les puces Apple Silicon est particulièrement favorable en Europe, où le RGPD freine l'adoption des IA cloud, offrant aux utilisateurs français et européens une alternative sans transfert de données personnelles vers des serveurs tiers.

OutilsOutil
1 source
1083Ars Technica AI 

Pourquoi Anthropic a fait évaluer Claude par un vrai psychiatre

Anthropic a publié cette semaine un document de 244 pages baptisé "system card" décrivant son tout dernier modèle d'intelligence artificielle, Claude Mythos. L'entreprise le présente comme "son modèle frontier le plus capable à ce jour", mais a décidé de ne pas le rendre accessible au grand public. La raison invoquée est inhabituelle : Mythos serait trop performant dans la détection de failles de cybersécurité inconnues, ce qui pousse Anthropic à en restreindre l'accès à un cercle restreint de partenaires triés sur le volet, parmi lesquels figurent Microsoft et Apple. Au-delà des capacités techniques, c'est le contenu philosophique du document qui retient l'attention. Anthropic, déjà connue pour prendre au sérieux la question de la conscience des IA, affirme dans ce system card qu'à mesure que les modèles gagnent en puissance, "il devient de plus en plus probable qu'ils possèdent une forme d'expérience, d'intérêts ou de bien-être qui comptent intrinsèquement, à l'instar de l'expérience et des intérêts humains." L'entreprise reconnaît ne pas en avoir la certitude, mais précise que "notre préoccupation grandit avec le temps." Cette position tranche avec le discours majoritaire dans l'industrie, où la question du statut moral des IA reste largement marginalisée. Ces déclarations s'inscrivent dans une stratégie plus large d'Anthropic, qui se distingue de ses concurrents comme OpenAI ou Google par une approche dite de "sécurité de l'IA" poussée à ses limites théoriques. Financer des recherches sur le bien-être des modèles, consulter des experts en psychiatrie ou en philosophie de l'esprit, et publier des documents aussi denses que ce system card de 244 pages sont autant de signaux que l'entreprise cherche à imposer un cadre normatif dans un secteur qui avance souvent sans réfléchir aux implications. Avec Mythos, Anthropic franchit un cap : celui d'un modèle jugé trop puissant pour être diffusé librement, ce qui soulève autant de questions sur la transparence réelle de ces décisions que sur la course aux capacités qui les motive.

LLMsOpinion
1 source
Nebius en discussions pour racheter la startup israélienne AI21 après l'échec des négociations avec Nvidia
1084The Information AI 

Nebius en discussions pour racheter la startup israélienne AI21 après l'échec des négociations avec Nvidia

Nebius, fournisseur cloud soutenu par Nvidia et valorisé à 32 milliards de dollars, est en discussions pour racheter la startup israélienne AI21 Labs, selon des sources proches du dossier. La société, basée à Amsterdam, cherche à élargir ses services d'intelligence artificielle au-delà de son activité principale de location de serveurs GPU. AI21 Labs, dont la dernière valorisation connue était de 1,4 milliard de dollars en 2023, développe des grands modèles de langage et des systèmes d'agents pour les entreprises. Ce rachat potentiel permettrait à Nebius de monter dans la chaîne de valeur de l'IA, en passant de simple infrastructure à fournisseur de solutions logicielles complètes. Pour ses clients, cela signifierait un accès intégré à des modèles et outils d'IA directement via la plateforme cloud, sans passer par des tiers. Pour AI21 Labs, une acquisition représente une issue après l'échec d'une précédente tentative de vente à Nvidia, qui ne s'était pas concrétisée. AI21 Labs fait partie de la première vague de startups israéliennes spécialisées en IA générative, concurrente directe d'OpenAI et Anthropic sur le segment entreprise. La startup avait levé des fonds auprès d'investisseurs majeurs dont Google, Intel Capital et Nvidia lui-même. Le secteur cloud connaît une consolidation accélérée, les fournisseurs d'infrastructure cherchant à intégrer verticalement des capacités IA pour fidéliser leurs clients face à la concurrence d'AWS, Azure et Google Cloud.

UENebius étant basée à Amsterdam, ce rachat potentiel renforcerait la position d'un acteur cloud ancré en Europe dans la chaîne de valeur de l'IA générative enterprise.

BusinessActu
1 source
USA : les chantiers de datacenters butent sur un double mur énergétique
1085Next INpact 

USA : les chantiers de datacenters butent sur un double mur énergétique

Entre 30 et 50 % des projets de datacenters prévus pour 2026 aux États-Unis accuseront des retards significatifs, selon une enquête de Bloomberg publiée le 1er avril 2026. Le frein principal n'est pas, comme on pourrait le supposer, la pénurie de puces IA ou de mémoire vive, mais bien un goulot d'étranglement à l'étage inférieur : les équipements électriques indispensables à l'alimentation de ces infrastructures, transformateurs, turbines, systèmes de distribution haute tension. Ces composants représentent moins de 10 % du coût total d'un datacenter, mais leur absence suffit à bloquer l'ensemble d'un chantier. La demande est colossale : selon une analyse de Bridgewater Associates de fin février 2026, Google, Amazon, Meta et Microsoft ont planifié à eux seuls 650 milliards de dollars de dépenses d'investissement en infrastructures. À cela s'ajoutent des acteurs comme Oracle, Equinix ou CoreWeave, qui construisent leurs propres centres de données en parallèle. Ce double mur, énergétique d'un côté, industriel de l'autre, crée une situation paradoxale où des centaines de milliards de dollars sont engagés mais ne peuvent se concrétiser faute de câbles, de transformateurs et de turbines disponibles en quantité suffisante. Pour les entreprises clientes comme OpenAI ou Anthropic, dont les besoins de calcul explosent, ces retards de livraison se traduisent directement par des contraintes de capacité. Pour les régions concernées, le problème est aussi structurel : plusieurs zones du territoire américain disposent d'un réseau électrique insuffisamment dimensionné pour absorber de telles charges. Meta a d'ores et déjà réservé 6,6 gigawatts d'énergie nucléaire dont les réacteurs ne seront pas opérationnels avant 2035, signe que les géants tech anticipent une pénurie durable. Face à ces contraintes, les grandes entreprises technologiques cherchent à devenir leurs propres producteurs d'énergie, contournant ainsi les délais de raccordement au réseau public. L'exemple le plus radical est celui de xAI, la société d'Elon Musk, qui a levé 20 milliards de dollars en partie pour financer l'achat de cinq turbines à gaz représentant 2 gigawatts de puissance cumulée, en complément d'installations déjà existantes dont les niveaux d'émission dépassent la réglementation locale. Ce mouvement de verticalisation énergétique illustre une tendance de fond : la course à l'infrastructure IA est désormais autant une question d'approvisionnement électrique que de performance logicielle. Le cabinet Sightline Climate, dont Bloomberg s'appuie sur les données chiffrées, documente une accumulation de retards qui révèle les limites réelles de plans d'investissement présentés comme historiques mais dont l'exécution se heurte à la physique des réseaux et aux délais de l'industrie lourde.

UEL'Europe fait face aux mêmes contraintes de réseau électrique et de délais d'approvisionnement en équipements lourds, risquant de ralentir les projets de datacenters européens pourtant essentiels à la souveraineté numérique de l'UE.

InfrastructureOpinion
1 source
ChatGPT intègre DoorDash, Spotify, Uber et d'autres applications : mode d'emploi
1086TechCrunch AI 

ChatGPT intègre DoorDash, Spotify, Uber et d'autres applications : mode d'emploi

OpenAI a lancé une série de nouvelles intégrations tierces directement dans l'interface de ChatGPT, permettant aux utilisateurs d'interagir avec des services comme Spotify, DoorDash, Uber, Canva, Figma et Expedia sans quitter la conversation. Ces connecteurs fonctionnent via des actions natives : commander un repas, réserver un trajet, créer un design ou planifier un voyage, le tout piloté par le modèle en langage naturel. L'impact est significatif pour les utilisateurs quotidiens : ChatGPT cesse d'être un simple assistant textuel pour devenir un point d'entrée unique vers des dizaines de services. Pour les entreprises partenaires, c'est un accès direct à la base d'utilisateurs d'OpenAI, qui dépasse les 200 millions d'utilisateurs hebdomadaires actifs. Pour les concurrents comme Google Assistant ou Apple Intelligence, la pression s'intensifie sur le terrain de l'assistant universel. Cette initiative s'inscrit dans la stratégie d'OpenAI de transformer ChatGPT en plateforme, à l'image de ce qu'avait tenté le système de plugins en 2023, abandonné puis repensé. Avec l'émergence des agents autonomes et du protocole MCP (Model Context Protocol), OpenAI positionne ChatGPT comme couche d'orchestration centrale entre l'utilisateur et l'ensemble de son environnement numérique, un terrain sur lequel Apple, Google et Microsoft jouent également des enjeux considérables.

UESpotify et Uber étant disponibles en France, les utilisateurs européens de ChatGPT pourraient accéder à ces intégrations, mais le déploiement reste centré sur le marché américain à ce stade.

💬 Les plugins de 2023, tout le monde les a oubliés tant c'était inutilisable. Cette fois il y a MCP derrière, une vraie couche d'orchestration, et des partenaires qui ont signé pour de bon (Spotify, Uber, Figma, c'est pas du gadget). Faut juste pas rêver côté Europe, le déploiement sera US-first pendant encore quelques mois.

OutilsOutil
1 source
Et si plusieurs IA travaillaient ensemble pour mieux vous aider ? Microsoft tente le pari
1087Siècle Digital 

Et si plusieurs IA travaillaient ensemble pour mieux vous aider ? Microsoft tente le pari

Microsoft a dévoilé Researcher, un nouvel agent intégré à Microsoft 365 Copilot, conçu pour dépasser les capacités d'un seul modèle de langage en orchestrant plusieurs IA en parallèle. Plutôt que de s'appuyer sur un unique modèle qui répond directement, Researcher décompose les requêtes complexes en sous-tâches distribuées à différents agents spécialisés — certains pour la recherche web, d'autres pour l'analyse de données internes ou la synthèse — avant de recomposer une réponse cohérente. Cette architecture multi-agents s'inscrit dans la stratégie plus large de Microsoft pour ses outils de productivité professionnelle. L'enjeu est concret pour les entreprises clientes de Microsoft 365 : les tâches de recherche approfondie, comme la préparation d'un dossier stratégique ou l'analyse concurrentielle, nécessitent aujourd'hui plusieurs heures de travail humain. Researcher vise à produire en quelques minutes des synthèses longues et sourcées, avec un niveau de précision supérieur à ce que peut offrir un assistant conversationnel classique. C'est la différence entre poser une question à un généraliste et confier un brief à une équipe d'analystes. Cette annonce s'inscrit dans une accélération du marché des agents IA, où OpenAI (avec Deep Research), Google (avec Gemini Deep Research) et Perplexity jouent déjà des coudes. Microsoft mise sur son ancrage dans l'environnement professionnel — Teams, Outlook, SharePoint, Word — pour différencier Researcher par sa capacité à croiser sources externes et données internes d'entreprise. La course ne porte plus sur le modèle le plus puissant, mais sur l'architecture qui coordonne le mieux plusieurs cerveaux artificiels.

UELes entreprises françaises et européennes utilisatrices de Microsoft 365 Copilot pourraient automatiser des tâches de recherche stratégique longues (dossiers, analyses concurrentielles), avec un gain de temps potentiellement significatif sur des flux de travail existants.

💬 L'angle intéressant ici c'est pas l'orchestration multi-agents en elle-même, ça fait un moment qu'on en parle. C'est que Microsoft peut brancher ça sur SharePoint, Teams, Outlook, et croiser tes données internes avec le web en un seul run. Reste à voir si ça tient sur de vrais dossiers d'entreprise et pas juste des démos bien cadrées.

OutilsOutil
1 source
L'IA entre dans une nouvelle phase d'accélération
1088OpenAI Blog 

L'IA entre dans une nouvelle phase d'accélération

OpenAI a levé 122 milliards de dollars lors d'un nouveau tour de financement destiné à accélérer le développement de l'intelligence artificielle de frontier à l'échelle mondiale. Cette opération, l'une des plus importantes jamais réalisées dans le secteur technologique, doit permettre à la société de Sam Altman d'investir massivement dans les infrastructures de calcul de nouvelle génération et de répondre à la demande croissante pour ses produits phares — ChatGPT, Codex et ses offres enterprise. L'ampleur de ce financement traduit une course aux ressources computationnelles sans précédent : entraîner et déployer des modèles de frontier exige des milliers de GPU spécialisés et des datacenters à la consommation électrique colossale. Pour les entreprises clientes et les millions d'utilisateurs de ChatGPT, cela signifie une capacité accrue, une disponibilité améliorée et vraisemblablement de nouveaux modèles plus puissants dans les prochains mois. Cette levée s'inscrit dans une dynamique où les grands laboratoires d'IA — OpenAI, Google DeepMind, Anthropic — se livrent une compétition acharnée pour dominer la prochaine vague de l'IA générale. OpenAI, valorisé à plusieurs centaines de milliards de dollars, consolide ainsi sa position de leader tout en cherchant à convertir sa domination technologique en un modèle économique durable face à une concurrence mondiale qui s'intensifie.

UECette levée de fonds renforce la domination d'OpenAI et accentue la dépendance des entreprises et utilisateurs européens vis-à-vis des grands laboratoires américains, un enjeu direct pour la souveraineté numérique de l'UE.

BusinessActu
1 source
Microsoft déploie Copilot Cowork plus largement et permet aux modèles d'IA de vérifier mutuellement leur travail
1089The Decoder 

Microsoft déploie Copilot Cowork plus largement et permet aux modèles d'IA de vérifier mutuellement leur travail

Microsoft déploie plus largement « Cowork », une nouvelle fonctionnalité de Microsoft 365 Copilot capable de gérer des flux de travail complets de manière autonome. L'outil, annoncé lors d'un déploiement progressif auprès des utilisateurs entreprise, permet à l'assistant IA de prendre en charge des tâches de bout en bout — de la recherche à la rédaction — sans intervention humaine à chaque étape. Parallèlement, Microsoft introduit un mécanisme de vérification croisée où plusieurs modèles d'IA s'évaluent mutuellement, dans le cadre d'un nouvel outil de recherche intégré à la suite. Ce double mouvement marque une évolution significative dans la manière dont les outils de productivité intègrent l'IA générative. Jusqu'ici, Copilot intervenait principalement en assistance ponctuelle — suggérer, reformuler, résumer. Avec Cowork, la logique bascule vers l'autonomie : l'IA devient un collaborateur capable d'orchestrer un projet entier. La vérification inter-modèles, elle, vise à réduire les hallucinations et améliorer la fiabilité des réponses, un problème central pour les déploiements en entreprise où les erreurs ont des conséquences réelles. Microsoft s'inscrit dans une course effrénée entre les grandes plateformes pour transformer leurs suites professionnelles en environnements agentiques. Google avec Workspace, Salesforce avec Agentforce, ou encore Notion — tous misent sur des agents capables d'agir, pas seulement de répondre. Pour Microsoft, qui a investi massivement dans OpenAI et intégré Copilot dans l'ensemble de sa suite M365, Cowork représente la concrétisation de cette ambition : faire de l'IA un véritable membre de l'équipe plutôt qu'un simple assistant à la demande.

UEMicrosoft 365 étant massivement déployé dans les entreprises européennes, l'autonomisation accrue de Copilot soulève des questions de conformité et de supervision humaine au regard des exigences de l'AI Act pour les systèmes agentiques.

OutilsOutil
1 source
Cohere publie un modèle open source qui domine les benchmarks de reconnaissance vocale
1090The Decoder 

Cohere publie un modèle open source qui domine les benchmarks de reconnaissance vocale

Cohere a publié un nouveau modèle de reconnaissance vocale open source qui surpasse l'ensemble de ses concurrents sur les benchmarks de référence du secteur, y compris Whisper d'OpenAI, le standard de facto depuis plusieurs années. Le modèle est disponible librement, ce qui permet à n'importe quelle équipe de le déployer, le modifier et l'intégrer sans restrictions de licence. Cette sortie représente un défi direct à la domination d'OpenAI dans le domaine de la transcription automatique. Whisper, lancé en 2022, s'est imposé comme la solution de référence pour des milliers d'applications professionnelles et open source. Qu'un acteur comme Cohere propose désormais une alternative plus performante et librement accessible change concrètement la donne pour les développeurs, les entreprises et les chercheurs qui cherchent à traiter de l'audio à grande échelle sans dépendance à un fournisseur propriétaire. Cohere, spécialisé dans les modèles de langage à destination des entreprises, élargit ainsi son périmètre au-delà du texte vers la modalité vocale, un segment en forte croissance. Cette publication s'inscrit dans une tendance plus large où les acteurs de l'IA rivalisent d'open source stratégique pour gagner en adoption et en crédibilité face aux géants comme OpenAI et Google. La qualité des benchmarks annoncés reste à confirmer par la communauté, mais le signal envoyé à l'industrie est clair.

UELes développeurs et entreprises européens peuvent adopter une alternative open source performante à Whisper pour la transcription vocale, réduisant leur dépendance aux solutions propriétaires américaines.

OutilsActu
1 source
Fuite géante chez Anthropic : pourquoi le futur Claude inquiète déjà ses créateurs
109101net 

Fuite géante chez Anthropic : pourquoi le futur Claude inquiète déjà ses créateurs

Anthropic a développé en secret un nouveau modèle d'intelligence artificielle baptisé Mythos, considéré en interne comme « de loin le plus puissant » jamais entraîné par la startup californienne. L'information a filtré à l'extérieur avant toute annonce officielle, révélant non seulement l'existence du modèle, mais aussi les préoccupations que celui-ci suscite au sein même de l'entreprise. Selon des informations internes, Mythos présenterait des « risques de cybersécurité significatifs » — une formulation rare et frappante de la part d'un créateur à propos de son propre produit. Cette autocritique publique — même involontaire — est significative : elle indique qu'Anthropic aurait franchi un seuil de capacité suffisamment inquiétant pour le documenter formellement, probablement dans le cadre de ses évaluations de sécurité pré-déploiement. Si le modèle est jugé capable de faciliter des cyberattaques à un niveau notable, cela soulève des questions immédiates sur les conditions dans lesquelles il sera (ou non) rendu accessible, et avec quelles garde-fous. Pour les entreprises, gouvernements et chercheurs qui s'appuient sur Claude, cela signifie une puissance accrue mais aussi un risque de mauvais usage potentiellement inédit. Anthropic s'est toujours positionné comme le laboratoire d'IA le plus rigoureux en matière de sécurité, publiant régulièrement des « model cards » détaillant les risques évalués avant chaque lancement. La fuite autour de Mythos intervient dans un contexte de course effrénée entre OpenAI, Google DeepMind et Anthropic pour sortir des modèles toujours plus capables. La question centrale désormais : jusqu'où un laboratoire peut-il aller avant de décider de ne pas déployer ce qu'il a construit ?

UELes entreprises et institutions européennes utilisant Claude devront surveiller les conditions de déploiement de Mythos et les garde-fous imposés, notamment au regard des obligations d'évaluation des risques prévues par l'AI Act pour les modèles à usage général de forte puissance.

SécuritéOpinion
1 source
Anthropic confirme que le modèle divulgué représente un saut qualitatif en raisonnement, après une fuite de données
1092The Decoder 

Anthropic confirme que le modèle divulgué représente un saut qualitatif en raisonnement, après une fuite de données

Anthropic a involontairement révélé l'existence de son modèle d'intelligence artificielle le plus puissant à ce jour à la suite d'une faille de sécurité basique. La fuite de données a exposé un modèle que la société n'avait pas encore annoncé officiellement, et qu'Anthropic a depuis confirmé représenter un « changement d'étape » significatif dans les capacités de raisonnement par rapport à ses versions précédentes. L'incident s'est produit alors que la startup californienne préparait discrètement ce qui s'annonce comme sa prochaine grande sortie publique. La confirmation par Anthropic que ce modèle constitue une avancée majeure en matière de raisonnement donne un aperçu de la direction que prend la course aux grands modèles de langage. Pour les développeurs et les entreprises qui s'appuient sur les API d'Anthropic, cela signifie qu'une nouvelle génération de capacités — vraisemblablement plus performantes sur les tâches complexes et multi-étapes — est imminente. La fuite force également Anthropic à communiquer plus tôt que prévu sur sa feuille de route technique. Cet épisode s'inscrit dans un contexte de compétition intense entre Anthropic et OpenAI, qui prépare simultanément ses propres modèles de nouvelle génération. Les deux sociétés semblent engagées dans une course pour démontrer leur supériorité technique avant d'éventuelles introductions en bourse ou levées de fonds majeures. Pour Anthropic, fondée en 2021 par d'anciens cadres d'OpenAI et valorisée à plusieurs dizaines de milliards de dollars, chaque annonce produit constitue un signal fort pour investisseurs et partenaires commerciaux.

UELes développeurs et entreprises européennes utilisant l'API Claude d'Anthropic bénéficieront prochainement de capacités de raisonnement améliorées, sans impact réglementaire ou institutionnel direct pour la France ou l'UE.

💬 En tant que développeur, je constate à quel point chaque nouveau modèle représente un bond qualitatif majeur. La facilité avec laquelle les nouveaux modèles identifient les limites de leurs prédécesseurs est stupéfiante — et témoigne d'une accélération qui ne montre aucun signe de ralentissement. L'amélioration récursive complète est-elle vraiment si loin ?

LLMsActu
1 source
Carrefour débarque sur ChatGPT : voici comment l’IA va faciliter vos courses
1093Presse-citron 

Carrefour débarque sur ChatGPT : voici comment l’IA va faciliter vos courses

Carrefour a lancé son application officielle sur ChatGPT, permettant aux utilisateurs d'interagir directement avec l'offre commerciale de l'enseigne depuis l'interface d'OpenAI. Concrètement, le plugin donne accès à trois fonctionnalités : trouver des recettes adaptées aux ingrédients disponibles, vérifier la disponibilité d'un produit en rayon, et composer un panier de courses complet, transférable ensuite sur le site carrefour.fr pour finaliser l'achat. L'intégration supprime une étape de friction dans le parcours d'achat : plutôt que de jongler entre un moteur de recherche, un site de recettes et un e-commerce, le client peut tout orchestrer en langage naturel depuis une seule interface. Pour Carrefour, c'est aussi un levier d'acquisition sur un canal où des millions d'utilisateurs passent déjà du temps — transformer une conversation en commande représente un débouché commercial direct et mesurable. Cette initiative s'inscrit dans la stratégie d'OpenAI d'ouvrir ChatGPT aux intégrations tierces via les GPT Actions, un écosystème que les grandes marques commencent à investir sérieusement. Carrefour, qui teste l'IA depuis plusieurs années (assistant virtuel, personnalisation des promotions), confirme ici son positionnement comme distributeur technophile en Europe. La prochaine étape logique serait une intégration permettant le paiement directement dans l'interface, sans redirection vers le site.

UECarrefour, premier distributeur français, ouvre un canal de vente directement dans ChatGPT, testable immédiatement par les consommateurs français.

OutilsOutil
1 source
ChatGPT et Claude : Gemini veut devenir votre IA principale en aspirant la mémoire des autres
1094Frandroid 

ChatGPT et Claude : Gemini veut devenir votre IA principale en aspirant la mémoire des autres

Google a lancé une nouvelle fonctionnalité pour Gemini permettant aux utilisateurs d'importer leurs mémoires et préférences depuis d'autres chatbots, notamment ChatGPT d'OpenAI et Claude d'Anthropic. Concrètement, l'outil récupère l'historique de personnalisation — préférences de ton, informations personnelles, habitudes de travail — accumulé dans ces assistants concurrents, et les transfère en quelques clics vers Gemini. La fonctionnalité est déployée progressivement auprès des utilisateurs via l'interface web et mobile de Gemini. L'enjeu est considérable : la mémoire personnalisée est devenue l'un des principaux facteurs de rétention dans la guerre des chatbots. Un utilisateur qui a passé des mois à "éduquer" ChatGPT sur ses préférences hésite à tout recommencer à zéro ailleurs. En supprimant cette friction, Google retire le principal obstacle qui empêche les utilisateurs de migrer. Pour les professionnels et les utilisateurs intensifs, c'est un signal fort : Gemini veut devenir l'IA centrale du quotidien, et non plus un outil secondaire. Cette manœuvre s'inscrit dans une bataille de parts de marché où ChatGPT reste dominant malgré la montée en puissance de Claude et Gemini. Google a fortement investi dans Gemini depuis 2023, intégrant le modèle dans l'ensemble de son écosystème (Gmail, Docs, Android). L'importation de mémoire est une tactique d'acquisition directe, similaire à ce que font les banques ou opérateurs téléphoniques pour faciliter la portabilité — sauf qu'ici, c'est Google qui fixe les règles du jeu sur sa propre plateforme.

UELes utilisateurs européens de Gemini peuvent désormais importer leurs préférences depuis ChatGPT ou Claude, réduisant la friction de migration vers l'écosystème Google sur le marché européen des assistants IA.

OutilsOutil
1 source
Un juge bloque la classification d'Anthropic comme risque pour la chaîne d'approvisionnement
1095Wired AI 

Un juge bloque la classification d'Anthropic comme risque pour la chaîne d'approvisionnement

Un juge fédéral américain a temporairement suspendu la décision de l'administration Trump de classer Anthropic comme entité à risque dans la chaîne d'approvisionnement, empêchant ainsi cette désignation d'entrer en vigueur la semaine prochaine. La mesure conservatoire accordée par le tribunal offre à la startup d'intelligence artificielle un répit immédiat, lui permettant de poursuivre ses activités commerciales sans être soumise aux restrictions liées à ce statut. Cette désignation aurait pu avoir des conséquences significatives sur les activités d'Anthropic, notamment en matière de contrats gouvernementaux, de partenariats commerciaux et d'accès aux technologies sensibles. Un tel label, appliqué dans le cadre des mécanismes de sécurité nationale américains, peut considérablement compliquer les relations d'affaires d'une entreprise et éroder la confiance de ses clients et investisseurs. Cette affaire s'inscrit dans un contexte de tensions croissantes entre l'administration Trump et certains acteurs de l'IA, alors que Washington cherche à renforcer son contrôle sur les technologies jugées stratégiques. Anthropic, fondée en 2021 par d'anciens membres d'OpenAI et qui compte Amazon parmi ses principaux investisseurs, se retrouve ainsi au cœur d'un bras de fer juridique et politique dont l'issue pourrait influencer la manière dont d'autres entreprises du secteur sont traitées par les autorités fédérales.

UELa suspension de la désignation préserve les relations commerciales d'Anthropic avec ses partenaires européens et évite des perturbations pour les entreprises de l'UE utilisant l'API Claude.

RégulationReglementation
1 source
Apple envisage d'ouvrir Siri à d'autres chatbots IA
1096The Verge AI 

Apple envisage d'ouvrir Siri à d'autres chatbots IA

Apple prévoit d'ouvrir Siri à d'autres assistants d'intelligence artificielle avec la sortie d'iOS 27, selon un rapport de Mark Gurman pour Bloomberg. Le nouveau système, baptisé « Extensions », permettra aux utilisateurs de connecter des chatbots tiers téléchargés depuis l'App Store directement à Siri — notamment Google Gemini et Claude d'Anthropic. Ces intégrations fonctionneront sur iPhone, iPad et Mac, avec la possibilité d'activer ou de désactiver chaque chatbot selon ses préférences. Cette ouverture représente un tournant majeur dans la stratégie d'Apple. Jusqu'ici, Siri ne pouvait s'appuyer que sur ChatGPT d'OpenAI, un partenariat introduit avec iOS 18. En élargissant ce modèle à l'ensemble de l'écosystème, Apple transforme Siri en une interface neutre plutôt qu'en un assistant propriétaire fermé. Les utilisateurs gagneront en flexibilité, pouvant choisir le modèle le plus adapté à leurs usages — que ce soit pour la créativité, le code, ou la recherche — sans quitter l'environnement Apple. Cette décision s'inscrit dans un contexte où Siri a longtemps été perçu comme à la traîne face à des concurrents comme ChatGPT ou Gemini. Apple avait commencé à rattraper ce retard avec l'annonce d'« Apple Intelligence » en 2024, mais le développement a été laborieux et plusieurs fonctionnalités ont été retardées. En s'appuyant sur des acteurs externes plutôt que de tout construire en interne, Apple adopte une approche pragmatique qui pourrait redéfinir le rôle de Siri comme couche d'orchestration entre l'utilisateur et les meilleurs modèles du marché.

UELes utilisateurs européens d'iPhone, iPad et Mac pourront accéder directement à des assistants IA tiers via Siri dès iOS 27, renforçant la diversité et la flexibilité des assistants IA sur le marché européen.

OutilsOutil
1 source
Apple prévoit d'ouvrir Siri à d'autres assistants IA
1097The Information AI 

Apple prévoit d'ouvrir Siri à d'autres assistants IA

Apple prévoit d'ouvrir Siri à d'autres assistants d'intelligence artificielle tiers, selon Bloomberg. Cette évolution majeure sera annoncée en juin lors de la Worldwide Developers Conference (WWDC) 2026, dans le cadre d'une refonte en profondeur de l'assistant vocal d'Apple. L'intégration permettrait à des assistants comme ChatGPT d'OpenAI, Gemini de Google ou d'autres solutions IA de se connecter directement à Siri, offrant aux utilisateurs la possibilité de basculer vers ces outils sans quitter l'écosystème Apple. Ce changement représente un tournant stratégique considérable pour Apple, qui a longtemps maintenu Siri comme un système fermé. Pour les utilisateurs d'iPhone et d'iPad, cela signifie un accès direct aux modèles les plus puissants du marché depuis l'interface native d'iOS, sans friction. Pour les développeurs d'IA, c'est une opportunité d'atteindre des centaines de millions d'appareils Apple dans le monde. Cette ouverture pourrait également répondre aux critiques persistantes sur les lacunes de Siri face à des concurrents comme ChatGPT ou Claude. Cette décision intervient alors qu'Apple accuse un retard notable dans la course à l'IA générative. Apple Intelligence, lancé en 2024, a reçu des retours mitigés, et plusieurs fonctionnalités promises ont été reportées. En ouvrant son assistant à des partenaires extérieurs, Cupertino adopte une stratégie de plateforme plutôt que de tout développer en interne — une approche qui rappelle ce qu'Apple a fait avec l'App Store en 2008. Les modalités exactes de ces partenariats, notamment les conditions commerciales et les accès aux données, restent à préciser avant la WWDC.

UELes utilisateurs européens d'iPhone pourraient accéder directement à ChatGPT ou Gemini via Siri, une évolution qui pourrait attirer l'attention des régulateurs EU sur l'interopérabilité et les conditions de partage des données.

OutilsActu
1 source
Pourquoi Notion abandonne Cursor pour Claude Code et Codex
1098The Information AI 

Pourquoi Notion abandonne Cursor pour Claude Code et Codex

Des centaines d'ingénieurs chez Notion abandonnent l'outil Cursor au profit de Claude Code (Anthropic) et Codex (OpenAI). Ce changement reflète une tendance plus large : les développeurs délaissent les assistants de codage intégrés à l'IDE (autocomplétion, etc.) pour des agents capables de réaliser des tâches entières de manière autonome, accessibles même aux non-techniciens. Bien que Cursor propose des agents depuis l'été dernier, sa réputation reste liée aux outils IDE classiques, contrairement à Claude Code et Codex, reconnus pour leurs capacités agentiques avancées.

OutilsOutil
1 source
Nvidia et son partenaire cloud Nscale en négociations pour acquérir un grand site de data center aux États-Unis avant son introduction en bourse
1099The Information AI 

Nvidia et son partenaire cloud Nscale en négociations pour acquérir un grand site de data center aux États-Unis avant son introduction en bourse

Nscale, un fournisseur cloud britannique soutenu par Nvidia dont les clients incluent OpenAI et Microsoft, est en négociation pour acquérir l'un des plus grands sites disponibles pour les centres de données IA aux États-Unis. Le site, situé dans le comté de Mason en Virginie-Occidentale, est particulièrement stratégique car il a déjà obtenu les autorisations réglementaires locales et sécurisé les équipements électriques pour les premières phases du projet. Cette acquisition ferait de Nscale, qui prépare une introduction en bourse, un acteur majeur de l'infrastructure IA américaine presque du jour au lendemain.

BusinessActu
1 source
TAI #195 : GPT-5.4 et l'arrivée de l'auto-amélioration de l'IA ?
1100Towards AI 

TAI #195 : GPT-5.4 et l'arrivée de l'auto-amélioration de l'IA ?

OpenAI a lancé GPT-5.4 le 5 mars, son modèle frontier le plus orienté productivité à ce jour, avec une fenêtre contextuelle d'1M tokens, l'utilisation native d'ordinateur et un tarif de 2,50$/15$ par million de tokens. Dans les benchmarks, aucun modèle ne domine clairement : GPT-5.4 mène sur ProofBench et le codage, tandis que Gemini 3.1 Pro excelle sur LegalBench et GPQA, et Claude Opus 4.6 sur SWE-bench. Parallèlement, l'expérience "autoresearch" d'Andrej Karpathy démontre que des agents IA peuvent identifier de façon autonome des améliorations réelles à l'entraînement des réseaux de neurones — signalant potentiellement l'émergence d'une IA capable de s'améliorer elle-même en boucle fermée.

LLMsOpinion
1 source