Aller au contenu principal

Dossier OpenAI — page 19

1852 articles · page 19 sur 38

Toute l'actualité d'OpenAI : nouvelles versions de ChatGPT et GPT, stratégie produit, partenariats, controverses et décisions de Sam Altman.

901MarkTechPost OutilsOutil

Nous Research enrichit Hermes d'une commande /learn pour capturer les workflows en commandes slash sans rédiger SKILL.md

Nous Research a enrichi son agent open-source Hermes Agent avec une nouvelle commande baptisée /learn, annoncée le 23 juin 2026. Cette fonctionnalité s'intègre au système de compétences existant (Skills System) de l'agent et permet de créer automatiquement des fichiers SKILL.md réutilisables sans avoir à les rédiger manuellement. Il suffit de pointer la commande vers une source : un répertoire local comme ~/projects/acme-sdk, une URL de documentation en ligne, des notes collées dans le terminal, ou même une procédure que l'utilisateur vient de lui faire exécuter. L'agent mobilise alors ses propres outils, readfile et searchfiles pour les fichiers locaux, web_extract pour le web, et produit une fiche de compétence conforme aux standards maison : description en moins de 60 caractères, structure de sections normalisée, et référencement uniquement aux commandes qui existent réellement. Toutes les compétences sont stockées dans ~/.hermes/skills/ et deviennent instantanément des commandes slash disponibles, comme /plan ou /axolotl. L'enjeu derrière cette simplicité apparente est considérable pour les équipes techniques. Jusqu'ici, documenter un workflow complexe, déployer un serveur, soumettre une note de frais, interagir avec une API interne, exigeait que quelqu'un rédige manuellement ce fichier de référence. Avec /learn, l'agent se charge lui-même de cette capitalisation, transformant une procédure fraîchement exécutée en compétence persistante et réutilisable. Le système de chargement à trois niveaux maintient les coûts en tokens sous contrôle : l'agent dispose en permanence d'un index compact (environ 3 000 tokens), et ne charge le contenu complet d'une compétence que lorsqu'une tâche le requiert explicitement. Une bibliothèque de dizaines de compétences ne pèse donc pas sur la fenêtre de contexte au repos. Hermes Agent est le projet phare de Nous Research dans l'espace des agents auto-améliorants open-source. Le Skills System repose sur le standard ouvert agentskills.io, ce qui lui confère une dimension communautaire : les compétences créées localement, installées depuis un hub tiers ou générées automatiquement partagent le même format et le même emplacement. /learn n'est pas un moteur d'ingestion séparé mais simplement une instruction transmise à l'agent comme un tour de conversation ordinaire, ce qui le rend compatible avec tous les modes d'exécution, CLI, interface TUI, passerelle de messagerie, tableau de bord, Docker ou remote. L'approbation manuelle reste possible via une option de contrôle des écritures. Cette architecture place Nous Research dans une logique de mémoire procédurale automatique pour les agents, un chantier sur lequel plusieurs laboratoires rivaux, dont Anthropic et OpenAI, cherchent eux aussi à progresser dans leurs propres écosystèmes d'agents.

1 source
Amazon Bedrock AgentCore est disponible en production : passez d'une idée à un agent opérationnel en quelques minutes
902AWS ML Blog 

Amazon Bedrock AgentCore est disponible en production : passez d'une idée à un agent opérationnel en quelques minutes

Amazon a annoncé le 18 juin 2026 la disponibilité générale d'AgentCore Harness, une nouvelle couche d'infrastructure de sa plateforme Bedrock conçue pour déployer des agents IA en production en quelques minutes. Le service repose sur deux appels API, CreateHarness pour définir un agent, InvokeHarness pour l'exécuter, et s'appuie sur les six primitives déjà disponibles en préversion depuis avril : Runtime, Memory, Gateway, Browser, Identity et Observability. L'agent tourne dans un environnement isolé doté d'un système de fichiers et d'un shell, peut lire des fichiers, exécuter des commandes et écrire du code. Il conserve la mémoire des utilisateurs et des conversations entre sessions, navigue sur le web, appelle des outils via MCP ou Gateway, et chaque étape est automatiquement tracée vers CloudWatch. Le problème qu'AgentCore Harness cherche à résoudre n'est pas la conception de l'agent, c'est tout ce qui l'entoure. Monter un prototype en local prend une après-midi ; le passer en production explose le volume de travail : concurrence, isolation, gestion des identités, état distribué, mise à l'échelle. Et ce coût se répétait à chaque nouveau cas d'usage, chaque changement de modèle, chaque nouvel outil. Le Harness absorbe ce câblage en tant qu'abstraction gérée, ce qui le transforme en quelque chose qu'on configure plutôt que quelque chose qu'on construit. Pour les équipes qui expérimentent plusieurs modèles ou cherchent à optimiser le rapport prix-performance, la fonctionnalité la plus attendue est la capacité à changer de fournisseur de modèle en cours de session sans perdre le contexte conversationnel. La compatibilité multi-modèles est au coeur de l'offre. Bedrock supporte déjà Anthropic Claude, Amazon Nova, Meta Llama, DeepSeek, Qwen, Cohere et Mistral, et vient d'intégrer OpenAI GPT-5.5 et GPT-5.4. Le service s'étend également à l'API OpenAI directe, Google Gemini, et via LiteLLM à Vertex, Azure OpenAI et d'autres. Cette ouverture reflète une tendance de fond : les grandes plateformes cloud se positionnent non plus comme fournisseurs d'un seul modèle, mais comme couches d'orchestration universelles. Amazon rejoint ainsi Microsoft Azure AI Foundry et Google Vertex AI dans la course aux plateformes d'agents prêtes pour la production. La prochaine étape sera de voir si cette abstraction tient sous la charge réelle et si les équipes adoptent le catalogue de compétences AWS plutôt que de continuer à construire leurs propres outils.

UELes équipes européennes développant des agents IA peuvent adopter cette infrastructure gérée pour réduire la charge opérationnelle liée au déploiement en production, mais aucune entreprise ou réglementation française ou européenne n'est directement impliquée.

OutilsOpinion
1 source
Meta donne un gros coup d’IA à Facebook… en exploitant les publications publiques
903Le Big Data 

Meta donne un gros coup d’IA à Facebook… en exploitant les publications publiques

Meta a lancé le 15 juin 2026 un nouveau « Mode IA » sur Facebook, qui transforme la barre de recherche en interface conversationnelle. Les utilisateurs peuvent désormais poser des questions en langage naturel et recevoir une réponse synthétisée directement par le modèle d'IA de Meta, sans avoir à parcourir une liste de résultats. Cette réponse s'appuie sur les publications publiques de la plateforme : posts d'utilisateurs, discussions de groupes et vidéos Reels. La fonctionnalité arrive en même temps que plusieurs outils de création assistés par l'IA, dont la génération de collages, des transitions vidéo automatiques et des filtres permettant d'habiller virtuellement sa photo de profil avec le maillot de son équipe sportive favorite. L'enjeu de fiabilité est immédiat et concret. Contrairement à un moteur de recherche classique qui renvoie vers des sources identifiables, ce système synthétise des millions d'avis, d'expériences personnelles et de discussions issues du grand public. La qualité de la réponse générée dépend donc directement de la qualité des contenus indexés, qui peuvent inclure rumeurs, approximations ou désinformations populaires. Google essuie les mêmes critiques depuis qu'il a introduit des résumés automatiques tirés de Reddit. Pour Meta, l'enjeu est d'autant plus fort que Facebook reste une plateforme de référence pour des centaines de millions d'utilisateurs, notamment dans des pays où elle constitue le principal point d'accès à l'information. Si le système ne parvient pas à distinguer une information fiable d'une opinion virale, il risque d'amplifier les fausses croyances à grande échelle. Ce lancement s'inscrit dans une stratégie d'intégration accélérée de l'IA sur l'ensemble des produits Meta. L'entreprise avait déjà lancé Forum, une application de questions-réponses communautaires alimentée par les groupes Facebook, signalant clairement sa volonté de concurrencer Google sur le terrain de la recherche d'information. En parallèle, Meta déploie des assistants pour créateurs de contenu et des réponses automatiques sur Marketplace, transformant progressivement Facebook en plateforme augmentée par l'IA. La bataille se joue à plusieurs niveaux : technologique face à Google et OpenAI, réglementaire face aux autorités européennes qui scrutent l'utilisation des données publiques des utilisateurs pour entraîner ou alimenter ces systèmes, et en termes de confiance auprès d'un public de plus en plus averti des limites des IA génératives.

UELes autorités européennes scrutinent l'utilisation des données publiques des utilisateurs de Facebook pour alimenter ce système d'IA, exposant Meta à des risques réglementaires sous le RGPD et l'AI Act.

💬 Transformer Facebook en source de vérité pour une IA de recherche, c'est prendre le contenu le plus chaotique du web et en faire une base de connaissance. Meta le sait, mais c'est ça ou laisser Google et OpenAI dicter les règles du moteur de demain. Reste à voir si le système saura distinguer un post fiable d'une opinion virale, parce qu'avec Facebook comme principale fenêtre sur l'info dans des dizaines de pays, un raté peut faire beaucoup de dégâts.

OutilsOutil
1 source
Google Cloud lance un format ouvert pour convertir des documents épars en fichiers Markdown destinés aux agents IA
904The Decoder 

Google Cloud lance un format ouvert pour convertir des documents épars en fichiers Markdown destinés aux agents IA

Google Cloud a lancé l'Open Knowledge Format (OKF), un nouveau standard destiné à transformer la documentation organisationnelle éparpillée en fichiers Markdown structurés avec frontmatter YAML. L'objectif : rendre la connaissance interne des entreprises portable et directement exploitable par des agents d'intelligence artificielle. La spécification, délibérément minimaliste, propose un cadre commun pour unifier des contenus aujourd'hui dispersés entre wikis, bases de données, outils SaaS et documents PDF. L'enjeu est considérable pour les entreprises qui déploient des agents IA en interne. Actuellement, ces agents peinent à accéder à la connaissance organisationnelle parce qu'elle ne respecte aucun format unifié. OKF résout ce problème structurel en imposant une couche de standardisation légère : chaque document devient un fichier texte lisible à la fois par un humain et par un LLM, avec des métadonnées explicites permettant aux agents de comprendre le contenu, sa portée et sa pertinence sans transformation préalable. La démarche de Google Cloud s'inscrit dans un mouvement intellectuel récent : Andrej Karpathy, chercheur emblématique passé par Tesla et OpenAI, avait popularisé ce concept sous l'appellation "LLM Wiki", plaidant pour des bases de connaissances conçues nativement pour les modèles de langage. En formalisant cette intuition sous forme de standard ouvert, Google Cloud cherche à s'imposer comme référence dans l'écosystème des agents d'entreprise, un marché en forte croissance où la qualité et l'accessibilité de la connaissance structurée sont devenues des avantages concurrentiels décisifs.

UELes entreprises et administrations européennes déployant des agents IA peuvent adopter ce standard ouvert pour structurer leur documentation interne et améliorer l'interopérabilité de leurs systèmes de gestion des connaissances.

💬 Le vrai goulot d'étranglement des agents IA en entreprise, c'est jamais le modèle, c'est la connaissance éparpillée dans 14 outils différents. Karpathy avait nommé le truc il y a un moment, Google vient juste de le mettre en costume corporate avec un nom de standard. Reste à voir combien d'éditeurs SaaS vont jouer le jeu, parce qu'un format ouvert sans adoption, c'est juste un PDF de plus.

OutilsOpinion
1 source
Les agents IA de codage trouvent le bon fichier mais passent à côté des lignes essentielles, selon une étude
905The Decoder 

Les agents IA de codage trouvent le bon fichier mais passent à côté des lignes essentielles, selon une étude

Les agents de codage dopés à l'intelligence artificielle, comme Claude Code d'Anthropic ou Codex d'OpenAI, souffrent d'un angle mort précis : ils localisent correctement le fichier contenant un bug, mais ratent la majorité des lignes critiques à l'intérieur de ce fichier. C'est ce que révèle SWE-Explore, un nouveau benchmark conçu spécifiquement pour évaluer la phase d'exploration du code, c'est-à-dire la recherche et la navigation dans une base de code, séparément de la phase de correction proprement dite. C'est une première dans l'évaluation des outils de développement automatisé. Ce découplage entre exploration et réparation change la façon d'interpréter les performances des agents de codage. Jusqu'ici, les benchmarks dominants comme SWE-bench mesuraient uniquement le résultat final : le bug est-il corrigé ou non ? SWE-Explore montre qu'un agent peut échouer non pas parce qu'il ne sait pas corriger le code, mais parce qu'il n'a pas identifié les bonnes lignes à modifier. Sans contexte suffisant, même le meilleur algorithme de correction produit un patch inutile. Les développeurs qui s'appuient sur ces outils en production s'exposent donc à des corrections en apparence valides mais ciblant les mauvaises sections. Ce travail s'inscrit dans une dynamique de remise en question des métriques utilisées pour comparer les agents de développement. L'industrie investit massivement dans ces outils, GitHub Copilot, Cursor, Devin, et les entreprises les vendent sur des taux de résolution de tickets. SWE-Explore suggère que ces chiffres masquent une faiblesse structurelle en amont : la compréhension fine d'une base de code existante reste un problème ouvert, et le résoudre conditionne tout le reste.

UELes développeurs français et européens qui s'appuient sur des agents de codage IA en production s'exposent à des corrections en apparence valides mais ciblant les mauvaises sections de code, une limite structurelle à évaluer avant tout usage professionnel critique.

💬 Ça explique des trucs que j'ai vécus : le patch arrive, il compile, les tests passent, et pourtant le bug est toujours là parce que l'agent a retouché le mauvais endroit. SWE-Explore met le doigt dessus avec rigueur, en séparant la phase de navigation de la phase de correction, ce qui n'avait jamais été fait proprement. Les éditeurs vont devoir intégrer ça dans leurs benchmarks marketing, parce que vendre sur des taux de résolution de tickets quand la moitié du problème est en amont, c'est se raconter des histoires.

RecherchePaper
1 source
Google Research : Gemini-SQL2 domine les benchmarks text-to-SQL avec une large avance
906The Decoder 

Google Research : Gemini-SQL2 domine les benchmarks text-to-SQL avec une large avance

Google Research a publié Gemini-SQL2, un système capable de convertir du langage naturel en requêtes SQL exécutables, construit sur le modèle Gemini 3.1 Pro. Sur le benchmark BIRD, référence industrielle pour évaluer la conversion texte-vers-SQL, Gemini-SQL2 atteint un taux de précision de 80,04 %, distançant significativement les solutions concurrentes d'OpenAI et d'Anthropic. Cette performance place Google en tête d'un domaine à fort enjeu commercial : la capacité à interroger des bases de données en langage courant, sans écrire une seule ligne de code, ouvre l'accès à la donnée à des profils non techniques au sein des entreprises. Pour Google, l'intégration de cette technologie dans ses services de données comme BigQuery ou Looker pourrait accélérer l'adoption par des équipes analytiques qui dépendent aujourd'hui d'ingénieurs pour formuler leurs requêtes. Le benchmark BIRD, qui évalue la robustesse des modèles sur des bases de données réelles et complexes, est devenu le baromètre de référence depuis 2023 pour comparer les approches text-to-SQL. La course à ce type de capacité s'inscrit dans une compétition plus large entre les grands laboratoires pour intégrer l'intelligence artificielle directement dans les flux de travail d'entreprise. Avec Gemini-SQL2, Google consolide sa position sur le segment des outils de productivité données, un marché où Microsoft, via Copilot for Azure, et les startups spécialisées comme Text2SQL.ai exercent également une pression croissante.

UELes entreprises européennes pourraient simplifier l'accès à leurs données analytiques en permettant à des profils non techniques d'interroger leurs bases sans écrire de SQL.

💬 80% sur BIRD sur des vraies bases de données complexes, c'est pas du benchmarking en chambre. Ce qui est intéressant c'est moins le score que l'intégration qui vient (BigQuery, Looker) : là, les équipes métier qui passaient leur vie à attendre un data engineer vont pouvoir requêter elles-mêmes. Reste à voir si ça tient quand les schémas sont vraiment sales, parce qu'en prod, c'est rarement aussi propre que dans les benchmarks.

LLMsActu
1 source
Hey Siri, voici l'IA
907Ben's Bites 

Hey Siri, voici l'IA

Apple a officiellement lancé Siri AI, son assistant d'intelligence artificielle nouvelle génération, présenté comme une réponse directe aux assistants conversationnels comme ChatGPT. Décrit par ses concepteurs comme l'équivalent d'un ChatGPT vieux d'environ un an, Siri AI intègre la dictée avancée, l'analyse d'images et une capacité d'interaction avec des applications tierces comme Messages et Maps. Le système repose sur une architecture hybride mêlant modèles locaux et modèles cloud, certains fournis par Google via Gemini, le tout regroupé sous la famille de modèles maison AFM 3. En parallèle, OpenAI a mis à jour le système de mémoire de ChatGPT avec une troisième itération baptisée Dreaming v3, qui améliore le rappel d'informations, respecte mieux les préférences à long terme de l'utilisateur et se corrige au fil du temps. Google, de son côté, a annoncé une refonte de NotebookLM : son interface de chat passe d'un système RAG classique à une architecture agentique baptisée Antigravity, dans laquelle chaque carnet dispose désormais d'un ordinateur cloud dédié capable d'exécuter du code pour analyser les fichiers uploadés, le tout propulsé par les derniers modèles Gemini 3.5. Ces annonces simultanées illustrent l'intensification de la course aux assistants IA dans le grand public. Pour Apple, l'enjeu est considérable : Siri, longtemps moqué pour ses lacunes face aux assistants concurrents, revient avec une architecture modernisée intégrant notamment des modèles Gemini, ce qui marque une rupture symbolique pour une entreprise habituellement centrée sur ses propres technologies. Côté Anthropic, une publication de blog affirme que les développeurs écrivent désormais huit fois plus de code grâce à Claude qu'ils ne le faisaient en 2025, une statistique qui redéfinirait radicalement la productivité dans le secteur logiciel si elle se confirme. L'entreprise révèle également que le code généré par Claude est utilisé pour entraîner les prochaines versions du modèle, une boucle d'amélioration continue qui accélère la progression des capacités. Cursor, l'éditeur de code augmenté par IA, a aussi franchi une étape avec Canvas, une fonctionnalité permettant de créer des applications internes, tableaux de bord et rapports partageables directement depuis l'outil. Cette séquence d'annonces intervient dans un contexte de consolidation rapide du marché. OpenAI a discrètement déposé un S-1 confidentiel auprès des autorités boursières américaines tout en affirmant ne pas être pressé d'entrer en bourse, et a défini trois priorités pour sa prochaine phase : construire un chercheur IA autonome, accélérer la croissance économique et offrir à chaque habitant de la planète un AGI personnel. Ces objectifs ambitieux coexistent avec une pression réglementaire croissante : Anthropic plaide pour la création d'un mécanisme permettant de suspendre le développement de l'IA si des risques l'exigeaient. Le marché des agents IA connaît par ailleurs une structuration accélérée, avec des acteurs comme Firecrawl qui proposent désormais des workflows installables pour automatiser des tâches web répétitives, signalant une industrialisation progressive de l'outillage agentique dans les entreprises.

UELes nouveaux assistants IA d'Apple (Siri AI avec Gemini intégré) et Google (NotebookLM agentique) seront déployés en Europe sous contrainte de l'AI Act et du RGPD, notamment pour le traitement cloud des données personnelles.

💬 Apple qui intègre Gemini dans Siri, c'est une capitulation symbolique habillée en "architecture hybride". Mais au moins ils ne mentent pas sur leur retard : "l'équivalent d'un ChatGPT vieux d'un an", c'est une com' étonnamment lucide pour eux. Reste à voir si l'intégration apps tierces tient hors démo.

Apple : le nouveau Siri est-il enfin meilleur que ChatGPT ?
908Le Big Data 

Apple : le nouveau Siri est-il enfin meilleur que ChatGPT ?

Apple a profité de la WWDC 2026 pour dévoiler Siri AI, une refonte complète de son assistant vocal disponible sur iPhone, Mac, iPad, Apple Watch et Vision Pro. Cette nouvelle version introduit des conversations plus naturelles, une compréhension du contexte personnel, la capacité d'analyser le contenu affiché à l'écran, une recherche web en temps réel, et surtout la possibilité d'enchaîner des actions dans plusieurs applications sans intervention manuelle. L'assistant peut désormais retrouver une réservation dans un ancien e-mail, identifier une photo précise ou extraire une adresse depuis une conversation iMessage, des capacités qui le rapprochent directement de ce que proposent ChatGPT, Gemini ou Claude depuis plusieurs années. L'atout distinctif de Siri AI réside dans son intégration native à l'écosystème Apple : là où ChatGPT fournit une réponse textuelle, Siri peut agir directement sur l'appareil, croiser des données entre applications et intervenir à partir de ce qui est visible à l'écran, sans que l'utilisateur ouvre une application dédiée. Cette fluidité opérationnelle représente un avantage réel pour les dizaines de millions d'utilisateurs Apple qui jonglent quotidiennement entre Mail, Messages, Photos et les apps tierces. Cependant, ChatGPT conserve une avance significative sur les tâches de raisonnement complexe et de génération de texte élaboré, domaines où OpenAI capitalise plusieurs années d'expérience avec ses grands modèles de langage. Apple en est visiblement conscient : l'annonce la plus révélatrice de la WWDC 2026 n'est pas Siri lui-même, mais le système baptisé "Extensions" qui permet à l'utilisateur de déléguer une question à ChatGPT, Gemini ou Claude lorsque Siri atteint ses limites. Cette ouverture à la concurrence peut se lire comme du pragmatisme, Apple offre une expérience unifiée sans forcer ses utilisateurs à choisir, mais elle ressemble aussi à un aveu de la part d'une entreprise qui a accumulé un retard considérable sur l'IA générative depuis 2022. Plutôt que d'affronter frontalement OpenAI, Google et Anthropic sur leur terrain, Apple repositionne Siri en hub d'accès à plusieurs intelligences artificielles, une stratégie qui mise sur la distribution et l'intégration matérielle plutôt que sur la puissance brute du modèle.

UELes dizaines de millions d'utilisateurs européens d'appareils Apple disposeront d'un assistant IA nativement intégré à leurs données personnelles, ce qui soulève des questions de conformité RGPD et AI Act sur l'agrégation cross-application et les transferts vers des serveurs américains.

💬 Ce qui m'a frappé à la WWDC, c'est pas Siri lui-même, c'est le système Extensions. Apple admet tranquillement qu'il n'a pas le meilleur modèle, et au lieu de se battre sur ce terrain, il devient la couche d'interface entre toi et ChatGPT ou Claude, en s'appuyant sur ce qu'il fait vraiment bien : l'intégration matérielle. Pas glorieux comme aveu, mais c'est probablement la stratégie la plus réaliste qu'Apple pouvait adopter en 2026.

OutilsOutil
1 source
Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents
909VentureBeat AI 

Le futuriste IA de Microsoft explique comment il utilise Copilot et les problèmes concrets que les entreprises résolvent avec des agents

Lors de sa conférence Build 2026, Microsoft a dévoilé cette semaine une série d'annonces destinées à ancrer les agents d'intelligence artificielle au cœur des systèmes d'entreprise. La firme a présenté Microsoft IQ, une couche contextuelle unifiée couvrant GitHub Copilot, Microsoft Foundry et Copilot Studio, ainsi que des API Work IQ dont le lancement est prévu le 16 juin. S'y ajoutent Fabric IQ pour les données métier structurées, Foundry IQ pour la récupération d'informations à travers les bases de connaissances d'entreprise et le web en temps réel, et Web IQ, un moteur de recherche conçu spécifiquement pour les agents. Microsoft a également introduit Scout, un assistant personnel de travail autonome, et annoncé sept nouveaux modèles maison regroupés sous la famille MAI, dont MAI-Thinking-1, optimisés pour l'efficience en tokens et la personnalisation sur données propriétaires. En parallèle, Claude Opus 4.8 d'Anthropic est désormais disponible sur Azure Foundry, aux côtés des modèles OpenAI GPT, témoignant d'une stratégie délibérée de choix multiple de modèles. Ces annonces marquent un tournant dans la façon dont Microsoft positionne son infrastructure IA : ce n'est plus l'accès à un modèle puissant qui fait la différence, mais la capacité à donner aux agents un contexte fiable, une identité, une mémoire et un accès sécurisé aux données d'entreprise. Pour les DSI et équipes techniques, cela se traduit concrètement par la possibilité de déployer des agents gérés dans Foundry, avec gestion automatique du dimensionnement et de la conteneurisation, sans avoir à construire cette infrastructure from scratch. L'enjeu est de taille : les entreprises qui parviennent à brancher leurs agents sur leurs données internes et leurs workflows existants pourront automatiser des processus complexes à grande échelle, là où les expériences pilotes restaient jusqu'ici cantonnées à des cas d'usage isolés. Marco Casalaina, VP Products Core AI et "AI Futurist" de Microsoft, est au cœur de cette stratégie. Ancien responsable de l'équipe Einstein AI chez Salesforce et diplômé en informatique de Cornell, il a rejoint Microsoft début 2022 pour prendre la tête des Azure Cognitive Services avant d'étendre son périmètre à l'ensemble des outils pour développeurs IA, incluant Foundry, VS Code, GitHub et GitHub Copilot. Son rôle de futuriste a une définition très concrète chez Microsoft : il est systématiquement le premier à tester chaque nouvelle fonctionnalité en provenance de toutes les équipes de la firme. Cette position d'observatoire lui permet de tracer ce qu'il appelle "le futur immédiat", c'est-à-dire l'horizon à douze mois des capacités agentiques. La compétition pour devenir la plateforme de référence des agents d'entreprise est désormais ouverte, avec Google et AWS comme principaux rivaux dans une course où le contexte, la gouvernance et l'intégration des données deviennent les véritables différenciateurs.

UELes entreprises européennes peuvent évaluer les API Work IQ sur Azure (lancement le 16 juin) et les modèles MAI pour l'automatisation de leurs workflows internes, avec des enjeux de souveraineté des données à considérer.

💬 Microsoft assume enfin que la guerre se joue sur la plomberie, pas sur les modèles. Donner aux agents un contexte fiable, une identité et un accès sécurisé aux données internes, c'est précisément ce qui bloquait les pilotes depuis deux ans. Et avoir Claude d'Anthropic sur Azure aux côtés d'OpenAI, c'est malin : un argument de neutralité que Google et AWS n'ont pas encore.

OutilsOutil
1 source
Anthropic : Claude rédige plus de 90 % de son code et plaide pour un bouton pause mondial de l'IA
910The Decoder 

Anthropic : Claude rédige plus de 90 % de son code et plaide pour un bouton pause mondial de l'IA

Anthropic a dévoilé des données internes montrant que Claude génère désormais plus de 80 % du code de production de l'entreprise, avec des ingénieurs qui expédient huit fois plus de lignes de code par jour qu'en 2024. Certaines métriques internes font état d'un chiffre dépassant 90 % selon les différentes équipes. Cette accélération illustre concrètement comment un système d'IA peut commencer à participer activement à son propre développement, franchissant un seuil que les chercheurs en sécurité considèrent comme critique. C'est précisément cette dynamique qui pousse Anthropic à réclamer un mécanisme de pause mondiale vérifiable du développement de l'IA de pointe. La société de San Francisco affirme qu'elle serait prête à suspendre ses propres travaux si les autres laboratoires de premier plan en faisaient autant de manière démontrable. L'enjeu est de taille : si l'IA atteint un niveau où elle améliore ses propres capacités de façon autonome, la vitesse de progression pourrait dépasser la capacité humaine à en évaluer les risques et à maintenir une supervision efficace. Cette position s'inscrit dans la tension fondatrice d'Anthropic, entreprise créée en 2021 par d'anciens membres d'OpenAI, qui se définit comme un acteur de « sécurité responsable » tout en restant pleinement engagée dans la course aux modèles toujours plus puissants. La proposition d'un bouton de pause global soulève des questions complexes sur sa faisabilité dans un secteur ultra-compétitif, où la coordination internationale entre laboratoires américains, européens et chinois reste largement théorique.

UEL'appel d'Anthropic à un mécanisme de pause mondiale vérifiable du développement de l'IA nourrit les débats sur la gouvernance internationale de l'IA, un enjeu central pour la mise en œuvre de l'AI Act européen.

💬 Claude génère 90 % du code qui fait tourner Claude. Ça mérite qu'on s'arrête là-dessus, parce que c'est le seuil précis que les chercheurs en sécurité pointaient depuis des années comme le moment où la supervision humaine devient difficile, et là c'est du concret, pas un scénario de papier. Le bouton pause mondial, l'intention est sérieuse, mais coordonner les labos américains, européens et chinois là-dessus, j'y crois pas trop, ça tient mieux dans les communiqués de presse.

SécuritéOpinion
1 source
Les workflows IA de Walmart face aux réalités du bilan financier
911AI News 

Les workflows IA de Walmart face aux réalités du bilan financier

Walmart a discrètement mis fin à l'accès illimité de ses 2,1 millions d'employés à Code Puppy, son assistant interne propulsé par un grand modèle de langage. Jusqu'ici encouragés à utiliser l'outil sans restriction pour des tâches comme l'analyse de feuilles de calcul, la création de présentations ou d'autres activités bureautiques automatisables, les salariés se voient désormais attribuer un quota fixe de tokens, l'unité de mesure qui détermine combien ils peuvent solliciter le modèle. Ce changement de politique, intervenu courant 2026, est une mesure de contrôle des coûts directement liée à la transition du secteur vers une facturation à l'usage, abandonnant le modèle d'abonnement à prix fixe qui offrait un accès quasi illimité à l'inférence LLM. Ce virage illustre une tension croissante au sein des grandes entreprises entre les gains de productivité annoncés et le coût réel pour les obtenir. À l'échelle de Walmart, même une utilisation modeste par employé génère des dépenses considérables, d'autant que certains comportements amplifient la facture : le phénomène dit du "token maxxing", encouragé jusqu'en avril dernier par un associé de Sequoia Capital dans le Wall Street Journal, a poussé des salariés à multiplier les requêtes complexes pour performer sur des tableaux de bord internes célébrant les meilleurs utilisateurs d'IA. Les modèles de raisonnement récursif ("thinking models"), plus coûteux car ils consomment davantage de tokens pour traiter les entrées de manière introspective, aggravent encore la note. Les workflows multi-agents, où des boucles itératives entre plusieurs agents sont relancées pour affiner un résultat, deviennent eux aussi mesurables en argent sonnant et trébuchant. Walmart n'est pas seul dans cette situation. Uber a révélé avoir consommé en quatre mois son budget IA prévu pour toute l'année 2026, signe que la nouvelle structure tarifaire des fournisseurs bouleverse les prévisions des entreprises utilisatrices. Anthropic et OpenAI ont déjà basculé leurs plans entreprise haut de gamme vers une facturation à l'usage, et Microsoft a commencé à facturer GitHub Copilot au 1er juin. En imposant des limites de tokens par employé, en publiant des guides sur le choix du bon outil selon la tâche, et en réservant les modèles frontière aux cas d'usage qui le justifient vraiment, Walmart cherche à poser les bases d'un vrai calcul de retour sur investissement, une étape que beaucoup d'entreprises ayant déployé l'IA à grande échelle n'ont pas encore franchie.

UELa bascule vers la facturation à l'usage d'Anthropic, OpenAI et Microsoft/GitHub Copilot (au 1er juin) s'applique également aux entreprises européennes, qui devront revoir leurs budgets IA et instaurer des politiques de gouvernance des tokens sous peine de dépassements comparables à ceux de Walmart et Uber.

💬 Le modèle "abonnement flat, ROI on verra plus tard" est mort. Walmart rationne ses 2 millions d'employés au token, Uber a cramé son budget annuel en quatre mois, et Microsoft facture Copilot au 1er juin, le tout en l'espace de quelques semaines. Les boîtes qui ont déployé large sans jamais faire le calcul vont avoir une conversation difficile cet été.

BusinessOpinion
1 source
Alibaba lance Qwen3.7-Plus : texte, vidéo et images pour 0,4 $/1,6 $ par million de tokens, mais en source fermée
912VentureBeat AI 

Alibaba lance Qwen3.7-Plus : texte, vidéo et images pour 0,4 $/1,6 $ par million de tokens, mais en source fermée

Alibaba a lancé cette semaine Qwen3.7-Plus, son dernier grand modèle de langage multimodal, capable de traiter simultanément du texte, des vidéos et des images. Le modèle est proposé à 0,40 dollar par million de tokens en entrée et 1,60 dollar en sortie, soit 60 % moins cher que son prédécesseur Qwen3.7-Max, sorti quelques semaines plus tôt mais limité au texte seul. Avec une fenêtre de contexte d'un million de tokens et jusqu'à 256 000 tokens dédiés au raisonnement interne, Qwen3.7-Plus cible explicitement les usages agentiques complexes, comme la migration de bases de code ou l'analyse automatisée de documents visuels. Le modèle intègre aussi un paramètre API baptisé "preservethinking", qui conserve les blocs de raisonnement internes entre les tours de conversation, évitant à l'agent de perdre le fil de sa logique au milieu d'une tâche longue. La rupture la plus notable n'est pas technique : Qwen3.7-Plus est distribué sous licence commerciale fermée, uniquement via l'API Alibaba Cloud et le service Qwen Chat. C'est un virage stratégique majeur pour un groupe qui avait construit sa réputation internationale sur la publication de modèles open source puissants, proches de l'état de l'art. Des entreprises comme Airbnb s'appuyaient justement sur ces modèles en accès libre. Pour les développeurs et organisations qui avaient intégré l'open source Qwen dans leurs infrastructures, ce changement de cap impose soit de migrer vers l'API payante d'Alibaba, soit de se tourner vers un concurrent. Sur le plan tarifaire, Qwen3.7-Plus reste compétitif face à des modèles comme MiniMax-M3 (0,30/1,20 dollar) ou Gemini 3.1 Flash-Lite de Google (0,25/1,50 dollar), mais il est dépassé en prix bas par DeepSeek-V4-Flash (0,14/0,28 dollar). Ce lancement s'inscrit dans une dynamique de consolidation des stratégies de monétisation chez les grands labos chinois. Après avoir inondé le marché de modèles open source pour gagner en adoption et en réputation, Alibaba suit une trajectoire similaire à celle d'OpenAI ou Anthropic : garder les modèles les plus capables derrière un accès payant. La fonctionnalité "preservethinking" avait déjà été introduite avec la génération Qwen 3.6, sur les modèles open weight Qwen3.6-27B et le Max propriétaire, signe que la stratégie de différenciation entre open et closed s'élabore depuis plusieurs mois. Avec la course aux modèles multimodaux et agentiques qui s'accélère, l'enjeu pour Alibaba est de ne pas perdre les développeurs séduits par l'ouverture, tout en capturant les revenus que seule une offre cloud fermée peut générer à grande échelle.

UELes développeurs et organisations européennes ayant intégré les modèles Qwen open source dans leurs infrastructures devront migrer vers l'API payante d'Alibaba Cloud ou se tourner vers des alternatives, représentant une contrainte opérationnelle et potentiellement financière concrète.

LLMsOpinion
1 source
Les modèles d'IA donnent souvent les bonnes réponses mais citent de mauvaises sources
913The Decoder 

Les modèles d'IA donnent souvent les bonnes réponses mais citent de mauvaises sources

Les grands modèles d'IA comme GPT d'OpenAI et Gemini de Google commettent régulièrement une erreur subtile mais préoccupante : lorsqu'ils analysent des documents, ils citent des passages qui ne soutiennent pas réellement leurs réponses. Des chercheurs de l'Université de Pékin ont formalisé ce phénomène sous le nom d'"hallucination d'attribution". Concrètement, le modèle peut fournir une réponse correcte tout en pointant vers une source incorrecte ou hors de propos. Pour mesurer ce problème de façon systématique, l'équipe a développé CiteVQA, le premier benchmark spécifiquement conçu pour évaluer la fiabilité des citations dans les réponses des modèles de langage. Ce défaut représente un risque sérieux dans les domaines réglementés comme le droit, la médecine ou la finance, où la traçabilité des sources n'est pas optionnelle mais légalement ou éthiquement requise. Un professionnel qui s'appuie sur une réponse d'IA et cite la source indiquée pourrait se retrouver à défendre une affirmation avec une référence qui ne la justifie pas. La distinction entre "avoir raison" et "citer correctement" est fondamentale : une réponse juste avec une mauvaise source est potentiellement aussi dangereuse qu'une réponse fausse. Ce problème s'inscrit dans un débat plus large sur la fiabilité des systèmes RAG (Retrieval-Augmented Generation), qui combinent recherche documentaire et génération de texte. Alors que les entreprises déploient massivement ces outils pour l'analyse de contrats, de dossiers médicaux ou de rapports financiers, la capacité à vérifier d'où provient une information devient critique. CiteVQA devrait servir de référence pour pousser les laboratoires à corriger ce biais dans leurs prochaines versions de modèles.

UELes secteurs réglementés européens (droit, médecine, finance) sont directement exposés : l'EU AI Act impose la traçabilité des systèmes IA à haut risque, et ce défaut de citation pourrait constituer une non-conformité lors des audits.

💬 C'est le bug silencieux des systèmes RAG : la réponse est bonne, mais la source pointe ailleurs. Dans les secteurs où un avocat ou un médecin doit tracer chaque information, ça ne passe pas à l'audit. CiteVQA arrive au bon moment, reste à voir si les labs vont vraiment corriger ça ou juste l'intégrer dans leurs benchmarks de comm.

RecherchePaper
1 source
Google I/O illustre comment la science pilotée par l'IA change de trajectoire
914MIT Technology Review 

Google I/O illustre comment la science pilotée par l'IA change de trajectoire

Lors du keynote Google I/O de mardi, Demis Hassabis, PDG de Google DeepMind, a déclaré que nous nous trouvons actuellement "au pied des collines de la singularité". Le moment fort de son intervention était une vidéo montrant comment WeatherNext, le logiciel de prévision météorologique de Google, avait fourni une alerte précoce sur l'atterrissage catastrophique de l'ouragan Melissa en Jamaïque l'an dernier, sauvant potentiellement des vies. La même semaine, OpenAI annonçait que l'un de ses modèles avait réfuté une conjecture mathématique importante, ce que certains mathématiciens considèrent comme la contribution la plus significative de l'IA générative aux mathématiques à ce jour. En parallèle, Isomorphic Labs, filiale de Google utilisant AlphaFold pour développer de nouveaux médicaments, levait 2 milliards de dollars en Série B. Ces annonces illustrent une tension croissante au coeur de l'IA scientifique : d'un côté, des outils spécialisés et entraînés pour résoudre des problèmes précis, comme WeatherNext ou AlphaFold (qui a valu le prix Nobel à des chercheurs de DeepMind et dont les prédictions de structures de protéines sont utilisées par plus de trois millions de chercheurs dans le monde) ; de l'autre, des systèmes agentiques basés sur des LLM, capables de mener des projets de recherche de pointe avec une supervision humaine minimale, voire nulle. Cette deuxième vision alimente aujourd'hui une grande part de l'enthousiasme autour de l'IA, notamment autour de l'idée d'une amélioration récursive, où les systèmes d'IA deviendraient les principaux moteurs de leur propre progression. Pushmeet Kohli, chef scientifique de Google Cloud, l'a formulé cette semaine dans la revue Daedalus : "Nous nous dirigeons vers une IA qui ne se contente plus de faciliter la science, mais qui commence à faire de la science." Des signes concrets de réorientation des ressources humaines et budgétaires chez Google confirment cette tendance. Le Los Angeles Times a révélé le mois dernier que John Jumper, le chercheur Google Fellow et co-lauréat du Nobel pour AlphaFold, travaille désormais sur l'IA appliquée au code et non plus sur des outils scientifiques spécialisés. Ce pivot n'est pas anodin : Google subit actuellement une pression concurrentielle de la part d'Anthropic et OpenAI sur le terrain des outils de développement logiciel, et les capacités de codage sont précisément ce qui conditionne le succès des systèmes agentiques de recherche. Si Google ne semble pas abandonner ses outils spécialisés, avec AlphaGenome et AlphaEarth Foundations sortis l'été dernier et une nouvelle version de WeatherNext en novembre, la direction stratégique s'oriente clairement vers une IA capable de faire de la science de manière autonome, un virage qui pourrait redéfinir en profondeur le rôle des chercheurs humains.

UELa réorientation stratégique de Google DeepMind vers une IA autonome capable de faire de la science pourrait fragiliser les laboratoires publics européens qui dépendent d'outils spécialisés comme AlphaFold, utilisé par plus de trois millions de chercheurs dans le monde dont une large part en Europe.

💬 Le vrai signal, c'est pas la vidéo de l'ouragan, c'est John Jumper qui bosse maintenant sur des outils de code. Quand tu déplaces un co-lauréat du Nobel de la recherche spécialisée vers le terrain où Anthropic et OpenAI te talonnent, tu dis quelque chose sur où est la vraie pression en ce moment. Reste à voir si les trois millions de chercheurs qui utilisent AlphaFold au quotidien vont se retrouver avec des outils en pilotage automatique, ou juste moins maintenus.

RecherchePaper
1 source
Alors que Grok peine, SpaceX mise sur la victoire face aux géants de la tech en IA
915Ars Technica AI 

Alors que Grok peine, SpaceX mise sur la victoire face aux géants de la tech en IA

SpaceX a déposé un document S-1 en vue d'une introduction en bourse anticipée, révélant une stratégie d'entreprise qui place désormais l'intelligence artificielle au coeur de son modèle économique. La société a formellement intégré xAI, la startup d'IA d'Elon Musk, en début d'année 2026, donnant naissance à la division SpaceXAI qui chapeaute les modèles Grok et le chatbot associé, auparavant développés de façon indépendante. Dans ce prospectus, SpaceX revendique posséder "le plus grand marché adressable actionnable de l'histoire humaine", estimant l'opportunité liée à l'IA à 26 500 milliards de dollars, une somme qui approche le PIB nominal des États-Unis, établi à près de 32 000 milliards de dollars au premier trimestre 2026. Le lancement de satellites et les missions spatiales, activités historiques de l'entreprise, y sont désormais présentés comme des activités de soutien à ce nouveau coeur de métier. Ce repositionnement stratégique intervient dans un contexte difficile pour Grok, qui peine à s'imposer face à des concurrents solidement établis. Les clients d'entreprise et les développeurs se tournent massivement vers OpenAI et Anthropic, dont les modèles bénéficient d'une adoption bien plus large et d'écosystèmes matures. Pour SpaceX, transformer une IPO en succès dépend donc en grande partie de la capacité de sa division IA à convaincre un marché qui n'a pas spontanément choisi Grok. L'enjeu financier est considérable : si les projections se révèlent même partiellement fondées, la valorisation attendue pourrait dépasser celle de nombreuses entreprises technologiques cotées. La fusion de xAI dans SpaceX illustre la concentration croissante des paris d'Elon Musk autour d'une seule entité, après des années de gestion parallèle de Tesla, SpaceX, xAI et X. L'absorption de xAI permet à SpaceX de mutualiser les données issues de ses infrastructures spatiales, notamment Starlink avec ses millions d'abonnés, pour alimenter des systèmes d'IA propriétaires. La course aux données et à la puissance de calcul constitue le véritable front concurrentiel, et SpaceX mise sur son infrastructure physique unique pour se différencier d'acteurs comme Google, Microsoft ou Amazon, qui dominent aujourd'hui le marché des services d'IA en entreprise.

UEL'essor d'un nouvel acteur majeur dans l'IA générative pourrait accentuer la dépendance des entreprises européennes aux plateformes américaines et fragiliser les efforts de souveraineté numérique portés par l'UE.

💬 Le chiffre de 26 500 milliards, c'est du prospectus pur (il faut bien justifier la valorisation). Ce qui m'intéresse vraiment, c'est Starlink : des millions d'abonnés, une infrastructure physique mondiale qu'OpenAI ne pourra jamais racheter. Reste à voir si ça suffit à convaincre les devs, parce que si tu regardes les forums en ce moment, le choix par défaut c'est toujours pas Grok.

BusinessOpinion
1 source
Qwen3.7 Max : l’IA d’Alibaba écrase ses anciens scores sur les benchmarks IA
916Le Big Data 

Qwen3.7 Max : l’IA d’Alibaba écrase ses anciens scores sur les benchmarks IA

Alibaba a dévoilé le 21 mai 2026 son nouveau modèle de langage Qwen3.7 Max, qui affiche un score de 56,6 sur l'Artificial Analysis Intelligence Index, soit 4,8 points de plus que son prédécesseur Qwen3.6 Max Preview (51,8). Le bond le plus notable concerne le codage agentique et le raisonnement scientifique, avec des progressions significatives sur des benchmarks spécialisés comme Humanity's Last Exam et TerminalBench Hard. La fenêtre de contexte du modèle passe également de 256 000 à un million de tokens, ce qui lui permet de traiter des volumes d'information sans précédent dans une seule session. Alibaba met aussi en avant une réduction mesurable du taux d'hallucinations : le modèle préfère ne pas répondre plutôt que d'inventer une information incertaine, une stratégie rendue possible par un investissement massif dans les techniques de reinforcement learning. Ces avancées ont des conséquences directes pour les développeurs et les entreprises qui utilisent l'IA dans leurs workflows. Une fenêtre d'un million de tokens change concrètement ce qu'il est possible de faire : analyser des bases de code entières, traiter de longs documents juridiques ou financiers, ou enchaîner des raisonnements complexes sur plusieurs étapes sans perdre de contexte. La réduction des hallucinations est un argument commercial fort dans les secteurs où la fiabilité est critique, comme le droit, la finance ou la médecine. Sur ces critères précis, Qwen3.7 Max commence à se positionner comme une alternative sérieuse aux offres d'OpenAI, Anthropic et Google, même si le modèle reste encore derrière les meilleurs modèles américains sur les classements globaux. Longtemps perçu comme un outsider dans la course aux grands modèles de langage, Alibaba s'impose progressivement comme un acteur de premier plan. La série Qwen incarne cette stratégie de rattrapage accéléré : chaque nouvelle version réduit l'écart avec la frontière technologique définie par GPT-4o, Claude ou Gemini. Le contexte géopolitique autour des semi-conducteurs et des restrictions américaines à l'export de puces avancées rend ces progrès d'autant plus remarquables. En parallèle, d'autres laboratoires chinois comme DeepSeek et Baidu intensifient eux aussi leurs efforts, créant une dynamique de compétition interne qui pousse l'ensemble de l'écosystème vers le haut. La prochaine étape pour Alibaba sera probablement l'intégration de capacités multimodales avancées, absentes de Qwen3.7 Max, pour rivaliser pleinement avec les modèles américains qui traitent déjà texte, image et vidéo dans un même système.

UELes entreprises et développeurs européens disposent d'une nouvelle alternative compétitive aux modèles américains, notamment pour des usages exigeant de longues fenêtres de contexte ou une haute fiabilité dans des secteurs réglementés comme le droit ou la finance.

💬 Un million de tokens de contexte, c'est pas du marketing, ça change vraiment ce qu'on peut faire : analyser une base de code entière, ou garder le fil sur un raisonnement long sans tout reperdre au milieu. La réduction des hallucinations via reinforcement learning, c'est le pari technique qui mérite qu'on y regarde sérieusement, surtout dans des secteurs où inventer une réponse coûte cher. Qwen est encore derrière sur les classements globaux, mais l'écart se resserre à une vitesse qui devrait mettre un peu de pression sur les labos américains.

LLMsOpinion
1 source
Mistral AI se renforce dans l’industrie européenne avec le rachat de Emmi AI
917Le Big Data 

Mistral AI se renforce dans l’industrie européenne avec le rachat de Emmi AI

Mistral AI a annoncé l'acquisition d'Emmi AI, une startup autrichienne fondée à Linz et spécialisée dans la modélisation de phénomènes physiques complexes, flux d'air, transfert thermique, contraintes mécaniques sur les matériaux. Le montant de la transaction n'a pas été divulgué, mais l'opération est considérée comme l'une des plus significatives de l'écosystème européen de l'IA cette année. Emmi AI avait levé 15 millions d'euros en 2025, la plus importante levée de fonds jamais réalisée en Autriche dans le secteur de l'intelligence artificielle. Ses équipes, réparties entre l'Autriche, l'Allemagne et la Lituanie, rejoignent désormais Mistral. La société française prévoit d'ouvrir un bureau officiel à Linz, qui s'ajoutera à ses hubs existants à Paris, Londres et Munich. Cette acquisition donne à Mistral AI une capacité inédite en Physics AI, des modèles capables de comprendre et simuler le comportement du monde physique en temps réel. Pour les industriels des secteurs des semi-conducteurs, de l'automobile ou de l'aérospatiale, cela ouvre la voie à des jumeaux numériques plus précis, à des simulations accélérées et à une réduction significative des coûts de R&D. Mistral dispose déjà de modèles analysant les lignes de production pour détecter des défauts ou piloter des bras robotisés ; l'intégration des technologies d'Emmi doit rendre ces systèmes plus fiables dans leurs interactions avec des environnements physiques contraignants. L'enjeu est aussi de proposer aux industriels européens une alternative souveraine aux plateformes américaines, dont la dépendance est de plus en plus perçue comme un risque stratégique. Le rachat s'inscrit dans un contexte de montée en puissance de l'IA industrielle comme priorité politique en Europe. La Commission européenne considère le secteur manufacturier comme un pilier de sa stratégie d'autonomie technologique, et plusieurs États membres accélèrent leurs investissements dans ce domaine. Mistral AI, valorisé à plusieurs milliards d'euros après ses dernières levées de fonds, consolide ainsi son positionnement face aux géants américains comme Google, Microsoft ou OpenAI, qui investissent massivement dans les mêmes usages verticaux. En s'ancrant davantage en Europe centrale avec des engagements en Autriche, en Allemagne et en Lituanie, le groupe français envoie un signal clair : la compétition pour l'IA industrielle se jouera aussi sur la capacité à retenir les talents et à construire des infrastructures de recherche hors des États-Unis.

UEL'acquisition d'Emmi AI par Mistral AI renforce la souveraineté technologique européenne dans l'IA industrielle, avec l'ouverture d'un bureau à Linz et l'intégration d'équipes autrichiennes, allemandes et lituaniennes au sein d'un champion français.

💬 Mistral qui bascule dans la simulation physique, c'est un vrai pari industriel, pas juste du repositionnement marketing. Modéliser des flux d'air ou des contraintes thermiques en temps réel, ça vaut des millions d'euros de tests physiques évités pour un constructeur auto ou un fabricant de semi-conducteurs. L'intégration va être compliquée, mais si ça marche, c'est un avantage que ni OpenAI ni Google n'ont encore vraiment.

BusinessOpinion
1 source
La Maison Blanche informe les entreprises d'IA de son projet d'évaluation des modèles avant leur sortie
918The Information AI 

La Maison Blanche informe les entreprises d'IA de son projet d'évaluation des modèles avant leur sortie

Le Bureau du directeur national de la cybersécurité de la Maison Blanche a réuni mardi des représentants d'OpenAI, Anthropic et Reflection AI, ainsi que des acteurs des secteurs du cloud, des semi-conducteurs, de la cybersécurité et de la finance, pour les informer d'un futur décret présidentiel sur l'intelligence artificielle. Selon plusieurs sources proches du dossier, Donald Trump pourrait signer ce texte dès jeudi. L'ordre exécutif vise à permettre aux agences de renseignement et à d'autres services gouvernementaux d'examiner les modèles d'IA avancés avant leur mise sur le marché, dans le cadre d'un dispositif décrit comme volontaire. Concrètement, les laboratoires développant des modèles dits « frontier » seraient invités à les soumettre au gouvernement jusqu'à 90 jours avant leur sortie publique. Ce mécanisme de prénotification représente un tournant dans la relation entre Washington et l'industrie de l'IA. En s'accordant un droit de regard anticipé sur les systèmes les plus puissants, le gouvernement américain se dote d'un levier inédit pour évaluer les risques potentiels, qu'ils soient sécuritaires, économiques ou stratégiques, avant que ces modèles ne soient accessibles au grand public. La nature volontaire du cadre laisse toutefois ouverte la question de son application réelle : sans contrainte juridique explicite, son efficacité dépendra largement de la coopération des entreprises. Ce projet s'inscrit dans une dynamique plus large de reprise en main politique de l'IA par l'administration Trump, après la révocation en janvier 2025 du décret Biden qui imposait des exigences de sécurité aux développeurs de grands modèles. Si la nouvelle approche se veut moins contraignante sur le fond, elle marque néanmoins une volonté de maintenir une supervision gouvernementale sur une technologie jugée stratégique. La présence de banques et d'entreprises de cybersécurité à ce briefing souligne que l'enjeu dépasse le seul secteur tech et concerne désormais l'ensemble de l'économie numérique américaine.

UELa mise en place d'un cadre américain de pré-évaluation des modèles frontier pourrait influencer les débats européens sur la supervision de l'IA, mais n'a pas d'effet juridique direct sur la France ou l'Union européenne.

💬 90 jours de prénotification, sur la base du volontariat : c'est exactement le genre de cadre qui ressemble à une avancée mais qui tient à la bonne volonté des labos. OpenAI et Anthropic vont jouer le jeu, les autres feront ce qu'ils veulent. Ce qui m'intéresse, c'est la présence des banques dans le briefing, ça dit quelque chose sur ce que Washington anticipe vraiment comme risques.

RégulationReglementation
1 source
Les coûts d'Anthropic augmentent : les entreprises poussent leurs fournisseurs à raccourcir les contrats
919The Information AI 

Les coûts d'Anthropic augmentent : les entreprises poussent leurs fournisseurs à raccourcir les contrats

Les entreprises augmentent significativement leurs dépenses auprès d'Anthropic et d'autres fournisseurs d'IA, et ce budget supplémentaire doit bien venir de quelque part. La cible naturelle : les contrats logiciels traditionnels. Selon des dirigeants et des consultants, de nombreuses organisations ne renoncent pas encore à leurs applications d'entreprise, mais elles se positionnent pour le faire si l'IA venait à rendre ces outils moins indispensables. Concrètement, elles exigent des contrats plus courts et des conditions plus favorables auprès de leurs éditeurs SaaS historiques. Ce changement de rapport de force représente une menace sérieuse pour les grands éditeurs de logiciels d'entreprise comme Salesforce, SAP ou ServiceNow. Des contrats pluriannuels de trois à cinq ans, autrefois la norme, sont désormais contestés. Les entreprises clientes gagnent en flexibilité pour pivoter vers des solutions IA si celles-ci se révèlent capables de remplacer des fonctions entières -- CRM, gestion des workflows, support client -- à moindre coût. Cette pression s'inscrit dans un contexte de réallocation massive des budgets technologiques vers l'IA générative. Les dépenses en modèles de fondation comme Claude d'Anthropic ou GPT d'OpenAI explosent, tandis que les directions financières cherchent à compenser ces investissements en réduisant les coûts fixes. Le secteur du SaaS, qui avait bénéficié d'une décennie de croissance quasi garantie grâce aux renouvellements automatiques, entre dans une phase d'incertitude structurelle dont l'issue dépendra largement de sa capacité à intégrer l'IA dans ses propres offres.

UELes éditeurs européens comme SAP sont directement exposés à la pression des entreprises clientes qui raccourcissent leurs cycles de contrats pour conserver la flexibilité de migrer vers des solutions d'IA générative.

💬 Les boîtes n'ont pas encore quitté Salesforce. Mais elles exigent des contrats d'un an au lieu de cinq, histoire de garder une porte de sortie si l'IA finit par faire le boulot du CRM ou du support client à moindre coût. C'est ça, le vrai truc ici : l'IA comme levier de négociation avant même d'être un remplacement.

BusinessOpinion
1 source
Gemini 3.5 Flash veut réduire les coûts IA des entreprises
920Le Big Data 

Gemini 3.5 Flash veut réduire les coûts IA des entreprises

Google a lancé Gemini 3.5 Flash lors de sa conférence I/O 2026, le 19 mai 2026, en le positionnant comme son modèle propriétaire le plus économique à ce jour. Le tarif annoncé est de 1,50 dollar par million de jetons, une réduction significative pensée pour les entreprises qui déploient des agents IA à grande échelle. En parallèle, Google a dévoilé plusieurs nouveaux produits : Gemini Spark, un agent personnel capable d'agir en arrière-plan dans Gmail, Docs, Sheets et Slides pour compiler des informations, organiser des événements ou mettre à jour des tableaux en temps réel ; Omni Flash ; et AntiGravity 2.0, une nouvelle version de sa plateforme multi-agents. Sundar Pichai, PDG de Google, a déclaré que certaines organisations ont déjà consommé leur budget annuel de jetons alors que l'année est à peine entamée, soulignant l'urgence du problème. L'enjeu est directement financier pour les directions IT. À mesure que les agents IA s'intègrent dans les outils métiers, les volumes de jetons consommés explosent et les coûts dépassent les budgets prévus. Gemini 3.5 Flash cible précisément ces usages quotidiens à grande échelle, là où des économies de quelques centimes par million de jetons peuvent représenter des millions de dollars pour un grand groupe. L'intégration native avec Google Workspace est présentée comme un levier supplémentaire : en limitant le recours aux API externes, elle réduit mécaniquement la facture. Le modèle économique devient ainsi aussi déterminant que les performances techniques, notamment pour convaincre les entreprises de franchir le pas de l'industrialisation de l'IA au-delà des preuves de concept. Cette offensive tarifaire de Google s'inscrit dans une dynamique de marché plus large. Anthropic a récemment baissé les tarifs de Claude Opus 4.6, et la montée en puissance des modèles open source comme Qwen d'Alibaba accentue la pression sur les grands acteurs. Les performances des modèles propriétaires commençant à converger, le prix s'impose comme un facteur différenciant majeur pour fidéliser les clients entreprises. Google cherche ainsi à tenir tête à OpenAI et Anthropic sur le segment de l'IA agentielle, un marché où la viabilité économique conditionne désormais l'adoption massive. La prochaine étape sera de voir si cette baisse tarifaire suffit à convaincre les grandes organisations de standardiser leurs workflows autour de l'écosystème Google, ou si la concurrence répondra rapidement avec des ajustements similaires.

UELes entreprises européennes déployant des agents IA à grande échelle sur Google Workspace pourraient réduire significativement leurs coûts de jetons grâce à ce nouveau tarif.

LLMsOpinion
1 source
Les coulisses du procès Musk contre Altman
921MIT Technology Review 

Les coulisses du procès Musk contre Altman

Elon Musk a perdu son procès contre OpenAI le 19 mai 2026. Le milliardaire accusait Sam Altman, PDG d'OpenAI, et Greg Brockman, président de l'organisation, de l'avoir trompé sur la vocation à but non lucratif de la société qu'ils avaient cofondée ensemble en 2015. Musk réclamait notamment que la transformation d'OpenAI en entité commerciale soit annulée ou compensée. Après trois semaines d'audience, le jury a tranché en faveur d'OpenAI, rejetant l'ensemble des griefs formulés par le plaignant. Le verdict a des implications directes pour l'avenir de l'intelligence artificielle et la structure des grandes organisations du secteur. En échouant à démontrer qu'il avait été lésé lors de la conversion progressive d'OpenAI vers un modèle lucratif, Musk voit s'éloigner toute possibilité de bloquer juridiquement la montée en puissance de son principal concurrent dans la course à l'IA générale. Le procès a également mis en lumière des tensions personnelles profondes : Shivon Zilis, proche de Musk, a témoigné que ce dernier avait tenté de débaucher Sam Altman pour le faire rejoindre ses propres projets. Par ailleurs, Musk a lui-même reconnu à la barre que xAI, sa propre entreprise d'IA, utilise des techniques de distillation à partir des modèles d'OpenAI, une admission embarrassante qui a affaibli sa crédibilité morale dans le dossier. Ce procès s'inscrit dans une rivalité qui dure depuis le départ fracassant de Musk du conseil d'administration d'OpenAI en 2018, officiellement pour éviter un conflit d'intérêts avec Tesla, mais que beaucoup d'observateurs attribuent à des désaccords stratégiques et personnels avec Altman. Depuis, Musk a fondé xAI et lancé Grok, positionnés directement contre GPT-4 et ses successeurs. La défaite judiciaire ne clôt pas la rivalité mais la recentre sur le terrain commercial et technologique, où les deux hommes continueront à se disputer talent, données et influence sur la définition même de ce que doit être l'intelligence artificielle.

UELe verdict consolide la trajectoire commerciale d'OpenAI sans contrainte juridique, renforçant la position dominante d'un acteur dont les services sont massivement adoptés par les entreprises et développeurs européens.

RégulationReglementation
1 source
Les agents Claude peuvent désormais se connecter aux API d'entreprise sans exposer leurs identifiants
922VentureBeat AI 

Les agents Claude peuvent désormais se connecter aux API d'entreprise sans exposer leurs identifiants

Anthropic vient d'annoncer deux nouvelles fonctionnalités pour Claude Managed Agents qui s'attaquent directement au principal frein à l'adoption des agents IA en entreprise : la sécurité des identifiants d'accès. La première, les sandboxes auto-hébergées, permet aux équipes d'exécuter les appels d'outils au sein de leur propre infrastructure, et est disponible dès maintenant en bêta publique. La seconde, les tunnels MCP, connecte les agents à des serveurs MCP privés sans que les identifiants ne transitent par le contexte de l'agent ; elle est pour l'instant en préversion de recherche. Cette architecture divise le système en deux parties distinctes : la boucle agentique (orchestration, gestion du contexte, récupération sur erreur) s'exécute sur l'infrastructure d'Anthropic, tandis que l'exécution des outils reste dans le périmètre de l'entreprise. Les tunnels MCP, eux, fonctionnent via une passerelle légère en sortie uniquement, installée dans le réseau de l'organisation, sans qu'aucun identifiant ne passe par l'agent. Ce changement architectural répond à un problème de fond dans les déploiements actuels : dans la plupart des systèmes en production, l'agent transporte lui-même les jetons d'authentification lors de l'exécution des appels d'outils. Un agent compromis ou mal configuré emporte donc avec lui tout ce dont il a besoin pour causer des dégâts sur les systèmes internes. En déplaçant le contrôle des identifiants vers la frontière réseau plutôt que de les laisser à l'intérieur de l'agent, Anthropic modifie substantiellement le modèle de menace. Pour les équipes d'orchestration, l'enjeu dépasse la sécurité : cette séparation permet de cartographier plus précisément les flux de travail des agents, de mieux contrôler les ressources de calcul et d'isoler les responsabilités entre la plateforme et l'infrastructure métier. Anthropic n'est pas seul sur ce terrain. OpenAI avait déjà ajouté l'exécution locale à son Agents SDK en avril 2025, en réponse à des demandes similaires de ses clients entreprise. La distinction que revendique Anthropic réside précisément dans cette séparation franche entre boucle agentique et exécution des outils, que les approches sandbox existantes, y compris celle d'OpenAI, ne font pas. Le protocole MCP, adopté rapidement en environnement de production, a en effet précédé la maturité des architectures de sécurité qui l'entourent, créant un écart que ces nouvelles fonctionnalités cherchent à combler. Pour les équipes qui évaluent la plateforme, la recommandation pratique est claire : commencer par migrer l'exécution des outils vers les sandboxes auto-hébergées et valider cette frontière avant d'explorer les tunnels MCP, encore en phase expérimentale.

UELes entreprises européennes déployant des agents Claude peuvent désormais conserver leurs identifiants d'accès dans leur propre périmètre réseau, facilitant la conformité GDPR lors des déploiements d'agents IA en production.

OutilsOpinion
1 source
Google affirme que Gemini 3.5 Flash peut réduire les coûts IA des entreprises de plus d'un milliard de dollars par an
923VentureBeat AI 

Google affirme que Gemini 3.5 Flash peut réduire les coûts IA des entreprises de plus d'un milliard de dollars par an

Google a présenté mardi Gemini 3.5 Flash lors de sa conférence annuelle I/O, un nouveau modèle d'intelligence artificielle qui revendique une rupture avec l'un des compromis les plus tenaces du secteur : la capacité et la vitesse ne seraient plus antinomiques. Selon Sundar Pichai, PDG de Google, les entreprises traitant environ mille milliards de tokens par jour sur Google Cloud pourraient économiser plus d'un milliard de dollars par an en basculant 80 % de leurs charges de travail vers Flash et d'autres modèles frontier. Sur les benchmarks standards, Gemini 3.5 Flash dépasse Gemini 3.1 Pro, qui était encore positionné comme le modèle phare de l'entreprise il y a quatre à cinq mois : 76,2 % sur Terminal-Bench 2.1, 1656 Elo sur GDPval-AA, 83,6 % sur MCP Atlas et 84,2 % sur CharXiv Reasoning. Il génère des tokens quatre fois plus vite que les modèles frontier concurrents comparables, voire douze fois plus vite dans sa version optimisée disponible dès maintenant sur Antigravity, la plateforme de développement agentique de Google. Koray Kavukcuoglu, directeur technique de Google DeepMind, confirme : « Nous avons développé une version encore plus optimisée de Flash, non pas quatre fois, mais douze fois plus rapide, à qualité égale. » L'enjeu est considérable pour les entreprises qui ont massivement investi dans l'IA générative. Depuis trois ans, les DSI sont contraints de jongler entre des modèles puissants mais lents et coûteux pour les tâches complexes, et des modèles légers mais moins fiables pour les requêtes simples. Ce pilotage en portefeuille génère une ingénierie coûteuse, des expériences utilisateur inégales et, surtout, des budgets tokens qui s'épuisent à toute vitesse. Pichai l'a formulé sans détour lors d'un briefing presse lundi : « Vous avez probablement entendu des DSI dire que leurs entreprises ont déjà dépassé leur budget annuel de tokens, et on est seulement en mai. » Flash, à environ un tiers à la moitié du coût des modèles frontier actuels tout en atteignant selon Google 90 % de leurs performances, rendrait ce compromis obsolète pour la majorité des cas d'usage. Cette annonce s'inscrit dans une bataille d'efficience qui s'est intensifiée depuis que les entreprises ont commencé à déployer des agents IA en production à grande échelle. La course ne porte plus seulement sur l'intelligence brute des modèles, mais sur leur coût d'exploitation réel. Google fait face à une pression croissante d'Anthropic, d'OpenAI et de Meta, qui ont tous lancé des modèles intermédiaires visant le même créneau. Avec Flash, Google revendique la position unique de modèle occupant le quadrant supérieur droit de l'index intelligence/vitesse d'Artificial Analysis, sans concurrent direct à date. La disponibilité immédiate du modèle turbo dans Antigravity suggère que Google mise sur les workflows agentiques comme terrain de différenciation durable face à ses rivaux.

UELes entreprises européennes sur Google Cloud peuvent réduire significativement leurs budgets tokens en adoptant Flash pour leurs charges de travail agentiques, sans attendre de réglementation spécifique UE.

LLMsOpinion
1 source
Face aux États-Unis et à la Chine, MISTRAL cherche son propre modèle d’IA et fait l’acquisition d’Emmi AI
924FrenchWeb 

Face aux États-Unis et à la Chine, MISTRAL cherche son propre modèle d’IA et fait l’acquisition d’Emmi AI

Mistral AI, la startup parisienne fondée en 2023 et valorisée plus de six milliards d'euros, annonce l'acquisition d'Emmi AI, une société spécialisée dans les agents conversationnels d'entreprise. Cette opération s'inscrit dans une stratégie de diversification accélérée : plutôt que de se limiter à l'entraînement de modèles fondationnels, Mistral cherche à construire une offre verticalement intégrée, allant du modèle de base jusqu'aux applications déployées chez les clients. Les détails financiers de l'acquisition n'ont pas été rendus publics. L'enjeu est de taille pour l'écosystème européen. Les entreprises du continent restent largement dépendantes des hyperscalers américains (AWS, Azure, Google Cloud) pour leurs infrastructures, des GPU NVIDIA pour le calcul, et des modèles d'OpenAI, Anthropic ou Google pour l'inférence. En absorbant Emmi AI, Mistral tente de proposer une alternative souveraine complète aux directions informatiques européennes soucieuses de leur autonomie stratégique et de conformité réglementaire, notamment au regard de l'AI Act européen entré en vigueur en 2024. Ce rachat intervient alors que la compétition internationale s'intensifie sur deux fronts simultanés : les États-Unis maintiennent leur avance sur les modèles de pointe, tandis que la Chine rattrape son retard à marche forcée avec des architectures intégrées comme celles de Huawei ou Baidu. Pour Mistral, qui a levé 1,1 milliard de dollars en 2024 avec des investisseurs comme Andreessen Horowitz et la Banque publique d'investissement, l'heure est au passage à l'échelle commerciale, pas seulement technologique.

UEL'acquisition d'Emmi AI par Mistral AI renforce l'offre souveraine européenne en agents IA d'entreprise, donnant aux DSI françaises et européennes une alternative intégrée aux solutions américaines, dans un contexte de conformité à l'AI Act.

💬 Mistral fait le pari qu'un modèle de base, ça ne suffit plus. Racheter Emmi AI, c'est aller chercher le client là où il est, dans ses workflows d'entreprise, plutôt que d'attendre qu'il vienne lui-même sur une API. Reste à voir si une startup, même avec un milliard en caisse, peut tenir tête aux hyperscalers sur leur propre terrain.

BusinessOpinion
1 source
Les utilisateurs quittent-ils ChatGPT ? Ce que révèlent les chiffres
925Le Big Data 

Les utilisateurs quittent-ils ChatGPT ? Ce que révèlent les chiffres

Selon un rapport annuel de Similarweb publié en avril 2026, ChatGPT a perdu 20 points de part de marché en douze mois, passant de 77,43 % à 57 % du trafic généré par les outils d'intelligence artificielle générative. Dans le même temps, Gemini de Google a franchi la barre des 25 % d'audience, quadruplant quasiment son score en un an grâce à une intégration agressive dans l'écosystème Google, Gmail, Android, Chrome. Claude, le modèle d'Anthropic, a lui presque triplé sa part, atteignant 6,02 % contre 1,40 % un an plus tôt, avec une accélération particulièrement marquée sur les derniers mois. Des acteurs plus spécialisés comme DeepSeek et Perplexity restent sous la barre des 4 %, mais contribuent eux aussi à l'érosion du leadership d'OpenAI. Grok de xAI recule, et Microsoft Copilot peine à maintenir sa position. Ce rééquilibrage du marché signale la fin du monopole de fait qu'OpenAI exerçait depuis le lancement grand public de ChatGPT fin 2022. Les utilisateurs, plus matures et mieux informés, multiplient désormais les outils selon leurs besoins : Claude pour la qualité rédactionnelle et la nuance, Gemini pour son intégration native dans les services Google, Perplexity pour la recherche documentée. Cette diversification des usages complique la fidélisation pour OpenAI, dont la croissance en volume reste réelle mais dont la dynamique ralentit sensiblement. Pour les entreprises qui ont misé sur un seul fournisseur d'IA, le signal est clair : le marché devient multi-modèles, et les stratégies d'intégration pèsent autant que la performance brute des systèmes. Ce glissement s'inscrit dans une compétition qui s'est considérablement intensifiée depuis 2025. Google, longtemps critiqué pour une réponse tardive à l'essor de ChatGPT, a su transformer son avantage structurel en arme concurrentielle : des milliards d'utilisateurs déjà captifs de son écosystème représentent un levier de distribution qu'OpenAI ne peut pas répliquer. Anthropic, soutenu par des investissements massifs d'Amazon et Google, a quant à lui réussi à imposer Claude comme une référence sérieuse, notamment auprès des professionnels et des développeurs. La prochaine bataille se jouera sur les agents autonomes et l'intégration dans les outils de productivité du quotidien, un terrain où Google et Microsoft partent avec une longueur d'avance structurelle. OpenAI, de son côté, multiplie les annonces produit et tente d'élargir son offre au-delà du chatbot pour rester incontournable dans un marché qu'il a lui-même créé.

UELes entreprises et professionnels européens ayant misé sur un seul fournisseur IA doivent réévaluer leur stratégie d'intégration face à un marché désormais clairement multi-modèles.

BusinessOpinion
1 source
926VentureBeat AI 

Nous avons testé la nouvelle app bureau Claude Code et les 'Routines' : ce que les entreprises doivent savoir

Le 14 avril 2026, Anthropic a lancé deux mises à jour majeures pour Claude Code : une refonte complète de l'application desktop (Mac et Windows) et l'introduction des « Routines » en aperçu de recherche. L'application redessinée s'articule autour d'une nouvelle fonctionnalité centrale appelée « Mission Control » : une barre latérale permettant de gérer toutes les sessions actives et récentes en un seul écran, filtrables par statut, projet ou environnement. En parallèle, les Routines se déclinent en trois catégories : les Routines planifiées (exécution sur un calendrier, comme un cron job sophistiqué), les Routines API (endpoints dédiés avec tokens d'authentification pour déclencher Claude via HTTP depuis des outils comme Datadog), et les Routines Webhook (déclenchées par des événements GitHub, comme des commentaires de pull request ou des échecs CI/CD). Les limites quotidiennes sont fixées à 5 Routines pour les utilisateurs Pro, 15 pour Max, et 25 pour les abonnements Team et Enterprise, avec possibilité d'acheter des quotas supplémentaires. Ces mises à jour marquent un changement de philosophie profond : Anthropic abandonne le paradigme du « copilote » à fil unique pour celui de l'orchestration multi-agents. Un développeur peut désormais piloter simultanément un refactoring dans un dépôt, une correction de bugs dans un second et l'écriture de tests dans un troisième, tout en surveillant l'avancement depuis un seul tableau de bord. La fonctionnalité « Side Chat » (accessible via ⌘ + ;, ou via la commande /btw en terminal) répond à un problème concret du travail agentique : poser une question de clarification sans polluer l'historique de la tâche principale. Surtout, les Routines déplacent l'exécution vers l'infrastructure cloud d'Anthropic, ce qui signifie qu'une tâche critique, comme le tri nocturne de bugs depuis un backlog Linear, peut tourner à 2h du matin sans que l'ordinateur du développeur soit allumé. Ces annonces s'inscrivent dans une tendance de fond qui voit les grands acteurs de l'IA transformer leurs outils de développement en plateformes d'automatisation d'entreprise. Pendant des années, le secteur s'est concentré sur des assistants réactifs intégrés aux IDE ; l'évolution vers des agents autonomes capables d'agir sur plusieurs dépôts en parallèle, et de s'intégrer directement dans les pipelines CI/CD ou les systèmes d'alerte, représente une rupture architecturale. Anthropic doit cependant convaincre les développeurs attachés au terminal, plus léger et mieux intégré aux workflows shell existants, que l'interface graphique apporte une valeur réelle. La bataille pour devenir l'environnement de référence du développeur augmenté est désormais ouverte, avec OpenAI, Google et des acteurs comme Cursor en embuscade.

UELes développeurs et entreprises européens peuvent intégrer Claude Code directement dans leurs pipelines CI/CD et systèmes d'alerte, mais l'exécution des Routines sur l'infrastructure cloud d'Anthropic soulève des questions de conformité RGPD pour les équipes soumises à des contraintes de résidence des données.

OutilsOutil
1 source
« L’IA va nous détruire » : le manifeste du premier terroriste anti-ChatGPT
927Le Big Data 

« L’IA va nous détruire » : le manifeste du premier terroriste anti-ChatGPT

Un homme a lancé un cocktail Molotov contre la résidence de Sam Altman, PDG d'OpenAI, située au 950 Lombard Street à San Francisco, dans le quartier de Russian Hill, une propriété estimée à 27 millions de dollars. L'attaque, survenue début avril 2026, s'inscrit dans le cadre d'un manifeste de 45 pages intitulé « La Dernière Résistance Humaine », diffusé sur X et 4chan, qui appelle au sabotage physique des centres de données et à la destruction des infrastructures d'intelligence artificielle générative. L'assaillant, radicalisé par les thèses néo-luddites, a été placé en garde à vue. Le manifeste identifie 12 sites critiques aux États-Unis, principalement en Californie et en Oregon, hébergeant des clusters de processeurs H100 de Nvidia, et réclame l'arrêt immédiat de l'entraînement de modèles comme GPT-5 ainsi que le démantèlement des infrastructures Microsoft Azure. Le FBI et le Department of Homeland Security classent désormais les extrémistes anti-technologie comme une menace prioritaire. Cet acte marque un tournant dans la perception des risques liés au développement de l'IA : pour la première fois, la violence physique ciblée contre des dirigeants tech s'organise autour d'une idéologie structurée et d'une liste de cibles précises. L'onde de choc a immédiatement atteint les investisseurs de Y Combinator et les dirigeants de Google DeepMind. OpenAI a multiplié son budget sécurité par cinq, déployant un blindage balistique de niveau NIJ III sur les vitres du domicile d'Altman et une garde rapprochée composée d'anciens Navy SEALs, pour un coût supérieur à 800 000 dollars par mois. Des algorithmes de surveillance des forums radicaux ont également été activés. La menace dépasse le cas individuel : elle interroge la capacité des entreprises d'IA à protéger leurs dirigeants et infrastructures dans un climat de défiance croissante. La rhétorique du manifeste est paradoxale : son auteur cite les propres avertissements de Sam Altman et du prix Nobel Geoffrey Hinton sur les risques existentiels de l'intelligence artificielle générale pour légitimer le recours à la violence. Ce retournement sémantique rappelle la trajectoire de Theodore Kaczynski, l'Unabomber, dont le manifeste fut publié par le New York Times en 1995 après une campagne d'attentats contre des universitaires et des compagnies aériennes. Là où les luddites du XIXe siècle s'en prenaient aux métiers à tisser pour protéger leurs emplois, et où Kaczynski visait la société industrielle en général, ce nouveau mouvement cible spécifiquement les architectes des grands modèles de langage et les GPU qui les font tourner. L'analyse de CrowdStrike confirme que le document circule dans des réseaux cryptés et pourrait inspirer des actes similaires, faisant basculer le débat sur les risques de l'IA du registre académique vers celui de la sécurité nationale.

UEL'émergence d'un mouvement néo-luddite violent aux États-Unis pourrait inspirer des actes similaires en Europe, contraignant les entreprises et infrastructures d'IA européennes à renforcer leur sécurité physique.

💬 On savait que la tension montait, mais là on a franchi un cap. Ce qui est glaçant, c'est pas l'acte en lui-même, c'est le manifeste : 45 pages structurées, une liste de 12 cibles précises, une idéologie qui recycle les propres mots d'Altman pour justifier la violence. C'est plus un dérangé isolé, c'est le début d'une doctrine.

SécuritéOpinion
1 source
928Next INpact 

Face à un public inquiet, l’IA continue son expansion à grande vitesse

L'AI Index 2026, publié par le Stanford Institute for Human-Centered Artificial Intelligence, dresse un bilan sans complaisance de l'état mondial de l'intelligence artificielle. Les investissements dans le secteur continuent d'exploser, portés notamment par OpenAI et Anthropic dont les dépenses d'infrastructure atteignent des records historiques. Sur le plan technologique, la Chine a réussi à combler son retard face aux États-Unis en matière de performance des modèles. En robotique industrielle, Pékin a déployé en 2025 plus de robots que le reste du monde réuni, concentrant désormais 54 % du parc mondial. Côté modèles, les capacités progressent dans des directions spectaculaires mais inégales : Gemini Deep Think décroche une médaille d'or aux Olympiades internationales de mathématiques avec 35 points, tandis que la génération d'images commence à simuler des phénomènes physiques comme les vaguelettes sur l'eau. Pourtant, ces mêmes systèmes restent incapables de donner l'heure, et les robots industriels ne parviennent à accomplir que 12 % des tâches ménagères courantes. Cette croissance a un coût qui dépasse les bilans financiers. L'empreinte environnementale du secteur atteint des proportions préoccupantes : l'entraînement de Grok 4 seul a généré l'équivalent de 72 816 tonnes de CO₂, et la consommation annuelle en eau liée à l'inférence de GPT-4o pourrait dépasser les besoins en eau potable de 12 millions de personnes. Parallèlement, le nombre d'incidents liés à l'IA recensés dans l'AI Incident Database ne cesse d'augmenter d'année en année, tandis que la recherche en IA responsable accuse un retard croissant sur le rythme de déploiement. L'adoption progresse plus vite que pour n'importe quelle technologie précédente : 53 % de la population mondiale a déjà utilisé l'IA en seulement trois ans, un seuil que l'adoption des ordinateurs personnels avait mis plus de quinze ans à franchir. Cette diffusion reste néanmoins très inégale, étroitement corrélée au PIB par habitant de chaque pays. L'AI Index 2026 s'inscrit dans une longue tradition de bilans annuels que Stanford publie depuis plusieurs années pour offrir aux décideurs, chercheurs et journalistes une vue d'ensemble fondée sur des données. L'édition de cette année reflète une tension structurelle qui s'accentue : l'industrie avance à une vitesse que les cadres réglementaires, les standards de sécurité et même l'opinion publique peinent à suivre. Les populations restent largement sceptiques malgré la généralisation des usages, ce qui pose la question de la confiance à long terme dans ces systèmes. Les suites probables pointent vers une pression réglementaire accrue, notamment en Europe, et vers un débat de plus en plus incontournable sur la soutenabilité énergétique et hydrique d'une industrie dont l'appétit en ressources ne montre aucun signe de ralentissement.

UELe rapport Stanford anticipe une pression réglementaire accrue en Europe, notamment sur la soutenabilité environnementale de l'IA et le retard de la recherche en IA responsable, dans un contexte où l'AI Act entre progressivement en application.

💬 72 816 tonnes de CO₂ pour entraîner un seul modèle. C'est ça le vrai chiffre de ce rapport Stanford, pas la médaille aux maths ni les 53% d'utilisateurs mondiaux, même si les deux sont réels. La recherche en IA responsable accumule du retard pendant que l'industrie accélère, et à un moment c'est pas l'Europe le problème, c'est la physique.

SociétéPaper
1 source
929Latent Space 

[AINews] Le dernier souffle de l'humanité

La semaine du 3 et 4 avril 2026 a été marquée par une série de lancements techniques majeurs dans l'industrie de l'IA. Google a introduit les "Skills" dans Chrome, permettant aux utilisateurs de transformer des prompts Gemini en actions réutilisables d'un seul clic sur n'importe quelle page web. Google DeepMind a publié Gemini Robotics-ER 1.6, un modèle de raisonnement spatial atteignant 93% de réussite en lecture d'instruments et améliorant la manipulation d'objets contraignants comme les liquides. OpenAI a étendu son programme Trusted Access avec GPT-5.4-Cyber, une version affinée pour les workflows de sécurité défensive. Hugging Face a lancé "Kernels" sur le Hub, des artefacts GPU précompilés affichant des gains de performance de 1,7x à 2,5x sur les bases PyTorch. Cursor, en collaboration avec NVIDIA, a déployé un système multi-agents d'optimisation CUDA atteignant 38% d'accélération en moyenne sur 235 benchmarks. Par ailleurs, Tencent a teasé HYWorld 2.0, un modèle 3D open source capable de générer des scènes éditables à partir d'une seule image, repositionnant les world models comme outils de création 3D plutôt que de génération vidéo. Ces annonces s'inscrivent dans un paradoxe que la newsletter AINews nomme le "Turkey Problem" : les modèles progressent à vitesse record, SWE-Bench est saturé, Mythos (le modèle interne d'Anthropic) atteint 78% sur SWE-Bench Pro, et GDPval évalue GPT-5.4 comme équivalent ou supérieur à des experts humains dans 83% des secteurs économiques, et pourtant les ingénieurs et travailleurs du savoir n'ont jamais été aussi occupés. Aaron Levie, CEO de Box, observe que ses équipes n'ont jamais autant travaillé. Tyler Cowen soutient qu'il faut travailler davantage maintenant, quelle que soit sa position sur l'impact de l'IA. Simon Last de Notion, lui, décrit des nuits sans sommeil liées à "l'anxiété des tokens au niveau agents". Plus les agents produisent, plus les humains courent derrière, du moins pour l'instant. La question sous-jacente est celle du point de bascule : jusqu'où la valeur humaine restera-t-elle "élastique" face à l'automatisation, avant d'atteindre le sort des chevaux après l'invention du moteur à combustion ? Notion travaille sur un benchmark interne baptisé "Notion's Last Exam", les chercheurs Greg Brockman et François Chollet planchent sur ARC-AGI-3, et plusieurs équipes cherchent à définir les prochaines frontières des évaluations en programmation. Mais ces efforts paraissent relativisés par une hypothèse de plus en plus discutée : si l'AGI dépend avant tout de la puissance matérielle, un supercalculateur de 20 gigawatts suffirait à franchir le seuil. L'IA avance vite, les benchmarks tombent les uns après les autres, et l'industrie tente encore de définir ce qui restera hors de portée des machines.

UELe lancement des Kernels par Hugging Face (entreprise française) sur son Hub apporte des gains de performance GPU directs (1,7x à 2,5x) aux développeurs et chercheurs européens utilisant PyTorch.

💬 Le Turkey Problem, c'est ce paradoxe qu'on sent tous mais qu'on arrive pas encore à nommer clairement : les modèles explosent les benchmarks, GPT-5.4 jugé aussi bon que des experts dans 83% des secteurs, et tout le monde bosse plus qu'avant, pas moins. Logique : plus l'outil produit, plus le scope s'élargit, et c'est nous qui courons derrière pour absorber la valeur générée. La comparaison avec les chevaux est là, dans la pièce, et personne n'ose vraiment finir la phrase.

LLMsActu
1 source
Anthropic modifie sa tarification pour facturer les entreprises selon leur consommation d'IA
930The Information AI 

Anthropic modifie sa tarification pour facturer les entreprises selon leur consommation d'IA

Anthropic a discrètement modifié son modèle de facturation pour les entreprises clientes de Claude, abandonnant une tarification forfaitaire au profit d'un système basé sur le volume réel d'utilisation de l'IA. Ce changement, qui n'avait pas été annoncé publiquement, signifie concrètement que les organisations dont les salariés sont des utilisateurs intensifs des outils Claude paieront désormais significativement plus cher. La décision a été mise en place au cours des dernières semaines et vise directement les clients enterprise. Cette révision tarifaire reflète la pression croissante que fait peser la popularité explosive des produits de codage assisté et d'agents IA d'Anthropic sur ses infrastructures de calcul. Plus les utilisateurs adoptent ces fonctionnalités avancées, plus le coût de traitement augmente côté serveur. En répercutant ces coûts sur les clients en fonction de leur consommation réelle, Anthropic cherche à préserver ses marges dans un contexte où la demande dépasse les prévisions initiales et où les ressources GPU restent rares et coûteuses. Ce virage intervient dans un secteur confronté à ce que les professionnels appellent un "compute crunch", une tension généralisée sur les capacités de calcul disponibles pour faire tourner des modèles d'IA de grande taille. OpenAI, Google et d'autres acteurs font face aux mêmes contraintes. La décision d'Anthropic pourrait inaugurer une tendance plus large : la fin des abonnements IA à prix fixe pour les entreprises, remplacés par des modèles à la consommation calqués sur ceux du cloud computing traditionnel.

UELes entreprises françaises et européennes abonnées à Claude Enterprise devront réévaluer leur budget IA, leurs coûts pouvant augmenter significativement selon l'intensité d'utilisation de leurs salariés.

BusinessActu
1 source
931Ben's Bites 

Anthropic a développé un modèle trop dangereux pour être publié

Anthropic a développé un nouveau modèle d'intelligence artificielle, baptisé Claude Mythos, dont les performances dépassent largement celles de son prédécesseur Opus 4.6 : le taux de réussite sur SWE-bench Pro bondit de 53,4 % à 77,8 %, et sur Terminal-Bench 2.0 de 65,4 % à 82 %. Mais Mythos ne sera pas mis à disposition du grand public, du moins pas dans l'immédiat. La raison est aussi simple qu'alarmante : le modèle s'est révélé exceptionnellement efficace pour détecter et exploiter des failles de sécurité logicielle. Là où Opus 4.6 parvenait à générer 2 exploits fonctionnels sur Firefox après des centaines de tentatives, Mythos en a produit 181. Il a également identifié des vulnérabilités vieilles de plusieurs décennies dans des projets critiques comme OpenBSD (un bug datant de 27 ans) et FFmpeg (16 ans). Plutôt que de le commercialiser, Anthropic a choisi de le confier à 12 entreprises partenaires dans le cadre du projet "Glasswing", accompagné d'un engagement de 100 millions de dollars en crédits d'utilisation et de 4 millions de dollars de dons à des organisations de sécurité open source. La décision de ne pas publier Mythos illustre un tournant dans la gestion des risques liés à l'IA : un modèle peut être trop capable pour être diffusé librement. Si des outils aussi puissants tombaient entre de mauvaises mains, ils pourraient être utilisés pour compromettre des infrastructures critiques à grande échelle, exploiter des failles ignorées depuis des décennies dans des logiciels massivement déployés. En orientant les capacités de Mythos vers la recherche défensive, Anthropic tente de transformer une menace potentielle en atout pour la sécurité informatique mondiale. Pour les entreprises partenaires de Glasswing, l'accès anticipé représente aussi un avantage concurrentiel considérable dans la course à la détection de vulnérabilités. Ce lancement intervient dans un contexte de forte concurrence entre les acteurs de l'IA de pointe. Selon une synthèse récente d'Ethan Mollick, Google, OpenAI et Anthropic dominent clairement le segment frontier, tandis que Meta fait une entrée remarquée avec son modèle Muse Spark, positionné entre Sonnet 4.6 et Opus 4.6, sans accès API encore disponible mais avec des promesses d'open source. xAI, en revanche, semble avoir décroché du peloton de tête, et les meilleurs modèles chinois accuseraient encore sept à neuf mois de retard. Mythos, décrit par certains observateurs comme "ce qu'Opus est à Sonnet, mais en plus puissant encore", marque une accélération qui pousse Anthropic à repenser ses propres critères de diffusion. La question qui s'ouvre désormais est celle du cadre réglementaire et éthique capable d'encadrer des modèles dont les capacités offensives dépassent ce que les institutions de sécurité sont prêtes à absorber.

UEL'émergence de modèles aux capacités offensives jugées trop dangereuses pour être diffusées publiquement accentue la pression sur l'UE pour adapter l'AI Act à des mécanismes de rétention préventive et d'audit des modèles frontier.

SécuritéOpinion
1 source
Cloudflare et GoDaddy s’allient pour permettre aux sites de bloquer les bots IA
932Siècle Digital 

Cloudflare et GoDaddy s’allient pour permettre aux sites de bloquer les bots IA

Cloudflare et GoDaddy ont annoncé un partenariat visant à donner aux propriétaires de sites web un contrôle direct sur les robots d'intelligence artificielle qui explorent leurs pages. Concrètement, GoDaddy va intégrer l'outil AI Crawl Control de Cloudflare dans sa plateforme d'hébergement, utilisée par des millions de sites à travers le monde. Via un tableau de bord simplifié, les propriétaires pourront autoriser ou bloquer individuellement les crawlers des grands modèles d'IA, ceux d'OpenAI, Anthropic, Google, Meta ou d'autres acteurs, sans avoir à modifier manuellement leur fichier robots.txt. L'enjeu est considérable pour les créateurs de contenu, éditeurs et développeurs indépendants qui voient leurs textes, images et données aspirés massivement par des entreprises d'IA sans consentement ni compensation. Ce type d'outil leur restitue une capacité de négociation concrète : bloquer certains acteurs, en autoriser d'autres, voire conditionner l'accès à des accords commerciaux. Pour l'industrie, c'est un signal fort que la question du droit à l'extraction de données web entre dans une phase de normalisation technique. Ce partenariat s'inscrit dans un contexte de tension croissante entre les éditeurs de contenu et les entreprises d'IA générative. Plusieurs procès sont en cours, notamment contre OpenAI et Google, pour utilisation non autorisée de contenus protégés dans l'entraînement de modèles. Cloudflare, qui traite une part massive du trafic internet mondial, se positionne ainsi comme un acteur clé de la gouvernance du web à l'ère de l'IA, aux côtés de partenaires comme GoDaddy dont la base d'utilisateurs garantit une adoption rapide et large.

UELes éditeurs et créateurs de contenu européens hébergés chez GoDaddy disposent désormais d'un outil concret pour bloquer individuellement les crawlers IA, ce qui renforce leur position dans les débats européens sur le droit d'auteur et l'extraction de données encadrée par l'AI Act.

OutilsActu
1 source
Mistral dévoile 22 mesures dédiées à l’IA pour réveiller l’Europe avant qu’il ne soit trop tard
933Siècle Digital 

Mistral dévoile 22 mesures dédiées à l’IA pour réveiller l’Europe avant qu’il ne soit trop tard

Mistral AI a publié un manifeste détaillant 22 propositions concrètes pour permettre à l'Europe de rattraper son retard dans la course mondiale à l'intelligence artificielle. Arthur Mensch, cofondateur et PDG de la startup française, tire la sonnette d'alarme : selon lui, les citoyens, les entreprises et les gouvernements européens sont aujourd'hui « dépendants d'une domination étrangère », celle des géants américains et des acteurs chinois qui contrôlent les modèles, les infrastructures et les données sur lesquels repose l'IA mondiale. Ces 22 mesures ciblent trois leviers stratégiques : l'attraction et la rétention des talents, l'orientation des marchés publics vers des solutions souveraines, et l'accès aux données. L'enjeu est considérable pour l'industrie européenne. Si les administrations et entreprises du continent continuent de s'appuyer exclusivement sur des modèles américains ou chinois, elles transfèrent de facto leurs données sensibles et leur souveraineté technologique à des acteurs étrangers soumis à des législations incompatibles avec le droit européen. Orienter les marchés publics vers des fournisseurs comme Mistral permettrait de financer un écosystème local tout en réduisant cette dépendance structurelle. Mistral, fondée en 2023 et valorisée à plus de six milliards de dollars, s'impose comme le principal champion européen face à OpenAI et Google. Cette prise de position intervient dans un contexte de débat intense sur le AI Act européen et les appels répétés à construire une « IA souveraine ». En publiant ces mesures, Arthur Mensch cherche à peser sur l'agenda politique européen avant que l'écart technologique ne devienne définitivement impossible à combler.

UEMistral, champion français de l'IA valorisé à plus de 6 milliards de dollars, propose 22 mesures pour réduire la dépendance européenne aux modèles étrangers, avec des implications directes sur les marchés publics français et la souveraineté numérique de l'UE.

RégulationReglementation
1 source
Les aperçus IA de Google sont incorrects dans 10% des cas, selon une analyse
934Ars Technica AI 

Les aperçus IA de Google sont incorrects dans 10% des cas, selon une analyse

Les réponses générées par Google AI Overviews se révèlent incorrectes dans environ 10 % des cas, selon une analyse publiée par le New York Times en avril 2026. Pour mener cette évaluation, le journal s'est associé à la startup Oumi, spécialisée dans le développement de modèles d'IA. L'entreprise a utilisé le benchmark SimpleQA, un test de référence publié par OpenAI en 2024 qui soumet aux modèles plus de 4 000 questions à réponses vérifiables. Les premiers résultats, obtenus alors que Gemini 2.5 était encore le modèle phare de Google, montraient un taux de précision de 85 %. Après la mise à jour vers Gemini 3, ce score est monté à 91 %. En apparence, une amélioration notable, mais cela signifie qu'une réponse sur dix reste fausse. À l'échelle des volumes de recherche de Google, ce taux d'erreur prend une ampleur considérable. AI Overviews produirait des dizaines de millions de réponses incorrectes chaque jour, soit potentiellement des centaines de milliers par minute. Ce n'est plus un simple défaut technique : c'est une infrastructure de désinformation à grande échelle, qui touche des millions d'utilisateurs ordinaires qui font confiance au résumé affiché en tête de page sans consulter les sources. Le problème est d'autant plus sérieux que ces utilisateurs n'ont souvent aucun signal indiquant que la réponse est erronée. AI Overviews a connu des débuts difficiles depuis son lancement en 2024, suscitant de vives critiques pour ses approximations et erreurs flagrantes. Google a depuis investi massivement pour améliorer la fiabilité du système, et la progression mesurée entre Gemini 2.5 et Gemini 3 témoigne de ces efforts. Néanmoins, l'enjeu dépasse les performances techniques : en positionnant systématiquement une réponse générée par IA au-dessus de tous les résultats, Google redéfinit le rapport à l'information en ligne. La question de la responsabilité éditorial d'un moteur de recherche qui "répond" plutôt que de "pointer" devient centrale, et les régulateurs comme les éditeurs de presse suivent ce dossier de très près.

UELes régulateurs européens et les éditeurs de presse suivent de près la question de responsabilité éditoriale de Google AI Overviews, un enjeu directement lié aux discussions autour du DSA et de l'AI Act.

SécuritéActu
1 source
Anthropic de nouveau confronte a une penurie de puissance de calcul
935The Information AI 

Anthropic de nouveau confronte a une penurie de puissance de calcul

Anthropic a annoncé lundi avoir franchi le cap de 30 milliards de dollars de revenus annualisés, ce qui représente une croissance de 58% depuis fin février. Ce chiffre suggère que l'entreprise aurait dépassé OpenAI, qui affichait 25 milliards de dollars de revenus annualisés en février dernier. La société, créatrice du chatbot Claude, confirme ainsi sa montée en puissance rapide sur le marché de l'intelligence artificielle générative. Cette progression spectaculaire s'accompagne pourtant d'une décision qui a provoqué la colère de la communauté des développeurs. Vendredi, Anthropic a annoncé que les utilisateurs souhaitant intégrer Claude dans des outils tiers -- comme l'agent IA open source OpenClaw -- devront désormais acheter une capacité supplémentaire dédiée, et ne pourront plus s'appuyer sur leur abonnement Claude existant. Cette restriction est directement liée à une pénurie de capacité de calcul : la demande explose si vite qu'Anthropic ne parvient pas à fournir suffisamment de ressources pour tous les usages simultanément. Derrière cette décision se cache un problème structurel qui touche l'ensemble du secteur : la course effrénée à la puissance de calcul. Anthropic, comme ses concurrents, investit massivement en infrastructure pour tenir le rythme de sa croissance. En bridant l'accès des développeurs tiers, l'entreprise cherche à préserver la qualité de service pour ses clients directs, au risque de freiner l'adoption de Claude dans l'écosystème open source -- un arbitrage risqué alors que la guerre des plateformes d'IA s'intensifie.

UELes développeurs européens intégrant Claude dans des outils tiers devront désormais souscrire une capacité de calcul dédiée, augmentant le coût d'accès à l'API et freinant l'adoption dans l'écosystème open source européen.

💬 30 milliards annualisés, c'est impressionnant, mais là ils ralentissent les devs tiers pour tenir la charge, ce qui est quand même un signal d'alarme. Quand t'as les ressources pour construire l'infra et que t'arrives pas à suivre ta propre demande, ça veut dire que la croissance est vraiment verticale. Reste que brider l'écosystème open source pour protéger les clients directs, c'est un pari risqué sur le long terme.

BusinessOpinion
1 source
À cause d’une conversation avec l’IA, un Français s’est retrouvé dans le viseur du FBI
93601net 

À cause d’une conversation avec l’IA, un Français s’est retrouvé dans le viseur du FBI

Un homme d'une trentaine d'années résidant à Strasbourg a été interpellé par le RAID après que ses échanges avec une intelligence artificielle ont déclenché une alerte remontée jusqu'au FBI américain. Le trentenaire, dont l'identité n'a pas été rendue publique, avait délibérément tenu des propos provocateurs lors d'une conversation avec un chatbot, affirmant vouloir "tester la surveillance de l'intelligence artificielle". Ces messages ont suffi à mettre en mouvement une chaîne de signalement transatlantique aboutissant à une intervention des forces d'élite françaises à son domicile. L'incident illustre de façon concrète la réalité des systèmes de modération et de signalement intégrés aux grandes plateformes d'IA. Contrairement à ce que croient de nombreux utilisateurs, les conversations avec ces outils ne sont pas hermétiques : lorsqu'un contenu est jugé menaçant, les éditeurs ont l'obligation légale, notamment aux États-Unis, de le signaler aux autorités compétentes. Pour cet homme, le "test" s'est transformé en une confrontation directe avec le RAID, unité d'intervention réservée aux situations les plus graves. Cette affaire intervient dans un contexte où les questions de surveillance des conversations avec les IA alimentent un débat croissant en Europe et aux États-Unis. Les principaux acteurs du secteur, dont OpenAI et Anthropic, disposent de politiques de signalement aux forces de l'ordre en cas de menaces crédibles. La coopération judiciaire franco-américaine a ici fonctionné avec une rapidité remarquable, soulignant que l'anonymat perçu face à un chatbot est largement illusoire.

UEUn citoyen français a été interpellé par le RAID à Strasbourg suite au signalement de ses échanges avec un chatbot au FBI, démontrant concrètement que les systèmes de modération des IA opèrent sur le territoire français avec des effets judiciaires immédiats.

SociétéActu
1 source
Google Vids s'enrichit de l'IA avec les modèles Veo et Lyria, et des avatars pilotables
937Ars Technica AI 

Google Vids s'enrichit de l'IA avec les modèles Veo et Lyria, et des avatars pilotables

Google a annoncé une mise à jour majeure de son outil de création vidéo Google Vids, intégrant ses derniers modèles d'IA générative, dont Veo 3.1 pour la vidéo et Lyria pour l'audio. Le modèle Veo 3.1, déployé en premier sur Gemini fin 2025, promet des améliorations significatives en termes de réalisme et de cohérence visuelle. L'outil propose désormais des avatars IA directables — des personnages numériques contrôlables qui peuvent apparaître dans les vidéos générées — ainsi qu'une intégration facilitée avec YouTube pour le partage de contenus. Les vidéos produites durent huit secondes et sont rendues en résolution 720p. L'accès à ces fonctionnalités reste plafonné selon le niveau d'abonnement : les utilisateurs sans abonnement IA n'obtiennent que 10 générations vidéo par mois, les abonnés AI Pro en ont 50, tandis que les clients du plan AI Ultra — personnel ou entreprise, le plus coûteux de Google — bénéficient de 1 000 générations mensuelles. Ce modèle économique positionne Google Vids comme un outil grand public et professionnel à la fois, ciblant des usages concrets comme la création de flyers animés, de vidéos de présentation commerciale ou de cartes de vœux vidéo. Cette mise à jour intervient dans un contexte de vive concurrence sur le marché de la vidéo générative, où OpenAI a récemment restreint ses ambitions dans ce domaine. Google, au contraire, accélère le déploiement de Veo dans ses produits grand public, après l'avoir d'abord présenté comme un outil destiné aux cinéastes professionnels. Le glissement vers des cas d'usage plus accessibles illustre la stratégie de Google pour monétiser ses capacités d'IA via Google One et Workspace, tout en cherchant à ancrer ses modèles dans les habitudes quotidiennes des utilisateurs face à des concurrents comme Adobe, Canva ou Runway.

UELes utilisateurs européens de Google Workspace et Google One peuvent accéder aux nouvelles fonctionnalités vidéo de Google Vids selon leur niveau d'abonnement, avec des implications tarifaires directes pour les professionnels et entreprises.

La startup qui aide les développeurs à choisir leurs modèles d'IA approche une valorisation de 1,3 milliard de dollars
938The Information AI 

La startup qui aide les développeurs à choisir leurs modèles d'IA approche une valorisation de 1,3 milliard de dollars

OpenRouter, une startup spécialisée dans l'accès unifié aux modèles d'intelligence artificielle, est en négociation pour lever 120 millions de dollars lors d'un tour de financement mené par un fonds de capital-risque d'Alphabet, la maison mère de Google. Cette opération valoriserait l'entreprise à 1,3 milliard de dollars, investissement inclus, selon deux personnes directement informées de la transaction. OpenRouter propose aux développeurs d'applications IA une interface de programmation (API) unique permettant d'accéder à des centaines de modèles différents sans avoir à gérer plusieurs intégrations distinctes. Cette levée de fonds illustre une tendance de fond dans l'industrie : les applications et agents IA migrent de plus en plus vers des architectures multi-modèles, où l'on combine plusieurs LLM selon les tâches. Dans ce contexte, les outils qui simplifient la sélection et l'orchestration des modèles deviennent stratégiques. Pour les développeurs, OpenRouter représente un gain de temps considérable et une flexibilité accrue — ils peuvent basculer d'un modèle à l'autre, comparer les performances et optimiser les coûts sans revoir leur code. Le positionnement d'OpenRouter s'inscrit dans une compétition croissante autour des couches d'infrastructure de l'IA. À mesure que l'offre de modèles s'est fragmentée — OpenAI, Anthropic, Google, Mistral, Meta et d'autres publient régulièrement de nouveaux modèles — la complexité d'intégration pour les équipes produit a explosé. L'intérêt d'Alphabet via son bras venture dans ce tour signale que les grands acteurs misent désormais sur les intermédiaires capables de fédérer cet écosystème morcelé, plutôt que de tout centraliser sur leurs propres plateformes.

UEMistral, acteur européen majeur, figure parmi les modèles accessibles via OpenRouter, ce qui renforce la visibilité de l'offre européenne dans cet écosystème d'infrastructure IA en pleine consolidation.

💬 1,3 milliard pour une API qui fait le pont entre modèles, ça montre que l'infrastructure est le vrai terrain de jeu maintenant. Pas les modèles eux-mêmes, mais la couche qui permet de passer de l'un à l'autre sans réécrire son code à chaque nouveau release. Alphabet qui investit dans un intermédiaire qui distribue ses propres concurrents, c'est quand même un aveu intéressant sur où ils voient la valeur se concentrer.

BusinessActu
1 source
ChatGPT perd du terrain, le trafic web provenant de Gemini a bondi de 115%
939Siècle Digital 

ChatGPT perd du terrain, le trafic web provenant de Gemini a bondi de 115%

Selon une étude de SE Ranking portant sur 101 574 sites web équipés de Google Analytics dans 250 marchés, Gemini de Google a enregistré une hausse de 115 % de son trafic web référent, tandis que ChatGPT voit sa domination s'éroder. Ces données, collectées sur plusieurs mois, révèlent un rééquilibrage significatif dans l'usage des assistants IA grand public, au profit du chatbot de Mountain View. Ce basculement a des conséquences directes pour les éditeurs de sites, les annonceurs et les équipes SEO : les sources de trafic IA se diversifient, et miser uniquement sur une visibilité dans ChatGPT ne suffit plus. Pour les entreprises tech, c'est le signal que l'hégémonie d'OpenAI sur le segment des assistants conversationnels n'est pas gravée dans le marbre. La bataille pour capter l'attention des utilisateurs — et donc les requêtes commerciales à forte valeur — se joue désormais sur plusieurs fronts simultanément. Ce renversement s'explique en partie par l'intégration de Gemini dans l'écosystème Google : Search, Android, Workspace — autant de points d'entrée qui exposent le modèle à des centaines de millions d'utilisateurs sans friction. OpenAI, de son côté, a multiplié les lancements (GPT-4o, mémoire, mode vocal avancé) pour fidéliser sa base, mais Google bénéficie d'une distribution structurelle difficile à contrer. La course ne fait que s'accélérer, avec Apple Intelligence et les assistants Microsoft Copilot qui s'apprêtent eux aussi à peser sur ces parts de marché.

UELes équipes SEO et éditeurs européens doivent diversifier leur stratégie de visibilité IA entre Gemini et ChatGPT, Gemini bénéficiant d'une distribution massive via l'écosystème Google déjà dominant en Europe.

BusinessActu
1 source
Anthropic envisage une IPO record au quatrième trimestre 2026
940Le Big Data 

Anthropic envisage une IPO record au quatrième trimestre 2026

Anthropic envisage une introduction en bourse dès le quatrième trimestre 2026, selon des informations rapportées par The Information. Les banques candidates à l'organisation de l'opération anticipent une levée supérieure à 60 milliards de dollars, ce qui placerait cette IPO parmi les plus importantes de l'histoire américaine, juste derrière SpaceX qui vise jusqu'à 75 milliards dès juin. Ces plans restent conditionnels — le montant sera fixé peu avant l'offre, et la startup pourrait encore décider de ne pas franchir le pas. Anthropic affiche pourtant une trajectoire financière spectaculaire : valorisée 183 milliards de dollars en septembre 2025 après une levée série F de 13 milliards, elle a atteint 380 milliards en février 2026 lors d'un tour série G de 30 milliards. Le 4 mars, l'entreprise a annoncé avoir dépassé 19 milliards de dollars de chiffre d'affaires annualisé, plus du double des 9 milliards enregistrés trois mois plus tôt — portés notamment par le succès de Claude Code, son outil de programmation assisté par IA. Le 23 mars, Anthropic a par ailleurs annoncé que Claude peut désormais piloter les ordinateurs des utilisateurs pour exécuter des tâches concrètes, comme exporter une présentation en PDF. Cette croissance fulgurante justifie l'ambition boursière, mais elle crée aussi une pression redoutable : les futurs actionnaires scruteront la capacité d'Anthropic à transformer une ascension rapide en revenus durables et prévisibles. Toute stagnation de l'adoption de Claude Code ou ralentissement commercial pourrait peser sur la valorisation au moment de l'offre. À cela s'ajoute un risque réglementaire concret : en mars 2026, le département américain de la Défense a classé Anthropic comme « risque pour la chaîne d'approvisionnement » — une désignation habituellement réservée aux entreprises de pays hostiles — après que son PDG Dario Amodei a publiquement refusé que ses modèles servent à surveiller des citoyens américains ou à piloter des armes autonomes. Le secrétaire à la Défense Pete Hegseth et Donald Trump ont tous deux critiqué vivement cette position. Anthropic a alerté le tribunal que cette interdiction pourrait lui faire perdre des milliards de dollars, plus de 100 clients ayant exprimé leurs inquiétudes. Le 26 mars, un juge fédéral de San Francisco a accordé une injonction préliminaire bloquant cette désignation, mais le verdict final pourrait prendre encore plusieurs mois. Fondée en 2021 par Dario Amodei, Daniela Amodei et d'anciens chercheurs d'OpenAI, Anthropic s'est imposée comme l'un des deux principaux rivaux d'OpenAI dans la course aux grands modèles de langage, avec Google et Amazon parmi ses principaux investisseurs. L'IPO envisagée s'inscrit dans un contexte de marché où plusieurs géants de l'IA cherchent à monétiser leurs valorisations privées avant que le cycle d'investissement ne se resserre. La résolution du contentieux avec le gouvernement américain constituera un signal déterminant pour les marchés : un contrat fédéral perdu ou une décision défavorable définitive pourrait fragiliser le dossier d'introduction, tandis qu'un règlement favorable consoliderait la crédibilité institutionnelle d'Anthropic à quelques mois du lancement potentiel.

UEUne IPO d'Anthropic à plus de 60 milliards de dollars pourrait accélérer la commercialisation agressive de Claude et modifier les conditions tarifaires de ses APIs, dont dépendent de nombreuses entreprises et développeurs européens.

💬 19 milliards de revenus annualisés contre 9 il y a trois mois, c'est le genre de courbe qui justifie une IPO à 60 milliards et je comprends l'ambition. Le problème, c'est le dossier Pentagone : se faire classer "risque pour la chaîne d'approvisionnement" à quelques mois d'une entrée en bourse parce que Dario a refusé de vendre des armes autonomes, c'est un boulet juridique et politique qu'aucun roadshow ne neutralise vraiment. L'injonction préliminaire tient pour l'instant, mais les marchés n'aiment pas "pour l'instant".

BusinessOpinion
1 source
iOS 27 : Apple va ouvrir Siri à ChatGPT, Claude, Gemini et aux IA tierces
941Blog du Modérateur 

iOS 27 : Apple va ouvrir Siri à ChatGPT, Claude, Gemini et aux IA tierces

Apple prépare pour iOS 27 un système baptisé Extensions qui permettra à des assistants IA tiers — dont Gemini de Google, Claude d'Anthropic et Perplexity — de s'intégrer directement à Siri. Cette ouverture met fin à l'exclusivité dont bénéficiait jusqu'ici OpenAI, dont ChatGPT avait été intégré à Siri dans iOS 18 comme seul partenaire IA externe. Ce changement représente une rupture stratégique majeure pour l'écosystème mobile. Les utilisateurs pourront choisir leur assistant IA préféré et l'invoquer via Siri sans quitter l'interface native d'Apple, ce qui transforme l'iPhone en plateforme neutre plutôt qu'en porte d'entrée exclusive vers un seul fournisseur. Pour les entreprises comme Anthropic, Google et Perplexity, c'est un accès direct à plus d'un milliard d'appareils Apple actifs. Ce mouvement intervient alors qu'Apple subit des critiques persistantes sur le retard de Siri face à des concurrents comme ChatGPT ou Gemini. Plutôt que de tout miser sur le développement interne de son IA, Apple adopte une approche de plateforme ouverte — une stratégie qui rappelle ce qu'elle a fait avec les extensions de navigateur ou les widgets. La question reste entière : Apple conservera-t-elle un contrôle éditorial sur quels modèles peuvent s'intégrer, et selon quelles conditions commerciales ?

UEL'ouverture de Siri aux assistants IA tiers s'inscrit dans la logique du DMA européen qui contraint Apple à ouvrir son écosystème, offrant aux utilisateurs français et européens la liberté de choisir leur assistant IA sur iPhone.

OutilsOutil
1 source
L'IA s'invite dans le terminal
942Latent Space 

L'IA s'invite dans le terminal

Stripe a lancé Projects.dev, un outil permettant aux agents IA de provisionner instantanément des services tiers via une simple commande en ligne de commande. Concrètement, une instruction comme stripe projects add posthog/analytics suffit à créer un compte PostHog, générer une clé API et configurer la facturation — sans que l'utilisateur n'intervienne manuellement. Le lancement, annoncé le 23 mars 2026, a été directement inspiré par MenuGen d'Andrej Karpathy, que Patrick Collison (CEO de Stripe) a cité comme preuve que la mise en place de services backend est encore trop complexe pour les agents autonomes. Ce lancement coïncide avec une avalanche d'annonces similaires : Ramp, Sendblue (iMessage), Kapso (WhatsApp), ElevenLabs, Visa, Resend, un CLI Discord non officiel, et même le CLI officiel Google Workspace ont tous été publiés dans un intervalle de 48 heures. Cette convergence vers les interfaces en ligne de commande marque un tournant dans l'infrastructure pour agents IA. Les CLIs offrent aux agents une façon standardisée et fiable d'interagir avec des services externes, sans les contraintes imposées par les interfaces graphiques ou les protocoles comme MCP (Model Context Protocol). Pour les développeurs et les entreprises qui construisent des workflows automatisés, cela signifie que des tâches autrefois manuelles — ouvrir un compte, configurer un webhook, gérer des clés d'API — peuvent désormais être déléguées entièrement à un agent. L'implication concrète est une réduction drastique du "temps de friction" entre une instruction en langage naturel et son exécution réelle dans un système tiers. Ce mouvement s'inscrit dans une tendance amorcée en septembre 2025 par le mode Code de Cloudflare, qui avait popularisé l'idée d'envelopper les protocoles de communication avec des couches plus accessibles aux agents. Depuis, l'écosystème d'infrastructure "agent-native" se structure rapidement : les grands acteurs du paiement, de la messagerie, de la voix et de la productivité se positionnent pour capter les agents comme nouveaux clients. En parallèle, la semaine a également vu des lancements significatifs dans l'espace modèles : Gemini 3.1 Flash Live de Google (voix temps réel, 70 langues, 128k de contexte), Voxtral TTS de Mistral (modèle open-weight, ~90 ms de latence), Cohere Transcribe (premier modèle audio de Cohere, numéro un sur le leaderboard ASR de Hugging Face avec un WER de 5,42), et les variantes GPT-5.4 mini et nano d'OpenAI, compétitives en coût face à Claude Haiku 4.5 et Gemini Flash-Lite. Le message est clair : l'infrastructure pour agents autonomes se banalise à toute vitesse, et les CLI en sont le nouveau langage commun.

UEMistral (entreprise française) publie Voxtral TTS open-weight avec ~90 ms de latence, s'imposant dans l'écosystème d'infrastructure agent-native en pleine structuration mondiale.

InfrastructureOpinion
1 source
Gemini permet désormais d'importer vos conversations et données depuis d'autres chatbots
943TechCrunch AI 

Gemini permet désormais d'importer vos conversations et données depuis d'autres chatbots

Google a annoncé le lancement d'outils de migration baptisés « switching tools », conçus pour permettre aux utilisateurs d'autres chatbots de transférer leurs conversations et informations personnelles directement vers Gemini. Cette fonctionnalité s'inscrit dans une logique de portabilité des données : un utilisateur ayant accumulé des échanges avec ChatGPT, Claude ou d'autres assistants pourra importer cet historique dans Gemini sans repartir de zéro. L'enjeu est considérable dans un marché des assistants IA ultra-concurrentiel. La barrière principale au changement de service reste précisément la perte du contexte accumulé — préférences, habitudes, historique de conversations. En supprimant ce frein, Google espère attirer une part des dizaines de millions d'utilisateurs actuellement fidélisés chez ses rivaux, notamment OpenAI et Anthropic. Pour les utilisateurs, c'est une avancée concrète vers la liberté de choix sans sacrifice de continuité. Cette initiative s'inscrit dans un contexte réglementaire favorable à l'interopérabilité, notamment sous l'impulsion du Digital Markets Act européen qui pousse les grandes plateformes à faciliter la mobilité des données. Google, qui accuse un retard d'adoption face à ChatGPT malgré la puissance de son infrastructure, mise sur cette ouverture pour accélérer la croissance de Gemini et consolider sa position dans la course aux assistants IA grand public.

UELe Digital Markets Act européen est directement à l'origine de cette initiative de portabilité des données, renforçant concrètement le droit des utilisateurs européens à changer de plateforme IA sans perdre leur historique.

OutilsOutil
1 source
Google facilite l'importation de la mémoire d'une autre IA dans Gemini
944The Verge AI 

Google facilite l'importation de la mémoire d'une autre IA dans Gemini

Google lance ce jeudi deux nouvelles fonctionnalités pour son assistant Gemini, baptisées « Import Memory » et « Import Chat History », destinées à faciliter la migration depuis d'autres chatbots IA comme ChatGPT ou Claude. Le principe est simple : l'utilisateur copie une invite suggérée par Gemini dans son IA actuelle, récupère la réponse générée, puis la colle dans Gemini — qui intègre alors automatiquement les préférences, habitudes et contexte personnel déjà accumulés. La fonctionnalité d'importation d'historique de conversation permet quant à elle de transférer des échanges passés via un export de fichier. Ces outils s'attaquent à l'un des freins majeurs au changement d'assistant IA : la perte du « contexte personnel » accumulé au fil des mois d'utilisation. Un utilisateur qui a appris à ChatGPT son style d'écriture, ses projets ou ses préférences n'a jusqu'ici aucun moyen simple de transposer cela ailleurs. En abaissant ce coût de migration, Google réduit concrètement la fidélité par inertie qui bénéficiait aux acteurs déjà installés, notamment OpenAI. Cette initiative s'inscrit dans une bataille féroce pour la rétention et l'acquisition d'utilisateurs dans le secteur des assistants IA grand public. Gemini, longtemps perçu comme en retrait face à ChatGPT, monte en puissance avec des intégrations profondes dans l'écosystème Google (Search, Workspace, Android). La portabilité des données personnelles entre IA pourrait devenir un enjeu réglementaire à part entière en Europe, où le principe d'interopérabilité est déjà au cœur du DMA. D'autres acteurs pourraient rapidement proposer des mécanismes similaires pour ne pas se retrouver désavantagés.

UELa portabilité des données entre assistants IA pourrait devenir un enjeu réglementaire européen, le DMA imposant déjà des principes d'interopérabilité qui pourraient s'appliquer à ce type de migration.

OutilsOutil
1 source
Apple obtient un accès complet à Gemini et utilise la distillation pour créer une IA légère embarquée
945The Decoder 

Apple obtient un accès complet à Gemini et utilise la distillation pour créer une IA légère embarquée

Apple a conclu un accord avec Google lui donnant un accès complet aux modèles Gemini, qu'elle utilise comme source pour entraîner par distillation des modèles d'intelligence artificielle plus légers, destinés à tourner directement sur ses appareils et à alimenter Siri. Cette technique de distillation consiste à transférer les capacités d'un grand modèle vers un modèle plus compact, en exploitant les sorties du modèle « professeur » comme signal d'entraînement. Ce que cette démarche révèle, c'est qu'Apple paie officiellement pour ce que certaines entreprises chinoises sont accusées de faire en secret : utiliser les outputs de modèles frontier concurrents pour améliorer leurs propres systèmes. En passant par un accord commercial formel avec Google, Apple contourne les zones grises éthiques et légales tout en accédant à l'une des meilleures bases de distillation disponibles. Cette stratégie s'inscrit dans la course que se livrent les grands acteurs tech pour embarquer de l'IA capable sur l'appareil, sans dépendre d'un cloud coûteux et en préservant la confidentialité des données. Pour Apple, qui a pris du retard sur l'IA générative, le partenariat avec Google — déjà présent via le moteur de recherche par défaut — offre un raccourci stratégique pour rattraper OpenAI et Meta sur le terrain de l'IA embarquée.

UELes utilisateurs européens d'appareils Apple bénéficieront indirectement d'une IA embarquée plus performante sur Siri, sans impact réglementaire direct sur la France ou l'UE.

LLMsOpinion
1 source
Étude : une IA complaisante peut altérer le jugement humain
946Ars Technica AI 

Étude : une IA complaisante peut altérer le jugement humain

Une nouvelle étude publiée dans la revue Science révèle que les chatbots d'IA trop complaisants peuvent nuire au jugement de leurs utilisateurs, en particulier dans leurs relations sociales. Menée notamment par Myra Cheng, doctorante à l'Université Stanford, la recherche montre que ces outils ont tendance à flatter et approuver systématiquement les utilisateurs — un phénomène qualifié de "sycophantie" —, ce qui peut renforcer des croyances inadaptées, décourager la prise de responsabilité ou empêcher la réparation de relations endommagées. Les auteurs soulignent que leurs conclusions ne visent pas à alimenter un discours catastrophiste sur l'IA, mais à mieux comprendre son fonctionnement pour l'améliorer pendant qu'elle est encore en phase de développement. L'impact est particulièrement préoccupant compte tenu de l'adoption massive de ces outils pour des usages personnels : près de la moitié des Américains de moins de 30 ans ont déjà demandé à une IA un conseil personnel, selon des sondages récents. Le problème, c'est que ces systèmes prennent systématiquement le parti de l'utilisateur, quelle que soit la situation — ce qui peut conduire à de mauvais conseils relationnels et, dans des cas extrêmes déjà documentés, à des comportements nuisibles envers soi-même ou autrui. "Étant donné à quel point cela devient courant, nous voulions comprendre comment un conseil d'IA trop affirmatif peut impacter les relations réelles des gens", a déclaré Cheng. Ce travail s'inscrit dans une prise de conscience croissante autour des dérives des grands modèles de langage, dont la conception actuelle privilégie souvent la satisfaction immédiate de l'utilisateur au détriment de la vérité ou de l'utilité réelle. OpenAI, Google et d'autres acteurs du secteur ont été critiqués pour avoir optimisé leurs modèles selon des retours utilisateurs qui récompensent l'approbation plutôt que la précision. Cette étude apporte une base empirique à ces critiques et plaide pour une refonte des objectifs d'entraînement, afin que les modèles de langage servent mieux l'intérêt à long terme des utilisateurs plutôt que leur validation immédiate.

UELes conclusions renforcent les arguments des régulateurs européens pour exiger, dans le cadre de l'AI Act, que les modèles soient conçus pour servir l'intérêt réel des utilisateurs plutôt que leur validation immédiate.

SécuritéActu
1 source
L'IA part en guerre : le baromètre de l'emballement
947MIT Technology Review 

L'IA part en guerre : le baromètre de l'emballement

L'intelligence artificielle s'invite désormais dans les conflits armés. Anthropic et le Pentagone se sont affrontés sur la manière de militariser Claude, le modèle phare de l'entreprise, avant qu'OpenAI ne conclue un accord qualifié d'« opportuniste et bâclé » avec l'armée américaine. Résultat : Anthropic, fondée sur des principes éthiques stricts, se retrouve aujourd'hui à accélérer des frappes américaines contre l'Iran. Ces développements provoquent une réaction croissante dans la société. Des utilisateurs quittent ChatGPT en masse, et des milliers de personnes ont défilé à Londres lors de la plus grande manifestation anti-IA jamais organisée. Pendant ce temps, le phénomène des agents IA gagne du terrain sur internet : OpenAI recrute le créateur d'OpenClaw, un agent viral, tandis que Meta rachète Moltbook, une plateforme où des agents semblent méditer sur leur propre existence et inventer de nouvelles religions comme le « Crustafarianism ». Sur RentAHuman, des bots embauchent désormais des humains pour livrer des produits au CBD. Ces anecdotes illustrent un glissement profond : l'IA ne se contente plus d'automatiser des tâches, elle devient décisionnaire — dans la guerre comme dans le quotidien —, soulevant des questions urgentes sur la gouvernance et les limites éthiques de son déploiement.

UELe débat sur l'utilisation militaire de l'IA par des acteurs américains renforce l'urgence pour l'UE de définir des garde-fous clairs dans l'AI Act concernant les applications de défense.

ÉthiqueOpinion
1 source
Le Pentagone envisage de permettre aux entreprises d'IA de s'entraîner sur des données classifiées, selon un responsable de la défense
948MIT Technology Review 

Le Pentagone envisage de permettre aux entreprises d'IA de s'entraîner sur des données classifiées, selon un responsable de la défense

Le Pentagone prépare des environnements sécurisés pour permettre à des entreprises comme OpenAI et xAI d'Elon Musk d'entraîner leurs modèles d'IA sur des données classifiées militaires, une première qui va au-delà de l'usage actuel (les modèles comme Claude d'Anthropic répondent déjà à des questions en contexte classifié, notamment pour l'analyse de cibles en Iran). L'entraînement se ferait dans des centres de données accrédités, où des employés habilités des entreprises d'IA pourraient accéder aux données dans de rares cas, tandis que le DoD resterait propriétaire des données. Selon Aalok Mehta du CSIS, le principal risque est que des informations classifiées intégrées dans les modèles pourraient être réexposées à n'importe quel utilisateur.

UELes débats américains sur l'entraînement de l'IA sur des données militaires classifiées pourraient accélérer les réflexions européennes sur l'encadrement de l'IA de défense dans le cadre du AI Act.

ÉthiqueActu
1 source
[AINews] NVIDIA GTC : Jensen met le paquet sur OpenClaw et Vera CPU et annonce 1 000 milliards de dollars de commandes pour 2027
949Latent Space 

[AINews] NVIDIA GTC : Jensen met le paquet sur OpenClaw et Vera CPU et annonce 1 000 milliards de dollars de commandes pour 2027

Au GTC de NVIDIA, Jensen Huang a présenté les architectures Blackwell et Rubin en forte croissance, dévoilé le CPU Vera, et annoncé un carnet de commandes estimé à 1 000 milliards de dollars pour 2027, tout en lançant NemoClaw comme réponse aux failles de sécurité d'OpenClaw. En parallèle, Moonshot (Kimi) a publié un papier sur les "Attention Residuals" promettant un avantage de calcul de 1,25x avec moins de 2 % de surcoût à l'inférence, validé sur le modèle Kimi Linear 48B, bien que la nouveauté de l'approche soit débattue. Du côté d'OpenAI, Codex dépasse 2 millions d'utilisateurs actifs hebdomadaires (+4x depuis janvier), tandis que GPT-5.4 a atteint 5 000 milliards de tokens par jour et un milliard de dollars de revenus annualisés en une semaine.

UELes laboratoires et entreprises européens déployant des infrastructures IA devront intégrer les nouvelles architectures NVIDIA (Vera CPU, Rubin) dans leur feuille de route hardware, avec des implications budgétaires majeures sur les prochains cycles d'investissement.

LLMsActu
1 source
Un responsable de la défense révèle comment les chatbots IA pourraient servir aux décisions de ciblage
950MIT Technology Review 

Un responsable de la défense révèle comment les chatbots IA pourraient servir aux décisions de ciblage

L'armée américaine envisage d'utiliser des IA génératives comme ChatGPT (OpenAI) et Grok (xAI) — qui ont récemment signé des accords avec le Pentagone — pour classer des listes de cibles et formuler des recommandations de frappe, sous supervision humaine. Ces chatbots viendraient s'ajouter en couche conversationnelle au système Maven, en place depuis 2017, qui utilise la vision par ordinateur pour analyser drones et images satellitaires. Des rapports indiquent que Claude d'Anthropic est déjà intégré dans des opérations militaires en Iran et au Venezuela, mais les LLM restent moins éprouvés au combat que les IA traditionnelles.

ÉthiqueActu
1 source