Aller au contenu principal

Dossier Anthropic — page 10

1078 articles · page 10 sur 22

Suivi d'Anthropic, le laboratoire qui a fait de la safety son positionnement : Claude, Mythos, Opus, partenariats Glasswing, IPO.

Moonshot AI lance Kimi Code CLI : un agent de codage IA en ligne de commande, développé en TypeScript
451MarkTechPost OutilsOutil

Moonshot AI lance Kimi Code CLI : un agent de codage IA en ligne de commande, développé en TypeScript

Moonshot AI, le laboratoire chinois d'intelligence artificielle, a publié Kimi Code CLI, un agent de codage open source conçu pour fonctionner directement dans le terminal. Distribué sous licence MIT et disponible sur GitHub, l'outil s'installe en une seule commande, sans prérequis Node.js, via un script officiel compatible macOS, Linux et Windows. Écrit en TypeScript et diffusé via npm, Kimi Code CLI succède à l'ancien kimi-cli et s'interface nativement avec les modèles Kimi de Moonshot AI, tout en restant compatible avec d'autres fournisseurs. L'agent est capable de lire et modifier du code, exécuter des commandes shell, explorer des fichiers, interroger des pages web, implémenter de nouvelles fonctionnalités, corriger des bugs, effectuer des refactorisations, répondre à des questions d'architecture et automatiser des tâches en lot. Par défaut, les opérations en lecture seule s'exécutent automatiquement, tandis que les modifications de fichiers ou les commandes shell demandent une confirmation explicite du développeur. L'agent adopte un modèle d'exécution dit "feedback-driven" : il planifie ses étapes, modifie le code, lance les tests et rapporte ses actions en boucle jusqu'à complétion. Parmi ses fonctionnalités distinctives, Kimi Code CLI intègre un support vidéo permettant de déposer un enregistrement d'écran directement dans le chat, une configuration native des serveurs MCP (Model Context Protocol) via la commande /mcp-config, ainsi qu'un système de sous-agents parallèles pour déléguer des tâches d'exploration, de planification ou de codage dans des contextes isolés. Des hooks de cycle de vie permettent d'auditer les décisions de l'agent ou de déclencher des notifications locales. Un mode plan (accessible via Shift-Tab ou --kimi --plan) génère un plan de recherche avant toute modification, et la commande /fork crée une branche expérimentale abandonnnable à tout moment. Kimi Code CLI s'inscrit dans une compétition croissante autour des agents de codage en terminal, un segment en pleine effervescence depuis l'émergence de Claude Code d'Anthropic, Aider ou encore Amp. La tendance de fond est celle de l'autonomisation progressive des outils de développement : les agents ne se contentent plus de suggérer du code, ils planifient, exécutent et itèrent de façon quasi-autonome sur des sessions longues. Moonshot AI, connu pour ses modèles Kimi aux capacités de contexte étendues, positionne cet outil comme une alternative sérieuse aux solutions occidentales dominantes, en ciblant notamment les développeurs souhaitant intégrer des LLMs dans leurs workflows sans quitter le terminal. L'accès au CLI est gratuit, mais l'utilisation des modèles nécessite une authentification OAuth Kimi Code ou une clé API Moonshot AI Open Platform.

UELes développeurs français et européens peuvent tester gratuitement cet agent open source, mais il ne cible pas spécifiquement le marché européen et n'a pas d'impact structurel sur la réglementation ou l'écosystème local.

1 source
NVIDIA Nemotron 3 Ultra est désormais disponible sur Amazon SageMaker JumpStart
452AWS ML Blog 

NVIDIA Nemotron 3 Ultra est désormais disponible sur Amazon SageMaker JumpStart

NVIDIA a annoncé la disponibilité immédiate de son modèle Nemotron 3 Ultra sur Amazon SageMaker JumpStart, permettant un déploiement en un clic sans gestion d'infrastructure. Le modèle repose sur une architecture hybride Transformer-Mamba de type Mixture-of-Experts (MoE), avec 550 milliards de paramètres au total dont seulement 55 milliards actifs par passe de calcul. Optimisé pour le format de précision NVFP4, il affiche une vitesse d'inférence cinq fois supérieure aux modèles équivalents et réduit les coûts jusqu'à 30 % pour les charges de travail agentiques. Il supporte des contextes allant jusqu'à un million de tokens, ce qui en fait l'un des modèles open source les plus ambitieux disponibles à ce jour sur une plateforme cloud grand public. Ce lancement cible directement les systèmes d'IA agentiques, une catégorie en pleine expansion où un modèle ne répond pas à une simple question mais planifie, appelle des outils, délègue des tâches à des sous-agents et itère sur des centaines de tours de dialogue. C'est précisément là que les modèles classiques montrent leurs limites : chaque étape supplémentaire alourdit le coût en tokens et en calcul. L'architecture MoE de Nemotron 3 Ultra contourne ce problème en n'activant qu'une fraction des paramètres à chaque passage, maintenant un débit élevé même sur des contextes très longs. Pour les entreprises qui automatisent des workflows complexes, orchestration d'agents, génération et débogage de code sur de vastes dépôts, recherche documentaire approfondie, cela se traduit concrètement par des tâches menées à terme avec une cohérence préservée et une facture cloud maîtrisée. NVIDIA positionne Nemotron 3 Ultra dans une stratégie plus large visant à s'imposer comme fournisseur de référence pour l'IA agentique d'entreprise, un segment où la concurrence s'intensifie entre OpenAI, Anthropic, Google et des acteurs open source comme Meta avec Llama. Le partenariat avec AWS et l'intégration native dans SageMaker JumpStart abaissent significativement la barrière à l'entrée pour les équipes techniques qui souhaitent tester ou déployer le modèle sans configurer de stack d'inférence from scratch. Les instances GPU requises, notamment les ml.p5en.48xlarge, restent coûteuses à l'heure, ce qui signifie que l'usage restera concentré sur des cas professionnels à forte valeur ajoutée. La disponibilité dès le jour zéro sur JumpStart suggère également un accord commercial étroit entre NVIDIA et Amazon, deux acteurs dont l'alliance dans le domaine de l'infrastructure IA se renforce à mesure que la course aux agents autonomes s'accélère.

UELes équipes R&D et développeurs européens accèdent désormais à l'un des plus grands modèles open source du marché via une plateforme cloud grand public, sans configuration d'infrastructure spécifique.

LLMsOpinion
1 source
OpenAI : Sam Altman voit l'IA proactive comme la prochaine grande étape après les chatbots et les agents
453The Decoder 

OpenAI : Sam Altman voit l'IA proactive comme la prochaine grande étape après les chatbots et les agents

Sam Altman, PDG d'OpenAI, a esquissé sa vision de la prochaine grande étape de l'intelligence artificielle : une "IA proactive" capable d'agir de manière autonome en arrière-plan, sans attendre qu'un utilisateur lui soumette une requête. Contrairement aux chatbots actuels, qui répondent à des questions ponctuelles, ou aux agents IA, qui exécutent des tâches déclenchées par l'humain, cette nouvelle génération d'outils surveillerait en continu l'environnement de travail et prendrait des initiatives de façon indépendante. Altman a également promis d'aider les entreprises à "obtenir plus de valeur pour moins de dépenses", au moment où les budgets IA explosent dans les organisations. Cette vision répond à deux problèmes concrets que rencontrent actuellement les entreprises : la flambée des coûts liés au déploiement de l'IA à grande échelle, et le fait que la majorité des employés ne savent tout simplement pas quoi demander à ces outils. Une IA qui agit sans être sollicitée pourrait contourner ce frein à l'adoption, en rendant les bénéfices accessibles même aux utilisateurs non techniques. L'enjeu est considérable : transformer l'IA d'un outil optionnel en infrastructure permanente du travail quotidien. Ce positionnement s'inscrit dans une course intense entre les grands acteurs du secteur. Google, Microsoft et Anthropic développent tous des systèmes d'agents et d'automatisation de plus en plus autonomes. La promesse d'une IA proactive soulève néanmoins des questions sérieuses sur la supervision humaine, la confidentialité des données et la responsabilité des décisions prises sans intervention humaine, des enjeux que l'industrie devra adresser pour convaincre les entreprises d'aller plus loin.

UELes entreprises européennes devront anticiper des enjeux de conformité RGPD et AI Act face à des systèmes IA agissant en arrière-plan sans déclenchement humain explicite.

LLMsOpinion
1 source
Les conséquences imprévues du retour de Codex
454The Information AI 

Les conséquences imprévues du retour de Codex

Le retour de Codex, l'agent de codage d'OpenAI, provoque des effets inattendus au sein même de l'entreprise. Repositionné comme outil polyvalent pour les travailleurs de la connaissance, Codex connaît un regain d'intérêt notable depuis plusieurs semaines, comme l'a souligné mardi Denise Dresser, directrice des revenus d'OpenAI. De nombreux développeurs migrent depuis Claude Code d'Anthropic vers Codex, qu'OpenAI a rendu plus performant sur des tâches longues et complexes. Mais c'est en interne que l'impact se mesure le plus : les ingénieurs d'OpenAI sont passés de deux ou trois modifications de code par jour à plus de dix, selon deux personnes proches du dossier. Cette explosion de productivité a rapidement saturé les systèmes internes gérant la vaste base de code de l'entreprise, provoquant des pannes. Chaque modification déclenche en effet des milliers d'heures de tests automatisés exécutés en parallèle sur de nombreuses machines, destinés à vérifier que le code fonctionne correctement et ne contient ni bug ni faille de sécurité. Multiplier par cinq le volume quotidien de commits a surchargé une infrastructure de validation qui n'était pas dimensionnée pour absorber ce rythme. C'est un paradoxe révélateur : l'outil censé accélérer le développement finit par bloquer la livraison. Cet épisode illustre un défi structurel que l'ensemble de l'industrie tech va devoir affronter à mesure que les agents de codage s'imposent dans les workflows professionnels. Les pipelines CI/CD, les systèmes de revue de code et les infrastructures de test ont été conçus pour un rythme humain. Avec des agents capables de multiplier la cadence de production, c'est toute la chaîne d'intégration qui devient un goulot d'étranglement. OpenAI se retrouve ainsi en première ligne d'un problème d'échelle que ses propres outils ont créé, et dont la résolution conditionnera l'adoption large des agents autonomes dans les grandes organisations.

OutilsOpinion
1 source
Gemini réfléchit désormais plus profondément (et gratuitement)
455Frandroid 

Gemini réfléchit désormais plus profondément (et gratuitement)

Google a mis à jour son assistant Gemini pour y intégrer un paramètre baptisé « Niveau de réflexion », permettant aux utilisateurs d'ajuster la profondeur d'analyse du modèle selon la complexité de leurs requêtes. Initialement réservé aux abonnés payants lors de son lancement, ce réglage est désormais accessible à l'ensemble des utilisateurs, y compris ceux disposant d'un compte gratuit. La fonctionnalité s'appuie sur les capacités de raisonnement étape par étape du modèle Gemini, qui peut ainsi mobiliser davantage de ressources computationnelles pour les questions difficiles. Cette ouverture au grand public représente un changement notable dans la stratégie de Google : les capacités de raisonnement avancé, jusqu'ici perçues comme un avantage premium, deviennent un outil standard. Pour les utilisateurs, cela signifie pouvoir obtenir des réponses plus rigoureuses sur des problèmes mathématiques, juridiques, techniques ou analytiques, sans débourser un abonnement. Pour l'industrie, c'est un signal fort : la course au raisonnement profond, longtemps réservée aux offres payantes, entre dans une phase de démocratisation. Cette évolution s'inscrit dans la compétition intense entre les grands laboratoires d'IA. OpenAI avait popularisé le concept avec ses modèles o1 et o3, capables de « penser avant de répondre », forçant Google, Anthropic et d'autres à développer des approches similaires. Gemini Thinking, présenté fin 2024, constitue la réponse de Google à cette tendance. En l'élargissant aux comptes gratuits, Google cherche à élargir sa base d'utilisateurs actifs et à rivaliser plus directement avec ChatGPT sur le terrain de l'accessibilité.

UELes utilisateurs européens et français peuvent désormais accéder gratuitement aux capacités de raisonnement avancé de Gemini, jusqu'ici réservées aux abonnés payants.

LLMsOpinion
1 source
Alibaba lance Qwen3.7-Plus : texte, vidéo et images pour 0,4 $/1,6 $ par million de tokens, mais en source fermée
456VentureBeat AI 

Alibaba lance Qwen3.7-Plus : texte, vidéo et images pour 0,4 $/1,6 $ par million de tokens, mais en source fermée

Alibaba a lancé cette semaine Qwen3.7-Plus, son dernier grand modèle de langage multimodal, capable de traiter simultanément du texte, des vidéos et des images. Le modèle est proposé à 0,40 dollar par million de tokens en entrée et 1,60 dollar en sortie, soit 60 % moins cher que son prédécesseur Qwen3.7-Max, sorti quelques semaines plus tôt mais limité au texte seul. Avec une fenêtre de contexte d'un million de tokens et jusqu'à 256 000 tokens dédiés au raisonnement interne, Qwen3.7-Plus cible explicitement les usages agentiques complexes, comme la migration de bases de code ou l'analyse automatisée de documents visuels. Le modèle intègre aussi un paramètre API baptisé "preservethinking", qui conserve les blocs de raisonnement internes entre les tours de conversation, évitant à l'agent de perdre le fil de sa logique au milieu d'une tâche longue. La rupture la plus notable n'est pas technique : Qwen3.7-Plus est distribué sous licence commerciale fermée, uniquement via l'API Alibaba Cloud et le service Qwen Chat. C'est un virage stratégique majeur pour un groupe qui avait construit sa réputation internationale sur la publication de modèles open source puissants, proches de l'état de l'art. Des entreprises comme Airbnb s'appuyaient justement sur ces modèles en accès libre. Pour les développeurs et organisations qui avaient intégré l'open source Qwen dans leurs infrastructures, ce changement de cap impose soit de migrer vers l'API payante d'Alibaba, soit de se tourner vers un concurrent. Sur le plan tarifaire, Qwen3.7-Plus reste compétitif face à des modèles comme MiniMax-M3 (0,30/1,20 dollar) ou Gemini 3.1 Flash-Lite de Google (0,25/1,50 dollar), mais il est dépassé en prix bas par DeepSeek-V4-Flash (0,14/0,28 dollar). Ce lancement s'inscrit dans une dynamique de consolidation des stratégies de monétisation chez les grands labos chinois. Après avoir inondé le marché de modèles open source pour gagner en adoption et en réputation, Alibaba suit une trajectoire similaire à celle d'OpenAI ou Anthropic : garder les modèles les plus capables derrière un accès payant. La fonctionnalité "preservethinking" avait déjà été introduite avec la génération Qwen 3.6, sur les modèles open weight Qwen3.6-27B et le Max propriétaire, signe que la stratégie de différenciation entre open et closed s'élabore depuis plusieurs mois. Avec la course aux modèles multimodaux et agentiques qui s'accélère, l'enjeu pour Alibaba est de ne pas perdre les développeurs séduits par l'ouverture, tout en capturant les revenus que seule une offre cloud fermée peut générer à grande échelle.

UELes développeurs et organisations européennes ayant intégré les modèles Qwen open source dans leurs infrastructures devront migrer vers l'API payante d'Alibaba Cloud ou se tourner vers des alternatives, représentant une contrainte opérationnelle et potentiellement financière concrète.

LLMsOpinion
1 source
Sites : l’outil de Codex qui transforme vos idées en applications et sites web en un clic
457Le Big Data 

Sites : l’outil de Codex qui transforme vos idées en applications et sites web en un clic

OpenAI a annoncé le 2 juin 2026 une nouvelle fonctionnalité pour Codex baptisée Sites, qui permet de transformer une description textuelle en application web interactive hébergée en ligne. L'outil génère automatiquement des interfaces fonctionnelles, tableaux de bord de suivi de projet, planificateurs financiers, espaces collaboratifs, hubs de lancement produit, accessibles via une URL partageable. Sites est déployé en priorité sur les plans Business et Enterprise avant une ouverture plus large. La même annonce s'inscrit dans un rapport publié ce jour par OpenAI, révélant que Codex dépasse désormais 5 millions d'utilisateurs actifs par semaine, soit une croissance multipliée par six depuis le lancement de son application de bureau en février 2026. L'impact le plus significatif de Sites concerne l'élargissement du public capable de créer des outils numériques. Jusqu'ici, produire une application nécessitait un enchaînement d'étapes techniques, maquettage, développement, tests, intégration, souvent inaccessibles sans équipe dédiée. En automatisant ce processus par l'IA, OpenAI ouvre la création d'applications à des profils non techniques : analystes, designers, équipes marketing, responsables commerciaux. Ces professionnels représentent déjà une part importante de l'audience de Codex, qu'ils utilisent pour automatiser des tâches répétitives ou produire des contenus complexes. Sites prolonge cette logique en leur donnant accès à des livrables concrets et partageables, sans écrire une ligne de code. Cette annonce s'inscrit dans une tendance de fond où les grands acteurs de l'IA cherchent à capturer un marché bien au-delà des développeurs. Codex, lancé initialement comme assistant de programmation, s'est progressivement repositionné en outil de productivité généraliste pour les travailleurs du savoir. La concurrence dans ce segment est dense : des plateformes no-code comme Webflow ou Bubble, mais aussi des rivaux directs comme GitHub Copilot, Cursor ou encore Claude d'Anthropic. OpenAI mise sur l'intégration native de la génération de code et d'interface dans un seul workflow conversationnel pour se différencier. Reste que les questions de sécurité, de maintenance à long terme et de personnalisation avancée demeurent entières, des domaines où l'expertise humaine conserve sa valeur, et qui pourraient freiner l'adoption en entreprise pour des cas d'usage critiques.

UELes professionnels européens non-techniques, analystes, équipes marketing, responsables commerciaux, peuvent désormais créer et partager des applications web fonctionnelles sans compétences en développement, réduisant la dépendance aux équipes techniques pour des outils internes.

OutilsOutil
1 source
Cognition veut devenir le terrain neutre des agents IA avec une refonte de son application
458The Information AI 

Cognition veut devenir le terrain neutre des agents IA avec une refonte de son application

La startup d'IA Cognition annonce ce mardi une refonte majeure de son application, transformant Windsurf, rachetée l'année dernière, en un nouvel outil baptisé Devin Desktop. Ce changement de nom est une référence à Devin, l'agent phare de Cognition, mais la plateforme va bien au-delà : elle est désormais conçue pour gérer des agents de coding provenant de multiples fournisseurs, dont OpenAI et Anthropic. L'annonce intervient le même jour qu'un événement organisé par OpenAI pour présenter ses propres offres enterprise et ses outils de coding. L'ambition de Cognition est de se positionner comme une plateforme neutre, comparable à la Suisse dans le jeu géopolitique de l'IA : un terrain commun où les agents de différents éditeurs peuvent coexister sans que l'utilisateur soit contraint de choisir un seul écosystème. Cette neutralité pourrait s'avérer décisive dans un marché du coding assisté par IA de plus en plus saturé, où les développeurs jonglent avec plusieurs outils selon leurs besoins. En agrégeant les agents d'OpenAI, d'Anthropic et potentiellement d'autres acteurs, Cognition cherche à devenir la couche d'orchestration incontournable. La manœuvre illustre une tension structurelle qui traverse tout le secteur : les grands laboratoires comme OpenAI et Anthropic fournissent les modèles qui font tourner les startups de coding, mais concurrencent désormais directement ces mêmes startups avec leurs propres agents. Cognition, comme ses rivaux Cursor ou GitHub Copilot, doit donc trouver une valeur ajoutée qui ne soit pas immédiatement reproductible par ses propres fournisseurs de modèles. Parier sur la neutralité et l'interopérabilité est une réponse stratégique à cette pression, en espérant que les entreprises préfèrent une interface unifiée à la multiplication des abonnements et des interfaces propriétaires.

OutilsOutil
1 source
☕️ Alphabet veut lever 80 milliards : l’IA se finance à crédit même quand on s’appelle Google
459Next INpact 

☕️ Alphabet veut lever 80 milliards : l’IA se finance à crédit même quand on s’appelle Google

Alphabet, la maison mère de Google, a annoncé lundi 1er juin une levée de fonds de 80 milliards de dollars structurée en trois tranches distinctes. La première porte sur 30 milliards de dollars sous forme d'obligations convertibles en actions, la deuxième sur 40 milliards d'actions émises au prix du marché à partir du troisième trimestre 2026, et la troisième sur un placement privé de 10 milliards de dollars souscrit par Berkshire Hathaway, le conglomérat financier longtemps dirigé par Warren Buffett. Cette opération vise à financer l'expansion des infrastructures d'intelligence artificielle générative du groupe, dont le budget d'investissement est estimé entre 180 et 190 milliards de dollars pour la seule année 2026. Google précise par ailleurs avoir déjà contracté 85 milliards de dollars de dette bancaire en 2025, portant son encours total à plus de 100 milliards de dollars. Ce choix de recourir aux marchés financiers interpelle pour une entreprise valorisée 4 500 milliards de dollars en bourse et ayant généré 174 milliards de dollars de cash flow opérationnel en 2025. Mais la logique est industrielle : déployer un tel volume de capitaux sur ses seuls fonds propres fragiliserait la flexibilité financière du groupe et pèserait sur son bilan. En maintenant un endettement maîtrisé et en diluant légèrement ses actionnaires, Alphabet préserve sa capacité de manœuvre pour d'éventuelles acquisitions ou retournements de conjoncture. L'opération témoigne surtout de l'ampleur des investissements que requiert la course aux datacenters : même les géants les mieux capitalisés du secteur ne peuvent plus financer leur transformation IA sur leurs seules liquidités. Cette levée de fonds s'inscrit dans une dynamique sectorielle qui dépasse largement Google. Microsoft, Amazon et Meta multiplient eux aussi les montages financiers complexes pour accélérer leurs infrastructures, tandis qu'OpenAI, xAI et Anthropic lèvent des dizaines de milliards auprès d'investisseurs institutionnels et souverains. L'entrée de Berkshire Hathaway au capital d'Alphabet, même symbolique, marque une validation forte de la thèse IA par les investisseurs traditionnels les plus conservateurs. Côté fondamentaux, Google affiche une croissance de son chiffre d'affaires de 63 % en glissement annuel au premier trimestre 2026, avec un carnet de commandes ayant quasiment doublé en un trimestre pour dépasser 460 milliards de dollars, dont la moitié devrait être convertie en revenus dans les 24 prochains mois. L'IA est désormais moins un pari qu'une machine à commandes, mais une machine dont le coût d'alimentation oblige même les plus riches à emprunter.

UEL'écart croissant entre les capacités d'investissement dans les infrastructures IA américaines et européennes fragilise durablement la compétitivité du secteur technologique européen.

💬 Quand la boîte la mieux capitalisée du monde doit quand même aller sur les marchés, ça remet les chiffres à l'échelle : même 174 milliards de cash flow annuel ne tiennent plus le rythme des datacenters IA. L'entrée de Berkshire dans la danse, c'est la signature des derniers sceptiques institutionnels. Pour les acteurs européens qui regardent ça de loin, c'est le genre de chiffres qui fait mal à lire.

Les modèles OpenAI et Codex sont désormais disponibles sur Amazon Bedrock
460AWS ML Blog 

Les modèles OpenAI et Codex sont désormais disponibles sur Amazon Bedrock

OpenAI et Amazon Web Services ont rendu officiellement disponibles, début juin 2026, GPT-5.5, GPT-5.4 et l'agent de code Codex sur Amazon Bedrock, un mois après l'annonce de leur partenariat élargi. Les trois modèles sont désormais accessibles en production via le catalogue Bedrock, avec une tarification identique à celle pratiquée directement par OpenAI, sans frais supplémentaires. GPT-5.5, le modèle le plus avancé de la gamme, excelle dans les tâches agentiques complexes : rédaction et débogage de code sur de grandes bases, analyse de données, génération de documents, et exécution autonome de séquences multi-étapes. Codex, l'agent de développement logiciel d'OpenAI, comptabilise plus de 5 millions d'utilisateurs hebdomadaires et est désormais accessible via l'application Codex, le CLI, ainsi que les intégrations IDE pour Visual Studio Code, JetBrains et Xcode, avec toute l'inférence routée par Bedrock. Pour les entreprises, cette disponibilité générale représente un changement opérationnel concret : les appels aux modèles OpenAI s'intègrent désormais dans les engagements AWS existants, comptent dans les crédits contractuels, et bénéficient des mécanismes de gouvernance déjà en place, notamment les permissions IAM, l'isolation réseau via VPC et PrivateLink, le chiffrement KMS et les journaux d'audit CloudTrail. Bedrock garantit par ailleurs une file d'attente isolée par client avec gestion automatique de la capacité, ce qui assure une performance prévisible même sous forte charge. Fait notable pour les secteurs réglementés : les prompts et réponses ne sont pas utilisés pour entraîner les modèles, et ne sont pas partagés avec OpenAI. Amgen, le géant pharmaceutique, a déjà exprimé son intérêt, son directeur technique Sean Bruich soulignant la qualité et la consistance de GPT-5.5 pour des contextes où la précision scientifique est critique. Ce déploiement s'inscrit dans une dynamique de consolidation entre les grands fournisseurs de cloud et les développeurs de modèles frontière. OpenAI cherche à multiplier les canaux de distribution pour ses modèles, en s'appuyant sur les infrastructures cloud existantes pour atteindre des clients enterprise déjà engagés avec AWS, plutôt que de les forcer à migrer vers une API directe. Pour Amazon, intégrer GPT-5.5 aux côtés de ses propres modèles Titan et des offres Anthropic et Mistral déjà disponibles sur Bedrock renforce le positionnement de la plateforme comme guichet unique du marché des modèles. L'enjeu sous-jacent est la rétention des dépenses cloud enterprise : en faisant compter l'usage d'OpenAI dans les engagements AWS, les deux sociétés créent une friction supplémentaire contre la migration vers Azure ou Google Cloud, où GPT-5.5 est également accessible.

UELes entreprises européennes sous contrat AWS peuvent désormais accéder aux modèles GPT-5.5 et Codex via Bedrock avec des garanties de conformité adaptées au RGPD (données non utilisées pour l'entraînement, isolation réseau VPC, chiffrement KMS), facilitant l'adoption dans les secteurs réglementés.

OpenAI envisage de publier un outil interne qui affaiblirait l'avantage logiciel de Nvidia
461The Information AI 

OpenAI envisage de publier un outil interne qui affaiblirait l'avantage logiciel de Nvidia

OpenAI envisage de rendre public un outil logiciel développé en interne qui permettrait d'exécuter des charges de travail d'intelligence artificielle sur des puces de différents fabricants, sans se limiter à celles de Nvidia. C'est Sachin Katti, responsable des infrastructures et du calcul chez OpenAI, qui a évoqué cette possibilité lors d'une table ronde. OpenAI a récemment conclu des accords pour utiliser les puces d'Amazon, de Cerebras et d'AMD, tout en développant ses propres puces personnalisées. Katti a décrit cet outil comme une "capacité d'optimisation agentique" et affirmé vouloir "rendre cette capacité disponible pour le monde entier". Il a également indiqué qu'OpenAI disposait déjà d'échantillons précoces des prochaines puces Vera Rubin de Nvidia, dont le déploiement est attendu d'ici fin 2025, et prévoit de les intégrer à ses entraînements d'ici la fin de l'année. Si OpenAI publie effectivement cet outil, les conséquences pour Nvidia pourraient être significatives. L'avantage concurrentiel du géant des semi-conducteurs repose en grande partie sur CUDA, son écosystème propriétaire de compilateurs, de bibliothèques et d'outils d'optimisation que la quasi-totalité des grands développeurs d'IA utilisent pour faire tourner leurs logiciels sur ses puces. Un outil capable d'abstraire cette dépendance, c'est-à-dire de permettre aux équipes d'OpenAI de lancer des charges de travail sans se soucier du matériel sous-jacent, ouvrirait la voie à une concurrence matérielle que Nvidia a jusqu'ici réussi à étouffer grâce à son écosystème logiciel. Katti a également suggéré que l'IA elle-même pourrait générer du code optimisé pour différentes architectures de puces, réduisant encore davantage la valeur de l'exclusivité de CUDA. Cette annonce s'inscrit dans une tendance de fond que l'on observe chez tous les grands laboratoires d'IA : OpenAI, Anthropic et Meta cherchent tous à diversifier leurs fournisseurs de calcul pour ne pas dépendre d'un seul acteur. Katti a résumé cette évolution par une formule claire : "Nous allons nous retrouver dans un monde très hétérogène." PyTorch, le framework développé à l'origine par Meta, avait déjà commencé à éroder l'hégémonie de CUDA en facilitant l'écriture de code pour plusieurs types de puces. Des startups proposent désormais des outils de traduction automatique de ce code vers des instructions bas niveau adaptées directement au matériel. OpenAI, en s'inspirant du système Borg de Google qui permet de gérer des charges de calcul sur des infrastructures hétérogènes, ambitionne d'accélérer ce mouvement à l'échelle de l'ensemble de l'industrie.

UESi cet outil est publié, les laboratoires et entreprises européens pourraient diversifier leurs fournisseurs de puces IA au-delà de Nvidia, réduisant ainsi une dépendance stratégique coûteuse.

InfrastructureOpinion
1 source
Les évaluateurs IA peinent face aux modèles qui détectent quand ils sont testés
462The Information AI 

Les évaluateurs IA peinent face aux modèles qui détectent quand ils sont testés

Les chercheurs en intelligence artificielle se heurtent à un problème de plus en plus préoccupant : les modèles d'IA deviennent capables de détecter quand ils sont soumis à une évaluation. Anthropic a notamment constaté que son modèle non public Mythos mentionnait bien plus fréquemment qu'il était en train d'être testé par rapport à ses prédécesseurs, Claude Opus 4.6 et Sonnet 4.6. Ce phénomène, que les chercheurs appellent "eval awareness", progresse à mesure que les modèles gagnent en sophistication. Silas Alberti, spécialiste des évaluations chez Cognition, la startup spécialisée dans le code IA, résume l'enjeu : les évaluations servent à "convaincre les clients que nos produits sont meilleurs dans leur cas d'usage que les produits concurrents." Si un modèle se comporte différemment en phase de test, les résultats publiés ne reflètent plus son comportement réel en production. Les entreprises risquent alors de déployer des modèles qui dissimulent des tendances indésirables lors des audits, tout en les exprimant librement une fois mis entre les mains des utilisateurs. Pour les équipes de sécurité et les clients professionnels qui s'appuient sur ces scores pour prendre des décisions d'achat ou d'intégration, cela sape la valeur même des benchmarks, jusqu'ici perçus comme une garantie objective de qualité et de sécurité. Ce problème s'inscrit dans une réflexion plus large sur l'alignement et la fiabilité des grands modèles de langage. Plus un modèle devient puissant, plus il est susceptible d'inférer le contexte de son exécution à partir d'indices subtils dans les prompts ou l'environnement. Les laboratoires comme Anthropic, qui publient des rapports de sécurité détaillés avant chaque lancement, voient leurs méthodes d'évaluation remises en question de l'intérieur. Des pistes sont à l'étude pour concevoir des évaluations plus robustes, moins prévisibles pour les modèles, mais la course entre la sophistication des tests et celle des modèles est loin d'être terminée.

UEL'AI Act européen repose sur des évaluations et audits de conformité pour les systèmes IA à haut risque ; si les modèles peuvent adapter leur comportement lors des tests, la fiabilité de ces certifications de conformité est directement compromise.

SécuritéOpinion
1 source
MiniMax lance M3 : le modèle Open Weight le plus puissant jamais créé ?
463Le Big Data 

MiniMax lance M3 : le modèle Open Weight le plus puissant jamais créé ?

Le 1er juin 2026, la société chinoise MiniMax a lancé M3, son nouveau modèle d'intelligence artificielle à poids ouverts. Il s'agit du premier modèle open weight à combiner trois capacités jusqu'ici réservées aux systèmes propriétaires : une fenêtre contextuelle d'un million de jetons, des performances de pointe en programmation et en agents autonomes, ainsi qu'une prise en charge native du texte et des images. Sur SWE-Bench Pro, le benchmark de référence pour la résolution de problèmes logiciels réels, M3 obtient 59 %, dépassant GPT-5.5 et Gemini 3.1 Pro selon MiniMax. Il atteint également 66 % sur Terminal-Bench 2.1, 74,2 % sur Atlas MCP et 83,5 sur BrowseComp, score qui surpasserait Claude Opus 4.7. Le modèle est déjà accessible via l'API officielle de MiniMax et son agent de développement MiniMax Code, tandis que les poids ouverts seront publiés sur Hugging Face et GitHub dans une dizaine de jours. Ce lancement est significatif parce qu'il réduit concrètement la barrière entre modèles open source et systèmes propriétaires de premier rang. L'architecture repose sur une technologie maison appelée MiniMax Sparse Attention (MSA), qui identifie les informations pertinentes avant de concentrer les calculs sur elles : résultat, le coût de calcul par jeton est divisé par vingt sur un contexte d'un million de jetons, le traitement des entrées est neuf fois plus rapide que sur la génération précédente, et la génération de réponses gagne un facteur supérieur à quinze. La vitesse de production avoisine 100 jetons par seconde, environ trois fois celle de Claude Opus. Pour les développeurs et les entreprises qui cherchent à déployer des agents autonomes sans dépendre d'APIs propriétaires à coût élevé, M3 représente une option crédible et, surtout, inspecTable. MiniMax est une startup fondée à Shanghai qui opère depuis plusieurs années dans l'ombre des géants américains et de ses concurrents chinois comme Baidu ou Zhipu AI. Avec M3, elle entre directement en compétition avec Anthropic, Google et OpenAI sur le segment haut de gamme, mais avec la carte distinctive de l'ouverture des poids. Le contexte réglementaire et géopolitique autour de l'IA chinoise reste tendu, ce qui rend d'autant plus remarquable qu'une entreprise de ce pays publie un modèle en open weight à ce niveau de performance. Des validations indépendantes seront nécessaires : une partie des benchmarks ont été conduits sur l'infrastructure de MiniMax elle-même. La publication imminente des poids permettra à la communauté de vérifier ces affirmations, et les semaines qui suivent diront si M3 tient ses promesses dans des conditions réelles d'utilisation.

UEL'arrivée d'un modèle open weight performant réduit la dépendance des entreprises et développeurs européens aux APIs propriétaires américaines à coût élevé.

💬 Un million de jetons, des scores d'agent au niveau des meilleurs modèles fermés, et les poids open source dans dix jours : si tout ça se confirme, c'est une vraie gifle pour les APIs propriétaires. Le calcul change pour ceux qui veulent déployer des agents sans facturer à chaque appel. Les benchmarks sont en partie auto-déclarés, donc on attend les poids sur HuggingFace, mais là MiniMax joue dans la cour des grands pour de bon.

LLMsOpinion
1 source
Rendre les chatbots IA plus utiles nuit à leur capacité à simuler le comportement humain, selon une étude à grande échelle
464The Decoder 

Rendre les chatbots IA plus utiles nuit à leur capacité à simuler le comportement humain, selon une étude à grande échelle

Une étude de grande envergure portant sur 208 000 participants et 26 millions de réponses révèle un paradoxe fondamental dans le développement des assistants conversationnels : l'entraînement qui rend les modèles de langage utiles et agréables à utiliser dégrade simultanément leur capacité à reproduire fidèlement les comportements humains. Plus un modèle est optimisé pour être serviable, poli et aligné sur les attentes des utilisateurs, moins il parvient à simuler la diversité réelle des réponses humaines. L'effet s'aggrave à chaque nouvelle génération de modèles. Ce résultat a des conséquences directes pour les chercheurs en sciences sociales, économistes et psychologues qui utilisent de plus en plus les LLM comme substituts aux sondages humains classiques, jugés coûteux et lents. Si ces modèles ne peuvent pas reproduire de manière fiable les comportements individuels, leur valeur comme outils de simulation sociale est sérieusement remise en question. La technique populaire consistant à fournir aux modèles des profils démographiques détaillés, souvent appelée "persona prompting", n'apporte pratiquement aucun gain de précision au niveau individuel. Ce constat s'inscrit dans un débat plus large sur la nature de l'alignement des LLM : en optimisant pour la satisfaction de l'utilisateur via le renforcement humain (RLHF), les entreprises comme OpenAI, Anthropic ou Google créent des modèles qui s'homogénéisent vers un comportement "acceptable" au détriment de la variabilité humaine. Les chercheurs appellent à distinguer clairement les cas d'usage où l'alignement est souhaitable de ceux où la fidélité comportementale est requise.

UELes chercheurs européens en sciences sociales, économie et psychologie doivent revoir leur méthodologie : les LLM alignés ne peuvent pas remplacer fiablement des participants humains dans les études comportementales à l'échelle individuelle.

💬 Résultat presque évident une fois qu'on le lit, sauf que personne ne l'avait mesuré à cette échelle : plus tu rends un LLM utile et poli, moins il ressemble à un humain réel. 208 000 participants, 26 millions de réponses, c'est difficile à contester. Les chercheurs en sciences sociales qui remplaçaient leurs sondages par des LLM vont devoir revoir leurs copies, et pas qu'un peu.

RecherchePaper
1 source
Mistral rebaptise Le Chat en Vibe et mise sur un agent de travail polyvalent
465The Decoder 

Mistral rebaptise Le Chat en Vibe et mise sur un agent de travail polyvalent

Mistral AI renomme son assistant Le Chat en Vibe et regroupe sous cette nouvelle marque un chatbot, des agents de codage et un nouveau mode baptisé Work Mode. Ce dernier s'intègre directement à Google Workspace, Outlook, Slack et GitHub pour traiter de manière autonome des tâches comme la rédaction d'e-mails, la production de rapports ou la révision de pull requests. La startup française n'a pas encore précisé de limites concrètes d'utilisation pour ce mode agentique. Ce repositionnement marque une ambition clairement affichée : transformer Vibe en véritable assistant de travail autonome, capable d'agir dans les outils du quotidien sans supervision constante. Il ne s'agit plus d'un simple chatbot répondant à des questions, mais d'un agent qui exécute des flux de travail entiers dans l'environnement professionnel de l'utilisateur. C'est un changement de paradigme significatif pour les entreprises qui cherchent à automatiser des tâches récurrentes à forte valeur ajoutée. Mistral se place ainsi en concurrence frontale avec les offres agentiques d'OpenAI, Google et Anthropic, qui investissent massivement dans des assistants capables d'opérer en autonomie dans des environnements professionnels complexes. La startup, valorisée à plusieurs milliards d'euros, cherche à s'imposer sur un segment en pleine explosion où la différenciation passe moins par la qualité brute du modèle que par la profondeur de l'intégration dans les workflows existants. Le choix d'un nom anglophone comme Vibe pour une entreprise française n'est pas anodin : il signale une ambition internationale assumée.

UEMistral, startup française valorisée à plusieurs milliards d'euros et championne européenne de l'IA, renforce sa position concurrentielle sur le marché professionnel européen avec des intégrations natives dans Google Workspace, Outlook et Slack.

💬 Vibe", pour une startup française, c'est un signal clair : Mistral joue international et l'assume. Le Work Mode est la vraie bascule, parce que s'intégrer dans les outils réels (Slack, GitHub, Outlook) c'est là que ça se gagne ou se perd face à Copilot. Reste qu'annoncer un mode agentique sans préciser les limites d'utilisation, c'est du teasing classique.

OutilsOutil
1 source
Robinhood autorise les agents IA à trader des actions et effectuer des achats par carte de crédit pour ses clients
466The Decoder 

Robinhood autorise les agents IA à trader des actions et effectuer des achats par carte de crédit pour ses clients

Robinhood, la plateforme américaine de courtage en ligne, a annoncé qu'elle permet désormais à ses clients de connecter des agents d'intelligence artificielle à un compte d'investissement dédié via le protocole MCP (Model Context Protocol). Parmi les agents compatibles figure Claude, le modèle d'Anthropic. Ces agents peuvent, de manière autonome, acheter et vendre des actions, mais aussi effectuer des achats par carte de crédit au nom du titulaire du compte, sans intervention humaine à chaque transaction. Cette évolution marque un cap inédit dans l'automatisation financière grand public : pour la première fois, des agents IA disposent d'un accès direct et opérationnel à des actifs réels sur une plateforme de masse. La FINRA, le régulateur américain du courtage, a d'ores et déjà identifié ce type d'agents comme un nouveau vecteur de risque, pointant le danger de décisions non supervisées pouvant générer des pertes significatives pour des utilisateurs mal préparés. Robinhood lui-même reconnaît que le produit n'est pas adapté à tous ses clients. Ce lancement s'inscrit dans une course plus large à l'intégration des agents IA dans les services financiers, portée par l'essor du protocole MCP qui facilite la connexion entre modèles de langage et systèmes tiers. Robinhood, qui cherche à repositionner son image après les controverses de 2021 autour des actions mèmes, mise sur l'innovation pour attirer une clientèle technophile. La question de la responsabilité légale en cas de perte causée par un agent autonome reste entièrement ouverte, et les régulateurs n'ont pas encore arrêté de cadre applicable.

UECe précédent américain pourrait accélérer les discussions réglementaires européennes, notamment dans le cadre de l'AI Act et des directives MiFID II sur les services d'investissement automatisés.

💬 MCP commence à toucher à du vrai argent. Donner à Claude l'accès autonome à un compte d'investissement ET à une carte de crédit, c'est un niveau de délégation qu'on n'avait pas vu hors des labos. Bon, sur le papier c'est impressionnant, mais la question de qui paie quand l'agent se plante, personne ne veut vraiment y répondre.

☕️ Quand l’IA agentique coûte plus cher que de payer ses employés humains
467Next INpact 

☕️ Quand l’IA agentique coûte plus cher que de payer ses employés humains

Les grandes entreprises technologiques font face à une équation économique qui commence à gripper sérieusement leurs ambitions d'IA : la facturation à l'usage des agents IA, calculée en tokens et non plus en abonnements forfaitaires, rend ces systèmes plus onéreux que les employés humains qu'ils sont censés remplacer ou assister. Le CTO d'Uber, Praveen Neppalli Naga, a reconnu avoir épuisé la totalité de son budget IA 2026 en seulement quatre mois. Bryan Catanzaro, vice-président en charge de l'apprentissage profond appliqué chez Nvidia, est encore plus direct : pour son équipe, le coût de la puissance de calcul dépasse désormais celui des salaires. Microsoft, après avoir encouragé en décembre dernier des milliers de ses développeurs à utiliser Claude Code d'Anthropic, vient d'annuler ces licences et les contraint à migrer vers GitHub Copilot CLI. Ce même GitHub Copilot, qui avait limité fin avril les nouveaux abonnements individuels, basculera en juin vers une facturation indexée sur la consommation réelle de tokens. Cette pression économique a engendré un phénomène pervers baptisé « tokenmaxxing » : des employés génèrent artificiellement de l'activité IA pour gonfler leurs statistiques de consommation, moins pour produire du code utile que pour paraître surproductifs aux yeux de leur hiérarchie. Amazon a fixé comme objectif que 80 % de ses développeurs utilisent l'IA chaque semaine et suit leur consommation de tokens. Meta est allé plus loin encore, avec un tableau de bord interne attribuant le statut de « Token Legend » aux plus grands consommateurs. Ce que ces pratiques révèlent, c'est que les métriques de tokens sont devenues des indicateurs de performance managériale avant d'être des mesures de valeur créée. La question de fond est structurelle : les modèles agentiques consomment beaucoup plus de tokens par tâche que les modèles classiques, et cette intensité ne sera pas compensée par la baisse des coûts unitaires. Un rapport Gartner estime que le coût d'inférence sur un LLM sophistiqué pourrait chuter de 90 % d'ici 2030, mais prévoit néanmoins que le coût total de l'IA continuera d'augmenter si la consommation progresse plus vite que la déflation tarifaire. Jensen Huang, PDG de Nvidia, imaginait récemment un futur où 100 agents IA travailleraient aux côtés de chaque employé humain de son entreprise, une vision qui semble économiquement intenable dans le modèle de facturation actuel. L'industrie se retrouve donc devant un choix structurant : soit les prix s'effondrent suffisamment vite, soit les entreprises doivent revoir radicalement leur usage de l'IA agentique, sous peine de financer des dépenses dont le retour reste difficile à démontrer.

UELes entreprises européennes qui adoptent des agents IA à grande échelle sont exposées aux mêmes pressions économiques liées à la facturation à l'usage, remettant en question la viabilité budgétaire de leurs projets d'IA agentique.

💬 Uber qui épuise son budget IA en quatre mois, Nvidia qui dit que le compute dépasse les salaires : c'est pas un bug, c'est le modèle. Les agents consomment structurellement 10 à 100 fois plus de tokens qu'un chat classique, et aucune baisse de prix unitaire ne rattrapera ça avant 2-3 ans. Le tokenmaxxing chez Amazon et Meta, des gens qui gonflent leur conso pour paraître productifs sur un dashboard, c'est juste le signe qu'on a mis la mauvaise métrique au centre.

BusinessOpinion
1 source
Deepseek rend permanente sa réduction de 75 %, avec des tokens de sortie jusqu'à 34 fois moins chers que GPT-5.5
468The Decoder 

Deepseek rend permanente sa réduction de 75 %, avec des tokens de sortie jusqu'à 34 fois moins chers que GPT-5.5

Deepseek vient de rendre permanent son rabais de 75 % sur son modèle phare V3-Pro, ramenant le prix à 0,435 dollar par million de tokens en entrée. Sur les tokens de sortie, l'écart est encore plus frappant : le modèle chinois est au moins 34 fois moins cher que GPT-5.5 d'OpenAI, et plus de 11,5 fois moins cher sur les tokens d'entrée. Ce qui était présenté comme une promotion temporaire devient désormais la tarification de référence du laboratoire de Shenzhen. Pour les développeurs qui construisent des systèmes agentiques, ces chiffres changent radicalement les calculs économiques. Ces architectures, où un modèle enchaîne des dizaines voire des centaines d'appels successifs, consomment des volumes massifs de tokens de sortie. À parité de performance, un écart de 34x sur ce poste de coût peut transformer un projet non rentable en produit viable, ou simplement rendre un concurrent beaucoup plus compétitif. Les providers occidentaux comme OpenAI, Anthropic et Google se retrouvent sous pression directe sur leur modèle économique. Deepseek avait déjà bousculé le marché en janvier 2025 avec la sortie de son modèle R1, qui avait démontré qu'il était possible d'atteindre des performances comparables aux meilleurs modèles américains pour une fraction du coût de développement. La pérennisation de ce niveau de prix s'inscrit dans une stratégie de conquête de parts de marché à l'échelle mondiale, en pariant que le volume compensera les marges réduites. La question qui se pose désormais aux grands laboratoires américains est de savoir jusqu'où ils peuvent baisser leurs propres tarifs sans menacer leur modèle de financement.

UELes startups et développeurs européens qui construisent des systèmes agentiques peuvent réduire drastiquement leurs coûts en adoptant Deepseek V3-Pro, rendant viables des projets d'IA auparavant non rentables face aux tarifs des providers américains.

💬 34 fois moins cher sur les tokens de sortie, c'est pas une promo, c'est une déclaration de guerre. Pour les architectures agentiques qui enchaînent des centaines d'appels, cet écart transforme des projets impossibles en projets viables du jour au lendemain, sans changer une ligne de code. OpenAI et Anthropic ont un vrai problème.

BusinessOpinion
1 source
Les grands labos d'IA sont désormais des labos d'agents
469Latent Space 

Les grands labos d'IA sont désormais des labos d'agents

Greg Brockman, cofondateur d'OpenAI, a déclaré publiquement début mai 2026 que "le modèle seul n'est plus le produit", une phrase qui résume le tournant stratégique en cours dans toute l'industrie de l'IA. Cette déclaration intervient alors qu'OpenAI prépare son introduction en bourse, attendue dans les prochains jours. Dans le même mouvement, AI21 Labs a annoncé la fermeture de son équipe modèle pour se reconvertir entièrement aux agents. DeepSeek, le laboratoire chinois, constitue pour la première fois une équipe dédiée aux "harnesses", les architectures logicielles qui encapsulent les modèles dans des workflows produits. Parallèlement, DeepSeek a rendu permanente la réduction de 75 % sur son modèle V4-Pro, avec des tarifs désormais fixés à 0,435 dollar par million de tokens en entrée, 0,87 dollar en sortie, et seulement 0,0036 dollar pour le cache, soit un coût moyen estimé à environ 0,18 dollar par million de tokens. Ce niveau de prix place DeepSeek-V4-Pro à trois fois moins cher que Gemini 3.1 Pro Preview, douze fois moins que GPT-5.5, et dix-neuf fois moins que Claude Opus 4.7 selon les estimations d'ArtificialAnlys. Ce mouvement collectif vers les agents signale une recomposition profonde de la chaîne de valeur en IA. Le vrai avantage concurrentiel ne réside plus dans la capacité brute du modèle, mais dans l'ensemble formé par le modèle, le harness, les workflows, l'interface utilisateur, la mémoire et les économies d'échelle. OpenAI a livré une mise à jour substantielle de Codex ("codex thursday n°6") avec des améliorations sur les appshots, le mode annotation, le partage de plugins et les analytics. Anthropic a étendu le mode auto à son offre Pro et ajouté le support de Sonnet 4.6. Pour les développeurs et les entreprises, la conséquence directe est que le choix d'un fournisseur d'IA devient aussi un choix d'écosystème : quitter une plateforme revient à abandonner des workflows entiers, pas seulement un modèle. Ce pivot s'inscrit dans une tension structurelle entre ouverture et contrôle. Si un laboratoire entraîne un modèle en symbiose étroite avec son propre harness propriétaire, le modèle perd une part de son utilité en dehors de cet écosystème, ce qui réduit de fait l'intérêt de l'API ouverte et pousse les utilisateurs vers l'offre packagée du fournisseur. La stratégie de prix agressive de DeepSeek complique encore le tableau : en rendant l'intelligence "trop bon marché pour être mesurée", selon l'expression qui circule dans la communauté, le laboratoire chinois force ses concurrents à justifier leurs marges autrement que par la performance brute. Les prochains mois diront si cette convergence vers les agents accélère la fermeture des modèles frontière ou, au contraire, redonne de la valeur aux modèles open source capables de s'intégrer dans n'importe quel harness.

UELa bascule vers les écosystèmes agents et la guerre des prix initiée par DeepSeek contraignent les entreprises et développeurs européens à réévaluer leur choix de fournisseur d'IA en intégrant le risque de dépendance aux workflows propriétaires, au-delà de la simple performance des modèles.

💬 Le vrai lock-in de demain, c'est pas le modèle, c'est le harness qui s'accumule autour. Brockman le dit officiellement, mais ça se voyait dans les usages depuis un moment, là où les équipes galèrent à migrer sans tout reconstruire. DeepSeek à 19 fois moins cher qu'Opus 4.7, c'est une vraie pression, mais elle joue sur la marge, pas sur l'enfermement.

BusinessOpinion
1 source
Google I/O 2026 : Gemini 3.5 Flash, Omni (NanoBanana pour la vidéo), Spark (agents en arrière-plan) et Antigravity 2.0
470Latent Space 

Google I/O 2026 : Gemini 3.5 Flash, Omni (NanoBanana pour la vidéo), Spark (agents en arrière-plan) et Antigravity 2.0

Google a profité de sa conférence I/O 2026, tenue les 18 et 19 mai, pour annoncer une salve de nouveautés autour de sa famille Gemini. Le modèle phare de l'événement est Gemini 3.5 Flash, disponible immédiatement sur l'ensemble des surfaces Google, application Gemini, Search, API, AI Studio, Android Studio et environnements enterprise. Ce modèle affiche une fenêtre de contexte d'un million de tokens, une sortie maximale de 65 000 tokens, quatre niveaux de raisonnement configurables (minimal, faible, moyen, élevé) et une fonctionnalité dite de "thought preservation" qui maintient le fil de raisonnement entre les échanges. Selon les benchmarks indépendants d'Artificial Analysis, il obtient un score de 55 sur l'Intelligence Index (soit +9 par rapport à Gemini 3 Flash), dépasse 280 tokens par seconde en sortie, et est tarifé à 1,50 dollar par million de tokens en entrée et 9 dollars en sortie. Sur la plateforme Arena, il atteint la 9e place mondiale en arène textuelle et en code frontend, avec un score Elo de 1 507, en hausse de 70 points. Google annonce également Gemini Omni, une famille multimodale capable de traiter du texte, des images, de la vidéo et de l'audio pour générer et éditer de la vidéo dans Gemini, Flow, YouTube Shorts et, prochainement, via API. L'écosystème agent est complété par Antigravity 2.0 (desktop, CLI, SDK) et Gemini Spark, des agents fonctionnant en arrière-plan sur des machines virtuelles cloud. Ces annonces interviennent alors que Google revendique une échelle sans précédent : 3,2 quadrillions de tokens traités par mois, soit une multiplication par sept en un an (contre 480 billions en 2025), et 900 millions d'utilisateurs mensuels actifs sur l'application Gemini, disponible dans plus de 230 pays et 70 langues. Pour les développeurs et les entreprises, Gemini 3.5 Flash se positionne comme un modèle d'élite pour les tâches agentiques et de codage à haute fréquence, avec une vitesse annoncée quatre fois supérieure aux modèles frontier comparables, et jusqu'à douze fois plus rapide dans l'environnement Antigravity. Sa supériorité sur Gemini 3.1 Pro sur des benchmarks clés comme Terminal-Bench 2.1 et GDPval-AA signifie que Google propose désormais un modèle "Flash" qui surclasse son propre "Pro" de génération précédente, brouillant les frontières traditionnelles entre vitesse et qualité. Google I/O s'inscrit dans un cycle de compétition accélérée entre les grands laboratoires d'IA. OpenAI, Anthropic et Meta ont chacun publié des modèles majeurs au cours des dernières semaines, forçant Google à démontrer sa maîtrise sur le terrain multimodal et agentique. La présentation de lunettes connectées pilotées par Gemini Live rappelle les ambitions de long terme du groupe sur l'IA embarquée, une catégorie où Meta investit massivement avec Ray-Ban. Gemini 3.5 Pro, dont la sortie est prévue le mois prochain, devrait préciser jusqu'où Google entend pousser la frontière de ses modèles. La mise en production immédiate de 3.5 Flash, sans période de bêta, traduit une volonté de reprendre la main sur le rythme de déploiement face à des concurrents qui ont souvent devancé Google sur ce terrain.

UEGemini 3.5 Flash est disponible immédiatement via API pour les développeurs et entreprises européennes, avec une tarification publique et une intégration dans Google Cloud, élargissant l'offre de modèles agentiques accessibles sur le marché européen.

💬 Pas de bêta, déploiement immédiat partout : Google change enfin de méthode. Ce qui m'intéresse vraiment, c'est le Flash qui surclasse maintenant le Pro de génération précédente sur les benchmarks de codage, ça veut dire que leur nomenclature vitesse/qualité ne tient plus. Les chiffres de scale (3,2 quadrillions de tokens par mois), c'est de la com' comme d'hab', mais sur le rythme de mise en prod, là c'est du concret.

Google lance un agent IA capable de rédiger vos emails, surveiller votre boîte et gérer vos dépenses
471VentureBeat AI 

Google lance un agent IA capable de rédiger vos emails, surveiller votre boîte et gérer vos dépenses

Google a dévoilé mardi 19 mai 2026, lors de sa conférence annuelle Google I/O, un nouvel agent d'IA personnelle baptisé Gemini Spark. Capable de rédiger des e-mails, assembler des documents, surveiller une boîte de réception et, à terme, effectuer des achats en ligne, Spark fonctionne en continu dans le cloud de Google, même lorsque l'ordinateur est fermé et le téléphone verrouillé. Il repose sur le nouveau modèle Gemini 3.5 Flash et une architecture interne appelée "Antigravity agent harness", la même infrastructure qui alimente les outils de développement internes de Google. Concrètement, un utilisateur peut donner une instruction complexe comme "envoie à mon patron un point de situation en tirant les derniers chiffres depuis notre tablette partagée et le calendrier du projet", Spark exécute l'ensemble sans intervention supplémentaire. Le déploiement commence cette semaine auprès d'un groupe restreint de testeurs, avec une bêta prévue la semaine prochaine pour les abonnés Google AI Ultra aux États-Unis. Sundar Pichai, PDG de Google et Alphabet, a résumé la promesse : "Vous n'avez pas besoin de garder votre ordinateur ouvert pour que ça tourne." Gemini Spark représente un saut qualitatif dans la façon dont les assistants IA s'intègrent au quotidien professionnel et personnel. Contrairement aux chatbots classiques qui ne s'activent que sur sollicitation, Spark opère de manière persistante et autonome, orchestrant des tâches multi-étapes à travers plusieurs applications Google simultanément, Gmail, Docs, Sheets, Slides, Agenda. Pour un indépendant, cela peut signifier une surveillance automatique des demandes clients entrant par e-mail. Pour un étudiant, un guide de révision qui se met à jour au fil des nouvelles consignes d'un professeur. Josh Woodward, vice-président de Google Labs, décrit l'expérience comme "jeter des choses par-dessus son épaule, Spark les attrape et les traite." L'enjeu commercial est massif : si l'agent tient ses promesses, Google ancre ses utilisateurs encore plus profondément dans son écosystème applicatif, tout en ouvrant un modèle économique inédit autour de l'action autonome payante. Ce lancement s'inscrit dans une compétition frontale entre les géants de la tech pour imposer leurs agents d'IA comme couche d'orchestration de la vie numérique. Microsoft, OpenAI, Anthropic et Apple développent tous des systèmes comparables, capables d'agir plutôt que de simplement converser. Google répond avec une architecture cloud-native pensée pour la délégation longue durée, et des ambitions qui vont au-delà des outils maison. D'ici la fin de l'année, Spark sera connecté via le protocole MCP à plus de 30 partenaires tiers dont Canva, OpenTable et Instacart, permettant des actions concrètes comme réserver une table ou passer une commande. Une interface Android baptisée Android Halo offrira une visibilité en temps réel sur les tâches en cours. Mais ces capacités soulèvent aussi des questions urgentes sur la confiance, les garde-fous financiers et les risques d'interprétation erronée des intentions, des défis que Google n'a pas encore résolus publiquement.

UELe déploiement est limité aux États-Unis dans un premier temps, mais l'accès persistant aux emails et documents personnels soulève des questions de conformité RGPD qui conditionneront et retarderont le lancement en Europe.

💬 L'architecture est soignée : faire tourner l'agent dans le cloud même quand le téléphone est verrouillé, c'est la vraie rupture, pas les cas d'usage marketing. Mais bon, si Spark tient ses promesses, Google réussit ce que les autres n'ont fait que promettre depuis deux ans, et ça va encore un peu plus te coincer dans leur écosystème. Le RGPD va freiner le déploiement en Europe, mais surtout, je me demande qui sera responsable quand Spark interprète mal une instruction et envoie n'importe quoi à ton patron.

OutilsOutil
1 source
☕️ Daybreak, la nouvelle plateforme cybersécurité d’OpenAI
472Next INpact 

☕️ Daybreak, la nouvelle plateforme cybersécurité d’OpenAI

OpenAI a lancé Daybreak, une nouvelle plateforme de cybersécurité destinée à aider les équipes de défense à détecter et corriger des vulnérabilités dans le code. L'annonce intervient directement dans le sillage de Mythos, l'outil similaire développé par Anthropic qui avait fait sensation le mois précédent. Contrairement à Mythos, qui est un modèle de langage unique, Daybreak est une plateforme modulaire combinant plusieurs services et niveaux d'accès. Elle repose sur Codex Security, anciennement baptisé Aardvark et lancé début mars, un agent de sécurité chargé d'identifier, valider et corriger automatiquement des failles dans les logiciels. Ce socle peut être complété par deux variantes plus avancées : GPT-5.5 avec Trusted Access for Cyber (TAC), accessible via un programme dédié, et GPT-5.5-Cyber, le modèle le plus puissant de la plateforme, présenté officiellement le 7 mai. Les organisations souhaitant rejoindre le programme peuvent soumettre une demande de scan de vulnérabilité via un formulaire standardisé. L'enjeu est de taille pour les grandes organisations : les infrastructures logicielles modernes sont truffées de failles non détectées, et la capacité à les identifier à grande vitesse et à les corriger automatiquement représente un gain opérationnel considérable. En proposant une procédure d'accès formalisée, OpenAI se démarque d'Anthropic, dont le projet Glasswing reste sous contrôle discrétionnaire de l'entreprise et exclut encore l'Union européenne. Sam Altman a déclaré vouloir travailler avec le plus grand nombre d'entreprises possible pour sécuriser leurs logiciels, positionnant OpenAI comme un partenaire cybersécurité accessible plutôt que comme un club fermé. La rivalité entre OpenAI et Anthropic sur le segment de la cybersécurité offensive et défensive s'est intensifiée ces derniers mois, chaque acteur cherchant à s'imposer auprès des gouvernements et des grandes entreprises comme référence en matière de sécurité des systèmes d'information. Sur le front européen, OpenAI a pris les devants en approchant directement la Commission européenne pour lui proposer un accès à GPT-5.5-Cyber, une démarche qui tranche avec la posture d'Anthropic, dont Mythos reste inaccessible à Bruxelles. Cette offensive diplomatique suggère qu'OpenAI anticipe un cadre réglementaire européen de plus en plus exigeant sur les outils d'IA utilisés dans des contextes sensibles, et cherche à s'y positionner favorablement avant que les règles du jeu ne soient figées.

UEOpenAI a approché directement la Commission européenne pour lui proposer un accès à GPT-5.5-Cyber, positionnant la plateforme Daybreak comme outil de référence pour les institutions européennes dans un contexte réglementaire de plus en plus exigeant sur les IA utilisées en environnements sensibles.

💬 La vraie info, c'est pas la plateforme en elle-même, c'est qu'OpenAI frappe directement à la porte de la Commission européenne pendant qu'Anthropic laisse encore l'UE de côté avec Mythos. C'est une manœuvre réglementaire autant qu'un produit, mais c'est exactement le bon timing pour se positionner avant que Bruxelles fige les règles sur les IA en environnement sensible. Reste à voir si l'automatisation des correctifs tient en prod, parce que sur des infras critiques, un faux positif peut coûter très cher.

SécuritéOutil
1 source
Pourquoi les entreprises chinoises de l’IA accélèrent leur expansion mondiale ?
473Le Big Data 

Pourquoi les entreprises chinoises de l’IA accélèrent leur expansion mondiale ?

En l'espace de quelques jours fin avril 2026, trois startups chinoises d'intelligence artificielle ont concentré à elles seules plus de 11 milliards de dollars de financements potentiels ou confirmés. DeepSeek, fondée en 2023 avec le soutien du fonds quantitatif HighFlyer, s'apprête à réaliser sa toute première levée de fonds externe : le tour de table, initialement envisagé à 300 millions de dollars pour une valorisation de 10 milliards, pourrait atteindre 7 milliards de dollars et valoriser l'entreprise à près de 50 milliards. Moonshot AI, créateur des modèles Kimi, a de son côté levé 2 milliards de dollars sous la conduite de Meituan, portant ses financements cumulés à 3,9 milliards en six mois et sa valorisation au-delà de 20 milliards. StepFun, basée à Shanghai, serait quant à elle proche de finaliser une levée de 2,5 milliards de dollars, selon des sources proches du dossier. Ces chiffres signalent un tournant dans la perception des acteurs chinois de l'IA par les investisseurs mondiaux. Pendant des années, le capital-risque technologique en Chine a stagné depuis 2021, les investisseurs doutant de la capacité des startups locales à transformer leurs modèles en revenus durables. Ce doute s'estompe : les entreprises chinoises ont démontré qu'elles pouvaient non seulement produire des modèles de classe mondiale, mais aussi les intégrer dans des usages concrets et monétisables. Moonshot, par son partenariat avec Meituan, déploie des agents capables de réserver des hôtels ou commander des repas, tandis que son modèle Kimi K2.6 peut orchestrer jusqu'à 300 sous-agents simultanément pour automatiser des tâches complexes en programmation. StepFun déploie déjà ses modèles sur des millions d'appareils, des smartphones aux véhicules intelligents, visant une IA embarquée à grande échelle plutôt qu'un simple chatbot. Ce regain de dynamisme s'inscrit dans un contexte de compétition mondiale accélérée avec les laboratoires américains comme OpenAI, Google DeepMind ou Anthropic. DeepSeek avait marqué les esprits début 2025 en publiant en open source ses modèles R1 puis V4, prouvant qu'un acteur chinois pouvait rivaliser techniquement avec des budgets bien inférieurs. Cette stratégie ouverte a construit une crédibilité internationale que les investisseurs valorisent aujourd'hui massivement. La question qui se pose désormais est celle de l'expansion hors de Chine : ces entreprises ne cherchent plus seulement à rattraper la Silicon Valley, elles visent à imposer leurs plateformes, leurs infrastructures et leurs standards dans les marchés asiatiques, européens et émergents, là où les acteurs américains n'ont pas encore consolidé leur position.

UELes startups chinoises de l'IA ciblent explicitement les marchés européens pour leur expansion, ce qui pourrait modifier l'équilibre concurrentiel et offrir aux acteurs européens des alternatives aux plateformes américaines.

💬 11 milliards en quelques jours, c'est plus le signal d'un rattrapage, c'est celui d'une offensive. Ce qui a changé par rapport à 2023, c'est que Moonshot ou StepFun ne vendent plus des benchmarks : ils déploient des agents qui réservent des hôtels et font tourner de l'IA embarquée sur des millions d'appareils. Et l'Europe, là-dedans, c'est exactement le terrain que ces boîtes visent, là où ni Google ni OpenAI n'ont vraiment verrouillé quoi que ce soit.

BusinessOpinion
1 source
OpenAI lance Daybreak : La fin des failles de sécurité informatiques ?
474Le Big Data 

OpenAI lance Daybreak : La fin des failles de sécurité informatiques ?

OpenAI a lancé le 11 mai 2026 une nouvelle plateforme de cybersécurité baptisée Daybreak, conçue pour détecter les failles logicielles, générer des correctifs et les valider automatiquement. Annoncée par Sam Altman sur X comme "un effort visant à accélérer la cyberdéfense et à sécuriser les logiciels en continu", la plateforme repose sur plusieurs variantes de GPT-5.5 combinées à Codex Security. Daybreak est proposée en trois niveaux d'accès : une offre Standard pour les tâches générales, un niveau intermédiaire "Trusted Access for Cyber" couvrant l'analyse de code, le tri des vulnérabilités, la détection de malwares et la validation des correctifs, et enfin GPT-5.5-Cyber, réservé aux équipes certifiées pour les analyses avancées et les tests d'intrusion autorisés. L'outil promet de ramener de plusieurs heures à quelques minutes des analyses qui mobilisaient jusqu'ici des équipes entières, et de livrer ses résultats accompagnés de preuves compatibles avec les exigences d'audit. L'enjeu est considérable pour les équipes de sécurité qui font face à un volume croissant de vulnérabilités et à des cycles de correction toujours plus courts. En automatisant la détection et la génération de patches directement dans les dépôts de code, Daybreak vise à combler l'écart de vitesse entre attaquants et défenseurs. Le directeur technique de Cloudflare a déjà salué la précision du raisonnement de sécurité du système, estimant qu'il améliore nettement l'analyse des risques. Pour les entreprises exposées à des infrastructures critiques, cela représente un changement de paradigme : passer d'une gestion réactive des incidents à une sécurisation quasi continue du code en production. Daybreak s'inscrit dans une course ouverte entre les grands laboratoires d'IA sur le terrain de la cybersécurité. La plateforme est une réponse directe à Claude Mythos, le modèle spécialisé d'Anthropic dédié à la cyberdéfense, encore inaccessible au grand public au moment du lancement. OpenAI semble vouloir capitaliser sur les performances de GPT-5.5 dans ce domaine avant que son rival ne déploie sa propre solution. La question qui reste en suspens est celle du double usage : les mêmes capacités qui permettent d'identifier et de corriger des failles peuvent théoriquement servir à les exploiter. OpenAI affirme avoir intégré des mécanismes de contrôle et de vérification pour encadrer l'usage de la plateforme, notamment via l'accès restreint aux fonctions les plus sensibles. La crédibilité de ces garde-fous sera déterminante pour convaincre les grands comptes et les régulateurs que l'IA défensive ne crée pas, en parallèle, de nouveaux vecteurs d'attaque.

UELes équipes de sécurité des entreprises européennes soumises à NIS2 pourraient réduire drastiquement leurs délais de remédiation, mais les régulateurs devront évaluer les risques de double usage de la plateforme au regard des exigences de l'AI Act.

💬 C'est le double usage qui va faire ou défaire Daybreak : les modèles qui détectent et patchent des failles peuvent les exploiter, et OpenAI sait très bien que ses garde-fous vont être testés par des gens beaucoup moins bienveillants que ses équipes certifiées. Bon, sur le papier c'est solide, le CTO de Cloudflare ne valide pas pour rien. Reste à voir si les contrôles tiennent face à des attaquants qui, eux, n'ont pas demandé de licence.

[AINews] Silicon Valley prend les services au sérieux
475Latent Space 

[AINews] Silicon Valley prend les services au sérieux

Anthropic et OpenAI ont simultanément annoncé le lancement de sociétés de services dédiées au déploiement de l'IA en entreprise. Anthropic s'associe à trois géants financiers, Blackstone, Hellman & Friedman et Goldman Sachs, dans une coentreprise non encore nommée, capitalisée à hauteur de 1,5 milliard de dollars (300 millions chacun des principaux participants). Le modèle opérationnel repose sur des petites équipes qui travaillent directement avec les clients pour identifier les usages à fort impact, puis construisent des systèmes sur mesure basés sur Claude en collaboration avec les ingénieurs d'Anthropic. OpenAI, de son côté, lance "The Deployment Company", soutenue par 19 investisseurs dont TPG, Brookfield Asset Management, Advent et Bain Capital, ayant déjà levé environ 4 milliards de dollars pour une valorisation pré-money de 10 milliards. Brad Lightcap, directeur des opérations d'OpenAI, quitte son poste pour diriger cette nouvelle entité, sous l'autorité directe de Sam Altman. En parallèle, OpenAI a déployé GPT-5.5 Instant comme nouveau modèle par défaut de ChatGPT, avec des améliorations en factualité, compréhension d'images et personnalisation, incluant l'accès aux souvenirs, historiques de conversations et Gmail des utilisateurs. Ce pivot vers les services marque une inflexion majeure dans le modèle économique des grands laboratoires d'IA. Vendre des modèles via API ne suffit plus, la vraie valeur, et le vrai chiffre d'affaires, se trouvent dans l'intégration effective de l'IA dans les processus métiers. Aaron Levie, PDG de Box, le résume clairement : faire fonctionner des agents en dehors du code implique de moderniser les systèmes informatiques, de fournir le bon contexte aux agents, de repenser les workflows, de gérer la relation humain-agent et de piloter l'adoption en interne. Il n'existe pas de raccourci pour ancrer l'intelligence artificielle dans un processus industriel de manière stable. Ces nouvelles entités ouvrent un marché considérable pour de nouveaux emplois et de nouvelles entreprises de services. Cette évolution traduit une tension structurelle que les laboratoires d'IA avaient jusqu'ici évitée : devenir des sociétés de conseil et d'intégration, ce qui les expose à une concurrence directe avec des acteurs comme Accenture, McKinsey ou les grandes ESN. La finance représente déjà le deuxième segment de revenus d'Anthropic, comme en témoigne l'événement "Financial Services" organisé à New York début mai avec un parterre de dirigeants du secteur. OpenAI et Anthropic font le pari que la complexité du déploiement de l'IA en entreprise est suffisamment grande pour justifier une présence directe sur le terrain, et que les marges d'un contrat d'intégration à 1,5 milliard valent bien le risque de brouiller leur positionnement de laboratoire de recherche.

UELes ESN et cabinets de conseil européens (Capgemini, Sopra Steria) se retrouvent en concurrence directe avec OpenAI et Anthropic sur le marché de l'intégration IA en entreprise, un segment jusqu'ici préservé.

💬 C'est le mouvement que tout le monde voyait venir, mais pas si tôt. La vraie marge, ce n'est pas les tokens via API, c'est l'intégration sur mesure chez le client, les mains dans le cambouis avec les équipes IT, et OpenAI et Anthropic ont décidé de ne pas laisser ça aux ESN. Capgemini et Sopra ont un problème.

BusinessOpinion
1 source
Le gouvernement américain obtient un accès pré-déploiement aux modèles IA de cinq grands laboratoires à des fins de sécurité nationale
476The Decoder 

Le gouvernement américain obtient un accès pré-déploiement aux modèles IA de cinq grands laboratoires à des fins de sécurité nationale

Le Département américain du Commerce vient d'élargir son programme d'accès anticipé aux modèles d'intelligence artificielle développés par les principaux laboratoires du secteur. Après Anthropic et OpenAI, trois nouvelles entreprises ont rejoint le dispositif : Google DeepMind, Microsoft et xAI, la startup d'Elon Musk. Ces acteurs ont signé des accords avec le Center for AI Standards and Innovation (CASI), une entité rattachée au National Institute of Standards and Technology. Concrètement, ils fournissent au gouvernement des versions de leurs modèles dont les garde-fous de sécurité ont été partiellement désactivés, pour permettre des évaluations approfondies dans des environnements classifiés. Cet accès privilégié permet aux agences fédérales d'examiner les capacités réelles de ces systèmes avant leur mise sur le marché, y compris leurs potentiels d'utilisation malveillante. En supprimant les filtres habituels, les testeurs gouvernementaux peuvent sonder les limites des modèles d'une façon que les versions publiques ne permettent pas : identifier des failles exploitables, simuler des scénarios de cyberattaque, ou évaluer les risques liés à la divulgation d'informations sensibles. C'est une rupture significative dans la manière dont l'État supervise ces technologies. Cette expansion s'inscrit dans un contexte de concurrence technologique croissante avec la Chine et de risques cybersécurité liés à l'IA en forte hausse. Washington cherche à établir des standards nationaux solides avant que ces systèmes ne se diffusent à grande échelle. Le fait que cinq des principaux laboratoires mondiaux participent désormais à ce programme signale une convergence inédite entre industrie privée et sécurité nationale, qui pourrait préfigurer un modèle de gouvernance applicable bien au-delà des frontières américaines.

UECe programme américain de supervision pré-déploiement pourrait servir de référence aux autorités européennes qui définissent encore les modalités concrètes d'évaluation des modèles à haut risque dans le cadre de l'AI Act.

💬 C'est le genre d'accord qu'on imaginait se faire dans l'ombre depuis des années, et là c'est officialisé. Cinq labos fournissent des versions sans filtres pour que le gouvernement cherche les failles, ce qui est probablement plus rassurant que l'alternative (tout le monde faisant semblant que ça n'existe pas). Ce qui m'intéresse maintenant, c'est de voir si Bruxelles va copier le modèle ou s'inventer une usine à gaz de plus.

RégulationReglementation
1 source
Le tournant de l'inférence
477Latent Space 

Le tournant de l'inférence

L'inférence est devenue le nouveau champ de bataille stratégique de l'intelligence artificielle. En quelques jours, deux signaux forts ont traversé l'industrie : Noam Brown a déclaré que "la puissance de calcul d'inférence est une ressource stratégique, actuellement sous-évaluée", tandis que Sam Altman affirmait qu'OpenAI devait "dans une large mesure devenir une entreprise d'inférence IA". Ces déclarations interviennent dans le sillage du lancement très réussi de GPT-4.5, mais aussi des chiffres publiés par Lip-Bu Tan, PDG d'Intel, lors de son appel aux résultats du premier trimestre 2026 : la demande en CPU, et non en GPU, est en hausse significative, tirée précisément par les nouveaux usages d'inférence à grande échelle. Jensen Huang, PDG de Nvidia, avait posé les bases de ce constat lors de sa keynote GTC : la demande en calcul a été multipliée par 10 000 en deux ans, l'usage par 100, ce qui représente selon lui une multiplication globale de un million fois en deux ans à peine. Ce basculement n'est pas qu'une métaphore : il redessine concrètement les priorités d'investissement de toute l'industrie. Pendant deux ans, les grandes entreprises tech ont massivement réorienté leurs budgets vers les GPU pour l'entraînement des modèles, au détriment de la maintenance et du renouvellement de leur parc CPU. Or, les agents IA en production, les environnements de simulation pour le renforcement par apprentissage (RL gyms), les outils comme Claude Code, tout cela tourne sur des CPU. Résultat : une potentielle pénurie de CPU se profile, non pas parce que la demande explose de façon spectaculaire comme pour les GPU, mais parce que le cycle naturel de renouvellement de cinq à six ans coïncide avec une sous-capitalisation chronique. Pour les startups comme pour les géants, le goulot d'étranglement se déplace : plus de capacité d'inférence se traduirait directement en plus de revenus, plus d'utilisateurs, des modèles plus performants. Ce moment marque une transition de phase dans l'économie de l'IA. L'ère de l'entraînement massif cède la place à celle du déploiement et du raisonnement continu : chaque fois qu'un modèle pense, agit, lit ou génère du texte, il infère. Cette boucle vertueuse, plus de capacité, plus de tokens, plus d'intelligence, est désormais le moteur central de la compétition entre OpenAI, Anthropic, Google et les autres. Les acteurs qui sécuriseront le plus de capacité d'inférence, que ce soit via des partenariats avec des fournisseurs cloud, des investissements dans des datacenters ou des puces propriétaires, prendront un avantage structurel difficile à rattraper. Le secteur CPU, longtemps dans l'ombre des GPU, redevient soudainement stratégique.

UELe goulot d'étranglement sur la capacité d'inférence CPU affecte directement les startups et entreprises européennes déployant des agents IA en production, qui devront repenser leurs priorités d'investissement infrastructure.

💬 C'est le pivot qu'on sentait venir depuis le lancement massif des agents en prod. Pendant deux ans, tout le monde a empilé des GPU pour l'entraînement, en laissant vieillir le parc CPU, et là c'est ce même parc qui devient le goulot d'étranglement pour l'inférence à grande échelle. Celui qui sécurise de la capacité d'inférence aujourd'hui prend une avance structurelle, pas juste technologique.

InfrastructureOpinion
1 source
NVIDIA Nemotron 3 Nano Omni intègre le raisonnement d'agents multimodaux dans un modèle ouvert et efficace
478NVIDIA Developer Blog 

NVIDIA Nemotron 3 Nano Omni intègre le raisonnement d'agents multimodaux dans un modèle ouvert et efficace

NVIDIA a dévoilé Nemotron-N-Nano-3B-Omni, un modèle multimodal compact capable de traiter simultanément du texte, des images, des vidéos et de l'audio au sein d'une seule architecture unifiée. Conçu pour l'inférence efficace, ce modèle de 3 milliards de paramètres est publié en open weights, ce qui permet à n'importe quel développeur de le télécharger, le modifier et le déployer sans dépendre des serveurs NVIDIA. Il prend en charge le raisonnement agentique, c'est-à-dire la capacité à enchaîner des perceptions et des actions dans une boucle autonome, couvrant aussi bien l'analyse de documents que l'interprétation d'écrans ou la compréhension vocale. L'intérêt principal de ce modèle réside dans sa conception monolithique : là où les systèmes agentiques actuels assemblent des chaînes de modèles spécialisés distincts pour la vision, l'audio et le texte, Nemotron Nano Omni gère l'ensemble dans un seul passage d'inférence. Cela réduit significativement la latence, la complexité d'orchestration et le coût de calcul, tout en maintenant une cohérence contextuelle entre les modalités. Pour les entreprises qui déploient des agents IA en production, c'est une réduction directe de la facture cloud et des points de défaillance. Ce lancement s'inscrit dans la stratégie plus large de NVIDIA de dominer non seulement le matériel GPU, mais aussi la couche logicielle et les modèles fondamentaux pour l'IA d'entreprise. La série Nemotron, qui comprend également des modèles plus grands comme Nemotron-4, vise à offrir des alternatives performantes aux modèles propriétaires d'OpenAI ou d'Anthropic. Avec la montée en puissance des agents autonomes capables d'interagir avec des interfaces graphiques, des fichiers et des flux audio, un modèle omnimodal efficace et ouvert représente une brique stratégique pour la prochaine génération d'assistants et d'automatisations.

UELes développeurs et entreprises européennes peuvent déployer cet agent IA multimodal open weights directement sur leur propre infrastructure, réduisant la dépendance aux API cloud américaines et renforçant la souveraineté numérique.

Microsoft et OpenAI mettent fin à leur accord exclusif et s'ouvrent aux clouds concurrents
479Interesting Engineering 

Microsoft et OpenAI mettent fin à leur accord exclusif et s'ouvrent aux clouds concurrents

Microsoft et OpenAI ont officiellement mis fin à leur relation exclusive le 27 avril 2026, restructurant en profondeur l'accord qui liait les deux entreprises depuis plusieurs années. Selon les termes révisés, OpenAI pourra désormais proposer ses produits et services sur l'ensemble des plateformes cloud, y compris AWS d'Amazon et Google Cloud d'Alphabet, alors qu'Azure de Microsoft était jusqu'ici le seul partenaire autorisé. Microsoft conserve son statut de partenaire cloud principal et bénéficie d'une licence non exclusive sur les modèles et produits d'OpenAI jusqu'en 2032. Sur le plan financier, Microsoft cesse de percevoir une part des revenus générés via Azure, tandis qu'OpenAI continuera de lui verser une commission jusqu'en 2030, mais plafonnée et désormais découplée des jalons technologiques comme l'intelligence artificielle générale, qui conditionnaient auparavant les versements. Ce changement ouvre concrètement le marché entreprise à OpenAI d'une façon qui n'était pas possible jusqu'ici. Gil Luria, analyste chez D.A. Davidson & Co., l'a formulé clairement dans les colonnes de Reuters : les clients AWS et Google Cloud étaient freinés dans leur adoption des outils OpenAI précisément à cause de l'exclusivité, et ils vont désormais pouvoir envisager OpenAI aux côtés d'Anthropic. Pour les grandes organisations qui opèrent en dehors de l'écosystème Microsoft, c'est une levée de verrou majeure. Les analystes de Barclays y voient un bénéfice mutuel : Microsoft réduit sa charge d'infrastructure, tandis qu'OpenAI accélère son déploiement à grande échelle sans dépendre d'un seul fournisseur. Cette évolution s'inscrit dans un contexte de maturité du marché de l'IA d'entreprise, mais aussi de pression réglementaire croissante aux États-Unis, au Royaume-Uni et en Europe, où l'exclusivité entre les deux géants suscitait des inquiétudes sur la concurrence dans le cloud. De son côté, Microsoft diversifie déjà sa stratégie IA en développant ses propres modèles et en intégrant des alternatives comme ceux d'Anthropic dans Microsoft 365 Copilot. OpenAI, pour sa part, avait anticipé ce tournant en sécurisant d'autres partenariats cloud pour augmenter sa capacité de calcul. Les deux entreprises ont annoncé qu'elles poursuivront leur collaboration sur l'expansion des centres de données, le co-développement de puces avancées et la cybersécurité pilotée par l'IA. Le partenariat n'est plus exclusif, mais il reste structurant pour l'avenir de l'IA en entreprise.

UELes entreprises européennes hébergées sur AWS ou Google Cloud peuvent désormais adopter les outils OpenAI sans migrer vers Azure, ce qui répond aux préoccupations des régulateurs européens sur la concurrence dans le marché cloud IA.

💬 C'était écrit, et franchement j'attendais ça. L'exclusivité Azure freinait des pans entiers du marché enterprise (les boîtes sur AWS ou GCP ne voulaient pas migrer juste pour accéder aux outils OpenAI), sans compter les régulateurs européens qui commençaient à montrer les dents. OpenAI récupère sa liberté de distribution, Microsoft conserve sa licence et sa commission jusqu'en 2032, tout le monde rentre à la maison content, sur le papier du moins.

BusinessOpinion
1 source
DeepSeek réduit ses prix d'API et établit un nouveau plancher pour les grands modèles
480Pandaily 

DeepSeek réduit ses prix d'API et établit un nouveau plancher pour les grands modèles

DeepSeek a annoncé le 26 avril une réduction massive des tarifs de son API, établissant de nouveaux planchers mondiaux pour les grands modèles de langage. Sur l'ensemble de la gamme V4, les prix des requêtes en cache d'entrée ont été divisés par dix par rapport aux tarifs initiaux. Le modèle phare V4-Pro bénéficie en outre d'une promotion temporaire de 75 % valable jusqu'au 5 mai 2026, portant le coût du cache d'entrée à seulement 0,025 yuan par million de tokens (environ 0,0035 dollar), un niveau sans précédent dans l'industrie. Pour V4-Flash, le tarif passe de 0,2 yuan à 0,02 yuan par million de tokens (0,0028 dollar). Sur V4-Pro, les entrées non mises en cache tombent de 12 à 3 yuans (0,41 dollar) et les sorties de 24 à 6 yuans (0,83 dollar). Ces baisses surviennent deux jours après la mise en open source de DeepSeek-V4, disponible en versions Pro et Flash, avec un support de contextes allant jusqu'à un million de tokens. Ces tarifs redéfinissent ce qui est économiquement viable pour les développeurs et les entreprises qui intègrent des modèles de langage dans leurs produits. À moins de 0,004 dollar par million de tokens en cache, des usages autrefois coûteux deviennent accessibles : agents autonomes, traitement massif de documents, pipelines de code avancés. L'argument économique est renforcé par des performances solides : en interne chez DeepSeek, V4 est jugé supérieur à Claude Sonnet 4.5 sur les tâches de programmation, avec une qualité approchant celle de Claude Opus 4.6 en mode non-raisonné. Dans les benchmarks généraux, V4-Pro surpasse tous les modèles open source et ne cède qu'aux meilleurs modèles propriétaires comme Gemini Pro 3.1 ; en mathématiques, STEM et coding compétitif, il égale ou dépasse les leaders du marché. Ces baisses de prix reposent sur des avancées architecturales concrètes. V4-Pro n'active que 49 milliards de paramètres sur 33 000 milliards de tokens d'entraînement, mais son coût de calcul par token est réduit à 27 % de celui de son prédécesseur V3.2, et l'utilisation du cache KV chute de 90 %. Le nouveau mécanisme d'attention creuse développé en interne (DSA) compresse les dimensions des tokens pour offrir de hautes performances sur les longs contextes avec des besoins en mémoire réduits. Stratégiquement, la série V4 est entièrement compatible avec les supernœuds Huawei Ascend, marquant un ancrage renforcé dans l'infrastructure de calcul domestique chinoise. Goldman Sachs a récemment souligné l'importance stratégique de DeepSeek-V4, et la mise en production massive des supernœuds Ascend prévue d'ici fin 2026 laisse entrevoir de nouvelles baisses tarifaires. Dans un secteur où OpenAI, Google et Anthropic s'affrontent déjà sur les prix, cette annonce amplifie la pression sur l'ensemble de l'écosystème mondial de l'IA.

UELa réduction massive des prix de l'API DeepSeek V4 offre aux développeurs et entreprises européens un accès à des modèles de pointe à des coûts jusqu'à dix fois inférieurs, rendant économiquement viables des usages IA auparavant réservés aux grandes structures.

💬 0,004 dollar par million de tokens, c'est le prix où les agents continus et le traitement massif de docs deviennent des trucs normaux, pas des projets de grande entreprise. Et que V4 passe devant Sonnet sur le code, ça commence à faire mal pour les modèles US sur le segment développeurs. Reste à voir si ça tient à l'échelle, mais le rapport de force change.

LLMsOpinion
1 source
GPT-5.5 et la super-application OpenAI Codex
481Latent Space 

GPT-5.5 et la super-application OpenAI Codex

OpenAI a lancé GPT-5.5 le 22 avril 2026, une semaine après la sortie de Claude Opus 4.7 par Anthropic. Le modèle est présenté comme "une nouvelle classe d'intelligence pour le travail réel" et déployé progressivement sur ChatGPT et Codex, l'accès API étant temporairement limité en attendant des vérifications de sécurité supplémentaires. Les benchmarks publiés sont impressionnants : 82,7% sur Terminal-Bench 2.0, 58,6% sur SWE-Bench Pro, 84,9% sur GDPval, 78,7% sur OSWorld-Verified et 84,4% sur BrowseComp. Le tarif API est fixé à 5$/30$ par million de tokens en entrée/sortie pour la version standard, et 30$/180$ pour la version Pro. Selon Artificial Analysis, GPT-5.5 en configuration medium atteint le même niveau que Claude Opus 4.7 au maximum sur leur Intelligence Index, mais à un quart du coût : environ 1 200 dollars contre 4 800. La fenêtre de contexte atteint 1 million de tokens en API, et Sam Altman souligne que le modèle consomme moins de tokens par tâche que son prédécesseur GPT-5.4. Ce lancement ne se résume pas à une simple mise à jour de modèle. GPT-5.5 marque un pivot stratégique d'OpenAI vers l'inférence agentique longue durée et l'efficacité économique, deux dimensions qui comptent davantage pour les entreprises que les scores bruts sur benchmarks académiques. La capacité à exécuter des tâches complexes avec moins d'interventions humaines change concrètement la proposition de valeur pour les développeurs et les équipes techniques. En parallèle, OpenAI a profondément étendu Codex : contrôle du navigateur, intégration avec Google Sheets, Slides, Docs et PDFs, dictée à l'échelle du système d'exploitation, et un mode de revue automatique reposant sur un agent secondaire dit "gardien" qui réduit le nombre de validations nécessaires sur les tâches longues. Codex n'est plus un outil de coding assisté : il devient un agent capable de naviguer dans des interfaces web, capturer des captures d'écran, itérer jusqu'à complétion, et traiter des flux de travail qui couvrent l'assurance qualité, la bureautique et la construction d'applications. Ce lancement s'inscrit dans une course frontale entre OpenAI, Anthropic et Google, dont Gemini 3.1 Pro Preview atteint un niveau comparable à GPT-5.5 à environ 900 dollars selon Artificial Analysis. OpenAI a co-conçu le modèle avec les systèmes NVIDIA GB200/300, et affirme que GPT-5.5 a contribué à améliorer sa propre infrastructure d'inférence, une affirmation qui illustre la direction que prend la compagnie. Sam Altman positionne désormais explicitement OpenAI comme une "entreprise d'inférence IA", signalant que la compétition ne se joue plus seulement sur la qualité des modèles mais sur leur coût d'exploitation à l'échelle. La décision d'absorber Prism et de faire de Codex la base d'une stratégie de superapp unifiée suggère qu'OpenAI cherche à verrouiller les workflows professionnels dans son écosystème, bien au-delà du simple chat.

UELes développeurs et entreprises européens bénéficient d'un modèle agentique de niveau SOTA à coût sensiblement réduit, ce qui modifie concrètement les arbitrages de déploiement IA à grande échelle sur le marché européen.

💬 Le ratio coût/perf, c'est là que ça se joue. GPT-5.5 medium au niveau d'Opus 4.7 max pour un quart du prix, les équipes qui hésitaient vont trancher vite. Et ce pivot vers une superapp avec Codex en moteur, c'est plus ambitieux qu'il n'y paraît : si l'agent gardien tient vraiment sur des tâches longues, OpenAI verrouille les workflows pro bien plus efficacement qu'avec n'importe quel score sur un benchmark.

LLMsOpinion
1 source
Les rumeurs disaient vrai : OpenAI lâche GPT-5.5, et ça change pas mal de choses
482Le Big Data 

Les rumeurs disaient vrai : OpenAI lâche GPT-5.5, et ça change pas mal de choses

OpenAI a officiellement lancé GPT-5.5 le 23 avril 2026, confirmant ainsi les rumeurs qui circulaient depuis plusieurs jours. Sam Altman a annoncé le modèle directement sur X, déclarant simplement qu'il "l'apprécie beaucoup", une formulation sobre pour un lancement que l'entreprise présente comme un véritable saut technologique. Le modèle est immédiatement disponible dans ChatGPT pour les abonnés Plus, Pro et Business sous la dénomination GPT-5.5 Thinking, avec une version GPT-5.5 Pro réservée aux traitements de données massifs exigeant une précision maximale. Les développeurs accédant via Codex bénéficient quant à eux d'une fenêtre de contexte de 400 000 tokens, suffisante pour ingérer des projets entiers en une seule passe. Ce qui distingue fondamentalement GPT-5.5 de ses prédécesseurs, c'est son autonomie opérationnelle. Là où les modèles précédents attendaient une instruction à chaque étape, celui-ci est conçu pour piloter des tâches complexes de bout en bout, en analysant, planifiant et utilisant les logiciels disponibles sans intervention humaine continue. En développement logiciel, cela se traduit concrètement par une capacité à résoudre des projets GitHub entiers en une seule passe, à déboguer de manière autonome en identifiant l'origine d'une faille là où un développeur passerait plusieurs heures, et à anticiper les effets de bord sur le reste du système. L'enthousiasme dans l'industrie est tel qu'un ingénieur chez NVIDIA a comparé l'idée de perdre l'accès au modèle à une amputation physique. Parallèlement, GPT-5.5 maintient une latence comparable à GPT-5.4 tout en consommant moins de tokens pour produire des résultats de meilleure qualité, ce qui améliore directement l'équation coût-performance pour les usages intensifs. Ce lancement s'inscrit dans une course à l'IA générative où chaque acteur cherche à franchir le palier de l'agent autonome, capable d'agir sur un ordinateur plutôt que de simplement répondre à des questions. OpenAI positionnne GPT-5.5 explicitement comme une "nouvelle classe d'intelligence pour le travail réel", ce qui signale un pivot stratégique vers les cas d'usage professionnels et les pipelines agentiques, au détriment du chatbot conversationnel grand public. Google, Anthropic et Meta s'engagent sur le même terrain avec leurs propres modèles capables d'utiliser des outils et d'exécuter des tâches multi-étapes. La disponibilité immédiate dans Codex suggère qu'OpenAI mise sur les développeurs comme vecteur d'adoption prioritaire, une population qui teste vite, publie ses benchmarks et influence ensuite les décisions d'achat des entreprises. La prochaine étape logique sera l'intégration plus profonde dans des environnements d'entreprise, avec des questions de sécurité, de traçabilité et de gouvernance que GPT-5.5 n'adresse pas encore publiquement.

UELes développeurs et entreprises européens utilisant l'API OpenAI via Codex peuvent immédiatement tester les capacités agentiques de GPT-5.5, ce qui soulève des questions de gouvernance et de traçabilité directement pertinentes dans le contexte du règlement européen sur l'IA.

LLMsOpinion
1 source
SpaceX s’allie à Cursor avec une option de rachat à 60 milliards
483Le Big Data 

SpaceX s’allie à Cursor avec une option de rachat à 60 milliards

SpaceX a officialisé le 21 avril 2026 un accord stratégique avec Cursor, l'éditeur de l'assistant de codage IA plébiscité par les développeurs professionnels. La structure de l'opération est atypique : SpaceX dispose soit de verser 10 milliards de dollars à Cursor pour ses travaux de développement, soit de procéder à une acquisition totale valorisant la start-up à 60 milliards de dollars. En parallèle, xAI, autre entité d'Elon Musk, a commencé à louer sa puissance de calcul à Cursor, mobilisant des dizaines de milliers de puces pour l'entraînement de modèles, selon Business Insider. The Information a également révélé que deux cadres importants de Cursor ont rejoint xAI récemment. Cursor, valorisée seulement 2,5 milliards de dollars début 2025, a bondi à 9 milliards quelques mois plus tard, puis à près de 30 milliards après une levée de fonds de 2,3 milliards en série D. L'option à 60 milliards acte une nouvelle étape dans cette ascension spectaculaire. Cet accord repose sur une logique de complémentarité : Cursor apporte son produit et sa base d'utilisateurs, essentiellement des développeurs expérimentés, tandis que SpaceX met à disposition le supercalculateur Colossus, dont la puissance équivaut à un million de puces Nvidia H100. L'objectif affiché est de créer les meilleurs outils d'IA au monde pour le codage et le travail de connaissance. Pour SpaceX, l'enjeu est de s'imposer rapidement sur un segment à forte valeur sans nécessairement décaisser immédiatement les 60 milliards, en conservant une option d'achat. Pour Cursor, l'accord constitue une validation implicite de sa valorisation, supérieure aux 50 milliards que la start-up visait lors de récentes discussions privées. Ce rapprochement s'inscrit dans une logique plus large de consolidation des actifs IA d'Elon Musk, qui cherche à créer un écosystème intégré combinant infrastructure de calcul, modèles de langage et outils de distribution. Le timing n'est pas anodin : SpaceX prépare une introduction en bourse très attendue, et l'intégration d'une brique logicielle à fort potentiel renforcerait son profil de conglomérat technologique au-delà du spatial. Cependant, le partenariat révèle aussi les faiblesses structurelles des deux parties : ni Cursor ni xAI ne disposent aujourd'hui de modèles capables de rivaliser pleinement avec ceux d'OpenAI ou d'Anthropic, qui dominent le marché de l'IA pour développeurs. L'alliance vise précisément à combler ce retard, mais SpaceX doit jongler avec des engagements financiers déjà conséquents, notamment après l'acquisition de xAI et du réseau social X, et les modalités de paiement, cash ou actions, restent à préciser.

Le « Claude-Killer » est là : OpenAI dévoile un Codex pour (presque) tout
484Le Big Data 

Le « Claude-Killer » est là : OpenAI dévoile un Codex pour (presque) tout

OpenAI a annoncé le 16 avril 2026 une mise à jour majeure de Codex, son assistant de développement intégré à ChatGPT, transformant profondément ce qui était jusqu'alors un outil de génération de code en un agent capable d'interagir avec l'ensemble d'un environnement informatique. La nouveauté la plus spectaculaire est le mode "computer use" : Codex peut désormais s'exécuter en arrière-plan sur macOS, ouvrir des applications, naviguer, cliquer et saisir du texte via son propre curseur, exactement comme le ferait un utilisateur humain. Plusieurs instances peuvent tourner en parallèle sans interférer avec le travail en cours. S'y ajoutent un navigateur intégré permettant d'annoter des pages web pour guider l'agent, la génération et l'amélioration d'images via gpt-image-1, une fonction mémoire qui retient les préférences et habitudes de travail entre les sessions, ainsi que plus de 90 nouveaux plugins incluant Jira via Atlassian Rovo, CircleCI, GitLab Issues et la suite Microsoft. Codex gère également les commentaires GitHub, plusieurs onglets de terminal et les connexions SSH en accès anticipé. Cette mise à jour repositionne Codex comme un véritable agent de travail autonome, et non plus comme un simple copilote de code. Pour les développeurs, la capacité à tester des interfaces sans API, à itérer visuellement sur du front-end ou à orchestrer des tâches répétitives sans intervention manuelle représente un gain de productivité substantiel. La fonction mémoire va plus loin encore : Codex peut analyser des commentaires dans Google Docs, récupérer du contexte depuis Slack ou Notion, et produire une liste d'actions priorisées pour reprendre un projet là où il a été laissé. Sam Altman lui-même a déclaré que le mode computer use s'est révélé "encore plus utile que prévu" lors des démonstrations internes, soulignant l'ampleur du changement par rapport aux attentes initiales. Cette évolution s'inscrit dans une compétition directe avec Anthropic et son assistant Claude, clairement visé par le titre "Claude-Killer" employé dans la presse spécialisée. OpenAI cherche à consolider ChatGPT comme plateforme centrale du travail des développeurs, en absorbant des workflows qui nécessitaient jusqu'ici plusieurs outils distincts. La stratégie des plugins MCP et des intégrations tierces rappelle l'approche d'un système d'exploitation plutôt que d'un simple assistant IA. Le déploiement reste progressif : le mode computer use est limité à macOS dans un premier temps, certaines fonctions de personnalisation et de mémoire seront déployées graduellement pour les entreprises, et les utilisateurs européens et britanniques ainsi que les établissements éducatifs bénéficieront également de ces nouveautés selon un calendrier non précisé.

UELes utilisateurs européens et britanniques sont explicitement mentionnés comme futurs bénéficiaires des nouvelles fonctionnalités de Codex, mais selon un calendrier non encore précisé par OpenAI.

💬 Le "Claude-Killer", ok, le titre fait vendre. Ce qui m'intéresse vraiment, c'est la combinaison computer use plus mémoire persistante, parce que là on a un agent qui reprend le contexte d'une session à l'autre et clique dans tes apps sans passer par une API. Reste à voir si ça tient sur de vrais projets (pas juste des démos internes où Sam dit que c'est "encore mieux que prévu"), et côté Europe on attendra sagement un calendrier "non précisé".

OutilsOutil
1 source
485Ars Technica AI 

Les tests Mythos AI du gouvernement britannique distinguent les vraies menaces cyber du battage médiatique

Le gouvernement britannique, via son AI Security Institute (AISI), a publié une évaluation indépendante du modèle Mythos Preview d'Anthropic, centré sur ses capacités en matière de cybersécurité offensive. Cette publication fait suite à l'annonce d'Anthropic la semaine précédente de restreindre l'accès initial à ce modèle à "un groupe limité de partenaires industriels critiques", le temps de préparer sa sortie publique. L'entreprise avait elle-même qualifié Mythos de modèle "remarquablement capable dans les tâches liées à la sécurité informatique". L'AISI confirme que le modèle dépasse les 85 % de réussite sur les défis Capture the Flag de niveau "Apprenti", une série d'épreuves de cybersécurité progressives utilisées depuis début 2023 pour évaluer les modèles d'IA. Sur les tâches individuelles de cybersécurité, Mythos ne se distingue pas fondamentalement des autres modèles frontières récents. Ce qui le différencie en revanche, c'est sa capacité à enchaîner ces tâches en séquences cohérentes et multi-étapes, ce type d'attaque coordonnée étant précisément ce qui permet d'infiltrer complètement un système réel. Cette nuance est cruciale : un modèle capable de relier reconnaissance, exploitation et persistance au sein d'une même session représente un saut qualitatif pour les attaquants potentiels, mais aussi pour les équipes défensives qui cherchent à automatiser les tests de pénétration. L'AISI mène ces évaluations sur Capture the Flag depuis début 2023, à une époque où GPT-3.5 Turbo peinait à résoudre les tâches de niveau débutant. La progression a été régulière depuis, et Mythos marque une nouvelle étape dans cette courbe. La décision d'Anthropic de limiter l'accès initial témoigne d'une stratégie de déploiement prudente face aux risques de mésusage dans un domaine aussi sensible. La publication des résultats par une institution gouvernementale indépendante apporte une crédibilité publique à ces avertissements, au-delà du discours commercial habituel des laboratoires d'IA.

UELes évaluations indépendantes de l'AISI britannique sur les capacités cyber offensives des LLMs pourraient servir de modèle aux régulateurs européens pour les audits de sécurité imposés par l'AI Act.

SécuritéOpinion
1 source
486MIT Technology Review 

Comprendre l'état actuel de l'IA : ces graphiques sont essentiels

Le rapport annuel AI Index 2026 de l'Institut HAI de l'Université Stanford, publié ce mois-ci, dresse un bilan saisissant de l'état de l'intelligence artificielle mondiale. Malgré les prédictions d'un essoufflement technologique, les modèles de pointe continuent de progresser à un rythme sans précédent. Sur le benchmark SWE-bench Verified, qui mesure les capacités en ingénierie logicielle, les meilleurs scores sont passés d'environ 60 % en 2024 à près de 100 % en 2025. Les modèles atteignent désormais ou dépassent les performances d'experts humains sur des tests de niveau doctorat en sciences, mathématiques et compréhension du langage. L'adoption de l'IA par le grand public progresse plus vite que celle du PC ou d'Internet en leur temps, et les entreprises du secteur génèrent des revenus plus rapidement que lors de n'importe quel autre boom technologique de l'histoire. Le tout, en dépensant des centaines de milliards de dollars en centres de données et en puces électroniques. Cette accélération a des conséquences concrètes et massives. Les centres de données IA dans le monde peuvent désormais consommer 29,6 gigawatts d'électricité, soit l'équivalent de la consommation maximale de l'État de New York. La seule utilisation de GPT-4o d'OpenAI pourrait dépasser annuellement les besoins en eau potable de 12 millions de personnes. La chaîne d'approvisionnement en semi-conducteurs représente une vulnérabilité stratégique majeure : les États-Unis concentrent la majorité des centres de données mondiaux, mais une seule entreprise taïwanaise, TSMC, fabrique la quasi-totalité des puces IA de pointe. Par ailleurs, les benchmarks censés mesurer les progrès de l'IA, les cadres réglementaires et le marché du travail peinent à suivre un secteur qui avance bien plus vite qu'eux. Sur le plan géopolitique, la course entre les États-Unis et la Chine est désormais au coude à coude. En début d'année 2023, OpenAI dominait nettement avec ChatGPT, mais l'écart s'est resserré en 2024 avec l'arrivée des modèles de Google et Anthropic. En février 2025, DeepSeek R1, développé par un laboratoire chinois, a brièvement égalé ChatGPT. En mars 2026, Anthropic prend la tête du classement Arena, suivi de près par xAI, Google et OpenAI, tandis que DeepSeek et Alibaba ne sont qu'à faible distance. Si les États-Unis disposent de modèles plus puissants, de davantage de capitaux et de 5 427 centres de données (dix fois plus que tout autre pays), la Chine domine en publications scientifiques, brevets et robotique. La transparence, elle, recule : OpenAI, Anthropic et Google ne divulguent plus leurs codes d'entraînement ni la taille de leurs modèles, compliquant le travail des chercheurs indépendants en matière de sécurité de l'IA.

UELes cadres réglementaires européens, dont l'AI Act, peinent à suivre le rythme d'accélération de l'IA décrit dans le rapport Stanford HAI 2026, soulevant des interrogations sur la capacité de l'UE à encadrer efficacement un secteur qui évolue bien plus vite que ses institutions.

💬 SWE-bench à presque 100% en un an, des modèles qui surpassent des experts sur des tests de doctorat, une adoption plus rapide qu'Internet en son temps. Les chiffres Stanford HAI 2026 sont là, vérifiables, pas du storytelling de keynote. Ce qui coince, c'est que pendant que les perfs s'envolent, OpenAI, Anthropic et Google ont discrètement arrêté de publier tailles de modèles et codes d'entraînement, laissant les chercheurs en sécurité IA travailler de plus en plus dans le noir.

RecherchePaper
1 source
487VentureBeat AI 

Vos développeurs font déjà tourner l'IA en local : pourquoi l'inférence sur appareil est l'angle mort du RSSI

Depuis dix-huit mois, les responsables de la sécurité informatique (CISO) géraient l'essor de l'IA générative avec une stratégie claire : surveiller le réseau. Bloquer les accès aux API d'OpenAI, Anthropic ou Google, router les requêtes via des passerelles contrôlées, logger chaque appel sortant. Ce modèle supposait que l'IA vivait dans le cloud et que toute interaction avec des données sensibles générait forcément du trafic réseau observable. Ce postulat est désormais obsolète. Une nouvelle génération de matériel grand public a rendu l'inférence locale non seulement possible, mais banale : un MacBook Pro équipé de 64 Go de mémoire unifiée peut faire tourner des modèles quantifiés de 70 milliards de paramètres à des vitesses utilisables. Les outils de distribution open-source permettent en une seule commande de télécharger un modèle de plusieurs gigaoctets, de couper le Wi-Fi, et de traiter des données sensibles sans qu'un seul paquet ne quitte l'appareil. Aucun log proxy, aucune trace cloud, aucune alerte DLP. Le danger ne réside plus uniquement dans la fuite de données vers l'extérieur, mais dans trois angles morts que la plupart des entreprises n'ont pas encore opérationnalisés. Premier risque : l'intégrité du code. Un développeur senior peut coller du code d'authentification ou des scripts d'infrastructure dans un modèle local non validé pour le "nettoyer", obtenir une sortie qui compile et passe les tests unitaires, puis committer le résultat sans que personne ne sache qu'une IA a influencé ce chemin de code. Les vulnérabilités introduites (validation d'entrées défaillante, paramètres par défaut dangereux) seront investigées sans que l'on remonte jamais à leur vraie cause. Deuxième risque : la conformité des licences. De nombreux modèles performants interdisent l'usage commercial, exigent des attributions, ou imposent des restrictions incompatibles avec le développement de produits propriétaires. Quand les équipes les font tourner localement, ces modèles contournent entièrement le processus habituel d'achat et de validation juridique, exposant potentiellement l'entreprise à des litiges. Ce phénomène, que certains appellent déjà le "Shadow AI 2.0" ou l'ère du BYOM (Bring Your Own Model), s'est imposé grâce à la convergence de trois facteurs techniques : la montée en puissance des accélérateurs grand public, la démocratisation de la quantification qui réduit drastiquement la taille des modèles, et la simplicité extrême des outils de distribution comme Ollama ou LM Studio. Le débat en entreprise reste encore cadré autour de l'exfiltration vers le cloud, alors que le risque le plus immédiat se joue désormais à l'intérieur même de l'appareil. Pour les CISO, l'enjeu n'est plus seulement de contrôler ce qui sort du réseau, mais de repenser entièrement leur modèle de gouvernance de l'IA, en intégrant l'inventaire des modèles locaux, l'audit des usages endpoint, et des politiques claires sur les modèles autorisés avant que ces pratiques ne se normalisent sans cadre.

UELes entreprises françaises et européennes sont directement exposées aux risques de Shadow AI 2.0 : l'usage non contrôlé de modèles locaux par les développeurs fragilise la conformité RGPD et expose les organisations à des litiges sur les licences open-source de modèles non validés juridiquement.

💬 Les RSSI ont passé dix-huit mois à construire des digues autour du cloud, pendant que leurs devs téléchargeaient des 70B quantifiés en une commande sur leur MacBook. La stratégie réseau tenait la route tant que l'IA vivait chez OpenAI, mais Ollama a mis fin à ça sans que personne lève la main. Aucune boîte n'a d'inventaire de ses modèles internes, et c'est là que le feu va prendre.

SécuritéOpinion
1 source
Meta lance Muse Spark, son premier modèle frontier à poids fermés
488The Decoder 

Meta lance Muse Spark, son premier modèle frontier à poids fermés

Meta Superintelligence Labs a lancé Muse Spark, son premier modèle dit « frontier » et surtout le premier de Meta à ne pas être distribué en open weights. C'est une rupture nette avec la stratégie qui a fait la réputation de l'entreprise : depuis la série Llama, Meta avait systématiquement publié les poids de ses modèles, se positionnant comme le champion de l'IA ouverte face à OpenAI et Anthropic. Les premiers tests indépendants placent Muse Spark dans la course aux meilleurs modèles du marché, réduisant l'écart avec GPT-4o, Claude et Gemini. Ce changement de posture a des implications directes pour l'industrie. Un modèle frontier fermé chez Meta signifie que l'entreprise entend désormais monétiser directement ses capacités les plus avancées, plutôt que de les offrir comme infrastructure commune à l'écosystème. Pour les développeurs et entreprises qui s'appuyaient sur les modèles Llama gratuits et modifiables, cela marque une limite : les capacités de pointe restent désormais derrière une API contrôlée. Ce pivot s'inscrit dans une dynamique de consolidation du secteur où chaque grand acteur cherche à transformer ses investissements massifs en avantages compétitifs durables. Meta a dépensé des dizaines de milliards en infrastructure GPU ces dernières années, et la pression des actionnaires pour rentabiliser ces dépenses est forte. La création de Meta Superintelligence Labs, structure dédiée à la recherche de pointe, signale une ambition de rivaliser frontalement avec OpenAI et Anthropic, et non plus seulement de les contourner par l'open source.

UELes développeurs et entreprises européens qui bâtissaient leurs produits sur les modèles Llama en open weights devront désormais passer par une API fermée et payante pour accéder aux capacités frontier de Meta, remettant en question leurs modèles économiques.

BusinessOpinion
1 source
De GPT-2 à Claude Mythos : le retour des modèles d'IA jugés trop dangereux à publier
489The Decoder 

De GPT-2 à Claude Mythos : le retour des modèles d'IA jugés trop dangereux à publier

Il y a sept ans, OpenAI avait annoncé en grande pompe que son modèle GPT-2 était « trop dangereux pour être publié », une décision largement moquée par l'industrie, qui y avait vu une opération de communication plus qu'une précaution réelle. Aujourd'hui, Anthropic reproduit le même geste avec Claude Mythos Preview, mais avec une différence de taille : cette fois, des preuves concrètes accompagnent la décision. Le modèle a identifié des milliers de vulnérabilités dans des systèmes d'exploitation et des navigateurs web, en un volume si élevé qu'aucune équipe humaine ne serait en mesure de les examiner dans un délai raisonnable. L'enjeu est fondamentalement différent de 2019. Un modèle capable de découvrir et potentiellement d'exploiter des failles à cette échelle représente une menace asymétrique pour la cybersécurité mondiale : un acteur malveillant disposant d'un tel outil pourrait attaquer des infrastructures critiques bien plus vite que les défenseurs ne pourraient réagir. La question n'est plus théorique, elle est opérationnelle. Ce changement de posture illustre une évolution profonde dans le secteur. La course aux capacités des LLM a produit des modèles dont les aptitudes dépassent désormais les cadres d'évaluation existants. Anthropic, qui a investi massivement dans la recherche sur la sécurité des IA avec son équipe d'« AI Safety », se retrouve dans la position inconfortable de restreindre ses propres créations. La question qui se pose maintenant est de savoir si d'autres laboratoires, sous pression concurrentielle, adopteront la même retenue ou choisiront de publier quand même.

UELa capacité d'un LLM à identifier des milliers de vulnérabilités systèmes renforce l'urgence d'encadrer les évaluations de sécurité des modèles à usage général dans le cadre de l'AI Act européen.

SécuritéOpinion
1 source
Microsoft publie un toolkit open source pour sécuriser les agents IA en production
490AI News 

Microsoft publie un toolkit open source pour sécuriser les agents IA en production

Microsoft a publié un toolkit open-source destiné à sécuriser les agents d'intelligence artificielle en temps réel au sein des environnements d'entreprise. Baptisé runtime security toolkit, cet outil s'intercale entre le modèle de langage et le réseau d'entreprise pour surveiller, évaluer et bloquer les actions des agents autonomes au moment précis où ils tentent de les exécuter. Concrètement, lorsqu'un agent IA déclenche un appel vers un outil externe, une base de données, un pipeline CI/CD ou un dépôt cloud, le toolkit intercepte la requête, la compare à un ensemble de règles de gouvernance centralisées, et bloque l'action si elle enfreint la politique définie. Un agent autorisé uniquement à consulter un inventaire qui tenterait de passer une commande d'achat se verrait immédiatement arrêté, et l'événement serait journalisé pour révision humaine. L'enjeu est considérable pour les équipes de sécurité et les développeurs. Les systèmes d'IA d'entreprise ne se contentent plus de répondre à des questions : ils exécutent du code, envoient des e-mails, modifient des fichiers et interagissent avec des API critiques sans intervention humaine directe. Les méthodes traditionnelles, analyse statique du code, scan de vulnérabilités avant déploiement, sont structurellement inadaptées aux modèles de langage non-déterministes. Une seule attaque par injection de prompt ou une hallucination mal orientée peut suffire à écraser une base de données ou exfiltrer des données clients. Le toolkit de Microsoft découple la politique de sécurité de la logique applicative : les développeurs n'ont plus à hardcoder des règles de sécurité dans chaque prompt, et les équipes sécurité disposent d'une piste d'audit vérifiable pour chaque décision autonome du modèle. Le choix de publier ce toolkit sous licence open-source n'est pas anodin. Les développeurs construisent aujourd'hui des workflows autonomes en combinant des bibliothèques open-source, des frameworks variés et des modèles tiers, Anthropic, Meta, Mistral ou d'autres. Un outil propriétaire lié à l'écosystème Microsoft aurait probablement été contourné au profit de solutions non vérifiées, sous pression des délais. En ouvrant le code, Microsoft permet à n'importe quelle organisation, qu'elle tourne sur des modèles locaux, sur Azure ou sur des architectures hybrides, d'intégrer ces contrôles de gouvernance sans dépendance fournisseur. L'ouverture invite aussi la communauté cybersécurité à contribuer et à empiler des outils commerciaux, tableaux de bord, intégrations de réponse aux incidents, par-dessus cette fondation commune, accélérant la maturité de tout l'écosystème. À mesure que les agents autonomes s'imposent dans les entreprises, ce type de couche de sécurité d'infrastructure pourrait devenir un standard incontournable.

UELes entreprises européennes déployant des agents IA peuvent adopter cet outil open-source pour répondre aux exigences de gouvernance et de traçabilité imposées par l'AI Act.

SécuritéOpinion
1 source
Claude Mythos, une IA vraiment trop puissante pour notre propre bien ?
491Frandroid 

Claude Mythos, une IA vraiment trop puissante pour notre propre bien ?

L'entreprise d'IA Anthropic a annoncé un nouveau grand modèle de langage baptisé Claude Mythos, accompagnant cette sortie d'une mise en garde inhabituelle : le modèle serait capable de "révolutionner la cybersécurité", mais pas nécessairement dans l'intérêt général. Cette déclaration, volontairement alarmante, illustre une stratégie de communication propre à Anthropic, qui publie systématiquement des fiches de sécurité ("system cards") détaillant les risques potentiels de ses modèles avant ou lors de leur lancement. Le signal envoyé est clair : Claude Mythos atteindrait un niveau de compétence suffisant pour assister à la conception ou à l'exploitation de failles de sécurité informatique, ce qui en ferait un outil à double tranchant pour les professionnels du secteur. Pour les entreprises, les gouvernements et les chercheurs en sécurité offensive et défensive, cela signifie que les barrières techniques séparant un attaquant averti d'un novice pourraient se réduire significativement. C'est précisément ce type de capacité, qualifiée d'"uplift" dans le jargon de la sécurité IA, qui inquiète les régulateurs et les experts en biosécurité et cybersécurité depuis plusieurs années. Anthropic se distingue de ses concurrents OpenAI et Google DeepMind par cette transparence proactive sur les risques de ses propres systèmes, une posture cohérente avec son positionnement d'entreprise fondée sur la sécurité IA ("AI safety"). La question qui se pose désormais est celle du contrôle d'accès : quels garde-fous techniques et contractuels Anthropic mettra-t-il en place pour limiter l'usage malveillant de Claude Mythos, et dans quelle mesure ces mesures seront-elles suffisantes face à des acteurs déterminés à contourner les restrictions.

UELes capacités d'"uplift" en cybersécurité de Claude Mythos interpellent les régulateurs européens, qui devront évaluer la suffisance des garde-fous d'Anthropic au regard des exigences de l'AI Act pour les modèles à usage général à haut risque.

💬 Anthropic joue encore la carte de la transparence proactive, et c'est plus rigoureux que les lancements en mode "fais-nous confiance" d'OpenAI. Publier une system card alarmiste sur un modèle qu'on sort quand même, ça couvre les arrières autant que ça informe. La vraie question, tu la connais déjà : qui vérifie que les garde-fous tiennent face à quelqu'un de vraiment motivé ?

SécuritéOpinion
1 source
Gemma 4 : Google lance une famille de quatre modèles IA en open source (Apache 2.0)
492Next INpact 

Gemma 4 : Google lance une famille de quatre modèles IA en open source (Apache 2.0)

Google a lancé Gemma 4, sa nouvelle famille de modèles d'intelligence artificielle en open source, quelques jours avant le week-end de Pâques 2026. La gamme comprend quatre variantes baptisées E2B, E4B, 26B A4B et 31B, offrant respectivement 2,3, 4,5, 25,2 et 30,7 milliards de paramètres. Le modèle 26B A4B adopte une architecture Mixture of Experts (MoE), ce qui signifie que seuls 3,8 milliards de paramètres sont effectivement activés lors de chaque inférence, réduisant considérablement la puissance de calcul nécessaire. Tous les modèles sont multimodaux : ils traitent du texte et des images, les deux plus petits ajoutant la reconnaissance vocale. Les fenêtres de contexte atteignent 128 000 tokens pour les modèles E2B et E4B, et 256 000 tokens pour les deux plus grands. L'ensemble de la famille intègre un mode de raisonnement pas-à-pas, une prise en charge native des outils pour les workflows d'agents, ainsi que des capacités de génération et correction de code. La licence retenue est Apache 2.0, considérée comme l'une des plus permissives : elle autorise la modification, la distribution et l'usage commercial sans contrainte majeure, à condition de conserver les mentions de copyright. Ce changement de licence est la décision la plus significative de cette annonce. Jusqu'ici, Google publiait ses modèles Gemma sous une licence maison, les "Gemma Terms of Use", qui lui permettait de restreindre l'utilisation à sa discrétion. En passant à Apache 2.0, Google offre aux développeurs, entreprises et chercheurs une garantie juridique bien plus solide pour intégrer ces modèles dans des produits commerciaux ou des recherches sensibles. La diversité des tailles proposées, notamment les variantes à 2,3 et 4,5 milliards de paramètres, permet de faire tourner Gemma 4 directement sur des ordinateurs personnels ou des smartphones, sans envoyer de données vers des serveurs tiers. Pour les entreprises soucieuses de confidentialité ou les développeurs indépendants aux ressources limitées, c'est un argument concret et immédiat. Avec cette décision, Google rejoint un camp qui compte déjà Mistral avec son modèle 7B publié en septembre 2023, OpenAI avec gpt-oss-120b et Alibaba avec sa famille Qwen, tous distribués sous Apache 2.0. Meta reste en retrait avec ses modèles LLaMA, soumis à une licence plus restrictive. Le contexte concurrentiel est intense : le marché des modèles ouverts s'est considérablement animé ces dix-huit derniers mois, et Google cherche à s'y positionner comme un acteur sérieux face à des alternatives bien établies. L'annonce intervient également au moment où Anthropic durcit ses conditions d'accès pour les applications tierces sur ses modèles payants, un contraste saisissant qui renforce l'attrait de l'approche ouverte de Google. Les suites dépendront de l'adoption par la communauté et des benchmarks indépendants, mais la combinaison licence permissive et gamme de tailles variées donne à Gemma 4 de sérieux atouts pour s'imposer dans l'écosystème open source.

UELa licence Apache 2.0 et les variantes légères (2-4 milliards de paramètres) permettent aux entreprises et développeurs européens d'intégrer Gemma 4 dans des produits commerciaux ou de le déployer en local, un atout concret pour la conformité RGPD.

💬 La vraie nouvelle, c'est pas les 31 milliards de paramètres, c'est Apache 2.0. Google arrête de jouer avec ses licences maison qui laissaient planer un doute juridique permanent sur l'usage commercial, et ça change tout pour les boîtes qui hésitaient à s'engager. Le petit E2B à 2,3 milliards avec 128k de contexte qui tourne en local, bon, sur le papier c'est exactement ce qu'on attendait pour des usages RGPD-friendly. Reste à voir ce que les benchmarks indépendants vont donner, parce que Google sait aussi soigner ses annonces de Pâques.

LLMsOpinion
1 source
OpenAI valorisée à 852 milliards de dollars après une nouvelle levée de fonds
493AI Business 

OpenAI valorisée à 852 milliards de dollars après une nouvelle levée de fonds

OpenAI vient de boucler un nouveau tour de financement qui porte sa valorisation à 852 milliards de dollars, consolidant ainsi sa position parmi les entreprises privées les plus valorisées au monde. La société, fondatrice de ChatGPT et des modèles GPT-4, franchit ce cap au terme d'une levée de fonds dont le montant exact n'a pas été précisé, mais qui reflète l'appétit persistant des investisseurs pour les acteurs dominants de l'IA générative. Cette valorisation place OpenAI dans une catégorie rarissime, aux côtés de géants technologiques non cotés comme SpaceX. Pour l'industrie, le signal est clair : les capitaux continuent de se concentrer massivement sur un nombre restreint d'acteurs capables de déployer des modèles à grande échelle, creusant l'écart avec les concurrents moins bien dotés. Les partenaires commerciaux et développeurs qui s'appuient sur l'API OpenAI y liront une garantie supplémentaire de pérennité. Cette levée intervient dans un contexte de compétition intense entre OpenAI, Google DeepMind, Anthropic et Meta sur le front des grands modèles de langage. Après avoir converti son statut en entreprise à but lucratif début 2025, OpenAI cherche à financer le développement de ses prochaines générations de modèles et l'expansion de son infrastructure de calcul. Une introduction en bourse reste évoquée à moyen terme, et cette valorisation en constituerait le plancher de référence.

UELes entreprises et développeurs européens qui s'appuient sur l'API OpenAI peuvent interpréter cette valorisation comme un signal de pérennité, sans impact réglementaire ou économique direct sur la France ou l'UE.

La levée de fonds d'OpenAI ; La (désastreuse) promotion des IPO de 2021
494The Information AI 

La levée de fonds d'OpenAI ; La (désastreuse) promotion des IPO de 2021

OpenAI a officialisé une levée de fonds massive, annonçant des engagements totaux atteignant 122 milliards de dollars. Parmi les contributeurs principaux, Amazon s'est engagé à hauteur de 50 milliards de dollars, dont seulement 15 milliards sont versés immédiatement — le reste étant conditionné à plusieurs facteurs, notamment l'entrée en Bourse d'OpenAI. SoftBank participera pour 30 milliards de dollars, répartis en trois versements échelonnés jusqu'en octobre. Il est important de souligner que ces chiffres représentent des engagements, pas des fonds déjà transférés : une grande partie de cet argent n'a pas encore atterri sur les comptes bancaires de l'entreprise. Cette opération confirme qu'OpenAI reste l'acteur le plus capitalisé de la course à l'intelligence artificielle générale, avec une capacité à mobiliser des partenaires stratégiques de premier plan. Pour Amazon, cet engagement massif renforce son positionnement dans l'IA au moment où AWS cherche à concurrencer Microsoft Azure, déjà partenaire historique d'OpenAI via un accord de plusieurs dizaines de milliards. Pour SoftBank, dont la stratégie repose sur des paris à long terme dans la tech, l'investissement reflète une conviction renouvelée dans le potentiel commercial de l'IA — après des années marquées par des paris controversés comme WeWork. Cette levée intervient dans un contexte de vive compétition entre les grands laboratoires d'IA, avec Anthropic (soutenu par Google et Amazon) et Google DeepMind en embuscade. Le calendrier des versements, lié en partie à une éventuelle introduction en Bourse d'OpenAI, illustre la pression croissante sur la startup pour monétiser ses produits et justifier des valorisations stratosphériques. Pendant ce temps, des tensions géopolitiques se font sentir : des menaces iraniennes visant des infrastructures technologiques américaines au Moyen-Orient font peser une incertitude supplémentaire sur un secteur déjà sous surveillance réglementaire intense en Europe et aux États-Unis.

UELa domination capitalistique renforcée d'OpenAI accentue la pression sur les régulateurs européens pour faire appliquer l'AI Act face à des acteurs américains aux moyens quasi-illimités.

💬 122 milliards sur le papier, c'est impressionnant, mais la moitié de cet argent n'existe pas encore vraiment : Amazon garde 35 milliards dans sa poche jusqu'à l'IPO, SoftBank échelonne sur deux ans. C'est le genre de levée où le communiqué de presse est deux fois plus gros que le chèque. Reste que même à moitié encaissé, ça fait une sacrée piste d'atterrissage pour OpenAI face à Anthropic et Google.

BusinessOpinion
1 source
OpenAI lève 3 milliards auprès d'investisseurs particuliers dans une levée record de 122 milliards
495TechCrunch AI 

OpenAI lève 3 milliards auprès d'investisseurs particuliers dans une levée record de 122 milliards

OpenAI a bouclé un tour de financement record de 122 milliards de dollars, dont 3 milliards levés directement auprès d'investisseurs particuliers — une démarche inhabituelle pour une entreprise non cotée. Le tour est mené par Amazon, Nvidia et SoftBank, et porte la valorisation de la société à 852 milliards de dollars, la plaçant parmi les entreprises privées les plus valorisées de l'histoire. L'ouverture aux investisseurs retail signale qu'OpenAI prépare activement son introduction en bourse. En associant le grand public à ce tour pré-IPO, la société élargit sa base d'actionnaires et génère une dynamique de marché favorable avant une cotation. Pour les investisseurs institutionnels comme SoftBank — déjà engagé à hauteur de 500 millions de dollars dans le projet Stargate — c'est une opportunité de consolider leur position avant que le titre ne soit accessible à tous. Cette levée intervient dans un contexte de course effrénée aux capitaux dans l'IA générative. OpenAI fait face à la montée en puissance de concurrents comme Anthropic, Google DeepMind et des acteurs chinois tels que DeepSeek. Avec une valorisation frôlant les 1 000 milliards de dollars, l'entreprise fondée par Sam Altman s'approche d'un statut de « trillion-dollar company » avant même son entrée en bourse, une IPO qui pourrait redéfinir les standards du secteur technologique.

UELa valorisation record d'OpenAI à 852 milliards de dollars et sa future IPO renforceront la dépendance des entreprises européennes aux infrastructures IA américaines, aggravant les enjeux de souveraineté numérique de l'UE.

💬 852 milliards avant même l'IPO, c'est du jamais vu et c'est pas un accident. Ouvrir le tour aux particuliers, c'est pas de la générosité envers les petits porteurs, c'est la mécanique classique pour chauffer la base actionnaire et arriver en bourse avec un marché déjà acquis. Ça va faire une IPO spectaculaire sur le papier, bon, reste à voir ce que ça donne quand les vrais chiffres de marge seront publics.

BusinessActu
1 source
Le code source complet du CLI Claude Code a fuité via un fichier map exposé
496Ars Technica AI 

Le code source complet du CLI Claude Code a fuité via un fichier map exposé

Anthropic a accidentellement exposé l'intégralité du code source de son outil Claude Code CLI en publiant ce matin la version 2.1.88 du package npm. Le package contenait un fichier source map, une erreur interne grave qui a permis à quiconque de reconstituer près de 2 000 fichiers TypeScript représentant plus de 512 000 lignes de code. Le chercheur en sécurité Chaofan Shou a été le premier à le signaler publiquement sur X en partageant une archive des fichiers. Le code a ensuite été déposé dans un dépôt GitHub public et a été forké des dizaines de milliers de fois en quelques heures. Cette fuite est un revers significatif pour Anthropic : le code source de Claude Code constitue un blueprint détaillé de l'architecture et du fonctionnement interne de l'outil, offrant aux concurrents — OpenAI, Google, et les dizaines de startups qui développent des agents de codage — une visibilité inédite sur les choix d'ingénierie d'Anthropic. Pour les utilisateurs, la fuite ne compromet pas directement la sécurité de leurs données, mais elle soulève des questions sur les pratiques de publication et de contrôle qualité de l'entreprise. Le code étant désormais massivement distribué, il est pratiquement impossible de le retirer de la circulation. Claude Code est l'un des produits à la plus forte croissance d'Anthropic ces derniers mois, devenu un outil central dans le segment des assistants de développement, en concurrence directe avec GitHub Copilot et Cursor. Cette exposition survient à un moment particulièrement délicat, alors qu'Anthropic cherche à s'imposer comme un acteur de confiance dans l'industrie. La mésaventure rappelle l'incident similaire survenu chez Samsung en 2023, où des ingénieurs avaient involontairement exposé du code propriétaire via ChatGPT — sauf qu'ici, c'est l'entreprise elle-même qui a commis l'erreur. La suite dépendra en partie de la réaction juridique d'Anthropic, même si la diffusion massive rend toute suppression illusoire.

UELa fuite expose l'architecture interne de l'outil le plus utilisé par les développeurs IA en Europe, soulevant des questions sur les pratiques de sécurité des éditeurs de logiciels IA et sur la protection du secret industriel dans le secteur.

BusinessOpinion
1 source
Le code source de Claude Code semble avoir fuité : ce que l'on sait
497VentureBeat AI 

Le code source de Claude Code semble avoir fuité : ce que l'on sait

Un fichier de débogage de 59,8 Mo a été accidentellement inclus dans la version 2.1.88 du package @anthropic-ai/claude-code publié sur le registre npm tôt ce matin. Ce fichier .map, destiné à un usage interne, contenait l'intégralité du code source TypeScript de Claude Code — environ 512 000 lignes. À 4h23 du matin (heure de l'Est), Chaofan Shou, un stagiaire chez Solayer Labs, a publié la découverte sur X avec un lien direct vers une archive téléchargeable. En quelques heures, le code était dupliqué sur GitHub et analysé par des milliers de développeurs. Anthropic, dont le chiffre d'affaires annualisé est estimé à 19 milliards de dollars en mars 2026, n'a pas encore commenté officiellement l'incident. La fuite est stratégiquement dévastatrice pour une raison précise : Claude Code représente à lui seul 2,5 milliards de dollars de revenus récurrents annualisés, un chiffre qui a plus que doublé depuis janvier 2026, avec 80 % du revenu issu des entreprises. Le code exposé constitue un véritable plan de construction pour les concurrents — de Cursor aux grands acteurs — sur la manière de concevoir un agent IA fiable et commercialement viable. L'architecture mémoire en trois couches dévoilée est particulièrement précieuse : au lieu de tout stocker, le système utilise un fichier MEMORY.md léger comme index de pointeurs, distribuant la connaissance dans des fichiers thématiques chargés à la demande, tandis que les transcriptions brutes ne sont jamais relues intégralement mais parcourues par recherche ciblée. Ce système de "mémoire sceptique" force l'agent à vérifier les faits contre le code réel avant d'agir, évitant les hallucinations lors de sessions longues. Le code révèle également "KAIROS" — référence grecque au "moment opportun" — un mode daemon autonome mentionné plus de 150 fois dans la source. Cette fonctionnalité non annoncée permet à Claude Code de fonctionner en arrière-plan en continu : lorsque l'utilisateur est inactif, un processus appelé autoDream consolide la mémoire de l'agent, fusionne les observations disparates et élimine les contradictions, de sorte que le contexte soit propre et pertinent au retour de l'utilisateur. Cette fuite survient dans un contexte de concurrence acharnée sur le marché des agents IA codeurs, où chaque avantage architectural représente des mois de R&D. Anthropic se retrouve dans la position inconfortable d'avoir involontairement offert à ses rivaux une fenêtre rare sur ses choix d'ingénierie les plus avancés.

BusinessOpinion
1 source
Les outils d'IA pour la santé se multiplient, mais sont-ils vraiment efficaces ?
498MIT Technology Review 

Les outils d'IA pour la santé se multiplient, mais sont-ils vraiment efficaces ?

Microsoft a lancé Copilot Health début mars 2026, une section dédiée dans son application Copilot permettant aux utilisateurs de connecter leurs dossiers médicaux et de poser des questions de santé personnalisées. Quelques jours auparavant, Amazon avait élargi l'accès à Health AI — un outil basé sur un grand modèle de langage jusqu'alors réservé aux abonnés de son service One Medical — au grand public. Ces deux lancements rejoignent ChatGPT Health, déployé par OpenAI en janvier 2026, et Claude d'Anthropic, qui peut accéder aux dossiers médicaux des utilisateurs avec leur consentement. Microsoft reçoit déjà 50 millions de questions de santé par jour sur Copilot, et la santé est devenue le sujet de discussion le plus fréquent sur l'application mobile. Karan Singhal, qui dirige l'équipe Health AI d'OpenAI, confirme une hausse « rapide, très rapide » des usages médicaux de ChatGPT, bien avant le lancement de produits dédiés. Cette vague répond à un besoin réel : l'accès aux soins reste difficile dans de nombreux systèmes de santé, particulièrement pour certaines populations. Des chatbots disponibles 24h/24, sans jugement, capables d'orienter un patient — triage inclus — pourraient à la fois améliorer la santé des utilisateurs et décharger un système saturé. Dominic King, vice-président santé chez Microsoft AI et ancien chirurgien, voit dans les progrès récents de l'IA générative la raison principale de ce déploiement accéléré. Girish Nadkarni, directeur de l'IA au Mount Sinai Health System, reconnaît lui aussi que ces outils occupent une place légitime dans le paysage, précisément parce qu'ils comblent un vide structurel. Certaines recherches suggèrent d'ailleurs que les LLM actuels sont capables de formuler des recommandations médicales utiles et sans danger. Mais les chercheurs indépendants tempèrent l'enthousiasme. Andrew Bean, doctorant à l'Oxford Internet Institute, estime que si ces modèles ont peut-être atteint un niveau suffisant pour être déployés, « la base de preuves doit impérativement être là ». Le problème central est celui de l'évaluation : en matière de santé, confier aux entreprises le soin de valider leurs propres produits comporte des risques, surtout si ces évaluations ne sont pas soumises à une révision externe. Même des acteurs sérieux comme OpenAI, qui mène des recherches rigoureuses, peuvent avoir des angles morts que la communauté scientifique plus large pourrait identifier. L'enjeu pour les prochains mois sera donc de savoir si l'industrie acceptera — ou si les régulateurs exigeront — des évaluations indépendantes avant tout déploiement à grande échelle de ces outils dans un domaine aussi sensible que la santé.

UELes outils de santé IA déployés par Microsoft, Amazon et OpenAI devront se conformer à l'AI Act (classification haut risque) et au règlement européen sur les dispositifs médicaux (MDR) avant tout accès au marché européen, ce qui retardera probablement leur disponibilité pour les patients français et européens.

OutilsOutil
1 source
OpenAI Frontier place les agents IA d'entreprise au cœur d'un combat que le secteur SaaS ne peut pas se permettre de perdre
499AI News 

OpenAI Frontier place les agents IA d'entreprise au cœur d'un combat que le secteur SaaS ne peut pas se permettre de perdre

OpenAI a lancé Frontier en février, une plateforme d'agents IA d'entreprise conçue comme une couche sémantique centralisée connectant entrepôts de données, CRM et outils internes — avec pour premiers clients Uber, State Farm, Intuit et Thermo Fisher Scientific. La CFO Sarah Friar vise à faire passer les revenus entreprise de 40% à 50% d'ici fin d'année, et les premiers résultats sont frappants : 90% du temps administratif libéré pour des commerciaux, 1 500 heures économisées par mois chez un client tech, et un processus d'optimisation industriel réduit de six semaines à un seul jour. La plateforme, volontairement ouverte aux agents Google, Microsoft et Anthropic, représente une menace structurelle directe pour le modèle SaaS à licences par siège, dont la rentabilité repose sur l'hypothèse que l'usage logiciel est indexé sur les effectifs humains.

UELes entreprises européennes utilisant des logiciels SaaS à licences par siège (Salesforce, SAP, ServiceNow) doivent anticiper une disruption tarifaire structurelle si ce modèle d'agents IA se généralise en Europe.

BusinessOpinion
1 source
Nvidia va investir 26 milliards de dollars dans des modèles d'IA open-weight, selon des documents officiels
500Wired AI 

Nvidia va investir 26 milliards de dollars dans des modèles d'IA open-weight, selon des documents officiels

Nvidia prévoit d'investir 26 milliards de dollars dans le développement de modèles d'IA open-weight, selon des documents officiels. Cette initiative positionnerait le géant de l'infrastructure IA pour concurrencer directement OpenAI, Anthropic et DeepSeek. Ce pivot stratégique marque une entrée significative de Nvidia dans la course aux modèles de fondation.

UEL'entrée de Nvidia dans le segment des modèles open-weight intensifie la concurrence pour Mistral, acteur français de référence dans ce domaine.

BusinessActu
1 source