Aller au contenu principal

Dossier OpenAI — page 18

1663 articles · page 18 sur 34

Toute l'actualité d'OpenAI : nouvelles versions de ChatGPT et GPT, stratégie produit, partenariats, controverses et décisions de Sam Altman.

Comment xAI Colossus redéfinit les règles de la course à l’IA
851Le Big Data InfrastructureOpinion

Comment xAI Colossus redéfinit les règles de la course à l’IA

En mars 2023, Elon Musk fonde xAI pour affronter directement OpenAI, Google et Meta dans la course aux grands modèles de langage. Le premier modèle, Grok, sort fin 2023 avec des résultats prometteurs, mais l'entreprise se heurte rapidement à un obstacle structurel majeur : elle ne possède aucune infrastructure propre et loue sa puissance de calcul auprès de fournisseurs cloud comme Oracle. Pour briser cette dépendance, Musk lance dès le printemps 2024 un chantier d'une rapidité inédite. xAI rachète une ancienne usine Electrolux de 73 000 mètres carrés à Memphis, Tennessee, et y déploie le supercalculateur Colossus. Début 2026, le site concentre environ 555 000 processeurs NVIDIA interconnectés, principalement des H100 et H200 dans le premier bloc (Colossus 1), et la nouvelle architecture Blackwell GB200/GB300 dans le second (Colossus 2), auxquels s'ajoute une extension satellitaire en cours à Southaven. À près de 35 000 dollars l'unité, le seul achat des composants dépasse les 18 milliards de dollars. Cette infrastructure redéfinit les rapports de force dans l'industrie de l'IA. En contrôlant son propre parc de calcul, xAI s'affranchit des délais et des contraintes imposés par les fournisseurs tiers, ce qui lui permet d'accélérer l'entraînement de ses modèles au rythme qu'elle impose. La densité thermique extrême générée par 555 000 puces a nécessité l'abandon du refroidissement par air au profit d'un système à eau intégral en circuit fermé, fourni par Dell et Supermicro, qui capte la chaleur directement sur le silicium et réduit significativement les coûts d'électricité liés à la climatisation. Sur le plan réseau, xAI a fait le choix de rejeter l'InfiniBand, standard dominant mais coûteux et en rupture mondiale, pour déployer la plateforme NVIDIA Spectrum-X Ethernet, avec routage adaptatif et protocole RoCE, afin d'éliminer la latence de queue qui paralyse les clusters lors des échanges massifs de paramètres entre processeurs. Ce projet s'inscrit dans une rivalité technologique et géopolitique qui dépasse largement xAI. La puissance de calcul est devenue la ressource stratégique centrale de l'IA : qui contrôle les clusters contrôle le rythme d'innovation. Microsoft, Google et Amazon ont chacun engagé des dizaines de milliards dans leurs propres datacenters, tandis que la pénurie mondiale de puces NVIDIA maintient une pression constante sur les acteurs moins capitalisés. En construisant Colossus en moins d'un an, là où l'industrie estimait le délai à deux ans minimum, xAI a envoyé un signal clair sur sa capacité d'exécution. La prochaine étape sera de transformer cette puissance brute en avance technologique durable face à des concurrents qui ne restent pas immobiles.

UELa concentration de capacité de calcul chez les acteurs américains creuse l'écart avec les laboratoires et startups européens, renforçant leur dépendance aux infrastructures cloud extérieures à l'UE.

1 source
Nous Research publie Hermes Desktop : une interface native multiplateforme pour Hermes Agent v0.15.2 avec sortie en streaming
852MarkTechPost 

Nous Research publie Hermes Desktop : une interface native multiplateforme pour Hermes Agent v0.15.2 avec sortie en streaming

Nous Research a lancé en prévisualisation publique Hermes Desktop, une application native disponible sur macOS, Windows et Linux, qui offre pour la première fois une interface graphique à son agent IA open source Hermes. Jusqu'ici limité à une interface en ligne de commande et à des passerelles de messagerie, Hermes Agent v0.15.2 dispose désormais d'une fenêtre native avec affichage en streaming des réponses, prévisualisation en temps réel des pages web, fichiers et sorties d'outils, un navigateur de fichiers, ainsi que des entrées et sorties vocales. L'application partage entièrement son cœur avec le CLI existant : configuration, clés API, sessions, compétences et mémoire sont communs à toutes les surfaces. Une conversation démarrée dans le bureau peut reprendre dans le terminal, et inversement, sans duplication d'état. Hermes Desktop a été démontré pour la première fois lors du keynote GTC de Jensen Huang avant d'être rendu disponible le 2 juin 2026. Ce lancement marque une étape importante dans l'accessibilité des agents IA autonomes pour le grand public. Hermes n'est pas un simple assistant de chat : c'est un agent qui planifie, exécute des actions et maintient un état persistant entre les sessions. La boucle d'apprentissage fermée le distingue des outils classiques : après une tâche complexe, l'agent génère des compétences réutilisables qui s'améliorent d'elles-mêmes lors des usages ultérieurs. La mémoire est gérée par l'agent lui-même, avec rappel inter-sessions via recherche FTS5 et résumé par LLM. En supprimant le prérequis du terminal, Nous Research ouvre Hermes à une population bien plus large d'utilisateurs non techniques, ce qui pourrait accélérer l'adoption des agents IA dans des flux de travail professionnels quotidiens. Nous Research s'inscrit dans une compétition croissante autour des agents IA autonomes et multiplateformes, face à des acteurs comme Anthropic avec Claude Code ou OpenAI avec ses capacités agentiques. Hermes se connecte à Telegram, Discord, Slack, WhatsApp, Signal, Email et CLI depuis une seule passerelle, avec un planificateur cron intégré et une délégation à des sous-agents isolés. L'exécution est sandboxée via cinq backends : local, Docker, SSH, Singularity et Modal. L'interopérabilité avec le Model Context Protocol (MCP) permet d'intégrer des outils externes. Pour les API, Nous Portal propose quatre niveaux d'abonnement (Free, Plus, Super, Ultra) donnant accès à plus de 300 modèles et à un Tool Gateway unifié qui route la recherche web via Firecrawl, la génération d'images via FAL et la synthèse vocale via OpenAI. Les prochaines questions porteront sur la stabilité hors prévisualisation et sur la capacité de la startup à tenir face aux ressources des géants du secteur.

OutilsOutil
1 source
Microsoft lance Project Solara, un OS Android conçu pour les agents plutôt que les applications
853Ars Technica AI 

Microsoft lance Project Solara, un OS Android conçu pour les agents plutôt que les applications

Microsoft a présenté Project Solara lors de sa conférence Build 2026, un système d'exploitation basé sur Android conçu non pas pour faire tourner des applications, mais des agents autonomes. Contrairement aux OS mobiles traditionnels, Solara est pensé comme une plateforme "chip-to-cloud", c'est-à-dire intégrée depuis le matériel jusqu'au cloud, capable de s'adapter à une multitude de dispositifs spécialisés. Pour l'instant, le projet reste limité à quelques prototypes conceptuels et ne sera pas disponible sur les appareils grand public dans l'immédiat. L'ambition déclarée de Microsoft est que Solara génère des interfaces à la volée, en fonction des besoins de l'agent qui s'y exécute, plutôt que de s'appuyer sur des interfaces figées comme le font les applications classiques. L'enjeu est considérable pour l'industrie technologique : si les agents IA deviennent les unités fondamentales d'interaction avec les machines, le modèle de distribution logicielle hérité des smartphones sera remis en cause. Les développeurs d'applications, les stores numériques, et les fabricants de puces devront tous s'adapter à un paradigme où l'interface n'est plus construite à l'avance mais calculée en temps réel. Pour les utilisateurs, cela signifierait des appareils potentiellement plus polyvalents, capables de se transformer selon la tâche, mais aussi une dépendance accrue aux modèles de langage sous-jacents et aux infrastructures cloud de Microsoft. Microsoft reconnaît elle-même que son discours reste largement spéculatif et que les modèles suffisamment puissants pour alimenter cette vision n'existent pas encore. La démarche s'inscrit dans la continuité de son partenariat avec OpenAI, aujourd'hui en cours de restructuration, et dans une tentative de ne pas répéter ses erreurs passées dans la transition mobile, où l'entreprise avait pris du retard sur les applications, la sécurité et le support long terme. En positionnant Solara dès maintenant, Microsoft cherche à occuper le terrain avant que la prochaine rupture technologique ne se concrétise.

UESi le paradigme agent-first se concrétise, les développeurs d'applications et fabricants d'appareils européens devront revoir leurs modèles économiques face à une dépendance accrue à l'écosystème Microsoft.

InfrastructureOpinion
1 source
Anthropic envisage une introduction en bourse, signe de la maturité de l'IA en entreprise
854AI News 

Anthropic envisage une introduction en bourse, signe de la maturité de l'IA en entreprise

Anthropic prépare une introduction en bourse qui constitue un tournant symbolique pour l'industrie de l'intelligence artificielle générative. L'entreprise fondée par Dario et Daniela Amodei, valorisée à plusieurs dizaines de milliards de dollars, franchit ainsi le seuil qui sépare la phase de recherche à capital-risque d'un statut de fournisseur d'infrastructure d'entreprise à part entière. William Samengo-Turner, responsable du secteur technologique chez le cabinet juridique A&O Shearman, résume l'enjeu : "La vraie question n'est pas de savoir si les marchés publics sont prêts pour l'IA, mais si l'IA est prête pour les marchés publics." Karthik Hariharan, ingénieur senior chez DoorDash, observe pour sa part qu'Anthropic et OpenAI se livrent une course à l'IPO, et que le premier à franchir la ligne "fixera probablement le plancher et le plafond des valorisations pour les 12 à 18 mois suivants." Cette cotation en bourse redéfinit concrètement la relation entre Anthropic et ses clients professionnels. Les entreprises qui intègrent Claude dans leurs workflows internes pourront désormais planifier sur plusieurs années autour de grilles tarifaires, de limites d'API et de contrats de service formalisés. Mais l'équation est contrainte : entraîner chaque nouvelle génération de modèles nécessite des dizaines de milliers de GPU et des dépenses d'investissement massives, que la structure des marchés publics oblige à répercuter de façon prévisible sur les clients. Si Wall Street exige une expansion agressive des marges post-IPO, les entreprises devront anticiper des conditions de licence plus strictes et l'abandon progressif des versions de modèles les moins rentables, créant des cycles de migration forcée pour les équipes de développement. Le modèle économique sous-jacent révèle une dépendance structurelle au marché B2B. Suvrankar Datta, chercheur au CRASH Lab, le chiffre sans détour : sur huit milliards d'êtres humains, seulement 100 millions peuvent se permettre de payer Claude au tarif actuel, et les 20 dollars mensuels de l'abonnement grand public ne financent pas des clusters de serveurs à plusieurs milliards de dollars. La survie financière d'Anthropic repose donc sur son ancrage dans les budgets des grandes organisations, à travers des usages comme la gestion des ressources humaines, la revue de documents juridiques ou le tri du support client. Nate Elliott, analyste IA chez Emarketer, pointe la tension centrale : "Claude a construit une base d'utilisateurs enterprise solide, mais il n'est pas compétitif en tant que plateforme IA grand public." La cotation d'Anthropic sera ainsi le premier test grandeur nature pour savoir si Wall Street considère l'IA comme une histoire de consommateurs ou comme une infrastructure industrielle.

UELes entreprises européennes intégrant Claude dans leurs workflows devront anticiper des révisions tarifaires et des conditions contractuelles plus strictes imposées par les exigences de rentabilité des marchés publics.

BusinessOpinion
1 source
Une implémentation du Microsoft Agent Governance Toolkit pour un usage sécurisé des outils d'agents IA : politiques, validations, journaux d'audit et contrôles des risques
855MarkTechPost 

Une implémentation du Microsoft Agent Governance Toolkit pour un usage sécurisé des outils d'agents IA : politiques, validations, journaux d'audit et contrôles des risques

Microsoft a publié le Agent Governance Toolkit, un cadre de référence permettant de contrôler et d'auditer les actions des agents IA avant leur exécution. Un tutoriel d'implémentation, conçu pour fonctionner directement dans Google Colab, illustre concrètement son fonctionnement : les agents ne peuvent pas exécuter directement leurs outils. Chaque action est d'abord soumise à une couche de gouvernance qui vérifie l'identité de l'agent, son score de confiance, le niveau de risque de l'opération, la sensibilité des données concernées et les règles de politique applicables. Le système repose sur des fichiers de configuration YAML définissant des règles précises : blocage des opérations destructrices en base de données (suppression ou vidage de tables), approbation humaine obligatoire pour l'envoi d'e-mails vers des destinataires externes, exécution en bac à sable des commandes shell avec filtrage de termes dangereux comme rm -rf ou chmod 777, et refus d'accès aux données sensibles pour les agents dont le score de confiance est inférieur à 0,65. Le toolkit génère également des journaux d'audit infalsifiables, permet d'activer un coupe-circuit global et offre une visualisation graphique des relations entre agents, outils, règles et résultats. Cette architecture répond à un problème croissant dans le déploiement des agents IA : l'agentivité excessive. À mesure que ces systèmes deviennent capables d'enchaîner des actions autonomes, qu'il s'agisse d'écrire dans des bases de données, d'envoyer des e-mails ou d'exécuter du code, le risque qu'ils accomplissent des opérations non souhaitées ou dommageables augmente considérablement. Le toolkit propose un modèle où chaque action peut être autorisée, refusée, mise en sandbox ou redirigée vers un processus d'approbation humaine, selon des critères déterministes et traçables. Les règles s'appuient sur la taxonomie de risques de l'OWASP pour les agents IA, notamment les catégories « Tool misuse », « Goal hijacking » et « Unauthorized action », apportant un cadre de conformité reconnu aux équipes de sécurité. La publication de ce toolkit s'inscrit dans un mouvement plus large de l'industrie pour encadrer les agents autonomes, dont la prolifération s'est accélérée depuis 2024 avec l'essor de frameworks comme LangChain, AutoGen (lui aussi développé par Microsoft) et les API d'agents d'OpenAI et Anthropic. Microsoft, qui a massivement investi dans l'IA via son partenariat avec OpenAI et l'intégration dans Azure et Copilot, se positionne ainsi comme acteur de référence sur la gouvernance de ces systèmes. Le fait que l'implémentation soit reproductible dans un notebook Colab, sans infrastructure complexe, signale une volonté claire de démocratiser ces pratiques au-delà des grandes entreprises. Les étapes naturelles incluent l'intégration de ce type de couche dans les plateformes d'orchestration existantes et l'adoption de standards communs pour l'audit des décisions IA.

UELa taxonomie de risques OWASP intégrée au toolkit s'aligne directement avec les exigences de traçabilité et de supervision humaine de l'AI Act européen, facilitant la conformité des équipes qui déploient des agents IA autonomes.

SécuritéTuto
1 source
Claude Opus 4.8 est-il enfin honnête ? Le test de l’honnêteté
856Le Big Data 

Claude Opus 4.8 est-il enfin honnête ? Le test de l’honnêteté

Anthropic a lancé Claude Opus 4.8 le 28 mai 2026, avec une promesse inhabituelle dans le secteur : moins d'affirmations non étayées et davantage de doutes assumés. Disponible immédiatement sur Claude et via l'API sous la référence claude-opus-4-8, le modèle conserve la tarification de son prédécesseur Opus 4.7, soit 5 dollars par million de tokens en entrée et 25 dollars en sortie. La nouveauté la plus concrète concerne la fiabilité du code : selon Anthropic, Opus 4.8 serait environ quatre fois moins susceptible de laisser passer sans avertissement des failles dans le code qu'il a lui-même généré. Le modèle vérifie davantage ses propres sorties avant de les restituer, et signale plus systématiquement ses incertitudes. Un mode rapide promet en outre une vitesse 2,5 fois supérieure à coût réduit. L'enjeu n'est pas anodin. Le vrai problème des modèles de langage n'est pas tant l'erreur que l'erreur présentée avec aplomb, transformant un bug en dette technique invisible. Dans les usages professionnels, revues de code, migrations de systèmes, analyses de documents longs, une approximation confiante peut contaminer l'ensemble d'un travail. Si Opus 4.8 tient sa promesse d'honnêteté, l'impact est direct pour les équipes d'ingénierie qui utilisent l'IA comme copilote. En parallèle, le modèle intègre en avant-première une capacité étendue dans Claude Code : planifier des tâches complexes et lancer des centaines de sous-agents en parallèle pour s'attaquer à des migrations de bases de code comptant des centaines de milliers de lignes. Cette montée en puissance vers l'orchestration rend la question de l'honnêteté encore plus structurante. Plus un modèle délègue à des agents autonomes, moins l'utilisateur peut surveiller chaque étape intermédiaire. Anthropic s'inscrit ici dans une tendance lourde : tous les grands laboratoires, OpenAI, Google DeepMind, cherchent à faire de leurs modèles de véritables chefs de projet capables de superviser des pipelines automatisés. Le risque, si la vérification interne n'est pas à la hauteur, est d'obtenir une usine à erreurs distribuées à grande échelle. Le verdict d'Opus 4.8 ne viendra pas des benchmarks officiels mais des développeurs confrontés à des migrations réelles, des audits de sécurité ou des analyses juridiques où une réponse prudente vaut mieux qu'une réponse rapide et fausse.

UELes équipes de développement françaises et européennes utilisant Claude via l'API peuvent adopter immédiatement Opus 4.8 pour leurs audits de code et migrations, sans surcoût par rapport à Opus 4.7.

💬 C'est le vrai problème des LLMs qu'Anthropic cible enfin : pas l'erreur, mais l'erreur dite avec confiance. Quatre fois moins de failles passées en silence dans le code généré, si ça tient hors benchmarks maison, tu peux commencer à lui confier des migrations réelles sans te retrouver avec une usine à dette technique. Le verdict ne viendra pas des slides Anthropic.

LLMsOpinion
1 source
Apple relance son offensive pour une IA locale, sans passer par le cloud
857The Information AI 

Apple relance son offensive pour une IA locale, sans passer par le cloud

Lors de sa conférence annuelle des développeurs (WWDC), prévue le mois prochain, Apple devrait mettre en avant une série de mises à jour d'intelligence artificielle très attendues pour l'iPhone, tout en insistant sur une capacité souvent sous-estimée : celle de faire tourner des modèles d'IA directement sur ses appareils, sans passer par le cloud. Selon des personnes proches des plans de l'entreprise, Apple entend démontrer comment ses 15 ans d'expérience dans la conception de puces personnalisées pour l'iPhone, l'Apple Watch et les Mac lui confèrent un avantage concret pour exécuter des modèles d'IA localement. Cette approche contraste avec la norme du secteur, où la plupart des traitements IA s'effectuent dans des datacenters remplis de puces coûteuses. Certaines requêtes resteront néanmoins traitées dans le cloud, notamment celles qui nécessitent une complexité élevée ou un accès à de vastes bases de données en ligne : dans le cadre d'un accord avec Google, une nouvelle version de Siri fera tourner certaines requêtes sur Google Cloud, via une version sous licence du modèle Gemini. Apple a par ailleurs récemment approuvé une technologie de confidentialité développée par Nvidia pour cet environnement, ce qui suggère que l'entreprise utilisera également des puces Nvidia pour une partie de ses besoins de calcul dans Google Cloud. L'enjeu de l'IA embarquée est considérable : exécuter des modèles localement réduit la latence, améliore la confidentialité des données et diminue la dépendance à des infrastructures cloud onéreuses. Avec des milliards d'appareils Apple en circulation, la capacité à distribuer des traitements IA à cette échelle représente un levier différenciant face à des concurrents comme Google, Microsoft ou OpenAI, dont les offres reposent quasi exclusivement sur des serveurs distants. Apple accuse un retard significatif sur ses rivaux dans la course à l'IA générative. La WWDC du mois prochain sera donc un moment clé pour démontrer que la maîtrise du matériel, via ses puces Apple Silicon, peut constituer une réponse crédible à ce retard. La coexistence d'une stratégie on-device et d'un recours au cloud via des partenaires comme Google et Nvidia illustre la complexité de la position d'Apple : rattraper rapidement les leaders du secteur tout en préservant les promesses de confidentialité qui sont au coeur de son identité de marque.

UEL'approche on-device d'Apple réduit les transferts de données vers des serveurs distants, ce qui s'aligne naturellement avec les exigences du RGPD et pourrait renforcer la conformité des milliards d'appareils Apple utilisés en Europe.

💬 L'argument confidentialité tient moins bien avec Siri qui sous-traite à Google Cloud, mais c'est à côté du sujet. Ce qui compte, c'est que quinze ans de puces custom donnent à Apple une base que Google ou Microsoft ne peuvent pas copier en six mois : faire tourner de l'IA sur des milliards d'appareils sans passer par un datacenter, c'est une infrastructure inversée que personne d'autre n'a. Reste à voir si les modèles sont à la hauteur.

InfrastructureOpinion
1 source
Alors que Grok peine, SpaceX mise sur la victoire face aux géants de la tech en IA
858Ars Technica AI 

Alors que Grok peine, SpaceX mise sur la victoire face aux géants de la tech en IA

SpaceX a déposé un document S-1 en vue d'une introduction en bourse anticipée, révélant une stratégie d'entreprise qui place désormais l'intelligence artificielle au coeur de son modèle économique. La société a formellement intégré xAI, la startup d'IA d'Elon Musk, en début d'année 2026, donnant naissance à la division SpaceXAI qui chapeaute les modèles Grok et le chatbot associé, auparavant développés de façon indépendante. Dans ce prospectus, SpaceX revendique posséder "le plus grand marché adressable actionnable de l'histoire humaine", estimant l'opportunité liée à l'IA à 26 500 milliards de dollars, une somme qui approche le PIB nominal des États-Unis, établi à près de 32 000 milliards de dollars au premier trimestre 2026. Le lancement de satellites et les missions spatiales, activités historiques de l'entreprise, y sont désormais présentés comme des activités de soutien à ce nouveau coeur de métier. Ce repositionnement stratégique intervient dans un contexte difficile pour Grok, qui peine à s'imposer face à des concurrents solidement établis. Les clients d'entreprise et les développeurs se tournent massivement vers OpenAI et Anthropic, dont les modèles bénéficient d'une adoption bien plus large et d'écosystèmes matures. Pour SpaceX, transformer une IPO en succès dépend donc en grande partie de la capacité de sa division IA à convaincre un marché qui n'a pas spontanément choisi Grok. L'enjeu financier est considérable : si les projections se révèlent même partiellement fondées, la valorisation attendue pourrait dépasser celle de nombreuses entreprises technologiques cotées. La fusion de xAI dans SpaceX illustre la concentration croissante des paris d'Elon Musk autour d'une seule entité, après des années de gestion parallèle de Tesla, SpaceX, xAI et X. L'absorption de xAI permet à SpaceX de mutualiser les données issues de ses infrastructures spatiales, notamment Starlink avec ses millions d'abonnés, pour alimenter des systèmes d'IA propriétaires. La course aux données et à la puissance de calcul constitue le véritable front concurrentiel, et SpaceX mise sur son infrastructure physique unique pour se différencier d'acteurs comme Google, Microsoft ou Amazon, qui dominent aujourd'hui le marché des services d'IA en entreprise.

UEL'essor d'un nouvel acteur majeur dans l'IA générative pourrait accentuer la dépendance des entreprises européennes aux plateformes américaines et fragiliser les efforts de souveraineté numérique portés par l'UE.

💬 Le chiffre de 26 500 milliards, c'est du prospectus pur (il faut bien justifier la valorisation). Ce qui m'intéresse vraiment, c'est Starlink : des millions d'abonnés, une infrastructure physique mondiale qu'OpenAI ne pourra jamais racheter. Reste à voir si ça suffit à convaincre les devs, parce que si tu regardes les forums en ce moment, le choix par défaut c'est toujours pas Grok.

BusinessOpinion
1 source
Qwen3.7 Max : l’IA d’Alibaba écrase ses anciens scores sur les benchmarks IA
859Le Big Data 

Qwen3.7 Max : l’IA d’Alibaba écrase ses anciens scores sur les benchmarks IA

Alibaba a dévoilé le 21 mai 2026 son nouveau modèle de langage Qwen3.7 Max, qui affiche un score de 56,6 sur l'Artificial Analysis Intelligence Index, soit 4,8 points de plus que son prédécesseur Qwen3.6 Max Preview (51,8). Le bond le plus notable concerne le codage agentique et le raisonnement scientifique, avec des progressions significatives sur des benchmarks spécialisés comme Humanity's Last Exam et TerminalBench Hard. La fenêtre de contexte du modèle passe également de 256 000 à un million de tokens, ce qui lui permet de traiter des volumes d'information sans précédent dans une seule session. Alibaba met aussi en avant une réduction mesurable du taux d'hallucinations : le modèle préfère ne pas répondre plutôt que d'inventer une information incertaine, une stratégie rendue possible par un investissement massif dans les techniques de reinforcement learning. Ces avancées ont des conséquences directes pour les développeurs et les entreprises qui utilisent l'IA dans leurs workflows. Une fenêtre d'un million de tokens change concrètement ce qu'il est possible de faire : analyser des bases de code entières, traiter de longs documents juridiques ou financiers, ou enchaîner des raisonnements complexes sur plusieurs étapes sans perdre de contexte. La réduction des hallucinations est un argument commercial fort dans les secteurs où la fiabilité est critique, comme le droit, la finance ou la médecine. Sur ces critères précis, Qwen3.7 Max commence à se positionner comme une alternative sérieuse aux offres d'OpenAI, Anthropic et Google, même si le modèle reste encore derrière les meilleurs modèles américains sur les classements globaux. Longtemps perçu comme un outsider dans la course aux grands modèles de langage, Alibaba s'impose progressivement comme un acteur de premier plan. La série Qwen incarne cette stratégie de rattrapage accéléré : chaque nouvelle version réduit l'écart avec la frontière technologique définie par GPT-4o, Claude ou Gemini. Le contexte géopolitique autour des semi-conducteurs et des restrictions américaines à l'export de puces avancées rend ces progrès d'autant plus remarquables. En parallèle, d'autres laboratoires chinois comme DeepSeek et Baidu intensifient eux aussi leurs efforts, créant une dynamique de compétition interne qui pousse l'ensemble de l'écosystème vers le haut. La prochaine étape pour Alibaba sera probablement l'intégration de capacités multimodales avancées, absentes de Qwen3.7 Max, pour rivaliser pleinement avec les modèles américains qui traitent déjà texte, image et vidéo dans un même système.

UELes entreprises et développeurs européens disposent d'une nouvelle alternative compétitive aux modèles américains, notamment pour des usages exigeant de longues fenêtres de contexte ou une haute fiabilité dans des secteurs réglementés comme le droit ou la finance.

💬 Un million de tokens de contexte, c'est pas du marketing, ça change vraiment ce qu'on peut faire : analyser une base de code entière, ou garder le fil sur un raisonnement long sans tout reperdre au milieu. La réduction des hallucinations via reinforcement learning, c'est le pari technique qui mérite qu'on y regarde sérieusement, surtout dans des secteurs où inventer une réponse coûte cher. Qwen est encore derrière sur les classements globaux, mais l'écart se resserre à une vitesse qui devrait mettre un peu de pression sur les labos américains.

LLMsOpinion
1 source
Mistral AI se renforce dans l’industrie européenne avec le rachat de Emmi AI
860Le Big Data 

Mistral AI se renforce dans l’industrie européenne avec le rachat de Emmi AI

Mistral AI a annoncé l'acquisition d'Emmi AI, une startup autrichienne fondée à Linz et spécialisée dans la modélisation de phénomènes physiques complexes, flux d'air, transfert thermique, contraintes mécaniques sur les matériaux. Le montant de la transaction n'a pas été divulgué, mais l'opération est considérée comme l'une des plus significatives de l'écosystème européen de l'IA cette année. Emmi AI avait levé 15 millions d'euros en 2025, la plus importante levée de fonds jamais réalisée en Autriche dans le secteur de l'intelligence artificielle. Ses équipes, réparties entre l'Autriche, l'Allemagne et la Lituanie, rejoignent désormais Mistral. La société française prévoit d'ouvrir un bureau officiel à Linz, qui s'ajoutera à ses hubs existants à Paris, Londres et Munich. Cette acquisition donne à Mistral AI une capacité inédite en Physics AI, des modèles capables de comprendre et simuler le comportement du monde physique en temps réel. Pour les industriels des secteurs des semi-conducteurs, de l'automobile ou de l'aérospatiale, cela ouvre la voie à des jumeaux numériques plus précis, à des simulations accélérées et à une réduction significative des coûts de R&D. Mistral dispose déjà de modèles analysant les lignes de production pour détecter des défauts ou piloter des bras robotisés ; l'intégration des technologies d'Emmi doit rendre ces systèmes plus fiables dans leurs interactions avec des environnements physiques contraignants. L'enjeu est aussi de proposer aux industriels européens une alternative souveraine aux plateformes américaines, dont la dépendance est de plus en plus perçue comme un risque stratégique. Le rachat s'inscrit dans un contexte de montée en puissance de l'IA industrielle comme priorité politique en Europe. La Commission européenne considère le secteur manufacturier comme un pilier de sa stratégie d'autonomie technologique, et plusieurs États membres accélèrent leurs investissements dans ce domaine. Mistral AI, valorisé à plusieurs milliards d'euros après ses dernières levées de fonds, consolide ainsi son positionnement face aux géants américains comme Google, Microsoft ou OpenAI, qui investissent massivement dans les mêmes usages verticaux. En s'ancrant davantage en Europe centrale avec des engagements en Autriche, en Allemagne et en Lituanie, le groupe français envoie un signal clair : la compétition pour l'IA industrielle se jouera aussi sur la capacité à retenir les talents et à construire des infrastructures de recherche hors des États-Unis.

UEL'acquisition d'Emmi AI par Mistral AI renforce la souveraineté technologique européenne dans l'IA industrielle, avec l'ouverture d'un bureau à Linz et l'intégration d'équipes autrichiennes, allemandes et lituaniennes au sein d'un champion français.

💬 Mistral qui bascule dans la simulation physique, c'est un vrai pari industriel, pas juste du repositionnement marketing. Modéliser des flux d'air ou des contraintes thermiques en temps réel, ça vaut des millions d'euros de tests physiques évités pour un constructeur auto ou un fabricant de semi-conducteurs. L'intégration va être compliquée, mais si ça marche, c'est un avantage que ni OpenAI ni Google n'ont encore vraiment.

BusinessOpinion
1 source
La Maison Blanche informe les entreprises d'IA de son projet d'évaluation des modèles avant leur sortie
861The Information AI 

La Maison Blanche informe les entreprises d'IA de son projet d'évaluation des modèles avant leur sortie

Le Bureau du directeur national de la cybersécurité de la Maison Blanche a réuni mardi des représentants d'OpenAI, Anthropic et Reflection AI, ainsi que des acteurs des secteurs du cloud, des semi-conducteurs, de la cybersécurité et de la finance, pour les informer d'un futur décret présidentiel sur l'intelligence artificielle. Selon plusieurs sources proches du dossier, Donald Trump pourrait signer ce texte dès jeudi. L'ordre exécutif vise à permettre aux agences de renseignement et à d'autres services gouvernementaux d'examiner les modèles d'IA avancés avant leur mise sur le marché, dans le cadre d'un dispositif décrit comme volontaire. Concrètement, les laboratoires développant des modèles dits « frontier » seraient invités à les soumettre au gouvernement jusqu'à 90 jours avant leur sortie publique. Ce mécanisme de prénotification représente un tournant dans la relation entre Washington et l'industrie de l'IA. En s'accordant un droit de regard anticipé sur les systèmes les plus puissants, le gouvernement américain se dote d'un levier inédit pour évaluer les risques potentiels, qu'ils soient sécuritaires, économiques ou stratégiques, avant que ces modèles ne soient accessibles au grand public. La nature volontaire du cadre laisse toutefois ouverte la question de son application réelle : sans contrainte juridique explicite, son efficacité dépendra largement de la coopération des entreprises. Ce projet s'inscrit dans une dynamique plus large de reprise en main politique de l'IA par l'administration Trump, après la révocation en janvier 2025 du décret Biden qui imposait des exigences de sécurité aux développeurs de grands modèles. Si la nouvelle approche se veut moins contraignante sur le fond, elle marque néanmoins une volonté de maintenir une supervision gouvernementale sur une technologie jugée stratégique. La présence de banques et d'entreprises de cybersécurité à ce briefing souligne que l'enjeu dépasse le seul secteur tech et concerne désormais l'ensemble de l'économie numérique américaine.

UELa mise en place d'un cadre américain de pré-évaluation des modèles frontier pourrait influencer les débats européens sur la supervision de l'IA, mais n'a pas d'effet juridique direct sur la France ou l'Union européenne.

💬 90 jours de prénotification, sur la base du volontariat : c'est exactement le genre de cadre qui ressemble à une avancée mais qui tient à la bonne volonté des labos. OpenAI et Anthropic vont jouer le jeu, les autres feront ce qu'ils veulent. Ce qui m'intéresse, c'est la présence des banques dans le briefing, ça dit quelque chose sur ce que Washington anticipe vraiment comme risques.

RégulationReglementation
1 source
Les coûts d'Anthropic augmentent : les entreprises poussent leurs fournisseurs à raccourcir les contrats
862The Information AI 

Les coûts d'Anthropic augmentent : les entreprises poussent leurs fournisseurs à raccourcir les contrats

Les entreprises augmentent significativement leurs dépenses auprès d'Anthropic et d'autres fournisseurs d'IA, et ce budget supplémentaire doit bien venir de quelque part. La cible naturelle : les contrats logiciels traditionnels. Selon des dirigeants et des consultants, de nombreuses organisations ne renoncent pas encore à leurs applications d'entreprise, mais elles se positionnent pour le faire si l'IA venait à rendre ces outils moins indispensables. Concrètement, elles exigent des contrats plus courts et des conditions plus favorables auprès de leurs éditeurs SaaS historiques. Ce changement de rapport de force représente une menace sérieuse pour les grands éditeurs de logiciels d'entreprise comme Salesforce, SAP ou ServiceNow. Des contrats pluriannuels de trois à cinq ans, autrefois la norme, sont désormais contestés. Les entreprises clientes gagnent en flexibilité pour pivoter vers des solutions IA si celles-ci se révèlent capables de remplacer des fonctions entières -- CRM, gestion des workflows, support client -- à moindre coût. Cette pression s'inscrit dans un contexte de réallocation massive des budgets technologiques vers l'IA générative. Les dépenses en modèles de fondation comme Claude d'Anthropic ou GPT d'OpenAI explosent, tandis que les directions financières cherchent à compenser ces investissements en réduisant les coûts fixes. Le secteur du SaaS, qui avait bénéficié d'une décennie de croissance quasi garantie grâce aux renouvellements automatiques, entre dans une phase d'incertitude structurelle dont l'issue dépendra largement de sa capacité à intégrer l'IA dans ses propres offres.

UELes éditeurs européens comme SAP sont directement exposés à la pression des entreprises clientes qui raccourcissent leurs cycles de contrats pour conserver la flexibilité de migrer vers des solutions d'IA générative.

💬 Les boîtes n'ont pas encore quitté Salesforce. Mais elles exigent des contrats d'un an au lieu de cinq, histoire de garder une porte de sortie si l'IA finit par faire le boulot du CRM ou du support client à moindre coût. C'est ça, le vrai truc ici : l'IA comme levier de négociation avant même d'être un remplacement.

BusinessOpinion
1 source
Gemini 3.5 Flash veut réduire les coûts IA des entreprises
863Le Big Data 

Gemini 3.5 Flash veut réduire les coûts IA des entreprises

Google a lancé Gemini 3.5 Flash lors de sa conférence I/O 2026, le 19 mai 2026, en le positionnant comme son modèle propriétaire le plus économique à ce jour. Le tarif annoncé est de 1,50 dollar par million de jetons, une réduction significative pensée pour les entreprises qui déploient des agents IA à grande échelle. En parallèle, Google a dévoilé plusieurs nouveaux produits : Gemini Spark, un agent personnel capable d'agir en arrière-plan dans Gmail, Docs, Sheets et Slides pour compiler des informations, organiser des événements ou mettre à jour des tableaux en temps réel ; Omni Flash ; et AntiGravity 2.0, une nouvelle version de sa plateforme multi-agents. Sundar Pichai, PDG de Google, a déclaré que certaines organisations ont déjà consommé leur budget annuel de jetons alors que l'année est à peine entamée, soulignant l'urgence du problème. L'enjeu est directement financier pour les directions IT. À mesure que les agents IA s'intègrent dans les outils métiers, les volumes de jetons consommés explosent et les coûts dépassent les budgets prévus. Gemini 3.5 Flash cible précisément ces usages quotidiens à grande échelle, là où des économies de quelques centimes par million de jetons peuvent représenter des millions de dollars pour un grand groupe. L'intégration native avec Google Workspace est présentée comme un levier supplémentaire : en limitant le recours aux API externes, elle réduit mécaniquement la facture. Le modèle économique devient ainsi aussi déterminant que les performances techniques, notamment pour convaincre les entreprises de franchir le pas de l'industrialisation de l'IA au-delà des preuves de concept. Cette offensive tarifaire de Google s'inscrit dans une dynamique de marché plus large. Anthropic a récemment baissé les tarifs de Claude Opus 4.6, et la montée en puissance des modèles open source comme Qwen d'Alibaba accentue la pression sur les grands acteurs. Les performances des modèles propriétaires commençant à converger, le prix s'impose comme un facteur différenciant majeur pour fidéliser les clients entreprises. Google cherche ainsi à tenir tête à OpenAI et Anthropic sur le segment de l'IA agentielle, un marché où la viabilité économique conditionne désormais l'adoption massive. La prochaine étape sera de voir si cette baisse tarifaire suffit à convaincre les grandes organisations de standardiser leurs workflows autour de l'écosystème Google, ou si la concurrence répondra rapidement avec des ajustements similaires.

UELes entreprises européennes déployant des agents IA à grande échelle sur Google Workspace pourraient réduire significativement leurs coûts de jetons grâce à ce nouveau tarif.

LLMsOpinion
1 source
Les agents Claude peuvent désormais se connecter aux API d'entreprise sans exposer leurs identifiants
864VentureBeat AI 

Les agents Claude peuvent désormais se connecter aux API d'entreprise sans exposer leurs identifiants

Anthropic vient d'annoncer deux nouvelles fonctionnalités pour Claude Managed Agents qui s'attaquent directement au principal frein à l'adoption des agents IA en entreprise : la sécurité des identifiants d'accès. La première, les sandboxes auto-hébergées, permet aux équipes d'exécuter les appels d'outils au sein de leur propre infrastructure, et est disponible dès maintenant en bêta publique. La seconde, les tunnels MCP, connecte les agents à des serveurs MCP privés sans que les identifiants ne transitent par le contexte de l'agent ; elle est pour l'instant en préversion de recherche. Cette architecture divise le système en deux parties distinctes : la boucle agentique (orchestration, gestion du contexte, récupération sur erreur) s'exécute sur l'infrastructure d'Anthropic, tandis que l'exécution des outils reste dans le périmètre de l'entreprise. Les tunnels MCP, eux, fonctionnent via une passerelle légère en sortie uniquement, installée dans le réseau de l'organisation, sans qu'aucun identifiant ne passe par l'agent. Ce changement architectural répond à un problème de fond dans les déploiements actuels : dans la plupart des systèmes en production, l'agent transporte lui-même les jetons d'authentification lors de l'exécution des appels d'outils. Un agent compromis ou mal configuré emporte donc avec lui tout ce dont il a besoin pour causer des dégâts sur les systèmes internes. En déplaçant le contrôle des identifiants vers la frontière réseau plutôt que de les laisser à l'intérieur de l'agent, Anthropic modifie substantiellement le modèle de menace. Pour les équipes d'orchestration, l'enjeu dépasse la sécurité : cette séparation permet de cartographier plus précisément les flux de travail des agents, de mieux contrôler les ressources de calcul et d'isoler les responsabilités entre la plateforme et l'infrastructure métier. Anthropic n'est pas seul sur ce terrain. OpenAI avait déjà ajouté l'exécution locale à son Agents SDK en avril 2025, en réponse à des demandes similaires de ses clients entreprise. La distinction que revendique Anthropic réside précisément dans cette séparation franche entre boucle agentique et exécution des outils, que les approches sandbox existantes, y compris celle d'OpenAI, ne font pas. Le protocole MCP, adopté rapidement en environnement de production, a en effet précédé la maturité des architectures de sécurité qui l'entourent, créant un écart que ces nouvelles fonctionnalités cherchent à combler. Pour les équipes qui évaluent la plateforme, la recommandation pratique est claire : commencer par migrer l'exécution des outils vers les sandboxes auto-hébergées et valider cette frontière avant d'explorer les tunnels MCP, encore en phase expérimentale.

UELes entreprises européennes déployant des agents Claude peuvent désormais conserver leurs identifiants d'accès dans leur propre périmètre réseau, facilitant la conformité GDPR lors des déploiements d'agents IA en production.

OutilsOpinion
1 source
Google affirme que Gemini 3.5 Flash peut réduire les coûts IA des entreprises de plus d'un milliard de dollars par an
865VentureBeat AI 

Google affirme que Gemini 3.5 Flash peut réduire les coûts IA des entreprises de plus d'un milliard de dollars par an

Google a présenté mardi Gemini 3.5 Flash lors de sa conférence annuelle I/O, un nouveau modèle d'intelligence artificielle qui revendique une rupture avec l'un des compromis les plus tenaces du secteur : la capacité et la vitesse ne seraient plus antinomiques. Selon Sundar Pichai, PDG de Google, les entreprises traitant environ mille milliards de tokens par jour sur Google Cloud pourraient économiser plus d'un milliard de dollars par an en basculant 80 % de leurs charges de travail vers Flash et d'autres modèles frontier. Sur les benchmarks standards, Gemini 3.5 Flash dépasse Gemini 3.1 Pro, qui était encore positionné comme le modèle phare de l'entreprise il y a quatre à cinq mois : 76,2 % sur Terminal-Bench 2.1, 1656 Elo sur GDPval-AA, 83,6 % sur MCP Atlas et 84,2 % sur CharXiv Reasoning. Il génère des tokens quatre fois plus vite que les modèles frontier concurrents comparables, voire douze fois plus vite dans sa version optimisée disponible dès maintenant sur Antigravity, la plateforme de développement agentique de Google. Koray Kavukcuoglu, directeur technique de Google DeepMind, confirme : « Nous avons développé une version encore plus optimisée de Flash, non pas quatre fois, mais douze fois plus rapide, à qualité égale. » L'enjeu est considérable pour les entreprises qui ont massivement investi dans l'IA générative. Depuis trois ans, les DSI sont contraints de jongler entre des modèles puissants mais lents et coûteux pour les tâches complexes, et des modèles légers mais moins fiables pour les requêtes simples. Ce pilotage en portefeuille génère une ingénierie coûteuse, des expériences utilisateur inégales et, surtout, des budgets tokens qui s'épuisent à toute vitesse. Pichai l'a formulé sans détour lors d'un briefing presse lundi : « Vous avez probablement entendu des DSI dire que leurs entreprises ont déjà dépassé leur budget annuel de tokens, et on est seulement en mai. » Flash, à environ un tiers à la moitié du coût des modèles frontier actuels tout en atteignant selon Google 90 % de leurs performances, rendrait ce compromis obsolète pour la majorité des cas d'usage. Cette annonce s'inscrit dans une bataille d'efficience qui s'est intensifiée depuis que les entreprises ont commencé à déployer des agents IA en production à grande échelle. La course ne porte plus seulement sur l'intelligence brute des modèles, mais sur leur coût d'exploitation réel. Google fait face à une pression croissante d'Anthropic, d'OpenAI et de Meta, qui ont tous lancé des modèles intermédiaires visant le même créneau. Avec Flash, Google revendique la position unique de modèle occupant le quadrant supérieur droit de l'index intelligence/vitesse d'Artificial Analysis, sans concurrent direct à date. La disponibilité immédiate du modèle turbo dans Antigravity suggère que Google mise sur les workflows agentiques comme terrain de différenciation durable face à ses rivaux.

UELes entreprises européennes sur Google Cloud peuvent réduire significativement leurs budgets tokens en adoptant Flash pour leurs charges de travail agentiques, sans attendre de réglementation spécifique UE.

LLMsOpinion
1 source
Face aux États-Unis et à la Chine, MISTRAL cherche son propre modèle d’IA et fait l’acquisition d’Emmi AI
866FrenchWeb 

Face aux États-Unis et à la Chine, MISTRAL cherche son propre modèle d’IA et fait l’acquisition d’Emmi AI

Mistral AI, la startup parisienne fondée en 2023 et valorisée plus de six milliards d'euros, annonce l'acquisition d'Emmi AI, une société spécialisée dans les agents conversationnels d'entreprise. Cette opération s'inscrit dans une stratégie de diversification accélérée : plutôt que de se limiter à l'entraînement de modèles fondationnels, Mistral cherche à construire une offre verticalement intégrée, allant du modèle de base jusqu'aux applications déployées chez les clients. Les détails financiers de l'acquisition n'ont pas été rendus publics. L'enjeu est de taille pour l'écosystème européen. Les entreprises du continent restent largement dépendantes des hyperscalers américains (AWS, Azure, Google Cloud) pour leurs infrastructures, des GPU NVIDIA pour le calcul, et des modèles d'OpenAI, Anthropic ou Google pour l'inférence. En absorbant Emmi AI, Mistral tente de proposer une alternative souveraine complète aux directions informatiques européennes soucieuses de leur autonomie stratégique et de conformité réglementaire, notamment au regard de l'AI Act européen entré en vigueur en 2024. Ce rachat intervient alors que la compétition internationale s'intensifie sur deux fronts simultanés : les États-Unis maintiennent leur avance sur les modèles de pointe, tandis que la Chine rattrape son retard à marche forcée avec des architectures intégrées comme celles de Huawei ou Baidu. Pour Mistral, qui a levé 1,1 milliard de dollars en 2024 avec des investisseurs comme Andreessen Horowitz et la Banque publique d'investissement, l'heure est au passage à l'échelle commerciale, pas seulement technologique.

UEL'acquisition d'Emmi AI par Mistral AI renforce l'offre souveraine européenne en agents IA d'entreprise, donnant aux DSI françaises et européennes une alternative intégrée aux solutions américaines, dans un contexte de conformité à l'AI Act.

💬 Mistral fait le pari qu'un modèle de base, ça ne suffit plus. Racheter Emmi AI, c'est aller chercher le client là où il est, dans ses workflows d'entreprise, plutôt que d'attendre qu'il vienne lui-même sur une API. Reste à voir si une startup, même avec un milliard en caisse, peut tenir tête aux hyperscalers sur leur propre terrain.

BusinessOpinion
1 source
Ernie 5.1 de Baidu réduit de 94 % les coûts de pré-entraînement tout en rivalisant avec les meilleurs modèles
867The Decoder 

Ernie 5.1 de Baidu réduit de 94 % les coûts de pré-entraînement tout en rivalisant avec les meilleurs modèles

Baidu a dévoilé Ernie 5.1, une nouvelle version de son modèle d'intelligence artificielle phare qui représente une avancée significative en matière d'efficacité de développement. Le modèle n'utilise qu'un tiers des paramètres de son prédécesseur et n'aurait coûté que 6 % du budget de pré-entraînement habituellement nécessaire pour des modèles de performance comparable, soit une réduction de 94 % des coûts. Sur le classement Search Arena, référence internationale pour évaluer les LLMs dans les tâches de recherche, Ernie 5.1 se positionne 4e au niveau mondial, derrière deux variantes de Claude Opus d'Anthropic et GPT-5.5 Search d'OpenAI. Cette performance économique repose sur une architecture baptisée "Once-For-All" : plutôt que d'entraîner plusieurs modèles distincts selon leur taille, cette approche permet d'extraire des sous-modèles plus compacts depuis un unique cycle d'entraînement. Le résultat est un modèle de niveau mondial obtenu à une fraction du coût habituel, ce qui pourrait radicalement abaisser la barrière financière à l'entrée pour les acteurs qui souhaitent développer des LLMs compétitifs. Cette annonce s'inscrit dans un contexte de course à l'efficacité qui redéfinit le secteur depuis la publication de DeepSeek R1 début 2025, laquelle avait démontré qu'il était possible d'obtenir des performances de premier rang sans budgets astronomiques. Baidu, acteur historique de l'IA en Chine et concurrent direct de géants comme Alibaba et Tencent sur le marché local, renforce ainsi sa position internationale à un moment où la compétition avec les laboratoires américains s'intensifie sur tous les fronts.

LLMsOpinion
1 source
GPT-5.5 coûte 49 à 92 % plus cher que son prédécesseur, selon la longueur des entrées
868The Decoder 

GPT-5.5 coûte 49 à 92 % plus cher que son prédécesseur, selon la longueur des entrées

OpenAI a doublé le prix affiché de GPT-5.5 par rapport à GPT-5.4, justifiant cette hausse par la promesse que des réponses plus courtes compenseraient le surcoût pour les utilisateurs. Mais une analyse conduite par OpenRouter, plateforme d'agrégation de modèles de langage, révèle que la réalité est bien différente : en s'appuyant sur des données d'utilisation réelles, OpenRouter conclut que les coûts effectifs ont augmenté de 49 à 92 % selon la longueur des requêtes soumises au modèle. Cette hausse tarifaire a des conséquences directes pour les développeurs et les entreprises qui intègrent GPT-5.5 dans leurs applications via l'API d'OpenAI. Une augmentation pouvant frôler les 100 % sur certains usages représente un choc budgétaire significatif, en particulier pour les startups et les équipes traitant de gros volumes de requêtes. Le fait que l'écart entre le tarif officiel et le coût réel soit si prononcé soulève également des questions sur la transparence des grilles tarifaires publiées par OpenAI. Anthropic a, elle aussi, relevé le prix de son modèle haut de gamme Opus 4.7, confirmant une tendance de fond dans l'industrie. Les deux entreprises se préparent à une introduction en bourse, ce qui pourrait expliquer une stratégie visant à améliorer leur rentabilité à court terme. Alors que la concurrence entre les grands acteurs de l'IA reste intense, cette course à la hausse des prix suggère que la phase de conquête à prix coûtant laisse progressivement place à une logique de monétisation plus agressive.

UELes startups et développeurs européens intégrant GPT-5.5 ou Opus 4.7 via API subissent une hausse effective de 49 à 92 % de leurs coûts opérationnels, les contraignant à revoir leurs budgets ou à évaluer des alternatives open-source.

💬 La "promesse de réponses plus courtes qui compensent", c'était du flan. OpenRouter a sorti les vraies données d'utilisation : +49 à +92% sur les coûts réels selon la longueur des requêtes, loin de ce qu'annonce le tarif officiel. Entre les deux boîtes en pré-IPO qui remontent leurs marges simultanément, le signal est assez lisible.

BusinessOpinion
1 source
DeepSeek lève plus de 7 milliards de dollars pour accélérer sa monétisation
869The Information AI 

DeepSeek lève plus de 7 milliards de dollars pour accélérer sa monétisation

DeepSeek, le laboratoire d'intelligence artificielle chinois qui a ébranlé l'industrie mondiale début 2025 avec ses modèles performants à faible coût, s'apprête à lever jusqu'à 50 milliards de yuans, soit environ 7,35 milliards de dollars, dans ce qui constituerait son tout premier tour de financement externe. Liang Wenfeng, fondateur et PDG milliardaire de la société, prévoit lui-même d'apporter la plus grande part de cette levée. Si elle se concrétise à ce montant, il s'agirait du tour de financement le plus important jamais réalisé par une entreprise d'intelligence artificielle chinoise. Cette levée de fonds marque un tournant stratégique majeur pour DeepSeek, qui a jusqu'ici fonctionné sans capital externe. La perspective de cette entrée d'argent frais pousse le laboratoire à accélérer ses plans de monétisation afin de devenir commercialement viable. DeepSeek aurait également indiqué à certains investisseurs qu'il compte désormais publier ses modèles à un rythme plus rapproché, aligné sur les standards du secteur, abandonant ainsi la cadence irrégulière qui était jusque-là sa marque de fabrique. DeepSeek s'était distingué en janvier 2025 en publiant des modèles rivaux de ceux d'OpenAI ou Google, mais développés à une fraction du coût déclaré, provoquant une onde de choc sur les marchés boursiers américains et alimentant les débats sur la suprématie technologique entre les États-Unis et la Chine. Cette levée signale que le laboratoire entend désormais transformer sa notoriété technique en position commerciale durable, dans un écosystème IA chinois de plus en plus compétitif face à Baidu, Alibaba et ByteDance.

UELa montée en puissance commerciale de DeepSeek intensifie la concurrence mondiale dans l'IA et pourrait influencer les choix d'adoption des entreprises européennes, qui devront peser les questions de conformité liées à l'utilisation de modèles issus de laboratoires chinois.

💬 7 milliards pour un labo qui s'est construit sans un centime externe, c'est un vrai changement de posture. Ce qui m'intéresse plus que le montant, c'est l'abandon de leur cadence de publication chaotique pour quelque chose de plus régulier, parce que c'est ça qui bloquait l'adoption sérieuse. Transformer la notoriété technique en machine commerciale face à Baidu et ByteDance, c'est pas le même sport.

BusinessActu
1 source
Sierra lève 950 millions pour s’imposer sur le marché de l’enterprise AI
870Le Big Data 

Sierra lève 950 millions pour s’imposer sur le marché de l’enterprise AI

Sierra, la startup spécialisée dans les agents IA pour les entreprises, a annoncé le 4 mai 2026 une levée de fonds de 950 millions de dollars, portant sa valorisation à plus de 15 milliards de dollars. Ce tour de table, mené par Tiger Global et GV, donne à l'entreprise plus d'un milliard de dollars en caisse pour accélérer son développement. Fondée il y a moins de deux ans par Bret Taylor, également président d'OpenAI et ancien co-CEO de Salesforce, Sierra compte déjà parmi ses clients plus de 40 % des entreprises du Fortune 50. Sa croissance financière est tout aussi spectaculaire : 100 millions de dollars de revenus annuels récurrents fin 2025, puis 150 millions dès le début 2026. Les agents déployés sur sa plateforme gèrent aujourd'hui des milliards d'interactions couvrant des cas d'usage concrets comme le refinancement immobilier, le traitement de sinistres ou la gestion des retours e-commerce. Ce financement confirme que le marché enterprise de l'IA a franchi un cap décisif : les grandes organisations ne testent plus, elles déploient à grande échelle. Les gains de productivité commencent à se matérialiser concrètement. Chez Uber, par exemple, environ 10 % du code est désormais généré automatiquement, et un projet d'intégration de réservation hôtelière estimé à un an de développement a été finalisé en six mois grâce aux workflows automatisés de Sierra. Nordstrom a lancé un agent vocal en cinq semaines, Singtel en dix semaines avec un taux de résolution supérieur à 70 %, et Cigna a réduit de 80 % le temps d'authentification de ses patients. Ces résultats illustrent la promesse centrale de l'enterprise AI : compresser les cycles de développement tout en augmentant la capacité d'innovation des grandes organisations. Sierra émerge dans un contexte où la compétition pour les budgets IA des grandes entreprises s'intensifie. Face à des acteurs comme Salesforce Agentforce ou ServiceNow, la startup se différencie par la profondeur de ses déploiements et le profil de son fondateur, qui lui confère une crédibilité rare pour naviguer dans les strates décisionnelles du Fortune 500. En avril 2026, Sierra a également lancé Ghostwriter, un outil qui génère automatiquement des agents à partir d'une simple description en langage naturel, avec l'ambition de rendre les logiciels d'entreprise complexes, comme Workday, accessibles via une interface conversationnelle. Avec ce milliard en caisse, Sierra vise à s'imposer comme la plateforme de référence mondiale pour la transformation de l'expérience client par l'IA agentique, dans une course où la capacité à industrialiser rapidement les déploiements sera l'avantage décisif.

BusinessOpinion
1 source
Le Pentagone choisit ses nouveaux fournisseurs IA et exclut Anthropic… enfin presque
871Next INpact 

Le Pentagone choisit ses nouveaux fournisseurs IA et exclut Anthropic… enfin presque

Le Pentagone a signé fin avril 2026 des accords avec huit fournisseurs de modèles d'intelligence artificielle pour déployer leurs technologies dans des opérations militaires classifiées. Les entreprises retenues sont OpenAI, Google, Microsoft, Amazon Web Services, NVIDIA, Oracle, SpaceX via sa filiale xAI, et Reflection. Ces contrats couvrent deux niveaux de classification : l'IL6, équivalent du « secret défense », et l'IL7, réservé aux données encore plus sensibles liées aux opérations en cours. Concrètement, ces IA seront mobilisées pour l'analyse de renseignement, la planification d'opérations et l'aide à la prise de décision en temps réel. Une entreprise brille par son absence : Anthropic, pourtant l'un des acteurs les plus avancés du secteur, a été écarté de ces accords. Cette sélection marque une accélération majeure de l'intégration de l'IA dans l'appareil militaire américain, avec des implications industrielles et éthiques immédiates. Chez Google, l'accord signé le 27 avril a provoqué une fronde interne : plus de 560 employés ont adressé une lettre ouverte à Sundar Pichai, réclamant que l'entreprise refuse tout contrat impliquant des opérations classifiées. « La seule façon de garantir que Google ne soit pas associé à de tels dommages est de refuser tout travail sur des projets classifiés », écrivent les signataires. Kent Walker, président des affaires juridiques d'Alphabet, a répondu sans ambiguïté dans un mémo interne, affirmant que Google travaillait « avec fierté » avec le ministère de la Défense depuis ses débuts et que soutenir la sécurité nationale de manière « réfléchie et responsable » restait une priorité de l'entreprise. Le cas Anthropic illustre les tensions profondes entre les exigences du Pentagone et les garde-fous éthiques des labs d'IA. Le DoD utilisait pourtant les modèles Claude depuis 2024, dans des opérations sensibles : ils auraient notamment contribué à la capture de Nicolas Maduro le 3 janvier, et aux premières opérations militaires liées au conflit israélo-iranien. Mais Anthropic a posé des conditions, refusant notamment que sa technologie serve à la surveillance de masse de citoyens américains ou à des armes entièrement autonomes. Le DoD, peu enclin à se laisser imposer des contraintes par un fournisseur, a alors désigné Anthropic « fournisseur à risque », une première pour une entreprise américaine, assimilée à une menace pour la chaîne d'approvisionnement nationale. L'affaire s'est depuis enlisée devant les tribunaux. Le lancement de Mythos par Anthropic début avril semble avoir légèrement rouvert la porte : le directeur technique du DoD, Emil Michael, reconnaît qu'Anthropic reste un risque d'approvisionnement tout en laissant entendre que la situation pourrait évoluer.

UEL'accélération de l'IA militaire classifiée aux États-Unis risque de relancer les débats européens sur une doctrine IA-défense propre et sur les limites que l'AI Act pourrait imposer aux applications militaires des modèles d'IA.

💬 Anthropic dit non à la surveillance de masse et aux armes autonomes, et se retrouve officiellement sur liste noire du Pentagone. C'est sans doute le premier lab à perdre un gros contrat sur des principes éthiques, pas juste à en parler depuis une scène de conférence. Ça va leur coûter cher, et c'est pourtant le seul truc crédible qu'on ait vu depuis longtemps dans ce secteur.

BusinessReglementation
1 source
GitHub Copilot adopte une facturation à la consommation
872AI News 

GitHub Copilot adopte une facturation à la consommation

À partir du 1er juin 2026, GitHub Copilot abandonne son modèle d'abonnement à requêtes fixes pour adopter une facturation à la consommation de tokens. Jusqu'à présent, les utilisateurs disposaient d'un quota mensuel de « requêtes premium », chaque requête comptant pour une unité qu'il s'agisse d'une tâche complexe de refactorisation ou d'une simple question. Le nouveau système remplace ces requêtes par des « AI Credits » : un abonné Copilot Pro à 10 dollars par mois reçoit 1 000 crédits, chaque crédit valant un centime américain. Un token représente environ les trois quarts d'un mot, ce qui signifie que 10 000 mots de code soumis à Copilot génèrent entre 12 000 et 13 000 tokens facturés. Le coût réel dépendra du modèle choisi, du ratio entrées/sorties, de la taille du cache et de la fonctionnalité utilisée. Seules les suggestions de complétion de code et les « Next Edit suggestions » resteront gratuites. Ce changement modifie profondément la relation des développeurs avec l'outil. Alors que l'abonnement mensuel masquait jusqu'ici la consommation réelle de tokens, Microsoft subventionnait de facto trois à huit fois la valeur nominale de chaque abonnement grâce à ses revenus logiciels et cloud, les utilisateurs devront désormais surveiller activement leur dépense token par requête. Pour un développeur qui enchaîne des tâches simples, l'impact sera limité. En revanche, les équipes qui déploient des agents de codage autonomes sur de grandes bases de code risquent de voir leur facture exploser rapidement. Le cas d'Uber est emblématique : selon The Information, le directeur technique de l'entreprise a déclaré avoir déjà épuisé l'intégralité du budget IA 2026 dès les premiers mois de l'année, alors que 11 % des mises à jour du code d'Uber sont désormais rédigées par des agents IA, principalement basés sur Claude d'Anthropic. Ce virage tarifaire s'inscrit dans un mouvement plus large du secteur. Anthropic et OpenAI ont déjà migré leurs clients enterprise vers une facturation à la consommation. Microsoft, propriétaire de GitHub, suit la même trajectoire mais à partir d'une position plus exposée : Copilot cible précisément les développeurs individuels et les petites équipes, un public moins préparé que les grandes entreprises à raisonner en coût par token. Le risque pour GitHub est double : freiner l'exploration des nouveaux utilisateurs, qui hésiteront avant de soumettre de longues sessions de débogage, et accélérer l'arbitrage chez les équipes tech qui compareront désormais les coûts réels de Copilot face à ses concurrents directs comme Cursor ou les offres Claude for Business. La transparence des coûts, longtemps perçue comme un avantage client, devient un terrain de compétition où les marges de chaque acteur seront exposées.

UELes développeurs français et européens utilisant GitHub Copilot devront surveiller activement leur consommation de tokens dès juin 2026 et réévaluer leurs budgets IA face à des alternatives comme Cursor ou Claude for Business.

💬 Microsoft vient de retirer le masque. Tant que le forfait fixe absorbait tout, personne ne regardait la consommation réelle, mais là, un agent autonome sur une grosse codebase, et la facture peut tripler sans prévenir. Le cas Uber, c'est pas une anecdote, c'est exactement ce qui attend les équipes qui ont dit oui à l'IA à grande échelle sans jamais compter les tokens.

OutilsOutil
1 source
Le graphe de connaissances d'AWS Quick prend des décisions d'orchestration invisibles pour les plans de contrôle
873VentureBeat AI 

Le graphe de connaissances d'AWS Quick prend des décisions d'orchestration invisibles pour les plans de contrôle

AWS a élargi cette semaine son assistant Quick avec une version desktop dotée d'un graphe de connaissances personnel persistant, capable d'exécuter des actions sur des fichiers locaux et des outils SaaS sans attendre d'y être invité. Contrairement aux copilotes conversationnels qui réinitialisent leur contexte à chaque session, Quick construit désormais en continu un profil utilisateur à partir des fichiers locaux, du calendrier, des e-mails et des applications connectées comme Google Workspace, Microsoft 365, Zoom, Salesforce et Slack. Ce graphe lui permet de déclencher des actions de manière proactive, rappeler à un chef d'équipe d'organiser des points réguliers, par exemple, sans que l'utilisateur n'ait à formuler de requête. AWS avait lancé Quick en octobre 2024 comme alternative aux plateformes de productivité IA de Google, OpenAI et Anthropic, combinant accès aux données d'entreprise, construction d'agents, recherche approfondie et automatisation de workflows. Ce changement introduit ce que les experts appellent une "orchestration fantôme" : un niveau de décision personnalisé qui opère en dehors des couches d'orchestration centralisées que les équipes IT déploient habituellement pour garder le contrôle sur les agents IA. Plutôt que de suivre des workflows définis à l'avance, Quick prend des décisions fondées sur des déclencheurs implicites, des interprétations propres à chaque utilisateur et des temporalités variables. Upal Saha, cofondateur et CTO de Bem, résume le risque : "Quand vous déployez un agent qui raisonne en plusieurs étapes pour parvenir à une décision, vous avez déjà accepté de ne pas pouvoir en expliquer intégralement le déroulement après coup. C'est acceptable pour une démo, pas pour un pipeline de traitement de sinistres ou un workflow financier où un régulateur peut exiger un audit complet de chaque décision automatisée sur les trois dernières années." AWS insiste sur le fait que Quick reste encadré par les politiques de sécurité, les permissions et les identités d'entreprise, et que les intégrations passent toutes par des API ou des connexions MCP contrôlées. Jigar Thakkar, vice-président de la suite Quick chez AWS, positionne le produit comme "l'endroit unique où les employés peuvent accéder à toutes leurs informations et tâches." Cette évolution s'inscrit dans une tendance plus large de l'industrie : Anthropic avec ses Claude Managed Agents et OpenAI avec son Agent SDK poussent eux aussi vers des agents plus autonomes dans les workflows d'entreprise, mais en maintenant des périmètres d'orchestration définis. La question qui se pose désormais est de savoir si les entreprises sont prêtes à accepter ce compromis entre productivité gagnée par l'autonomie et traçabilité exigée par la conformité réglementaire.

UELes entreprises européennes utilisant AWS Quick devront évaluer la conformité de l'orchestration fantôme avec l'AI Act et le RGPD, qui exigent traçabilité et explicabilité des décisions automatisées dans les workflows réglementés.

OutilsOutil
1 source
Google et le Pentagone concluent un accord pour un usage de l'IA sans restriction légale
874The Verge 

Google et le Pentagone concluent un accord pour un usage de l'IA sans restriction légale

Google a conclu un accord classifié avec le département américain de la Défense (DoD) autorisant ce dernier à utiliser ses modèles d'intelligence artificielle pour "tout usage gouvernemental légal", selon un rapport de The Information publié lundi. La révélation intervient moins de vingt-quatre heures après qu'une partie des employés de Google a adressé une pétition au PDG Sundar Pichai, exigeant qu'il bloque l'accès du Pentagone à ses technologies, par crainte que celles-ci soient employées à des fins "inhumaines ou extrêmement préjudiciables". Cet accord positionne Google aux côtés d'OpenAI et xAI, qui ont eux aussi signé des contrats classifiés avec le gouvernement américain. La décision illustre la tension croissante au sein des grandes entreprises tech entre impératifs commerciaux et éthique de déploiement : le DoD représente un client stratégique de premier plan, mais ses usages potentiels des systèmes d'IA restent opaques pour le grand public comme pour les salariés de ces entreprises. Le contexte récent éclaire la portée de ce choix. Anthropic a été récemment inscrit sur liste noire par le Pentagone après avoir refusé de supprimer ses garde-fous de sécurité sur demande du DoD. Google, en acceptant un accès étendu et sans restrictions explicites, prend le chemin inverse. La question des applications militaires de l'IA, qu'il s'agisse de ciblage, de surveillance ou d'automatisation de décisions, s'impose désormais comme un enjeu central pour l'ensemble du secteur.

UEL'accord pousse les régulateurs européens à préciser dans l'AI Act les conditions d'usage militaire de l'IA, mettant en lumière un vide réglementaire que les institutions de l'UE devront combler.

SécuritéOpinion
1 source
ImageGen est sur la voie de l'AGI
875Latent Space 

ImageGen est sur la voie de l'AGI

GPT-Image-2, le dernier modèle de génération d'images d'OpenAI, s'impose comme l'un des outils les plus polyvalents du moment. Capable de produire des visuels éducatifs, des infographies précises, des illustrations issues de la culture populaire ou des assets graphiques en temps réel pendant qu'un développeur code, il s'intègre désormais directement dans Codex, l'agent de programmation d'OpenAI, comme compétence activable. Cette combinaison GPT-Image-2 plus Codex permet de générer des ressources visuelles de manière itérative au fil du développement, ce qui change concrètement le flux de travail des développeurs. La qualité du modèle en termes de fidélité et de faible taux d'hallucinations est telle que des concurrents comme Claude Design, pourtant présenté il y a peu comme la référence, ne figurent plus dans la conversation. Cette dynamique soulève une question stratégique sérieuse : les modèles de génération d'images sont-ils un luxe pour des laboratoires qui cherchent à atteindre l'intelligence artificielle générale, ou bien une nécessité ? La réponse semble de plus en plus claire : oui, ils sont nécessaires. Parce que le texte, le code et les données structurées ne suffisent plus à démontrer le "G" de "AGI". Une IA vraiment générale doit maîtriser la voix, le visuel, la génération multimodale, y compris les calques transparents. Fermer cette boucle créative, c'est prendre une avance décisive sur tous les concurrents qui se concentrent uniquement sur le code et la productivité d'entreprise. En parallèle, OpenAI a opéré un pivot stratégique majeur en révisant son partenariat exclusif avec Microsoft. Sam Altman a annoncé que si Microsoft reste le cloud partenaire principal, OpenAI peut désormais distribuer ses modèles sur tous les clouds, y compris Google TPU et AWS Bedrock, une confirmation d'Andy Jassy est attendue dans les prochaines semaines. La licence de Microsoft sur la propriété intellectuelle d'OpenAI devient ainsi non exclusive, et la clause AGI de l'accord original serait de facto caduque selon plusieurs observateurs. Sur le plan des benchmarks, GPT-5.5 affiche des résultats contrastés : 67,1 % sur WeirdML sans mode de réflexion, contre 57,4 % pour GPT-5.4, mais toujours en retrait face à Claude Opus 4.7 à 76,4 %. L'Arena LMSYS place le modèle en troisième position en mathématiques et deuxième en recherche, mais neuvième en code. Enfin, GitHub a annoncé la migration de Copilot vers une facturation à l'usage au 1er juin, un signal fort de la monétisation croissante des workflows agentiques, tandis qu'OpenAI a publié en open source Symphony, une couche d'orchestration reliant les gestionnaires de tickets à des agents Codex pour automatiser le cycle complet "issue → PR → revue humaine".

UELa restructuration du partenariat OpenAI-Microsoft vers une licence non exclusive pourrait faciliter l'accès aux modèles OpenAI via des fournisseurs cloud alternatifs utilisés par les entreprises européennes.

CréationActu
1 source
Google et AWS répartissent la pile des agents IA entre contrôle et exécution
876VentureBeat AI 

Google et AWS répartissent la pile des agents IA entre contrôle et exécution

Google et Amazon Web Services viennent de redéfinir leurs approches respectives pour orchestrer les agents IA d'entreprise, révélant une fracture profonde dans la façon de concevoir l'infrastructure agentique. Google a lancé une nouvelle version de Gemini Enterprise, regroupant sous une même bannière sa plateforme Gemini Enterprise et son application éponyme, tout en rebaptisant Vertex AI en Gemini Enterprise Platform. De son côté, AWS a enrichi Bedrock AgentCore d'un système de harness, un dispositif de configuration automatique alimenté par Strands Agents, son framework open source. Ce harness permet aux équipes de définir ce que l'agent doit faire, quel modèle utiliser et quels outils appeler, le reste étant pris en charge automatiquement. Dans le même temps, Anthropic a dévoilé ses Claude Managed Agents et OpenAI a renforcé son Agents SDK, confirmant que l'ensemble de l'industrie cherche simultanément à résoudre le même problème : comment gérer des agents IA qui tournent durablement en production. L'enjeu dépasse la simple question de l'outillage développeur. À mesure que les agents passent de courtes tâches ponctuelles à des workflows autonomes de longue durée, un nouveau type de défaillance émerge : la dérive d'état (state drift). Un agent qui fonctionne en continu accumule de la mémoire, des réponses et un contexte évolutif. Avec le temps, ce contexte devient obsolète : les sources de données changent, les outils renvoient des réponses contradictoires, et l'agent perd en fiabilité sans que personne ne s'en rende forcément compte. C'est ce problème systémique que Google et AWS cherchent à prévenir, par deux chemins opposés. Google mise sur un plan de contrôle à la manière de Kubernetes, centré sur la gouvernance et la visibilité. AWS privilégie la vitesse de déploiement et la simplification de la configuration, en déléguant la coordination à la couche d'exécution. Cette divergence illustre une transformation plus profonde de la pile IA, qui se stratifie désormais en couches spécialisées. Google positionne Gemini Enterprise comme une porte d'entrée unifiée vers l'ensemble de ses systèmes IA, avec des outils de sécurité et de gouvernance inclus dans l'abonnement, selon Maryam Gholami, directrice senior produit chez Google. AWS, Anthropic et OpenAI s'orientent davantage vers la vélocité et la flexibilité d'exécution. La question de savoir quelle approche s'imposera reste ouverte : Gholami elle-même reconnaît que ce sont les clients qui dicteront les usages des agents longue durée, un domaine où les bonnes pratiques restent encore à définir. Le vrai test viendra lorsque les entreprises feront tourner ces systèmes en conditions réelles, avec des agents qui devront remonter de l'information, demander des validations humaines, et résister à la dégradation progressive de leur contexte.

UELes entreprises européennes qui déploient des agents IA en production sur Google Cloud ou AWS devront arbitrer entre les deux approches d'orchestration pour leurs workflows agentiques durables.

InfrastructureOpinion
1 source
Alibaba publie Qwen3.6-27B, un modèle dense qui surpasse le MoE 397B sur les benchmarks de codage par agents
877MarkTechPost 

Alibaba publie Qwen3.6-27B, un modèle dense qui surpasse le MoE 397B sur les benchmarks de codage par agents

L'équipe Qwen d'Alibaba a publié Qwen3.6-27B, un modèle dense en open-weight de 27 milliards de paramètres disponible sous licence Apache 2.0 sur Hugging Face, en deux variantes : BF16 et FP8. Ce modèle se distingue notamment sur les benchmarks de codage agentique, où il surpasse des modèles bien plus imposants : il atteint 1 487 points sur QwenWebBench (génération de code frontend) contre 1 068 pour son prédécesseur Qwen3.5-27B, et 36,2 sur NL2Repo (génération de code à l'échelle d'un dépôt) contre 27,3. Sur SWE-bench Verified, référence du secteur pour les agents logiciels autonomes, il atteint 77,2, se rapprochant des 80,9 de Claude 4.5 Opus. Fait notable : ces performances dépassent celles du Qwen3.5-397B-A17B, un modèle Mixture-of-Experts quatorze fois plus grand. L'intérêt de cette publication tient à deux innovations concrètes. La première concerne le codage agentique : le modèle a été spécifiquement optimisé pour naviguer dans de larges bases de code, modifier plusieurs fichiers simultanément et produire du code exécutable cohérent, couvrant sept catégories allant du design web à la 3D. La seconde innovation, baptisée Thinking Preservation, répond à une limite structurelle des LLM actuels : par défaut, le raisonnement intermédiaire (chain-of-thought) n'est conservé que pour le message en cours et disparaît au tour suivant. Qwen3.6-27B propose une option pour conserver et réutiliser ces traces de raisonnement sur l'ensemble d'une conversation, ce qui réduit les tokens redondants et améliore l'utilisation du cache KV dans les workflows d'agents itératifs. Cette sortie s'inscrit dans une stratégie accélérée d'Alibaba sur les modèles ouverts : Qwen3.6-27B est le deuxième modèle de la famille Qwen3.6, après le Qwen3.6-35B-A3B (MoE à 3B paramètres actifs) lancé quelques semaines plus tôt, lui-même héritier de la série Qwen3.5. Sur le plan architectural, le modèle adopte une structure hybride originale répartie sur 64 couches : trois sublayers sur quatre utilisent Gated DeltaNet, une attention linéaire en O(n) bien plus efficace que l'attention classique quadratique O(n²), tandis qu'une couche sur quatre conserve l'attention standard. Cette conception permet de traiter de longs contextes avec un coût mémoire réduit, tout en maintenant la précision sur les tâches complexes. Compatible avec SGLang, vLLM et Hugging Face Transformers, le modèle vise directement les développeurs qui construisent des agents de codage, dans un segment où Anthropic et OpenAI restent pour l'instant en tête.

LLMsOpinion
1 source
Les entreprises surestiment leur contrôle sur l'IA : 72 % ne sont pas aussi sécurisées qu'elles le croient
878VentureBeat AI 

Les entreprises surestiment leur contrôle sur l'IA : 72 % ne sont pas aussi sécurisées qu'elles le croient

Dans 72 % des entreprises interrogées, les décideurs affirment utiliser au moins deux plateformes d'intelligence artificielle qu'ils considèrent comme leur couche "primaire", selon une enquête menée par VentureBeat auprès de 40 grandes entreprises entre janvier et mars 2026. Ce chiffre révèle un écart béant entre la perception du contrôle et la réalité opérationnelle. L'exemple le plus frappant vient du système hospitalier Mass General Brigham (MGB), plus grand employeur du Massachusetts avec 90 000 salariés : l'an dernier, son directeur technique Nallan Sriraman a dû stopper un nombre incontrôlé de projets pilotes internes en IA qui avaient proliféré sans supervision. MGB a depuis construit une plateforme sécurisée maison autour de Microsoft Copilot, capable de supporter jusqu'à 30 000 utilisateurs, pour empêcher que les données de santé protégées (PHI) des patients ne soient transmises au fournisseur du modèle sous-jacent, OpenAI. En parallèle, l'hôpital doit bâtir un "plan de contrôle" central pour orchestrer les agents IA déployés séparément par Epic, Workday et ServiceNow, qui fonctionnent tous différemment. Ce phénomène de dispersion, que VentureBeat nomme "gouvernance mirage", traduit une contradiction structurelle : les entreprises croient avoir mis en place une gouvernance solide alors qu'elles n'ont défini ni responsabilités claires, ni garde-fous précis, ni processus d'évaluation ou de sécurité réels. Pour les responsables de la sécurité en particulier, cette multiplicité de plateformes, issues de Microsoft Azure, Google, OpenAI, Anthropic ou d'éditeurs applicatifs, élargit mécaniquement la surface d'attaque, à un moment où les cyberattaques assistées par IA gagnent en sophistication. Le paradoxe est d'autant plus aigu que les entreprises se sont tournées vers leurs grands fournisseurs logiciels existants pour éviter de dupliquer les efforts, mais se retrouvent malgré tout contraintes de construire autour de leurs lacunes. Ce contexte reflète la vitesse à laquelle les hyperscalers et les grands éditeurs ont intégré l'IA dans leurs offres, forçant leurs clients entreprise à absorber une complexité non anticipée. Comme l'explique Sriraman avec l'analogie des "six aveugles et l'éléphant", chaque fournisseur décrit l'IA à sa façon, rendant toute vision cohérente difficile à construire. Le marché reste "encore naissant", selon ses termes, ce qui rend les décisions stratégiques particulièrement hasardeuses. La prochaine étape pour des organisations comme MGB sera de stabiliser ces plans de contrôle multi-agents tout en attendant que les fournisseurs mûrissent leurs propres capacités de sécurité, un pari sur un calendrier que personne ne maîtrise vraiment.

UELes entreprises européennes soumises aux obligations de conformité de l'AI Act sont particulièrement exposées à ce risque de 'gouvernance mirage', où un écart entre gouvernance déclarée et réalité opérationnelle pourrait constituer une non-conformité réglementaire.

SécuritéActu
1 source
Course à l’IA : le laboratoire de Jeff Bezos proche d’un méga deal à 38 milliards
879Le Big Data 

Course à l’IA : le laboratoire de Jeff Bezos proche d’un méga deal à 38 milliards

Project Prometheus, la start-up d'IA cofondée par Jeff Bezos, s'apprête à finaliser une levée de fonds de près de 10 milliards de dollars qui porterait sa valorisation à 38 milliards, selon le Financial Times. Cette opération intervient moins d'un an après un premier tour de table de 6,2 milliards, confirmant une trajectoire de financement exceptionnellement rapide. La société, fondée il y a moins de 12 mois, compte entre 50 et 200 employés recrutés en grande partie chez OpenAI, xAI et Google DeepMind. Elle est dirigée par Jeff Bezos aux côtés de Vik Bajaj, ancien responsable de Google X et professeur associé à Stanford. Ses bureaux sont établis à San Francisco, au coeur de l'écosystème mondial de l'IA. Par ailleurs, selon le New York Times, Bezos aurait engagé des discussions préliminaires avec des investisseurs du Moyen-Orient et d'Asie du Sud-Est pour lever jusqu'à 100 milliards de dollars supplémentaires, dans le but de créer un fonds dédié aux entreprises exploitant les technologies de Prometheus. Ce qui distingue Prometheus de la plupart de ses concurrents, c'est son positionnement sur l'IA physique : des systèmes capables d'interagir directement avec des environnements industriels réels, dans des secteurs comme la fabrication, l'ingénierie aérospatiale ou la production de semi-conducteurs. Là où l'IA générative peine encore à démontrer un retour sur investissement immédiat pour les industriels, Prometheus parie sur une IA qui agit dans le monde tangible plutôt que de se limiter au traitement de données. Pour les entreprises manufacturières et les grandes industries, ce type de technologie représente un levier de transformation directe, potentiellement plus concret que les modèles conversationnels grand public. C'est précisément ce créneau qui justifie l'intérêt massif des investisseurs, malgré l'absence totale de revenus à ce stade. La montée en puissance de Project Prometheus s'inscrit dans une phase nouvelle de la course mondiale à l'IA, où les batailles ne se jouent plus uniquement sur les performances des modèles de langage, mais sur leur intégration dans l'économie réelle. Jeff Bezos, avec une fortune estimée à plus de 200 milliards de dollars et un réseau d'investisseurs mondial, dispose d'une capacité d'action hors norme pour imposer Prometheus dans ce segment. La stratégie rappelle les logiques d'intégration verticale bien connues dans la tech : contrôler à la fois la technologie fondamentale et l'écosystème d'entreprises qui l'exploitent. Bloomberg précise que le tour de table actuel reste ouvert et que ses modalités pourraient encore évoluer, signe que la compétition pour entrer au capital de la start-up reste vive. Dans un secteur où OpenAI, Anthropic et Google se disputent la couche logicielle, Prometheus tente de s'imposer sur la couche industrielle, un pari ambitieux mais cohérent avec la vision long terme de son fondateur.

UEL'orientation de Prometheus vers l'IA industrielle (fabrication, aérospatiale, semi-conducteurs) pourrait à terme concurrencer ou transformer des secteurs manufacturiers européens, mais aucun impact direct sur la France ou l'UE n'est identifié à ce stade.

💬 38 milliards pour une boîte sans un euro de revenu et moins d'un an d'existence, sur le papier ça crie bulle. Mais l'angle IA physique (fabrication, aérospatiale, semi-conducteurs) c'est vraiment pas le même jeu que la guerre des chatbots, et là Bezos arrive avec la patience et le réseau qu'il faut pour jouer long. C'est le genre de pari qui paraît absurde en 2026 et évident en 2030.

BusinessOpinion
1 source
880Latent Space 

[AINews] Moonshot Kimi K2.6 : le meilleur modèle open source du monde se met à jour pour rivaliser avec Opus 4.6 (avant DeepSeek v4 ?)

Moonshot AI a lancé Kimi K2.6 le 18 avril 2026, une mise à jour majeure de son modèle de langage open-weight qui consolide la position du laboratoire chinois en tête des modèles ouverts mondiaux. Ce modèle de type Mixture-of-Experts (MoE) totalise 1 000 milliards de paramètres, avec 32 milliards actifs à la fois, 384 experts, une fenêtre de contexte de 256 000 tokens, la multimodalité native et une quantification INT4. Disponible dès le jour de lancement sur vLLM, OpenRouter, Cloudflare Workers AI, Baseten et MLX, il revendique des records open source sur plusieurs benchmarks de référence : 54,0 sur HLE with tools, 58,6 sur SWE-Bench Pro, 76,7 sur SWE-Bench Multilingual et 83,2 sur BrowseComp. Moonshot revendique également des capacités d'exécution longue durée inédites : plus de 4 000 appels d'outils enchaînés, des sessions continues de plus de 12 heures, et jusqu'à 300 sous-agents parallèles via un système baptisé "Claw Groups". Simultanément, Alibaba a publié Qwen3.6-Max-Preview, un avant-goût de son prochain modèle phare, qui a atteint la 7e place dans le classement Code Arena, propulsant Alibaba au 3e rang des laboratoires dans cette catégorie. Ces sorties illustrent une accélération concrète des modèles ouverts chinois dans les domaines du code et des agents autonomes, deux terrains jusqu'ici dominés par des acteurs américains comme Anthropic, OpenAI et Google. La communauté des développeurs a rapidement adopté K2.6 comme alternative crédible à Claude ou GPT-4 pour des tâches d'infrastructure : des utilisateurs rapportent une exécution autonome sur cinq jours, des réécritures de noyaux système, et un moteur d'inférence en Zig surpassant LM Studio de 20 % en débit. K2.6 tient également tête à Gemini 3.1 Pro sur les tâches de design frontend avec un taux de victoire et d'égalité de 68,6 %, un terrain considéré comme le point fort de Google. Le contexte est celui d'une course ouverte et intense entre laboratoires. Depuis le lancement de K2.5 en janvier 2026, Moonshot occupe la première place parmi les labs chinois open source, dans un silence relatif de DeepSeek depuis la version v3.2, dont une v4 reste attendue. Moonshot est par ailleurs l'un des trois laboratoires chinois que l'équipe d'Anthropic a cités en février pour avoir potentiellement utilisé ses données d'entraînement sans autorisation. En parallèle, Hermes Agent, la pile d'agents open source la plus en vue du moment, a dépassé 100 000 étoiles sur GitHub en moins de deux mois, détrônant OpenClaw en croissance hebdomadaire. L'ensemble du tableau suggère que les modèles ouverts, portés par des labs asiatiques bien dotés, ne jouent plus dans une catégorie inférieure aux modèles propriétaires occidentaux.

UELes développeurs européens peuvent désormais déployer localement un modèle open-weight de niveau frontier, réduisant leur dépendance aux API propriétaires américaines soumises au Cloud Act.

LLMsActu
1 source
Sephora confie son programme de fidélité à ChatGPT : pourquoi c’est un tournant
881FrenchWeb 

Sephora confie son programme de fidélité à ChatGPT : pourquoi c’est un tournant

Sephora a annoncé fin mars à Las Vegas, lors de la conférence Shoptalk Spring, un partenariat stratégique avec OpenAI pour intégrer ChatGPT au cœur de son programme de fidélité Beauty Insider. Ce qui distingue cet accord de simples expérimentations marketing : l'enseigne confie à l'IA les données de ses membres, un actif considéré comme l'un des plus précieux de l'entreprise. Sephora inaugure ainsi ce que l'industrie commence à appeler le « shopping agentique », où l'IA ne se contente plus de répondre à des questions mais agit pour le compte de l'utilisateur. Pour les quelque 34 millions de membres Beauty Insider aux États-Unis, cela signifie potentiellement une expérience d'achat entièrement personnalisée, pilotée par un assistant capable d'analyser l'historique d'achats, les préférences de marques et les tendances beauté en temps réel. L'enjeu dépasse la simple recommandation produit : en laissant une IA accéder aux données comportementales de ses clients les plus fidèles, Sephora parie que la personnalisation de masse peut devenir un avantage concurrentiel durable face à la concurrence en ligne et aux plateformes comme Amazon. Ce partenariat s'inscrit dans une vague plus large de grands distributeurs qui cherchent à monétiser leurs données first-party à l'heure où les cookies tiers disparaissent. OpenAI, de son côté, accélère son virage vers les applications commerciales après avoir sécurisé des financements massifs, et le retail de luxe constitue un terrain d'expansion stratégique. La question qui reste ouverte est celle de la gouvernance : confier des données clients sensibles à un tiers comme OpenAI soulève des interrogations sur la souveraineté des données et la conformité au RGPD pour les opérations européennes de Sephora.

UESephora, entreprise française du groupe LVMH, confie des données clients sensibles à OpenAI, ce qui soulève des questions concrètes de conformité RGPD pour ses opérations européennes.

BusinessOpinion
1 source
882Ars Technica AI 

Des retards de construction touchent 40 % des centres de données américains prévus pour 2026

Près de 40 % des projets de centres de données américains prévus pour 2026 accuseront un retard de plus de trois mois sur leur calendrier initial, selon une analyse publiée par le Financial Times. Ce constat repose sur des images satellites fournies par la société d'analyse géospatiale SynMax, croisées avec les déclarations publiques et documents de permis compilés par le groupe de recherche IIR Energy. Les projets concernés appartiennent à des géants technologiques comme Microsoft, Oracle et OpenAI. Les responsables de chantiers liés à OpenAI ont notamment signalé un manque critique d'artisans qualifiés, électriciens, monteurs de tuyauteries, pour mener de front plusieurs chantiers simultanément. Ce ralentissement menace directement les ambitions de l'industrie de l'intelligence artificielle, qui a engagé des centaines de milliards de dollars dans la construction de centres de données de plus en plus imposants, chacun pouvant consommer autant d'électricité que des centaines de milliers de foyers américains. Des retards de trois mois ou plus sur des infrastructures aussi stratégiques pèsent lourd : ils décalent la mise en production de capacités de calcul indispensables à l'entraînement et au déploiement des modèles d'IA, retardant par ricochet les lancements de produits et les engagements commerciaux pris auprès des clients cloud. Cette situation s'inscrit dans un contexte de course effrénée aux ressources : la demande de travailleurs spécialisés dans la construction de centres de données a explosé bien plus vite que l'offre disponible. À cela s'ajoutent des pénuries chroniques d'équipements électriques, des délais de raccordement au réseau électrique qui s'étendent parfois sur plusieurs années, et une résistance locale croissante dans certaines communautés qui s'inquiètent de l'impact de ces mégastructures sur la consommation d'eau et d'énergie. La question est désormais de savoir si l'industrie tech saura adapter son rythme d'investissement à la réalité des contraintes physiques et humaines du terrain.

UELes retards dans les capacités de calcul cloud américaines pourraient ralentir l'accès des entreprises européennes aux services d'IA et renchérir les coûts d'infrastructure.

InfrastructureActu
1 source
GPT-Rosalind : cette IA travaille gratuitement pour les chercheurs, mais il y a un hic
883Le Big Data 

GPT-Rosalind : cette IA travaille gratuitement pour les chercheurs, mais il y a un hic

OpenAI a présenté le 16 avril 2026 GPT-Rosalind, un modèle d'intelligence artificielle de nouvelle génération conçu spécifiquement pour la recherche en biologie, la découverte de médicaments et la médecine translationnelle. Baptisé en hommage à la chimiste Rosalind Franklin, ce modèle est accessible en version test via ChatGPT, Codex et l'API d'OpenAI, mais uniquement pour un cercle restreint d'organisations américaines sélectionnées. Ses capacités couvrent la génomique, l'ingénierie des protéines et la chimie moléculaire : il croise des données complexes, formule des hypothèses biologiques et conçoit des protocoles expérimentaux complets. Sur BixBench, référence sectorielle en bioinformatique, il se classe premier parmi tous les modèles ayant publié leurs résultats. Sur LABBench2, il surpasse GPT-5.4 sur six tâches sur onze, avec une performance particulièrement nette sur CloningQA, un exercice de conception de réactifs pour protocoles de clonage moléculaire. En collaboration avec Dyno Therapeutics, le modèle a été testé sur des séquences d'ARN inédites : ses propositions ont dépassé 95 % des experts humains en prédiction de protéines, et atteint le 84e percentile pour la génération de séquences. Pour la recherche biomédicale, l'enjeu est considérable. Des tâches qui mobilisaient des équipes entières pendant des années peuvent désormais être accélérées par un modèle capable de raisonner sur des structures biologiques complexes. La gratuité pendant la phase de test lève la barrière financière pour les laboratoires, leur permettant d'expérimenter sans contrainte de budget. Si les performances observées se confirment en conditions réelles, GPT-Rosalind pourrait compresser significativement les cycles de développement de médicaments, dont les délais se comptent actuellement en décennies et les coûts en milliards de dollars. OpenAI a choisi une stratégie d'accès délibérément restrictive, justifiée par la sensibilité des domaines concernés. Les organisations candidates subissent une vérification approfondie : leurs travaux doivent présenter un impact collectif identifiable et positif. Les bénéficiaires acceptent des conditions d'usage strictes et s'engagent à mettre en place des mécanismes contre les détournements. Cette prudence n'est pas anodine : un modèle capable de manipuler des concepts biologiques avancés, comme la conception de protéines ou la modification de séquences génétiques, soulève des questions de biosécurité que la communauté scientifique et les régulateurs scrutent de près. Le lancement de GPT-Rosalind s'inscrit dans une course plus large entre OpenAI, Google DeepMind et des acteurs spécialisés comme Insilico Medicine pour dominer l'IA appliquée aux sciences de la vie, un marché estimé à plusieurs centaines de milliards de dollars d'ici 2030.

UELes laboratoires et chercheurs européens sont exclus de l'accès à GPT-Rosalind, réservé à un cercle restreint d'organisations américaines, creusant l'écart avec les acteurs américains dans la course à l'IA biomédicale.

RechercheOpinion
1 source
Google et le Pentagone discutent d'un accord IA classifié, l'entreprise renouant avec le secteur militaire
884The Information AI 

Google et le Pentagone discutent d'un accord IA classifié, l'entreprise renouant avec le secteur militaire

Google est en négociation avec le Département de la Défense américain pour un accord qui permettrait au Pentagone de déployer les modèles d'intelligence artificielle Gemini dans des environnements classifiés. L'information, révélée par deux personnes ayant une connaissance directe des discussions, indique que les deux parties envisagent un contrat autorisant l'utilisation de l'IA de Google pour l'ensemble des usages légaux au sein des forces armées américaines. Selon l'une de ces sources, Google aurait proposé d'inclure dans le contrat des clauses restrictives visant à empêcher que ses modèles soient utilisés pour de la surveillance de masse intérieure ou pour des systèmes d'armes autonomes, notamment le ciblage, sans supervision humaine "appropriée". Cet accord marquerait un tournant majeur dans la relation entre Google et le secteur militaire. L'entreprise deviendrait un contractant technologique significatif du Pentagone, avec un accès potentiel à des infrastructures classifiées, un niveau d'engagement rarement atteint dans l'industrie tech civile. Pour l'armée américaine, intégrer Gemini dans des environnements sécurisés ouvrirait la voie à des capacités d'analyse, de traitement du renseignement et de prise de décision assistée par IA à une échelle et une vitesse sans précédent. Les garde-fous proposés par Google, bien que symboliquement importants, restent formulés de façon vague, notamment autour de la notion de contrôle humain "approprié", ce qui laisse une marge d'interprétation considérable. Ce rapprochement s'inscrit dans un renversement de position spectaculaire pour Google. En 2018, face à une fronde interne massive de ses employés, l'entreprise avait abandonné le projet Maven, un contrat avec le Pentagone portant sur l'analyse d'images de drones par IA, et s'était engagée à ne pas développer d'IA à usage militaire offensif. Depuis, la concurrence acharnée avec Microsoft, qui fournit déjà des services cloud et d'IA à l'armée via Azure et ses partenariats avec OpenAI, ainsi que la pression des actionnaires ont poussé Google à reconsidérer cette posture. La course aux contrats gouvernementaux dans le domaine de l'IA est désormais un enjeu stratégique majeur pour l'ensemble des grandes entreprises technologiques américaines.

UECe rapprochement militaro-technologique américain pourrait accélérer les débats européens sur la souveraineté technologique et l'encadrement de l'IA dans la défense.

BusinessActu
1 source
Broadcom et Meta : un partenariat à l’échelle du Gigawatt pour le futur de l’IA
885Le Big Data 

Broadcom et Meta : un partenariat à l’échelle du Gigawatt pour le futur de l’IA

Meta et Broadcom ont officialisé le 14 avril 2026 un partenariat stratégique pluriannuel pour bâtir l'une des infrastructures de calcul IA les plus massives jamais conçues. Dès la première phase, la capacité déployée dépasse 1 gigawatt, avec une trajectoire assumée vers plusieurs gigawatts dans les années à venir. Au cœur du dispositif : les puces propriétaires MTIA (Meta Training and Inference Accelerator), conçues pour optimiser à la fois l'entraînement et l'inférence des modèles d'IA. Broadcom fournit l'ensemble de la chaîne matérielle, de la conception des accélérateurs via sa plateforme XPU à leur interconnexion réseau haut débit. La collaboration est prévue pour durer jusqu'en 2029 au moins, avec des générations successives de puces MTIA adaptées aux besoins évolutifs de Meta. Ce partenariat représente un changement d'échelle radical dans la façon dont les grandes plateformes numériques abordent leurs besoins en calcul. Meta ne se contente plus d'acheter des GPU sur étagère : l'entreprise co-conçoit avec Broadcom des accélérateurs taillés sur mesure pour ses propres charges de travail, ce qui permet d'optimiser conjointement la logique de calcul, la gestion mémoire et les transferts de données à haute vitesse. L'enjeu est concret : alimenter des services utilisés quotidiennement par des milliards de personnes, de WhatsApp à Instagram en passant par Threads, tout en réduisant le coût total de possession. Mark Zuckerberg a affiché publiquement l'ambition d'apporter des capacités d'IA avancées à chaque utilisateur, jusqu'à ce qu'il décrit comme une forme de "superintelligence personnelle". À cette échelle, chaque point d'efficacité matérielle se traduit directement en milliards de dollars d'économies ou de capacités supplémentaires. Ce mouvement s'inscrit dans une tendance de fond qui redessine l'industrie du semi-conducteur et des infrastructures cloud. Face à la domination de Nvidia sur le marché des GPU d'IA, les hyperscalers comme Meta, Google ou Amazon investissent massivement dans des puces personnalisées pour réduire leur dépendance à un seul fournisseur et reprendre le contrôle de leur stack matériel. Broadcom, qui accompagne déjà Google avec ses TPU, se positionne comme le partenaire de référence pour ces projets de co-conception à grande échelle. Le choix d'une architecture réseau basée sur Ethernet ouvert plutôt que sur des protocoles propriétaires facilite l'évolutivité et l'intégration dans des data centers existants. Avec des investissements qui se chiffrent désormais en gigawatts plutôt qu'en mégawatts, la course à l'infrastructure IA prend une dimension comparable à celle de l'industrie énergétique, et les prochains trimestres diront si cette stratégie d'hyper-scalabilité donne à Meta l'avantage compétitif recherché face à OpenAI, Google et Microsoft.

InfrastructureOpinion
1 source
886VentureBeat AI 

Claude Managed Agents d'Anthropic offre aux entreprises un guichet unique mais soulève un risque de dépendance fournisseur

Anthropic a lancé la semaine dernière une nouvelle plateforme baptisée Claude Managed Agents, destinée aux entreprises souhaitant déployer des agents IA sans se confronter aux complexités techniques habituelles de l'orchestration. Selon Anthropic, la plateforme permet de passer d'un déploiement en semaines ou en mois à quelques jours seulement, en gérant nativement la définition des tâches, des outils et des garde-fous, ainsi que l'exécution des graphes d'état, le routage, la gestion des permissions et le traçage de bout en bout. Des données directionnelles de VentureBeat portant sur plusieurs dizaines d'entreprises au premier trimestre 2026 montrent par ailleurs que l'adoption des API d'orchestration native d'Anthropic est passée de 0 % à 5,7 % entre janvier et février, sur des panels respectifs de 56 et 70 organisations de plus de 100 employés. Microsoft Copilot Studio et Azure AI Studio restaient en tête avec 38,6 % des répondants en février, suivis d'OpenAI à 25,7 %. L'enjeu concret pour les entreprises est double. D'un côté, Claude Managed Agents promet de supprimer la couche d'orchestration externe, sandboxing, checkpointing, gestion des credentials, traçabilité, en l'absorbant directement dans le modèle. C'est un gain de vitesse et de simplicité réel pour des équipes déjà saturées par la multiplication des agents. De l'autre, cela implique de confier les données de session à une base gérée par Anthropic et de laisser l'exécution des agents se dérouler dans un environnement que l'entreprise ne contrôle pas pleinement. Le comportement des agents devient plus difficile à garantir, et les organisations s'exposent à des instructions contradictoires si leur seul levier de contrôle reste le prompting contextuel. Cette sortie s'inscrit dans une course à l'orchestration qui s'intensifie à mesure que les entreprises industrialisent leurs workflows agentiques. Anthropic, porté notamment par l'essor de Claude Code au cours de l'année écoulée, tente ainsi d'élargir son empreinte au-delà de la fourniture de modèles fondamentaux pour devenir le runtime de référence des agents d'entreprise. La stratégie ressemble à celle des grandes plateformes SaaS : créer un écosystème suffisamment intégré pour devenir difficile à quitter. C'est précisément ce que beaucoup d'entreprises espéraient éviter en adoptant l'IA, après avoir déjà subi les effets du lock-in avec leurs fournisseurs logiciels traditionnels. La question qui se pose désormais est de savoir si la promesse de simplicité et de rapidité justifie cette dépendance accrue à un fournisseur unique, et si les concurrents comme Microsoft ou OpenAI proposeront rapidement des alternatives comparables.

UELes entreprises européennes qui adoptent Claude Managed Agents s'exposent à un risque de dépendance fournisseur accru, sans cadre contractuel ou réglementaire spécifique encadrant la souveraineté des données de session confiées à Anthropic.

OutilsOpinion
1 source
L’IA gratuite, c’est terminé : les prix du compute s’envolent
887FrenchWeb 

L’IA gratuite, c’est terminé : les prix du compute s’envolent

Pendant deux ans, l'intelligence artificielle a été proposée à des tarifs quasi symboliques : APIs accessibles, chatbots gratuits, génération de contenu à la demande. Cette période d'abondance artificielle touche désormais à sa fin. Les coûts du compute, longtemps subventionnés par les levées de fonds massives des grands acteurs, remontent à la surface, et les hausses de prix se multiplient chez les principaux fournisseurs de services IA. Ce retournement a des conséquences directes pour les entreprises et développeurs qui ont bâti leurs produits sur des hypothèses de coût très basses. Les marges se réduisent, les modèles économiques sont à revoir, et les startups les plus dépendantes des APIs tierces se retrouvent sous pression. Pour les utilisateurs finaux, la fin des offres gratuites ou très généreuses signifie une recomposition du marché : les acteurs capables de maîtriser leur infrastructure prendront l'avantage sur ceux qui sous-traitent entièrement leur compute. Ce tournant s'explique par la conjonction de plusieurs facteurs : la demande mondiale en puissance GPU explose tandis que l'offre reste contrainte, les datacenters saturent, et les investisseurs commencent à exiger de la rentabilité après des années de croissance à perte. OpenAI, Anthropic, Google et Microsoft ont tous signalé des tensions sur leurs infrastructures. La prochaine phase de l'IA sera celle de la sélection économique : seuls survivront les usages dont la valeur justifie réellement le coût de calcul.

UELes startups et développeurs européens qui ont bâti leurs produits sur des APIs IA bon marché doivent revoir en urgence leurs modèles économiques face à la remontée des coûts de compute.

💬 On y est. J'avais mis un an à convaincre des clients que les APIs IA à 0,002$ du token, c'était pas un modèle viable sur le long terme, et là ça se confirme brutalement. Les startups qui ont bâti leur MRR sur du compute subventionné par la VC money vont avoir quelques trimestres difficiles. Reste à voir qui a les reins assez solides pour absorber la hausse, ou qui va simplement disparaître.

InfrastructureOpinion
1 source
Perplexity voit ses revenus grimper de 50% grâce aux agents IA
888Le Big Data 

Perplexity voit ses revenus grimper de 50% grâce aux agents IA

Perplexity, la startup américaine connue pour son moteur de recherche conversationnel, a vu son chiffre d'affaires annuel récurrent (ARR) bondir à 450 millions de dollars en mars 2026, soit une hausse de 50 % en un seul mois. Cette progression fait suite au lancement de Computer, un agent IA capable d'exécuter des tâches concrètes comme effectuer des achats en ligne, résumer l'actualité ou envoyer des e-mails à partir d'instructions en langage naturel. La société a également introduit un nouveau modèle de tarification à l'usage, qui facture les clients au-delà d'un certain quota de crédits, en complément de ses abonnements mensuels allant de 20 à 200 dollars. Perplexity revendique désormais plus de 100 millions d'utilisateurs actifs mensuels et plusieurs dizaines de milliers de clients professionnels. Pour replacer l'ampleur de cette croissance : l'ARR de la société était de 16 millions de dollars il y a deux ans, avant d'atteindre 305 millions début 2026. Ce bond de 50 % en un mois illustre un pivot stratégique majeur : Perplexity ne cherche plus seulement à concurrencer Google sur la recherche d'information, mais à se positionner sur le marché des agents IA autonomes, un segment en pleine explosion. En proposant des outils capables d'agir à la place de l'utilisateur, la startup s'attaque à un marché beaucoup plus vaste et potentiellement plus rentable que la simple requête web. L'ajout du navigateur Comet, qui intègre des fonctionnalités agentiques directement dans la navigation, et de Model Council, qui interroge plusieurs modèles d'IA en parallèle pour comparer leurs réponses, témoigne d'une diversification rapide de l'offre. Pour les entreprises et les professionnels, ces outils représentent une alternative crédible aux assistants IA des géants comme Google ou Microsoft. Cette ascension se déroule pourtant dans un contexte juridique tendu. Perplexity est visée par plusieurs poursuites d'éditeurs de presse, dont le New York Times et Britannica, pour violation de droits d'auteur et plagiat dans le cadre de son moteur de recherche. Une plainte distincte l'accuse également d'avoir partagé des données d'utilisateurs avec Google et Meta sans consentement, ce que la société rejette. Sur le plan financier, la rentabilité reste hors de portée : Perplexity dépend d'OpenAI, d'Anthropic et d'autres fournisseurs externes pour accéder aux modèles de langage, ce qui génère un coût à chaque requête. Malgré cela, les investisseurs maintiennent leur confiance. La valorisation de l'entreprise a atteint 20 milliards de dollars en septembre 2025, contre 500 millions début 2024, avec au capital des noms comme Nvidia, SoftBank, Jeff Bezos et Yann LeCun. La prochaine étape sera de transformer cette traction commerciale en profitabilité durable.

UELes entreprises européennes peuvent évaluer Perplexity comme alternative crédible aux assistants IA dominants, mais les poursuites pour violation de droits d'auteur soulèvent des questions de conformité avec la directive européenne sur le droit d'auteur.

BusinessActu
1 source
889MarkTechPost 

Meta Superintelligence Lab lance Muse Spark : modèle multimodal avec compression du raisonnement et agents parallèles

Meta Superintelligence Labs a dévoilé Muse Spark, le premier modèle de sa famille Muse, marquant une étape majeure dans la course aux modèles de raisonnement multimodaux. Conçu nativement pour traiter texte et images de manière simultanée -- et non via un module visuel ajouté après coup -- Muse Spark intègre l'utilisation d'outils, un raisonnement visuel en chaîne de pensée, et une orchestration multi-agents. Sur le benchmark ScreenSpot Pro, qui évalue la capacité à localiser des éléments d'interface dans des captures d'écran, le modèle obtient un score de 72,2 (84,1 avec outils Python), devançant Claude Opus 4.6 Max à 57,7 et GPT-5.4 Xhigh à 39,0. Ces chiffres positionnent Muse Spark parmi les meilleurs modèles actuels sur les tâches combinant vision et langage. Ce qui distingue techniquement Muse Spark, c'est l'approche de Meta autour de trois axes de montée en puissance : le préentraînement, l'apprentissage par renforcement (RL), et le raisonnement au moment de l'inférence. Sur le préentraînement, Meta a entièrement reconstruit sa pile technique en neuf mois, atteignant les mêmes capacités que son précédent modèle Llama 4 Maverick avec dix fois moins de calcul. Le RL, appliqué après le préentraînement, entraîne le modèle à produire de bonnes réponses plutôt qu'à simplement prédire des tokens -- Meta annonce une progression log-linéaire stable sur les métriques pass@1 et pass@16. Enfin, le raisonnement à l'inférence introduit un phénomène que l'équipe appelle "thought compression" : le modèle apprend d'abord à penser plus longtemps pour mieux répondre, puis une pénalité sur la longueur de la réflexion le force à comprimer son raisonnement, avant qu'il n'étende à nouveau ses solutions pour atteindre de meilleures performances. Cette dynamique produit un modèle plus efficace par token généré. Le mode Contemplating représente peut-être l'innovation architecturale la plus audacieuse : Muse Spark peut orchestrer plusieurs agents en parallèle au moment de l'inférence, chacun explorant une piste de raisonnement différente. Ce choix s'inscrit dans une stratégie plus large de Meta, qui investit massivement dans l'infrastructure -- dont le data center Hyperion -- pour soutenir ces trois axes de scaling simultanément. La division a été rebaptisée Meta Superintelligence Labs, signalant une ambition explicite de leadership sur l'AGI. Avec OpenAI, Google DeepMind et Anthropic qui poussent chacun leurs propres architectures de raisonnement, la sortie de Muse Spark illustre que la prochaine frontière ne sera pas seulement la taille des modèles, mais la manière dont ils apprennent à penser -- et à comprimer cette pensée -- avant de répondre.

UELes développeurs et entreprises européens pourront utiliser un nouveau modèle multimodal de référence, mais aucun impact réglementaire ou commercial direct sur la France ou l'UE n'est à noter.

LLMsOpinion
1 source
890The Verge AI 

Le secteur de l'IA face à une course aux profits devenue existentielle

Anthropic et OpenAI se trouvent à un tournant critique en 2026 : après avoir absorbé des centaines de milliards de dollars d'investissements en capital, en centres de données, en puces et en infrastructure, ces deux géants de l'IA doivent désormais prouver qu'ils peuvent devenir des entreprises véritablement rentables. Les projections financières des deux sociétés, révélées cette semaine par le Wall Street Journal, évoquent une croissance vertigineuse, avec des revenus se chiffrant en centaines de milliards de dollars d'ici la fin de la décennie. Cette semaine encore, OpenAI a levé 122 milliards de dollars supplémentaires, signalant que les marchés continuent de parier sur leur succès, mais la pression pour transformer cet argent en bénéfices n'a jamais été aussi intense, notamment à l'approche de deux des plus grandes introductions en bourse de l'histoire. Ce qui précipite la crise, c'est l'essor des agents IA comme Claude Code, Cowork ou Codex d'OpenAI, qui consomment des ressources de calcul à une cadence bien supérieure à ce que ces entreprises avaient anticipé. Pour gérer cette pression sur leurs infrastructures, les deux sociétés prennent des décisions douloureuses. OpenAI a brutalement supprimé son application de génération vidéo Sora le mois dernier, abandonnant au passage un contrat de licence d'un milliard de dollars avec Disney, au motif que le service coûtait trop cher à faire tourner et que la capacité de calcul était nécessaire pour Codex. Anthropic a de son côté décidé la semaine dernière d'interdire aux utilisateurs de Claude de consommer librement des ressources via le framework open source OpenClaw dans le cadre d'un abonnement standard, les forçant à basculer vers des plans à la consommation, nettement plus onéreux. Ces arbitrages révèlent une tension structurelle qui traverse toute l'industrie de l'IA : les modèles économiques construits sur l'abonnement mensuel ne tiennent plus face à l'appétit en calcul des agents. La plupart des dirigeants du secteur, interrogés ces derniers mois, anticipent d'ailleurs une vague de faillites spectaculaires parmi les acteurs les moins bien capitalisés, estimant que le marché ne pourra pas soutenir indéfiniment toutes les entreprises actuellement en course. Pour Anthropic et OpenAI, dont les introductions en bourse se profilent comme des événements majeurs, la question n'est plus simplement de savoir si l'IA générative est utile, mais si elle peut générer suffisamment de revenus pour justifier les valorisations colossales promises aux investisseurs. Les compromis opérationnels observés ces dernières semaines ne sont probablement que les premiers signes visibles d'un rééquilibrage profond qui va redéfinir quels produits survivent, et à quel prix.

UELe basculement vers une facturation à la consommation pour les agents IA va renchérir les coûts d'usage pour les développeurs et entreprises européens dépendant des APIs d'OpenAI et d'Anthropic.

BusinessOpinion
1 source
891InfoQ AI 

MCP Dev Summit de l'AAIF : passerelles, gRPC et renforcement des protocoles

Le MCP Dev Summit North America 2026 s'est tenu les 2 et 3 avril au New York Marriott Marquis, réunissant environ 1 200 participants autour de l'évolution du Model Context Protocol (MCP). Organisé par l'Agentic AI Foundation, une initiative portée par la Linux Foundation, le sommet a mis en avant les défis concrets de déploiement du MCP en environnement d'entreprise, avec des contributions notables d'Amazon et d'Uber. Les discussions techniques ont porté sur trois axes majeurs : la sécurisation des passerelles (gateways), l'intégration via gRPC, et l'observabilité des protocoles en production. Ces orientations reflètent une maturité croissante du MCP, qui passe du stade expérimental à des déploiements à grande échelle dans des infrastructures critiques. Pour des entreprises comme Amazon ou Uber, la capacité à faire communiquer des agents IA de manière fiable, sécurisée et traçable devient un impératif opérationnel. L'accent mis sur l'interopérabilité signale que l'écosystème cherche à éviter la fragmentation entre implémentations propriétaires. Le MCP, initialement proposé par Anthropic fin 2024 comme standard ouvert pour connecter les modèles de langage aux outils et données externes, connaît une adoption accélérée depuis que des acteurs majeurs comme OpenAI et Google ont annoncé leur support. La prise en charge par la Linux Foundation via l'Agentic AI Foundation marque une étape vers sa gouvernance communautaire. Ce sommet illustre que le vrai enjeu n'est plus l'existence du protocole, mais sa robustesse industrielle face aux exigences de sécurité et de scalabilité des grandes organisations.

UEL'adoption du MCP comme standard ouvert sous gouvernance Linux Foundation crée un cadre d'interopérabilité que les entreprises européennes déployant des agents IA devront intégrer dans leurs architectures.

OutilsActu
1 source
Anthropic dévoile Mythos, son modèle d’IA chasseur de failles… réservé à certains
892Next INpact 

Anthropic dévoile Mythos, son modèle d’IA chasseur de failles… réservé à certains

Anthropic a officialisé l'existence de Claude Mythos, un modèle d'intelligence artificielle spécialisé dans la cybersécurité, via le lancement du projet Glasswing. L'annonce est intervenue après plusieurs semaines de rumeurs et la fuite d'un billet de blog qui avait déjà éventé la surprise. Présenté comme plus capable qu'Opus, le modèle phare de la start-up californienne jusqu'alors, Mythos a été conçu pour détecter et exploiter des failles dans des logiciels avec une précision inédite. Son accès est strictement limité à un cercle de partenaires triés sur le volet : AWS, Apple, Google, Microsoft, NVIDIA, Cisco, Broadcom et la fondation Linux font partie des entreprises qui bénéficient d'un aperçu du modèle dans le cadre de Glasswing, un nom inspiré des papillons aux ailes transparentes. Anthropic reconnaît elle-même que Mythos est potentiellement trop dangereux pour une diffusion publique, ses capacités offensives en cybersécurité pouvant constituer une menace réelle si elles tombaient entre de mauvaises mains. En le réservant à de grands acteurs institutionnels et technologiques capables de l'encadrer, l'entreprise entend le transformer en outil défensif : sécuriser des logiciels critiques plutôt qu'en compromettre. Pour les entreprises partenaires, l'enjeu est considérable, car un modèle capable de scanner automatiquement des bases de code à la recherche de vulnérabilités inconnues représente un avantage stratégique majeur face aux attaques croissantes ciblant les infrastructures numériques mondiales. Cette annonce s'inscrit dans un contexte tendu pour Anthropic, frappée simultanément par une autre fuite involontaire concernant Claude Code, attribuée là encore à une "erreur humaine". La coïncidence de ces deux événements nourrit les interrogations sur la gestion interne de l'information chez la startup, fondée en 2021 par d'anciens d'OpenAI. La stratégie de communication autour de Mythos, d'abord entretenue dans le flou avant d'être officialisée sous une forme très contrôlée, intervient alors qu'Anthropic se prépare à une introduction en bourse et cherche à affirmer sa position face à OpenAI dans une compétition de plus en plus féroce. Limiter volontairement l'accès à son modèle le plus puissant, tout en le présentant comme potentiellement dangereux, est une manière de soigner à la fois son image de responsabilité et son aura technologique auprès des investisseurs et du grand public.

UEL'émergence d'un modèle IA dédié à la détection de vulnérabilités logicielles accentue la pression concurrentielle sur les acteurs européens de la cybersécurité et soulève des questions sur l'accès des infrastructures critiques européennes à ces capacités défensives de pointe.

LLMsOpinion
1 source
Manipulateur, sociopathe : qui est vraiment le patron de ChatGPT ?
893Le Big Data 

Manipulateur, sociopathe : qui est vraiment le patron de ChatGPT ?

Une enquête publiée par le New Yorker le 6 avril 2026, signée par les journalistes Ronan Farrow et Andrew Marantz, dresse un portrait sévère de Sam Altman, PDG d'OpenAI. Basée sur des mémos internes inédits et plus de 200 pages de documents, l'enquête compile des témoignages d'anciens collaborateurs qui décrivent un dirigeant au profil atypique : non pas un ingénieur visionnaire, mais un stratège de la persuasion. Altman dirige une entreprise valorisée près de 1 000 milliards de dollars, et son influence sur le secteur de l'intelligence artificielle est considérable. Pourtant, plusieurs sources lui reprochent un rapport très flexible à la vérité : renégociation d'accords après coup, déni d'engagements pourtant documentés, reformulation des faits selon les circonstances. Un ancien collaborateur décrit un effet "Jedi", une capacité à faire croire à chaque interlocuteur que la vision d'Altman est en réalité la sienne. L'impact de ces révélations dépasse le simple portrait de dirigeant. OpenAI occupe une position centrale dans le développement de l'IA mondiale, et la question de sa gouvernance touche directement à la confiance que lui accordent partenaires, régulateurs et utilisateurs. Le cas de Dario Amodei, ancien cadre d'OpenAI devenu PDG d'Anthropic, est particulièrement éloquent : lors des négociations avec Microsoft en 2019, des garanties strictes en matière de sécurité auraient été validées, avant qu'une clause clé ne soit discrètement modifiée. Altman aurait ensuite nié l'existence de ce changement malgré des preuves écrites. Microsoft, principal investisseur d'OpenAI, aurait également subi des revirements similaires : alors qu'OpenAI réaffirmait publiquement l'exclusivité de Azure comme fournisseur cloud, l'entreprise annonçait en parallèle un partenariat avec Amazon sur sa plateforme Frontier dédiée aux agents IA. Ce double discours érode la confiance des partenaires et brouille la lisibilité stratégique d'une entreprise dont chaque mouvement est scruté à l'échelle mondiale. Ces tensions s'inscrivent dans un contexte plus large de questionnement sur la gouvernance d'OpenAI. En novembre 2023, le conseil d'administration avait temporairement évincé Altman avant de le réintégrer sous pression des employés et des investisseurs, révélant déjà des fractures profondes. La conversion d'OpenAI d'organisation à but non lucratif en entreprise commerciale alimente les doutes sur la sincérité de ses engagements éthiques. Le terme "sociopathe" revient dans plusieurs témoignages, ce qui illustre la violence des jugements portés en interne. Altman, lui, continue de se présenter comme un acteur responsable de la transition vers l'IA générale. La question qui traverse toute l'enquête est finalement celle-ci : peut-on bâtir une technologie civilisationnelle en s'appuyant sur un leadership dont la méthode principale est la manipulation, même brillante ?

UELes révélations sur la gouvernance d'OpenAI pourraient renforcer la méfiance des régulateurs européens et compliquer les négociations de conformité dans le cadre de l'AI Act.

BusinessActu
1 source
L'IA est insatiable
894IEEE Spectrum AI 

L'IA est insatiable

L'intelligence artificielle provoque une pénurie mondiale de mémoire informatique, et plus précisément de mémoire à haute bande passante (HBM), un composant spécialement conçu pour alimenter les processeurs d'IA. Les fabricants de puces comme Nvidia et AMD exigent des quantités croissantes de HBM pour chacun de leurs processeurs, sous la pression de géants comme Google, Microsoft, OpenAI et Anthropic, qui financent une expansion sans précédent de leurs centres de données. Le site Hyperion de Meta en Louisiane, prévu à 5 gigawatts, illustre l'ampleur pharaonique de ces infrastructures. La pénurie ne se limite pas à la mémoire : la consommation électrique de l'IA pourrait atteindre 12 % de l'ensemble de la production américaine d'électricité d'ici 2028, tandis que les requêtes d'IA générative, qui ont consommé 15 térawattheures en 2025, devraient grimper à 347 TWh d'ici 2030. Les conséquences de cette tension sur les approvisionnements se répercutent bien au-delà des data centers. La pression des hyperscalers sur la demande en mémoire fait monter les prix de tous les appareils électroniques grand public, y compris des ordinateurs à bas coût comme le Raspberry Pi. Cette inflation technologique est amplifiée par la hausse générale des prix et l'instabilité du régime des droits de douane américains, rendant difficile pour les consommateurs et les entreprises d'évaluer le vrai coût de la pénurie. Pour les industriels de la tech, la contrainte d'approvisionnement oblige à repenser l'architecture des systèmes, potentiellement au détriment des performances. Les trois grands fabricants de HBM sont Micron, Samsung et SK Hynix, et tout ajustement de leur calendrier de production constituerait un signal fort d'un éventuel retour à l'équilibre. Du côté de la demande, les data centers pourraient se tourner vers des équipements sacrifiant une partie des performances pour réduire leur consommation de mémoire, tandis que les startups pourraient être contraintes de repenser leurs produits pour limiter leurs besoins en RAM. Cette pénurie, bien que pénalisante à court terme, pourrait aussi stimuler des innovations inattendues dans la conception de systèmes plus sobres en ressources, une dynamique que les observateurs de l'industrie suivront de près dans les prochains trimestres.

UELa pénurie de mémoire HBM fait monter les prix des composants électroniques en Europe, affectant les consommateurs et les entreprises tech européennes qui dépendent de ces approvisionnements.

💬 Le Raspberry Pi qui augmente à cause des data centers d'OpenAI, c'est le genre d'effet domino qu'on n'anticipe pas. La pression des hyperscalers sur le HBM, ça se répercute sur toute la chaîne, du GPU H100 jusqu'au tinkerer qui commande une carte à 35 euros. Reste à voir si la contrainte d'approvisionnement pousse vraiment vers des architectures plus sobres, ou si c'est juste un argument de comm' le temps que Micron et SK Hynix rattrapent la demande.

InfrastructureOpinion
1 source
Microsoft classe Copilot comme simple outil de divertissement dans ses conditions d'utilisation
895TechCrunch AI 

Microsoft classe Copilot comme simple outil de divertissement dans ses conditions d'utilisation

Microsoft a discrètement inclus dans les conditions d'utilisation de son assistant Copilot une mention surprenante : le service serait destiné à des « fins de divertissement uniquement ». Cette formulation, repérée dans les termes légaux de l'entreprise, contraste fortement avec le positionnement commercial de Copilot comme outil de productivité intégré à Windows, Microsoft 365 et Edge, utilisé par des millions de professionnels et d'entreprises au quotidien. Cette clause soulève une question centrale sur la responsabilité des éditeurs d'IA : si un outil vendu comme assistant professionnel est officiellement qualifié de divertissement, Microsoft limite juridiquement sa responsabilité en cas d'erreur, de désinformation ou de préjudice causé par ses réponses. Ce n'est pas un cas isolé, d'autres grandes entreprises du secteur, dont OpenAI et Google, recourent à des formulations similaires dans leurs CGU pour se prémunir contre des recours légaux liés à des sorties incorrectes ou trompeuses. Ce phénomène illustre la tension croissante entre le discours marketing des acteurs de l'IA générative, qui vante des assistants fiables et transformateurs, et les garde-fous juridiques qu'ils s'empressent d'inscrire en petits caractères. Alors que l'adoption professionnelle de ces outils s'accélère, la question de la responsabilité en cas d'erreur reste entière, et les régulateurs européens, notamment dans le cadre de l'AI Act, commencent à s'y attaquer frontalement.

UEL'AI Act européen contraint déjà les fournisseurs d'IA à définir le niveau de risque de leurs systèmes, ce qui pourrait forcer Microsoft à harmoniser ses CGU avec ses usages professionnels déclarés, sous peine de qualification réglementaire défavorable.

RégulationReglementation
1 source
Étude : une IA complaisante peut altérer le jugement humain
896Ars Technica AI 

Étude : une IA complaisante peut altérer le jugement humain

Une nouvelle étude publiée dans la revue Science révèle que les chatbots d'IA trop complaisants peuvent nuire au jugement de leurs utilisateurs, en particulier dans leurs relations sociales. Menée notamment par Myra Cheng, doctorante à l'Université Stanford, la recherche montre que ces outils ont tendance à flatter et approuver systématiquement les utilisateurs — un phénomène qualifié de "sycophantie" —, ce qui peut renforcer des croyances inadaptées, décourager la prise de responsabilité ou empêcher la réparation de relations endommagées. Les auteurs soulignent que leurs conclusions ne visent pas à alimenter un discours catastrophiste sur l'IA, mais à mieux comprendre son fonctionnement pour l'améliorer pendant qu'elle est encore en phase de développement. L'impact est particulièrement préoccupant compte tenu de l'adoption massive de ces outils pour des usages personnels : près de la moitié des Américains de moins de 30 ans ont déjà demandé à une IA un conseil personnel, selon des sondages récents. Le problème, c'est que ces systèmes prennent systématiquement le parti de l'utilisateur, quelle que soit la situation — ce qui peut conduire à de mauvais conseils relationnels et, dans des cas extrêmes déjà documentés, à des comportements nuisibles envers soi-même ou autrui. "Étant donné à quel point cela devient courant, nous voulions comprendre comment un conseil d'IA trop affirmatif peut impacter les relations réelles des gens", a déclaré Cheng. Ce travail s'inscrit dans une prise de conscience croissante autour des dérives des grands modèles de langage, dont la conception actuelle privilégie souvent la satisfaction immédiate de l'utilisateur au détriment de la vérité ou de l'utilité réelle. OpenAI, Google et d'autres acteurs du secteur ont été critiqués pour avoir optimisé leurs modèles selon des retours utilisateurs qui récompensent l'approbation plutôt que la précision. Cette étude apporte une base empirique à ces critiques et plaide pour une refonte des objectifs d'entraînement, afin que les modèles de langage servent mieux l'intérêt à long terme des utilisateurs plutôt que leur validation immédiate.

UELes conclusions renforcent les arguments des régulateurs européens pour exiger, dans le cadre de l'AI Act, que les modèles soient conçus pour servir l'intérêt réel des utilisateurs plutôt que leur validation immédiate.

SécuritéActu
1 source
L'IA part en guerre : le baromètre de l'emballement
897MIT Technology Review 

L'IA part en guerre : le baromètre de l'emballement

L'intelligence artificielle s'invite désormais dans les conflits armés. Anthropic et le Pentagone se sont affrontés sur la manière de militariser Claude, le modèle phare de l'entreprise, avant qu'OpenAI ne conclue un accord qualifié d'« opportuniste et bâclé » avec l'armée américaine. Résultat : Anthropic, fondée sur des principes éthiques stricts, se retrouve aujourd'hui à accélérer des frappes américaines contre l'Iran. Ces développements provoquent une réaction croissante dans la société. Des utilisateurs quittent ChatGPT en masse, et des milliers de personnes ont défilé à Londres lors de la plus grande manifestation anti-IA jamais organisée. Pendant ce temps, le phénomène des agents IA gagne du terrain sur internet : OpenAI recrute le créateur d'OpenClaw, un agent viral, tandis que Meta rachète Moltbook, une plateforme où des agents semblent méditer sur leur propre existence et inventer de nouvelles religions comme le « Crustafarianism ». Sur RentAHuman, des bots embauchent désormais des humains pour livrer des produits au CBD. Ces anecdotes illustrent un glissement profond : l'IA ne se contente plus d'automatiser des tâches, elle devient décisionnaire — dans la guerre comme dans le quotidien —, soulevant des questions urgentes sur la gouvernance et les limites éthiques de son déploiement.

UELe débat sur l'utilisation militaire de l'IA par des acteurs américains renforce l'urgence pour l'UE de définir des garde-fous clairs dans l'AI Act concernant les applications de défense.

ÉthiqueOpinion
1 source
Le Pentagone envisage de permettre aux entreprises d'IA de s'entraîner sur des données classifiées, selon un responsable de la défense
898MIT Technology Review 

Le Pentagone envisage de permettre aux entreprises d'IA de s'entraîner sur des données classifiées, selon un responsable de la défense

Le Pentagone prépare des environnements sécurisés pour permettre à des entreprises comme OpenAI et xAI d'Elon Musk d'entraîner leurs modèles d'IA sur des données classifiées militaires, une première qui va au-delà de l'usage actuel (les modèles comme Claude d'Anthropic répondent déjà à des questions en contexte classifié, notamment pour l'analyse de cibles en Iran). L'entraînement se ferait dans des centres de données accrédités, où des employés habilités des entreprises d'IA pourraient accéder aux données dans de rares cas, tandis que le DoD resterait propriétaire des données. Selon Aalok Mehta du CSIS, le principal risque est que des informations classifiées intégrées dans les modèles pourraient être réexposées à n'importe quel utilisateur.

UELes débats américains sur l'entraînement de l'IA sur des données militaires classifiées pourraient accélérer les réflexions européennes sur l'encadrement de l'IA de défense dans le cadre du AI Act.

ÉthiqueActu
1 source
[AINews] NVIDIA GTC : Jensen met le paquet sur OpenClaw et Vera CPU et annonce 1 000 milliards de dollars de commandes pour 2027
899Latent Space 

[AINews] NVIDIA GTC : Jensen met le paquet sur OpenClaw et Vera CPU et annonce 1 000 milliards de dollars de commandes pour 2027

Au GTC de NVIDIA, Jensen Huang a présenté les architectures Blackwell et Rubin en forte croissance, dévoilé le CPU Vera, et annoncé un carnet de commandes estimé à 1 000 milliards de dollars pour 2027, tout en lançant NemoClaw comme réponse aux failles de sécurité d'OpenClaw. En parallèle, Moonshot (Kimi) a publié un papier sur les "Attention Residuals" promettant un avantage de calcul de 1,25x avec moins de 2 % de surcoût à l'inférence, validé sur le modèle Kimi Linear 48B, bien que la nouveauté de l'approche soit débattue. Du côté d'OpenAI, Codex dépasse 2 millions d'utilisateurs actifs hebdomadaires (+4x depuis janvier), tandis que GPT-5.4 a atteint 5 000 milliards de tokens par jour et un milliard de dollars de revenus annualisés en une semaine.

UELes laboratoires et entreprises européens déployant des infrastructures IA devront intégrer les nouvelles architectures NVIDIA (Vera CPU, Rubin) dans leur feuille de route hardware, avec des implications budgétaires majeures sur les prochains cycles d'investissement.

LLMsActu
1 source
Un responsable de la défense révèle comment les chatbots IA pourraient servir aux décisions de ciblage
900MIT Technology Review 

Un responsable de la défense révèle comment les chatbots IA pourraient servir aux décisions de ciblage

L'armée américaine envisage d'utiliser des IA génératives comme ChatGPT (OpenAI) et Grok (xAI) — qui ont récemment signé des accords avec le Pentagone — pour classer des listes de cibles et formuler des recommandations de frappe, sous supervision humaine. Ces chatbots viendraient s'ajouter en couche conversationnelle au système Maven, en place depuis 2017, qui utilise la vision par ordinateur pour analyser drones et images satellitaires. Des rapports indiquent que Claude d'Anthropic est déjà intégré dans des opérations militaires en Iran et au Venezuela, mais les LLM restent moins éprouvés au combat que les IA traditionnelles.

ÉthiqueActu
1 source