Aller au contenu principal

Dossier Meta IA — page 5

545 articles · page 5 sur 11

Meta dans la course IA : Muse Spark, Superintelligence Labs, hyperagents, licenciements liés au pivot IA et infrastructure CoreWeave.

SkillMAS : quand l’IA réorganise son équipe et réécrit ses outils en temps réel
201Le Big Data RecherchePaper

SkillMAS : quand l’IA réorganise son équipe et réécrit ses outils en temps réel

Une équipe de chercheurs des universités Jiao Tong de Shanghai et du Centre-Sud, en partenariat avec le fabricant de smartphones OPPO, a publié en mai 2026 les travaux fondateurs du framework SkillMAS, un nouveau système d'orchestration d'agents d'intelligence artificielle. L'architecture, entièrement non paramétrique, ne modifie pas les poids des modèles de langage sous-jacents : elle fonctionne comme une couche logicielle supérieure qui permet à des équipes d'agents autonomes de réorganiser leurs rôles et de réécrire leurs outils en temps réel, sans aucune reprogrammation manuelle. Le mécanisme central repose sur une coévolution synchronisée à deux échelles : une échelle micro, qui gère les compétences techniques de chaque agent individuel, et une échelle macro, qui supervise l'organigramme collectif et redistribue les responsabilités au sein de l'équipe. Les deux niveaux s'influencent mutuellement en continu, ce qui confère au système une plasticité jusqu'ici absente des architectures classiques. Ce niveau d'adaptabilité répond à une limite structurelle des systèmes multi-agents actuels : leurs rôles et leurs outils sont figés par les développeurs au moment de la conception. Face à l'imprévu, ces architectures rigides entrent en boucles d'erreurs, consomment des quantités massives de tokens et nécessitent une supervision humaine constante, ce qui cantonne la technologie à des tâches bien balisées. SkillMAS brise ce plafond en permettant au système de s'adapter dynamiquement aux tâches complexes, réduisant à la fois les coûts opérationnels et la dépendance au pilotage humain. Pour OPPO, l'enjeu est directement industriel : cette architecture ouvre la voie à des assistants virtuels capables de gérer des situations inédites sans intervention extérieure, un saut qualitatif significatif pour les appareils grand public. Entre 2023 et 2025, la recherche en systèmes multi-agents avançait sur deux fronts séparés : des projets comme Voyager (Microsoft Research, 2023) exploraient la capacité des agents à créer leurs propres outils, tandis que des frameworks comme MetaGPT se concentraient sur la coordination collective. Aucun système ne fusionnait réellement ces deux dimensions. SkillMAS représente cette convergence, en unifiant apprentissage automatique et systèmes distribués dans une architecture unique. La validation en laboratoire démontre sa supériorité face aux standards actuels, et l'implication directe d'un acteur industriel comme OPPO suggère un passage prochain vers des applications commerciales. La prochaine étape sera de confirmer ces performances dans des environnements réels, hors conditions de laboratoire, où la robustesse des systèmes adaptatifs sera véritablement mise à l'épreuve.

UERecherche publiée par des universités chinoises en partenariat avec OPPO, sans impact immédiat sur la France/UE, mais susceptible d'influencer les architectures multi-agents à moyen terme.

1 source
Tutoriel NVIDIA cuTile en Python : noyaux GPU tuilés pour vecteurs et matrices dans Colab
202MarkTechPost 

Tutoriel NVIDIA cuTile en Python : noyaux GPU tuilés pour vecteurs et matrices dans Colab

NVIDIA a lancé cuTile Python, une interface de programmation GPU par tuiles permettant d'écrire des kernels de style CUDA directement en Python, sans passer par le C++. Un tutoriel détaillé, conçu pour fonctionner sur Google Colab, guide les développeurs à travers trois exemples progressifs : addition de vecteurs, addition de matrices et multiplication de matrices. L'environnement requiert au minimum le pilote NVIDIA R580 et le CUDA Toolkit 13.1, des prérequis que Colab ne satisfait pas toujours en configuration standard. Le package s'installe via PyPI sous le nom cuda-tile[tileiras], et le tutoriel intègre un mode de repli automatique sur PyTorch pour garantir l'exécutabilité du notebook même lorsque les conditions du runtime ne sont pas réunies. L'enjeu est considérable pour la communauté des développeurs en machine learning et en IA. Jusqu'ici, écrire des kernels GPU personnalisés et hautement optimisés exigeait de maîtriser le CUDA C++, un langage bas niveau réservé à un profil d'ingénieur très spécialisé. cuTile Python abaisse cette barrière en exposant une abstraction par tuiles directement en Python, le langage de référence de l'écosystème IA. Concrètement, les développeurs peuvent désormais contrôler finement comment les tenseurs sont chargés, calculés et stockés en mémoire GPU, puis comparer les performances de leurs kernels personnalisés avec les opérations standard de PyTorch. Ce niveau de contrôle, auparavant réservé à des équipes spécialisées dans des laboratoires comme Google DeepMind ou Meta FAIR, devient accessible à un cercle bien plus large de praticiens. Cette initiative s'inscrit dans une tendance de fond chez NVIDIA à rendre son écosystème CUDA plus accessible aux développeurs Python, face à la montée en puissance de compilateurs alternatifs comme Triton d'OpenAI ou JAX de Google. Triton, intégré nativement à PyTorch depuis 2022, avait déjà ouvert cette voie en permettant d'écrire des opérations GPU optimisées en Python pur. cuTile se positionne comme la réponse directe de NVIDIA, en s'appuyant sur son propre stack logiciel et ses nouvelles générations de pilotes. Le fait que le tutoriel soit explicitement conçu pour Colab, l'environnement de notebooks gratuit de Google, signale une stratégie d'adoption large : abaisser le coût d'entrée pour que les étudiants, chercheurs et ingénieurs puissent expérimenter sans infrastructure dédiée. La prochaine étape naturelle sera l'intégration de cuTile dans les frameworks d'entraînement majeurs comme HuggingFace Accelerate ou PyTorch Lightning, ce qui pourrait redéfinir comment les équipes optimisent leurs pipelines à grande échelle.

OutilsTuto
1 source
ChatGPT : OpenAI prépare sa plus grande transformation depuis son lancement
203Le Big Data 

ChatGPT : OpenAI prépare sa plus grande transformation depuis son lancement

OpenAI prépare une refonte profonde de ChatGPT, son assistant conversationnel lancé en novembre 2022, avec l'ambition de le transformer en une "super-application" multifonction. Selon des informations publiées début juin 2026, la plateforme ne se limiterait plus à la conversation textuelle mais intégrerait de manière renforcée des outils de génération d'images, des capacités d'agents IA autonomes capables d'exécuter des tâches complexes, et des partenariats approfondis avec des services tiers comme Canva ou Booking.com. L'outil de codage Codex, déjà lancé par OpenAI, serait également mis davantage en avant dans cette nouvelle architecture. L'objectif déclaré : faire de ChatGPT un point d'entrée unique pour une large palette d'usages numériques, du travail créatif au développement logiciel en passant par la planification de voyages. Cette transformation répond à une logique économique autant que technologique. Les entreprises représentent déjà près de 40 % des revenus d'OpenAI, et la société vise à accroître cette proportion dans les prochains mois. En centralisant davantage de services au sein d'une seule plateforme, OpenAI espère augmenter l'engagement des utilisateurs professionnels, généralement plus disposés à payer pour des outils qui leur font gagner du temps. Codex, l'assistant dédié au développement informatique, illustre cette stratégie : il gagne rapidement du terrain auprès des développeurs, un segment à forte valeur monétisable. Pour les utilisateurs grand public, l'intégration de partenaires comme Booking.com ou Canva pourrait réduire le besoin de passer d'une application à l'autre, augmentant ainsi la durée et la fréquence d'utilisation de ChatGPT. Cette évolution s'inscrit dans un contexte de concurrence IA intense. Google avec Gemini, Anthropic avec Claude, Meta avec ses modèles open-source et des dizaines de startups se disputent le même espace. OpenAI, valorisé à plus de 300 milliards de dollars lors de sa dernière levée de fonds en 2025, doit justifier cette valorisation auprès d'investisseurs qui attendent une croissance des revenus récurrents, notamment en vue d'une introduction en bourse anticipée. La stratégie de la super-application n'est pas nouvelle dans la tech : WeChat en Chine a démontré qu'un écosystème fermé et centralisé peut générer une dépendance utilisateur extrêmement rentable. Pour OpenAI, l'enjeu est de réussir cette transition sans aliéner sa base d'utilisateurs actuels, habitués à un outil simple et direct, tout en convainquant les entreprises partenaires que l'intégration dans l'écosystème ChatGPT vaut l'investissement.

UELe partenariat avec Booking.com (Amsterdam) illustre l'intégration d'acteurs européens dans l'écosystème ChatGPT, mais l'impact direct sur les entreprises françaises ou les régulations européennes reste diffus.

💬 La stratégie super-application, c'est le WeChat playbook appliqué à l'IA, et sur le papier ça tient la route. Ce qui m'intéresse vraiment là-dedans, c'est moins Booking.com que Codex : si les devs adoptent massivement l'outil, OpenAI touche le segment le plus monétisable qui soit. Reste à voir si les utilisateurs lambda voudront bien troquer la simplicité actuelle contre une plateforme fourre-tout.

OutilsOpinion
1 source
Sakana AI parie qu'une IA capable de s'améliorer elle-même peut mettre fin à la course au calcul des grands laboratoires
204The Decoder 

Sakana AI parie qu'une IA capable de s'améliorer elle-même peut mettre fin à la course au calcul des grands laboratoires

Sakana AI, une startup japonaise co-fondée par Llion Jones, l'un des huit co-auteurs du papier fondateur « Attention is All You Need » (2017), vient de lancer un laboratoire de recherche entièrement dédié à l'auto-amélioration récursive, connue sous le sigle RSI (Recursive Self-Improvement). Cette technologie consiste à concevoir des systèmes d'IA capables de s'optimiser eux-mêmes de façon itérative, sans dépendre d'une augmentation constante de la puissance de calcul disponible. Pour Sakana AI, le RSI constitue une alternative directe à la course aux datacenters et aux puces que se livrent les grands laboratoires américains comme OpenAI, Google DeepMind ou Meta, qui engloutissent des dizaines de milliards de dollars en infrastructure. L'idée centrale est d'obtenir des gains de performance en rendant les modèles capables de retravailler leur propre architecture ou leurs paramètres, plutôt qu'en empilant davantage de GPUs. Si cette piste aboutit, elle pourrait redistribuer les cartes entre acteurs bien dotés en capital et équipes plus agiles. Le RSI est aussi l'une des technologies les plus surveillées par les chercheurs en sécurité de l'IA. Anthropic, qui développe pourtant ses propres modèles frontier, met explicitement en garde contre les risques de contrôle associés à des systèmes capables de se redéfinir eux-mêmes. La tension est révélatrice : l'auto-amélioration récursive est à la fois perçue comme un levier de souveraineté technologique pour les acteurs hors Silicon Valley, et comme l'un des scénarios de risque les plus sérieux pour la sécurité à long terme de l'IA.

UESi le RSI tient ses promesses, les laboratoires européens à ressources limitées pourraient bénéficier d'une voie de compétitivité alternative à la course aux datacenters, réduisant leur dépendance aux infrastructures massives américaines.

💬 Sakana mise sur l'auto-amélioration récursive pour contourner la course au calcul. C'est le seul angle vraiment crédible si tu n'as pas dix milliards à mettre dans des datacenters, et avec Llion Jones à bord (un des auteurs d'"Attention is All You Need"), l'équipe a le niveau pour que ça soit autre chose qu'un pitch deck. Le hic, c'est que le RSI est aussi ce qu'Anthropic cite en tête de liste quand on leur demande ce qui les empêche de dormir.

RecherchePaper
1 source
The Download : le piratage par IA dépasse Mythos, et l'effet des chatbots sur le cerveau
205MIT Technology Review 

The Download : le piratage par IA dépasse Mythos, et l'effet des chatbots sur le cerveau

Des attaquants ont exploité lundi l'agent IA de support client de Meta pour voler des comptes Instagram : ils ont simplement demandé au système de lier les comptes visés à des adresses e-mail sous leur contrôle, et l'agent a obtempéré. Cette attaque basique mais efficace survient alors que les débats en cybersécurité se concentraient jusqu'ici sur des menaces bien plus sophistiquées, notamment depuis qu'Anthropic a annoncé que son modèle Mythos se montrait trop performant en piratage pour être diffusé au grand public. Pendant ce temps, Anthropic a publiquement appelé à un ralentissement mondial du développement de l'IA, citant les risques d'auto-amélioration des modèles et demandant un plan coordonné au niveau international. Autre signal fort : selon Cloudflare, le trafic web généré par des bots a pour la première fois dépassé celui des humains, atteignant 57,4 % du total, un cap que le PDG de l'entreprise n'anticipait pas avant fin 2027. Le piratage des comptes Instagram illustre une réalité que l'industrie préfère souvent ignorer : à mesure que les entreprises délèguent davantage de tâches à des agents IA, des attaques comparativement rudimentaires deviennent des vecteurs d'exploitation redoutables. Par ailleurs, Gloria Mark, psychologue à l'Université de Californie à Irvine, alerte sur un autre type de dommage collatéral : ses recherches montrent que les technologies numériques ont déjà considérablement réduit les capacités d'attention, générant davantage de stress et affaiblissant les performances. Elle craint que des outils comme ChatGPT ou Claude n'accélèrent ce glissement. « Vous déléguez votre travail cognitif à l'IA, et ce n'est pas bon pour nous », résume-t-elle, évoquant une érosion de la pensée critique et de l'intelligence émotionnelle. La bonne nouvelle : elle estime que cette trajectoire peut encore être corrigée. Ces événements s'inscrivent dans un contexte de montée en puissance des enjeux de gouvernance de l'IA à l'échelle mondiale. Aux États-Unis, des responsables gouvernementaux ont discuté de la possibilité pour l'État de prendre des participations financières dans des entreprises d'IA, une idée que Sam Altman aurait lui-même soumise à la Maison-Blanche l'année dernière. La Maison-Blanche envisage également d'intégrer des IA médicales pour diagnostiquer des maladies et prescrire des traitements, malgré l'absence de preuves solides sur leur efficacité clinique réelle. Le Canada a de son côté lancé sa stratégie nationale IA, avec plus de 2 milliards de dollars de financement et un objectif de 250 000 emplois créés. En Corée du Sud, le ministre du Travail pousse les entreprises technologiques à partager les profits générés par l'IA avec leurs salariés et fournisseurs, un débat qui avait déjà failli déclencher une grève massive chez Samsung. L'IA reconfigure simultanément les infrastructures numériques, les économies et les cerveaux humains, souvent plus vite que les institutions ne peuvent y répondre.

UEL'appel d'Anthropic à un ralentissement mondial du développement de l'IA pourrait influencer le calendrier d'application de l'AI Act européen, tandis que le dépassement du trafic humain par les bots (57,4 %) concerne directement les infrastructures numériques et la cybersécurité européennes.

💬 On s'inquiétait de Mythos, le modèle trop fort en hacking pour être publié, et pendant ce temps quelqu'un a juste demandé poliment à l'agent Meta de lier des comptes Instagram à ses propres adresses mail. C'est ça le vrai risque des agents IA : pas les scénarios de science-fiction, mais l'absence de garde-fous sur des actions basiques que n'importe quel humain refuserait. Reste à voir combien d'entreprises vont continuer à déployer des agents sans politique d'autorisation sérieuse.

SécuritéActu
1 source
NVIDIA lance Nemotron 3 Ultra, un hybride Mamba-Transformer open source à 550 milliards de paramètres pour agents autonomes
206MarkTechPost 

NVIDIA lance Nemotron 3 Ultra, un hybride Mamba-Transformer open source à 550 milliards de paramètres pour agents autonomes

NVIDIA a dévoilé Nemotron 3 Ultra, son modèle d'intelligence artificielle le plus ambitieux à ce jour : un modèle à mélange d'experts (MoE) de 550 milliards de paramètres au total, dont seulement 55 milliards sont activés à chaque token. Conçu spécifiquement pour les agents autonomes de longue durée, il repose sur une architecture hybride Mamba-Attention, une alternative aux Transformers purs. Les couches Mamba gèrent les longues séquences avec une mise à l'échelle sous-quadratique, tandis que quelques couches Attention assurent un rappel précis sur de grands contextes. Le modèle a été pré-entraîné sur 20 000 milliards de tokens, puis sa fenêtre de contexte a été étendue à 1 million de tokens. NVIDIA annonce un débit d'inférence jusqu'à six fois supérieur à celui de modèles open source comparables, à précision équivalente. Le pipeline de post-entraînement combine apprentissage supervisé (SFT), apprentissage par renforcement à récompense vérifiable (RLVR) et une distillation multi-enseignants (MOPD). Les données publiées en open source incluent 50 millions d'exemples SFT, 2 millions de tâches RL et 55 environnements RL, auxquels s'ajoutent 173 milliards de tokens de code GitHub fraîchement collectés. Ce modèle répond à un défi concret du déploiement d'agents IA : plus un agent opère longtemps, plus le nombre de tokens traités explose, et plus le coût d'inférence devient prohibitif. Nemotron 3 Ultra inverse cette dynamique grâce à sa structure MoE et à l'architecture Mamba, dont le coût de décodage reste constant quelle que soit la longueur de la séquence. Pour les entreprises qui construisent des agents capables d'utiliser des outils, de planifier sur de nombreux tours et de raisonner sur de longs contextes, c'est une amélioration directe de viabilité économique. La publication simultanée des jeux de données d'entraînement et des 15 nouveaux environnements RL est également significative : elle permet à la communauté de reproduire et d'affiner le pipeline sans repartir de zéro, ce que les grands modèles fermés ne permettent pas. Nemotron 3 Ultra s'inscrit dans la stratégie de NVIDIA visant à imposer sa stack logicielle dans l'écosystème IA open source, en complément de ses GPU. L'entraînement n'a pas été sans accrocs : deux divergences de loss ont été documentées. La première, vers 8 000 milliards de tokens, était due à une réduction de gradient en BF16 qui écrasait silencieusement la contribution du mécanisme de prédiction multi-token. La seconde, vers 16 000 milliards de tokens, reste inexpliquée et a conduit NVIDIA à tronquer l'entraînement à 20 000 milliards de tokens. Ces incidents, publiquement documentés, constituent une contribution rare à l'ingénierie de l'entraînement à grande échelle. Le modèle est publié en open weights via Hugging Face, positionnant NVIDIA comme un acteur de référence dans la course aux modèles ouverts face à Meta, Mistral et Google.

UELa publication en open weights avec les jeux de données d'entraînement (50 M exemples SFT, 2 M tâches RL) permet aux équipes de recherche et entreprises européennes de reproduire, affiner et déployer ce modèle sans dépendance propriétaire, renforçant leur capacité à développer des agents autonomes compétitifs à moindre coût d'inférence.

💬 L'architecture Mamba pour des agents longs, c'est le problème qu'on se prend en pleine figure dès qu'on essaie de faire tourner quelque chose de sérieux en prod. 55 milliards actifs sur 550, contexte à un million de tokens sans faire exploser les coûts à chaque requête, les datasets publiés avec, ça change vraiment l'équation pour qui construit sur de l'open source. Et documenter deux divergences de loss en cours d'entraînement, dont une inexpliquée, c'est rare, et franchement plus utile que trois posts de blog soignés.

LLMsOpinion
1 source
Gemma 4 12B : Google apporte l’IA multimodale sur les PC grand public
207Le Big Data 

Gemma 4 12B : Google apporte l’IA multimodale sur les PC grand public

Google a lancé le 3 juin 2026 Gemma 4 12B, un modèle d'intelligence artificielle multimodal conçu pour fonctionner sur des ordinateurs grand public disposant de seulement 16 Go de mémoire vive. Contrairement aux grands modèles qui nécessitent des infrastructures cloud coûteuses, ce modèle intermédiaire de la famille Gemma est capable de traiter simultanément du texte, des images et de l'audio directement en local. Selon Google, ses performances sur plusieurs benchmarks se rapprochent de celles du modèle Gemma 26B, pourtant bien plus imposant. Le modèle est d'ores et déjà accessible via des outils populaires comme LM Studio, Ollama, les applications Google AI Edge Gallery et AI Edge Eloquent, ainsi qu'une interface en ligne de commande nommée LiteRT-LM. Les poids préentraînés sont disponibles sur Hugging Face et Kaggle. L'enjeu principal est la souveraineté des données et l'accessibilité de l'IA avancée. En permettant l'exécution locale d'un modèle multimodal capable de transcrire, reformater ou traduire du contenu vocal sans connexion internet, Google ouvre la voie à des cas d'usage concrets pour les professionnels et particuliers soucieux de ne pas envoyer leurs données vers des serveurs distants. L'analyse de documents, les assistants personnels et l'automatisation de tâches deviennent envisageables sur une machine ordinaire, sans abonnement cloud. C'est un changement de paradigme potentiellement significatif pour les entreprises de taille moyenne, les développeurs indépendants et les utilisateurs dans des environnements à connectivité limitée. Cette annonce s'inscrit dans une tendance de fond qui voit les grands acteurs de l'IA rivaliser sur le segment des modèles compacts et open, face à la montée de concurrents comme Meta avec Llama, Mistral ou encore Microsoft. La véritable originalité architecturale de Gemma 4 12B réside dans l'abandon des encodeurs séparés pour le traitement visuel et audio : au lieu d'assembler plusieurs briques spécialisées, le modèle intègre nativement ces modalités dans son réseau principal, réduisant les calculs intermédiaires et la consommation mémoire. Cette approche, techniquement délicate à mettre en oeuvre sans sacrifier les performances, représente aussi la première fois qu'un modèle intermédiaire de la gamme Gemma gère nativement l'audio. Google positionne ainsi Gemma 4 12B comme une brique de base pour des applications dites agentiques, capables d'agir de manière autonome sur l'appareil de l'utilisateur, un segment sur lequel la compétition entre laboratoires devrait s'intensifier dans les prochains mois.

UELes entreprises et développeurs européens peuvent désormais exécuter un modèle multimodal en local sans transférer leurs données vers des serveurs américains, une avancée directement pertinente pour la conformité RGPD.

💬 C'est le genre de modèle qu'on attendait : multimodal, 16 Go de RAM, dispo sur Ollama maintenant. L'audio natif sans encodeur séparé, c'est la vraie nouveauté technique, et ça change quelque chose pour qui veut traiter de la voix en local sans envoyer ses données quelque part. Reste à voir si les perfs tiennent dans les vrais usages, mais j'ai déjà lancé le pull.

LLMsOpinion
1 source
☕️ Alphabet veut lever 80 milliards : l’IA se finance à crédit même quand on s’appelle Google
208Next INpact 

☕️ Alphabet veut lever 80 milliards : l’IA se finance à crédit même quand on s’appelle Google

Alphabet, la maison mère de Google, a annoncé lundi 1er juin une levée de fonds de 80 milliards de dollars structurée en trois tranches distinctes. La première porte sur 30 milliards de dollars sous forme d'obligations convertibles en actions, la deuxième sur 40 milliards d'actions émises au prix du marché à partir du troisième trimestre 2026, et la troisième sur un placement privé de 10 milliards de dollars souscrit par Berkshire Hathaway, le conglomérat financier longtemps dirigé par Warren Buffett. Cette opération vise à financer l'expansion des infrastructures d'intelligence artificielle générative du groupe, dont le budget d'investissement est estimé entre 180 et 190 milliards de dollars pour la seule année 2026. Google précise par ailleurs avoir déjà contracté 85 milliards de dollars de dette bancaire en 2025, portant son encours total à plus de 100 milliards de dollars. Ce choix de recourir aux marchés financiers interpelle pour une entreprise valorisée 4 500 milliards de dollars en bourse et ayant généré 174 milliards de dollars de cash flow opérationnel en 2025. Mais la logique est industrielle : déployer un tel volume de capitaux sur ses seuls fonds propres fragiliserait la flexibilité financière du groupe et pèserait sur son bilan. En maintenant un endettement maîtrisé et en diluant légèrement ses actionnaires, Alphabet préserve sa capacité de manœuvre pour d'éventuelles acquisitions ou retournements de conjoncture. L'opération témoigne surtout de l'ampleur des investissements que requiert la course aux datacenters : même les géants les mieux capitalisés du secteur ne peuvent plus financer leur transformation IA sur leurs seules liquidités. Cette levée de fonds s'inscrit dans une dynamique sectorielle qui dépasse largement Google. Microsoft, Amazon et Meta multiplient eux aussi les montages financiers complexes pour accélérer leurs infrastructures, tandis qu'OpenAI, xAI et Anthropic lèvent des dizaines de milliards auprès d'investisseurs institutionnels et souverains. L'entrée de Berkshire Hathaway au capital d'Alphabet, même symbolique, marque une validation forte de la thèse IA par les investisseurs traditionnels les plus conservateurs. Côté fondamentaux, Google affiche une croissance de son chiffre d'affaires de 63 % en glissement annuel au premier trimestre 2026, avec un carnet de commandes ayant quasiment doublé en un trimestre pour dépasser 460 milliards de dollars, dont la moitié devrait être convertie en revenus dans les 24 prochains mois. L'IA est désormais moins un pari qu'une machine à commandes, mais une machine dont le coût d'alimentation oblige même les plus riches à emprunter.

UEL'écart croissant entre les capacités d'investissement dans les infrastructures IA américaines et européennes fragilise durablement la compétitivité du secteur technologique européen.

💬 Quand la boîte la mieux capitalisée du monde doit quand même aller sur les marchés, ça remet les chiffres à l'échelle : même 174 milliards de cash flow annuel ne tiennent plus le rythme des datacenters IA. L'entrée de Berkshire dans la danse, c'est la signature des derniers sceptiques institutionnels. Pour les acteurs européens qui regardent ça de loin, c'est le genre de chiffres qui fait mal à lire.

L'IA dans le développement de jeux vidéo : comment elle transforme l'industrie
209AI News 

L'IA dans le développement de jeux vidéo : comment elle transforme l'industrie

L'intelligence artificielle s'est imposée comme un pilier du développement de jeux vidéo. Selon une enquête de Google Cloud, 90% des développeurs intègrent déjà l'IA dans leur travail quotidien, et sur Steam, 7 818 titres ont déclaré utiliser l'IA en 2025, soit une hausse de 681% par rapport à l'année précédente. Concrètement, cette intégration traverse toutes les étapes de la production. Ubisoft a développé Ghostwriter, un outil génératif qui rédige des premières ébauches de dialogues pour les personnages non-joueurs, libérant les scénaristes des tâches de pur volume. Chez Tencent, l'outil Hunyuan3D-PolyGen génère des assets 3D de niveau professionnel avec des gains d'efficacité supérieurs à 70% selon les artistes. Meta a présenté WorldGen, capable de produire un environnement 3D navigable à partir d'une simple description textuelle en cinq minutes, directement compatible avec Unity et Unreal. Du côté du contrôle qualité, EA déploie des agents d'apprentissage par renforcement pour tester ses jeux de manière autonome, pendant que Square Enix a annoncé son intention d'automatiser 70% de son processus de QA et de débogage d'ici 2027, en partenariat avec l'Université de Tokyo. L'impact opérationnel est déjà mesurable. Selon Andreessen Horowitz, la création de concept art qui nécessitait trois semaines se ramène désormais à une heure grâce aux outils génératifs. La génération vocale via des plateformes comme ElevenLabs permet de localiser un jeu dans plusieurs langues à une vitesse que les pipelines d'enregistrement traditionnels ne peuvent pas égaler. Pour les jeux navigateur, des outils comme FRVR AI permettent à n'importe quel utilisateur de générer un jeu jouable depuis une simple description. Ce nivellement de l'accès change la structure du marché : des développeurs sans formation artistique ou technique approfondie peuvent désormais atteindre le stade du prototype fonctionnel et publier sur des plateformes comme Poki, dont le modèle publicitaire offre une monétisation immédiate. L'enjeu n'est plus seulement l'efficacité des grands studios, mais la démocratisation de la création vidéoludique à une échelle sans précédent. Cette transformation s'accélère dans un secteur qui fait face depuis des années à des cycles de production longs et coûteux. L'émergence des grands modèles de langage a rendu possible ce que les systèmes procéduraux classiques ne pouvaient pas accomplir : maintenir une cohérence narrative dans des univers générés dynamiquement, comme le démontre le cadre de recherche PANGeA. Mais l'expansion n'est pas sans friction. L'afflux de titres de faible qualité générés par IA sur Steam en 2025 a soulevé des questions sur les standards minimaux dans un environnement où produire du contenu devient quasi gratuit. Les syndicats d'acteurs vocaux et les guildes de scénaristes négocient encore les conditions dans lesquelles l'IA peut générer des dialogues ou cloner des voix. Ces négociations, combinées aux questions de propriété intellectuelle sur les assets générés, dessinent les contours du prochain débat structurant pour une industrie qui pèse plusieurs centaines de milliards de dollars à l'échelle mondiale.

UEUbisoft, entreprise française leader mondial du jeu vidéo, intègre déjà l'IA générative dans ses studios via Ghostwriter, tandis que les syndicats européens de doubleurs et scénaristes négocient des garde-fous face à l'automatisation des dialogues et au clonage vocal.

💬 681% de hausse sur Steam, c'est pas une stat, c'est un signal d'alarme autant qu'une opportunité. Ce qui m'intéresse vraiment là-dedans, c'est pas les grands studios qui gagnent du temps sur les assets, c'est le mec seul qui peut maintenant aller jusqu'au prototype jouable sans équipe. Reste que l'inondation de slop sur Steam, ça va forcer une curation que la plateforme n'a jamais vraiment assumée.

OutilsOutil
1 source
DeepSeek V4 : émancipation chinoise et urgence d’une stratégie IA européenne
210Le Big Data 

DeepSeek V4 : émancipation chinoise et urgence d’une stratégie IA européenne

Le modèle DeepSeek V4, développé par la startup chinoise DeepSeek, s'est imposé comme un signal fort de la maturité technologique de la Chine en matière d'intelligence artificielle. Dans une analyse publiée début 2026, Francis Lelong, expert en souveraineté technologique, décortique les mécanismes qui ont permis à Pékin de contourner les sanctions américaines sur les semi-conducteurs. Loin de freiner Pékin, ces restrictions ont fonctionné comme un accélérateur : privée d'accès direct aux puces Nvidia haut de gamme, la Chine a investi massivement dans sa propre chaîne de valeur, des terres rares aux modèles de langage, en passant par la conception de ses propres composants. Le résultat est un écosystème d'IA de plus en plus autonome, capable de proposer des LLM ouverts et paramétrables compétitifs face aux offres américaines, à l'image de ce que Mistral AI incarne en Europe. L'enjeu dépasse largement la performance technique des chatbots. Lelong rappelle qu'un modèle d'IA n'est jamais culturellement neutre : il encode les valeurs, les biais et les priorités politiques de ses concepteurs. La montée en puissance de l'IA chinoise représente donc un levier de soft power considérable, capable d'exporter une vision du monde à travers chaque interaction. Sur le plan économique, l'ouverture de data centers est comparée par Lelong à un déploiement instantané de "millions de cerveaux synthétiques" : dans un contexte de vieillissement démographique mondial, le travail synthétique déplace la valeur du capital humain et devient un moteur de croissance incontournable pour éviter la stagnation. La compétition sino-américaine profite paradoxalement aux entreprises mondiales, qui bénéficient d'une offre élargie et de coûts réduits. Cette course technologique s'inscrit dans une rivalité géopolitique structurelle, comparable à la course spatiale des années 1960, mais avec une dimension culturelle et économique bien plus diffuse. Les sanctions américaines, selon Lelong, ne feront que retarder l'inévitable : la Chine avait déjà tracé sa trajectoire d'indépendance technologique, couvrant le spatial, le quantique, l'énergie et le nucléaire. L'affaire Manus, où Pékin a repris le contrôle d'une startup acquise par Meta, est interprétée non comme un acte de souveraineté assumée, mais comme un signal inquiétant envoyé aux jeunes talents et aux investisseurs. C'est dans ce contexte que l'Europe est interpellée dans son absence stratégique : ni le modèle fermé et capitalistique américain, ni le modèle ouvert mais politiquement contrôlé chinois ne correspond aux valeurs européennes. Définir une troisième voie, à l'image du succès relatif de Mistral, reste l'urgence que Lelong juge encore sans réponse collective à l'échelle du continent.

UELa montée en puissance de DeepSeek et de l'IA chinoise renforce l'urgence pour l'Europe de définir une troisième voie souveraine, Mistral restant pour l'instant la seule réponse partielle à l'échelle du continent.

💬 Les sanctions américaines censées bloquer Pékin leur ont offert le meilleur des accélérateurs : construire leur propre chaîne, du silicium au modèle. Pendant ce temps, l'Europe a Mistral et beaucoup de colloques sur la souveraineté numérique. C'est pas faute d'avoir été prévenus.

LLMsReglementation
1 source
Anthropic frappe fort : Claude Opus 4.8 écrase déjà GPT-5.5 et Mythos arrive bientôt
211Frandroid 

Anthropic frappe fort : Claude Opus 4.8 écrase déjà GPT-5.5 et Mythos arrive bientôt

Anthropic lance Claude Opus 4.8 le 28 mai 2026, disponible au même tarif que son prédécesseur direct Opus 4.7. La mise à jour introduit un mode rapide proposé à un coût trois fois inférieur, rendant le modèle plus accessible pour les applications à fort volume d'appels API. Anthropic annonce également un renforcement des capacités d'honnêteté du modèle, un axe de développement central dans sa philosophie d'alignement. Sur les benchmarks publiés, Opus 4.8 surpasse GPT-5.5 d'OpenAI sur plusieurs métriques de référence. En parallèle, l'entreprise a déjà déployé Mythos, un modèle encore plus puissant, auprès d'un cercle restreint d'utilisateurs, sans calendrier officiel de sortie grand public pour l'instant. Le maintien du tarif d'Opus 4.7 tout en livrant des performances supérieures constitue une pression directe sur la concurrence. La division par trois du coût du mode rapide ouvre des perspectives concrètes pour les entreprises qui déploient des pipelines à grande échelle, où le coût par token est déterminant. L'amélioration de l'honnêteté répond aux préoccupations croissantes des utilisateurs professionnels sur la fiabilité des modèles, notamment dans les contextes juridiques, médicaux et financiers. Cette sortie s'inscrit dans une course aux modèles qui s'est considérablement accélérée depuis début 2026, avec OpenAI, Google et Meta enchaînant les mises à jour majeures à un rythme sans précédent. L'existence de Mythos, maintenu en accès restreint malgré sa maturité opérationnelle, illustre la stratégie de déploiement graduel d'Anthropic, qui préfère affiner en cercle fermé avant d'ouvrir au grand public. La société fondée par Dario et Daniela Amodei se positionne ainsi comme un acteur qui mise sur la prudence et la performance simultanément, cherchant à capturer une clientèle entreprise exigeante sans sacrifier la sécurité.

UELes entreprises européennes utilisant l'API Claude bénéficieront du mode rapide trois fois moins cher, réduisant significativement les coûts de déploiement à grande échelle pour les pipelines à fort volume d'appels.

💬 Le mode rapide à un tiers du prix, c'est la vraie info. Opus 4.8 qui bat GPT-5.5 sur les benchmarks, ok, mais les classements bougent toutes les six semaines, alors que le coût par token divisé par trois sur les gros pipelines, ça change vraiment les calculs pour les équipes en prod. Mythos en accès restreint pendant ce temps, c'est le signe qu'Anthropic joue désormais sur deux niveaux en même temps.

LLMsOpinion
1 source
☕️ Quand l’IA agentique coûte plus cher que de payer ses employés humains
212Next INpact 

☕️ Quand l’IA agentique coûte plus cher que de payer ses employés humains

Les grandes entreprises technologiques font face à une équation économique qui commence à gripper sérieusement leurs ambitions d'IA : la facturation à l'usage des agents IA, calculée en tokens et non plus en abonnements forfaitaires, rend ces systèmes plus onéreux que les employés humains qu'ils sont censés remplacer ou assister. Le CTO d'Uber, Praveen Neppalli Naga, a reconnu avoir épuisé la totalité de son budget IA 2026 en seulement quatre mois. Bryan Catanzaro, vice-président en charge de l'apprentissage profond appliqué chez Nvidia, est encore plus direct : pour son équipe, le coût de la puissance de calcul dépasse désormais celui des salaires. Microsoft, après avoir encouragé en décembre dernier des milliers de ses développeurs à utiliser Claude Code d'Anthropic, vient d'annuler ces licences et les contraint à migrer vers GitHub Copilot CLI. Ce même GitHub Copilot, qui avait limité fin avril les nouveaux abonnements individuels, basculera en juin vers une facturation indexée sur la consommation réelle de tokens. Cette pression économique a engendré un phénomène pervers baptisé « tokenmaxxing » : des employés génèrent artificiellement de l'activité IA pour gonfler leurs statistiques de consommation, moins pour produire du code utile que pour paraître surproductifs aux yeux de leur hiérarchie. Amazon a fixé comme objectif que 80 % de ses développeurs utilisent l'IA chaque semaine et suit leur consommation de tokens. Meta est allé plus loin encore, avec un tableau de bord interne attribuant le statut de « Token Legend » aux plus grands consommateurs. Ce que ces pratiques révèlent, c'est que les métriques de tokens sont devenues des indicateurs de performance managériale avant d'être des mesures de valeur créée. La question de fond est structurelle : les modèles agentiques consomment beaucoup plus de tokens par tâche que les modèles classiques, et cette intensité ne sera pas compensée par la baisse des coûts unitaires. Un rapport Gartner estime que le coût d'inférence sur un LLM sophistiqué pourrait chuter de 90 % d'ici 2030, mais prévoit néanmoins que le coût total de l'IA continuera d'augmenter si la consommation progresse plus vite que la déflation tarifaire. Jensen Huang, PDG de Nvidia, imaginait récemment un futur où 100 agents IA travailleraient aux côtés de chaque employé humain de son entreprise, une vision qui semble économiquement intenable dans le modèle de facturation actuel. L'industrie se retrouve donc devant un choix structurant : soit les prix s'effondrent suffisamment vite, soit les entreprises doivent revoir radicalement leur usage de l'IA agentique, sous peine de financer des dépenses dont le retour reste difficile à démontrer.

UELes entreprises européennes qui adoptent des agents IA à grande échelle sont exposées aux mêmes pressions économiques liées à la facturation à l'usage, remettant en question la viabilité budgétaire de leurs projets d'IA agentique.

💬 Uber qui épuise son budget IA en quatre mois, Nvidia qui dit que le compute dépasse les salaires : c'est pas un bug, c'est le modèle. Les agents consomment structurellement 10 à 100 fois plus de tokens qu'un chat classique, et aucune baisse de prix unitaire ne rattrapera ça avant 2-3 ans. Le tokenmaxxing chez Amazon et Meta, des gens qui gonflent leur conso pour paraître productifs sur un dashboard, c'est juste le signe qu'on a mis la mauvaise métrique au centre.

BusinessOpinion
1 source
ChatGPT Ads Manager : l’outil que vous attendez pour gérer vos campagnes publicitaires ?
213Le Big Data 

ChatGPT Ads Manager : l’outil que vous attendez pour gérer vos campagnes publicitaires ?

OpenAI a lancé en bêta son ChatGPT Ads Manager le 5 mai 2026, ouvrant pour la première fois l'accès à une régie publicitaire en libre-service intégrée directement dans son chatbot. Disponible dès maintenant pour les annonceurs américains, la plateforme permet de créer, piloter et optimiser des campagnes publicitaires qui s'affichent sous les réponses générées par l'IA. OpenAI assure que les annonces n'influencent pas les contenus produits par ChatGPT et que les conversations des utilisateurs ne sont pas transmises aux annonceurs. Cette étape s'inscrit dans une stratégie de monétisation agressive : la société vise 2,5 milliards de dollars de revenus publicitaires pour 2026 et ambitionne d'atteindre 100 milliards de dollars annuels d'ici 2030. Les annonceurs européens peuvent déjà s'inscrire sur liste d'attente. L'enjeu est considérable pour l'industrie publicitaire. Contrairement à Google ou Meta qui s'appuient sur le profilage comportemental des utilisateurs, ChatGPT Ads Manager mise sur un ciblage purement contextuel, ancré dans l'intention de recherche immédiate de l'utilisateur au moment précis où il pose sa question. Pour un annonceur, cela signifie toucher un prospect au moment exact où il exprime un besoin, sans exploiter l'historique personnel ou les données privées. Ce positionnement différenciant pourrait séduire les marques soucieuses de conformité réglementaire, notamment en Europe, tout en offrant un retour sur investissement potentiellement plus ciblé que les formats display classiques. La structure de la plateforme suit la trinité habituelle du marketing digital : campagne, groupes thématiques, annonces finales, avec deux modes d'accès, l'un guidé pour les débutants, l'autre permettant l'import direct de modèles pour les utilisateurs expérimentés. Ce lancement intervient dans un contexte de pression financière croissante sur OpenAI. Faire tourner des serveurs d'IA à grande échelle représente des coûts colossaux, et les abonnements ChatGPT Plus ou Pro ne suffisent pas à couvrir les ambitions de croissance de l'entreprise. En intégrant la publicité, OpenAI suit le chemin tracé par Google avec son moteur de recherche, cherchant à monétiser une audience massive, estimée à plusieurs centaines de millions d'utilisateurs actifs, sans dégrader l'expérience perçue. La viabilité de ce modèle dépendra néanmoins de la tolérance des utilisateurs à la présence de contenus sponsorisés dans un outil qu'ils associent à la neutralité informationnelle, ainsi que de la capacité d'OpenAI à convaincre les régulateurs européens que ce ciblage contextuel respecte bien le RGPD. Les prochains mois, avec l'ouverture annoncée aux marchés hors États-Unis, seront déterminants.

UELes annonceurs européens peuvent s'inscrire sur liste d'attente dès maintenant, mais l'ouverture effective du marché dépendra de la validation par les régulateurs que le ciblage contextuel respecte le RGPD.

💬 Le ciblage contextuel, c'est l'argument qui change tout par rapport à Google ou Meta. Pas de profil comportemental, juste l'intention au moment T, et pour les annonceurs européens qui souffrent du RGPD depuis des années, c'est une vraie bouffée d'air. Le vrai test, c'est pas la technique, c'est la tolérance des utilisateurs à voir des pubs dans un outil qu'ils associent à la neutralité.

BusinessOpinion
1 source
Google I/O 2026 : Gemini 3.5 Flash, Omni (NanoBanana pour la vidéo), Spark (agents en arrière-plan) et Antigravity 2.0
214Latent Space 

Google I/O 2026 : Gemini 3.5 Flash, Omni (NanoBanana pour la vidéo), Spark (agents en arrière-plan) et Antigravity 2.0

Google a profité de sa conférence I/O 2026, tenue les 18 et 19 mai, pour annoncer une salve de nouveautés autour de sa famille Gemini. Le modèle phare de l'événement est Gemini 3.5 Flash, disponible immédiatement sur l'ensemble des surfaces Google, application Gemini, Search, API, AI Studio, Android Studio et environnements enterprise. Ce modèle affiche une fenêtre de contexte d'un million de tokens, une sortie maximale de 65 000 tokens, quatre niveaux de raisonnement configurables (minimal, faible, moyen, élevé) et une fonctionnalité dite de "thought preservation" qui maintient le fil de raisonnement entre les échanges. Selon les benchmarks indépendants d'Artificial Analysis, il obtient un score de 55 sur l'Intelligence Index (soit +9 par rapport à Gemini 3 Flash), dépasse 280 tokens par seconde en sortie, et est tarifé à 1,50 dollar par million de tokens en entrée et 9 dollars en sortie. Sur la plateforme Arena, il atteint la 9e place mondiale en arène textuelle et en code frontend, avec un score Elo de 1 507, en hausse de 70 points. Google annonce également Gemini Omni, une famille multimodale capable de traiter du texte, des images, de la vidéo et de l'audio pour générer et éditer de la vidéo dans Gemini, Flow, YouTube Shorts et, prochainement, via API. L'écosystème agent est complété par Antigravity 2.0 (desktop, CLI, SDK) et Gemini Spark, des agents fonctionnant en arrière-plan sur des machines virtuelles cloud. Ces annonces interviennent alors que Google revendique une échelle sans précédent : 3,2 quadrillions de tokens traités par mois, soit une multiplication par sept en un an (contre 480 billions en 2025), et 900 millions d'utilisateurs mensuels actifs sur l'application Gemini, disponible dans plus de 230 pays et 70 langues. Pour les développeurs et les entreprises, Gemini 3.5 Flash se positionne comme un modèle d'élite pour les tâches agentiques et de codage à haute fréquence, avec une vitesse annoncée quatre fois supérieure aux modèles frontier comparables, et jusqu'à douze fois plus rapide dans l'environnement Antigravity. Sa supériorité sur Gemini 3.1 Pro sur des benchmarks clés comme Terminal-Bench 2.1 et GDPval-AA signifie que Google propose désormais un modèle "Flash" qui surclasse son propre "Pro" de génération précédente, brouillant les frontières traditionnelles entre vitesse et qualité. Google I/O s'inscrit dans un cycle de compétition accélérée entre les grands laboratoires d'IA. OpenAI, Anthropic et Meta ont chacun publié des modèles majeurs au cours des dernières semaines, forçant Google à démontrer sa maîtrise sur le terrain multimodal et agentique. La présentation de lunettes connectées pilotées par Gemini Live rappelle les ambitions de long terme du groupe sur l'IA embarquée, une catégorie où Meta investit massivement avec Ray-Ban. Gemini 3.5 Pro, dont la sortie est prévue le mois prochain, devrait préciser jusqu'où Google entend pousser la frontière de ses modèles. La mise en production immédiate de 3.5 Flash, sans période de bêta, traduit une volonté de reprendre la main sur le rythme de déploiement face à des concurrents qui ont souvent devancé Google sur ce terrain.

UEGemini 3.5 Flash est disponible immédiatement via API pour les développeurs et entreprises européennes, avec une tarification publique et une intégration dans Google Cloud, élargissant l'offre de modèles agentiques accessibles sur le marché européen.

💬 Pas de bêta, déploiement immédiat partout : Google change enfin de méthode. Ce qui m'intéresse vraiment, c'est le Flash qui surclasse maintenant le Pro de génération précédente sur les benchmarks de codage, ça veut dire que leur nomenclature vitesse/qualité ne tient plus. Les chiffres de scale (3,2 quadrillions de tokens par mois), c'est de la com' comme d'hab', mais sur le rythme de mise en prod, là c'est du concret.

Les modèles open source Gemma 4 de Google utilisent le décodage spéculatif pour atteindre jusqu'à 3x plus de rapidité
215Ars Technica AI 

Les modèles open source Gemma 4 de Google utilisent le décodage spéculatif pour atteindre jusqu'à 3x plus de rapidité

Google a lancé ce printemps sa nouvelle gamme de modèles d'IA ouverts, Gemma 4, conçus pour fonctionner en local sur le matériel des utilisateurs. Quelques semaines seulement après ce lancement, l'entreprise publie des modèles auxiliaires appelés "MTP drafters" (drafters à prédiction multi-token), exploitant une technique connue sous le nom de décodage spéculatif. Le principe : ces modèles légers anticipent les prochains tokens avant que le modèle principal ne les génère, ce qui peut accélérer la vitesse de génération jusqu'à trois fois par rapport à une inférence classique. Gemma 4 repose sur la même architecture de base que Gemini, le modèle frontier de Google, mais est optimisé pour tourner sur une seule machine, y compris sur un GPU grand public avec quantification. L'enjeu est considérable pour quiconque veut utiliser des modèles puissants sans dépendre d'un service cloud. En local, les contraintes matérielles sont sévères : bande passante mémoire limitée, absence de clusters de TPUs comme ceux dont dispose Google en interne. Le décodage spéculatif contourne en partie ces goulots d'étranglement en parallélisant une partie du travail d'inférence. Pour les développeurs et chercheurs qui font tourner des modèles sur leur propre infrastructure, un gain de 3x sur la vitesse de génération représente une différence très concrète en termes de productivité et de coût opérationnel. Google a également profité du lancement de Gemma 4 pour changer de licence : exit la licence Gemma propriétaire des versions précédentes, place à l'Apache 2.0, bien plus permissive et appréciée de l'écosystème open source. Ce choix positionne Gemma 4 comme un concurrent direct de Llama de Meta ou des modèles Mistral, dans une course où la liberté d'usage est devenue un argument de poids. Les MTP drafters sont encore présentés comme expérimentaux, mais ils signalent clairement la direction que prend Google : rendre ses modèles ouverts non seulement plus capables, mais aussi plus rapides à exploiter sur du matériel ordinaire.

UELe passage à la licence Apache 2.0 et le gain de vitesse x3 via le décodage spéculatif rendent Gemma 4 directement exploitable par les développeurs et laboratoires européens souhaitant déployer des modèles puissants en local, sans dépendance cloud.

💬 Le décodage spéculatif, ça fait des années qu'on en parle en labo, mais là Google le rend pratique sur un GPU grand public. Le vrai truc de cette annonce, c'est quand même le passage à Apache 2.0, les anciennes licences Gemma c'était de l'open source du dimanche. Reste à voir si le x3 tient en prod réelle, parce que les benchmarks Google ont une tendance connue à se dégonfler un peu.

LLMsActu
1 source
AWS approfondit sa collaboration avec OpenAI pour séduire les grandes entreprises
216Le Big Data 

AWS approfondit sa collaboration avec OpenAI pour séduire les grandes entreprises

Amazon Web Services et OpenAI ont annoncé le 28 avril 2026 un élargissement significatif de leur partenariat, avec l'intégration des derniers modèles d'OpenAI directement dans Amazon Bedrock, la plateforme d'IA managée d'AWS. Concrètement, les entreprises clientes d'AWS peuvent désormais accéder aux modèles OpenAI via les mêmes API et outils que ceux déjà utilisés pour Anthropic, Meta, Mistral AI ou Cohere, sans changer d'environnement ni multiplier les contrats. Dans la foulée, AWS a annoncé le lancement de Codex sur Bedrock, l'agent de développement logiciel d'OpenAI déjà utilisé par plus de 4 millions de personnes chaque semaine, ainsi que le déploiement des Amazon Bedrock Managed Agents, une couche d'orchestration pour automatiser des workflows complexes en production. Pour les grandes organisations, l'enjeu dépasse le simple accès à de nouveaux modèles. Ce qui change concrètement, c'est la possibilité d'utiliser l'IA d'OpenAI sans renoncer aux garanties de sécurité et de conformité d'AWS : gestion des accès via IAM, chiffrement des données, journalisation avec CloudTrail, connectivité sécurisée via PrivateLink. Ces couches de gouvernance, déjà en place pour d'autres modèles Bedrock, s'appliquent désormais aux modèles OpenAI sans reconfiguration. À cela s'ajoute un avantage financier non négligeable : les usages OpenAI peuvent être imputés directement aux engagements cloud AWS existants, évitant la multiplication des fournisseurs et des lignes budgétaires. Pour les directions techniques et achats des grandes entreprises, c'est précisément le type de friction qui bloquait le passage du pilote à la production à grande échelle. Cette annonce s'inscrit dans une compétition acharnée entre les grands clouds pour capter les budgets IA des entreprises. Azure bénéficie depuis plusieurs années d'une exclusivité de fait sur OpenAI via l'investissement de Microsoft, qui détient une participation estimée à plusieurs dizaines de milliards de dollars dans la startup. En ouvrant Bedrock aux modèles OpenAI, AWS brouille cette distinction et positionne sa plateforme comme un guichet unique multi-modèles, où l'entreprise choisit le meilleur outil pour chaque cas d'usage sans dépendre d'un fournisseur unique. Pour OpenAI, l'accord élargit considérablement sa distribution commerciale au-delà de l'écosystème Microsoft, à une clientèle enterprise déjà ancrée dans AWS. Les prochains mois diront si cette convergence accélère l'adoption de Codex dans les équipes de développement, un marché où GitHub Copilot d'Amazon et Microsoft se livrent déjà une bataille directe.

UELes entreprises européennes déjà clientes d'AWS peuvent désormais déployer les modèles OpenAI en production via leur infrastructure cloud existante, avec les couches de conformité AWS déjà en place, supprimant un frein réglementaire majeur à l'adoption à grande échelle.

BusinessOpinion
1 source
Token, compute, dérive des usages : pourquoi l’IA peut coûter plus cher que vos équipes ?
217Le Big Data 

Token, compute, dérive des usages : pourquoi l’IA peut coûter plus cher que vos équipes ?

Dans certaines entreprises, la facture mensuelle liée à l'intelligence artificielle dépasse désormais celle des salaires humains. C'est le constat documenté par Axios dans une enquête publiée fin avril 2026, qui révèle que le coût du traitement des requêtes IA excède, dans certains cas, celui des équipes en chair et en os. Bryan Catanzaro, responsable chez Nvidia, a confirmé le phénomène pour ses propres équipes. Le New York Times rapporte que certains utilisateurs intensifs atteignent plus de 150 000 dollars de dépenses mensuelles en tokens, certains ingénieurs dépensant davantage en usage d'IA qu'ils ne touchent en salaire. Chez Uber, des équipes utilisant des outils comme Claude Code ont déjà épuisé leur budget annuel d'IA bien avant la fin de l'exercice, selon The Information. Le phénomène a même un nom dans les milieux tech : le "tokenmaxxing", pratique où les ingénieurs maximisent délibérément leur consommation de tokens, parfois comme indicateur implicite de performance. Ce glissement remet en cause la promesse fondatrice de l'IA en entreprise : réduire les coûts grâce à l'automatisation. L'équation est plus complexe que prévu. Chaque requête envoyée à un modèle consomme des tokens facturés, et lorsque les agents s'exécutent en parallèle sans supervision directe, les volumes explosent. La structure de coût des entreprises se transforme en profondeur : les dépenses, autrefois fixes et prévisibles via les ressources humaines, deviennent variables, dépendantes de l'usage, et donc difficiles à piloter. Pour les organisations qui n'ont pas mis en place de garde-fous, la dérive peut être rapide. Chez Meta, l'utilisation de l'IA est désormais intégrée dans l'évaluation des performances des employés, ce qui pousse mécaniquement à une consommation accrue. Google et Microsoft adoptent des dynamiques similaires, une grande part du code produit étant déjà générée par des modèles. Cette situation profite directement aux fournisseurs de modèles. OpenAI et Anthropic bénéficient de la hausse de consommation, Anthropic ayant d'ailleurs relevé ses tarifs récemment. Les investisseurs parient sur la capacité des modèles les plus efficaces à capter davantage de clients en offrant un meilleur ratio performance-coût. Du côté des entreprises consommatrices, les réponses restent expérimentales. Jensen Huang, PDG de Nvidia, a évoqué l'idée de distribuer des quotas de tokens aux employés, à l'image d'une enveloppe salariale dédiée à l'IA, ce qui transformerait l'accès à la puissance de calcul en véritable avantage compétitif individuel. Le compute est en passe de devenir une ligne budgétaire stratégique aussi sensible que la masse salariale, obligeant les directions financières à repenser leur manière de gouverner ces outils avant que la facture ne devienne incontrôlable.

UELes entreprises européennes adoptant des agents IA à grande échelle sont exposées aux mêmes dérives budgétaires documentées aux États-Unis, sans cadre de gouvernance des coûts IA encore établi au niveau sectoriel ou réglementaire.

BusinessOpinion
1 source
Le bémol sur le retrait de Benchmark du capital de Manus
218The Information AI 

Le bémol sur le retrait de Benchmark du capital de Manus

Le fonds de capital-risque américain Benchmark a distribué à ses investisseurs les bénéfices de la vente de Butterfly Effect, la startup singapourienne à l'origine de l'agent IA Manus, avant même que les régulateurs chinois ne bloquent la transaction. Meta avait annoncé en décembre 2025 le rachat de cette entreprise pour plus de 2 milliards de dollars. Benchmark avait mené un tour de financement de 75 millions de dollars au printemps 2024, valorisant la startup à environ 500 millions de dollars. La transaction avait été bouclée en fin d'année, et les retours sur investissement ont déjà été redistribués aux limited partners du fonds avant que Pékin n'intervienne cette semaine pour exiger l'annulation de l'opération. Le blocage par les autorités chinoises crée une situation juridique inédite : Meta se retrouve contrainte de se défaire d'un actif qu'elle a déjà acquis, sans pouvoir récupérer facilement les fonds versés aux investisseurs. Frank Aquila, avocat spécialisé en fusions-acquisitions chez Sullivan & Cromwell, qualifie ce scénario de "proche de l'impossible", comparant la situation à vouloir "remettre le génie dans sa bouteille". Ce précédent serait, selon lui, "dangereux" pour toutes les entreprises envisageant des opérations transfrontalières impliquant des capitaux ou des actifs liés à la Chine. Butterfly Effect avait été fondée à Pékin avant de déménager à Singapour, mais cette délocalisation n'a pas suffi à échapper à la juridiction de Pékin sur l'opération. L'investissement initial de Benchmark avait déjà suscité des critiques dans la communauté du capital-risque américain, certains VC estimant qu'il représentait un risque pour la sécurité nationale. L'affaire illustre les tensions croissantes entre les ambitions mondiales des géants technologiques américains et le durcissement du contrôle de Pékin sur les actifs stratégiques liés à l'IA, une dynamique qui risque de compliquer durablement les transactions transatlantiques et transpacifiques dans ce secteur.

UELes entreprises et fonds d'investissement européens actifs dans des opérations transnationales impliquant des actifs IA liés à la Chine sont exposés au même risque de blocage réglementaire par Pékin, menaçant la sécurité juridique des transactions transfrontalières dans le secteur IA.

BusinessOpinion
1 source
DeepSeek : dernière avancée en IA et la course aux modèles du monde
219MIT Technology Review 

DeepSeek : dernière avancée en IA et la course aux modèles du monde

La firme chinoise DeepSeek a publié vendredi un aperçu de son nouveau modèle phare, V4, suscitant immédiatement l'attention de l'industrie. Cette version se distingue par sa capacité à traiter des contextes bien plus longs que la génération précédente, grâce à une architecture repensée pour gérer de grands volumes de texte avec une meilleure efficacité. Malgré son statut open source, ses performances se mesurent à celles des modèles propriétaires d'Anthropic, d'OpenAI et de Google. Point stratégique notable : V4 est la première release de DeepSeek optimisée pour les puces Ascend de Huawei, signalant un test grandeur nature de la capacité de la Chine à réduire sa dépendance aux GPU Nvidia. Dans le même temps, Google a annoncé un investissement pouvant atteindre 40 milliards de dollars dans Anthropic, dans une opération valorisant la startup à 350 milliards de dollars, signe que la course au calcul et aux modèles de pointe s'accélère des deux côtés du Pacifique. Ces annonces s'inscrivent dans une semaine marquée par des enjeux géopolitiques et industriels majeurs. La Chine a bloqué le projet de rachat par Meta du studio d'IA Manus pour 2 milliards de dollars, invoquant des raisons de sécurité nationale et qualifiant l'opération de tentative "conspiratrice" de vider la base technologique chinoise. Washington réplique en maintenant ses contrôles à l'exportation sur les puces avancées, tandis que le président Trump a licencié l'ensemble du National Science Board, suscitant des craintes sur l'interférence politique dans la recherche fondamentale américaine. Sur le plan économique, la pression sur les capacités de calcul commence à peser sur des secteurs entiers : emplois, prix de l'électricité et marchés de composants sont tous affectés par l'explosion de la demande en infrastructure IA. En parallèle, un autre front s'ouvre dans la recherche fondamentale : celui des "world models", ces systèmes capables de modéliser le monde physique plutôt que le seul domaine textuel. Des figures comme la professeure de Stanford Fei-Fei Li et Yann LeCun, fondateur d'AMI Labs, défendent l'idée que ces modèles sont indispensables pour dépasser les limites connues des grands modèles de langage et permettre de véritables avancées en robotique. Composer un roman ou générer du code reste infiniment plus simple pour une machine que de plier du linge ou naviguer dans une rue bondée ; les world models ambitionnent de combler cet écart. Ce sujet figure en tête de la liste des dix technologies prioritaires établie par le MIT Technology Review, signe que l'industrie considère désormais cette direction comme l'un des prochains fronts décisifs de l'intelligence artificielle.

UEL'optimisation de DeepSeek V4 sur les puces Huawei Ascend offre aux entreprises européennes une alternative open source aux modèles propriétaires américains, tandis que l'escalade de la guerre technologique sino-américaine sur les puces et les contrôles à l'exportation contraint l'Europe à clarifier son positionnement stratégique dans la course mondiale à l'IA.

LLMsActu
1 source
Les rumeurs disaient vrai : OpenAI lâche GPT-5.5, et ça change pas mal de choses
220Le Big Data 

Les rumeurs disaient vrai : OpenAI lâche GPT-5.5, et ça change pas mal de choses

OpenAI a officiellement lancé GPT-5.5 le 23 avril 2026, confirmant ainsi les rumeurs qui circulaient depuis plusieurs jours. Sam Altman a annoncé le modèle directement sur X, déclarant simplement qu'il "l'apprécie beaucoup", une formulation sobre pour un lancement que l'entreprise présente comme un véritable saut technologique. Le modèle est immédiatement disponible dans ChatGPT pour les abonnés Plus, Pro et Business sous la dénomination GPT-5.5 Thinking, avec une version GPT-5.5 Pro réservée aux traitements de données massifs exigeant une précision maximale. Les développeurs accédant via Codex bénéficient quant à eux d'une fenêtre de contexte de 400 000 tokens, suffisante pour ingérer des projets entiers en une seule passe. Ce qui distingue fondamentalement GPT-5.5 de ses prédécesseurs, c'est son autonomie opérationnelle. Là où les modèles précédents attendaient une instruction à chaque étape, celui-ci est conçu pour piloter des tâches complexes de bout en bout, en analysant, planifiant et utilisant les logiciels disponibles sans intervention humaine continue. En développement logiciel, cela se traduit concrètement par une capacité à résoudre des projets GitHub entiers en une seule passe, à déboguer de manière autonome en identifiant l'origine d'une faille là où un développeur passerait plusieurs heures, et à anticiper les effets de bord sur le reste du système. L'enthousiasme dans l'industrie est tel qu'un ingénieur chez NVIDIA a comparé l'idée de perdre l'accès au modèle à une amputation physique. Parallèlement, GPT-5.5 maintient une latence comparable à GPT-5.4 tout en consommant moins de tokens pour produire des résultats de meilleure qualité, ce qui améliore directement l'équation coût-performance pour les usages intensifs. Ce lancement s'inscrit dans une course à l'IA générative où chaque acteur cherche à franchir le palier de l'agent autonome, capable d'agir sur un ordinateur plutôt que de simplement répondre à des questions. OpenAI positionnne GPT-5.5 explicitement comme une "nouvelle classe d'intelligence pour le travail réel", ce qui signale un pivot stratégique vers les cas d'usage professionnels et les pipelines agentiques, au détriment du chatbot conversationnel grand public. Google, Anthropic et Meta s'engagent sur le même terrain avec leurs propres modèles capables d'utiliser des outils et d'exécuter des tâches multi-étapes. La disponibilité immédiate dans Codex suggère qu'OpenAI mise sur les développeurs comme vecteur d'adoption prioritaire, une population qui teste vite, publie ses benchmarks et influence ensuite les décisions d'achat des entreprises. La prochaine étape logique sera l'intégration plus profonde dans des environnements d'entreprise, avec des questions de sécurité, de traçabilité et de gouvernance que GPT-5.5 n'adresse pas encore publiquement.

UELes développeurs et entreprises européens utilisant l'API OpenAI via Codex peuvent immédiatement tester les capacités agentiques de GPT-5.5, ce qui soulève des questions de gouvernance et de traçabilité directement pertinentes dans le contexte du règlement européen sur l'IA.

LLMsOpinion
1 source
CoreWeave a convaincu les marchés obligataires
221The Information AI 

CoreWeave a convaincu les marchés obligataires

En l'espace de quelques semaines d'avril 2026, CoreWeave a levé près de 16 milliards de dollars auprès d'une diversité d'investisseurs rarement vue pour une entreprise technologique. Le 31 mars, la société a bouclé une facilité de crédit de 8,5 milliards de dollars adossée à ses propres processeurs graphiques Nvidia. Le 9 avril, elle a élargi un contrat existant avec Meta Platforms à 21 milliards de dollars pour la fourniture de capacités de calcul. Elle a ensuite émis 1,25 milliard de dollars d'obligations à haut rendement et 3 milliards en titres convertibles, des opérations rapidement augmentées d'un milliard supplémentaire. Dans la foulée, Anthropic a annoncé son arrivée comme nouveau client. La semaine suivante, CoreWeave a placé encore un milliard d'obligations sans même organiser de tournée de présentation auprès des investisseurs. Au milieu de tout cela, la firme de trading Jane Street a investi 1 milliard de dollars dans CoreWeave et s'est engagée à dépenser 6 milliards en services cloud IA sur la plateforme. Le titre de l'entreprise a progressé de 55 % sur le mois. Ce niveau de financement reflète un changement de posture profond chez les investisseurs obligataires, traditionnellement prudents vis-à-vis des entreprises technologiques. Ces acteurs ont longtemps boudé le secteur, jugé trop risqué, et avaient manifesté leur inquiétude l'an dernier face à la vague d'endettement d'Oracle et d'autres constructeurs d'infrastructures IA. Désormais, la demande massive et les engagements fermes de géants comme Meta suffisent à rassurer des fonds tels que Janus Henderson Investors, dont le responsable de la recherche crédit Mike Talaga résume la position : "Nous acceptons le risque de construction parce que la demande est là." Pour les investisseurs, CoreWeave représente un levier direct sur le succès de l'IA, avec une capacité démontrée à livrer de la puissance de calcul et à convaincre ses clients d'en commander davantage. L'entrée de Jane Street, acteur financier et non développeur d'IA, signale en outre que l'appétit pour ces services dépasse désormais le cercle des pure players technologiques. La trajectoire de CoreWeave s'inscrit dans une course effrénée à l'infrastructure déclenchée par les progrès rapides de l'IA générative. La pénurie de capacités de calcul a transformé les fournisseurs de cloud spécialisés en acteurs incontournables du secteur. CoreWeave cherche à consolider son avance en enrichissant son offre de logiciels et de services pour fidéliser ses clients. Nick Robbins, vice-président en charge du développement corporate, reconnaît cependant que l'ère actuelle est "celle de la croyance plutôt que du scepticisme." Cette dynamique pourrait s'emballer à court terme, mais elle comporte des risques systémiques : contrairement aux marchés actions, une turbulence dans l'obligataire peut freiner le crédit à l'échelle de l'économie entière, et de lourdes pertes futures dans ce compartiment pourraient se propager bien au-delà du seul secteur IA.

BusinessOpinion
1 source
222MarkTechPost 

Guide de programmation complet pour exécuter les modèles open-weight GPT d'OpenAI avec des workflows d'inférence avancés

OpenAI a publié une version open-weight de ses modèles GPT sous l'identifiant openai/gpt-oss-20b, un modèle de 20 milliards de paramètres téléchargeable depuis HuggingFace et exécutable localement via la bibliothèque Transformers. Un guide technique détaillé, publié récemment, explique comment déployer ce modèle dans Google Colab en s'appuyant sur la quantification native MXFP4, les activations en torch.bfloat16, et le système devicemap="auto" pour l'allocation GPU automatique. Le modèle pèse environ 40 Go en téléchargement et nécessite au minimum 16 Go de VRAM, ce qui impose l'usage d'un GPU de type T4 ou A100, disponibles sur Colab Pro. Le tutoriel couvre l'installation des dépendances précises (Transformers 4.51+, accelerate, sentencepiece), le chargement du modèle avec trustremote_code=True, puis l'exécution de workflows complets : génération structurée, streaming, dialogue multi-tours, appel d'outils et inférence en batch. La mise à disposition de ce modèle en open-weight représente un changement significatif pour les développeurs et chercheurs qui souhaitent inspecter, modifier ou déployer un LLM de la famille GPT sans dépendre de l'API d'OpenAI. Contrairement aux modèles hébergés, gpt-oss-20b offre une transparence totale sur l'architecture, un contrôle complet des paramètres d'inférence (température, topp, longueur de séquence), et la possibilité d'exécution hors ligne sur infrastructure privée. Pour les entreprises soumises à des contraintes de confidentialité des données, ou pour les équipes de recherche qui ont besoin de reproductibilité, c'est une alternative concrète aux API fermées. Le guide recommande d'ailleurs les paramètres temperature=1.0 et topp=1.0 pour reproduire le comportement officiel du modèle. Ce mouvement s'inscrit dans une dynamique plus large de publication de modèles open-weight par les grands laboratoires : Meta avec Llama, Mistral AI avec ses modèles libres, ou encore Google avec Gemma. OpenAI, longtemps perçu comme le plus fermé des acteurs majeurs, adopte ici une stratégie différente en libérant un modèle intermédiaire techniquement capable. La compatibilité avec l'écosystème HuggingFace et Transformers facilite l'adoption immédiate par la communauté. Les prochaines étapes pourraient inclure des fine-tunings spécialisés par la communauté, des déploiements sur hardware grand public via des solutions comme llama.cpp ou Ollama, et une évaluation comparative approfondie face à Llama 3 ou Mistral Large, ce qui permettra de situer précisément gpt-oss-20b dans le paysage des modèles ouverts.

UELes équipes européennes soumises au RGPD peuvent désormais déployer un modèle de la famille GPT en infrastructure privée, sans transférer de données vers les serveurs d'OpenAI.

💬 OpenAI qui lâche un open-weight, ça faisait longtemps qu'on en parlait sans y croire. 20 milliards de paramètres, compatible HuggingFace, déployable sur ta propre infra, c'est exactement ce que réclamaient les équipes sous RGPD depuis des mois. Reste à voir si ça tient face à Llama 3 une fois les benchmarks sérieux posés.

LLMsTuto
1 source
223Le Big Data 

NVIDIA Vera : quand le CPU devient le cerveau de l’IA autonome

Le 16 mars 2026, lors de la conférence GTC 2026, Jensen Huang a présenté le processeur CPU Vera, une puce conçue spécifiquement pour l'intelligence artificielle agentique. Architecturé autour de la plateforme Olympus, Vera embarque 88 cœurs personnalisés basés sur la technologie ARM Neoverse, une mémoire SOCAMM en LPDDR6 atteignant une bande passante de 1,2 To/s, et une conception monolithique qui réduit la latence interne au minimum physiquement possible. Contrairement aux GPU Blackwell et Rubin qui gèrent le traitement parallèle massif, Vera prend en charge l'exécution séquentielle et logique : la planification, la vérification, l'enchaînement de décisions. Sa capacité à manipuler des contextes de plusieurs millions de tokens en temps réel en fait un composant radicalement différent des processeurs x86 traditionnels, jugés trop lents pour les exigences actuelles de l'IA. L'enjeu est fondamental pour toute entreprise qui cherche à déployer des agents IA dans des workflows réels. Jusqu'ici, les systèmes d'IA buttaient sur le goulot d'étranglement du raisonnement séquentiel : générer du texte rapidement ne suffit pas pour gérer du code complexe, de la logistique ou de la prise de décision multi-étapes. Vera permet à l'IA de passer d'un outil passif à un collaborateur capable d'orchestrer des tâches sur la durée, de corriger ses propres erreurs et d'enchaîner des raisonnements structurés sans latence perceptible. Pour les développeurs et les entreprises, cela ouvre concrètement la voie à des agents autonomes opérationnels dans des environnements de production exigeants, là où les solutions actuelles restent trop fragiles ou trop lentes. Cette annonce s'inscrit dans une accélération que NVIDIA pilote depuis plusieurs années en construisant une pile matérielle complète pour l'IA. Après avoir dominé l'entraînement des modèles avec ses GPU, puis l'inférence avec la gamme Blackwell, l'entreprise complète aujourd'hui l'architecture avec un CPU qui lui est propre, réduisant sa dépendance aux processeurs Intel et AMD pour les charges de travail IA. Le concept rappelle la distinction cognitive entre Système 1 (rapide, instinctif) et Système 2 (analytique, délibéré) : les GPU couvrent le premier, Vera prend en charge le second. Si l'adoption suit, NVIDIA pourrait imposer une architecture propriétaire de bout en bout pour les data centers orientés agents, ce qui renforcerait encore davantage sa position dominante dans l'infrastructure de l'IA mondiale au moment où la course aux systèmes autonomes s'intensifie chez Google, Microsoft et Meta.

UELes opérateurs de data centers européens déployant des agents IA devront évaluer une migration vers cette architecture propriétaire NVIDIA pour contourner les goulots d'étranglement du raisonnement séquentiel.

💬 Le goulot d'étranglement du raisonnement séquentiel, c'est le truc qui fait ramer les agents en prod depuis 2 ans, et Vera s'attaque frontalement à ça. La distinction Système 1/Système 2 appliquée au silicium, c'est bien vu, pas juste du marketing. Le revers, c'est que si t'as besoin de Vera pour que tes agents tournent vraiment, t'achètes le stack NVIDIA complet, de bout en bout, et ils le savent.

InfrastructureOpinion
1 source
224The Verge AI 

Anthropic lance un nouveau modèle Opus dans l'effervescence de la préversion Mythos

Anthropic a lancé Claude Opus 4.7, son modèle grand public le plus puissant à ce jour, disponible dès maintenant via l'API et les interfaces Claude. L'entreprise le positionne comme une progression significative par rapport à Opus 4.6, notamment pour les tâches d'ingénierie logicielle avancées et les scénarios de codage complexes qui nécessitaient auparavant davantage d'intervention humaine. Opus 4.7 apporte également des améliorations en analyse d'images, en suivi d'instructions, et se montre plus créatif dans la génération de présentations et de documents. Ce lancement consolide la position d'Anthropic dans la course aux modèles de pointe, en offrant aux développeurs et entreprises un outil plus autonome pour les projets techniques ambitieux. La réduction du besoin de supervision humaine dans le codage complexe représente un gain concret de productivité pour les équipes d'ingénierie, et les progrès en compréhension visuelle élargissent les cas d'usage possibles dans l'analyse de données et la création de contenu. Ce lancement intervient quelques jours seulement après l'annonce de Mythos Preview, un modèle spécialisé en cybersécurité qu'Anthropic présente comme son modèle le plus puissant toutes catégories confondues. La distinction entre les deux est notable : Mythos cible des usages très spécifiques dans la sécurité informatique, tandis qu'Opus 4.7 vise le grand public des utilisateurs professionnels. Anthropic multiplie ainsi les lancements sur un marché où OpenAI, Google et Meta maintiennent une pression constante, et cette stratégie de segmentation par usage pourrait devenir une tendance durable dans l'industrie.

UELes développeurs et entreprises européens peuvent accéder immédiatement à Opus 4.7 via l'API, avec des gains de productivité concrets pour les équipes d'ingénierie sur des tâches de codage complexe.

OpenAI tacle Microsoft : l’alliance avec Amazon devient la nouvelle priorité stratégique
225Le Big Data 

OpenAI tacle Microsoft : l’alliance avec Amazon devient la nouvelle priorité stratégique

OpenAI vient de franchir une étape symbolique dans sa stratégie commerciale : selon une note interne de Denise Dresser, directrice des revenus de l'entreprise, le partenariat signé avec Amazon représente désormais un moteur de croissance prioritaire pour le segment enterprise. Ce partenariat, annoncé il y a moins de deux mois et adossé à un engagement financier d'Amazon de 50 milliards de dollars, s'appuie sur AWS Bedrock, la plateforme cloud qui permet aux entreprises d'accéder à plusieurs modèles d'IA dont ceux d'OpenAI. Dans la même note, Dresser reconnaît explicitement que l'alliance historique avec Microsoft, qui a investi plus de 13 milliards de dollars depuis 2019, « restreint » désormais la capacité d'OpenAI à répondre aux besoins du marché. Le segment enterprise représente déjà 40 % du chiffre d'affaires d'OpenAI, et la demande enregistrée depuis l'intégration via Bedrock est décrite comme « stupéfiante ». Ce pivotement stratégique a des conséquences directes pour les clients entreprises et pour l'ensemble de l'industrie cloud. En permettant l'accès à ses modèles via AWS plutôt qu'exclusivement via Azure, OpenAI s'aligne sur les infrastructures déjà en place chez la majorité de ses clients B2B, levant ainsi un frein concret à l'adoption. La flexibilité offerte par Bedrock, présentée comme une couche d'accès plus ouverte que l'écosystème Microsoft, répond à une demande réelle du marché. Pour OpenAI, l'enjeu est aussi défensif : Anthropic, avec son modèle Claude, a enregistré un chiffre d'affaires annualisé supérieur à 30 milliards de dollars et gagne rapidement du terrain dans les entreprises, au point d'avoir généré ce qu'on a appelé la « Claudemania » lors de la conférence HumanX à San Francisco. La relation entre OpenAI et Microsoft se dégrade donc progressivement depuis mi-2024, date à laquelle Microsoft a officiellement classé OpenAI parmi ses concurrents dans son rapport annuel, aux côtés d'Amazon, Google et Meta. Redmond développe en parallèle ses propres modèles d'IA et renforce Copilot, réduisant mécaniquement sa dépendance à son ancien partenaire exclusif. OpenAI, de son côté, diversifie déjà ses fournisseurs de calcul vers Oracle, Google et CoreWeave. Ce décroisement progressif dessine une nouvelle carte du pouvoir dans l'IA enterprise : des alliances moins exclusives, plus pragmatiques, dictées par la présence réelle des clients dans les écosystèmes cloud. La bataille pour le marché B2B de l'IA n'en est qu'à ses débuts, et chaque géant repositionne ses pièces en conséquence.

UELes entreprises européennes déjà hébergées sur AWS peuvent désormais accéder aux modèles OpenAI via Bedrock sans migration vers Azure, réduisant concrètement le frein à l'adoption de l'IA dans les environnements cloud existants.

💬 Microsoft a mis 13 milliards sur la table depuis 2019 et se retrouve aujourd'hui listé comme concurrent dans les rapports annuels d'OpenAI, c'est assez symptomatique de la vitesse à laquelle les alliances se déconstruisent dans ce secteur. Le fond du sujet, c'est que les clients enterprise sont déjà sur AWS, pas sur Azure, et OpenAI a visiblement décidé d'aller là où se trouvent les deals plutôt que de défendre une exclusivité qui lui coûte des contrats. La pression de Claude en arrière-plan accélère tout ça.

BusinessOpinion
1 source
Sauver la France et l’Europe face à l’IA : Mistral AI pousse 22 mesures d’urgence
226Le Big Data 

Sauver la France et l’Europe face à l’IA : Mistral AI pousse 22 mesures d’urgence

Mistral AI, la licorne française valorisée 11,7 milliards d'euros, a publié un document détaillant 22 mesures d'urgence pour permettre à l'Europe de ne pas se laisser distancer par les États-Unis et la Chine dans la course à l'intelligence artificielle. Parmi les propositions phares figure la création d'une "AI blue card", un titre de séjour simplifié inspiré de la carte bleue européenne, destiné à faciliter l'installation de chercheurs et développeurs étrangers sur le continent. L'entreprise appelle également à instaurer une préférence européenne dans les marchés publics, à introduire des incitations fiscales pour l'adoption d'infrastructures locales, et à centraliser les oeuvres du domaine public afin d'alimenter l'entraînement des modèles d'IA sans dépendre des plateformes étrangères. Pour donner corps à sa vision, Mistral AI a levé 830 millions de dollars de dette, destinés notamment à la construction d'un centre de données en France, avec un objectif de plus d'un milliard d'euros de chiffre d'affaires d'ici 2026. Ces propositions s'attaquent à un déséquilibre structurel documenté : sur 1 400 milliards de dollars investis dans le numérique à l'échelle mondiale, 80 % sont captés par les États-Unis. L'Europe dispose des talents et d'une capacité de financement, mais peine à organiser un marché cohérent qui permette à ses acteurs de rivaliser. Si les mesures proposées par Mistral étaient adoptées, elles changeraient concrètement les règles du jeu pour les entreprises et administrations européennes, qui seraient incitées à privilégier des solutions locales plutôt que de s'appuyer sur AWS, Azure ou Google Cloud. Pour les chercheurs étrangers, la "AI blue card" représenterait un signal fort que l'Europe entend sérieusement concurrencer la Silicon Valley en matière d'attractivité. Ces propositions s'inscrivent dans un contexte de prise de conscience accélérée sur la souveraineté technologique en Europe. OpenAI elle-même a publié récemment 13 pages de recommandations sur l'encadrement de l'automatisation, signe que les grands acteurs cherchent à peser sur les débats réglementaires avant que les gouvernements ne tranchent. Mistral, fondée en 2023 par d'anciens chercheurs de DeepMind et Meta, s'est rapidement imposée comme le champion européen de l'IA générative, avec des modèles open source compétitifs face aux offres américaines. En publiant ce plan en 22 points, la startup sort d'une posture purement technique pour entrer dans le débat politique et industriel, à un moment où la Commission européenne et les États membres cherchent encore leur doctrine face à la montée en puissance des grands modèles. Les prochains mois seront décisifs : si ces mesures trouvent un écho à Bruxelles ou à Paris, elles pourraient redéfinir les conditions dans lesquelles se développe l'IA en Europe.

UEMistral AI, licorne française, propose 22 mesures concrètes, préférence européenne dans les marchés publics, 'AI blue card' pour les talents étrangers, incitations fiscales pour l'infrastructure locale, qui pourraient redéfinir les règles du jeu pour les entreprises et administrations françaises et européennes.

RégulationReglementation
1 source
On est dans Black Mirror ? Google va cloner tous les YouTubers avec l’IA
227Le Big Data 

On est dans Black Mirror ? Google va cloner tous les YouTubers avec l’IA

Google vient de déployer sur YouTube une fonctionnalité permettant aux créateurs de contenu de générer un avatar numérique à partir d'un simple selfie et d'un enregistrement vocal. Le système produit une réplique photoréaliste capable d'apparaître dans des vidéos YouTube Shorts, à partir d'une consigne écrite. La génération produit des séquences de huit secondes. Pour l'instant, l'accès est réservé aux adultes titulaires d'un compte. Google recommande un éclairage soigné et un environnement silencieux pour obtenir un résultat convaincant. Chaque clip généré est marqué avec SynthID, le filigrane numérique de Google, et porte une étiquette visible signalant l'origine artificielle du contenu. La plateforme s'appuie également sur le standard de certification C2PA pour garantir la traçabilité. Les créateurs conservent le contrôle sur leur avatar : ils peuvent le supprimer à tout moment, et les données sont effacées automatiquement après trois ans d'inactivité. La suppression d'une vidéo générée ne supprime toutefois pas le fichier source original stocké dans le compte. Cette innovation ouvre une brèche concrète dans les habitudes de production vidéo. Un créateur peut désormais publier du contenu sans tourner une seule prise de vue réelle, ce qui réduit les contraintes matérielles et de temps liées au tournage. Pour les YouTubers prolifiques ou ceux qui peinent à maintenir un rythme régulier de publication, l'outil représente un gain opérationnel significatif. Mais la technologie soulève aussi des questions de fond : si n'importe quel visage peut être reproduit avec un simple enregistrement, les risques de détournement ou d'usurpation d'identité numérique deviennent concrets. Les mécanismes de protection mis en place par Google, aussi sérieux soient-ils, reposent sur une infrastructure technique que les utilisateurs ne contrôlent pas entièrement. La saturation du flux de contenu constitue un autre effet collatéral probable : si la production d'une vidéo ne demande plus qu'une ligne de texte, le volume de contenus disponibles pourrait augmenter de façon spectaculaire, rendant la découvrabilité encore plus difficile pour les créateurs indépendants. Cette annonce s'inscrit dans une stratégie d'intégration accélérée de l'IA générative au sein de l'écosystème YouTube. Google avait déjà introduit des carrousels générés par IA dans les résultats de recherche, des outils de mise à l'échelle automatique pour améliorer les vidéos basse résolution, et des fonctions d'édition automatisée. La concurrence s'intensifie avec des plateformes comme TikTok ou Meta qui investissent également dans les avatars synthétiques et les outils de création assistée. La question des droits à l'image dans un environnement où le clonage devient accessible au grand public reste largement ouverte sur le plan juridique, notamment en Europe où le RGPD impose des contraintes strictes sur le traitement des données biométriques. YouTube se retrouve ainsi à l'avant-garde d'un débat qui dépasse le simple outil créatif.

UELe déploiement de cette fonctionnalité de clonage biométrique soulève des questions juridiques directes en Europe, où le RGPD impose des contraintes strictes sur le traitement des données biométriques, ce qui pourrait limiter ou retarder sa disponibilité pour les créateurs européens.

CréationOutil
1 source
228Ben's Bites 

Anthropic a développé un modèle trop dangereux pour être publié

Anthropic a développé un nouveau modèle d'intelligence artificielle, baptisé Claude Mythos, dont les performances dépassent largement celles de son prédécesseur Opus 4.6 : le taux de réussite sur SWE-bench Pro bondit de 53,4 % à 77,8 %, et sur Terminal-Bench 2.0 de 65,4 % à 82 %. Mais Mythos ne sera pas mis à disposition du grand public, du moins pas dans l'immédiat. La raison est aussi simple qu'alarmante : le modèle s'est révélé exceptionnellement efficace pour détecter et exploiter des failles de sécurité logicielle. Là où Opus 4.6 parvenait à générer 2 exploits fonctionnels sur Firefox après des centaines de tentatives, Mythos en a produit 181. Il a également identifié des vulnérabilités vieilles de plusieurs décennies dans des projets critiques comme OpenBSD (un bug datant de 27 ans) et FFmpeg (16 ans). Plutôt que de le commercialiser, Anthropic a choisi de le confier à 12 entreprises partenaires dans le cadre du projet "Glasswing", accompagné d'un engagement de 100 millions de dollars en crédits d'utilisation et de 4 millions de dollars de dons à des organisations de sécurité open source. La décision de ne pas publier Mythos illustre un tournant dans la gestion des risques liés à l'IA : un modèle peut être trop capable pour être diffusé librement. Si des outils aussi puissants tombaient entre de mauvaises mains, ils pourraient être utilisés pour compromettre des infrastructures critiques à grande échelle, exploiter des failles ignorées depuis des décennies dans des logiciels massivement déployés. En orientant les capacités de Mythos vers la recherche défensive, Anthropic tente de transformer une menace potentielle en atout pour la sécurité informatique mondiale. Pour les entreprises partenaires de Glasswing, l'accès anticipé représente aussi un avantage concurrentiel considérable dans la course à la détection de vulnérabilités. Ce lancement intervient dans un contexte de forte concurrence entre les acteurs de l'IA de pointe. Selon une synthèse récente d'Ethan Mollick, Google, OpenAI et Anthropic dominent clairement le segment frontier, tandis que Meta fait une entrée remarquée avec son modèle Muse Spark, positionné entre Sonnet 4.6 et Opus 4.6, sans accès API encore disponible mais avec des promesses d'open source. xAI, en revanche, semble avoir décroché du peloton de tête, et les meilleurs modèles chinois accuseraient encore sept à neuf mois de retard. Mythos, décrit par certains observateurs comme "ce qu'Opus est à Sonnet, mais en plus puissant encore", marque une accélération qui pousse Anthropic à repenser ses propres critères de diffusion. La question qui s'ouvre désormais est celle du cadre réglementaire et éthique capable d'encadrer des modèles dont les capacités offensives dépassent ce que les institutions de sécurité sont prêtes à absorber.

UEL'émergence de modèles aux capacités offensives jugées trop dangereuses pour être diffusées publiquement accentue la pression sur l'UE pour adapter l'AI Act à des mécanismes de rétention préventive et d'audit des modèles frontier.

SécuritéOpinion
1 source
Une startup crée un logiciel de gestion de code pour les adeptes du tokenmaxxing
229The Information AI 

Une startup crée un logiciel de gestion de code pour les adeptes du tokenmaxxing

GitButler, une startup berlinoise spécialisée dans la gestion de code, vient de lever 17 millions de dollars lors d'un tour de table de série A mené par Andreessen Horowitz. L'opération inclut également les investisseurs existants A.Capital Ventures et Fly Ventures. L'annonce a été faite par Scott Chacon, PDG de l'entreprise, qu'il a cofondée il y a trois ans avec les entrepreneurs Anne Leuschner et Kiril Videlov. Le logiciel de GitButler vise à faciliter la coordination entre développeurs humains et agents de codage IA, en modernisant les outils de gestion de versions qui existent depuis plusieurs décennies. Cette levée de fonds s'inscrit dans un contexte où les entreprises technologiques poussent leurs équipes à utiliser massivement l'IA pour écrire du code. Meta, notamment, a vu émerger en interne un classement informel mesurant quels ingénieurs consomment le plus de tokens IA, une pratique baptisée "tokenmaxxing". Cette course à l'utilisation de l'IA génère une demande croissante pour des outils capables d'organiser, de tracer et de superviser le code produit par ces agents, qui travaillent en parallèle des développeurs humains et à un rythme que les systèmes traditionnels de contrôle de versions peinent à suivre. Les outils de versioning classiques comme Git ont été conçus pour un flux de travail entièrement humain, où les modifications sont soumises de façon réfléchie et espacée. L'irruption d'agents IA capables de générer des milliers de lignes de code en continu bouscule ces paradigmes établis. GitButler parie que ce changement structurel crée un nouveau marché pour des couches logicielles intermédiaires entre les agents et les dépôts de code. Avec le soutien d'Andreessen Horowitz, l'un des fonds les plus influents de la Silicon Valley, la startup dispose désormais des ressources pour s'imposer dans cet espace encore peu défriché, à mesure que le "tokenmaxxing" se généralise au-delà de Meta.

UEGitButler, startup berlinoise, s'impose comme acteur européen des outils de développement IA avec ce financement d'Andreessen Horowitz, renforçant l'écosystème tech allemand face à la Silicon Valley.

💬 Le tokenmaxxing chez Meta, c'est le genre d'anecdote qui te dit que l'époque a vraiment changé, et moi je la crois. Git a 20 ans, il n'a jamais été conçu pour des agents qui crachent du code en continu, le tuyau est trop étroit. GitButler parie sur la bonne couche au bon moment, avec 17M et a16z dans le dos, reste à voir si la prod suit.

OutilsActu
1 source
Cloudflare et GoDaddy s’allient pour permettre aux sites de bloquer les bots IA
230Siècle Digital 

Cloudflare et GoDaddy s’allient pour permettre aux sites de bloquer les bots IA

Cloudflare et GoDaddy ont annoncé un partenariat visant à donner aux propriétaires de sites web un contrôle direct sur les robots d'intelligence artificielle qui explorent leurs pages. Concrètement, GoDaddy va intégrer l'outil AI Crawl Control de Cloudflare dans sa plateforme d'hébergement, utilisée par des millions de sites à travers le monde. Via un tableau de bord simplifié, les propriétaires pourront autoriser ou bloquer individuellement les crawlers des grands modèles d'IA, ceux d'OpenAI, Anthropic, Google, Meta ou d'autres acteurs, sans avoir à modifier manuellement leur fichier robots.txt. L'enjeu est considérable pour les créateurs de contenu, éditeurs et développeurs indépendants qui voient leurs textes, images et données aspirés massivement par des entreprises d'IA sans consentement ni compensation. Ce type d'outil leur restitue une capacité de négociation concrète : bloquer certains acteurs, en autoriser d'autres, voire conditionner l'accès à des accords commerciaux. Pour l'industrie, c'est un signal fort que la question du droit à l'extraction de données web entre dans une phase de normalisation technique. Ce partenariat s'inscrit dans un contexte de tension croissante entre les éditeurs de contenu et les entreprises d'IA générative. Plusieurs procès sont en cours, notamment contre OpenAI et Google, pour utilisation non autorisée de contenus protégés dans l'entraînement de modèles. Cloudflare, qui traite une part massive du trafic internet mondial, se positionne ainsi comme un acteur clé de la gouvernance du web à l'ère de l'IA, aux côtés de partenaires comme GoDaddy dont la base d'utilisateurs garantit une adoption rapide et large.

UELes éditeurs et créateurs de contenu européens hébergés chez GoDaddy disposent désormais d'un outil concret pour bloquer individuellement les crawlers IA, ce qui renforce leur position dans les débats européens sur le droit d'auteur et l'extraction de données encadrée par l'AI Act.

OutilsActu
1 source
Microsoft publie un toolkit open source pour sécuriser les agents IA en production
231AI News 

Microsoft publie un toolkit open source pour sécuriser les agents IA en production

Microsoft a publié un toolkit open-source destiné à sécuriser les agents d'intelligence artificielle en temps réel au sein des environnements d'entreprise. Baptisé runtime security toolkit, cet outil s'intercale entre le modèle de langage et le réseau d'entreprise pour surveiller, évaluer et bloquer les actions des agents autonomes au moment précis où ils tentent de les exécuter. Concrètement, lorsqu'un agent IA déclenche un appel vers un outil externe, une base de données, un pipeline CI/CD ou un dépôt cloud, le toolkit intercepte la requête, la compare à un ensemble de règles de gouvernance centralisées, et bloque l'action si elle enfreint la politique définie. Un agent autorisé uniquement à consulter un inventaire qui tenterait de passer une commande d'achat se verrait immédiatement arrêté, et l'événement serait journalisé pour révision humaine. L'enjeu est considérable pour les équipes de sécurité et les développeurs. Les systèmes d'IA d'entreprise ne se contentent plus de répondre à des questions : ils exécutent du code, envoient des e-mails, modifient des fichiers et interagissent avec des API critiques sans intervention humaine directe. Les méthodes traditionnelles, analyse statique du code, scan de vulnérabilités avant déploiement, sont structurellement inadaptées aux modèles de langage non-déterministes. Une seule attaque par injection de prompt ou une hallucination mal orientée peut suffire à écraser une base de données ou exfiltrer des données clients. Le toolkit de Microsoft découple la politique de sécurité de la logique applicative : les développeurs n'ont plus à hardcoder des règles de sécurité dans chaque prompt, et les équipes sécurité disposent d'une piste d'audit vérifiable pour chaque décision autonome du modèle. Le choix de publier ce toolkit sous licence open-source n'est pas anodin. Les développeurs construisent aujourd'hui des workflows autonomes en combinant des bibliothèques open-source, des frameworks variés et des modèles tiers, Anthropic, Meta, Mistral ou d'autres. Un outil propriétaire lié à l'écosystème Microsoft aurait probablement été contourné au profit de solutions non vérifiées, sous pression des délais. En ouvrant le code, Microsoft permet à n'importe quelle organisation, qu'elle tourne sur des modèles locaux, sur Azure ou sur des architectures hybrides, d'intégrer ces contrôles de gouvernance sans dépendance fournisseur. L'ouverture invite aussi la communauté cybersécurité à contribuer et à empiler des outils commerciaux, tableaux de bord, intégrations de réponse aux incidents, par-dessus cette fondation commune, accélérant la maturité de tout l'écosystème. À mesure que les agents autonomes s'imposent dans les entreprises, ce type de couche de sécurité d'infrastructure pourrait devenir un standard incontournable.

UELes entreprises européennes déployant des agents IA peuvent adopter cet outil open-source pour répondre aux exigences de gouvernance et de traçabilité imposées par l'AI Act.

SécuritéOpinion
1 source
Google lance la famille de modèles ouverts Gemma 4
232AI Business 

Google lance la famille de modèles ouverts Gemma 4

Google a lancé Gemma 4, une nouvelle famille de modèles d'IA open source conçue pour le raisonnement avancé et les capacités multimodales. Héritière de la série Gemma, cette offre s'inscrit dans la stratégie de Google DeepMind de proposer des modèles accessibles aux développeurs et chercheurs, utilisables localement ou dans le cloud. La famille comprend plusieurs variantes de tailles différentes, adaptées à des usages allant des appareils mobiles aux serveurs de production. L'arrivée de Gemma 4 renforce l'arsenal open source disponible pour les équipes techniques qui ne veulent pas dépendre exclusivement de modèles propriétaires via API. Les capacités multimodales — traitement combiné de texte et d'images — ouvrent la voie à des applications concrètes dans l'analyse documentaire, la vision par ordinateur et les assistants enrichis. Pour les entreprises soucieuses de confidentialité ou de coûts d'inférence, un modèle performant déployable en local représente un avantage opérationnel direct. Google s'inscrit ainsi dans une compétition ouverte avec Meta (LLaMA), Mistral et d'autres acteurs qui misent sur l'open source pour gagner l'adhésion des développeurs. La série Gemma, lancée début 2024, avait déjà rencontré un accueil favorable grâce à ses performances compétitives à taille réduite. Avec Gemma 4, Google cherche à consolider sa position dans cet écosystème, alors que le débat entre modèles ouverts et fermés reste central dans l'industrie de l'IA.

UELes équipes techniques et entreprises européennes disposent d'une nouvelle famille open source déployable en local, réduisant la dépendance aux APIs propriétaires et facilitant la conformité RGPD.

Une plainte qualifie le « Mode Incognito » de Perplexity d'imposture
233Ars Technica AI 

Une plainte qualifie le « Mode Incognito » de Perplexity d'imposture

Le moteur de recherche IA Perplexity fait l'objet d'une action en justice qui l'accuse de partager massivement les conversations de ses utilisateurs avec Google et Meta, à leur insu. Selon la plainte déposée, cette pratique concernerait tous les utilisateurs, qu'ils aient ou non créé un compte sur la plateforme. Les outils de développement utilisés lors de l'enquête auraient révélé que les premières requêtes saisies sont systématiquement transmises à des tiers, tout comme les questions de relance générées par l'IA sur lesquelles l'utilisateur clique. Pour les non-abonnés, la situation serait encore plus grave : leurs conversations initiales seraient partagées via une URL permettant à des tiers comme Meta et Google d'accéder à l'intégralité de l'échange. L'enjeu est considérable pour les millions d'utilisateurs qui font confiance à Perplexity pour des recherches potentiellement sensibles, professionnelles ou personnelles. Le mode "Incognito" proposé par la plateforme, censé garantir une confidentialité renforcée, est qualifié de "mascarade" par les plaignants. Si les faits allégués sont avérés, cela signifie que des volumes massifs de données — requêtes médicales, financières, juridiques ou autres — auraient été transmis à deux des plus grandes régies publicitaires du monde sans le consentement explicite des utilisateurs, en violation potentielle des lois sur la protection des données. Cette affaire s'inscrit dans un contexte de scrutin croissant autour des pratiques de confidentialité des outils d'IA conversationnelle. Perplexity, valorisé à plusieurs milliards de dollars et présenté comme un concurrent direct de Google Search, avait déjà été épinglé en 2024 pour des pratiques de scraping contestables. La question de savoir dans quelle mesure les startups IA monétisent les données utilisateurs via des partenariats publicitaires avec les géants de la tech risque désormais de s'inviter au cœur des débats réglementaires, aussi bien en Europe qu'aux États-Unis.

UESi les pratiques décrites sont avérées, elles constitueraient une violation du RGPD, exposant Perplexity à des sanctions de la CNIL et des autorités européennes de protection des données au détriment des millions d'utilisateurs européens de la plateforme.

ÉthiqueReglementation
1 source
La startup qui aide les développeurs à choisir leurs modèles d'IA approche une valorisation de 1,3 milliard de dollars
234The Information AI 

La startup qui aide les développeurs à choisir leurs modèles d'IA approche une valorisation de 1,3 milliard de dollars

OpenRouter, une startup spécialisée dans l'accès unifié aux modèles d'intelligence artificielle, est en négociation pour lever 120 millions de dollars lors d'un tour de financement mené par un fonds de capital-risque d'Alphabet, la maison mère de Google. Cette opération valoriserait l'entreprise à 1,3 milliard de dollars, investissement inclus, selon deux personnes directement informées de la transaction. OpenRouter propose aux développeurs d'applications IA une interface de programmation (API) unique permettant d'accéder à des centaines de modèles différents sans avoir à gérer plusieurs intégrations distinctes. Cette levée de fonds illustre une tendance de fond dans l'industrie : les applications et agents IA migrent de plus en plus vers des architectures multi-modèles, où l'on combine plusieurs LLM selon les tâches. Dans ce contexte, les outils qui simplifient la sélection et l'orchestration des modèles deviennent stratégiques. Pour les développeurs, OpenRouter représente un gain de temps considérable et une flexibilité accrue — ils peuvent basculer d'un modèle à l'autre, comparer les performances et optimiser les coûts sans revoir leur code. Le positionnement d'OpenRouter s'inscrit dans une compétition croissante autour des couches d'infrastructure de l'IA. À mesure que l'offre de modèles s'est fragmentée — OpenAI, Anthropic, Google, Mistral, Meta et d'autres publient régulièrement de nouveaux modèles — la complexité d'intégration pour les équipes produit a explosé. L'intérêt d'Alphabet via son bras venture dans ce tour signale que les grands acteurs misent désormais sur les intermédiaires capables de fédérer cet écosystème morcelé, plutôt que de tout centraliser sur leurs propres plateformes.

UEMistral, acteur européen majeur, figure parmi les modèles accessibles via OpenRouter, ce qui renforce la visibilité de l'offre européenne dans cet écosystème d'infrastructure IA en pleine consolidation.

💬 1,3 milliard pour une API qui fait le pont entre modèles, ça montre que l'infrastructure est le vrai terrain de jeu maintenant. Pas les modèles eux-mêmes, mais la couche qui permet de passer de l'un à l'autre sans réécrire son code à chaque nouveau release. Alphabet qui investit dans un intermédiaire qui distribue ses propres concurrents, c'est quand même un aveu intéressant sur où ils voient la valeur se concentrer.

BusinessActu
1 source
OpenAI valorisée à 852 milliards de dollars après une nouvelle levée de fonds
235AI Business 

OpenAI valorisée à 852 milliards de dollars après une nouvelle levée de fonds

OpenAI vient de boucler un nouveau tour de financement qui porte sa valorisation à 852 milliards de dollars, consolidant ainsi sa position parmi les entreprises privées les plus valorisées au monde. La société, fondatrice de ChatGPT et des modèles GPT-4, franchit ce cap au terme d'une levée de fonds dont le montant exact n'a pas été précisé, mais qui reflète l'appétit persistant des investisseurs pour les acteurs dominants de l'IA générative. Cette valorisation place OpenAI dans une catégorie rarissime, aux côtés de géants technologiques non cotés comme SpaceX. Pour l'industrie, le signal est clair : les capitaux continuent de se concentrer massivement sur un nombre restreint d'acteurs capables de déployer des modèles à grande échelle, creusant l'écart avec les concurrents moins bien dotés. Les partenaires commerciaux et développeurs qui s'appuient sur l'API OpenAI y liront une garantie supplémentaire de pérennité. Cette levée intervient dans un contexte de compétition intense entre OpenAI, Google DeepMind, Anthropic et Meta sur le front des grands modèles de langage. Après avoir converti son statut en entreprise à but lucratif début 2025, OpenAI cherche à financer le développement de ses prochaines générations de modèles et l'expansion de son infrastructure de calcul. Une introduction en bourse reste évoquée à moyen terme, et cette valorisation en constituerait le plancher de référence.

UELes entreprises et développeurs européens qui s'appuient sur l'API OpenAI peuvent interpréter cette valorisation comme un signal de pérennité, sans impact réglementaire ou économique direct sur la France ou l'UE.

OpenAI scénarise son IPO et conclut son tour sur un cliffhanger à 852 milliards de dollars
236FrenchWeb 

OpenAI scénarise son IPO et conclut son tour sur un cliffhanger à 852 milliards de dollars

OpenAI vient de boucler son dernier tour de financement à une valorisation de 852 milliards de dollars, un record absolu pour une entreprise privée dans le secteur technologique. Ce tour, piloté par Sam Altman avec une précision narrative remarquable, intervient quelques mois avant une introduction en bourse attendue pour la fin de l'année 2026. Le montant exact levé n'a pas été divulgué, mais la valorisation place OpenAI au rang des entreprises les plus précieuses au monde, devant des géants établis depuis des décennies. Cette valorisation stratosphérique n'est pas anodine : elle conditionne directement les termes de l'IPO à venir et verrouille les attentes des investisseurs institutionnels. À 852 milliards, OpenAI se positionne pour viser le trillion de dollars en bourse, un seuil symbolique que seuls Apple, Nvidia, Microsoft et quelques autres ont franchi. Pour les acteurs de l'IA — startups, investisseurs, concurrents — ce chiffre envoie un signal fort sur la prime accordée au leadership dans ce secteur, et renforce la pression sur Anthropic, Google DeepMind et Meta pour justifier leurs propres valorisations. Ce tour de table s'inscrit dans une transformation structurelle d'OpenAI, en cours depuis 2024 : la société a entamé sa conversion de statut à but non lucratif vers une structure commerciale classique, condition sine qua non d'une cotation en bourse. Sam Altman orchestre chaque étape comme un récit feuilletonnant — tours de table, restructurations, annonces produits — pour maintenir l'élan narratif et les valorisations. L'IPO, si elle aboutit, serait l'une des plus importantes de la décennie dans la tech.

UELa valorisation record d'OpenAI à 852 milliards de dollars accentue la pression sur les acteurs européens de l'IA, notamment Mistral, pour justifier leurs propres valorisations auprès des investisseurs institutionnels européens.

💬 852 milliards avant l'IPO, c'est une mise en scène autant qu'une réalité financière. Altman sait que le chiffre qui précède la bourse devient le plancher psychologique des attentes, et viser le trillion dès la cotation, c'est courageux ou inconscient, peut-être les deux. Ce qui me frappe surtout, c'est la pression que ça met sur Mistral et les autres européens : expliquer ta valorisation quand OpenAI écrase tout le monde à 852 Mds, bonne chance.

BusinessOpinion
1 source
Des applications de surveillance cherchent à empêcher les agents IA de dériver
237The Information AI 

Des applications de surveillance cherchent à empêcher les agents IA de dériver

Face aux dérives des agents IA autonomes — qui ont déjà causé des incidents de sécurité et des pannes chez Meta et Amazon — de grandes entreprises comme ServiceNow, ainsi que plusieurs startups, développent une nouvelle catégorie de logiciels baptisés "agents IA gardiens". Ces outils de surveillance prennent la forme d'applications cloud conçues pour détecter et stopper les comportements erratiques ou dangereux d'autres agents IA avant qu'ils ne causent des dommages. Concrètement, ces agents gardiens se connectent aux agents IA déjà déployés en entreprise — qu'ils soient construits avec OpenClaw, Claude Code ou Salesforce Agentforce — via des interfaces de programmation standard ou des serveurs MCP (Model Context Protocol). Une fois en place, ils surveillent en temps réel les actions des agents supervisés et peuvent intervenir si ceux-ci s'écartent de leur mission. La mise en place reste cependant fastidieuse : chaque connexion doit être configurée manuellement, ce qui freine l'adoption à grande échelle. L'émergence de ces outils reflète une tension croissante dans l'industrie : les entreprises déploient des agents IA de plus en plus autonomes pour automatiser des tâches complexes, mais peinent à en contrôler les effets de bord. Les incidents chez des acteurs aussi matures que Meta et Amazon illustrent que même les équipes les plus aguerries ne sont pas à l'abri. La question du contrôle et de la gouvernance des agents IA autonomes s'impose désormais comme un enjeu stratégique central pour 2026, ouvrant un marché potentiellement lucratif pour les acteurs qui sauront proposer des solutions fiables et simples à déployer.

UELes entreprises européennes déployant des agents IA autonomes sont directement concernées par ces enjeux de gouvernance, d'autant que l'AI Act impose des exigences de contrôle et de traçabilité sur les systèmes IA à haut risque.

💬 Des agents pour surveiller les agents, on y est. C'est un peu absurde sur le papier, mais quand Meta et Amazon ont des incidents en prod avec leurs propres systèmes, tu te dis que le problème est réel et pas juste théorique. La vraie limite pour l'instant c'est l'intégration manuelle, un agent gardien qui demande autant de config que l'agent qu'il surveille, ça va freiner tout le monde.

SécuritéOpinion
1 source
Microsoft lance de nouvelles améliorations de Copilot combinant les modèles Anthropic et OpenAI
238The Information AI 

Microsoft lance de nouvelles améliorations de Copilot combinant les modèles Anthropic et OpenAI

Microsoft a dévoilé lundi de nouvelles fonctionnalités pour son logiciel 365 Copilot, intégrant simultanément les modèles d'intelligence artificielle d'OpenAI et d'Anthropic pour automatiser les tâches dans ses applications Office et Teams. Parmi les nouveautés, une fonction baptisée « Critique » combine les deux fournisseurs de manière séquentielle : les modèles d'OpenAI compilent d'abord une recherche sur un sujet donné, puis les modèles d'Anthropic (Claude) analysent et critiquent ce résultat pour en améliorer la qualité finale. Microsoft a également annoncé des améliorations à la mémoire de Copilot et à ses capacités d'agents autonomes. Cette intégration multi-modèles marque un tournant dans la stratégie de Microsoft : plutôt que de s'appuyer exclusivement sur son partenaire historique OpenAI — dans lequel il a investi plus de 13 milliards de dollars —, l'entreprise orchestre désormais plusieurs LLMs en fonction de leurs forces respectives. Pour les quelque 400 millions d'utilisateurs de la suite Microsoft 365, cela se traduit par des assistants plus fiables capables d'auto-corriger leurs propres sorties. Ce virage reflète une tendance de fond dans l'industrie : les grandes entreprises adoptent des architectures « multi-modèles » pour optimiser coût, performance et résilience. Microsoft, qui distribue aussi les modèles d'Anthropic via Azure, se positionne en orchestrateur neutre plutôt qu'en champion exclusif d'OpenAI. La relation entre les deux entreprises reste étroite, mais la dépendance s'allège — un signal fort à l'heure où Google, Meta et Amazon renforcent également leurs propres offres d'IA en entreprise.

UELes entreprises françaises et européennes équipées de Microsoft 365 bénéficieront directement des nouvelles capacités Copilot multi-modèles, sans surcoût ni migration requise.

OutilsOutil
1 source
Mistral AI lance un modèle de synthèse vocale
239AI Business 

Mistral AI lance un modèle de synthèse vocale

Mistral AI, la startup française spécialisée dans les modèles de langage, a lancé son premier modèle de synthèse vocale (text-to-speech), baptisé Mistral TTS. Compatible avec neuf langues — dont le français, l'anglais, l'espagnol, l'allemand, l'italien, le portugais, le néerlandais, le polonais et le russe —, le modèle est disponible via l'API de la plateforme La Plateforme et vise en priorité les applications d'agents vocaux en production. Ce lancement représente une extension stratégique de l'offre Mistral au-delà du texte pur. Les agents vocaux — utilisés dans le service client, les assistants embarqués ou la téléphonie automatisée — nécessitent des modèles TTS rapides, naturels et multilingues. En intégrant cette brique directement dans son écosystème, Mistral permet aux développeurs de construire des workflows vocaux complets sans dépendre de fournisseurs tiers comme ElevenLabs ou la voix de Google. Fondée en 2023 par d'anciens chercheurs de Google DeepMind et Meta, Mistral s'est imposée comme le principal challenger européen face aux géants américains de l'IA. Après avoir consolidé ses modèles de texte et de code, l'entreprise comble progressivement les manques de sa plateforme pour proposer une suite complète. Le TTS multilingue arrive dans un marché en pleine effervescence, où la voix devient un vecteur central d'interaction entre humains et systèmes d'IA.

UEMistral TTS offre aux entreprises européennes une alternative souveraine aux solutions vocales américaines pour déployer des agents vocaux multilingues sans dépendre de fournisseurs tiers.

OutilsOpinion
1 source
WhatsApp passe à la vitesse supérieure avec l’IA et peut désormais répondre à votre place
240Siècle Digital 

WhatsApp passe à la vitesse supérieure avec l’IA et peut désormais répondre à votre place

WhatsApp franchit une nouvelle étape dans l'intégration de l'intelligence artificielle avec le déploiement d'une fonctionnalité permettant à Meta AI de suggérer des réponses complètes directement dans les conversations. Contrairement aux suggestions automatiques basiques déjà présentes sur d'autres plateformes, le système analyse le contexte de l'échange en cours pour proposer des formulations adaptées au ton et au contenu du fil de discussion. Cette mise à jour s'inscrit dans une série de nouveautés IA annoncées par Meta pour son application de messagerie, qui compte plus de deux milliards d'utilisateurs actifs dans le monde. L'enjeu est considérable : pour la première fois, une IA intégrée à une messagerie grand public peut potentiellement rédiger des messages à la place de l'utilisateur, sans que le destinataire en soit informé. Cela soulève des questions concrètes sur l'authenticité des échanges privés, mais répond aussi à une demande réelle — gagner du temps sur des réponses répétitives ou formuler plus facilement des messages dans une langue étrangère. Pour les professionnels utilisant WhatsApp Business, l'impact pourrait être immédiat sur la gestion du service client. Cette évolution s'inscrit dans la stratégie d'ensemble de Meta, qui déploie depuis 2023 son assistant Meta AI sur l'ensemble de ses plateformes — Facebook, Instagram, Messenger et WhatsApp. La firme de Mark Zuckerberg cherche à rattraper son retard face à Google (avec Gemini dans Android Messages) et Apple (avec Apple Intelligence dans iMessage), tandis que la question de la confidentialité des données utilisées pour entraîner ces modèles reste entière, notamment en Europe où le RGPD encadre strictement ce type de traitement.

UEL'intégration de Meta AI dans les conversations WhatsApp soulève des questions de conformité RGPD sur le traitement des données des échanges privés des utilisateurs européens.

OutilsOutil
1 source
Anthropic envisage une IPO au T4 et prépare les modèles 'Claude Mythos' et 'Capybara
241The Information AI 

Anthropic envisage une IPO au T4 et prépare les modèles 'Claude Mythos' et 'Capybara

Anthropic, la start-up américaine d'intelligence artificielle fondée par Dario et Daniela Amodei, envisage une introduction en bourse (IPO) dès le quatrième trimestre 2026, selon un rapport de The Information publié jeudi. Des banquiers en lice pour accompagner l'opération estiment que la levée de fonds pourrait atteindre 60 milliards de dollars, ce qui placerait Anthropic parmi les introductions technologiques les plus importantes de la décennie. Parallèlement, la société prépare deux nouveaux modèles d'intelligence artificielle avancés, dont les noms de code sont « Claude Mythos » et « Capybara », qui devraient représenter une montée en gamme significative par rapport aux versions actuelles de Claude. Une valorisation à 60 milliards de dollars lors d'une IPO aurait des répercussions majeures pour tout l'écosystème de l'IA : elle validerait les investissements massifs consentis par Amazon (4 milliards) et Google (2 milliards), tout en signalant aux marchés que les grands modèles de langage sont désormais des actifs cotables à maturité commerciale. Pour les entreprises clientes d'Anthropic, une entrée en bourse renforcerait la crédibilité et la pérennité du fournisseur, accélérant potentiellement l'adoption de Claude dans des contextes d'entreprise critique. Anthropic évolue dans un marché sous haute pression concurrentielle face à OpenAI, Google DeepMind et Meta. Après plusieurs tours de financement privés totalisant plusieurs milliards de dollars, une IPO constituerait une sortie naturelle pour les investisseurs historiques tout en finançant la prochaine génération de modèles. Le lancement de « Mythos » et « Capybara » avant ou pendant le processus boursier servirait probablement à démontrer la solidité technique de l'entreprise aux futurs actionnaires.

UELes entreprises européennes clientes d'Anthropic pourraient bénéficier d'une stabilité accrue du fournisseur, mais l'IPO renforce surtout la domination américaine sur le marché des grands modèles de langage.

BusinessActu
1 source
Apple obtient un accès complet à Gemini et utilise la distillation pour créer une IA légère embarquée
242The Decoder 

Apple obtient un accès complet à Gemini et utilise la distillation pour créer une IA légère embarquée

Apple a conclu un accord avec Google lui donnant un accès complet aux modèles Gemini, qu'elle utilise comme source pour entraîner par distillation des modèles d'intelligence artificielle plus légers, destinés à tourner directement sur ses appareils et à alimenter Siri. Cette technique de distillation consiste à transférer les capacités d'un grand modèle vers un modèle plus compact, en exploitant les sorties du modèle « professeur » comme signal d'entraînement. Ce que cette démarche révèle, c'est qu'Apple paie officiellement pour ce que certaines entreprises chinoises sont accusées de faire en secret : utiliser les outputs de modèles frontier concurrents pour améliorer leurs propres systèmes. En passant par un accord commercial formel avec Google, Apple contourne les zones grises éthiques et légales tout en accédant à l'une des meilleures bases de distillation disponibles. Cette stratégie s'inscrit dans la course que se livrent les grands acteurs tech pour embarquer de l'IA capable sur l'appareil, sans dépendre d'un cloud coûteux et en préservant la confidentialité des données. Pour Apple, qui a pris du retard sur l'IA générative, le partenariat avec Google — déjà présent via le moteur de recherche par défaut — offre un raccourci stratégique pour rattraper OpenAI et Meta sur le terrain de l'IA embarquée.

UELes utilisateurs européens d'appareils Apple bénéficieront indirectement d'une IA embarquée plus performante sur Siri, sans impact réglementaire direct sur la France ou l'UE.

LLMsOpinion
1 source
Actualité : GitHub Copilot : Microsoft va utiliser vos données pour alimenter son IA, sauf si vous refusez
243Les Numériques IA 

Actualité : GitHub Copilot : Microsoft va utiliser vos données pour alimenter son IA, sauf si vous refusez

Microsoft a annoncé en mars 2026 une modification de sa politique de données pour GitHub Copilot : les données des utilisateurs — incluant le code, les interactions et les comportements sur la plateforme — seront désormais utilisées pour entraîner ses modèles d'intelligence artificielle, sauf si les utilisateurs se désinscrivent explicitement via les paramètres de leur compte. Ce changement concerne l'ensemble des utilisateurs de GitHub Copilot, qu'ils soient en version gratuite ou payante, et prend effet dans les prochaines semaines. Pour des millions de développeurs, cela signifie que leur code — parfois propriétaire ou sensible — pourrait contribuer à améliorer les outils IA de Microsoft sans action de leur part. Le mécanisme d'opt-out existe, mais il repose sur la démarche active de l'utilisateur, ce qui, statistiquement, laisse la grande majorité des données accessibles. Pour les entreprises qui utilisent GitHub en environnement professionnel, la question de la confidentialité du code source devient immédiatement critique. Microsoft a racheté GitHub en 2018 pour 7,5 milliards de dollars, un investissement dont la rentabilisation passe largement par Copilot, lancé en 2021 et aujourd'hui intégré dans l'écosystème Visual Studio et Azure. La firme de Redmond s'inscrit ainsi dans une tendance plus large : OpenAI, Google et Meta ont tous adopté des politiques similaires d'utilisation des données utilisateurs pour affiner leurs modèles. La pression réglementaire européenne, notamment via le RGPD, pourrait cependant contraindre Microsoft à adapter ces pratiques pour les utilisateurs de l'Union européenne.

UELes développeurs européens utilisant GitHub Copilot doivent se désinscrire activement pour protéger leur code propriétaire ; le RGPD pourrait contraindre Microsoft à imposer un mécanisme d'opt-in explicite pour les utilisateurs de l'UE.

ÉthiqueReglementation
1 source
15 millions de paramètres et 1 seul GPU : Yann LeCun fait un premier pas vers l’IA qui comprend le monde réel
244Numerama 

15 millions de paramètres et 1 seul GPU : Yann LeCun fait un premier pas vers l’IA qui comprend le monde réel

Yann LeCun, directeur scientifique de Meta AI et figure centrale de l'intelligence artificielle moderne, publie avec un consortium de chercheurs LeWorldModel, un modèle de prédiction du monde capable de s'entraîner directement à partir de pixels bruts — sans prétraitement ni encodage intermédiaire — tout en maintenant une stabilité d'entraînement inédite à cette échelle. Le modèle repose sur 15 millions de paramètres et tourne sur un seul GPU, ce qui le rend accessible bien au-delà des grands laboratoires disposant de clusters massifs. L'enjeu est considérable pour la robotique et l'IA incarnée : pour qu'un robot puisse interagir de façon autonome avec son environnement physique, il doit d'abord modéliser le monde visuel tel qu'il est, image après image, sans dépendre d'annotations humaines. LeWorldModel ouvre cette voie en apprenant directement depuis la donnée visuelle brute, là où les approches précédentes échouaient souvent à converger ou nécessitaient des architectures beaucoup plus lourdes. C'est un pas concret vers une IA qui « comprend » le monde réel plutôt que de simplement le classifier. Cette publication intervient dans un contexte particulier : LeCun vient de cofonder AMI Labs, une startup basée en France dont les premiers travaux ne sont pas encore dévoilés. Depuis plusieurs années, il défend publiquement une vision alternative aux grands modèles de langage — il milite pour des systèmes d'IA basés sur la prédiction du monde physique plutôt que sur la génération de texte. LeWorldModel s'inscrit directement dans cette feuille de route, et pourrait constituer une brique fondamentale de l'architecture JEPA (Joint Embedding Predictive Architecture) qu'il développe chez Meta depuis 2022.

UELa cofondation par LeCun d'AMI Labs, startup basée en France, ancre directement ces travaux dans l'écosystème français de l'IA et pourrait constituer un pôle de recherche européen sur l'IA incarnée.

RecherchePaper
1 source
Mark Zuckerberg et Jensen Huang rejoignent le nouveau conseil technologique de Trump
245The Verge AI 

Mark Zuckerberg et Jensen Huang rejoignent le nouveau conseil technologique de Trump

Mark Zuckerberg (Meta), Larry Ellison (Oracle), Jensen Huang (Nvidia) et Sergey Brin (Google) seront les quatre premiers membres du Conseil des conseillers du président sur la science et la technologie (PCAST), selon le Wall Street Journal. Ce panel, qui aura son mot à dire sur la politique en matière d'IA, comptera 13 membres au départ et pourrait s'étendre à 24. Il sera coprésidé par David Sacks, le « tsar » de l'IA et des cryptomonnaies de Trump, et Michael Kratsios, conseiller technologique de la Maison-Blanche. Cette initiative place directement les PDG des géants technologiques au cœur de la politique fédérale sur l'intelligence artificielle. Leur influence pourrait peser lourd sur les réglementations à venir, les investissements publics et la position américaine face à la concurrence chinoise dans la course à l'IA. Le fait que des dirigeants de sociétés privées siègent officiellement dans un organe consultatif présidentiel soulève aussi des questions sur les conflits d'intérêts potentiels. Le PCAST est une instance historique qui conseille la Maison-Blanche sur la science, la technologie, l'éducation et l'innovation — sa composition reflète la priorité absolue accordée par l'administration Trump à la domination américaine dans le domaine de l'IA.

UELa composition pro-industrie de ce conseil pourrait accélérer la divergence réglementaire entre Washington et Bruxelles, renforçant la pression concurrentielle sur les entreprises européennes d'IA soumises à l'AI Act.

RégulationReglementation
1 source
Cette startup veut changer la façon dont les mathématiciens font des maths
246MIT Technology Review 

Cette startup veut changer la façon dont les mathématiciens font des maths

Axiom Math, une startup basée à Palo Alto en Californie, a lancé un outil gratuit baptisé Axplorer, conçu pour aider les mathématiciens à découvrir des patterns mathématiques susceptibles de débloquer des problèmes restés sans solution depuis des décennies. L'outil est une refonte de PatternBoost, développé en 2024 par François Charton — aujourd'hui chercheur chez Axiom — lorsqu'il travaillait encore chez Meta. Là où PatternBoost nécessitait un supercalculateur, Axplorer tourne sur un simple Mac Pro. L'an dernier, PatternBoost avait permis de résoudre un problème réputé difficile en théorie des graphes, le problème des quatre-cycles de Turán — un défi qui consiste à maximiser le nombre de connexions entre des points sans former de boucles à quatre nœuds. Axiom Math a également utilisé un autre de ses outils, AxiomProver, pour résoudre quatre problèmes mathématiques majeurs en 2025. La démarche d'Axiom s'inscrit dans un mouvement plus large : rendre accessibles des outils d'IA puissants à l'ensemble de la communauté mathématique, et non plus seulement aux équipes disposant de clusters GPU. C'est précisément ce que souligne la fondatrice et PDG de la startup, Carina Hong : les mathématiques ne se résument pas à trouver des solutions à des problèmes existants, elles sont avant tout exploratoires. Charton, lui, est sceptique face aux récents succès des grands modèles de langage comme GPT-5 sur des problèmes ouverts — notamment ceux laissés par le mathématicien Paul Erdős. Selon lui, ces victoires concernent des problèmes peu étudiés, pas les grands défis sur lesquels les meilleurs esprits ont travaillé pendant des années. Axplorer adopte une approche différente : l'utilisateur soumet un exemple, l'outil en génère d'autres similaires, l'utilisateur sélectionne les plus prometteurs, et le cycle recommence — une logique proche de celle d'AlphaEvolve de Google DeepMind, mais accessible à tous. Les avancées en mathématiques ont des répercussions profondes sur l'informatique, l'IA de nouvelle génération et la sécurité internet. Cette initiative s'inscrit dans le cadre du programme expMath (Exponentiating Mathematics) lancé par la DARPA, l'agence de recherche avancée du Pentagone, pour encourager l'adoption des outils d'IA dans la recherche mathématique fondamentale.

UEL'outil gratuit Axplorer est accessible à toute la communauté mathématique européenne, et son co-créateur François Charton est un chercheur français.

RecherchePaper
1 source
136 cœurs, 3 nm… Arm dévoile une première puce bien à lui, et elle dépote
247Frandroid 

136 cœurs, 3 nm… Arm dévoile une première puce bien à lui, et elle dépote

Arm, connu jusqu'ici comme vendeur de propriété intellectuelle pour ses architectures de puces, franchit un cap inédit en lançant son propre processeur physique. Fabriquée en partenariat avec Meta, cette puce embarque 136 cœurs et une gravure en 3 nm, la plaçant d'emblée dans le haut de gamme des semi-conducteurs actuels. Cette entrée en matière marque un tournant stratégique pour Arm, qui sort de son rôle de fournisseur de licences pour devenir acteur du matériel. La puce est conçue spécifiquement pour l'IA agentique, un segment en pleine explosion où la puissance de calcul et l'efficacité énergétique sont décisives. Le partenariat avec Meta n'est pas anodin : le géant américain investit massivement dans ses propres infrastructures d'IA pour réduire sa dépendance aux fournisseurs externes comme Nvidia ou Qualcomm.

UELe pivot d'Arm vers le hardware souverain représente un signal fort pour l'industrie des semi-conducteurs, alors que l'Europe cherche à renforcer sa propre capacité de production via le Chips Act européen.

InfrastructureActu
1 source
Les autorités chinoises interdisent aux cofondateurs de Manus de quitter le territoire
248The Information AI 

Les autorités chinoises interdisent aux cofondateurs de Manus de quitter le territoire

Les autorités chinoises ont interdit aux cofondateurs de Manus, Xiao Hong et Ji Yichao, de quitter le territoire national, selon le Financial Times. Cette mesure intervient alors que les régulateurs examinent l'acquisition de la startup d'agents IA par Meta Platforms pour 2 milliards de dollars. Les deux fondateurs ont été convoqués par la Commission nationale du développement et de la réforme. Cette interdiction de sortie du territoire signale que Pékin entend exercer un contrôle étroit sur cette transaction stratégique. Elle pourrait ralentir, voire bloquer, un rachat qui représenterait l'une des plus importantes acquisitions de Meta dans le domaine de l'IA, et illustre la volonté de la Chine de garder la main sur ses pépites technologiques. Manus est une startup chinoise spécialisée dans les agents IA autonomes, devenue virale début 2025 après la démonstration de capacités jugées remarquables. Son acquisition par Meta s'inscrit dans la course mondiale aux talents et technologies d'IA.

UELa tension géopolitique sino-américaine autour des acquisitions d'IA illustre des enjeux de souveraineté technologique que l'UE suit de près dans le cadre de sa propre politique industrielle.

BusinessActu
1 source
L'IA part en guerre : le baromètre de l'emballement
249MIT Technology Review 

L'IA part en guerre : le baromètre de l'emballement

L'intelligence artificielle s'invite désormais dans les conflits armés. Anthropic et le Pentagone se sont affrontés sur la manière de militariser Claude, le modèle phare de l'entreprise, avant qu'OpenAI ne conclue un accord qualifié d'« opportuniste et bâclé » avec l'armée américaine. Résultat : Anthropic, fondée sur des principes éthiques stricts, se retrouve aujourd'hui à accélérer des frappes américaines contre l'Iran. Ces développements provoquent une réaction croissante dans la société. Des utilisateurs quittent ChatGPT en masse, et des milliers de personnes ont défilé à Londres lors de la plus grande manifestation anti-IA jamais organisée. Pendant ce temps, le phénomène des agents IA gagne du terrain sur internet : OpenAI recrute le créateur d'OpenClaw, un agent viral, tandis que Meta rachète Moltbook, une plateforme où des agents semblent méditer sur leur propre existence et inventer de nouvelles religions comme le « Crustafarianism ». Sur RentAHuman, des bots embauchent désormais des humains pour livrer des produits au CBD. Ces anecdotes illustrent un glissement profond : l'IA ne se contente plus d'automatiser des tâches, elle devient décisionnaire — dans la guerre comme dans le quotidien —, soulevant des questions urgentes sur la gouvernance et les limites éthiques de son déploiement.

UELe débat sur l'utilisation militaire de l'IA par des acteurs américains renforce l'urgence pour l'UE de définir des garde-fous clairs dans l'AI Act concernant les applications de défense.

ÉthiqueOpinion
1 source
Arm se lance dans la fabrication de ses propres puces
250Wired AI 

Arm se lance dans la fabrication de ses propres puces

Arm, jusqu'ici spécialisé dans la conception de puces pour d'autres fabricants, lance désormais sa propre gamme de matériel dédié à l'intelligence artificielle. Meta, OpenAI, Cerebras et Cloudflare figurent parmi les premiers clients de ces nouveaux composants.

UECe repositionnement d'Arm sur la fabrication directe de puces IA pourrait modifier les équilibres du marché des semi-conducteurs en Europe, notamment pour les entreprises européennes qui s'approvisionnent via les partenaires licenciés d'Arm.

BusinessActu
1 source