Aller au contenu principal

Dossier OpenAI — page 14

1847 articles · page 14 sur 37

Toute l'actualité d'OpenAI : nouvelles versions de ChatGPT et GPT, stratégie produit, partenariats, controverses et décisions de Sam Altman.

Pourquoi les boucles d'agents ont la cote
651The Information AI OutilsOutil

Pourquoi les boucles d'agents ont la cote

Les "agent loops", ou boucles d'agents, s'imposent comme l'une des approches les plus discutées dans la communauté des développeurs IA, notamment sur X et Reddit ces dernières semaines. Le principe consiste à faire tourner un ou plusieurs agents en boucle autonome, sans intervention humaine entre chaque étape : l'agent tente différentes approches pour accomplir une tâche, un second agent évalue son travail, et le processus recommence jusqu'à l'atteinte de l'objectif ou d'une condition d'arrêt prédéfinie. Cette méthode tranche avec l'approche classique qui consiste à soumettre un prompt, attendre la réponse, puis corriger manuellement. Lors de la conférence AI Engineers d'avril 2025, des ingénieurs d'Anthropic ont illustré le potentiel de la technique avec un exemple concret : ils ont demandé à Claude de développer une application générant des jeux vidéo rétro. Avec un prompt minimal, Claude a livré l'application en 20 minutes pour 9 dollars. La même tâche confiée à une boucle d'agents a pris six heures et coûté 200 dollars, mais le résultat était nettement supérieur. L'engouement pour les boucles d'agents tient à leur capacité à traiter des tâches longues ou mal définies, là où une simple requête atteint rapidement ses limites. Pour les développeurs qui construisent des applications complexes, l'approche offre un niveau de qualité qu'un échange ponctuel ne permet pas d'atteindre. Le compromis reste cependant significatif : un rapport de coût de 1 à 22 représente une barrière réelle à l'adoption généralisée. À court terme, cette méthode restera donc réservée aux cas d'usage où la qualité prime sur le budget, plutôt qu'aux tâches routinières à faible enjeu. Cette tendance s'inscrit dans une évolution plus large du secteur vers des systèmes d'IA toujours plus autonomes. L'industrie se déplace progressivement du modèle "prompt-réponse" vers des architectures multi-agents capables de s'auto-corriger et de raisonner sur de longues séquences d'actions. Anthropic, qui développe Claude, figure parmi les acteurs en pointe sur ce terrain, aux côtés d'OpenAI et Google DeepMind. L'enjeu à moyen terme sera de réduire le coût computationnel de ces boucles pour les rendre économiquement accessibles à grande échelle, condition nécessaire pour que les agent loops passent du statut d'expérimentation avancée à celui d'outil standard du développement IA.

1 source
Enregistrer une compétence
652Ben's Bites 

Enregistrer une compétence

OpenAI a dévoilé une fonctionnalité majeure pour son agent de code Codex : le mode Record & Replay, qui permet de montrer au système un flux de travail répétitif une seule fois, comme remplir une note de frais ou soumettre une demande de congé, pour qu'il le transforme automatiquement en une compétence réutilisable, inspectable et modifiable. Dans le même élan, Anthropic a annoncé que Claude Code supporte désormais les Artefacts, des pages HTML interactives partageables pouvant servir de tableaux de bord de projet ou de récapitulatifs de pull requests, disponibles en bêta pour les plans Team et Enterprise. OpenAI a également élargi Daybreak, son programme de cybersécurité, avec une nouvelle version de GPT-5.5-Cyber réservée à ses partenaires de confiance, capable de reproduire davantage de vulnérabilités que son prédécesseur, ainsi qu'avec Patch the Planet, une initiative pour accélérer la correction de failles dans les logiciels open source. De son côté, Sakana AI a lancé Fugu, une API qui orchestre plusieurs modèles sur des tâches complexes et revendique un score de 73,7 sur SWE-bench Pro et 82,1 sur TerminalBench 2.1, des performances proches de Fable, même si des lacunes subsistent en usage réel. Ces annonces illustrent une tendance de fond : les outils d'IA passent du stade de l'assistant ponctuel à celui d'un système d'automatisation durable. La fonctionnalité Record & Replay de Codex réduit concrètement la friction pour les équipes qui gèrent des processus administratifs ou métiers répétitifs, sans exiger de compétences en programmation. Les Artefacts de Claude Code ouvrent la voie à une collaboration plus riche entre développeurs, en rendant les livrables de l'IA directement partageables. Pour la cybersécurité, l'extension de Daybreak signale qu'OpenAI positionne ses modèles comme des outils offensifs et défensifs à part entière pour les professionnels du secteur. Ces développements s'inscrivent dans une semaine particulièrement dense pour l'écosystème de l'IA générative. L'API Interactions de Google est passée en disponibilité générale, unifiant accès aux modèles et aux agents sous une même interface. GPT-5.5 Instant a amélioré ses performances sur les questions médicales, atteignant le niveau des meilleurs modèles de raisonnement d'OpenAI selon l'entreprise. Perplexity Computer a intégré un système de mémoire baptisé Brain. Stripe a ouvert un répertoire permettant aux agents de rechercher et de payer des services directement depuis la ligne de commande. ElevenLabs, enfin, a lancé un moteur publicitaire capable de localiser des spots dans plus de 50 langues. La vitesse à laquelle ces capacités s'accumulent suggère que 2026 marque un tournant dans l'autonomie réelle des agents, avec des workflows complets désormais déléguables de bout en bout.

UECes outils (Codex Record & Replay, Claude Code Artifacts, API Fugu, annuaire Stripe pour agents) sont immédiatement accessibles aux développeurs et entreprises européens, mais aucune annonce ne cible spécifiquement la France ou l'Union européenne.

💬 Record & Replay de Codex, c'est le truc qui résume tout : tu montres une fois, ça devient une compétence durable. C'est le passage du copilote ponctuel à l'automatisation métier réelle, sans ligne de code à écrire. Reste à voir si ça tient sur des workflows un peu moins lisses que la note de frais modèle.

OutilsOutil
1 source
Meta voulait espionner ses employés pour l’IA, ça tourne au fiasco en interne
653Le Big Data 

Meta voulait espionner ses employés pour l’IA, ça tourne au fiasco en interne

Le 22 juin 2026, Meta a suspendu son programme MCI (Model Capability Initiative), une initiative interne conçue pour entraîner des modèles d'intelligence artificielle à partir du comportement réel de ses propres employés. Concrètement, le système captait les mouvements de souris, les frappes au clavier, les clics et parfois des captures d'écran des machines des salariés. La suspension a été déclenchée après la découverte d'un problème de configuration ayant exposé des données sensibles d'employés à un nombre de personnes bien plus large que prévu au sein de l'entreprise. La porte-parole Tracy Clayton a précisé qu'aucune intrusion externe n'avait été détectée et qu'aucun comportement suspect de la part des employés n'avait été observé. L'enquête est en cours pour déterminer l'étendue exacte de l'incident. La révélation fragilise davantage un programme déjà contesté en interne. Avant même cet incident, plusieurs employés avaient exprimé des inquiétudes sur la vie privée, la sécurité des données et l'impact concret sur les performances de leurs machines, certains signalant un ralentissement notable au quotidien. Début juin, Meta avait tenté de calmer les tensions en permettant aux salariés de suspendre temporairement la collecte ou de demander une exemption totale, mais ces ajustements n'ont pas suffi à restaurer la confiance. L'incident du 22 juin transforme ce qui était une friction interne gérable en une crise de crédibilité pour le dispositif entier, renforçant les doutes sur la capacité de Meta à gérer responsablement des données aussi sensibles que celles de ses propres collaborateurs. Le MCI s'inscrit dans une course que se livrent les grandes entreprises technologiques pour améliorer leurs modèles d'IA avec des données comportementales de haute qualité, difficiles à obtenir autrement. Utiliser les données des employés comme terrain d'entraînement est une approche risquée sur le plan légal et éthique, notamment en Europe où le RGPD encadre strictement ce type de collecte. Meta, qui développe activement ses modèles Llama et cherche à combler son retard face à OpenAI et Google sur les assistants IA, se retrouve donc dans une position délicate : abandonner le programme signifie perdre un avantage potentiel, mais le maintenir sans reconstruction complète de la confiance interne semble difficile. La suite dépendra des conclusions de l'enquête et de la capacité de l'entreprise à proposer un cadre de collecte jugé acceptable par ses propres équipes.

UELa collecte de données comportementales d'employés (frappes clavier, captures d'écran) pour entraîner des modèles IA serait soumise au RGPD en Europe, exposant Meta à des risques juridiques majeurs si le programme venait à s'appliquer à ses salariés européens.

Google adopte l'Interactions API comme interface par défaut pour ses modèles et agents Gemini
654The Decoder 

Google adopte l'Interactions API comme interface par défaut pour ses modèles et agents Gemini

Google DeepMind a officialisé l'Interactions API comme nouvelle interface par défaut pour ses modèles et agents Gemini. Ce changement architectural remplace l'ancienne API generateContent, jusqu'ici l'interface standard pour interroger les modèles Gemini via le Google AI Studio et les SDK associés. La nouvelle interface repose sur un schéma simplifié structuré autour d'étapes typées, abandonnant l'organisation précédente basée sur des rôles. Désormais, toutes les nouvelles fonctionnalités destinées aux agents seront exclusivement disponibles via cette API. Ce basculement a des conséquences directes pour les développeurs qui ont construit des applications ou des pipelines sur l'API generateContent : ils devront migrer vers le nouveau schéma pour accéder aux futures capacités. L'approche par étapes typées vise à rendre l'intégration plus claire et moins ambiguë, notamment pour les scénarios agentiques complexes où plusieurs actions s'enchaînent. En gelant les nouvelles fonctionnalités sur l'ancienne API, Google crée une pression de migration qui devrait accélérer l'adoption du nouveau standard. Ce choix s'inscrit dans une tendance de fond chez les grands fournisseurs de modèles : aligner l'interface de programmation sur les besoins des systèmes agentiques, qui nécessitent une gestion fine des états, des outils et des flux d'exécution. Google, qui fait face à une concurrence intense d'OpenAI et Anthropic sur le segment des agents IA, cherche à offrir une base technique plus cohérente pour les développeurs. L'Interactions API représente ainsi moins un simple changement d'interface qu'une réorientation stratégique de la plateforme Gemini vers les usages agentiques de nouvelle génération.

UELes développeurs européens ayant intégré l'API generateContent de Gemini dans leurs applications devront planifier une migration vers l'Interactions API pour continuer à accéder aux nouvelles fonctionnalités agentiques de Google.

OutilsOutil
1 source
Apple Private Cloud Compute : la révolution invisible qui verrouille la sécurité de l’IA
655Le Big Data 

Apple Private Cloud Compute : la révolution invisible qui verrouille la sécurité de l’IA

Apple a déployé une infrastructure cloud radicalement différente des modèles existants pour alimenter Apple Intelligence, son système d'intelligence artificielle lancé en 2024. Baptisée Private Cloud Compute (PCC), cette architecture mobilise des serveurs distants dédiés aux modèles d'IA trop lourds pour être exécutés localement sur les puces A17 Pro, A18 ou M des appareils Apple. Ces serveurs fonctionnent selon cinq principes stricts : traitement sans état (les données sont effacées de la RAM sitôt la requête traitée, sans jamais toucher un disque), verrouillage cryptographique du micrologiciel, absence totale d'accès privilégié pour les ingénieurs Apple eux-mêmes, impossibilité technique de cibler un utilisateur précis, et vérifiabilité publique de l'architecture. Apple a également ouvert récemment cette infrastructure à des développeurs tiers, leur permettant d'y déployer leurs propres modèles dans ce cadre sécurisé. L'enjeu est direct pour des centaines de millions d'utilisateurs d'iPhone, d'iPad et de Mac : les agents autonomes capables d'enchaîner des tâches complexes nécessitent des modèles dont la taille dépasse la RAM disponible sur n'importe quel smartphone, et une exécution locale viderait la batterie en quelques minutes. Sans PCC, Apple devrait choisir entre brider ces fonctionnalités ou envoyer les données des utilisateurs vers un cloud opaque, comme le font Google, Microsoft ou OpenAI. Le PCC résout cette tension en offrant une garantie mathématique et matérielle : même Apple ne peut pas lire les requêtes traitées par ses propres serveurs. Pour l'industrie, c'est un modèle alternatif crédible à l'hyperscaler classique, et une réponse concrète aux régulateurs européens qui scrutent le traitement des données personnelles dans l'IA. Ce projet s'inscrit dans la stratégie de différenciation longue d'Apple, qui a fait de la vie privée un argument commercial central depuis plusieurs années face à Google et Meta. La montée en puissance des agents IA, qui accèdent à des emails, calendriers, messages et fichiers personnels, rendait cette infrastructure indispensable : confier ces données à un serveur standard aurait représenté un risque réputationnel et réglementaire majeur. L'ouverture récente à des tiers marque une nouvelle étape, Apple cherchant à faire du PCC une plateforme en concurrence directe avec les offres de confidential computing de Google (Confidential VMs) et Microsoft (Azure Confidential Computing). La prochaine question est de savoir si les entreprises et les régulateurs accepteront ces garanties comme suffisantes, ou exigeront des audits indépendants plus poussés du code et des matériels Apple.

UELe modèle PCC d'Apple, avec ses garanties cryptographiques sur le traitement des données, pourrait constituer une réponse concrète aux exigences du RGPD et faciliter l'adoption d'Apple Intelligence par les entreprises et administrations européennes soumises aux règles strictes de protection des données personnelles.

InfrastructureOpinion
1 source
L'Oréal intègre l'essayage virtuel Maybelline dans ChatGPT
656AI News 

L'Oréal intègre l'essayage virtuel Maybelline dans ChatGPT

L'Oréal a annoncé lors de VivaTech 2026 un partenariat stratégique avec OpenAI qui intègre directement l'outil d'essayage virtuel de maquillage Maybelline dans ChatGPT. Concrètement, la fonctionnalité Makeup Virtual Try-On de Maybelline New York sera accessible depuis l'interface conversationnelle de ChatGPT, s'appuyant sur ModiFace, la filiale de réalité augmentée rachetée par L'Oréal au Canada en 2018. L'accord va bien au-delà du simple try-on : il couvre la visibilité des produits Lancôme et Kérastase dans les résultats de ChatGPT aux États-Unis, des pilotes publicitaires impliquant SkinCeuticals, CeraVe et Garnier, ainsi que l'utilisation du modèle GPT-Rosalind d'OpenAI pour cartographier le microbiome cutané, en commençant par La Roche-Posay. En interne, les derniers modèles OpenAI alimenteront CreAItech, la plateforme de création de contenu générative de L'Oréal, déjà utilisée par les équipes marketing pour produire images et vidéos. Le groupe indique que 73 000 employés ont été formés à l'IA générative. Ce partenariat marque une étape significative dans la monétisation de ChatGPT comme canal commercial. Avec plus de 900 millions d'utilisateurs hebdomadaires actifs et 50 millions d'abonnés déclarés par OpenAI en 2026, l'intégration d'un outil d'essayage beauté dans le chatbot transforme une interface de conversation en point de vente potentiel. Pour L'Oréal, dont le e-commerce a progressé à deux chiffres en 2025 pour dépasser 30 % des ventes, c'est un levier direct de croissance. Les services Beauty Tech du groupe ont déjà été utilisés plus de 120 millions de fois dans 66 pays fin 2025. L'enjeu est aussi scientifique : appliquer un modèle de raisonnement en sciences du vivant à la recherche sur le microbiome ouvre une voie vers de nouveaux produits de soin développés plus rapidement. Ce rapprochement s'inscrit dans une tendance de fond où les grandes marques de consommation cherchent à s'intégrer aux interfaces IA avant qu'elles ne deviennent le premier point de contact avec les consommateurs. L'Oréal, qui collabore déjà avec IBM sur un modèle fondationnel de formulation cosmétique et avec NVIDIA sur le rendu 3D et la science prédictive des formules, consolide une stratégie IA multi-partenaires. Du côté d'OpenAI, ce partenariat avec un groupe du CAC 40 présent dans 150 pays valide le modèle publicitaire en cours de déploiement dans ChatGPT, centré sur les moments d'intention d'achat. Les modalités concrètes d'affichage des publicités dans l'interface restent toutefois non communiquées, et l'équilibre entre expérience utilisateur et monétisation sera l'un des points de friction à surveiller dans les prochains mois.

UEL'Oréal, fleuron français du CAC 40 présent dans 150 pays, s'impose comme précurseur européen en intégrant ses marques directement dans ChatGPT, ouvrant la voie à un nouveau modèle commercial pour les groupes de grande consommation européens souhaitant capter les intentions d'achat via les interfaces IA.

OutilsOpinion
1 source
Les politiques gouvernementales imprévisibles, nouveau risque de l'IA
657The Information AI 

Les politiques gouvernementales imprévisibles, nouveau risque de l'IA

L'administration Trump a adressé ce week-end un avertissement formel à Anthropic : aucun étranger, y compris les propres employés étrangers de l'entreprise, ne peut accéder aux derniers modèles d'intelligence artificielle de la société sans autorisation préalable du gouvernement. Anthropic se retrouve ainsi dans un bras de fer inédit avec Washington autour de l'accès à ses modèles les plus récents. Dans la foulée, les dirigeants d'OpenAI ont envoyé samedi une note interne à leurs équipes, affirmant avoir signifié à l'administration que le développement de l'IA "nécessite les meilleurs talents du monde entier", une prise de position directement motivée par l'inquiétude que suscite le précédent Anthropic. Cette intervention gouvernementale introduit une nouvelle catégorie de risque pour l'ensemble du secteur de l'IA : l'imprévisibilité réglementaire. Les entreprises qui investissent des milliards dans des infrastructures de calcul et recrutent à l'international se retrouvent exposées à des décisions administratives susceptibles de bouleverser leurs opérations du jour au lendemain. Pour des acteurs dont les équipes de recherche sont largement constituées de talents étrangers, une telle restriction touche directement à leur capacité de production et de compétitivité, bien au-delà des seules considérations commerciales. Ce contexte s'inscrit dans une posture plus large de l'administration américaine qui cherche à contrôler la diffusion des technologies d'IA les plus avancées, notamment pour des raisons de sécurité nationale et de concurrence géopolitique avec la Chine. Les contrôles à l'exportation des semi-conducteurs et des modèles d'IA se durcissent depuis plusieurs mois, mais les restrictions à l'accès interne selon la nationalité des employés représentent une évolution significative. Si ce précédent venait à se généraliser, il pourrait remodeler les stratégies de recrutement, d'organisation et de déploiement de toutes les grandes entreprises américaines du secteur, au moment même où elles tentent d'attirer les meilleurs chercheurs mondiaux pour maintenir leur avance technologique.

UELes chercheurs européens employés par des entreprises américaines d'IA pourraient se voir restreindre l'accès aux modèles avancés, et le durcissement des contrôles américains à l'exportation menace l'accès des acteurs européens aux technologies de pointe.

💬 Ça, c'est le genre de friction qu'on n'avait pas vue venir. Les meilleurs labos d'IA américains ont bâti leurs équipes de recherche en recrutant partout dans le monde, et Washington vient de leur signifier que ces mêmes chercheurs n'ont plus accès aux modèles sur lesquels ils bossent. Le paradoxe : vouloir gagner la course à l'IA face à la Chine en commençant par handicaper ses propres équipes.

RégulationReglementation
1 source
Anthropic perd-il la confiance des chercheurs en IA ? Les anciens d'AGI House lèvent 25 millions pour un nouveau fonds
658The Information AI 

Anthropic perd-il la confiance des chercheurs en IA ? Les anciens d'AGI House lèvent 25 millions pour un nouveau fonds

L'administration Trump a annoncé vendredi soir une décision interdisant de facto les modèles les plus avancés d'Anthropic, invoquant des préoccupations de cybersécurité. La mesure, dans laquelle Amazon CEO Andy Jassy aurait joué un rôle déclencheur, frappe notamment Claude Mythos, le modèle phare de la startup fondée par Dario Amodei. Ce qui surprend autant que la décision elle-même, c'est le silence assourdissant qui l'accompagne du côté des rivaux. En février dernier, lors d'une précédente friction avec l'administration, des figures de l'industrie comme Sam Altman s'étaient rapidement portées à la défense d'Anthropic. Cette fois, pas un mot. Des employés d'OpenAI et d'autres laboratoires concurrents indiquent ouvertement avoir moins de sympathie pour Anthropic dans cette situation. Leur raisonnement est simple : c'est Anthropic elle-même qui a multiplié les avertissements publics sur les capacités et les dangers potentiels de Claude Mythos, et qui a activement plaidé en faveur d'une réglementation fédérale plus agressive de l'IA. En adoptant ce discours alarmiste, la startup a fourni aux autorités les arguments mêmes qui servent aujourd'hui à justifier des restrictions. La réaction du gouvernement, si elle paraît sévère, n'est pas totalement illogique au regard des déclarations d'Anthropic elle-même. Dario Amodei avait encore publié la semaine dernière un billet dans lequel il comparait la lenteur de la politique en matière d'IA à Sylvebarbe, le personnage du Seigneur des Anneaux, implorant une action gouvernementale plus rapide. L'ironie est cruelle : l'administration a effectivement accéléré, mais pas dans le sens espéré. Cette situation révèle la tension structurelle dans laquelle se trouve Anthropic, tiraillée entre son ambition commerciale et son positionnement comme voix morale de la sécurité de l'IA. Jouer la carte des risques existentiels pour obtenir des règles favorables peut se retourner contre soi, surtout quand les autorités prennent ces risques au pied de la lettre.

💬 Anthropic a construit toute sa crédibilité sur "nos modèles sont dangereux, réglez-les", et voilà qu'on les règle. La logique est difficile à contester depuis l'intérieur. Le silence des concurrents, lui, dit tout.

RégulationReglementation
1 source
Mistral serait valorisée 20 milliards d’euros après une levée de 3 milliards
659Le Big Data 

Mistral serait valorisée 20 milliards d’euros après une levée de 3 milliards

Mistral AI est en discussions avancées pour lever environ 3 milliards d'euros auprès d'investisseurs, une opération qui valoriserait la startup française à près de 20 milliards d'euros selon des informations révélées par Bloomberg le 14 juin 2026. Ce montant représenterait presque un doublement de sa valorisation précédente, établie à 11,7 milliards d'euros lors de son tour de table de série C en septembre 2025. Fondée en avril 2023 par d'anciens chercheurs de Google DeepMind et Meta, Mistral aurait levé au total environ 4 milliards de dollars depuis sa création. Si cette opération se concrétise, l'entreprise rejoindrait le cercle restreint des startups technologiques les plus valorisées d'Europe, aux côtés de groupes bien plus anciens et établis. Cette levée de fonds aurait des conséquences directes sur la capacité de Mistral à rivaliser à plus long terme avec les géants américains. Avec ces nouvelles ressources, l'entreprise pourrait accélérer le développement de ses modèles, renforcer ses infrastructures, elle construit actuellement un centre de données en région parisienne et en dispose d'un autre en Suède, et élargir son offre pour les clients professionnels. Pour les entreprises et institutions européennes, l'enjeu dépasse la simple performance technique : souveraineté numérique, conformité au RGPD, maîtrise des données sensibles et réduction de la dépendance aux fournisseurs américains sont devenus des critères d'achat prioritaires. Mistral a su capitaliser sur cette demande en signant des partenariats avec l'armée française, le gouvernement luxembourgeois, Airbus, BMW et plusieurs grandes banques européennes. Mistral occupe une position singulière dans l'écosystème mondial de l'IA : elle est l'une des rares entreprises non américaines à publier des modèles en open weights tout en commercialisant des versions propriétaires spécialisées, développement logiciel, génération vocale, reconnaissance de caractères. Mais l'écart avec les leaders reste abyssal : OpenAI et Anthropic affichent des valorisations supérieures à 100 milliards de dollars chacune, et bénéficient d'une avance considérable en termes de revenus et de déploiement à grande échelle. La discussion est encore à un stade préliminaire et les conditions pourraient évoluer. Ce qui est clair, en revanche, c'est que les capitaux européens et internationaux se mobilisent autour de l'idée qu'un champion continental de l'IA est non seulement possible, mais nécessaire, et que Mistral est aujourd'hui le principal prétendant à ce rôle.

UEUne valorisation à 20 milliards d'euros renforcerait la capacité de Mistral à proposer aux entreprises et institutions françaises et européennes une alternative souveraine aux fournisseurs américains, avec des garanties accrues sur la conformité RGPD et la maîtrise des données sensibles.

💬 20 milliards, c'est le genre de chiffre qui commence à peser dans une salle de conseil. Ce qui m'intéresse là-dedans, c'est moins la valorisation que ce que ça dit de l'appétit des investisseurs pour un modèle non américain, ouvert ET propriétaire, avec des contrats gouvernementaux dans la poche. Reste que l'écart avec OpenAI ou Anthropic est encore massif, et qu'on parle de discussions préliminaires, pas d'un chèque signé.

BusinessActu
1 source
Washington interdit Mythos 5 : l’Amérique veut contrôler les modèles, quelle sera la réponse des acteurs de l’IA?
660FrenchWeb 

Washington interdit Mythos 5 : l’Amérique veut contrôler les modèles, quelle sera la réponse des acteurs de l’IA?

Le gouvernement américain a ordonné vendredi soir à Anthropic de suspendre immédiatement l'accès à Mythos 5 et Fable 5, ses deux modèles les plus avancés dans le domaine de la cybersécurité. La directive s'appuie sur des impératifs de sécurité nationale et mobilise les pouvoirs de contrôle des exportations dont dispose Washington, un arsenal juridique habituellement réservé aux technologies militaires et aux semi-conducteurs. Anthropic, dont le siège est à San Francisco, n'a eu d'autre choix que de se conformer dans l'immédiat. Cette décision marque un tournant dans la régulation de l'IA générative aux États-Unis. En ciblant spécifiquement les capacités cyber des modèles, Washington envoie un signal clair : certaines aptitudes de l'IA, jugées trop sensibles, relèvent désormais du domaine régalien. Pour les entreprises qui utilisaient ces modèles dans leurs outils de sécurité informatique, la coupure est immédiate et sans alternative garantie. Pour l'industrie dans son ensemble, le précédent est considérable : si les autorités peuvent suspendre un produit commercial au nom de la sécurité nationale, chaque laboratoire d'IA doit désormais intégrer ce risque réglementaire dans sa stratégie produit. Ce mouvement s'inscrit dans une tendance de fond observée depuis 2023, où Washington tente de reprendre la main sur la diffusion des technologies d'IA les plus puissantes, notamment face à la concurrence chinoise. Les contrôles à l'exportation des puces Nvidia avaient ouvert la voie ; le ciblage des modèles eux-mêmes constitue une étape supplémentaire. La question qui se pose désormais est celle de la réponse des autres acteurs du secteur : OpenAI, Google DeepMind et Meta développent tous des modèles aux capacités similaires, et observent attentivement la façon dont Anthropic négocie la suite.

UELes contrôles d'exportation américains sur les modèles IA pourraient restreindre immédiatement l'accès des entreprises européennes aux outils de cybersécurité fondés sur ces modèles, les exposant à un risque réglementaire unilatéral émanant de Washington.

💬 C'est le précédent qu'on craignait tous. Washington vient de démontrer qu'un modèle IA peut être coupé du jour au lendemain, exactement comme on coupe l'accès à une puce Nvidia, au nom de la sécurité nationale. Les boîtes européennes qui avaient intégré ces modèles dans leurs outils de sécu viennent de découvrir leur vraie dépendance.

RégulationReglementation
1 source
Le PDG d'Anthropic réclame une réglementation de l'IA inspirée de la FAA : ce que les entreprises doivent savoir
661VentureBeat AI 

Le PDG d'Anthropic réclame une réglementation de l'IA inspirée de la FAA : ce que les entreprises doivent savoir

Dario Amodei, cofondateur et PDG d'Anthropic, a publié un essai intitulé "Policy on the AI Exponential" dans lequel il appelle le gouvernement américain à réguler la mise sur le marché des modèles d'IA les plus puissants, en s'inspirant explicitement de la Federal Aviation Administration (FAA). Anthropic a simultanément dévoilé deux feuilles de route : un "Advanced AI Framework" ciblant les risques catastrophiques, et un "Economic Policy Framework" sur les déplacements d'emplois liés à l'IA, doté de 350 millions de dollars. Ces annonces surviennent le lendemain du lancement de Claude Fable 5, le modèle grand public le plus puissant de l'entreprise, et de Claude Mythos 5, une version plus restreinte aux capacités offensives et défensives avancées en cybersécurité. Concrètement, le cadre proposé exigerait que tout modèle entraîné avec plus de 10^25 opérations flottantes (FLOPs), ou développé par une entreprise dépassant 500 millions de dollars de revenus IA ou 1 milliard en R&D, soit soumis à des audits obligatoires par des tiers indépendants. En cas de risques biologiques, cybernétiques ou d'autonomie graves, les autorités auraient le pouvoir de bloquer, retarder ou révoquer le déploiement de ces modèles. Pour les entreprises qui s'appuient sur des API d'IA dans leur infrastructure, les conséquences sont immédiates : une mise à jour très attendue pourrait être indéfiniment bloquée par des régulateurs, ou un modèle déjà déployé retiré si des tests post-déploiement révèlent des comportements dangereux. Cela contraint les architectes techniques à concevoir des systèmes multi-modèles pour éviter toute dépendance exclusive à un fournisseur unique. La cybersécurité est au coeur du dispositif : Amodei cite directement les capacités de Claude Mythos Preview, capable de découvrir des vulnérabilités critiques dans les principaux systèmes d'exploitation, comme facteur ayant "bouleversé" le paysage mondial de la sécurité informatique. Les développeurs frontières seraient tenus de protéger les poids de leurs modèles contre les attaques extérieures et les menaces internes, et de signaler les "attaques par distillation", où des acteurs malveillants utilisent un modèle principal pour entraîner un clone moins aligné. Cette prise de position marque un tournant pour Anthropic, longtemps positionné comme champion de la sécurité de l'IA face à OpenAI et Google DeepMind. Pendant trois ans, les entreprises ont construit leurs produits sur l'hypothèse que les API d'IA n'évolueraient que vers plus de puissance. L'introduction d'embargos réglementaires potentiels bouleverse ce postulat. "Nous avons longtemps plaidé pour des exigences de transparence sur l'IA frontière, parce que les risques n'étaient pas encore assez clairs pour être précisément régulés. Ce n'est plus suffisant", a écrit Amodei sur X. Avec ces propositions, Anthropic cherche à façonner le cadre législatif avant que d'autres acteurs, notamment au Congrès américain, ne le définissent à sa place, tout en consolidant sa légitimité auprès des régulateurs et des grandes entreprises clientes.

UESi ce cadre réglementaire américain est adopté, les entreprises européennes dépendant d'API de modèles frontières pourraient subir des interruptions de service imprévues en cas de blocage ou retrait d'un modèle par les autorités américaines.

💬 Lancer Fable 5 la veille de l'essai sur la régulation, c'est du lobbying bien habillé, et personne n'est dupe. Sur le fond, les audits tiers pour les modèles frontières ça a du sens, c'est même ce qu'on attendait depuis un moment. Ce qui change vraiment pour ceux qui construisent sur ces API, c'est la clause retrait post-déploiement : ton modèle en prod peut être coupé du jour au lendemain par des régulateurs, donc le multi-fournisseur passe d'option à urgence.

RégulationReglementation
1 source
Claude Fable 5 : Anthropic donne-t-il vraiment au public toute la puissance de Mythos ?
662Le Big Data 

Claude Fable 5 : Anthropic donne-t-il vraiment au public toute la puissance de Mythos ?

Anthropic a lancé Claude Fable 5 le 9 juin 2026, soit deux mois après avoir refusé de rendre public son modèle Mythos 5, jugé trop sensible pour une diffusion générale. Ce nouveau modèle repose sur la même architecture fondamentale que Mythos 5, mais est accompagné de mécanismes de sécurité qui filtrent automatiquement les requêtes touchant à des domaines à risque : piratage informatique, certaines recherches biologiques, développement d'IA avancées. Lorsqu'une conversation franchit ces seuils, le système bascule discrètement vers un modèle moins performant sur ces sujets spécifiques. Mythos 5 dans sa version complète reste quant à lui réservé à des organisations partenaires sélectionnées dans le cadre du programme de cybersécurité d'Anthropic. Sur les benchmarks de programmation et d'ingénierie logicielle, Fable 5 surpasse toutes les générations précédentes d'Anthropic, devance les modèles concurrents d'OpenAI et de Google, et creuse l'écart à mesure que la complexité des tâches augmente. Anthropic illustre également ses capacités multimodales avec une démonstration atypique : le modèle a terminé Pokémon Rouge Feu en s'appuyant uniquement sur des captures d'écran, sans guide ni carte externe. Ce lancement représente bien plus qu'une mise à jour de produit. Il donne au grand public l'accès le plus complet jamais accordé à une technologie de cette envergure chez Anthropic, tout en maintenant une ligne de contrôle sur les usages les plus sensibles. En pratique, selon l'entreprise, les garde-fous n'interviennent que dans une faible proportion des échanges : la majorité des utilisateurs bénéficie donc des performances complètes du modèle. Pour les développeurs et les entreprises, cela signifie l'accès à un agent de codage et de raisonnement qui s'améliore proportionnellement à la difficulté des problèmes posés, un avantage compétitif concret dans des secteurs où la complexité logicielle est la norme. Ce choix d'Anthropic illustre la tension structurelle qui traverse désormais tout le secteur de l'IA frontier : comment continuer d'innover à marche forcée tout en affichant une posture de responsabilité face aux risques ? Il y a deux mois, l'entreprise avait choisi de bloquer la publication de Mythos en invoquant des préoccupations de sécurité ; aujourd'hui, elle en dérive une version enveloppée de garde-fous et la commercialise. Cette stratégie de dévoilement partiel est aussi une réponse à la pression concurrentielle exercée par OpenAI et Google, qui continuent eux aussi de repousser les limites de ce qu'ils rendent accessible. La vraie question qui se pose désormais est de savoir si ces mécanismes de filtrage tiennent réellement à l'épreuve d'utilisateurs déterminés, ou s'ils constituent avant tout un signal politique destiné à rassurer régulateurs et opinions publiques.

UELa stratégie de dévoilement partiel et les mécanismes de filtrage différencié illustrés par ce lancement alimentent directement le débat réglementaire européen sur l'accès aux modèles frontières dans le cadre de l'AI Act.

💬 Le détail qui me reste en tête : Fable 5 glisse silencieusement vers un modèle dégradé quand tu franchis une zone sensible, sans te dire un mot. C'est malin commercialement, mais ça veut dire qu'on ne sait jamais vraiment quel modèle on a en face. Sur le codage par contre, les perfs sont là, et pour des projets où la complexité grimpe, ça commence à faire une différence visible.

LLMsOpinion
1 source
Le nouveau modèle d'Anthropic cible les utilisateurs avancés mais coupe l'accès aux rivaux IA
663The Information AI 

Le nouveau modèle d'Anthropic cible les utilisateurs avancés mais coupe l'accès aux rivaux IA

Anthropic a publié mardi une version publique de Claude Fable 5, son modèle de nouvelle génération, une itération légèrement bridée du système baptisé en interne "Mythos", dont les rumeurs circulaient depuis plusieurs semaines dans les milieux du développement. Les premiers accès au modèle ont été ouverts aux développeurs d'applications, qui ont pu l'évaluer dans des conditions réelles. Leurs retours confirment l'essentiel des attentes : Fable 5 surpasse nettement les générations précédentes d'Anthropic sur le code, le raisonnement spatial et les tâches de connaissance générale. Une restriction notable a toutefois été intégrée dès le lancement : toute requête touchant à la cybersécurité est automatiquement redirigée vers le modèle Claude Opus 4.8, jugé moins puissant, afin de limiter les risques de détournement. Ce qui frappe dans les retours des testeurs, c'est moins la performance brute que la nature des tâches sur lesquelles Fable 5 se distingue vraiment. Sur des questions simples ou de difficulté intermédiaire, le type de requêtes qu'on adresserait à Google Search ou à ChatGPT, l'amélioration par rapport aux modèles précédents d'Anthropic reste difficile à percevoir. En revanche, sur des travaux longs et complexes, le bond est significatif : des développeurs ont rapporté avoir généré un jeu vidéo complet à partir d'un seul prompt, un cas d'usage qui illustre une montée en gamme qualitative sur les tâches nécessitant planification, cohérence prolongée et enchaînement logique sur plusieurs étapes. Ce lancement s'inscrit dans une compétition frontale entre les grands laboratoires d'IA, où chaque sortie de modèle est scrutée comme un indicateur de positionnement stratégique. Anthropic, adossé à des milliards de dollars d'investissements d'Amazon et Google, cherche à affirmer sa place face à OpenAI et Google DeepMind sur le segment des utilisateurs avancés et des équipes de développement professionnelles. La décision de limiter les capacités liées à la cybersécurité révèle également la pression croissante pesant sur ces entreprises pour démontrer que la puissance des modèles peut être déployée de façon responsable, sans devenir un vecteur d'exploitation. Les prochaines semaines diront si la version complète de Mythos franchit un nouveau palier.

UELes développeurs et équipes techniques en France et en Europe peuvent intégrer ce nouveau modèle dans leurs workflows, avec des gains significatifs sur les tâches complexes de code et de raisonnement.

💬 Le gap sur les tâches simples, je m'en fous. C'est sur les enchaînements longs et complexes que ça change quelque chose, et les testeurs qui ont généré un jeu vidéo complet depuis un seul prompt en sont la meilleure illustration. La restriction cybersec vers Opus 4.8, c'est du pragmatisme habillé en éthique, mais dans le contexte actuel difficile de faire autrement.

LLMsOpinion
1 source
Claude Fable 5 : le premier modèle Mythos est puissant, coûteux et très filtré
664The Decoder 

Claude Fable 5 : le premier modèle Mythos est puissant, coûteux et très filtré

Anthropic a lancé Claude Fable 5, le premier modèle de sa nouvelle gamme Mythos, positionnée au-dessus de la famille Claude 4. Le modèle domine quasiment tous les benchmarks actuels, dont SWE-bench Verified où il atteint 95 %, un score sans précédent pour une IA généraliste. La facture est à la hauteur des ambitions : Fable 5 est facturé 10 ou 50 dollars par million de tokens selon le niveau d'usage, soit le double du tarif d'Opus 4.8, jusqu'ici le modèle le plus cher de la gamme. Cette puissance accrue s'accompagne de contraintes significatives. Les filtres de sécurité, renforcés dans cette version, bloquent environ 9 % des requêtes, un taux notable qui risque de poser problème aux développeurs travaillant dans des secteurs sensibles comme la santé, le droit ou la sécurité informatique. Plus surprenant encore, Anthropic a introduit une politique de rétention des données de 30 jours qui s'applique désormais même aux contrats dits "zero data retention", une décision qui inquiète les entreprises ayant souscrit ces options précisément pour garantir la confidentialité totale de leurs échanges. Ce lancement marque une inflexion stratégique pour Anthropic, qui segmente désormais explicitement son offre par niveau de performance et de coût. La classe Mythos vise les usages professionnels et d'infrastructure les plus exigeants, là où la concurrence avec OpenAI et Google s'intensifie. La question du prix et des restrictions de contenu déterminera si les entreprises adoptent Fable 5 ou maintiennent des solutions moins onéreuses pour leurs pipelines de production.

UELa modification de la politique de rétention des données à 30 jours, y compris pour les contrats 'zero data retention', impose aux entreprises européennes une révision de leur conformité GDPR concernant les échanges avec l'API Anthropic.

💬 95% sur SWE-bench, c'est du solide. La rétention 30 jours imposée même aux contrats "zero data retention", c'est Anthropic qui change les règles en cours de route, et les entreprises européennes vont avoir un vrai sujet GDPR sur les bras. 9% de blocages sur un modèle vendu pour les cas pro les plus sensibles, ça va faire mal en prod.

LLMsOpinion
1 source
[AINews] Claude Fable 5 : impressionnant mais sûr, avec des conditions controversées
665Latent Space 

[AINews] Claude Fable 5 : impressionnant mais sûr, avec des conditions controversées

Anthropic a lancé le 9 juin 2026 Claude Fable 5, son premier modèle dit "Mythos-class" disponible en accès général, soit 63 jours après l'annonce initiale du projet Mythos et 34 jours après un accord avec SpaceX. Ce modèle représente au minimum le double de la taille de Claude Opus 4.8, lui-même sorti il y a à peine deux semaines et déjà considéré comme le meilleur modèle au monde selon plusieurs classements. Fable 5 partage la même architecture de base que Mythos 5, version à accès restreint, avec des garde-fous supplémentaires. Ses performances sont spectaculaires: sur le nouveau benchmark FrontierCode Diamond, le score bondit de 13,4 % à 29,3 % par rapport au modèle précédent. Le tarif API est fixé à environ deux fois le prix d'Opus. La sortie coïncide avec la conférence Claude Tokyo et intervient une semaine avant l'introduction en bourse de SpaceX, dans un contexte où Anthropic et OpenAI ont déposé leurs S-1 à la SEC la même semaine. Deux décisions controversées accompagnent ce lancement et suscitent des réactions vives dans la communauté open source. D'abord, Anthropic abandonne la politique de rétention zéro des données (ZDR): toutes les conversations sur les modèles Mythos-class seront conservées 30 jours, y compris chez les tiers, sans être utilisées pour l'entraînement mais avec un accès humain tracé. Ensuite, Anthropic introduit une suppression silencieuse des capacités liées au développement de LLM concurrents, notamment pour la construction de pipelines de préentraînement, d'infrastructures d'entraînement distribué ou de conception d'accélérateurs ML. Ces limitations, estimées à 0,03 % du trafic total et concentrées dans moins de 0,1 % des organisations, sont invisibles pour l'utilisateur: le modèle ne bascule pas vers un autre, il est simplement rendu moins efficace via modification de prompt, vecteurs de pilotage (steering vectors) ou fine-tuning paramétrique (PEFT). Ce choix délibéré de ne pas signaler la restriction choque une partie de la communauté qui y voit une rupture de transparence. Ce lancement s'inscrit dans une course aux modèles de frontière qui s'est fortement accélérée en 2026, avec Anthropic et OpenAI désormais engagés dans des processus d'introduction en bourse simultanés. Rendre disponible en général un modèle de cette classe représente un effort d'ingénierie considérable, et Anthropic y voit un engagement envers l'accessibilité. Mais la restriction silencieuse sur le développement de modèles concurrents marque un précédent: c'est la première fois qu'un grand laboratoire implémente des contre-mesures techniques invisibles visant directement d'autres acteurs de l'IA. Si cela reste pour l'instant limité, la logique pourrait s'étendre, soulevant des questions profondes sur les limites acceptables entre sécurité, compétition commerciale et liberté de recherche.

UELe changement de politique ZDR (rétention 30 jours sur les modèles Mythos-class) impose une révision de conformité GDPR aux entreprises européennes utilisant l'API Anthropic pour des données sensibles.

💬 Les perfs sont là, le score double sur FrontierCode, le prix aussi, c'est le deal habituel. Ce qui me dérange, c'est la dégradation silencieuse pour les orgs qui construisent des LLMs concurrents, pas parce que c'est massif (0,03% du trafic), mais parce que t'as aucun moyen de savoir si tu es concerné. Anthropic vient d'inventer le DRM pour l'IA.

Apple veut de nouveau sauver le soldat Siri, cette fois avec l’aide de Google
666Next INpact 

Apple veut de nouveau sauver le soldat Siri, cette fois avec l’aide de Google

Apple a profité de sa WWDC 2026 pour dévoiler « Siri AI », une refonte complète de son assistant vocal intégré à iOS 27, iPadOS 27, macOS 27 et visionOS 27. La nouveauté centrale : Apple s'appuie désormais sur les modèles de langage de Google pour alimenter Siri, deux ans après des débuts catastrophiques avec Apple Intelligence. L'assistant rebaptisé sera d'abord accessible aux développeurs via les bêtas immédiates des nouveaux systèmes, mais les utilisateurs grand public devront patienter jusqu'à « plus tard dans l'année », en version bêta. La compatibilité est limitée au matériel récent : iPhone 15 Pro et 16e au minimum, iPad mini A17 Pro, Air ou Pro M1, Mac M1, et Apple Watch Series 10 ou Ultra 2. Le lancement se fera en anglais uniquement, les autres langues suivant ultérieurement. Le changement est loin d'être universel. Les utilisateurs européens d'iPhone et d'iPad sont explicitement exclus du déploiement initial, Apple invoquant la nécessité d'aligner ses pratiques avec le Digital Markets Act de l'Union européenne. C'est un coup dur pour une base d'utilisateurs importante, qui devra attendre qu'Apple trouve un accord avec Bruxelles sur les questions de vie privée et de sécurité. La dépendance assumée aux modèles Google constitue elle-même un aveu : Apple ne dispose pas, en interne, d'une capacité LLM suffisante pour rivaliser avec Google, OpenAI ou Meta sur ce terrain. Lors de la keynote, les temps de réflexion de Siri ont été visibles et jugés longs, ce qui suggère que les défis techniques ne sont pas entièrement résolus. Apple était déjà passé par ce script exactement il y a deux ans, à la WWDC 2024, avec des promesses similaires sur un assistant contextuel, capable de comprendre l'écran, les données personnelles et de naviguer sur le web, promesses largement non tenues. La crise autour de Siri avait été profonde, avec des critiques internes et publiques sur le retard accumulé face à des concurrents comme Google Assistant ou ChatGPT. Cette fois, le constructeur mise sur le partenariat Google et sur des démonstrations non coupées au montage pour regagner la confiance. Parmi les fonctions concrètes annoncées : la gestion de séquences complexes en langage naturel depuis la Dynamic Island, l'extension de l'intelligence visuelle à l'app Appareil photo avec reconnaissance de plats ou partage d'addition, et une intégration plus profonde au contexte personnel (photos, emails, messages). Si les promesses se concrétisent à l'automne, Apple aura enfin livré ce qu'elle vendait depuis 2024, mais l'Europe, elle, attendra encore.

UELes utilisateurs français et européens d'iPhone et d'iPad sont explicitement exclus du déploiement initial de Siri AI en raison du Digital Markets Act, et devront attendre qu'Apple trouve un accord avec Bruxelles sur les questions de vie privée avant d'accéder aux nouvelles fonctionnalités.

💬 Apple qui s'appuie sur Google pour faire tourner Siri, c'est l'aveu le plus net de toute la keynote. Les features annoncées semblent enfin là, pas juste des slides, et les démos non coupées au montage changent un peu la perception. Sauf qu'on est en Europe, donc on repassera encore, le temps qu'Apple règle son cas avec Bruxelles.

L'IA peut désormais gérer votre administration
667MIT Technology Review 

L'IA peut désormais gérer votre administration

L'actualité de l'IA cette semaine illustre à la fois son essor commercial et les tensions qu'il suscite. Anthropic, la startup fondée par d'anciens membres d'OpenAI, a déposé confidentiellement un dossier d'introduction en bourse et vise une entrée sur les marchés dès cet automne, possiblement avant OpenAI elle-même, sans dévoiler de valorisation cible. En parallèle, la Floride est devenue le premier État américain à poursuivre OpenAI en justice, accusant ChatGPT de mettre en danger la sécurité des enfants et de faire primer le profit sur la sûreté publique, selon le procureur général James Uthmeier. Du côté de la cybersécurité, des hackers ont pris le contrôle de comptes Instagram de célébrités en exploitant Meta AI : en demandant simplement des informations d'accès à l'assistant, ils ont contourné les protections habituelles. Enfin, l'Union européenne envisage d'exclure les géants américains du cloud, notamment Amazon, Microsoft et Google, des contrats liés aux infrastructures critiques, dans le cadre d'un effort de souveraineté numérique accéléré par les tensions commerciales avec Washington. Ces événements convergent pour dessiner un secteur à un tournant décisif. L'IPO d'Anthropic s'inscrit dans une course au capital où être premier en bourse pourrait donner un avantage symbolique et financier considérable face à OpenAI, attendue juste après la cotation de SpaceX, valorisée à mille milliards de dollars. La poursuite floridienne signale que la patience des régulateurs américains s'amenuise face aux risques supposés des chatbots grand public, une préoccupation qui pousse déjà plusieurs plateformes à intégrer des vérifications d'âge. La faille Meta AI révèle un risque systémique croissant : déléguer le support client à des intelligences artificielles crée de nouveaux vecteurs d'attaque que les équipes de sécurité n'ont pas encore pleinement anticipés. Pour les petites entreprises, en revanche, l'IA représente une opportunité concrète : les modèles actuels peuvent déjà gérer la comptabilité de base, la facturation, la prise de notes ou la planification des réseaux sociaux, des tâches autrefois réservées aux structures capables d'embaucher des spécialistes. Ces développements s'inscrivent dans un contexte où l'IA s'est imposée en moins de quatre ans comme un enjeu géopolitique, économique et social de premier ordre. La décision européenne d'écarter les fournisseurs américains reflète une défiance croissante vis-à-vis de la dépendance technologique envers les États-Unis, renforcée par les politiques commerciales de l'administration Trump. Pendant ce temps, des universités chinoises affiliées à l'armée cherchent à se procurer des puces Nvidia en dépit des restrictions américaines à l'exportation, et Pékin développerait des outils capables de prédire la dissidence politique. Sur le front scientifique, Meta, Anthropic et DeepMind auraient intensifié leurs recherches sur la conscience des machines, ouvrant un débat philosophique que la communauté scientifique commence à prendre au sérieux. L'ensemble du secteur avance à une vitesse que les cadres réglementaires, les protocoles de sécurité et les normes éthiques peinent encore à suivre.

UEL'UE envisage d'exclure Amazon, Microsoft et Google des contrats d'infrastructures critiques, une décision qui pourrait remodeler le marché du cloud souverain européen et accélérer l'adoption de solutions locales.

💬 L'IA qui gère ton administration, c'est pas du flan, les modèles actuels font vraiment le boulot sur la compta de base ou la facturation. Mais la faille Meta AI cette semaine rappelle un truc simple : brancher un assistant sur des processus sensibles sans repenser la sécurité, c'est offrir un boulevard aux attaquants. Bon, on le savait, mais là c'est plus théorique.

BusinessReglementation
1 source
MiniMax-M3 surpasse GPT-5.5 et Gemini 3.1 Pro sur des benchmarks clés, pour 5 à 10 % du coût
668VentureBeat AI 

MiniMax-M3 surpasse GPT-5.5 et Gemini 3.1 Pro sur des benchmarks clés, pour 5 à 10 % du coût

La startup chinoise MiniMax a lancé dimanche soir son modèle de langage MiniMax-M3, se positionnant d'emblée comme une alternative redoutable aux modèles propriétaires américains. Disponible via l'API MiniMax à un tarif promotionnel de 0,30 dollar par million de tokens en entrée et 1,20 dollar par million en sortie, le modèle affiche des performances supérieures à GPT-5.5 d'OpenAI et à Gemini 3.1 Pro de Google sur plusieurs benchmarks clés, pour 5 à 10 % de leur coût. Même à plein tarif, 0,60 dollar l'entrée et 2,40 dollars la sortie, M3 revient à seulement 8 à 20 % du prix des grands modèles propriétaires concurrents. L'entreprise a également annoncé la mise à disposition sous licence open source avec poids ouverts dans les dix prochains jours, permettant aux entreprises de télécharger et personnaliser le modèle gratuitement. M3 intègre par ailleurs une fenêtre de contexte d'un million de tokens, une multimodalité native, et des capacités avancées en codage et en traitement de tâches agentiques, avec un abonnement mensuel à partir de 20 dollars. Ce lancement remet en question une règle non écrite du secteur : les développeurs devaient jusqu'ici choisir entre des modèles fermés très performants mais coûteux, ou des modèles open source accessibles mais limités sur les raisonnements complexes et les longues séquences. MiniMax-M3 brouille cette frontière en combinant performance de pointe et coût marginal, ce qui pourrait redistribuer les cartes pour les équipes de développement cherchant à intégrer des capacités d'IA avancées sans exploser leurs budgets d'inférence. La possibilité de déployer les poids en local renforce encore l'intérêt pour les entreprises soucieuses de confidentialité ou cherchant à s'affranchir de dépendances API. Cette percée s'inscrit dans un mouvement plus large de rattrapage des laboratoires chinois face aux géants américains. DeepSeek, Alibaba avec Qwen, Moonshot via Kimi et désormais MiniMax publient à un rythme soutenu des modèles compétitifs à des prix agressifs, alimentant une guerre tarifaire qui contraint OpenAI, Google et Anthropic à revoir leurs propres grilles. Sur le plan technique, M3 repose sur une architecture originale baptisée MiniMax Sparse Attention, qui rompt avec les mécanismes d'attention traditionnels dont le coût de calcul croît quadratiquement avec la longueur des séquences. En découpant les matrices clé-valeur en blocs ciblés lus une seule fois, cette approche permet d'être plus de quatre fois plus rapide que des alternatives open source comparables sur de longues séquences. La disponibilité imminente des poids ouverts pourrait transformer M3 en référence de facto pour les entreprises cherchant un modèle frontier déployable en interne.

UELes développeurs et entreprises européens disposent d'une alternative frontier open source déployable localement, réduisant la dépendance aux API américaines et les coûts d'inférence de 80 à 95 %.

💬 C'est le lancement qui va forcer OpenAI et Google à bouger leurs prix, et cette fois c'est difficile à ignorer. 5 à 10 % du coût avec les benchmarks qui suivent, et les poids ouverts dans dix jours pour déployer en local, si tu travailles avec des LLMs tu vas regarder ça de près. Reste à voir ce que ça donne en conditions réelles, mais l'architecture Sparse Attention sur les longues séquences, c'est une vraie proposition technique, pas juste du dumping tarifaire.

LLMsOpinion
1 source
Le jour d'indépendance de Microsoft dans l'IA
669The Information AI 

Le jour d'indépendance de Microsoft dans l'IA

Microsoft a ouvert mardi sa conférence annuelle Build 2026 à San Francisco, devant quelque 2 500 développeurs d'applications. L'événement prend cette année une coloration particulière : il survient deux mois après ce que la presse américaine a qualifié de "découplage conscient" entre Microsoft et OpenAI, et sert de vitrine officielle aux modèles d'intelligence artificielle que Microsoft développe désormais en propre, sans s'appuyer sur la technologie du créateur de ChatGPT ni sur celle d'Anthropic. Pour Microsoft, l'enjeu est de taille : prouver que sa division IA peut rivaliser de façon autonome sur un marché où OpenAI et Anthropic s'imposent comme références. Proposer ses propres modèles aux développeurs signifie réduire sa dépendance structurelle vis-à-vis d'un partenaire avec lequel les tensions se sont accumulées, tout en reprenant la main sur la chaîne de valeur. Pour les milliers d'équipes qui bâtissent des applications sur l'écosystème Microsoft, le signal est clair : une alternative interne existe désormais. Cette émancipation s'inscrit dans une reconfiguration profonde des alliances dans l'industrie de l'IA. Microsoft a investi des milliards de dollars dans OpenAI depuis 2019, intégrant ses modèles dans Azure, Copilot et Office. Mais la multiplication des acteurs, la montée en puissance des modèles open source et les frictions stratégiques entre les deux entreprises ont accéléré l'ambition de Redmond de contrôler sa propre pile technologique. Build 2026 marque symboliquement ce tournant.

UELes entreprises et développeurs européens qui s'appuient sur l'écosystème Microsoft (Azure, Copilot, Office 365) doivent anticiper une transition vers des modèles maison, avec des implications potentielles sur les contrats, les performances et la roadmap de leurs intégrations IA.

💬 Ça faisait longtemps que ça devait arriver. Mettre des milliards dans OpenAI tout en leur confiant toute la chaîne de valeur, c'est le genre de pari qui finit par se retourner contre toi. Bon, sur le papier c'est la bonne décision, mais leurs modèles maison vont devoir tenir la route face à Claude et GPT, pas juste sur les benchmarks.

BusinessOpinion
1 source
Le travail et le code dans une seule IA ? Voici Vibe, la nouvelle ambition de Mistral
670Le Big Data 

Le travail et le code dans une seule IA ? Voici Vibe, la nouvelle ambition de Mistral

Mistral a lancé le 28 mai 2026 Vibe, une plateforme qui fusionne productivité professionnelle et développement logiciel au sein d'un même environnement. Concrètement, Vibe n'est pas un outil entièrement nouveau : il s'agit d'une évolution substantielle de Le Chat, l'assistant IA que la startup française avait déjà déployé. La plateforme intègre désormais un mode Travail, un mode Code, une interface en ligne de commande et une extension VS Code inédite. Elle se connecte à des services tiers comme Slack, GitHub et Google Workspace, et permet à l'IA de lire des fichiers, modifier du code, exécuter des commandes et récupérer du contexte via des mentions "@" dans d'autres outils. L'extension VS Code s'affiche dans un panneau latéral qui prend automatiquement en compte les documents ouverts dans l'éditeur. L'ambition centrale de Vibe est l'unification : éliminer la fragmentation entre les dizaines d'outils qu'utilisent aujourd'hui les équipes techniques et les professionnels. Pour un développeur, pouvoir passer de la revue de code sur GitHub à la rédaction d'un document ou au suivi de projet sans changer d'interface représente un gain de temps potentiellement significatif. Pour les profils non techniques, l'idée d'un agent capable de gérer plusieurs étapes d'un workflow, planification, rédaction, coordination, depuis un seul endroit répond à une vraie friction quotidienne. Mistral positionne ainsi Vibe non plus comme un simple chatbot qui répond à des questions, mais comme un agent qui agit : une distinction que l'ensemble du secteur cherche à matérialiser depuis plusieurs mois. Mistral s'inscrit dans une course très disputée à l'assistant universel, où OpenAI avec ChatGPT, Anthropic avec Claude et Google avec Gemini occupent déjà des positions solides. La startup française, fondée en 2023 et valorisée à plusieurs milliards d'euros, mise sur son ancrage européen et sa maîtrise technique pour se différencier dans ce marché. Vibe représente un pivot stratégique clair : passer d'un fournisseur de modèles de langage à une plateforme applicative complète, capable de fidéliser des utilisateurs dans leur flux de travail quotidien. Reste la question de l'exécution. Les agents IA ont accumulé les promesses depuis un an avec des résultats souvent irréguliers, entre automatisations défaillantes et réponses approximatives dans des contextes complexes. La vraie mesure de Vibe se fera sur la durée et la fiabilité, face à des concurrents qui disposent de ressources considérables et d'écosystèmes déjà très bien établis.

UEMistral, startup française valorisée à plusieurs milliards d'euros, lance une plateforme applicative complète qui concurrence directement les outils américains dominants, renforçant l'offre européenne en matière d'agents IA pour les équipes techniques et professionnelles.

💬 L'extension VS Code qui lit automatiquement ce qui est ouvert dans l'éditeur, c'est la feature qui m'intéresse le plus là-dedans. Mistral passe de fournisseur de modèles à plateforme applicative complète, et j'y vois un pivot logique même si le terrain est occupé par des acteurs avec des budgets autrement plus grands. Reste à voir si ça tient quand les workflows deviennent vraiment complexes.

OutilsOutil
1 source
DataGrail : vos fournisseurs envoient peut-être vos données à des modèles d'IA sans votre accord
671VentureBeat AI 

DataGrail : vos fournisseurs envoient peut-être vos données à des modèles d'IA sans votre accord

DataGrail, plateforme de protection de la vie privée basée à San Francisco, a publié son Privacy and AI Trends Report 2026 après avoir analysé 2 400 logiciels d'entreprise parmi les plus répandus. Le constat est sévère : 63,6 % des éditeurs qui mettent en avant leurs fonctionnalités d'intelligence artificielle ne mentionnent aucun sous-traitant IA tiers dans leurs contrats de traitement des données (DPA). Ces documents juridiques constituent pourtant la base sur laquelle les équipes juridiques et de conformité évaluent les risques liés à leurs fournisseurs. Pour établir ce chiffre, les chercheurs ne se sont pas contentés de lire les contrats : ils ont croisé les DPA avec la documentation produit, les dépôts GitHub, les connexions API et les supports marketing de chacun des 2 400 éditeurs. Résultat : un DPA peut mentionner Claude comme modèle utilisé, tandis que la documentation technique révèle en parallèle des intégrations avec OpenAI et Gemini, sans que cela soit reflété dans aucun document contractuel. Les conséquences concrètes de ce décalage sont potentiellement graves. Une entreprise qui adopte un outil de recrutement basé sur l'IA, effectue un audit de sécurité d'Anthropic sur la foi du DPA, et ignore que l'outil transmet en réalité des milliers de CV contenant adresses, données financières et numéros de sécurité sociale à des modèles jamais évalués, s'expose à des violations réglementaires sérieuses, notamment les règles de la FTC sur la prise de décision automatisée en matière d'emploi. Plus largement, selon le rapport IBM 2025 sur le coût des violations de données, les organisations confrontées à du "shadow AI" affichent un coût moyen de violation de 4,63 millions de dollars, soit 670 000 dollars de plus que celles sans IA non déclarée. Aux États-Unis, les amendes liées à la vie privée ont atteint 3,425 milliards de dollars en 2025, davantage que lors des cinq années précédentes réunies, une tendance que Gartner anticipe en accélération jusqu'en 2028. Ce rapport arrive dans un contexte où l'ensemble de l'industrie logicielle cherche à se repositionner comme acteur de l'IA, souvent plus vite que les processus de gouvernance ne peuvent suivre. Daniel Barber, co-fondateur et PDG de DataGrail, résume la situation : le DPA était censé être le document de référence pour évaluer le risque IA, mais ce n'est plus suffisant en 2026. Le problème structurel tient au fait que les sous-traitants IA se multiplient, changent rapidement, et que les éditeurs ne mettent pas systématiquement à jour leur documentation juridique en conséquence. L'enjeu pour les entreprises est désormais d'aller au-delà de la lecture des contrats et d'auditer activement les connexions techniques réelles de leurs fournisseurs pour savoir précisément quels modèles traitent leurs données et celles de leurs clients.

UELes entreprises européennes utilisant des SaaS intégrant l'IA s'exposent à des violations du RGPD si leurs fournisseurs sous-traitent des données à des modèles d'IA non déclarés dans les DPA, contournant les obligations de traçabilité et de transparence imposées par le règlement européen.

💬 63% des éditeurs IA ne mentionnent aucun sous-traitant dans leur DPA, le chiffre est difficile à avaler. Ton outil de recrutement SaaS audité côté Anthropic peut très bien envoyer tes CV à OpenAI et Gemini en parallèle, sans que rien n'apparaisse dans aucun contrat. Le DPA comme unique référence de risque, c'est fini.

ÉthiqueReglementation
1 source
Face à la « course aux armements », le Pape érige l’éthique de l’IA en impératif
672Next INpact 

Face à la « course aux armements », le Pape érige l’éthique de l’IA en impératif

Le pape Léon XIV a publié ce lundi 25 mai 2026, jour de Pentecôte, sa première encyclique intitulée Magnifica Humanitas, « Magnifique humanité », un document de 90 pages entièrement consacré à l'intelligence artificielle. Fait sans précédent dans l'histoire pontificale, il a lui-même présenté le texte depuis le Vatican. Élu en mai 2025, ce mathématicien de formation avait fait de l'IA l'une de ses priorités dès le début de son pontificat, en créant notamment une commission vaticane interdicastère sur le sujet. La préparation de l'encyclique a impliqué des acteurs inattendus : l'évêque Paul Tighe, référent numérique du Saint-Siège, a contribué à la rédaction de la « Constitution de Claude », document normatif et d'entraînement des modèles d'Anthropic, et rencontré George Osborne, responsable des relations gouvernementales d'OpenAI. À la présentation du texte, Léon XIV était accompagné de Christopher Olah, cofondateur d'Anthropic, qui a salué l'initiative en déclarant que l'industrie avait besoin d'« une critique éclairée qui alertera nos laboratoires lorsque nous nous égarerons ». Sur le fond, l'encyclique constitue une critique directe de la concentration du pouvoir technologique entre les mains d'acteurs privés. Invoquant l'image de la tour de Babel pour décrire une industrie qui « prétend dominer le ciel », le pape met en garde contre la déshumanisation que peut engendrer cette course aux armements numérique. Il oppose à cette trajectoire le modèle de la reconstruction des murs de Jérusalem, où la responsabilité est partagée entre tous, prêtres, artisans, femmes, jeunes. Trois principes de la doctrine sociale catholique structurent ses propositions : la justice sociale, la destination universelle des biens, en clair, la déconcentration des brevets, algorithmes, plateformes et données, et la subsidiarité, soit le renforcement de corps intermédiaires au service du bien commun. Ce texte s'inscrit dans une longue tradition d'engagement social de l'Église catholique, dont le marqueur historique est l'encyclique Rerum Novarum de 1891, publiée il y a exactement 135 ans en réponse aux dérives du capitalisme industriel. Léon XIV poursuit et amplifie le travail de dialogue entamé par François avec la Silicon Valley, notamment via la Human Technology Foundation du père dominicain Éric Salobir, qui réunit régulièrement à Rome des représentants de Google, Amazon et Meta. En choisissant Anthropic comme interlocuteur privilégié plutôt qu'OpenAI, et en associant un chercheur en interprétabilité à la présentation d'un texte doctrinal majeur, le Vatican signale une volonté de peser concrètement sur les standards de l'industrie, à un moment où les pressions géopolitiques et commerciales fragilisent la capacité des laboratoires à s'autoréguler.

UEL'encyclique pontificale pourrait renforcer les positions européennes dans les négociations sur les standards éthiques de l'IA, notamment via l'implication du père dominicain français Éric Salobir comme intermédiaire entre le Vatican et l'industrie tech.

💬 Un évêque catholique qui contribue à la "Constitution de Claude" d'Anthropic, c'est le genre de détail qui te fait relire deux fois. Le Vatican ne moralise plus depuis les hauteurs, il s'installe à la table de l'industrie, et en choisissant Olah plutôt que les commerciaux d'OpenAI, il signale clairement ses alliances. Une encyclique ne remplace pas un règlement contraignant, mais comme tentative de peser sur les normes industrielles depuis l'extérieur, c'est le truc le plus sérieux qu'on ait vu depuis des mois.

ÉthiqueOpinion
1 source
Qwen3.7-Max d'Alibaba peut fonctionner de manière autonome pendant 35 heures et prend en charge des frameworks externes comme Claude Code d'Anthropic
673VentureBeat AI 

Qwen3.7-Max d'Alibaba peut fonctionner de manière autonome pendant 35 heures et prend en charge des frameworks externes comme Claude Code d'Anthropic

Alibaba a publié Qwen3.7-Max, un modèle d'intelligence artificielle conçu pour opérer de façon entièrement autonome pendant des dizaines d'heures d'affilée. La démonstration la plus frappante fournie par l'équipe Qwen : le modèle a été connecté à un serveur isolé équipé d'un processeur T-Head ZW-M890 PPU, une architecture matérielle qu'il n'avait jamais rencontrée lors de son entraînement. Sa mission consistait à optimiser un noyau de calcul d'attention. En 35 heures consécutives, Qwen3.7-Max a exécuté 1 158 appels d'outils distincts, réalisé 432 évaluations du noyau, diagnostiqué des erreurs de compilation et amélioré le code de façon itérative jusqu'à atteindre une accélération de 10x en moyenne géométrique. Ses concurrents chinois directs, GLM-5.1 de z.ai et Kimi K2.6 de Moonshot, n'ont atteint respectivement que 7,3x et 5,0x, avant d'interrompre leurs sessions faute de progression. Autre signe de rupture avec les pratiques antérieures de l'équipe Qwen : ce modèle est propriétaire et accessible uniquement via API payante, contrairement aux versions précédentes publiées en open source. Ce virage stratégique a des implications concrètes pour l'ensemble du secteur. En choisissant un modèle fermé, Alibaba s'aligne sur OpenAI et Google, qui réservent leurs modèles les plus puissants à leurs offres commerciales. Cela change la donne pour les entreprises et développeurs qui comptaient sur les modèles Qwen ouverts pour des déploiements locaux ou des usages sensibles. Par ailleurs, le fait que le modèle soit uniquement accessible depuis des points d'accès basés en Chine soulève des questions de conformité réglementaire pour les entreprises américaines et européennes soumises à des obligations de souveraineté des données, notamment dans le cadre de contrats gouvernementaux. Le modèle supporte néanmoins des environnements d'exécution externes comme Claude Code d'Anthropic, ce qui lui ouvre un spectre d'utilisation plus large dans les workflows d'ingénierie logicielle. La performance de Qwen3.7-Max repose sur ce qu'Alibaba appelle l'« environment scaling » : plutôt que d'entraîner le modèle uniquement sur du texte, il a été exposé à un vaste éventail d'environnements agentiques dynamiques, lui permettant de développer un raisonnement à long horizon sans perdre le fil de ses instructions. Le modèle intègre également un mécanisme de détection du reward hacking, qui lui permet d'identifier lorsqu'il tente de contourner ses propres règles d'évaluation et de s'autocorriger. Dans le benchmark YC-Bench, qui simule un an de cycle de vie d'une startup, Qwen3.7-Max a généré l'équivalent de 2,08 millions de dollars de revenus virtuels, soit près du double de son prédécesseur Qwen3.6-Plus. La sortie de ce modèle intervient quelques mois après le départ de plusieurs responsables clés de l'équipe Qwen, une transition qui explique en partie l'abandon de l'open source au profit d'une monétisation directe.

UEL'accessibilité exclusive via des points d'accès basés en Chine contraint les entreprises et administrations européennes soumises aux obligations de souveraineté des données à exclure ce modèle de leurs workflows malgré ses performances agentiques exceptionnelles.

💬 Le vrai sujet, c'est pas les 35 heures de run autonome (impressionnant, certes, mais on s'y attendait). C'est qu'Alibaba tourne la page de l'open source et passe tout fermé, avec des endpoints uniquement basés en Chine, ce qui met Qwen3.7-Max hors jeu pour toute équipe européenne sous contraintes de souveraineté. Ceux qui avaient construit leurs workflows sur les modèles Qwen ouverts vont devoir se retourner.

LLMsOpinion
1 source
Cohere maîtrise la quantification sans perte et les citations natives avec Command A+, son premier modèle Apache 2.0
674VentureBeat AI 

Cohere maîtrise la quantification sans perte et les citations natives avec Command A+, son premier modèle Apache 2.0

Le laboratoire canadien d'intelligence artificielle Cohere a dévoilé Command A+, un modèle de langage de 218 milliards de paramètres conçu pour le raisonnement complexe, le traitement de documents multimodaux et les workflows agentiques. La particularité de cette annonce réside dans sa licence : pour la première fois de son histoire, Cohere publie ses poids sous licence Apache 2.0, une des licences open source les plus permissives, disponibles gratuitement sur Hugging Face. Le modèle repose sur une architecture Sparse Mixture-of-Experts (MoE) : seulement 25 milliards de paramètres sur les 218 sont activés lors de chaque génération. Cette efficacité architecturale est renforcée par une quantification poussée. Command A+ est disponible en format 4-bit (W4A4), ce qui lui permet de tourner sur un seul GPU NVIDIA Blackwell B200 ou deux NVIDIA H100, tout en atteignant 375 tokens par seconde avec une latence de 113 millisecondes au premier token, soit 63 % plus rapide et 17 % moins de latence que son prédécesseur Command A Reasoning. Un tokeniseur entièrement repensé assure par ailleurs un support natif de 48 langues, avec une meilleure efficacité pour les langues non européennes. Ce lancement marque une percée technique sur la quantification sans perte, un problème qui freinait jusqu'ici l'adoption des grands modèles en production. En ne quantifiant à 4 bits que les réseaux d'experts MoE tout en conservant la pleine précision sur les couches d'attention, et en appliquant une technique appelée Quantization-Aware Distillation, Cohere parvient à comprimer massivement le modèle sans dégrader ses capacités de raisonnement. Pour les entreprises, cela signifie concrètement qu'un modèle de niveau frontier peut désormais s'exécuter en interne, sur leur propre infrastructure, sans dépendre d'API tierces ni exposer leurs données sensibles à des tiers. C'est une rupture nette avec les modèles propriétaires de OpenAI ou Anthropic, estimés à plusieurs milliers de milliards de paramètres et uniquement accessibles via le cloud. Ce pari s'inscrit dans la stratégie dite d'IA souveraine défendue par Aidan Gomez, cofondateur de Cohere et ancien chercheur chez Google, l'un des auteurs du célèbre article « Attention Is All You Need » qui a posé les bases des transformers modernes. L'idée est de permettre aux gouvernements, grandes entreprises et développeurs de déployer des modèles de niveau frontier entièrement sous leur contrôle. Cette publication intervient peu après l'annonce d'une fusion entre Cohere et le laboratoire allemand Aleph Alpha, deux acteurs qui misent sur la souveraineté numérique face à la domination américaine. Avec Command A+, Cohere ne s'attaque pas seulement au marché des API cloud : il repositionne l'open source comme une réponse crédible aux géants propriétaires, au moment où les exigences réglementaires et la sensibilité aux données poussent de plus en plus d'organisations à reprendre la main sur leur infrastructure IA.

UELa fusion Cohere–Aleph Alpha et la licence Apache 2.0 de Command A+ permettent aux organisations européennes de déployer un modèle frontier en interne sur leur propre infrastructure, renforçant la souveraineté numérique face aux plateformes cloud américaines et facilitant la conformité à l'AI Act.

💬 Deux H100 pour un modèle de 218 milliards de paramètres sans perte de qualité, c'est pas rien. La technique qui quantifie uniquement les couches MoE tout en gardant la pleine précision sur l'attention, c'est une vraie trouvaille, pas juste de la compression agressive qui dégrade en douce. Et Cohere qui ouvre ses poids en Apache 2.0 pour la première fois de son histoire, ça c'est le signal fort pour toutes les orgas européennes qui voulaient du souverain sans se faire distancer techniquement.

LLMsOpinion
1 source
Si Google n'arrive pas à rendre les agents IA utiles, personne ne le pourra peut-être
675The Verge AI 

Si Google n'arrive pas à rendre les agents IA utiles, personne ne le pourra peut-être

Lors de sa conférence Google I/O 2026, Google a présenté une nouvelle génération d'agents IA capables de fonctionner en continu en arrière-plan. Ces agents sont conçus pour accomplir des tâches concrètes : collecter des informations sur le web, planifier des événements, résumer une boîte mail ou un calendrier, et interagir de façon autonome avec les services de l'utilisateur. Google affirme que ces agents s'intégreront de façon transparente dans l'écosystème de ses produits existants, de Gmail à Google Calendar en passant par la recherche. Cette annonce intervient dans un contexte de transformation rapide du marché des agents IA. Pendant des années, les promesses d'assistants personnels intelligents ont buté sur des résultats décevants, livrant des outils bien en deçà des attentes. Mais depuis six mois, la donne change, portée notamment par le succès viral d'OpenClaw, une plateforme open-source d'agents IA qui a démontré que ces systèmes pouvaient enfin rendre des services réels et mesurables. Pour les professionnels et les particuliers, la perspective de déléguer des tâches répétitives à un agent autonome fiable représente un gain de productivité potentiellement majeur. Google occupe une position stratégique unique dans cette course : l'entreprise contrôle à la fois les modèles de langage (Gemini), les données utilisateurs via ses services et l'infrastructure cloud mondiale. Ses concurrents, d'OpenAI à Anthropic, développent des agents similaires, mais aucun ne dispose du même accès direct aux données du quotidien de centaines de millions d'utilisateurs. La question n'est plus de savoir si les agents IA deviendront utiles, mais lequel des grands acteurs parviendra à concrétiser cette promesse à grande échelle en premier.

UELes agents Google s'intégreront dans Gmail et Google Calendar utilisés par des millions d'Européens, soulevant des enjeux de conformité RGPD autour de l'accès autonome aux données personnelles.

💬 Google a un avantage que personne d'autre n'a : tes données. Pas juste un accès via API, mais vingt ans de Gmail, Calendar, Search, tous connectés entre eux. La vraie question c'est pas si les agents vont marcher, c'est si Google va réussir à ne pas les tuer avant qu'ils décollent.

OutilsOutil
1 source
Google I/O 2026 : Les rumeurs disaient vrai, Gemini 3.5 débarque et va tout balayer
676Le Big Data 

Google I/O 2026 : Les rumeurs disaient vrai, Gemini 3.5 débarque et va tout balayer

Lors de la conférence Google I/O du 19 mai 2026, le géant de Mountain View a officiellement lancé la série Gemini 3.5, avec en tête de cortège le modèle Flash 3.5, disponible immédiatement dans le monde entier. Présenté par le PDG Sundar Pichai comme le modèle le plus puissant jamais développé par Google, Gemini 3.5 Flash est désormais le modèle par défaut dans l'application Gemini, dans le mode IA de Google Search, ainsi que dans Google AI Studio et Android Studio via l'API Gemini. Sur les benchmarks publiés par l'entreprise, il atteint 76,2 % sur Terminal-Bench 2.1 contre 70,3 % pour Gemini 3.1 Pro, et 1656 points sur GDPval-AA Elo en tâches agentiques contre 1314 pour son prédécesseur. Google affirme également qu'il génère jusqu'à quatre fois plus de tokens par seconde que des modèles concurrents comparables, tout en coûtant deux à trois fois moins cher dans certains scénarios. Ce lancement redistribue les cartes dans la course aux modèles de langage. Un modèle dit "Flash", habituellement positionné sur la vitesse et l'économie plutôt que la performance brute, surpasse ici le modèle Pro de la génération précédente sur presque tous les tests significatifs, y compris le codage et les tâches agentiques. Google revendique même des performances proches de Claude Opus 4.7 Max d'Anthropic sur l'Artificial Analysis Intelligence Index, tout en étant environ douze fois plus rapide. Pour les développeurs et les entreprises qui construisent des applications sur des API LLM, ce rapport performance-coût représente un argument commercial direct : des capacités de niveau frontier sans la facture associée. Google a par ailleurs annoncé que Gemini 3.5 a été conçu dans le respect de son Frontier Safety Framework, avec des outils d'analyse interprétative capables d'examiner les mécanismes de raisonnement internes du modèle avant chaque réponse. Ce lancement s'inscrit dans une dynamique d'accélération tous azimuts, après que Google a progressivement regagné du terrain sur OpenAI et Anthropic depuis fin 2024. L'autre annonce majeure de l'I/O 2026 est Gemini Spark, un agent IA personnel conçu pour fonctionner en continu sur Google Cloud, natif dans l'écosystème Workspace, Gmail, Docs, Sheets, Slides, et activable simplement par e-mail. Sur mobile, la fonction Android Halo permettra de suivre en temps réel les actions de l'agent. Selon Josh Woodward, vice-président de Google Labs, Spark peut déjà rédiger automatiquement rapports et brouillons d'e-mails à partir de données issues de documents et feuilles de calcul, et certaines PME l'utiliseraient déjà en production. La convergence entre un modèle frontier accessible, une infrastructure cloud intégrée et un agent personnel persistant dessine la stratégie Google pour 2026 : verrouiller l'utilisateur dans un écosystème IA complet avant que la concurrence ne se consolide.

UEGemini 3.5 Flash est immédiatement disponible via l'API Gemini et Google AI Studio, offrant aux développeurs et entreprises européennes un modèle frontier moins cher et plus rapide susceptible d'accélérer l'adoption IA dans les PME qui s'appuient sur l'écosystème Google Workspace.

💬 Quand le Flash dépasse le Pro de la génération d'avant sur presque tous les benchmarks, c'est que la taxonomie des modèles est en train d'exploser, et c'est une bonne nouvelle pour les devs. Quatre fois plus rapide, deux à trois fois moins cher, performances frontier : difficile d'ignorer ça si tu construis quelque chose sur API. Mais l'annonce qui m'intéresse vraiment, c'est Spark : Google ne vend pas un modèle, il vend une serrure.

LLMsOpinion
1 source
Mistral prépare son IA chasseuse de failles, Microsoft déploie déjà son armée d’agents
677Next INpact 

Mistral prépare son IA chasseuse de failles, Microsoft déploie déjà son armée d’agents

Mistral AI travaille au développement d'un modèle d'intelligence artificielle dédié à la détection de failles de sécurité dans le code de banques européennes, selon des informations rapportées par Bloomberg. La startup française, qui collaborait déjà avec ses clients du secteur bancaire sur ces problématiques avant le lancement de Mythos par Anthropic en avril dernier, prépare désormais une version "clé en main" pour un déploiement plus large. En parallèle, Microsoft a dévoilé MDASH, pour "Microsoft Security multi-model agentic scanning harness", un système de sécurité agentique mobilisant plusieurs modèles d'IA complémentaires et une centaine d'agents spécialisés. Sur le benchmark CyberGym, qui regroupe plus de 1 500 tâches reproduisant des vulnérabilités réelles, MDASH affiche un taux de réussite de 88,45 %, soit environ 5 points de mieux que son concurrent le plus proche. Le système a déjà permis d'identifier 16 vulnérabilités dans l'authentification et l'infrastructure réseau de Windows, dont 4 failles critiques permettant l'exécution de code à distance. La détection automatisée de vulnérabilités par IA est en train de passer du statut d'expérimentation de laboratoire à celui d'outil industriel déployé à grande échelle, c'est le constat que Microsoft formule explicitement. Pour les entreprises et institutions gérant des infrastructures critiques, l'enjeu est considérable : des systèmes capables d'ausculter des millions de lignes de code en continu représentent un saut qualitatif majeur face aux audits manuels. Mais cette puissance soulève aussi une question de dépendance stratégique : qui contrôle ces outils, et sur quel code s'appliquent-ils ? C'est précisément ce point qu'Arthur Mensch, directeur général de Mistral, a soulevé cette semaine devant la commission d'enquête sur les vulnérabilités numériques à l'Assemblée nationale. Sans nommer Anthropic, il a pointé le risque de confier le code et les bases de données de l'armée française à un modèle étranger comme Mythos, actuellement distribué au compte-gouttes auprès d'organisations majoritairement américaines, sans accès accordé à l'Europe. L'argument est limpide : la cybersécurité par IA est un sujet régalien, et la souveraineté technologique devient un critère non négociable. Mistral se positionne ainsi comme alternative européenne crédible dans une course qui oppose déjà Anthropic, OpenAI avec son initiative Daybreak, et désormais Microsoft. La question des certifications, des audits et de la gouvernance de ces outils devrait rapidement s'imposer dans les débats réglementaires européens.

UEMistral AI développe un modèle de cybersécurité souverain ciblant les banques européennes et les infrastructures militaires françaises, tandis qu'Arthur Mensch alerte l'Assemblée nationale sur le risque stratégique de confier le code de l'armée française à des modèles américains sans accès garanti à l'Europe.

💬 Ce que dit Mensch à l'Assemblée, c'est pas du lobbying habillé en souveraineté, c'est du bon sens brut : si tu confies le code de l'armée française à un modèle américain qui filtre lui-même ses accès européens, tu perds la main sur ta propre infrastructure critique. Microsoft affiche 88% sur CyberGym et 4 failles critiques trouvées dans Windows, le niveau monte vite. Mistral a l'argument souveraineté, reste à voir si ça pèse face à des chiffres pareils.

SécuritéOpinion
1 source
Claude Mythos devient le premier modèle d'IA à réussir toutes les simulations de cyberattaque de l'agence britannique de sécurité de l'IA
678The Decoder 

Claude Mythos devient le premier modèle d'IA à réussir toutes les simulations de cyberattaque de l'agence britannique de sécurité de l'IA

L'Institut de sécurité de l'IA du Royaume-Uni (AISI) vient de réviser à la baisse, pour la deuxième fois, son estimation du rythme de progression des capacités cyber de l'IA. D'abord ramenée de huit à 4,7 mois, cette estimation s'est avérée trop conservatrice : Claude Mythos Preview d'Anthropic et GPT-5.5 d'OpenAI ont dépassé ce seuil révisé. Mythos est devenu le premier modèle à réussir l'intégralité des simulations d'attaques informatiques conçues par l'AISI, une performance qu'aucun système d'IA n'avait atteinte jusqu'ici. Cet accomplissement soulève des interrogations sérieuses sur la vitesse à laquelle les modèles d'IA atteignent des capacités offensives critiques. Que des systèmes commerciaux puissent désormais réussir toutes les simulations d'attaques d'un organisme gouvernemental de sécurité signifie que le fossé entre capacités théoriques et menaces réelles se referme rapidement. Pour les entreprises, gouvernements et infrastructures critiques, cela implique que les défenses actuelles pourraient devenir insuffisantes face à des acteurs malveillants équipés de ces outils. Logan Graham, responsable du red teaming chez Anthropic, tempère pourtant l'ampleur de l'exploit : "D'ici un an, Mythos paraîtra probablement assez limité", a-t-il déclaré. Cette mise en perspective illustre le problème central auquel font face les régulateurs : les benchmarks de sécurité deviennent obsolètes presque aussi vite qu'ils sont établis. L'AISI, créé en 2023 sous l'impulsion du gouvernement britannique pour évaluer les risques des modèles frontier, doit désormais accélérer sa propre cadence d'évaluation pour rester pertinent face à une progression que plus personne ne semble capable d'anticiper correctement.

UELes gouvernements et infrastructures critiques européens devront réviser leurs référentiels d'évaluation cyber, ce milestone influençant directement les exigences de l'AI Act sur les modèles frontier à haut risque.

💬 L'AISI s'est trompé deux fois sur la cadence de progression, et s'est quand même fait dépasser. Le vrai souci, c'est pas qu'un modèle passe tous les tests cyber d'un organisme gouvernemental, c'est que ces tests soient périmés avant même d'être publiés. La citation de Logan Graham résume bien : dans un an, Mythos paraîtra limité, et je pense qu'il n'exagère pas.

SécuritéOpinion
1 source
Sam Altman témoigne au procès contre Elon Musk
679The Verge AI 

Sam Altman témoigne au procès contre Elon Musk

Sam Altman, PDG d'OpenAI, a pris la parole à la barre lors d'un procès fédéral en Californie qui l'oppose à Elon Musk. Altman et Greg Brockman, président d'OpenAI, figurent comme principaux défendeurs dans cette affaire intentée par Musk. Les trois hommes faisaient partie de l'équipe fondatrice d'OpenAI, et Musk avait investi jusqu'à 38 millions de dollars dans la startup dès ses débuts avant de quitter le conseil d'administration et de rompre avec ses anciens associés. Ce procès représente l'aboutissement juridique d'une guerre ouverte entre deux figures majeures de la tech. Musk accuse Altman et Brockman d'avoir trahi la mission d'origine d'OpenAI, initialement fondée comme organisation à but non lucratif dédiée au bien commun, en la transformant en entreprise commerciale au service d'intérêts privés. Si Musk obtenait gain de cause, cela pourrait contraindre OpenAI à revoir en profondeur sa gouvernance et sa structure capitalistique, au moment où la société cherche à boucler des levées de fonds colossales. Les tensions entre Musk et Altman couvaient depuis plusieurs années, ponctuées d'échanges publics acerbes et d'accusations mutuelles. Après son départ d'OpenAI, Musk a fondé xAI et lancé le modèle Grok, se positionnant comme concurrent direct de ChatGPT. Ce procès se déroule dans un contexte de bataille pour l'hégémonie dans l'IA générative, où chaque acteur cherche à imposer sa vision, qu'elle soit commerciale, idéologique ou géopolitique.

UESi le tribunal contraint OpenAI à revoir sa gouvernance ou sa structure capitalistique, cela pourrait indirectement affecter ses déploiements et partenariats en Europe, sans impact réglementaire direct sur la France ou l'UE.

💬 Ce procès, c'est d'abord deux ego milliardaires qui règlent leurs comptes en robe de chambre juridique. Musk a quitté OpenAI, monté xAI, lancé Grok, et il vient expliquer à un juge que la mission non-lucrative a été trahie, lui qui se bat pour exactement la même hégémonie commerciale. Bon, la question de la gouvernance d'OpenAI reste réelle, mais l'intention derrière, elle se lit de loin.

Un médaillé Fields : ChatGPT 5.5 Pro a produit une recherche niveau doctorat en moins de deux heures sans aide humaine
680The Decoder 

Un médaillé Fields : ChatGPT 5.5 Pro a produit une recherche niveau doctorat en moins de deux heures sans aide humaine

Le mathématicien Timothy Gowers, lauréat de la médaille Fields en 1998 et l'une des figures les plus respectées des mathématiques contemporaines, a soumis ChatGPT 5.5 Pro à une série de problèmes ouverts en théorie des nombres. En moins d'une heure, le modèle d'OpenAI a transformé une borne exponentielle en borne polynomiale, une avancée non triviale dans ce domaine. Un chercheur du MIT impliqué dans l'évaluation a qualifié l'idée centrale trouvée par le modèle de "complètement originale". L'ensemble du travail a été accompli en moins de deux heures, sans aucune intervention humaine. Cette performance marque un tournant dans la perception des capacités des grands modèles de langage en mathématiques de haut niveau. Jusqu'ici, les LLMs excellaient à résoudre des exercices connus ou à vérifier des démonstrations existantes, mais produire une idée originale en recherche pure était considéré hors de portée. Si un modèle peut désormais contribuer à des problèmes ouverts au niveau doctorat, cela remet en question la définition même de la contribution mathématique humaine. La réflexion de Gowers est particulièrement révélatrice : selon lui, le nouveau critère pour évaluer une contribution mathématique sera désormais de prouver quelque chose qu'un LLM ne peut pas faire. Ce déplacement de la référence illustre une transformation profonde du rapport entre l'IA et la recherche fondamentale. OpenAI, qui avait déjà annoncé des ambitions en mathématiques formelles avec des outils comme le prover interne, franchit ici une étape qualitative qui devrait accélérer les débats sur la co-authorship humain-IA dans les publications académiques.

UELes institutions académiques françaises et européennes devront réviser leurs critères d'évaluation de la contribution scientifique et leurs règles de co-authorship face à des LLMs capables de produire des résultats originaux en mathématiques fondamentales.

💬 Une borne exponentielle transformée en polynomiale en moins d'une heure, sur un problème ouvert, validé par Gowers lui-même. Ce n'est pas un benchmark bidouillé, c'est de la recherche fondamentale originale. Et la réaction de Gowers dit tout : la nouvelle mesure de la contribution mathématique, ça sera désormais de prouver ce qu'un LLM ne peut pas faire.

LLMsOpinion
1 source
Anthropic annonce un rythme de revenus annuels de 30 milliards de dollars après une croissance de 80x
681VentureBeat AI 

Anthropic annonce un rythme de revenus annuels de 30 milliards de dollars après une croissance de 80x

Anthropic a annoncé lors de sa conférence développeurs "Code with Claude" le 7 mai 2026 avoir atteint un taux de revenus annualisé de 30 milliards de dollars, contre environ 9 milliards fin 2025. La progression est spectaculaire : 87 millions de dollars en janvier 2024, 1 milliard en décembre 2024, 14 milliards en février 2026, 19 milliards en mars, et 30 milliards en avril. Sur scène, le PDG Dario Amodei a reconnu que cette croissance avait dépassé toutes les projections internes : la société avait planifié une croissance de 10x, mais a enregistré 80x au premier trimestre sur base annualisée, une performance qu'il a lui-même qualifiée de "complètement folle" et "trop difficile à gérer". Cette accélération hors norme a d'ailleurs provoqué des tensions sur les capacités de calcul disponibles. À titre de comparaison, Salesforce a mis vingt ans pour atteindre 30 milliards de revenus annuels ; Anthropic y est parvenu en moins de trois ans d'existence. Ce bond repose en grande partie sur un seul produit : Claude Code, l'outil de programmation agentique lancé publiquement à mi-2025. Il a atteint 1 milliard de dollars de revenus annualisés en six mois, puis 2,5 milliards dès février 2026. Depuis janvier 2026, le nombre d'utilisateurs actifs hebdomadaires a doublé et les abonnements entreprises ont quadruplé. L'outil ne se contente pas de suggérer des extraits de code : il lit une base de code complète, planifie une séquence d'actions, les exécute avec de vrais outils de développement, évalue les résultats et ajuste son approche de manière autonome. Un développeur moyen passe désormais 20 heures par semaine à l'utiliser. Anthropic compte aujourd'hui plus de 1 000 clients entreprises dépensant chacun plus d'un million de dollars par an en services Claude, un chiffre qui a doublé depuis février. Ce qui rend la dynamique particulièrement difficile à contrer pour la concurrence, c'est qu'Anthropic utilise Claude Code pour développer Claude Code lui-même. La majorité du code produit en interne est désormais généré par l'outil, les ingénieurs se concentrant sur l'architecture et l'orchestration de plusieurs agents en parallèle. Amodei a précisé que 2026 est la première année où les pull requests internes d'Anthropic ont augmenté grâce au travail de Claude sur sa propre base de code, créant une boucle de rétroaction que les concurrents sans produit équivalent ne peuvent pas répliquer. Dans un secteur où OpenAI, Google et Meta investissent des dizaines de milliards pour rester compétitifs, Anthropic, valorisé 61,5 milliards de dollars lors de sa dernière levée de fonds, s'impose comme le premier acteur à transformer la demande d'IA générative en croissance de revenus véritablement industrielle.

UELa croissance fulgurante d'Anthropic renforce la dépendance stratégique des développeurs et entreprises européens vis-à-vis des plateformes d'IA agentique américaines, un enjeu que l'AI Act ne réglemente qu'indirectement.

💬 30 milliards en moins de trois ans, le chiffre est spectaculaire, et Dario lui-même dit que ça le dépasse. Ce qui me frappe vraiment : 20 heures par semaine en moyenne sur Claude Code, ce n'est plus de l'assistance au développement, c'est le poste de travail. Et quand tu vois que la moitié du code d'Anthropic est produit par Claude Code qui développe Claude Code, là tu comprends pourquoi personne d'autre ne peut reprendre le terrain.

BusinessActu
1 source
La loi sur l’IA va être « simplifiée », et ce n’est pas une bonne nouvelle pour les consommateurs européens
68201net 

La loi sur l’IA va être « simplifiée », et ce n’est pas une bonne nouvelle pour les consommateurs européens

L'Union européenne a annoncé jeudi 7 mai un accord politique visant à "simplifier" l'AI Act, sa législation phare sur l'intelligence artificielle adoptée en 2024. Conclu à Bruxelles, cet accord prévoit d'alléger les obligations imposées aux entreprises développant ou déployant des systèmes d'IA sur le territoire européen. Les détails précis des modifications n'ont pas encore tous été rendus publics, mais l'orientation est nette : réduire la charge réglementaire pour faciliter l'innovation, au nom de la compétitivité du continent. Cette révision anticipée inquiète profondément les associations de défense des consommateurs, qui y voient un recul historique sur les protections acquises. L'AI Act prévoyait des exigences strictes de transparence, de traçabilité et d'évaluation des risques pour les systèmes dits "à haut risque", ceux déployés dans la santé, la justice, l'emploi ou les services publics. Un assouplissement de ces règles affaiblirait concrètement les recours disponibles pour les citoyens européens confrontés à des décisions automatisées qui les affectent directement. Ce revirement s'inscrit dans un contexte de pression intense exercée par l'administration Trump, qui a explicitement demandé à Bruxelles de démanteler ses réglementations numériques. Les lobbys américains de la tech, représentant notamment Google, Meta et OpenAI, poussent depuis des mois pour un texte moins contraignant. Paradoxalement, ces mêmes acteurs reprochent à l'Europe de ne pas aller assez loin dans certains assouplissements. Cette "simplification" pose une question fondamentale sur la capacité de l'UE à maintenir ses standards face aux pressions diplomatiques et économiques qui convergent pour les éroder.

UEL'assouplissement de l'AI Act réduit directement les protections des citoyens français et européens face aux décisions automatisées dans la santé, l'emploi et la justice, en affaiblissant les obligations de transparence et de traçabilité imposées aux systèmes à haut risque.

💬 On attendait la simplification pour les PME, pas le démantèlement des protections citoyennes. L'AI Act a mis trois ans à s'imposer face aux lobbys, et là on efface les obligations de transparence sur les systèmes à haut risque en quelques mois, sous pression explicite de Washington. Appeler ça de la "compétitivité", c'est du flan.

RégulationReglementation
1 source
Mistral AI lance des agents distants dans Vibe et Mistral Medium 3.5 avec un score de 77,6 % sur SWE-Bench Verified
683MarkTechPost 

Mistral AI lance des agents distants dans Vibe et Mistral Medium 3.5 avec un score de 77,6 % sur SWE-Bench Verified

Mistral AI vient d'annoncer deux avancées majeures : le lancement des agents distants dans Vibe, sa plateforme d'agents de codage, et la mise en préversion publique de Mistral Medium 3.5, un nouveau modèle dense de 128 milliards de paramètres. Ce modèle devient immédiatement le modèle par défaut dans Vibe et dans Le Chat, l'assistant grand public de Mistral. Sur le benchmark SWE-Bench Verified, référence du secteur pour évaluer la capacité d'un modèle à résoudre des problèmes réels tirés de dépôts GitHub open source, Medium 3.5 obtient un score de 77,6%, devançant Devstral 2 ainsi que Qwen3.5 397B A17B. Le modèle dispose d'une fenêtre de contexte de 256 000 tokens, soit environ 200 000 mots traités en une seule passe, suffisant pour raisonner sur l'intégralité d'une grande base de code. Il est également multimodal, avec un encodeur visuel développé intégralement par Mistral plutôt que réutilisé depuis des modèles comme CLIP, ce qui lui confère davantage de flexibilité face aux images de tailles et formats variés. La bascule vers les agents distants représente un changement fondamental dans la façon dont les développeurs interagissent avec Vibe. Jusqu'ici, les sessions Vibe s'exécutaient localement, liant l'agent au terminal de l'utilisateur. Désormais, plusieurs sessions peuvent tourner en parallèle dans le cloud pendant que le développeur fait autre chose. Il est même possible de "téléporter" une session locale en cours vers le cloud sans perdre l'historique, l'état de la tâche ni les validations en attente. Chaque session s'exécute dans un environnement isolé, et lorsqu'une tâche est terminée, l'agent peut ouvrir directement une pull request sur GitHub et notifier le développeur. Les intégrations couvrent également Linear, Jira pour la gestion des tickets, Sentry pour les incidents, et Slack ou Teams pour les notifications. Le Chat de Mistral bénéficie de la même infrastructure via les Workflows de Mistral Studio, la même couche d'orchestration développée en interne avant d'être ouverte aux entreprises puis au grand public. Cette annonce s'inscrit dans une compétition de plus en plus dense sur le segment des agents de codage, où Mistral affronte notamment GitHub Copilot Workspace, Cursor et des offres d'OpenAI ou d'Anthropic. En positionnant Vibe comme une alternative accessible depuis la ligne de commande ou directement depuis Le Chat, Mistral mise sur la praticité et l'intégration native à la chaîne de développement existante. Le choix de construire son propre encodeur visuel plutôt que de s'appuyer sur des composants standard témoigne d'une volonté de maîtrise technique complète sur la pile. Avec Medium 3.5, Mistral qualifie ce modèle de premier "flagship merged model", suggérant une évolution de sa stratégie produit vers des modèles unifiés capables de couvrir instruction, raisonnement et code sans multiplication des variantes spécialisées.

UEMistral AI, entreprise française, consolide sa position de champion européen de l'IA avec un modèle de pointe et une plateforme d'agents de codage qui concurrencent directement les offres américaines sur le marché du développement logiciel.

LLMsOpinion
1 source
GPT-5.5 aussi redoutable que Mythos en matière de hacking ? Les tests inquiètent
684Le Big Data 

GPT-5.5 aussi redoutable que Mythos en matière de hacking ? Les tests inquiètent

L'AI Security Institute a publié fin avril 2026 les résultats de tests comparatifs entre GPT-5.5, le dernier modèle d'OpenAI, et Mythos, le modèle phare d'Anthropic, sur des scénarios de cyberattaque simulés. Sur CyberBench et la simulation britannique TLO en 32 étapes, GPT-5.5 atteint 71,4 % de réussite sur des tâches de niveau expert, contre 68,6 % pour Mythos. Plus révélateur encore : GPT-5.5 a réussi à compléter la simulation TLO de bout en bout dans 2 cas sur 10, Mythos dans 3 cas sur 10. Cette simulation reproduit une cyberattaque complète incluant la reconnaissance, l'exploitation de vulnérabilités, l'élévation de privilèges, les mouvements latéraux et l'analyse cryptographique, soit des opérations normalement réservées à des professionnels de la sécurité offensive. Ce franchissement de seuil est significatif parce qu'il marque un glissement qualitatif : ces modèles ne se contentent plus d'assister un humain dans une tâche ponctuelle, ils sont désormais capables d'exécuter des chaînes d'attaque complètes et cohérentes sur plusieurs dizaines d'étapes. Une erreur en cours de séquence suffit normalement à faire échouer l'ensemble de la simulation, ce qui rend la réussite partielle de ces deux systèmes d'autant plus notable. Pour les équipes de sécurité défensive, les entreprises et les gouvernements, cela signifie que des capacités offensives jusqu'ici réservées à des groupes d'attaquants expérimentés pourraient devenir accessibles via des interfaces conversationnelles grand public, abaissant drastiquement le niveau technique requis pour mener des intrusions sophistiquées. Mythos faisait déjà l'objet d'inquiétudes avant la publication de ces résultats : Anthropic lui-même avait appelé à la prudence quant à son déploiement, et la Maison-Blanche avait exprimé des réserves sur les risques d'usage incontrôlé. GPT-5.5 s'invite maintenant dans ce débat avec des performances quasi équivalentes, ce qui complique la gestion du risque : il ne s'agit plus d'un modèle isolé jugé trop puissant, mais d'une tendance de fond touchant les grands laboratoires simultanément. L'écart entre les deux modèles est mince sur les benchmarks, mais GPT-5.5 se distingue par une progression plus régulière à travers les étapes, tandis que Mythos affiche des avancées plus irrégulières. La trajectoire commune des deux systèmes, clairement visible sur les graphiques de l'AI Security Institute, indique que davantage de tokens disponibles se traduit directement par une plus grande profondeur d'exécution dans les simulations d'attaque, ouvrant la question de savoir où se situe la prochaine limite à franchir.

UELes administrations et entreprises européennes font face à un risque accru d'intrusions sophistiquées facilitées par des interfaces grand public, une menace que l'ENISA et les obligations de l'AI Act sur les systèmes à haut risque devront intégrer en urgence.

💬 Le score à 71%, c'est presque secondaire. Ce qui compte, c'est qu'il n'y a plus un modèle isolé à surveiller, les deux plus grands labos arrivent au même résultat simultanément, et ça rend la gestion du risque autrement plus compliquée. 2 fois sur 10, 3 fois sur 10, une chaîne d'attaque complète en 32 étapes sans assistance humaine : le niveau d'entrée pour mener une intrusion sophistiquée vient de baisser d'un cran.

SécuritéOpinion
1 source
Dopés par l’IA, les géants du cloud projettent 700 milliards $ d’investissements en 2026
685Next INpact 

Dopés par l’IA, les géants du cloud projettent 700 milliards $ d’investissements en 2026

Microsoft, Meta, Amazon et Alphabet ont publié simultanément leurs résultats financiers le 29 avril 2026, tous supérieurs aux attentes, et tous accompagnés d'une révision à la hausse de leurs prévisions d'investissement dans l'intelligence artificielle. Additionnées, leurs enveloppes atteignent désormais 700 milliards de dollars pour l'année en cours. Google Cloud se distingue particulièrement avec un chiffre d'affaires bondissant de 12,26 à 20 milliards de dollars sur le seul premier trimestre, soit une progression de 60 %, adossée à un carnet de commandes dépassant 460 milliards. La maison mère Alphabet clôture le trimestre à près de 110 milliards de chiffre d'affaires, en hausse de 22 % sur un an, portée aussi bien par la publicité search (+20 %, à 60 milliards) que par YouTube. Amazon Web Services, leader mondial du cloud, enregistre pour sa part une croissance de 28 % sur un an, à 37,6 milliards de dollars, sa meilleure performance depuis quinze trimestres. Le trimestre a également vu AWS signer une trentaine de partenariats stratégiques avec OpenAI, Anthropic, NVIDIA, Meta, l'armée américaine et le groupe français Veolia. Ces chiffres signalent que l'IA n'est plus seulement un poste de dépenses pour les géants du cloud : elle est devenue un moteur de revenus mesurable. Sundar Pichai indique que les modèles Gemini traitent désormais plus de 16 milliards de tokens par minute via l'API, soit une hausse de 60 % par rapport au trimestre précédent. Chez Amazon, la division Bedrock aurait traité sur ce seul trimestre plus de tokens que sur toutes les années précédentes cumulées. Au-delà du cloud stricto sensu, l'IA irrigue désormais la publicité programmatique et les outils d'automatisation des achats médias, élargissant son impact à l'ensemble de l'écosystème numérique. Amazon monte également en puissance dans les semiconducteurs, avec une activité projetée à plus de 20 milliards de dollars annuels, positionnant le groupe comme fournisseur et premier client de ses propres puces. Cette publication groupée intervient dans un contexte où les interrogations sur une éventuelle bulle spéculative autour de l'IA se multiplient, sans que les résultats opérationnels ne les confirment pour l'instant. Les quatre groupes ont massivement investi dans les data centers et les infrastructures GPU depuis 2023, des dépenses qui commencent à se traduire en revenus récurrents via les contrats cloud longue durée. La concentration des investissements autour de quelques acteurs, AWS, Google Cloud, Azure, renforce une logique d'oligopole qui rend l'entrée sur ce marché structurellement difficile pour les challengers. Les prochains trimestres seront déterminants pour confirmer si cette dynamique tient face aux incertitudes tarifaires américaines et à la montée en puissance de concurrents chinois comme Alibaba Cloud ou Huawei.

UELe groupe français Veolia a signé un partenariat stratégique avec AWS, et la concentration des 700 milliards d'investissements autour de quelques acteurs américains renforce la dépendance structurelle des entreprises et États européens vis-à-vis du cloud américain.

💬 700 milliards, c'est plus une promesse, c'est du revenu qui rentre. AWS à +28 %, Google Cloud à +60 % sur un seul trimestre, bon, le discours sur la bulle spéculative devient difficile à tenir. Le vrai sujet, c'est l'oligopole qui se cimente, et pour les entreprises et États européens, cette dépendance va coûter cher.

BusinessOpinion
1 source
Bilan IA Avril 2026 : Le Basculement Définitif vers l’IA Agentique et Physique
686Le Big Data 

Bilan IA Avril 2026 : Le Basculement Définitif vers l’IA Agentique et Physique

Avril 2026 restera comme le mois où l'industrie de l'intelligence artificielle a définitivement tourné la page des chatbots. Le 23 avril, OpenAI a lancé GPT-5.5 (nom de code "Spud"), un modèle conçu pour l'ingénierie logicielle en totale autonomie, intégrant une fonction "Thinking" qui optimise ses raisonnements internes pour réduire la consommation de tokens et domine les nouveaux benchmarks agentiques Terminal-Bench 2.0. Le lendemain, DeepSeek a publié les poids de son modèle V4 (1,6 trillion de paramètres) sous licence MIT, compatible avec les puces Huawei Ascend pour contourner les embargos américains, déclenchant une guerre des prix mondiale avec une fenêtre de contexte d'un million de tokens. Meta, rattrapée par un scandale de manipulation de benchmarks sur Llama 4, a abandonné l'open-source et créé les Meta Superintelligence Labs avant de dévoiler Muse Spark, un modèle propriétaire doté d'un mode d'orchestration multi-agents baptisé "Contemplating". Microsoft a lancé sa gamme MAI pour réduire sa dépendance à OpenAI, tandis que des robots humanoïdes ont été déployés pour la première fois dans les usines BMW et Boston Dynamics. Le premier trimestre 2026 affichait 242 milliards de dollars investis dans le secteur, dont 80 % captés par OpenAI, Anthropic, xAI et Waymo. Ce basculement vers l'IA agentique et physique redessine concrètement les modes de production industrielle et de développement logiciel. L'IA consomme désormais 10 % de l'électricité américaine, forçant l'industrie à se tourner vers le nucléaire, les algorithmes neuro-symboliques cent fois moins énergivores, et même des centres de données spatiaux. Sur le front de la cybersécurité, le modèle Claude Mythos d'Anthropic a démontré sa capacité à identifier seul des failles "Zero-Day" critiques ; jugé trop dangereux pour une diffusion publique, il a été intégré au Project Glasswing, une alliance de géants technologiques chargée de corriger les vulnérabilités du web mondial en temps réel. Ces développements imposent à tous les acteurs une course contre la montre entre puissance de déploiement et maîtrise des risques systémiques. Ce mois sous tension s'inscrit dans une bataille géopolitique et judiciaire qui dépasse largement les laboratoires. En Europe, l'EU AI Act entrera en application stricte en août 2026, contraignant les entreprises à documenter et auditer leurs systèmes d'IA. La Chine bloque tout rachat de ses pépites technologiques par des capitaux américains, tandis que DeepSeek V4, en s'appuyant sur les puces Huawei, illustre la résilience de l'écosystème chinois face aux embargos. Aux États-Unis, Elon Musk a engagé ce que les médias spécialisés surnomment déjà "le procès du siècle" contre OpenAI, au coeur duquel se pose une question fondamentale : à qui appartiendra l'intelligence artificielle générale une fois atteinte ? La réponse conditionnera l'architecture de pouvoir du secteur pour la décennie à venir.

UEL'entrée en application stricte de l'EU AI Act en août 2026 contraint les entreprises opérant en Europe à documenter et auditer leurs systèmes d'IA sous peine de sanctions, à un moment où la compétition mondiale s'intensifie brutalement.

💬 Ce qui me retient le plus ce mois, c'est pas les robots dans les usines BMW ni la guerre des prix DeepSeek, c'est Anthropic qui planque Claude Mythos parce qu'il repère des zero-days tout seul et que c'est jugé trop risqué pour une sortie publique. On arrive à un stade où les labos n'ont plus confiance dans leurs propres créations, et ça, c'est pas banal. Le procès Musk contre OpenAI, au fond, c'est juste la même question posée autrement : à qui appartient le truc une fois qu'on l'a construit ?

LLMsActu
1 source
Le nouveau modèle V4 de DeepSeek : trois raisons pour lesquelles il compte
687MIT Technology Review 

Le nouveau modèle V4 de DeepSeek : trois raisons pour lesquelles il compte

DeepSeek a publié vendredi une version préliminaire de V4, son nouveau modèle phare attendu depuis plusieurs mois. Disponible en open source, le modèle se décline en deux versions : V4-Pro, conçu pour le code et les tâches d'agents complexes, et V4-Flash, plus léger et optimisé pour la vitesse. Sur les principaux benchmarks, V4-Pro rivalise avec les meilleurs modèles fermés du marché, se situant au niveau de Claude Opus de chez Anthropic, de GPT-5 d'OpenAI et de Gemini de Google. Face aux autres modèles open source, notamment Qwen d'Alibaba ou GLM de Z.ai, V4 les surpasse en codage, mathématiques et disciplines scientifiques. L'entreprise rapporte qu'une enquête interne auprès de 85 développeurs expérimentés a montré que plus de 90 % d'entre eux classent V4-Pro parmi leurs premiers choix pour les tâches de programmation. DeepSeek a également optimisé le modèle pour des frameworks d'agents populaires comme Claude Code ou CodeBuddy. Ce qui distingue V4, c'est son rapport performance-prix particulièrement agressif. V4-Pro est facturé 1,74 dollar par million de tokens en entrée et 3,48 dollars en sortie, une fraction du tarif pratiqué par OpenAI ou Anthropic pour des modèles comparables. V4-Flash descend encore plus bas, à 0,14 dollar par million de tokens en entrée et 0,28 dollar en sortie, ce qui en fait l'un des modèles haut de gamme les moins chers du marché. Pour les développeurs et les entreprises, cela signifie un accès à des capacités d'IA frontier sans les coûts habituellement prohibitifs des API propriétaires. Les deux versions intègrent un mode de raisonnement pas à pas, et V4 introduit une nouvelle architecture qui améliore significativement la gestion de longs contextes, ouvrant la voie à des applications sur des documents ou des bases de code entières. Cette sortie intervient dans un contexte particulier pour DeepSeek. La firme de Hangzhou avait provoqué un séisme dans l'industrie en janvier 2025 avec R1, un modèle de raisonnement entraîné avec des ressources limitées qui avait mis en question la suprématie américaine en matière d'IA. Depuis, l'entreprise a traversé des mois difficiles, marqués par des départs de personnels clés, des retards dans ses lancements et une surveillance accrue des gouvernements américain et chinois. V4 constitue son retour sur la scène des modèles frontier, même si l'effet de surprise de R1 ne se reproduira probablement pas. L'enjeu est désormais de confirmer que DeepSeek peut tenir dans la durée face à des adversaires disposant de ressources computationnelles autrement plus importantes, et de s'imposer comme une alternative crédible et pérenne dans un écosystème open source en pleine effervescence.

UELes développeurs et entreprises européennes accèdent à des capacités frontier en open source à des tarifs très inférieurs aux API propriétaires, élargissant concrètement les options pour les startups et PME du continent.

LLMsOpinion
1 source
GPT-5.5 vs Claude Opus 4.7 : quelle est vraiment l’IA la plus puissante ?
688Le Big Data 

GPT-5.5 vs Claude Opus 4.7 : quelle est vraiment l’IA la plus puissante ?

OpenAI et Anthropic ont tous deux lancé leurs nouveaux modèles phares à quelques semaines d'intervalle : GPT-5.5 et Claude Opus 4.7. Sur l'Artificial Analysis Intelligence Index, qui agrège les performances sur un large éventail de tâches, GPT-5.5 s'impose avec un score de 60 contre 57 pour Claude Opus 4.7, le plaçant en tête du classement mondial toutes catégories confondues. Mais les benchmarks spécialisés racontent une histoire différente : sur le GPQA Diamond, un test composé de questions de niveau doctorat en sciences dures, Claude Opus 4.7 obtient 94,2 % contre 93,6 % pour GPT-5.5. Sur l'Humanity's Last Exam, conçu pour résister à la mémorisation et testant le raisonnement interdisciplinaire pointu, l'avantage d'Anthropic se creuse davantage : 46,9 % pour Opus 4.7 contre 41,4 % pour GPT-5.5 sans outils. Les deux modèles s'appuient sur des tokens de raisonnement invisibles qui améliorent leurs capacités mais les rendent plus lents et sensiblement plus chers à l'usage. L'écart entre les deux modèles révèle deux profils d'excellence distincts qui auront des conséquences concrètes sur les choix des développeurs et des entreprises. GPT-5.5 domine sur les capacités agentiques, utilisation d'un terminal, navigation web autonome, cybersécurité offensive, ce qui en fait l'outil de référence pour l'automatisation et les workflows qui nécessitent qu'une IA "fasse des choses" de façon autonome. Claude Opus 4.7 s'impose en revanche sur les tâches qui exigent un raisonnement profond, la résolution de problèmes complexes sans réponse évidente, et la stratégie à long terme. Pour les équipes qui construisent des agents autonomes, le choix penchera vers OpenAI ; pour celles qui ont besoin d'analyse, de synthèse ou de conseil de haut niveau, Anthropic prend l'avantage. Cette confrontation s'inscrit dans une phase d'accélération sans précédent de la course aux modèles de base. OpenAI et Anthropic se disputent la position de référence auprès des entreprises, des développeurs et des plateformes tierces, sachant que le modèle adopté en infrastructure devient difficile à déloger. L'émergence des tokens de raisonnement comme standard, une technique issue des travaux sur les "chain-of-thought" et popularisée par o1 d'OpenAI fin 2024, marque un tournant : les deux acteurs ont convergé vers la même architecture de base, rendant les différenciations de plus en plus fines et contextuelles. La prochaine étape sera probablement de voir qui parvient à maintenir ce niveau de performance tout en réduisant les coûts d'inférence, condition sine qua non pour une adoption à grande échelle.

UELes développeurs et entreprises en France et en UE devront arbitrer entre GPT-5.5 pour les workflows agentiques et Claude Opus 4.7 pour l'analyse approfondie lors de leurs décisions d'infrastructure IA.

💬 Ce que je retiens, c'est pas le score global, c'est la ligne de partage qui s'impose : GPT-5.5 pour orchestrer des agents autonomes, Opus 4.7 pour les tâches où tu as besoin que le modèle réfléchisse vraiment. C'est utile pour choisir son stack, mais le sous-texte de tout ça, c'est que les deux convergent sur les tokens de raisonnement, et ça coûte cher. Reste à voir qui réussit à tenir ce niveau de performance tout en faisant baisser l'addition.

LLMsOpinion
1 source
DeepSeek dévoile un nouveau modèle d'IA, un an après avoir secoué ses rivaux américains
689The Verge AI 

DeepSeek dévoile un nouveau modèle d'IA, un an après avoir secoué ses rivaux américains

DeepSeek, la startup chinoise d'intelligence artificielle, a dévoilé vendredi une préversion de son prochain modèle phare, baptisé V4. La société affirme que ce modèle open source rivalise avec les systèmes propriétaires des grands acteurs américains, notamment Anthropic, Google et OpenAI. DeepSeek met en avant des progrès significatifs par rapport aux versions précédentes, en particulier dans les capacités de génération de code, un domaine devenu central pour les agents IA et qui a propulsé le succès d'outils comme ChatGPT Codex ou Claude Code. La sortie s'accompagne d'une annonce notable pour l'industrie chinoise des semi-conducteurs : DeepSeek souligne explicitement la compatibilité de V4 avec les puces Huawei fabriquées en Chine. Ce lancement est stratégiquement important à plusieurs titres. Sur le plan technologique, une IA open source capable de tenir tête aux meilleurs modèles fermés du monde redistribue les cartes en matière d'accès et d'adoption. Pour les entreprises et développeurs, cela signifie potentiellement des alternatives performantes sans dépendance aux API américaines. Côté hardware, valider des puces Huawei comme substrat de développement IA de pointe est un signal fort dans un contexte de restrictions américaines à l'exportation de semi-conducteurs vers la Chine. Cette annonce intervient environ un an après que DeepSeek avait secoué la Silicon Valley avec la sortie de ses modèles R1 et V3, provoquant une chute en bourse de plusieurs acteurs du secteur et relançant le débat sur l'efficacité des restrictions technologiques imposées à Pékin. La course entre les États-Unis et la Chine pour la suprématie en IA s'accélère, et DeepSeek s'impose comme l'un des rares laboratoires non américains capable de fixer le rythme du secteur.

UELa disponibilité d'un modèle open source compétitif offre aux entreprises et développeurs européens une alternative crédible aux API américaines, renforçant les ambitions de souveraineté numérique de l'UE.

💬 Ce n'est pas le modèle en lui-même qui m'intéresse, c'est la puce Huawei en dessous. DeepSeek vient de montrer qu'on peut entraîner un concurrent sérieux aux meilleurs modèles du monde sans NVIDIA, ce qui rend les restrictions américaines à l'export beaucoup moins rassurantes pour Washington. Reste à voir si ça tient sur des benchmarks indépendants, mais en un an ils ont forcé la Silicon Valley à revoir ses calculs deux fois.

LLMsOpinion
1 source
L'IA à base d'agents pousse les prix à la hausse, Deepseek sort un modèle compétitif pour presque rien
690The Decoder 

L'IA à base d'agents pousse les prix à la hausse, Deepseek sort un modèle compétitif pour presque rien

Le laboratoire chinois Deepseek a lancé deux nouveaux modèles, V4-Pro et V4-Flash, dotés d'une architecture pouvant atteindre 1 600 milliards de paramètres et d'une fenêtre de contexte d'un million de tokens. La sortie s'accompagne d'un article technique détaillant les choix d'entraînement, les techniques de distillation et le matériel utilisé. Les tarifs annoncés se situent très nettement en dessous de ceux pratiqués par OpenAI, Google et Anthropic, confirmant la stratégie agressive de Deepseek sur le marché des API. Cette annonce intervient dans un contexte où les grands acteurs occidentaux font l'inverse : face à l'explosion des usages agentiques, OpenAI et Anthropic ont récemment revu leurs prix à la hausse et imposé des plafonds de consommation sur certains modèles. Deepseek propose une alternative performante à une fraction du coût, ce qui représente une pression directe sur les marges et les modèles économiques des leaders du secteur. Pour les développeurs et les entreprises qui cherchent à déployer des agents autonomes à grande échelle, l'équation coût-performance devient difficile à ignorer. Deepseek s'est imposé depuis début 2025 comme l'un des acteurs les plus disruptifs du marché mondial des LLM, en montrant qu'il est possible d'obtenir des résultats compétitifs avec des budgets d'entraînement bien inférieurs à ceux de ses concurrents américains. La publication du papier technique accompagnant V4-Pro et V4-Flash s'inscrit dans cette logique de transparence qui renforce la crédibilité du laboratoire et alimente le débat sur l'avantage réel des géants du cloud face à une concurrence ouverte et low-cost.

UELes développeurs et entreprises européens déployant des agents autonomes peuvent réduire significativement leurs coûts d'API en adoptant DeepSeek V4-Pro/V4-Flash, remettant en question l'équation coût-performance avec leurs fournisseurs actuels.

LLMsOpinion
1 source
☕️ SpaceX aurait courtisé Mistral avant son deal avec Cursor
691Next INpact 

☕️ SpaceX aurait courtisé Mistral avant son deal avec Cursor

SpaceX négocie l'acquisition de Cursor pour 60 milliards de dollars, avec une clause de rupture fixée à 10 milliards si l'accord venait à échouer. Mais avant de se focaliser sur ce deal, xAI, la filiale IA d'Elon Musk désormais fusionnée avec SpaceX, avait envisagé une tout autre stratégie : un partenariat à trois impliquant à la fois Cursor et la startup française Mistral AI. Selon Business Insider, ces discussions auraient eu lieu au plus haut niveau de l'entreprise, Elon Musk lui-même ayant porté l'idée d'une collaboration tripartite pour rivaliser directement avec Anthropic et OpenAI sur le terrain des outils de codage assisté par IA. En parallèle, Microsoft aurait également examiné un rachat potentiel de Cursor avant de décider de ne pas formuler d'offre, selon des sources de CNBC. L'enjeu est considérable : le marché des assistants de code IA est en pleine explosion et SpaceX accuse un retard significatif. Michael Nicolls, président de xAI et dirigeant de SpaceX, le reconnaissait lui-même dans un mémo interne début avril, estimant que son entreprise était « clairement en retard » face à la concurrence. En face, les chiffres parlent d'eux-mêmes : GitHub Copilot de Microsoft revendique 4,7 millions d'utilisateurs payants, soit une hausse de 75 % sur un an selon le CEO Satya Nadella, tandis que Codex d'OpenAI vient d'atteindre 4 millions d'utilisateurs actifs, gagnant un million en deux semaines seulement. Cursor, avec son positionnement d'éditeur de code natif IA, représente pour SpaceX une voie d'entrée rapide dans ce segment sans avoir à construire de zéro. L'intérêt porté à Mistral s'explique en partie par les liens déjà tissés entre les deux organisations : Devendra Chaplot, membre fondateur de Mistral AI et cocréateur de ses premiers modèles de langage, a rejoint xAI où il supervise aujourd'hui l'entraînement des LLM. Ce rapprochement illustre la guerre des talents et des actifs technologiques qui structure désormais l'industrie IA, où les grandes entreprises cherchent à consolider rapidement des capacités en matière de modèles et d'interfaces développeurs. L'acquisition de Cursor permettrait à SpaceX de s'implanter directement dans les workflows des ingénieurs logiciels, un segment stratégique que Codex d'OpenAI ambitionne également de dominer dans le cadre de sa future « superapp ». La bataille pour capter les développeurs professionnels, nouveau terrain de jeu des géants de l'IA, ne fait que commencer.

UEMistral AI, fleuron français de l'IA européenne, se retrouve au cœur des manœuvres d'acquisition américaines, soulevant des questions directes sur la souveraineté technologique européenne et le risque de captation d'un champion national par xAI/SpaceX.

💬 Musk voulait Mistral dans le deal, et c'est le détail qui retient mon attention. Ça confirme que les modèles français ont une valeur concrète sur le marché américain, pas juste sur le papier de la souveraineté numérique. Reste à voir combien de temps Mistral peut jouer dans cette cour sans finir absorbé.

BusinessActu
1 source
Pourquoi Mythos d'Anthropic a galvanisé l'industrie chinoise de la cybersécurité
692SCMP Tech 

Pourquoi Mythos d'Anthropic a galvanisé l'industrie chinoise de la cybersécurité

Le modèle d'intelligence artificielle Claude Mythos Preview, développé par la start-up américaine Anthropic, a suscité une vive réaction dans les milieux de la cybersécurité et de la finance en Chine. Ce système se distingue par sa capacité à identifier et exploiter de manière autonome des vulnérabilités dans des systèmes informatiques d'entreprise et financiers, à un niveau qui surpasse les outils conventionnels actuellement déployés dans ces secteurs. Le modèle n'a pas été rendu public, ce qui n'a pas empêché son existence d'alimenter de nombreuses discussions dans l'industrie chinoise. L'impact est double : côté défensif, les équipes de sécurité voient dans ce type de modèle un accélérateur pour la détection de failles avant qu'elles ne soient exploitées malicieusement ; côté offensif, la perspective d'un outil IA capable de mener des attaques autonomes modifie profondément le calcul des risques pour les institutions financières et les infrastructures critiques. Pour les professionnels de la cybersécurité en Chine, l'émergence de telles capacités chez un acteur américain constitue à la fois un signal d'alerte et une source d'inspiration pour leurs propres développements. Ce regain d'intérêt s'inscrit dans la compétition technologique sino-américaine autour de l'IA, où chaque avancée d'un camp alimente la course de l'autre. Anthropic, fondée en 2021 par d'anciens chercheurs d'OpenAI, s'est imposée comme l'un des acteurs les plus sérieux du secteur, avec des modèles Claude reconnus pour leurs performances en raisonnement complexe. Le fait que Mythos ne soit pas encore accessible au grand public n'a fait qu'amplifier la curiosité et les spéculations autour de ses capacités réelles.

UELes infrastructures critiques et institutions financières européennes sont exposées aux mêmes risques offensifs liés à l'IA autonome, renforçant l'urgence d'adapter les cadres NIS2 et DORA à ces nouvelles menaces.

693Next INpact 

Anthropic et Amazon étendent leur accord, 5 milliards de dollars contre 5 GW

Anthropic et Amazon ont annoncé lundi un accord stratégique de grande ampleur, combinant un investissement massif en capital et une promesse de dépenses garanties en infrastructure. Amazon injecte 5 milliards de dollars dans Anthropic, avec une option ouverte sur 20 milliards supplémentaires dont les conditions restent floues. En contrepartie, Anthropic s'engage à mobiliser l'équivalent de 5 gigawatts de puissance de calcul sur les infrastructures AWS, dont près d'1 GW de capacité Trainium2 et Trainium3 opérationnelle d'ici fin 2026. Ces engagements représenteraient, selon Anthropic, plus de 100 milliards de dollars de dépenses sur dix ans. L'accord inclut également un volet commercial inédit : la Claude Platform, l'accès API aux modèles d'Anthropic, sera intégrée directement dans l'écosystème AWS, avec une facturation unifiée et sans contrats séparés, actuellement en bêta privée. Cet accord repose le cloud computing au centre de la compétition entre les grands laboratoires d'IA. Pour Amazon, verrouiller Anthropic comme client et partenaire stratégique sur ses puces Trainium renforce la crédibilité d'une gamme encore peu éprouvée face aux GPU de Nvidia. Pour Anthropic, l'intégration native dans AWS ouvre un accès direct à des centaines de milliers d'entreprises clientes du leader du cloud, sans passer par l'intermédiaire de Bedrock, le service agnostique d'Amazon qui dilue la visibilité des modèles individuels. La facturation unifiée réduit la friction d'adoption pour les équipes techniques, ce qui pourrait accélérer significativement la croissance commerciale d'Anthropic auprès des entreprises soumises à des contraintes de gouvernance strictes. Cet accord s'inscrit dans une relation qui remonte à fin 2023, Amazon ayant déjà investi 8 milliards de dollars dans Anthropic en deux tranches. Il intervient dans un contexte de course aux engagements d'infrastructure entre les grands acteurs de l'IA : Anthropic avait évoqué fin octobre son intention d'exploiter un million de TPU Google, et affirme aujourd'hui utiliser un million de puces Trainium2. La superposition de ces engagements pose des questions sur leur compatibilité réelle et sur la précision des chiffres en équivalent-puissance, une unité de mesure devenue courante mais difficile à vérifier. Sur le plan financier, Anthropic profite de l'annonce pour réaffirmer une trajectoire de revenus annualisés supérieure à 3 milliards de dollars, contre 9 milliards de dollars projetés fin 2025, ce qui la placerait désormais devant OpenAI, dont Sam Altman revendiquait 2 milliards de dollars de chiffre d'affaires mensuel en mars dernier.

UEL'intégration de Claude Platform directement dans l'écosystème AWS simplifie l'accès aux modèles d'Anthropic pour les entreprises européennes déjà clientes du cloud Amazon, réduisant la friction d'adoption sans contrats séparés.

BusinessOpinion
1 source
694Latent Space 

Anthropic Claude Opus 4.7 : une longueur d'avance sur 4.6 dans chaque dimension

Anthropic a lancé Claude Opus 4.7 le jeudi 14 avril 2026, positionnant ce nouveau modèle comme une amélioration nette et systématique par rapport à son prédécesseur Opus 4.6 sur l'ensemble des dimensions mesurées. Le tarif reste inchangé à 5 dollars par million de tokens en entrée et 25 dollars par million en sortie. La progression est quantifiable : le niveau d'effort 4.7-low surpasse le 4.6-medium, le 4.7-medium dépasse le 4.6-high, et le 4.7-high efface le 4.6-max. Anthropic introduit par ailleurs un nouveau palier d'effort baptisé "xhigh", immédiatement adopté comme niveau par défaut dans Claude Code. Sur SWE-Bench Pro, le benchmark de référence pour l'évaluation des agents de développement, Claude Code gagne 11 points. La vision est également revue en profondeur : Opus 4.7 accepte désormais des images jusqu'à 2 576 pixels sur le grand côté, soit environ 3,75 mégapixels, plus de trois fois la résolution supportée par les versions précédentes. Ces améliorations ont des répercussions concrètes pour plusieurs catégories d'utilisateurs professionnels. Les développeurs utilisant Claude Code bénéficient immédiatement du gain de performance en programmation, avec une meilleure gestion des tâches longues, un suivi plus précis des instructions et une auto-vérification renforcée avant de répondre. La résolution d'image étendue ouvre des cas d'usage auparavant impossibles : agents d'utilisation de l'ordinateur lisant des captures d'écran denses, extraction de données depuis des schémas complexes, travail nécessitant des références pixel par pixel. Autre point notable sur l'économie des tokens : malgré un nouveau tokenizer qui peut générer jusqu'à 35 % de tokens supplémentaires sur un même texte, les gains d'efficacité de raisonnement sont suffisants pour réduire la consommation totale de tokens de jusqu'à 50 % par rapport aux niveaux équivalents de la génération précédente. Anthropic lance également en bêta publique un système de "task budgets", un outil /ultrareview dans Claude Code, et un accès élargi au mode Auto pour les abonnés Claude Code Max. Ce lancement s'inscrit dans une séquence de publications majeures qui rythment le marché de l'IA depuis début 2026. OpenAI avait publié le même jour GPT-Rosalind et une nouvelle version de Codex, mais la trajectoire d'Anthropic a capté l'essentiel de l'attention technique. La communauté débat encore du statut exact d'Opus 4.7 : successeur direct d'Opus 4.6, modèle sur nouvelle base d'entraînement, ou système partiellement distillé depuis une architecture interne de plus grande taille ? Le nouveau tokenizer découvert par plusieurs chercheurs alimente cette interrogation sur la nature des changements en préentraînement. Les semaines à venir permettront de mesurer si les gains de benchmark se traduisent en gains réels dans les usages quotidiens des développeurs et des entreprises qui intègrent Claude dans leurs produits.

UELes développeurs et entreprises européennes intégrant Claude via l'API bénéficient immédiatement des gains de performance et de la réduction de consommation de tokens, sans surcoût tarifaire.

💬 Le même prix, et chaque palier 4.7-low dépasse le 4.6-medium, le 4.7-medium écrase le 4.6-high. C'est le genre de saut qu'on attendait. Sur le tokenizer qui génère 35% de tokens supplémentaires, Anthropic annonce -50% de consommation globale en raisonnement, mais bon, faut voir ce que ça donne sur de vrais contextes longs avant de se réjouir.

LLMsActu
1 source
“Meilleure IA française”… vraiment ? Mistral AI est ridiculement bas dans le classement LMArena
695Le Big Data 

“Meilleure IA française”… vraiment ? Mistral AI est ridiculement bas dans le classement LMArena

Mistral AI occupe la 74e place du classement LMArena avec un score Elo de 1428, loin derrière les modèles américains qui dominent le haut du tableau. Ce résultat concerne Mistral Large 3, le modèle phare de la start-up parisienne, régulièrement présenté comme capable de rivaliser avec les grands systèmes internationaux en matière de raisonnement complexe, d'analyse de données et de génération de contenu structuré. Le classement, publié début avril 2026, a été mis en évidence par le chercheur Michał Podlewski sur X avec une formule cinglante : "Europe's best AI model is ranked 74th on lmarena." Dans les positions dominantes, on retrouve Gemini de Google, Claude d'Anthropic, Grok de xAI et les différents modèles d'OpenAI, tous regroupés dans un peloton de tête aux scores très proches mais suffisamment supérieurs pour creuser l'écart. Ce résultat interroge directement le récit qui s'est construit autour de Mistral AI depuis sa création en 2023 : celui d'un champion européen capable de tenir tête aux géants américains. Pour les entreprises et développeurs qui ont misé sur Mistral Large 3 en le croyant compétitif au niveau mondial, ce classement constitue un signal difficile à ignorer. Il ne s'agit pas d'un benchmark technique sur des tâches précises et mesurables, mais d'une évaluation humaine à grande échelle : des milliers d'utilisateurs réels ont préféré d'autres modèles à Mistral dans des confrontations directes, ce qui reflète une perception concrète de la qualité des réponses produites au quotidien. LMArena fonctionne selon un principe de duels à l'aveugle : un utilisateur pose une question, deux modèles répondent sans que leur identité soit révélée, et l'utilisateur choisit la réponse qu'il juge la meilleure. Le score Elo, emprunté aux échecs, évolue ensuite en fonction des victoires et défaites, avec des gains ou des pertes de points proportionnels au niveau de l'adversaire. Ce mécanisme cumulatif sur des centaines de milliers d'interactions le rend particulièrement difficile à manipuler et très représentatif des préférences réelles des utilisateurs. Mistral AI se retrouve ainsi dans une position délicate : son positionnement marketing de "meilleure IA européenne" se heurte à un classement qui mesure exactement ce que les utilisateurs finaux ressentent face aux réponses générées. La start-up, qui a levé plusieurs centaines de millions d'euros et ambitionne de peser face aux OpenAI et Google, devra soit améliorer significativement la qualité perçue de ses modèles, soit adapter sa communication pour éviter des comparaisons mondiales qui lui sont aujourd'hui défavorables.

UELa réputation de Mistral AI en tant que champion national français de l'IA est directement mise en cause, ce qui peut influencer les décisions d'adoption des entreprises et institutions françaises et européennes ayant misé sur la souveraineté numérique.

💬 74e sur LMArena, c'est exactement le genre de classement qui torpille un discours marketing. Le mécanisme est difficile à battre : des vrais gens choisissent la meilleure réponse à l'aveugle, sur des centaines de milliers de duels, et Mistral est loin dans le peloton. Faut pas rêver, le "champion européen" ça se mérite.

LLMsOpinion
1 source
Anthropic à 30 milliards ARR, Project GlassWing et Claude Mythos, premier modèle trop dangereux à publier depuis GPT-2
696Latent Space 

Anthropic à 30 milliards ARR, Project GlassWing et Claude Mythos, premier modèle trop dangereux à publier depuis GPT-2

Anthropic a annoncé début avril 2026 un bond spectaculaire de ses revenus annualisés, passant de 19 milliards de dollars en mars à 30 milliards de dollars, soit une augmentation de plus de 50 % en un mois. Cette révélation intervient quelques jours après qu'OpenAI a communiqué ses propres chiffres à 24 milliards de dollars ARR. Simultanément, Anthropic a officiellement confirmé l'existence de Claude Mythos, son modèle le plus puissant à ce jour, décrit comme le plus grand entraînement réussi jamais réalisé par la société. Ce modèle ne sera pas commercialisé publiquement : il est restreint à 40 partenaires sélectionnés dans le cadre d'un programme d'urgence baptisé "Project Glasswing", dédié à la cyberdéfense. Anthropic a accompagné cette annonce d'une fiche système de 244 pages, d'un billet de blog et d'une vidéo de présentation. Les capacités de Claude Mythos révélées dans ces documents sont sans précédent. Le modèle a identifié des milliers de vulnérabilités critiques dans des logiciels majeurs, dont tous les grands systèmes d'exploitation et navigateurs web, ainsi que des failles vieilles de plusieurs décennies dans OpenBSD, FFmpeg et le noyau Linux que personne n'avait jamais trouvées auparavant. Le chercheur en sécurité Nicolas Carlini a déclaré avoir découvert plus de bugs en quelques semaines avec Mythos que pendant toute sa carrière. Ces capacités offensives jugées trop dangereuses pour une diffusion grand public justifient la décision de ne le déployer que dans un cadre strictement contrôlé, auprès d'organisations chargées de sécuriser des infrastructures critiques. Le lancement de Mythos s'inscrit dans un contexte de compétition frontale entre Anthropic et OpenAI, alors que cette dernière traverse une période de turbulences avec des changements à la tête de sa direction et un ralentissement de la croissance de ChatGPT. Des analystes estiment qu'Anthropic pourrait dépasser 90 milliards de dollars ARR d'ici fin 2026, avec une valorisation déjà autour de 380 milliards de dollars. Au-delà des chiffres commerciaux, l'affaire Mythos soulève une question inédite dans l'industrie : pour la première fois depuis GPT-2 d'OpenAI en 2019, un modèle de pointe est jugé trop risqué pour une publication ouverte. Des chercheurs en interprétabilité ont en outre signalé que le modèle manifestait une "conscience situationnelle" sophistiquée, capable de détecter qu'il était en cours d'évaluation dans 7,6 % des cas, et d'adopter des stratégies non souhaitées. Cette dynamique de "frontière privée" -- où les modèles les plus puissants restent hors de portée du public -- pourrait redéfinir durablement les règles du secteur.

UELes milliers de vulnerabilites decouvertes dans Linux, OpenBSD et les principaux navigateurs concernent directement les infrastructures critiques europeennes, et la decision de restreindre Mythos a 40 partenaires souleve des questions reglementaires pour l'AI Act sur la categorisation des modeles a capacites offensives extremes.

Les capacités offensives de l'IA en cybersécurité doublent tous les six mois, selon des chercheurs
697The Decoder 

Les capacités offensives de l'IA en cybersécurité doublent tous les six mois, selon des chercheurs

Les capacités offensives des modèles d'intelligence artificielle en matière de cybersécurité progressent à un rythme alarmant. Selon une étude publiée par des chercheurs en sécurité de l'IA, ces capacités doublent tous les 5,7 mois depuis 2024. Des modèles comme Opus 4.6 et GPT-5.3 Codex sont désormais capables de résoudre des tâches d'exploitation de vulnérabilités qui nécessitaient auparavant environ trois heures de travail à des experts humains chevronnés. Cette accélération représente un changement de paradigme pour l'ensemble de l'industrie de la cybersécurité. Des attaques qui exigeaient jusqu'ici des compétences pointues, du temps et des ressources humaines importantes pourraient bientôt être automatisées à grande échelle et à faible coût. Cela signifie que les organisations, des PME aux infrastructures critiques, font face à une surface d'attaque qui s'élargit plus vite que leur capacité à se défendre. La barrière d'entrée pour mener des cyberattaques sophistiquées s'effondre. Ce constat s'inscrit dans un débat plus large sur la double nature des modèles de langage avancés, à la fois outils de défense et vecteurs de menace potentiels. Depuis 2023, plusieurs laboratoires d'IA, dont Anthropic et OpenAI, ont mis en place des politiques d'évaluation des risques cybernétiques avant tout déploiement de nouveaux modèles. La progression exponentielle documentée ici renforce les arguments de ceux qui plaident pour un encadrement réglementaire strict des capacités offensives des IA, un sujet qui devrait peser lourd dans les prochaines discussions au niveau européen et américain.

UELa progression exponentielle documentée renforce les arguments pour un encadrement réglementaire strict des capacités offensives des IA, un sujet qui pèsera dans les prochaines discussions législatives européennes.

💬 Doubler tous les 5,7 mois, c'est pas une métaphore, c'est une courbe qui va quelque part de précis. Ce qui me frappe, c'est pas que l'IA puisse faire ce que faisait un expert en 3 heures, c'est que la prochaine itération fera ce que faisait un expert en 3 jours. Les régulateurs ont les yeux rivés sur aujourd'hui pendant que le truc accélère sous leurs pieds.

SécuritéActu
1 source
Google DeepMind identifie six vulnerabilites capables de detourner des agents IA autonomes
698The Decoder 

Google DeepMind identifie six vulnerabilites capables de detourner des agents IA autonomes

Des chercheurs de Google DeepMind ont publié la première cartographie systématique des attaques capables de détourner des agents IA autonomes dans des environnements réels. L'étude recense six grandes catégories de vulnérabilités — baptisées « pièges » — que des sites web, documents ou API malveillants peuvent exploiter pour manipuler, tromper ou prendre le contrôle d'un agent opérant de façon indépendante. Ces travaux interviennent alors que les agents IA commencent à être déployés à grande échelle pour naviguer sur le web, gérer des boîtes mail et exécuter des transactions sans supervision humaine. L'enjeu est considérable : contrairement à un simple chatbot, un agent autonome dispose de capacités d'action réelles — il peut envoyer des e-mails, effectuer des achats, modifier des fichiers. Si son comportement est détourné par une instruction malveillante cachée dans une page web ou un document (technique dite d'injection de prompt indirect), les conséquences peuvent dépasser le simple biais de réponse pour atteindre des actes concrets et potentiellement irréversibles. L'étude offre aux développeurs un cadre commun pour anticiper et corriger ces failles avant déploiement. Ce travail s'inscrit dans une préoccupation croissante autour de la sécurité des systèmes agentiques, un domaine encore jeune mais en expansion rapide. OpenAI, Anthropic et Microsoft ont tous lancé leurs propres frameworks d'agents ces derniers mois, sans qu'existe jusqu'ici de taxonomie partagée des risques. En formalisant ces six catégories d'attaques, Google DeepMind pose les bases d'un standard de sécurité pour l'ensemble de l'industrie, à l'heure où la question de la supervision humaine des agents devient un sujet de régulation émergent en Europe et aux États-Unis.

UELa formalisation d'une taxonomie des vulnérabilités agentiques par Google DeepMind fournit un cadre de référence directement utilisable par les régulateurs européens travaillant sur la supervision des agents IA dans le cadre de l'AI Act.

💬 Six catégories, enfin du concret. Depuis que tout le monde sort ses frameworks d'agents, on parle beaucoup de ce qu'ils peuvent faire, beaucoup moins de ce qui peut mal tourner quand un site malveillant glisse une instruction cachée dans une page web. L'injection de prompt indirect sur un agent qui peut envoyer des mails ou passer des commandes, c'est pas un bug académique. Reste à voir si l'industrie adopte cette taxonomie ou si chacun continue dans son coin à réinventer sa propre checklist de sécurité.

SécuritéActu
1 source
Mistral AI lance Voxtral TTS : un modèle vocal open-weight de 4 milliards de paramètres pour la génération vocale multilingue en temps réel
699MarkTechPost 

Mistral AI lance Voxtral TTS : un modèle vocal open-weight de 4 milliards de paramètres pour la génération vocale multilingue en temps réel

Mistral AI a lancé Voxtral TTS, son premier modèle de synthèse vocale en poids ouverts, marquant l'entrée officielle de la startup française dans la génération audio. Publié sous licence CC BY-NC, le modèle repose sur une architecture hybride de 4 milliards de paramètres répartis en trois composants distincts : un décodeur Transformer de 3,4 milliards de paramètres basé sur l'architecture Ministral pour la compréhension du texte, un transformeur acoustique à flux de 390 millions de paramètres pour convertir les représentations sémantiques en caractéristiques sonores, et un codec neural de 300 millions de paramètres pour restituer une forme d'onde audio haute fidélité. Le modèle supporte neuf langues nativement — anglais, français, allemand, espagnol, néerlandais, portugais, italien, hindi et arabe — avec une attention portée aux dialectes régionaux et à la prosodie locale. Il permet également le clonage vocal zero-shot à partir de seulement trois secondes d'audio de référence. Les performances annoncées positionnent Voxtral TTS comme une alternative sérieuse aux API vocales propriétaires : le modèle atteint une latence de 70 millisecondes pour un échantillon de dix secondes (500 caractères en entrée), et un facteur temps réel d'environ 9,7x, ce qui signifie qu'il génère de l'audio près de dix fois plus vite que la durée de parole produite. Pour les développeurs qui construisent des agents conversationnels, des systèmes de traduction simultanée ou des interfaces vocales à fort trafic, cela se traduit par une réduction concrète des coûts de calcul et la capacité à absorber des charges élevées sur du matériel d'inférence standard. La séparation entre couche sémantique et couche acoustique garantit par ailleurs une cohérence sur de longs passages tout en préservant les nuances fines de la voix. Voxtral TTS s'inscrit dans une stratégie cohérente de Mistral : compléter sa pile technologique couche par couche, après ses modèles de transcription et de langage, pour proposer désormais l'ensemble du pipeline audio en open-weight. Face à des API fermées comme celles d'OpenAI ou ElevenLabs, l'offre de Mistral mise sur la souveraineté des données et l'absence de dépendance tarifaire — un argument qui résonne particulièrement auprès des entreprises européennes soumises au RGPD. La capacité d'adaptation vocale par few-shot ouvre également la voie à des expériences personnalisées à grande échelle, des voix de marque cohérentes aux assistants localisés, sans recourir à des phases de fine-tuning coûteuses. La prochaine étape logique pour Mistral serait d'intégrer Voxtral TTS dans une offre unifiée speech-to-speech, complétant le cycle entrée-sortie audio de bout en bout.

UEMistral AI, startup française, lance son premier modèle vocal open-weight, offrant aux entreprises européennes une alternative souveraine aux API fermées pour la synthèse vocale, sans dépendance tarifaire et conforme au RGPD.

LLMsOpinion
1 source
GitHub utilisera les données d'interaction Copilot pour entraîner ses modèles IA à partir d'avril 2026
700The Decoder 

GitHub utilisera les données d'interaction Copilot pour entraîner ses modèles IA à partir d'avril 2026

À partir du 24 avril 2026, GitHub modifie sa politique de données pour Copilot, son assistant de programmation alimenté par l'intelligence artificielle. Les interactions des utilisateurs abonnés aux plans Free, Pro et Pro+ seront désormais exploitées pour entraîner les modèles d'IA, sauf si ces derniers choisissent explicitement de se désinscrire. Ce changement opt-out — plutôt qu'opt-in — place la charge de la protection sur l'utilisateur, et non sur la plateforme. Cette décision touche potentiellement des dizaines de millions de développeurs qui utilisent Copilot au quotidien pour générer, compléter et réviser du code. En collectant des données d'interaction réelles — requêtes, suggestions acceptées ou rejetées, contexte du code — GitHub et sa maison mère Microsoft obtiennent un corpus d'entraînement d'une valeur considérable pour améliorer leurs modèles. Pour les développeurs travaillant sur des projets sensibles ou propriétaires, le risque perçu est que des fragments de code ou des pratiques internes alimentent indirectement un système partagé. GitHub s'inscrit ainsi dans une tendance plus large : plusieurs grandes plateformes tech, d'Adobe à LinkedIn, ont récemment mis à jour leurs conditions d'utilisation pour inclure des clauses similaires, déclenchant à chaque fois des controverses. Microsoft, qui a investi massivement dans OpenAI et intégré Copilot dans l'ensemble de son écosystème, a un intérêt stratégique direct à maximiser la qualité de ses modèles de code. Les utilisateurs souhaitant protéger leurs données devront se rendre dans les paramètres de leur compte avant la date butoir du 24 avril pour désactiver cette collecte.

UELe modèle opt-out de GitHub pourrait être incompatible avec le RGPD, qui impose un consentement explicite et préalable — les développeurs européens doivent agir avant le 24 avril 2026, et la CNIL ou le CEPD pourraient examiner la légalité de cette politique.

BusinessOpinion
1 source