Aller au contenu principal

Dossier Microsoft — page 6

1056 articles · page 6 sur 22

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

ChatGPT se verrouille contre les cyberattaques : ce nouveau mode va mieux protéger vos données, comment l’activer ?
25101net SécuritéActu

ChatGPT se verrouille contre les cyberattaques : ce nouveau mode va mieux protéger vos données, comment l’activer ?

OpenAI a déployé une nouvelle fonctionnalité de sécurité baptisée "Lockdown Mode" pour ChatGPT, disponible sur l'ensemble des abonnements, du niveau gratuit jusqu'aux offres payantes. Ce mode verrouillé désactive délibérément plusieurs capacités natives du chatbot, notamment la navigation web en temps réel, afin de réduire la surface d'attaque exposée aux cybermenaces. L'activation se fait en quelques clics depuis les paramètres de l'application, sans nécessiter de configuration technique avancée. La cible principale de cette fonctionnalité est le monde professionnel : avocats, consultants, journalistes ou tout employé amené à traiter des informations sensibles ou confidentielles via ChatGPT. Le mode répond spécifiquement aux attaques par injection de requêtes, une technique où du contenu malveillant intégré dans un document ou une page web tente de détourner les instructions données au modèle pour exfiltrer des données ou manipuler les réponses. En coupant l'accès aux sources externes, OpenAI supprime le vecteur d'attaque le plus courant. Les attaques par prompt injection ont fortement progressé depuis la démocratisation des agents IA capables de naviguer sur le web et d'exécuter des actions autonomes, poussant plusieurs chercheurs en sécurité à alerter les éditeurs. OpenAI s'inscrit ainsi dans une tendance plus large du secteur, après que Microsoft et Anthropic ont également renforcé les garde-fous de leurs propres assistants. Le Lockdown Mode représente un compromis assumé entre sécurité et fonctionnalité, laissant à l'utilisateur le choix du niveau de protection selon son contexte d'usage.

UELes professionnels français (avocats, journalistes, consultants) manipulant des données sensibles via ChatGPT peuvent désormais activer ce mode pour réduire leur exposition aux attaques par injection de requêtes.

1 source
Perplexity AI lance un orchestrateur d'inférence hybride pour PC : répartition automatique entre local et cloud
252MarkTechPost 

Perplexity AI lance un orchestrateur d'inférence hybride pour PC : répartition automatique entre local et cloud

Perplexity AI a présenté lors du Computex 2026 ce qu'elle décrit comme le premier orchestrateur d'inférence hybride local-serveur, une technologie destinée à son produit Perplexity Computer. Le principe : un modèle d'IA compact installé sur l'appareil de l'utilisateur analyse chaque tâche entrante et décide automatiquement si elle doit être exécutée en local ou envoyée vers un modèle frontier dans le cloud. La fonctionnalité arrivera en juillet 2026, d'abord sur Windows, tandis que la version Mac de Personal Computer est déjà disponible depuis avril 2026 avec une liste d'attente ouverte pour Windows. L'orchestrateur est compatible avec les puces Intel Core Ultra Series 3 et les GPU NVIDIA RTX Spark, et fonctionne indépendamment du modèle utilisé. Perplexity Computer, lancé en février 2026 sur abonnement Max à 200 dollars par mois, peut coordonner jusqu'à 20 modèles d'IA dans un même flux de travail. L'enjeu principal de cette architecture est la gouvernance des données dans les environnements professionnels. Jusqu'ici, les systèmes d'IA agentiques obligeaient les utilisateurs à choisir entre puissance de calcul et confidentialité. Le nouvel orchestrateur supprime ce compromis en automatisant la décision : les données sensibles comme les fichiers financiers, les dossiers de santé ou les documents personnels restent sur l'appareil, tandis que les tâches nécessitant une puissance de calcul élevée sont envoyées vers les serveurs de Perplexity. Le système demande l'autorisation de l'utilisateur avant tout envoi de données sensibles vers le cloud, ce qui répond directement aux exigences de conformité et de traçabilité que posent les entreprises face aux outils d'IA. Pour les équipes qui hésitaient à adopter des agents IA par crainte des fuites de données, c'est un argument concret. Cette annonce s'inscrit dans une course plus large à l'IA sur appareil, où Apple, Microsoft, Google et de nombreux fabricants de puces cherchent à convaincre que le traitement local est l'avenir. Perplexity, qui s'est imposé comme un acteur sérieux de la recherche IA avec plusieurs centaines de millions de dollars levés, tente ici de se différencier sur le segment des agents autonomes, un marché encore naissant mais très disputé. L'idée de faire du modèle local un chef d'orchestre plutôt qu'un simple exécutant est une évolution architecturale notable : ce n'est plus seulement "quel modèle utiliser" mais "où chaque morceau de la tâche doit-il s'exécuter". Si la promesse tient à l'usage réel, ce type d'orchestration pourrait devenir la norme pour tout système agentique voulant combiner performance, coût maîtrisé et confidentialité.

UEL'architecture hybride local-cloud, en maintenant les données sensibles sur l'appareil, pourrait faciliter l'adoption par les entreprises européennes soumises au RGPD qui hésitaient à déployer des agents IA.

💬 L'IA locale comme simple accélérateur, ça fait deux ans qu'on en entend parler. Ce qui change ici, c'est de mettre le petit modèle en position de chef d'orchestre qui décide ce qui part dans le cloud, avec demande explicite pour les fichiers sensibles, et pour les équipes enterprise bloquées par le RGPD, c'est l'argument concret qui manquait. Les 200 dollars par mois sur abonnement Max, c'est par contre un vrai filtre à l'entrée.

OutilsOutil
1 source
Snowflake lance Horizon Catalog pour sécuriser l’IA générative en entreprise
253Le Big Data 

Snowflake lance Horizon Catalog pour sécuriser l’IA générative en entreprise

Au Snowflake Summit 2026, tenu à San Francisco début juin, l'éditeur américain Snowflake a présenté Horizon Catalog, une plateforme unifiée conçue pour encadrer le déploiement de l'IA générative en entreprise. La nouveauté phare est Horizon Context, une couche sémantique centralisée qui standardise le contexte métier, données financières, commerciales, opérationnelles, pour garantir que chaque application, utilisateur ou agent IA s'appuie sur une définition commune des indicateurs clés. Le gestionnaire d'actifs BlackRock figure parmi les premiers clients à avoir adopté la solution, pour assurer la cohérence de ses analyses IA à travers ses environnements de données mondiaux. Snowflake complète l'offre avec Semantic Studio et Semantic View Autopilot, des outils qui automatisent la création et la maintenance de vues sémantiques cohérentes, sans exiger de solide expertise SQL. L'enjeu dépasse la simple organisation des données : selon les chiffres avancés par Snowflake, près des deux tiers des organisations citent aujourd'hui la cybersécurité comme le principal frein au déploiement à grande échelle de l'IA générative. Les agents autonomes capables d'accéder à des données sensibles, d'exécuter des actions métier et d'interagir avec plusieurs systèmes internes en même temps exposent des surfaces d'attaque que les modèles de sécurité traditionnels, conçus pour des utilisateurs humains, ne couvrent pas. Snowflake répond avec Agent Identity, un mécanisme qui attribue une identité vérifiée à chaque agent avant tout accès aux données, permettant de tracer, auditer et gouverner chaque action selon des règles définies. Des dispositifs de détection proactive contre les tentatives de jailbreak et autres attaques visant les modèles IA viennent compléter ce cadre. La sortie d'Horizon Catalog s'inscrit dans une compétition intense entre les grandes plateformes de données pour capter les budgets IA des entreprises. Snowflake, historiquement positionné sur l'entrepôt de données cloud, se repositionne comme couche d'infrastructure de confiance pour l'IA, un terrain où il affronte directement Databricks, Microsoft Fabric et Google BigQuery. La promesse d'une "vérité d'entreprise" unifiée répond à un problème concret : dans de nombreuses organisations, les mêmes métriques produisent des chiffres différents selon les outils, ce qui rend les recommandations des agents IA peu fiables, voire contradictoires. En automatisant la gouvernance sémantique et en sécurisant les identités des agents, Snowflake cherche à transformer ce point de friction en argument commercial différenciant, alors que les entreprises passent de l'expérimentation IA à des déploiements en production à grande échelle.

UELes entreprises européennes déployant des agents IA en production pourraient s'appuyer sur ces mécanismes de gouvernance sémantique et d'identité des agents pour répondre aux exigences de conformité RGPD et de l'AI Act.

💬 Le problème ciblé ici, c'est pas du marketing : dans beaucoup d'organisations, la même métrique donne des chiffres différents selon l'outil, et ça rend les agents IA peu crédibles en prod. La partie Agent Identity m'intéresse davantage que la couche sémantique, parce qu'on allait droit dans le mur côté traçabilité avec des agents autonomes qui trifouillent les données sans laisser de traces auditables. BlackRock comme client de référence, c'est bien, mais reste à voir si ça tient quand c'est pas une multinationale avec 50 ingénieurs data pour piloter le déploiement.

OutilsActu
1 source
OpenAI enrichit Codex avec des plugins spécialisés pour en faire une application grand public
254The Decoder 

OpenAI enrichit Codex avec des plugins spécialisés pour en faire une application grand public

OpenAI étend les capacités de Codex en y intégrant des plugins spécialisés selon les métiers, ciblant notamment l'analyse de données, les équipes commerciales et la banque d'investissement. L'outil, initialement conçu comme un assistant de programmation, compte désormais cinq millions d'utilisateurs hebdomadaires, dont un sur cinq n'est pas développeur. Ce segment non-technique connaît une croissance trois fois supérieure à celle de la base de développeurs traditionnelle. Ce basculement démographique révèle une ambition claire d'OpenAI : transformer Codex en application professionnelle généraliste, capable de s'intégrer dans des flux de travail très divers sans exiger de compétences techniques. Pour les entreprises, cela signifie que des équipes entières, des analystes financiers aux commerciaux, pourraient bientôt s'appuyer sur un outil de génération de code et d'automatisation sans passer par la case développement. L'enjeu est considérable : démocratiser l'automatisation au sein des organisations. Cette expansion s'inscrit dans une course plus large que se livrent les grandes plateformes d'IA pour capter le marché des outils de productivité professionnelle. Microsoft, Google et Salesforce investissent massivement dans des agents métiers similaires. OpenAI cherche à asseoir Codex comme une couche transversale dans les entreprises, bien au-delà de son positionnement initial d'IDE intelligent. L'ajout de plugins sectoriels est une réponse directe à la demande croissante d'automatisation sans code, un marché estimé à plusieurs dizaines de milliards de dollars dans les prochaines années.

UELes équipes professionnelles européennes (finance, analyse, commercial) pourraient adopter Codex comme couche d'automatisation sans code, dans un marché où Microsoft et Google proposent déjà des offres concurrentes bien implantées en Europe.

OutilsOutil
1 source
Anthropic étend Project Glasswing à 150 partenaires dans 15 pays pour traquer les failles logicielles critiques
255The Decoder 

Anthropic étend Project Glasswing à 150 partenaires dans 15 pays pour traquer les failles logicielles critiques

Anthropic étend son programme Project Glasswing à 150 partenaires répartis dans plus de 15 pays, tous mobilisés pour détecter des failles de sécurité dans des infrastructures critiques à l'aide de Claude Mythos Preview, la dernière version expérimentale de son modèle d'IA. Les organisations déjà intégrées au programme ont collectivement identifié plus de 10 000 vulnérabilités sérieuses, un chiffre qui illustre l'ampleur des failles encore présentes dans les systèmes jugés sensibles à l'échelle mondiale. L'initiative soulève une question stratégique importante : Anthropic se positionne simultanément des deux côtés du marché de la cybersécurité. D'un côté, le programme Glasswing cartographie les vulnérabilités avec des partenaires externes ; de l'autre, la société commercialise Claude Security, un produit payant permettant aux organisations de corriger ces mêmes failles. Ce double positionnement lui confère un avantage concurrentiel considérable, mais expose également l'entreprise à des critiques sur les potentiels conflits d'intérêts inhérents à ce modèle. Cette expansion s'inscrit dans une course plus large entre les grands acteurs de l'IA pour s'imposer dans le secteur de la cybersécurité, estimé à plusieurs centaines de milliards de dollars. Google, Microsoft et OpenAI ont chacun lancé des offres similaires ces derniers mois. Pour Anthropic, Project Glasswing représente aussi un argument de crédibilité : démontrer que ses modèles peuvent détecter des failles réelles, à grande échelle, renforce la légitimité de Claude comme outil professionnel au-delà des usages textuels classiques.

UEL'extension du programme à plus de 15 pays pourrait inclure des partenaires européens impliqués dans la sécurisation d'infrastructures critiques, un enjeu directement encadré par la directive NIS2.

SécuritéOpinion
1 source
Baz améliore la précision de la revue de code par agents IA grâce à Amazon Bedrock AgentCore
256AWS ML Blog 

Baz améliore la précision de la revue de code par agents IA grâce à Amazon Bedrock AgentCore

Baz, une startup spécialisée dans l'automatisation des revues de code, a développé un agent IA capable de vérifier non seulement la qualité technique du code, mais aussi sa conformité aux spécifications produit et aux maquettes de design. Baptisé Spec Review Agent, ce système repose sur Amazon Bedrock et Amazon Bedrock AgentCore, les services d'IA managés d'AWS. Concrètement, l'agent s'active automatiquement à l'ouverture d'une pull request GitHub, interroge simultanément Figma pour récupérer les spécifications visuelles et Jira pour les exigences fonctionnelles, puis décompose l'ensemble en critères vérifiables. Il spawne ensuite des sous-agents parallèles, un par exigence, qui analysent le code source et interagissent avec l'environnement de prévisualisation via l'outil AgentCore Browser Tool, capable d'inspecter le DOM, de simuler des interactions utilisateur et de comparer visuellement l'interface rendue avec les maquettes Figma. L'enjeu est considérable pour les équipes de développement modernes. Jusqu'ici, la vérification qu'une fonctionnalité correspondait réellement à ce que le product owner avait demandé ou que le designer avait conçu reposait entièrement sur des tests manuels effectués par des équipes QA. Ces vérifications prenaient des heures, introduisaient des incohérences d'une release à l'autre et s'appuyaient sur une connaissance interne non documentée et donc fragile. En automatisant cette couche de validation, Baz cherche à supprimer le délai systématique entre la livraison du code et la détection des écarts, réduisant ainsi les régressions et accélérant les cycles de mise en production. Pour les équipes engineering qui travaillent à haute vélocité, c'est potentiellement une transformation profonde du workflow de review, qui passe d'une vérification de syntaxe à une validation de comportement réel. Ce projet s'inscrit dans une tendance plus large d'industrialisation des agents IA dans le cycle de développement logiciel, après l'émergence des assistants de génération de code comme GitHub Copilot. Amazon Bedrock AgentCore, lancé récemment par AWS, propose des primitives spécifiquement conçues pour l'orchestration d'agents multi-étapes en production, incluant la navigation web autonome, la gestion de la mémoire et l'exécution de code dans des environnements isolés. Baz exploite ces capacités pour bâtir une infrastructure d'orchestration déployée sur Amazon EKS, avec un Application Load Balancer en entrée. La prochaine étape logique pour ce type de système sera d'étendre la couverture au-delà des critères d'acceptation Jira et des maquettes Figma, vers des dimensions comme la performance ou l'accessibilité, transformant progressivement la revue de code en audit produit complet piloté par l'IA.

OutilsOutil
1 source
Les agents IA donnent des réponses fausses avec assurance : la couche de contexte est le prochain défi de l'IA en entreprise
257VentureBeat AI 

Les agents IA donnent des réponses fausses avec assurance : la couche de contexte est le prochain défi de l'IA en entreprise

À San Francisco, lors du Snowflake Summit 26, l'éditeur américain de cloud de données a annoncé une série d'initiatives destinées à résoudre un problème croissant dans les déploiements d'IA en entreprise : les agents produisent des réponses assurées mais incorrectes, non pas à cause du modèle lui-même, mais parce que le même terme "revenu" peut signifier une chose dans un tableau de bord de business intelligence, une autre dans une table SQL, et encore autre chose dans les instructions d'un agent. Parmi les annonces figurent Data Stream, un service de streaming géré compatible Kafka, des améliorations à l'adaptive compute et une meilleure interopérabilité avec Apache Iceberg. La pièce maîtresse est un système à deux couches baptisé Horizon Context et Cortex Sense. Horizon Context, construit sur l'acquisition de Select Star, agrège les métadonnées de Postgres, SQL Server, Tableau et Power BI dans un catalogue centralisé ; Cortex Sense enrichit ce contexte automatiquement à partir des données et habitudes d'usage des clients, sans curation manuelle. "Horizon Context, c'est tout ce qui est explicite et déclaré par les clients ; Cortex Sense, c'est tout ce qui est implicite et dérivé par nous", a résumé Christian Kleinerman, directeur exécutif produit de Snowflake. L'enjeu est considérable pour les entreprises qui adoptent des architectures de récupération hybrides. Selon les données VB Pulse du premier trimestre 2026, issues d'une enquête auprès d'organisations de plus de 100 employés, l'intention de passer à une récupération hybride a triplé, de 10,3 % en janvier à 33,3 % en mars, la croissance la plus rapide de tout le secteur. Lorsque plusieurs agents interrogent les mêmes données sous-jacentes, ils raisonnent sur des schémas différents et renvoient des résultats divergents. Horizon Context vise à corriger ce problème au niveau du catalogue plutôt qu'agent par agent, tandis qu'un mécanisme baptisé Semantic View Autopilot crée et affine automatiquement des vues sémantiques sans maintenance manuelle continue. La connexion à Cortex Search, l'implémentation RAG de Snowflake, permet à ce contexte enrichi d'alimenter directement les workflows de récupération des produits CoCo et Cowork. Ce problème de couche de contexte est devenu le prochain grand chantier de l'IA d'entreprise. Les deux dernières années de construction d'infrastructures de récupération ont produit une recherche vectorielle plus rapide et moins coûteuse, mais aucune définition partagée de ce que les données signifient réellement. Snowflake n'est pas seul : Microsoft a ouvert son ontologie métier Fabric IQ via MCP pour que les agents de n'importe quel éditeur puissent s'appuyer sur une sémantique commune. Pour ne pas enfermer ses clients, Snowflake lie Horizon Context à l'Open Semantic Interchange, rendant les définitions métier portables vers des catalogues et outils tiers. La question qui se pose est désormais de savoir quelle couche de contexte s'imposera dans un marché où un nombre croissant d'acteurs promettent tous de rendre les agents plus fiables.

UELes entreprises européennes déployant des architectures multi-agents font face aux mêmes enjeux de cohérence sémantique, rendant ces nouvelles couches de contexte directement pertinentes pour les DSI du continent.

OutilsOpinion
1 source
IA d’entreprise : Snowflake et Anthropic renforcent la gouvernance des modèles IA
258Le Big Data 

IA d’entreprise : Snowflake et Anthropic renforcent la gouvernance des modèles IA

Snowflake et Anthropic ont annoncé le 2 juin 2026, lors du Snowflake Summit 2026, un renforcement significatif de leur partenariat autour de l'IA d'entreprise. Concrètement, les modèles Claude d'Anthropic s'intègrent désormais plus profondément dans Snowflake Cortex AI, notamment pour alimenter Snowflake Cortex Code et Snowflake Intelligence. L'objectif est de permettre aux organisations de déployer des agents IA directement dans leur environnement de données existant, sans avoir à externaliser ou déplacer des données sensibles. Des entreprises comme Block, Indeed, Carvana, Notion ou eSentire utilisent déjà cette combinaison en production. Christian Kleinerman, EVP Product chez Snowflake, a indiqué que Snowflake Cortex Code serait devenu le produit à la croissance la plus rapide de toute l'histoire du groupe. L'enjeu central de ce partenariat est la gouvernance : les entreprises des secteurs réglementés, finance, santé, cybersécurité, retail, ne peuvent pas déployer l'IA sur des données critiques sans garanties fortes en matière de sécurité, de conformité et de traçabilité. En combinant la couche de gouvernance et de contrôle d'accès de Snowflake avec les capacités de raisonnement de Claude, les deux groupes proposent une architecture où le modèle devient une extension native de la plateforme data de l'entreprise plutôt qu'un outil externe. Cela change concrètement le profil de risque de l'IA générative pour les décideurs : Block automatise ainsi des workflows de conformité pour Square et Cash App, eSentire automatise des analyses SOC de niveau 1 pour libérer ses analystes humains des tâches répétitives, et Carvana optimise ses opérations logistiques et financières grâce à cette architecture. Ce renforcement s'inscrit dans la continuité d'un accord élargi signé fin 2025, qui avait déjà permis l'intégration native de Claude dans Cortex AI sur les principaux clouds. Le marché de l'IA d'entreprise est en train de basculer d'une phase d'expérimentation vers des déploiements opérationnels à grande échelle, et plusieurs acteurs, Microsoft avec Azure OpenAI, Google avec Vertex AI, AWS avec Bedrock, se livrent une concurrence intense pour capter cette demande. Snowflake, en tant que plateforme data indépendante du cloud, joue une carte différente : celle de la neutralité et de la gouvernance centralisée. Anthropic, de son côté, accélère sa distribution en entreprise via des partenariats stratégiques plutôt que par une offre cloud propriétaire. Les prochaines étapes du partenariat devraient porter sur l'extension de Claude Marketplace au sein de l'écosystème Snowflake, ouvrant la porte à un modèle de distribution plus large pour les modèles d'Anthropic dans les environnements data d'entreprise.

UELes entreprises européennes des secteurs réglementés (finance, santé, cybersécurité) disposent d'une architecture permettant de déployer Claude directement dans leur environnement de données existant, sans externaliser de données sensibles, un argument clé pour la conformité RGPD.

OutilsOpinion
1 source
L’IA crée son propre Shadow IT : les entreprises perdent déjà la trace de leurs agents
259FrenchWeb 

L’IA crée son propre Shadow IT : les entreprises perdent déjà la trace de leurs agents

Un phénomène bien connu refait surface sous une forme nouvelle dans les entreprises : après avoir lutté pendant vingt ans contre le Shadow IT classique, les directions informatiques font face à une variante propulsée par l'intelligence artificielle. Des équipes métier déploient désormais des agents IA, des assistants automatisés et des flux de traitement autonomes sans passer par les circuits de validation informatique habituels. La facilité d'accès aux outils IA grand public, souvent accessibles via un simple abonnement ou une API, accélère cette dispersion incontrôlée. Le risque est considérable. Contrairement à une application SaaS classique, un agent IA peut accéder à des données sensibles, exécuter des tâches en autonomie, interagir avec des systèmes tiers et produire des résultats à grande échelle, le tout hors de tout audit interne. Les entreprises ne savent plus combien d'agents tournent en leur nom, quelles données ils traitent, ni qui en est réellement responsable. Cela expose les organisations à des violations réglementaires, notamment sous le RGPD ou l'AI Act européen, et à des risques de sécurité difficiles à quantifier. Ce phénomène s'inscrit dans une dynamique plus large : la démocratisation rapide des outils IA, portée par OpenAI, Google, Microsoft et des dizaines de startups, a rendu l'expérimentation accessible à n'importe quel salarié. Les DSI, déjà débordés par la transformation numérique, peinent à établir des cadres de gouvernance adaptés à cette nouvelle réalité. Les prochains mois devraient voir émerger des solutions de découverte et d'inventaire d'agents IA, un marché naissant que plusieurs éditeurs de cybersécurité commencent déjà à adresser.

UELes entreprises françaises et européennes sont directement exposées aux risques de non-conformité au RGPD et à l'AI Act en raison de déploiements d'agents IA internes non contrôlés et non audités.

💬 Le Shadow IT, on pensait l'avoir à peu près domestiqué. Mais n'importe quel chef de projet peut maintenant poser un agent en prod avec une carte bleue et un compte OpenAI, sans que la DSI ne le voie passer. La différence avec l'ancienne version, c'est que cet agent agit en autonomie, touche des données sensibles, et sous l'AI Act, si ça déraille, c'est ton entreprise qui morfle, pas l'employé qui a cliqué sur "déployer".

SécuritéOpinion
1 source
☕️ YouTube va détecter automatiquement les vidéos générées avec l’IA
260Next INpact 

☕️ YouTube va détecter automatiquement les vidéos générées avec l’IA

YouTube a annoncé une refonte significative de son système d'étiquetage des contenus générés par intelligence artificielle, avec une mesure centrale : la détection automatique des vidéos IA, sans attendre que les créateurs le déclarent eux-mêmes. Concrètement, la plateforme apposera désormais un label « AI » visible en filigrane directement sur les Shorts et au-dessus de la description des vidéos longues. Si le système détecte une présence significative d'IA dans un contenu, l'étiquette sera appliquée même en l'absence de déclaration du créateur. Ce dernier pourra contester la décision via les réglages de sa vidéo, sauf dans certains cas où le label devient permanent : vidéos produites avec les outils IA natifs de YouTube, ou contenus intégrant des métadonnées C2PA, le standard de traçabilité développé depuis 2021 par une coalition industrielle qui encode dans les fichiers le nom de l'auteur, la date de création et le mode de fabrication du contenu. Ce changement marque un basculement dans la responsabilité de la transparence : jusqu'ici, l'étiquetage reposait entièrement sur la bonne volonté des créateurs, et le système précédent était jugé peu lisible. En rendant la détection automatique, YouTube retire une partie du contrôle éditorial aux producteurs de contenus et s'impose comme arbitre de ce qui est ou non « suffisamment IA » pour être signalé. Pour les spectateurs, cela représente un gain de contexte immédiat, notamment sur des formats courts comme les Shorts où la vigilance est moins naturelle. Pour les créateurs, c'est une contrainte nouvelle : un contenu mal classifié pourra être étiqueté contre leur gré, même si un mécanisme de révision est prévu. L'enjeu dépasse YouTube : c'est la question de la confiance dans les contenus vidéo en ligne qui est posée, à l'heure où les deepfakes et les avatars synthétiques deviennent techniquement indiscernables. Cette annonce s'inscrit dans une stratégie offensive de YouTube sur le terrain de l'IA générative. La plateforme a multiplié les outils ces derniers mois : Dream Screen pour générer des décors animés à partir d'une description textuelle, le modèle vidéo Veo pour animer des images fixes, modifier le style d'une vidéo ou insérer des objets synthétiques, et Auto Dubbing pour doubler automatiquement une vidéo dans 27 langues avec synchronisation labiale en cours d'amélioration. En poussant l'adoption de ces outils tout en renforçant l'étiquetage, YouTube joue sur les deux tableaux : encourager la création IA pour alimenter la croissance de la plateforme, tout en se protégeant des accusations de désinformation ou de manipulation. La coalition C2PA, qui fédère des acteurs comme Adobe, Microsoft et les grandes agences de presse, fournit le cadre technique de cette traçabilité, et son adoption progressive par les plateformes majeures laisse entrevoir un futur où chaque contenu numérique portera une empreinte d'origine vérifiable.

UEL'AI Act européen impose des obligations de transparence sur les contenus IA, notamment les deepfakes : l'adoption par YouTube du standard C2PA et de la détection automatique constitue un alignement de facto avec ces exigences, ce qui affecte directement les créateurs et spectateurs français et européens.

💬 YouTube se pose en arbitre de ce qui est "suffisamment IA", et c'est un changement de posture assez net. Avant c'était la bonne foi des créateurs, maintenant c'est l'algo qui tranche, avec un droit de recours si tu n'es pas d'accord. Ce que je regarde surtout, c'est C2PA qui progresse discrètement : si tous les acteurs majeurs l'adoptent, on va se retrouver avec une traçabilité d'origine sur chaque contenu numérique, et c'est une vraie infrastructure qui se construit là.

Anthropic génère probablement au moins 35 % de revenus de plus qu'OpenAI
261The Information AI 

Anthropic génère probablement au moins 35 % de revenus de plus qu'OpenAI

Anthropic génère désormais des revenus annualisés proches de 45 milliards de dollars, dépassant ceux d'OpenAI, dont le rythme actuel est estimé à environ 33 milliards. Sur les cinq premiers mois de 2026, la croissance d'Anthropic a été cinq fois supérieure à celle de son concurrent, selon des sources proches des chiffres. OpenAI avait pourtant affiché une progression solide, avec une hausse de ses revenus mensuels de plus de 50 % sur la période, conforme aux projections communiquées à ses investisseurs, mais cette performance paraît modeste face à l'ascension fulgurante d'Anthropic. L'écart entre les deux entreprises atteint désormais environ 35 % en faveur d'Anthropic, et rien n'indique que la tendance s'inversera si OpenAI n'accélère pas sensiblement sa croissance. Ce renversement de hiérarchie constitue une surprise de taille dans l'industrie de l'IA générative. Pendant des années, OpenAI a été considérée comme le leader incontesté du secteur, portée par le succès mondial de ChatGPT et les investissements colossaux de Microsoft. Qu'Anthropic, fondée en 2021 par d'anciens dirigeants d'OpenAI dont Dario et Daniela Amodei, ait réussi à surpasser son rival en termes de revenus illustre à quel point le marché des API et des solutions B2B est devenu le principal moteur de croissance du secteur. Claude, le modèle phare d'Anthropic, s'est imposé comme un choix privilégié dans les environnements professionnels, notamment pour ses capacités de traitement de contextes longs et sa fiabilité perçue. Anthropic a levé des milliards de dollars ces dernières années, notamment auprès d'Amazon, qui a investi environ 4 milliards de dollars en 2023-2024, et de Google, qui a engagé plus de 2 milliards. Ces partenariats stratégiques lui ont fourni les ressources nécessaires pour scaler son infrastructure et conquérir des clients entreprise à grande échelle. OpenAI, de son côté, traverse une restructuration juridique complexe, passant d'une structure à but non lucratif vers un modèle capitalistique, tout en faisant face à une concurrence accrue sur le marché des assistants grand public. Cette bataille de revenus entre les deux géants reflète un enjeu plus large: quelle plateforme deviendra le socle de l'IA dans les entreprises mondiales au cours des prochaines années.

💬 Personne n'a vu venir ça, ou presque. Pendant que tout le monde regardait ChatGPT et le grand public, Anthropic a silencieusement verrouillé les contrats enterprise, ceux où Claude tourne dans des pipelines de prod et pas juste dans un onglet de navigateur. 45 milliards annualisés contre 33 pour OpenAI, c'est pas un détail.

BusinessOpinion
1 source
☕️ Quand l’IA agentique coûte plus cher que de payer ses employés humains
262Next INpact 

☕️ Quand l’IA agentique coûte plus cher que de payer ses employés humains

Les grandes entreprises technologiques font face à une équation économique qui commence à gripper sérieusement leurs ambitions d'IA : la facturation à l'usage des agents IA, calculée en tokens et non plus en abonnements forfaitaires, rend ces systèmes plus onéreux que les employés humains qu'ils sont censés remplacer ou assister. Le CTO d'Uber, Praveen Neppalli Naga, a reconnu avoir épuisé la totalité de son budget IA 2026 en seulement quatre mois. Bryan Catanzaro, vice-président en charge de l'apprentissage profond appliqué chez Nvidia, est encore plus direct : pour son équipe, le coût de la puissance de calcul dépasse désormais celui des salaires. Microsoft, après avoir encouragé en décembre dernier des milliers de ses développeurs à utiliser Claude Code d'Anthropic, vient d'annuler ces licences et les contraint à migrer vers GitHub Copilot CLI. Ce même GitHub Copilot, qui avait limité fin avril les nouveaux abonnements individuels, basculera en juin vers une facturation indexée sur la consommation réelle de tokens. Cette pression économique a engendré un phénomène pervers baptisé « tokenmaxxing » : des employés génèrent artificiellement de l'activité IA pour gonfler leurs statistiques de consommation, moins pour produire du code utile que pour paraître surproductifs aux yeux de leur hiérarchie. Amazon a fixé comme objectif que 80 % de ses développeurs utilisent l'IA chaque semaine et suit leur consommation de tokens. Meta est allé plus loin encore, avec un tableau de bord interne attribuant le statut de « Token Legend » aux plus grands consommateurs. Ce que ces pratiques révèlent, c'est que les métriques de tokens sont devenues des indicateurs de performance managériale avant d'être des mesures de valeur créée. La question de fond est structurelle : les modèles agentiques consomment beaucoup plus de tokens par tâche que les modèles classiques, et cette intensité ne sera pas compensée par la baisse des coûts unitaires. Un rapport Gartner estime que le coût d'inférence sur un LLM sophistiqué pourrait chuter de 90 % d'ici 2030, mais prévoit néanmoins que le coût total de l'IA continuera d'augmenter si la consommation progresse plus vite que la déflation tarifaire. Jensen Huang, PDG de Nvidia, imaginait récemment un futur où 100 agents IA travailleraient aux côtés de chaque employé humain de son entreprise, une vision qui semble économiquement intenable dans le modèle de facturation actuel. L'industrie se retrouve donc devant un choix structurant : soit les prix s'effondrent suffisamment vite, soit les entreprises doivent revoir radicalement leur usage de l'IA agentique, sous peine de financer des dépenses dont le retour reste difficile à démontrer.

UELes entreprises européennes qui adoptent des agents IA à grande échelle sont exposées aux mêmes pressions économiques liées à la facturation à l'usage, remettant en question la viabilité budgétaire de leurs projets d'IA agentique.

💬 Uber qui épuise son budget IA en quatre mois, Nvidia qui dit que le compute dépasse les salaires : c'est pas un bug, c'est le modèle. Les agents consomment structurellement 10 à 100 fois plus de tokens qu'un chat classique, et aucune baisse de prix unitaire ne rattrapera ça avant 2-3 ans. Le tokenmaxxing chez Amazon et Meta, des gens qui gonflent leur conso pour paraître productifs sur un dashboard, c'est juste le signe qu'on a mis la mauvaise métrique au centre.

BusinessOpinion
1 source
Alors que Grok peine, SpaceX mise sur la victoire face aux géants de la tech en IA
263Ars Technica AI 

Alors que Grok peine, SpaceX mise sur la victoire face aux géants de la tech en IA

SpaceX a déposé un document S-1 en vue d'une introduction en bourse anticipée, révélant une stratégie d'entreprise qui place désormais l'intelligence artificielle au coeur de son modèle économique. La société a formellement intégré xAI, la startup d'IA d'Elon Musk, en début d'année 2026, donnant naissance à la division SpaceXAI qui chapeaute les modèles Grok et le chatbot associé, auparavant développés de façon indépendante. Dans ce prospectus, SpaceX revendique posséder "le plus grand marché adressable actionnable de l'histoire humaine", estimant l'opportunité liée à l'IA à 26 500 milliards de dollars, une somme qui approche le PIB nominal des États-Unis, établi à près de 32 000 milliards de dollars au premier trimestre 2026. Le lancement de satellites et les missions spatiales, activités historiques de l'entreprise, y sont désormais présentés comme des activités de soutien à ce nouveau coeur de métier. Ce repositionnement stratégique intervient dans un contexte difficile pour Grok, qui peine à s'imposer face à des concurrents solidement établis. Les clients d'entreprise et les développeurs se tournent massivement vers OpenAI et Anthropic, dont les modèles bénéficient d'une adoption bien plus large et d'écosystèmes matures. Pour SpaceX, transformer une IPO en succès dépend donc en grande partie de la capacité de sa division IA à convaincre un marché qui n'a pas spontanément choisi Grok. L'enjeu financier est considérable : si les projections se révèlent même partiellement fondées, la valorisation attendue pourrait dépasser celle de nombreuses entreprises technologiques cotées. La fusion de xAI dans SpaceX illustre la concentration croissante des paris d'Elon Musk autour d'une seule entité, après des années de gestion parallèle de Tesla, SpaceX, xAI et X. L'absorption de xAI permet à SpaceX de mutualiser les données issues de ses infrastructures spatiales, notamment Starlink avec ses millions d'abonnés, pour alimenter des systèmes d'IA propriétaires. La course aux données et à la puissance de calcul constitue le véritable front concurrentiel, et SpaceX mise sur son infrastructure physique unique pour se différencier d'acteurs comme Google, Microsoft ou Amazon, qui dominent aujourd'hui le marché des services d'IA en entreprise.

UEL'essor d'un nouvel acteur majeur dans l'IA générative pourrait accentuer la dépendance des entreprises européennes aux plateformes américaines et fragiliser les efforts de souveraineté numérique portés par l'UE.

💬 Le chiffre de 26 500 milliards, c'est du prospectus pur (il faut bien justifier la valorisation). Ce qui m'intéresse vraiment, c'est Starlink : des millions d'abonnés, une infrastructure physique mondiale qu'OpenAI ne pourra jamais racheter. Reste à voir si ça suffit à convaincre les devs, parce que si tu regardes les forums en ce moment, le choix par défaut c'est toujours pas Grok.

BusinessOpinion
1 source
Stellantis vise les longs trajets : la conduite mains libres arrive sur autoroute
264Frandroid 

Stellantis vise les longs trajets : la conduite mains libres arrive sur autoroute

Stellantis a annoncé le même jour deux partenariats stratégiques pour accélérer son virage vers la conduite automatisée. Le groupe automobile franco-italo-américain s'associe d'une part avec Wayve, startup britannique spécialisée dans l'intelligence artificielle pour la mobilité autonome, et d'autre part avec Qualcomm, géant américain des semi-conducteurs, pour le traitement du calcul embarqué. L'objectif est d'intégrer ces technologies dans les véhicules de ses marques phares, Peugeot, Citroën, Jeep et Fiat, à horizon 2028. Concrètement, il s'agit d'offrir une conduite mains libres sur autoroute, dite de niveau 2+ ou niveau 3 selon les marchés, permettant au conducteur de ne plus intervenir activement lors des longs trajets à grande vitesse. C'est une évolution significative pour des millions d'automobilistes européens et américains qui parcourent régulièrement des centaines de kilomètres sur voie rapide. Pour Stellantis, en pleine restructuration sous la pression des véhicules électriques chinois et de la concurrence Tesla, ce pari technologique est aussi un argument commercial fort pour repositionner ses marques sur le segment premium de la sécurité et du confort. Cette double alliance s'inscrit dans une course industrielle que se livrent tous les grands constructeurs depuis plusieurs années. Wayve, qui a levé plus d'un milliard de dollars en 2024 notamment auprès de Microsoft et SoftBank, mise sur une approche par apprentissage profond plutôt que sur des règles préprogrammées. Qualcomm, de son côté, domine déjà l'informatique embarquée dans l'automobile avec sa plateforme Snapdragon Ride. Le calendrier 2028 laisse le temps aux homologations réglementaires européennes, encore en cours pour les systèmes de niveau 3, de se stabiliser.

UEPeugeot et Citroën, marques françaises du groupe Stellantis, intégreront la conduite mains libres sur autoroute d'ici 2028, avec des implications directes sur les homologations de niveau 3 actuellement en cours au sein de l'UE.

💬 Stellantis a besoin d'une histoire à raconter, et celle-là tient la route, sur le papier. Le choix de Wayve est ce qu'il y a de plus intéressant dans ce partenariat : l'approche par apprentissage profond plutôt que des règles préprogrammées, c'est le seul pari crédible face à Tesla et aux Chinois. 2028, c'est loin, et les homologations niveau 3 en Europe sont encore un vrai chantier ouvert.

RobotiqueOpinion
1 source
Mistral AI se renforce dans l’industrie européenne avec le rachat de Emmi AI
265Le Big Data 

Mistral AI se renforce dans l’industrie européenne avec le rachat de Emmi AI

Mistral AI a annoncé l'acquisition d'Emmi AI, une startup autrichienne fondée à Linz et spécialisée dans la modélisation de phénomènes physiques complexes, flux d'air, transfert thermique, contraintes mécaniques sur les matériaux. Le montant de la transaction n'a pas été divulgué, mais l'opération est considérée comme l'une des plus significatives de l'écosystème européen de l'IA cette année. Emmi AI avait levé 15 millions d'euros en 2025, la plus importante levée de fonds jamais réalisée en Autriche dans le secteur de l'intelligence artificielle. Ses équipes, réparties entre l'Autriche, l'Allemagne et la Lituanie, rejoignent désormais Mistral. La société française prévoit d'ouvrir un bureau officiel à Linz, qui s'ajoutera à ses hubs existants à Paris, Londres et Munich. Cette acquisition donne à Mistral AI une capacité inédite en Physics AI, des modèles capables de comprendre et simuler le comportement du monde physique en temps réel. Pour les industriels des secteurs des semi-conducteurs, de l'automobile ou de l'aérospatiale, cela ouvre la voie à des jumeaux numériques plus précis, à des simulations accélérées et à une réduction significative des coûts de R&D. Mistral dispose déjà de modèles analysant les lignes de production pour détecter des défauts ou piloter des bras robotisés ; l'intégration des technologies d'Emmi doit rendre ces systèmes plus fiables dans leurs interactions avec des environnements physiques contraignants. L'enjeu est aussi de proposer aux industriels européens une alternative souveraine aux plateformes américaines, dont la dépendance est de plus en plus perçue comme un risque stratégique. Le rachat s'inscrit dans un contexte de montée en puissance de l'IA industrielle comme priorité politique en Europe. La Commission européenne considère le secteur manufacturier comme un pilier de sa stratégie d'autonomie technologique, et plusieurs États membres accélèrent leurs investissements dans ce domaine. Mistral AI, valorisé à plusieurs milliards d'euros après ses dernières levées de fonds, consolide ainsi son positionnement face aux géants américains comme Google, Microsoft ou OpenAI, qui investissent massivement dans les mêmes usages verticaux. En s'ancrant davantage en Europe centrale avec des engagements en Autriche, en Allemagne et en Lituanie, le groupe français envoie un signal clair : la compétition pour l'IA industrielle se jouera aussi sur la capacité à retenir les talents et à construire des infrastructures de recherche hors des États-Unis.

UEL'acquisition d'Emmi AI par Mistral AI renforce la souveraineté technologique européenne dans l'IA industrielle, avec l'ouverture d'un bureau à Linz et l'intégration d'équipes autrichiennes, allemandes et lituaniennes au sein d'un champion français.

💬 Mistral qui bascule dans la simulation physique, c'est un vrai pari industriel, pas juste du repositionnement marketing. Modéliser des flux d'air ou des contraintes thermiques en temps réel, ça vaut des millions d'euros de tests physiques évités pour un constructeur auto ou un fabricant de semi-conducteurs. L'intégration va être compliquée, mais si ça marche, c'est un avantage que ni OpenAI ni Google n'ont encore vraiment.

BusinessOpinion
1 source
Le Fil IA prouve sa valeur lors du deuxième jour du TechEx Amérique du Nord
266AI News 

Le Fil IA prouve sa valeur lors du deuxième jour du TechEx Amérique du Nord

La deuxième journée de TechEx North America a placé la preuve au centre des débats. Le programme AI and Big Data s'est articulé autour d'une expression revenue plusieurs fois comme un avertissement : l'"AI graveyard", le cimetière des pilotes jamais devenus des systèmes pérennes. Les sessions de la piste Enterprise AI Implementation, ROI and Adoption ont couvert les pilotes bloqués, le passage de l'expérimentation à l'impact réel, les arbitrages entre acheter ou construire, et les conditions d'un retour sur investissement durable. Hex a présenté ses agents de données avec évaluation et gouvernance intégrées, tandis que Dow a illustré la conversion de données en valeur financière concrète. La ville de San Jose et le DMV californien ont apporté une dimension gouvernementale au débat, ancrant les cas d'usage dans des services publics réels où la fiabilité et la transparence envers les citoyens sont non négociables. Le constat central de la journée est que la majorité des entreprises ont suffisamment de budget pour lancer des expériences en IA et suffisamment de visibilité managériale pour les annoncer, mais beaucoup moins disposent de la qualité de données, de la conception de processus et des mécanismes de contrôle nécessaires pour les maintenir. Les "copilotes" ont montré leur utilité comme outils de productivité individuelle, mais leur valeur reste difficile à mesurer. Les agents IA promettent une connexion plus directe aux processus métiers, à condition d'être évalués sur la qualité de leurs actions concrètes dans les systèmes. Les sessions bancaires ont rendu l'enjeu encore plus net : les services financiers ne peuvent pas se permettre des garanties floues sur l'automatisation. La transformation échoue aussi quand les employés ne changent pas leurs routines, que les managers n'adaptent pas les incitations, ou que les données nécessaires n'arrivent jamais au bon endroit au bon moment. Le programme Cyber Security and Cloud Expo a introduit la notion de "velocity gap", utilisée plusieurs fois durant la journée : les unités métiers adoptent les outils d'IA générative plus vite que les équipes de sécurité ne peuvent les superviser. Les outils arrivent en premier, les politiques et la surveillance arrivent après. Des sessions spécifiques sur le jailbreaking et les fuites de données ont illustré les conséquences concrètes : des employés qui placent des données sensibles dans des outils non sanctionnés, ou des systèmes IA mal bornés qui élargissent les vecteurs de fuite. La gouvernance est apparue sous plusieurs formes interconnectées : gouvernance transversale entre équipes juridiques, sécurité et technique ; gouvernance dans la couche données via la traçabilité et la qualité ; gouvernance autour des agents IA, définissant précisément ce qu'un agent est autorisé à connaître et à faire. La maturité de l'IA agentique en entreprise dépendra de la capacité à formaliser cette évaluation, avant que le fossé entre vitesse d'adoption et contrôle ne devienne ingérable.

SociétéActu
1 source
Google lance Antigravity 2.0 à I/O 2026 : plateforme autonome orientée agents, avec CLI, SDK et support entreprise
267MarkTechPost 

Google lance Antigravity 2.0 à I/O 2026 : plateforme autonome orientée agents, avec CLI, SDK et support entreprise

Google a profité de sa keynote développeurs I/O 2026 pour annoncer un changement d'architecture majeur dans ses outils de développement assisté par IA. La compagnie a lancé Antigravity 2.0, une application desktop autonome construite entièrement autour de l'orchestration d'agents, accompagnée d'un Antigravity CLI, d'un Antigravity SDK, de Managed Agents dans l'API Gemini, et d'un support enterprise via la Gemini Enterprise Agent Platform. Contrairement à l'Antigravity IDE existant, cette version 2.0 abandonne l'approche centrée sur l'éditeur de code pour placer la gestion de workflows multi-agents comme abstraction principale. L'application permet d'orchestrer plusieurs agents en parallèle, d'exécuter des tâches planifiées en arrière-plan via des sous-agents dynamiques, et s'intègre nativement avec Google AI Studio, Android et Firebase. Une commande vocale native est également intégrée, dans la continuité des ajouts récents à Gmail et Google Docs. Le CLI Antigravity remplace officiellement le Gemini CLI, tout en conservant ses fonctionnalités essentielles: Agent Skills, Hooks, Subagents et Extensions, ces dernières rebaptisées plugins. Les Managed Agents, propulsés par Gemini 3.5 Flash, permettent de lancer via un simple appel API un agent capable de raisonner, d'utiliser des outils et d'exécuter du code dans un environnement Linux isolé, accessible depuis l'Interactions API et Google AI Studio. Ce pivot stratégique change fondamentalement la proposition de Google aux développeurs. La fonctionnalité de tâches planifiées est particulièrement significative: plutôt que d'interroger manuellement un agent à chaque fois, les développeurs définissent des tâches qui invoquent les agents automatiquement, transformant l'assistant ponctuel en pipeline d'automatisation persistant. Pour les équipes enterprise, la connexion directe aux projets Google Cloud via la Gemini Enterprise Agent Platform simplifie le déploiement d'agents dans une infrastructure existante. Le SDK permet aux équipes d'ingénierie d'intégrer des agents Antigravity dans leurs propres produits internes, optimisés pour les modèles Gemini. Les environnements isolés des Managed Agents conservent fichiers et état entre appels successifs, permettant des sessions multi-tours sans réinitialiser le contexte. Cette annonce s'inscrit dans une bataille d'écosystèmes entre les grandes plateformes tech pour capter les développeurs dans leur univers d'agents IA. Google fait face à la concurrence directe de Claude Code d'Anthropic, de GitHub Copilot Workspace de Microsoft et d'outils comme Cursor. En unifiant desktop, CLI, SDK et enterprise autour d'un même "agent harness" co-optimisé avec Gemini 3.5 Flash, Google parie sur une cohérence verticale: chaque amélioration du harness central se propage automatiquement à toutes les surfaces. La disparition du Gemini CLI au profit de l'Antigravity CLI marque aussi un repositionnement de marque clair, signalant que l'IA agentique, et non plus le chatbot, est désormais la porte d'entrée principale de Google pour les développeurs.

UELes développeurs et équipes enterprise européens disposent d'une nouvelle plateforme unifiée d'orchestration d'agents intégrable à une infrastructure cloud existante, sans contrainte réglementaire européenne spécifique identifiée à ce stade.

OutilsOutil
1 source
Gemini Spark : cette IA de Google travaille pour vous même quand vous dormez
268Le Big Data 

Gemini Spark : cette IA de Google travaille pour vous même quand vous dormez

Google a présenté Gemini Spark lors de la conférence Google I/O 2026, le 19 mai 2026, en parallèle du modèle Gemini Omni. Il ne s'agit pas d'un simple chatbot amélioré, mais d'un agent IA autonome conçu pour agir en arrière-plan sans attendre d'instructions directes. Connecté à l'ensemble de l'écosystème Google, Gmail, Docs, Sheets, Agenda, Slides, l'agent analyse les habitudes de l'utilisateur, prépare des rappels avant un rendez-vous, génère des brouillons d'e-mails à partir d'échanges liés à un même projet, ou organise automatiquement des informations dispersées. Sa caractéristique principale est de fonctionner en continu dans le cloud, y compris lorsque le smartphone et l'ordinateur de l'utilisateur sont éteints. Google illustre l'outil avec des cas d'usage concrets : un étudiant qui reçoit automatiquement une fiche de révision après qu'un professeur a envoyé un PDF, ou une organisation d'événement gérée de manière quasi autonome via les confirmations automatiques et le suivi des échanges. L'arrivée de Gemini Spark marque un tournant dans la manière dont Google positionne ses outils IA : on passe du modèle réactif, qui répond quand on lui parle, au modèle proactif, qui agit sans sollicitation. Pour les professionnels et les utilisateurs intensifs des outils Google, cela représente un gain de temps potentiellement significatif sur les tâches administratives répétitives. Mais la perspective d'une IA en accès permanent aux mails, documents et calendriers personnels soulève des questions légitimes de confidentialité. Google indique que les utilisateurs conserveront la main sur les validations importantes avant toute action définitive, mais le curseur entre autonomie et contrôle reste à définir concrètement dans les usages réels. Gemini Spark s'inscrit dans une course accélérée entre les grands acteurs technologiques pour imposer leurs agents IA dans la vie quotidienne, Microsoft avec Copilot, Apple avec ses nouvelles fonctions Siri, et des acteurs comme OpenAI avec des outils d'automatisation similaires. Pour l'instant, l'accès à Gemini Spark reste strictement limité : une poignée de testeurs sélectionnés y ont accès, une phase bêta est prévue aux États-Unis d'ici fin mai 2026, et l'outil sera réservé aux abonnés du forfait Google AI Ultra, une offre premium dont le prix n'est pas accessible à tous. Aucune date de lancement n'a été communiquée pour la France. Google avance prudemment, conscient que le déploiement d'un agent aussi intrusif dans la sphère personnelle exige une confiance que le grand public n'a pas encore nécessairement accordée.

UEAucune date de lancement prévue pour la France ; l'accès permanent de l'agent aux mails et documents personnels soulève des questions de conformité au RGPD que les autorités européennes devront examiner avant tout déploiement.

Google I/O 2026 : Google tease une IA ultra-puissante. Le coup de grâce face à OpenAI ?
269Le Big Data 

Google I/O 2026 : Google tease une IA ultra-puissante. Le coup de grâce face à OpenAI ?

Google a tenu sa conférence annuelle I/O le 19 mai 2026 à l'amphithéâtre Shoreline de Mountain View, en Californie. Dans les heures précédant l'événement, la firme a orchestré un teasing appuyé autour d'une nouvelle génération de modèles Gemini. Les fuites liées au projet Antigravity mentionnent deux variantes principales : Gemini 3.2 et Gemini 5 Flash, capables selon les rumeurs de traiter plus de 900 jetons par seconde, soit des vitesses de réponse quasi instantanées même sur des requêtes complexes. Sundar Pichai, PDG de Google, a lui-même alimenté l'anticipation en publiant sur X une courte vidéo générée par IA évoquant l'univers Gemini. Plusieurs observateurs sectoriels ont également mentionné un modèle baptisé Gemini Omni, conçu pour fusionner texte, image, audio et vidéo en temps réel, avec la capacité de transformer des images en vidéos et de créer des avatars numériques interactifs. Une rumeur particulièrement notable suggère que Google aurait entraîné le plus grand modèle de son histoire, au point que celui-ci aurait produit des comportements inattendus lors des tests internes. Ces annonces, si elles se confirment, placent Google en concurrent direct et sérieux face à OpenAI sur le terrain des modèles de fondation. Une vitesse de traitement supérieure à 900 jetons par seconde représenterait un bond significatif par rapport aux performances actuelles du marché, réduisant drastiquement la latence pour les applications professionnelles et grand public. La dimension multimodale de Gemini Omni, si elle est effective, répondrait à une demande croissante des développeurs cherchant à intégrer différents formats de données dans un seul pipeline. L'agent personnel Spark, évoqué par l'analyste Andrew Curran, signalerait en outre une ambition directe de Google sur le marché des assistants autonomes, segment où OpenAI et son partenaire Microsoft sont actuellement bien installés. Google I/O 2026 s'inscrit dans une séquence compétitive particulièrement tendue. Depuis le lancement de ChatGPT fin 2022, Google a dû accélérer sa stratégie IA après avoir été pris de court, enchaînant les sorties de Bard puis des différentes versions de Gemini. Cette conférence arrive quelques semaines après la Build de Microsoft et plusieurs annonces d'OpenAI, dans un contexte où chaque acteur cherche à affirmer sa domination sur les modèles de nouvelle génération. La mention de comportements inattendus lors des tests internes du plus grand modèle de Google soulève également des questions sur la maîtrise de ces systèmes, un sujet que la communauté de la sécurité IA surveille de près. Le keynote de deux heures prévu ce soir devait clarifier jusqu'où Google est prêt à aller dans cette course à la puissance.

UELes nouveaux modèles Gemini, une fois disponibles via Google Cloud et l'API Gemini, impacteront directement les développeurs et entreprises européennes qui les intègrent dans leurs produits et pipelines IA.

💬 900 jetons par seconde, si le chiffre tient, ça change vraiment les usages pro, la latence c'est souvent là que les applis IA décrochent. Ce que je retiens surtout, c'est quand même ce détail sur les comportements inattendus en test interne, parce que ce genre de truc ne se glisse pas par hasard dans un teasing. Google joue gros ce soir.

LLMsOpinion
1 source
Avec 34 millions d’euros, Dust accélère sur les systèmes multi-agents pour les entreprises
270FrenchWeb 

Avec 34 millions d’euros, Dust accélère sur les systèmes multi-agents pour les entreprises

La startup française Dust a annoncé une levée de fonds de 34 millions d'euros pour accélérer le développement de ses systèmes multi-agents destinés aux entreprises. Cette opération, l'une des plus significatives du secteur de l'IA appliquée en France cette année, doit permettre à la société de renforcer son infrastructure technique et d'élargir sa base de clients parmi les grandes organisations. Dust propose une plateforme permettant de déployer des agents IA capables de collaborer entre eux pour automatiser des processus métiers complexes, allant bien au-delà du simple assistant conversationnel. L'enjeu est de taille : si l'IA générative s'est diffusée à une vitesse inédite dans les entreprises, son impact réel sur l'organisation du travail reste limité. Les copilotes et chatbots actuels restent des outils individuels, cloisonnés, sans mémoire collective ni coordination. Dust parie que la prochaine étape est la mise en place d'agents spécialisés qui se transmettent des tâches, partagent du contexte et agissent de façon coordonnée, transformant ainsi des workflows entiers plutôt qu'une seule interaction à la fois. Cette levée intervient dans un contexte de compétition intense autour des agents IA, où des acteurs comme Salesforce, Microsoft ou encore des startups américaines telles que Glean et Moveworks se positionnent également sur l'automatisation des processus d'entreprise. La particularité de Dust tient à son ancrage européen et à son approche modulaire, permettant aux équipes IT d'assembler des chaînes d'agents sur mesure. Avec ces nouveaux fonds, la startup entend consolider sa position sur le marché européen avant d'envisager une expansion internationale.

UEDust, startup française, lève 34 millions d'euros pour construire une alternative européenne aux plateformes d'agents IA d'entreprise et vise à consolider sa position sur le marché européen avant une expansion internationale.

💬 34M€ pour Dust, c'est le genre de levée qui montre que le marché a enfin compris que les chatbots en silo ne suffisent plus. La vraie valeur, elle est dans la coordination entre agents, pas dans l'assistant individuel bien poli. Reste à voir si leur approche modulaire tient face à Salesforce qui a les moyens de racheter le problème.

BusinessActu
1 source
Anthropic et OpenAI captent 89 % des revenus des startups IA
271The Information AI 

Anthropic et OpenAI captent 89 % des revenus des startups IA

Anthropic et OpenAI concentrent désormais 89 % des revenus générés par les 34 principales startups d'intelligence artificielle, selon les données de la base Generative AI Database de The Information. Ensemble, ces 34 entreprises ont atteint un chiffre d'affaires annualisé de près de 80 milliards de dollars, soit 6,6 milliards de dollars par mois, tirés de la vente d'applications IA ou de l'accès aux modèles qui les alimentent. Cette progression représente une hausse de 112 % en seulement six mois, témoignant d'une accélération sans précédent dans le secteur. Cette concentration extrême signifie que les deux géants absorbent la quasi-totalité de la valeur créée par le boom de l'IA générative, laissant à peine 11 % des revenus aux 32 autres startups du classement. Pour les investisseurs, les entreprises clientes et les développeurs, cela réduit considérablement la diversité réelle de l'écosystème malgré l'effervescence apparente du marché. Les acteurs qui ne se sont pas imposés comme fournisseurs d'infrastructure ou de modèles de référence risquent de se retrouver structurellement marginalisés. Cette dynamique s'inscrit dans un marché où la course aux modèles fondamentaux a exigé des capitaux colossaux : OpenAI et Anthropic ont levé respectivement plusieurs dizaines de milliards de dollars ces dernières années. La capacité à déployer massivement et à nouer des partenariats stratégiques avec Microsoft, Google ou Amazon a créé des avantages compétitifs difficiles à surmonter. La question qui se pose désormais est de savoir si une troisième force, qu'il s'agisse de Meta, Mistral ou d'un acteur encore émergent, peut briser ce duopole avant qu'il ne se cristallise définitivement.

UELa concentration des revenus entre acteurs américains marginalise Mistral et les alternatives européennes, fragilisant la souveraineté numérique de la France et de l'UE dans les infrastructures IA fondamentales.

💬 89 % pour deux acteurs, c'est le chiffre qui rend tout le discours sur la diversité de l'écosystème IA difficile à tenir. Mistral est dans les 11 % restants, et l'argument souveraineté numérique devient de plus en plus compliqué à défendre quand les deux boîtes qui captent tout ont Microsoft et Google dans leur actionnariat. Ça ne va pas s'inverser tout seul.

Les modeles d'IA de pointe ne suppriment pas seulement du contenu : ils le réécrivent, et les erreurs sont presque impossibles à détecter
272VentureBeat AI 

Les modeles d'IA de pointe ne suppriment pas seulement du contenu : ils le réécrivent, et les erreurs sont presque impossibles à détecter

Des chercheurs de Microsoft ont publié une étude démontrant que les grands modèles de langage les plus avancés introduisent silencieusement des erreurs dans les documents qu'ils traitent lors de workflows autonomes en plusieurs étapes. Pour mesurer ce phénomène, l'équipe a conçu un benchmark baptisé DELEGATE-52, composé de 310 environnements de travail couvrant 52 domaines professionnels, de la comptabilité à la cristallographie en passant par la notation musicale. Chaque environnement repose sur des documents réels de 2 000 à 5 000 tokens, associés à cinq à dix tâches d'édition complexes. La méthode d'évaluation, dite "round-trip relay", s'inspire de la rétro-traduction : chaque modification appliquée à un document est conçue pour être réversible, et le modèle doit ensuite exécuter l'opération inverse dans une session indépendante, sans connaissance de l'étape précédente. Résultat : même les modèles frontier les plus performants corrompent en moyenne 25% du contenu des documents à l'issue de ces séquences. Et la présence d'outils agentiques ou de documents parasites ne fait qu'aggraver les performances. Ces conclusions soulèvent des questions concrètes pour quiconque envisage de déléguer du travail intellectuel à une IA. Dans le cadre du "vibe coding", par exemple, un développeur confie l'édition de son code à un modèle sans relire chaque modification. En comptabilité, un utilisateur peut demander à un LLM de réorganiser un grand livre par catégorie de dépenses. Dans ces scénarios, les erreurs introduites par le modèle, suppressions non autorisées, hallucinations insérées dans le texte, reformulations inexactes, sont particulièrement difficiles à détecter précisément parce que l'utilisateur a choisi de faire confiance à la machine plutôt que de tout vérifier lui-même. Une corruption de 25% du contenu dans un document professionnel peut avoir des conséquences significatives et rester invisible si personne ne relit ligne par ligne. Cette étude s'inscrit dans un contexte de pression croissante pour automatiser les tâches de connaissance, portée notamment par l'essor des agents IA censés opérer de manière autonome sur de longues séquences d'actions. Philippe Laban, chercheur senior chez Microsoft Research et co-auteur de l'article, souligne que les modèles testés ignoraient totalement la structure de l'expérience et traitaient chaque étape comme une tâche ordinaire, ce qui rend les résultats d'autant plus représentatifs des conditions réelles. Alors que des acteurs comme OpenAI, Anthropic ou Google multiplient les annonces autour des agents autonomes, ce travail rappelle que la fiabilité sur des tâches longues et itératives reste un problème non résolu. La confiance dans ces systèmes ne devrait pas précéder les preuves de leur robustesse.

UELes entreprises et professionnels européens qui déploient des agents IA pour automatiser des tâches documentaires dans des secteurs réglementés (comptabilité, droit, santé) sont exposés à un risque de corruption silencieuse pouvant entraîner des conséquences légales ou financières significatives.

💬 25% de corruption silencieuse dans des documents pro, c'est pas un bug de démo, c'est un problème de production. Ce qui me frappe, c'est l'aspect invisible : si tu délègues à l'IA précisément pour ne pas relire chaque ligne, tu ne verras jamais l'erreur. Les labs multiplient les annonces d'agents autonomes, mais la fiabilité sur des tâches longues, c'est toujours pas résolu.

SécuritéOpinion
1 source
Apple cherche à intégrer les agents IA dans l'App Store
273The Information AI 

Apple cherche à intégrer les agents IA dans l'App Store

Apple explore actuellement des moyens d'intégrer les agents d'intelligence artificielle dans son App Store, selon des sources proches du dossier. La firme de Cupertino cherche à tirer profit de l'une des tendances les plus fortes du secteur technologique tout en maintenant le contrôle sur les logiciels distribués via sa plateforme. Depuis plusieurs mois, Apple bloque les outils de "vibe coding", ces environnements de développement pilotés par IA, au motif qu'ils enfreignent ses règles de publication. L'enjeu est considérable pour Apple, qui risque de se retrouver marginalisée si ses plateformes ne parviennent pas à accueillir la prochaine génération d'applications autonomes. Les agents IA, capables d'exécuter des tâches complexes de manière indépendante, représentent un changement de paradigme pour l'ensemble de l'industrie du logiciel. En les tenant à l'écart, Apple se coupe d'un marché en pleine explosion et expose sa boutique applicative à la critique d'être trop restrictive face à l'innovation. Cette situation reflète la tension structurelle entre le modèle fermé d'Apple et l'essor rapide des outils d'IA générative. Des concurrents comme Google et Microsoft ont déjà ouvert leurs écosystèmes aux agents et aux outils de développement assistés par IA. Apple, longtemps réticente à assouplir ses règles de l'App Store, notamment sous pression réglementaire en Europe, doit désormais trouver un équilibre entre contrôle de la qualité, sécurité des utilisateurs et compétitivité face à un secteur qui n'attend pas.

UELa pression réglementaire européenne (DMA) sur l'App Store d'Apple, explicitement citée, pourrait forcer une ouverture accélérée aux agents IA en Europe avant d'autres marchés.

💬 Apple a bloqué le vibe coding pendant des mois, et là ils découvrent qu'il faut quand même accueillir les agents IA, bon. Le modèle fermé a rendu l'App Store solide, mais face à des agents autonomes qui exécutent des tâches de bout en bout, leurs règles actuelles ne tiennent plus. Le DMA va les forcer à trancher en Europe avant qu'ils aient une réponse propre, et ça pourrait créer un précédent.

BusinessOpinion
1 source
GridSFM : un petit modele de fondation pour les reseaux electriques
274Microsoft Research 

GridSFM : un petit modele de fondation pour les reseaux electriques

Microsoft a lancé GridSFM, un petit modèle de fondation neuronal conçu pour résoudre en quelques millisecondes l'un des problèmes les plus complexes de la gestion des réseaux électriques : le flux de puissance optimal en courant alternatif, ou AC-OPF. Jusqu'ici, ce calcul pouvait prendre plusieurs heures sur les grands réseaux de transport d'électricité, forçant les opérateurs à choisir entre analyser peu de scénarios ou recourir à des approximations qui négligent des contraintes physiques critiques. GridSFM change la donne : un seul réseau de neurones couvre des grilles de 500 à 80 000 nœuds de connexion, avec deux niveaux disponibles, GridSFM-Open pour les grilles de recherche jusqu'à 4 000 nœuds, et GridSFM-Premier pour les systèmes de production jusqu'à 80 000 nœuds. Le modèle prend en entrée la topologie du réseau, les spécifications des générateurs et des charges, et les contraintes des lignes de transmission, puis produit un point d'opération optimal ainsi qu'un verdict de faisabilité physique. L'enjeu économique est considérable. Les décisions d'optimisation des réseaux électriques influencent directement jusqu'à 20 milliards de dollars par an en coûts de congestion, ainsi que 3,4 térawattheures d'énergies renouvelables perdues chaque année faute de pouvoir les acheminer. En permettant d'évaluer des ordres de grandeur supplémentaires de scénarios en temps réel, GridSFM ouvre la voie à une gestion proactive plutôt que réactive des réseaux. Concrètement, les opérateurs obtiennent une visibilité directe sur la congestion, la stabilité et l'état général du système, sans avoir à attendre des heures de calcul. Pour les marchés de l'électricité, la distribution en temps réel et l'analyse de contingence, cette rapidité représente une transformation opérationnelle majeure. Ce lancement s'inscrit dans un contexte de tension croissante sur les réseaux électriques, soumis simultanément à l'explosion de la demande, à l'intégration des énergies renouvelables, à l'électrification des transports et à la multiplication des événements météorologiques extrêmes. Microsoft avait déjà posé les bases avec la publication d'un jeu de données ouvert sur la topologie du réseau de transmission américain, qui alimente directement GridSFM. Le modèle est construit comme un opérateur neuronal discret à structure par blocs, représentant chaque réseau sous forme de graphe orienté, et entraîné via une supervision par solveur (IPOPT dans PowerModels.jl) ainsi que par des contraintes physiques. En le mettant à disposition de la communauté, Microsoft vise à permettre la construction de simulateurs avancés et d'outils de planification sans repartir de zéro, accélérant potentiellement la transition énergétique à l'échelle industrielle.

UELes gestionnaires de réseaux européens, dont RTE en France, pourraient déployer GridSFM pour optimiser l'intégration des renouvelables et réduire les coûts de congestion, un enjeu central dans les objectifs de transition énergétique de l'UE.

💬 Un modèle spécialisé qui résout en millisecondes ce que les solveurs classiques calculent en plusieurs heures, c'est le bon usage de l'IA, pas du marketing. 20 milliards par an de coûts de congestion réseaux, c'est du concret. Sur le papier, ça change vraiment quelque chose pour RTE et les opérateurs européens, et le fait que Microsoft publie ça en open accélère le truc.

InfrastructureOpinion
1 source
SAP Sapphire : l’entreprise autonome devient la nouvelle vision B2B de SAP
275Le Big Data 

SAP Sapphire : l’entreprise autonome devient la nouvelle vision B2B de SAP

Lors de SAP Sapphire 2026, l'éditeur allemand SAP a présenté sa nouvelle vision stratégique : transformer son ERP en une "entreprise autonome" capable d'exécuter des processus critiques de bout en bout grâce à l'IA. Le CEO Christian Klein a dévoilé trois piliers majeurs : SAP Autonomous Suite, qui déploie plus de 50 assistants Joule spécialisés coordonnant plus de 200 agents IA dans la finance, les achats, la supply chain, les RH et l'expérience client ; SAP Business AI Platform, qui fusionne SAP Business Technology Platform, SAP Business Data Cloud et SAP Business AI en un environnement unique ; et Joule Work, une interface orientée objectif accessible sur ordinateur, mobile et commandes vocales. Pour accélérer l'adoption, SAP annonce un fonds de 100 millions d'euros et une série de partenariats avec Anthropic, Amazon Web Services, Google Cloud, Microsoft, NVIDIA, Mistral AI et Cohere. Un cas concret a été mis en avant avec l'énergéticien RWE : des agents IA analysent des milliers d'incidents passés sur des éoliennes offshore pour identifier l'origine probable d'une panne et générer automatiquement des ordres de maintenance préremplis. L'enjeu central de cette annonce est de faire passer l'IA d'un rôle d'assistant à celui d'exécutant autonome au coeur des opérations d'entreprise. L'assistant dédié à la clôture financière illustre l'ambition : en automatisant les écritures comptables, les rapprochements et la correction d'erreurs, SAP promet de réduire un processus qui prenait plusieurs semaines à quelques jours seulement. Pour les grandes entreprises soumises à des exigences croissantes de productivité, de conformité réglementaire et de rapidité, c'est une promesse directement chiffrée en gains opérationnels. Le lancement de sept solutions Industry AI, avec des règles métiers et réglementaires propres à chaque secteur, signale que SAP ne vise plus seulement les directions IT mais les métiers eux-mêmes, qu'il s'agisse de l'énergie, de la logistique ou de la fabrication. Cette offensive s'inscrit dans une compétition frontale entre les grands éditeurs ERP pour la domination de l'IA d'entreprise, face à Oracle, Microsoft et Salesforce qui poursuivent des ambitions similaires. SAP capitalise sur sa position de référence dans les grandes organisations mondiales, où ses systèmes gèrent déjà les données les plus critiques : c'est précisément ce capital de confiance et de données que le groupe cherche à monétiser via l'IA autonome. Le SAP Knowledge Graph, couche qui structure les relations entre données, processus et entités métiers, est présenté comme le socle différenciateur qui donnera aux agents une compréhension contextuelle que des solutions génériques ne peuvent pas offrir. Les partenariats avec des fournisseurs de modèles souverains comme Mistral AI et Cohere indiquent également que SAP anticipe des exigences de conformité et de localisation des données, particulièrement fortes en Europe. La prochaine étape sera de valider ces promesses à grande échelle dans des déploiements réels, au-delà des cas pilotes présentés en conférence.

UESAP, leader européen des ERP, intègre Mistral AI dans sa plateforme et anticipe explicitement les exigences européennes de souveraineté et de localisation des données, avec un fonds de 100 millions d'euros ciblant l'adoption dans les grandes organisations, dont de nombreuses entreprises françaises et européennes déjà clientes.

💬 Les 50 assistants et les 200 agents, c'est du bruit. Ce qui compte, c'est le Knowledge Graph, cette couche qui structure 30 ans de données métiers dans des millions d'entreprises, et que personne d'autre ne peut reproduire du jour au lendemain. Le cas RWE sur les éoliennes, bon, c'est encore un pilote, mais c'est exactement là où SAP peut devenir difficile à contourner.

OutilsOutil
1 source
La valorisation de N8N double à 4,42 milliards d’euros alors que SAP accélère sur les workflows de l’IA d’entreprise
276FrenchWeb 

La valorisation de N8N double à 4,42 milliards d’euros alors que SAP accélère sur les workflows de l’IA d’entreprise

La plateforme d'automatisation de workflows n8n vient de voir sa valorisation doubler pour atteindre 4,42 milliards d'euros, à la faveur d'une entrée au capital du groupe allemand SAP. L'opération s'inscrit dans une séquence d'acquisitions et de prises de participation menées par SAP en l'espace de quelques semaines seulement, ciblant des acteurs clés de la chaîne de valeur de l'intelligence artificielle d'entreprise. Après Dremio, spécialiste de la gestion des données, et Prior Labs, orienté modèles IA, n8n devient la troisième pièce du puzzle stratégique de l'éditeur de Walldorf. Cette montée au capital dépasse le cadre d'un simple investissement financier. SAP cherche à positionner ses solutions au coeur des architectures d'agents IA qui se déploient rapidement dans les grandes entreprises, un marché en pleine ébullition où la maîtrise des workflows d'orchestration est devenue un avantage compétitif décisif. Pour n8n, dont le modèle open-source a séduit des centaines de milliers de développeurs, l'adossement à SAP ouvre les portes d'un écosystème de clients grands comptes que la startup n'aurait pu atteindre seule. SAP, dont le coeur de métier reste les ERP, doit réinventer sa proposition de valeur face à la montée en puissance de Microsoft, Salesforce et ServiceNow sur le terrain de l'automatisation intelligente. En constituant rapidement un portefeuille d'actifs spécialisés autour des données, des modèles et des workflows, le groupe allemand parie sur une intégration verticale qui lui permettrait de proposer une offre IA bout en bout à ses 440 000 clients dans le monde.

UESAP, géant européen des ERP basé à Walldorf, et n8n, startup allemande d'automatisation open-source, consolident ensemble une filière européenne de l'IA d'entreprise, renforçant la compétitivité du continent sur le marché mondial des workflows intelligents.

💬 La vraie cohérence de la stratégie SAP commence à apparaître. Dremio pour les données, Prior Labs pour les modèles, n8n pour l'orchestration, tout ça en quelques semaines, c'est une pile IA verticale qu'ils assemblent vite et bien. Reste à voir si n8n, outil adoré des devs précisément parce qu'il n'est pas SAP, survit au contact des grands comptes enterprise.

BusinessOpinion
1 source
Intel pourrait fabriquer les futures puces IA d’Apple
277Le Big Data 

Intel pourrait fabriquer les futures puces IA d’Apple

Apple et Intel auraient conclu un accord préliminaire permettant au géant des semi-conducteurs américain de fabriquer une partie des futures puces IA d'Apple, selon le Wall Street Journal. Les deux groupes auraient négocié pendant plus d'un an avant d'aboutir à ce rapprochement, révélé début mai 2026. La réaction des marchés a été immédiate : l'action Intel a bondi de près de 14 % à l'annonce, tandis qu'Apple gagnait environ 2 %. Le partenariat débuterait par les futures puces de la série M destinées aux Mac et aux iPad, les puces iPhone pouvant suivre dans un second temps. Côté production, l'usine d'Intel à Chandler, en Arizona, fabrique déjà des puces basées sur son procédé 18A, la technologie la plus avancée du groupe. Apple pourrait toutefois attendre la génération suivante, baptisée 18A-P, dont la mise en production de masse est attendue dès l'année prochaine selon l'analyste Ben Bajarin de Creative Strategies. Cet accord représenterait bien plus qu'un simple contrat de sous-traitance. Pour Apple, il s'agit de réduire une dépendance quasi totale à TSMC, le fondeur taïwanais qui produit aujourd'hui l'essentiel de ses puces les plus avancées. La montée en puissance de l'IA générative a fait exploser la demande mondiale de capacités de fabrication : Nvidia, Microsoft, Amazon, Google et Meta mobilisent déjà une part croissante des lignes de production les plus avancées, rendant la diversification stratégique urgente pour Apple. Bajarin qualifie Intel de "seule alternative crédible" capable de devenir une seconde source industrielle à grande échelle pour Cupertino. Cette diversification permettrait également de limiter l'exposition aux risques géopolitiques liés aux tensions autour de Taïwan, qui font peser une menace structurelle sur l'approvisionnement en puces. Pour Intel, la portée symbolique d'un tel contrat serait considérable. L'entreprise a longtemps peiné à convaincre des clients externes de lui confier des puces critiques, après des années de retards technologiques et de problèmes de rendement dans son activité de fonderie. Accrocher Apple à son carnet de commandes équivaudrait à valider publiquement que cette division est désormais compétitive face aux leaders asiatiques. Intel accélère ses investissements industriels aux États-Unis dans ce but. Cette alliance potentielle s'inscrit dans une bataille plus large : aujourd'hui, seules trois entreprises disposent des technologies nécessaires pour produire les semi-conducteurs les plus avancés, TSMC, Intel et Samsung. Apple aurait d'ailleurs également visité l'usine texane de Samsung pour évaluer ses capacités, signe que la guerre mondiale des usines IA s'intensifie et que les géants de la tech cherchent activement à multiplier leurs options industrielles.

UECe rapprochement Apple-Intel accélère la consolidation des capacités de fabrication de semi-conducteurs avancés aux États-Unis, rendant plus urgente la question de la souveraineté industrielle européenne face à une dépendance structurelle aux fondeurs extra-européens que l'European Chips Act cherche précisément à réduire.

💬 Apple qui diversifie ses fondeurs, c'est pas une surprise, mais que ce soit Intel qui décroche le contrat, là par contre je l'aurais pas parié il y a deux ans. Les retards, les problèmes de rendement, le fiasco de leur division fonderie... et pourtant le 18A semble enfin tenir la route, assez pour qu'Apple prenne le risque. Reste à voir si les lignes de production suivent quand il faudra livrer des dizaines de millions de puces.

Anthropic veut contrôler mémoire, évaluations et orchestration des agents, de quoi inquiéter les entreprises
278VentureBeat AI 

Anthropic veut contrôler mémoire, évaluations et orchestration des agents, de quoi inquiéter les entreprises

Quelques semaines seulement après le lancement de Claude Managed Agents, Anthropic a enrichi sa plateforme de trois nouvelles fonctionnalités majeures : « Dreaming », « Outcomes » et « Multi-Agent Orchestration ». Dreaming permet aux agents de réviser leurs sessions passées pour construire une mémoire évolutive et détecter des patterns jusque-là invisibles. Outcomes offre aux équipes la possibilité de définir des critères de succès précis pour mesurer la performance de leurs agents. Quant à Multi-Agent Orchestration, elle permet à un agent principal de décomposer des tâches complexes et de les déléguer à des agents spécialisés. L'objectif affiché d'Anthropic est de réduire au minimum l'intervention humaine dans la gestion des agents, en intégrant mémoire, évaluation et orchestration au sein d'une seule et même infrastructure hébergée. Ce repositionnement place Anthropic en concurrence directe avec un écosystème entier d'outils spécialisés que les entreprises utilisent aujourd'hui séparément : LangGraph et CrewAI pour l'orchestration, Pinecone pour la mémoire vectorielle à long terme, DeepEval pour l'évaluation externe, et des équipes humaines entières pour le contrôle qualité. En consolidant toutes ces couches dans un runtime unifié, Anthropic promet une traçabilité complète et un déploiement simplifié. Mais cette intégration verticale soulève des questions sérieuses pour les entreprises. La plateforme tourne sur une infrastructure qu'elles ne contrôlent pas, ce qui peut créer des problèmes de conformité sur la résidence des données, un point critique dans des secteurs régulés comme la finance ou la santé. Par ailleurs, les organisations déjà engagées dans de vastes chantiers de transformation IA ne peuvent pas forcément remplacer leurs systèmes existants du jour au lendemain sans casser leurs workflows. La vraie tension est celle du lock-in. En concentrant mémoire, orchestration et évaluation dans une même couche, Anthropic capte l'essentiel de l'architecture décisionnelle des agents, et les entreprises qui adoptent pleinement la plateforme se retrouvent structurellement dépendantes d'un seul fournisseur. Cette dynamique n'est pas propre à Anthropic : OpenAI et Microsoft poussent également vers des architectures intégrées, au motif que rapprocher orchestration et modèle améliore le contrôle et la cohérence. Mais le mouvement accélère une recomposition du marché où les couches intermédiaires, mémoire, routing, évaluation, risquent d'être absorbées par les grands modèles eux-mêmes. Les entreprises qui ont investi dans des stacks modulaires et flexibles devront arbitrer entre la commodité d'une plateforme tout-en-un et leur capacité à rester agiles face à un marché encore en pleine définition.

UELes entreprises européennes des secteurs régulés (finance, santé) devront évaluer la conformité de l'infrastructure hébergée d'Anthropic avec les exigences de résidence des données imposées par le RGPD.

💬 Anthropic ne vend plus un modèle, il vend une plateforme, et la différence va se payer cash d'ici 18 mois. Mémoire, orchestration, évaluation dans un seul runtime hébergé, c'est séduisant pour les équipes qui gèrent 4 outils différents, mais ça fait une dépendance énorme sur l'architecture décisionnelle complète. Pour les boîtes françaises en finance ou santé, la question de la résidence des données n'est pas rhétorique.

BusinessOutil
1 source
Anthropic s'engage à dépenser 200 milliards de dollars sur Google Cloud sur cinq ans
279The Decoder 

Anthropic s'engage à dépenser 200 milliards de dollars sur Google Cloud sur cinq ans

Anthropic s'est engagé à dépenser environ 200 milliards de dollars sur les services de Google Cloud au cours des cinq prochaines années, selon un rapport de The Information. Ce montant représente plus de 40 % du carnet de commandes total de Google Cloud, une proportion sans précédent pour un seul client. OpenAI et Anthropic réunis comptent aujourd'hui pour environ la moitié des 2 000 milliards de dollars de revenus cloud contractualisés chez les quatre grands fournisseurs du marché : Amazon, Microsoft, Google et Oracle, alors que les deux startups demeurent déficitaires. Ces chiffres illustrent la dépendance structurelle des acteurs dominants de l'IA générative à l'infrastructure cloud, et la pression financière considérable qui pèse sur leurs modèles économiques. Pour justifier de tels engagements, Anthropic et OpenAI tablent chacun sur une multiplication de leurs revenus par 20 à 30 d'ici 2029. Si cette trajectoire est atteignable reste une question ouverte, au regard des pertes actuelles et de la compétition acharnée dans le secteur. Ces engagements s'inscrivent dans une relation d'interdépendance financière entre les géants du cloud et les startups IA. Google a investi plusieurs milliards de dollars dans Anthropic en tant qu'actionnaire, et ces dépenses cloud constituent en retour un flux de revenus garanti pour l'infrastructure Google. Ce modèle circulaire, où les fournisseurs cloud financent les startups qui reversent ces capitaux en achats d'infrastructure, soulève des questions sur la viabilité à long terme d'un secteur qui brûle des capitaux à une échelle inédite dans l'histoire de la tech.

UELa dépendance structurelle des leaders de l'IA générative aux infrastructures cloud américaines renforce les enjeux de souveraineté numérique européenne et soulève des questions sur la compétitivité des acteurs du secteur en Europe.

💬 200 milliards sur cinq ans chez Google Cloud, c'est pas un partenariat, c'est une dépendance assumée. Le truc fascinant, c'est la circularité du schéma : Google investit dans Anthropic, Anthropic reverse cet argent à Google Cloud, et tout le monde appelle ça de la croissance. Reste à voir comment ce montage tient si les revenus ne décollent pas au rythme x20 promis.

IBM veut faire de l’IA le moteur de transformation des entreprises
280Le Big Data 

IBM veut faire de l’IA le moteur de transformation des entreprises

Lors de sa conférence annuelle Think 2026, IBM a présenté ce qu'il appelle un "AI operating model", un modèle opérationnel destiné à transformer en profondeur le fonctionnement des entreprises. La pièce maîtresse de cette annonce est une nouvelle version de Watson Orchestrate, qui évolue en plateforme de contrôle multi-agents capable de superviser simultanément plusieurs IA spécialisées, finance, support client, cybersécurité, RH, supply chain. Rob Thomas, vice-président senior des logiciels chez IBM, a insisté sur un point central : la qualité des données reste le prérequis absolu de toute stratégie IA crédible. IBM s'appuie également sur son rapprochement avec Confluent pour renforcer le streaming de données en temps réel via Kafka et Flink, afin que ses modèles ne travaillent plus jamais sur des informations obsolètes. L'enjeu pour IBM est de combler ce qu'il nomme l'"AI divide" : le fossé croissant entre les entreprises qui ont intégré l'IA dans leurs opérations quotidiennes et celles qui restent coincées au stade des expérimentations isolées. Des années de pilotes IA en silo, assistants internes, automatisation documentaire, agents conversationnels, ont atteint leurs limites. IBM veut désormais que ces briques se coordonnent en un système unique et cohérent, gouverné et auditable. Mark Tauschek, vice-président recherche chez Info-Tech Research Group, confirme que la prolifération des agents autonomes crée déjà des risques réels : politiques appliquées de façon incohérente, manque de traçabilité, gouvernance absente. IBM se positionne explicitement comme fournisseur de gouvernance IA plutôt que comme simple éditeur d'outils génératifs. Ce repositionnement intervient dans un contexte où les grands acteurs technologiques se livrent une bataille féroce pour capter les budgets IA des entreprises. Microsoft, Google, Salesforce et Oracle avancent tous leurs propres frameworks d'agents. IBM, dont l'histoire est profondément ancrée dans les infrastructures d'entreprise et la gestion des données sensibles, mise sur la confiance et la gouvernance comme avantages différenciants, un argument qui résonne particulièrement dans les secteurs régulés comme la banque, l'assurance ou la santé. La stratégie repose sur quatre piliers liés : données, agents IA, automatisation et infrastructure hybride. Si IBM parvient à convaincre que cette approche intégrée réduit les risques tout en accélérant la valeur opérationnelle, Think 2026 pourrait marquer un tournant dans sa capacité à reconquérir un rôle de premier plan dans l'ère de l'IA d'entreprise.

UEL'approche gouvernance d'IBM et son focus sur les secteurs régulés (banque, assurance, santé) résonnent directement avec les exigences de l'AI Act européen, dont les premières obligations d'audit et de traçabilité entrent en vigueur cette année.

OutilsOutil
1 source
☕️ Les promesses non tenues autour de Siri vont coûter cher à Apple
281Next INpact 

☕️ Les promesses non tenues autour de Siri vont coûter cher à Apple

Apple a proposé un règlement amiable de 250 millions de dollars pour mettre fin à un recours collectif déposé en Californie, après que des consommateurs américains ont accusé l'entreprise de publicité mensongère autour de son assistant Siri. Le litige porte sur des spots télévisés diffusés à l'automne 2024, au moment du lancement de la gamme iPhone 16, dans lesquels l'actrice Bella Ramsey, connue pour ses rôles dans Game of Thrones et The Last of Us, interagissait avec un Siri capable de croiser des informations issues de plusieurs applications simultanément et d'exploiter le contexte de l'utilisateur pour répondre à des questions complexes. Ces fonctionnalités, présentées comme imminentes lors de la WWDC de juin 2024, n'ont jamais vu le jour. Apple a depuis discrètement retiré l'une de ces publicités, mais les archives d'internet en ont conservé la trace. Le chèque de 250 millions, qui ne comprend aucune reconnaissance de faute de la part d'Apple, doit encore être validé par le juge californien en charge du dossier. Si l'accord est approuvé, il constituera l'un des règlements judiciaires les plus importants de l'histoire d'Apple. Au-delà du montant, c'est l'ampleur du décalage entre la communication et la réalité qui frappe : les plaignants affirment qu'Apple a vendu des capacités d'IA « qui n'existaient pas à l'époque, qui n'existent toujours pas, et qui n'existeront pas dans les deux prochaines années ». Pour les consommateurs ayant acheté un iPhone 16 en partie motivés par ces promesses, la déception est concrète et mesurable. Pour l'industrie technologique plus largement, ce recours envoie un signal clair : les annonces de fonctionnalités IA non déployées peuvent désormais exposer les entreprises à une responsabilité juridique significative, à mesure que les régulateurs et les juridictions civiles s'emparent du sujet. Le retard de ce « Siri 2.0 » n'est pas un accident isolé, mais le symptôme d'une crise plus profonde au sein de la division intelligence artificielle d'Apple. L'entreprise, qui avait dévoilé Apple Intelligence avec une confiance affichée en juin 2024, a enchaîné les reports, faute de modèle suffisamment performant pour alimenter les nouvelles ambitions de l'assistant. Cette situation a déclenché une réorganisation interne et provoqué le départ de John Giannandrea, le principal responsable de l'IA chez Apple. Pour combler son retard, Cupertino a confirmé début janvier 2026 un accord avec Google pour intégrer les modèles Gemini à ses futures fonctionnalités d'IA. Le Siri personnalisé est désormais attendu avec iOS 27, mais la crédibilité d'Apple dans ce domaine reste entamée, dans un secteur où ses rivaux, Google, Microsoft, Amazon, ont déjà plusieurs longueurs d'avance.

UECe précédent judiciaire américain pourrait inciter les régulateurs européens à renforcer l'application de l'AI Act et du droit de la consommation contre les affirmations trompeuses sur les capacités des systèmes d'IA dans la publicité.

💬 Apple a vendu du rêve sur Siri, le rêve n'est jamais arrivé, et ça leur coûte 250 millions. Ce n'est pas le montant qui m'intéresse, c'est le signal : annoncer une feature IA inexistante en pub, c'est désormais un risque juridique réel. Et toute l'industrie fait ça, pas seulement Cupertino.

SAP tente de reprendre la main sur les données d’entreprise avec DREMIO et PRIOR LABS
282FrenchWeb 

SAP tente de reprendre la main sur les données d’entreprise avec DREMIO et PRIOR LABS

SAP a annoncé quasiment en simultané deux acquisitions stratégiques majeures : Dremio, spécialiste américain des architectures lakehouse bâties sur le format ouvert Apache Iceberg, et Prior Labs, une startup allemande qui développe des modèles d'intelligence artificielle spécialement conçus pour les données tabulaires, le format de prédilection des entreprises. Les termes financiers des deux transactions n'ont pas été divulgués. Ces mouvements s'inscrivent dans la volonté de l'éditeur de Walldorf de repositionner sa plateforme cloud SAP Business Technology Platform comme le système nerveux des données d'entreprise à l'ère de l'IA. L'enjeu est considérable : les grandes entreprises disposent de vastes stocks de données structurées dans des ERP, des entrepôts de données et des lacs de données disparates, et peinent à les exploiter pour alimenter des agents IA ou des analyses prédictives. En intégrant Dremio, SAP offrirait à ses clients la capacité d'interroger ces données en temps réel sans les déplacer, grâce à la couche de requête universelle qu'Iceberg permet. Prior Labs, de son côté, apporte des modèles capables d'apprendre directement sur des tableaux sans pré-entraînement massif, ce qui accélère drastiquement le déploiement de l'IA sur les données métier. SAP se retrouve dans une course serrée face à Salesforce, Microsoft et ServiceNow, tous en train de muscler leurs capacités IA sur les données d'entreprise. L'approche "lakehouse ouvert" de Dremio tranche avec les silos propriétaires traditionnels, un argument commercial puissant face aux clients méfiants du vendor lock-in. Ces deux rachats signalent que SAP parie sur une architecture de données ouverte et fédérée comme socle de sa prochaine génération d'agents IA d'entreprise.

UESAP, entreprise allemande et leader mondial des ERP, renforce sa plateforme IA avec l'acquisition de Prior Labs (startup allemande), impactant directement les milliers d'entreprises françaises et européennes clientes de SAP.

💬 SAP qui mise sur Apache Iceberg et une architecture ouverte, ça change vraiment quelque chose par rapport à leur approche historique. Prior Labs m'intrigue plus que Dremio, en fait : des modèles qui apprennent directement sur des données tabulaires sans pré-entraînement massif, c'est exactement ce dont les équipes métier ont besoin pour déployer de l'IA sans passer par six mois de data prep. Reste à voir si SAP sait intégrer sans casser ce qui faisait l'intérêt de ces deux boîtes.

BusinessOpinion
1 source
Amazon envisage un mode de recherche IA hybride sur son site marchand
283The Information AI 

Amazon envisage un mode de recherche IA hybride sur son site marchand

Amazon envisage d'intégrer des réponses conversationnelles directement dans sa barre de recherche principale, selon Amanda Doerr, vice-présidente en charge du shopping chez Amazon. Jusqu'ici, l'assistant IA Rufus fonctionnait comme un outil séparé, distinct du moteur de recherche classique utilisé par des centaines de millions d'acheteurs. Le modèle envisagé consisterait à afficher un encart conversationnel au-dessus des résultats de recherche pour certaines requêtes, sans rediriger l'utilisateur vers une interface de chatbot distincte. Ce changement pourrait transformer en profondeur la manière dont les consommateurs naviguent sur Amazon, qui reste l'une des premières destinations mondiales pour la recherche de produits. En fusionnant la navigation, la recherche d'information et l'achat dans un seul flux, Amazon réduirait la friction entre la phase de découverte et l'acte d'achat. Pour les vendeurs et les marques présents sur la plateforme, cela soulèverait également des questions importantes sur la visibilité des produits dans un format où une réponse IA pourrait éclipser les résultats organiques traditionnels. Cette évolution s'inscrit dans une course plus large entre les géants technologiques pour intégrer l'IA générative aux interfaces de recherche. Google expérimente depuis 2023 ses "AI Overviews" dans les résultats de recherche, tandis que Microsoft a ajouté Copilot à Bing. Amazon, dont le cœur de métier reste le commerce, doit trouver un équilibre délicat entre améliorer l'expérience utilisateur et préserver la lisibilité des catalogues produits sur lesquels repose son modèle publicitaire.

UELes millions de consommateurs français et les vendeurs présents sur Amazon.fr seraient directement affectés par ce changement, qui modifierait la visibilité des produits et la dynamique de découverte d'articles sur la plateforme.

💬 Amazon c'est la vraie barre de recherche pour les achats, pas Google, et c'est pour ça que ce changement est plus important qu'il n'y paraît. Une réponse IA qui s'affiche avant les résultats organiques, ça remet à zéro dix ans de stratégie SEO marchand pour des milliers de vendeurs. Reste à voir si Amazon est vraiment prêt à toucher à son modèle pub pour ça, parce que là c'est leur chiffre d'affaires qui est en jeu.

OutilsOutil
1 source
Le Pentagone choisit ses nouveaux fournisseurs IA et exclut Anthropic… enfin presque
284Next INpact 

Le Pentagone choisit ses nouveaux fournisseurs IA et exclut Anthropic… enfin presque

Le Pentagone a signé fin avril 2026 des accords avec huit fournisseurs de modèles d'intelligence artificielle pour déployer leurs technologies dans des opérations militaires classifiées. Les entreprises retenues sont OpenAI, Google, Microsoft, Amazon Web Services, NVIDIA, Oracle, SpaceX via sa filiale xAI, et Reflection. Ces contrats couvrent deux niveaux de classification : l'IL6, équivalent du « secret défense », et l'IL7, réservé aux données encore plus sensibles liées aux opérations en cours. Concrètement, ces IA seront mobilisées pour l'analyse de renseignement, la planification d'opérations et l'aide à la prise de décision en temps réel. Une entreprise brille par son absence : Anthropic, pourtant l'un des acteurs les plus avancés du secteur, a été écarté de ces accords. Cette sélection marque une accélération majeure de l'intégration de l'IA dans l'appareil militaire américain, avec des implications industrielles et éthiques immédiates. Chez Google, l'accord signé le 27 avril a provoqué une fronde interne : plus de 560 employés ont adressé une lettre ouverte à Sundar Pichai, réclamant que l'entreprise refuse tout contrat impliquant des opérations classifiées. « La seule façon de garantir que Google ne soit pas associé à de tels dommages est de refuser tout travail sur des projets classifiés », écrivent les signataires. Kent Walker, président des affaires juridiques d'Alphabet, a répondu sans ambiguïté dans un mémo interne, affirmant que Google travaillait « avec fierté » avec le ministère de la Défense depuis ses débuts et que soutenir la sécurité nationale de manière « réfléchie et responsable » restait une priorité de l'entreprise. Le cas Anthropic illustre les tensions profondes entre les exigences du Pentagone et les garde-fous éthiques des labs d'IA. Le DoD utilisait pourtant les modèles Claude depuis 2024, dans des opérations sensibles : ils auraient notamment contribué à la capture de Nicolas Maduro le 3 janvier, et aux premières opérations militaires liées au conflit israélo-iranien. Mais Anthropic a posé des conditions, refusant notamment que sa technologie serve à la surveillance de masse de citoyens américains ou à des armes entièrement autonomes. Le DoD, peu enclin à se laisser imposer des contraintes par un fournisseur, a alors désigné Anthropic « fournisseur à risque », une première pour une entreprise américaine, assimilée à une menace pour la chaîne d'approvisionnement nationale. L'affaire s'est depuis enlisée devant les tribunaux. Le lancement de Mythos par Anthropic début avril semble avoir légèrement rouvert la porte : le directeur technique du DoD, Emil Michael, reconnaît qu'Anthropic reste un risque d'approvisionnement tout en laissant entendre que la situation pourrait évoluer.

UEL'accélération de l'IA militaire classifiée aux États-Unis risque de relancer les débats européens sur une doctrine IA-défense propre et sur les limites que l'AI Act pourrait imposer aux applications militaires des modèles d'IA.

💬 Anthropic dit non à la surveillance de masse et aux armes autonomes, et se retrouve officiellement sur liste noire du Pentagone. C'est sans doute le premier lab à perdre un gros contrat sur des principes éthiques, pas juste à en parler depuis une scène de conférence. Ça va leur coûter cher, et c'est pourtant le seul truc crédible qu'on ait vu depuis longtemps dans ce secteur.

BusinessReglementation
1 source
Implémentation pratique : analyse, visualisation et affinage de traces de raisonnement d'agents
285MarkTechPost 

Implémentation pratique : analyse, visualisation et affinage de traces de raisonnement d'agents

Un tutoriel de programmation publié récemment propose une approche complète pour exploiter le jeu de données lambda/hermes-agent-reasoning-traces, une collection structurée de traces de raisonnement issues de modèles d'agents IA. Le guide couvre quatre étapes distinctes : le chargement et l'inspection du dataset, la construction de parseurs pour extraire les composants clés (traces de réflexion, appels d'outils, réponses), l'analyse statistique des comportements (fréquence d'utilisation des outils, longueur des conversations, taux d'erreurs), et enfin la conversion du dataset dans un format compatible avec l'entraînement supervisé. Le dataset est disponible en plusieurs configurations, notamment "kimi" et "glm-5.1", correspondant à des architectures d'agents différentes, et peut être chargé via la bibliothèque Hugging Face datasets. Les outils utilisés incluent Python 3, pandas, matplotlib, seaborn, transformers, accelerate et trl. Comprendre comment un agent IA raisonne en interne avant d'agir est un enjeu clé pour quiconque cherche à améliorer, déboguer ou affiner ces systèmes. Ce tutoriel permet de séparer concrètement la "pensée" interne d'un modèle (blocs `) de ses actions externes (blocs ) et des retours qu'il reçoit (), grâce à des parseurs basés sur des expressions régulières. Cette granularité est précieuse pour les équipes qui développent des agents autonomes : elle permet de détecter des comportements anormaux, d'identifier des appels d'outils malformés, ou de repérer des patterns de raisonnement défaillants avant de lancer un cycle de fine-tuning. La dernière étape du guide, la préparation du dataset pour le supervised fine-tuning (SFT), rend les données directement exploitables avec des frameworks comme TRL de Hugging Face. Le dataset hermes-agent-reasoning-traces` s'inscrit dans un mouvement plus large de publication de données d'entraînement spécialisées pour les agents IA multi-tours, capables d'utiliser des outils externes. Avec l'essor des architectures de type "agentic" dans des produits comme les assistants à code, les agents de recherche ou les copilotes professionnels, la qualité des traces de raisonnement utilisées pour l'entraînement devient un levier différenciant. Des acteurs comme Lambda, Kimi (Moonshot AI) ou encore les équipes derrière GLM (Tsinghua/Zhipu AI) contribuent à cet écosystème de données ouvertes. La tendance va vers des modèles capables de justifier leurs décisions étape par étape, ce qui exige précisément le type d'infrastructure d'analyse décrite dans ce tutoriel. Les prochaines évolutions pourraient inclure des métriques automatisées de qualité du raisonnement ou des benchmarks standardisés sur ce type de traces.

💬 Ce dataset de traces de raisonnement, c'est du matériel brut pour quiconque entraîne ou débogue un agent en ce moment. La partie intéressante c'est moins le fine-tuning que l'analyse en amont : repérer les appels d'outils malformés ou les boucles de raisonnement avant de lancer un cycle d'entraînement, ça évite de brûler des GPU pour rien. Reste que les configs "kimi" et "glm-5.1" sont assez spécifiques, difficile de généraliser sans retravailler les parseurs de fond en comble.

LLMsTuto
1 source
GitHub Copilot adopte une facturation à la consommation
286AI News 

GitHub Copilot adopte une facturation à la consommation

À partir du 1er juin 2026, GitHub Copilot abandonne son modèle d'abonnement à requêtes fixes pour adopter une facturation à la consommation de tokens. Jusqu'à présent, les utilisateurs disposaient d'un quota mensuel de « requêtes premium », chaque requête comptant pour une unité qu'il s'agisse d'une tâche complexe de refactorisation ou d'une simple question. Le nouveau système remplace ces requêtes par des « AI Credits » : un abonné Copilot Pro à 10 dollars par mois reçoit 1 000 crédits, chaque crédit valant un centime américain. Un token représente environ les trois quarts d'un mot, ce qui signifie que 10 000 mots de code soumis à Copilot génèrent entre 12 000 et 13 000 tokens facturés. Le coût réel dépendra du modèle choisi, du ratio entrées/sorties, de la taille du cache et de la fonctionnalité utilisée. Seules les suggestions de complétion de code et les « Next Edit suggestions » resteront gratuites. Ce changement modifie profondément la relation des développeurs avec l'outil. Alors que l'abonnement mensuel masquait jusqu'ici la consommation réelle de tokens, Microsoft subventionnait de facto trois à huit fois la valeur nominale de chaque abonnement grâce à ses revenus logiciels et cloud, les utilisateurs devront désormais surveiller activement leur dépense token par requête. Pour un développeur qui enchaîne des tâches simples, l'impact sera limité. En revanche, les équipes qui déploient des agents de codage autonomes sur de grandes bases de code risquent de voir leur facture exploser rapidement. Le cas d'Uber est emblématique : selon The Information, le directeur technique de l'entreprise a déclaré avoir déjà épuisé l'intégralité du budget IA 2026 dès les premiers mois de l'année, alors que 11 % des mises à jour du code d'Uber sont désormais rédigées par des agents IA, principalement basés sur Claude d'Anthropic. Ce virage tarifaire s'inscrit dans un mouvement plus large du secteur. Anthropic et OpenAI ont déjà migré leurs clients enterprise vers une facturation à la consommation. Microsoft, propriétaire de GitHub, suit la même trajectoire mais à partir d'une position plus exposée : Copilot cible précisément les développeurs individuels et les petites équipes, un public moins préparé que les grandes entreprises à raisonner en coût par token. Le risque pour GitHub est double : freiner l'exploration des nouveaux utilisateurs, qui hésiteront avant de soumettre de longues sessions de débogage, et accélérer l'arbitrage chez les équipes tech qui compareront désormais les coûts réels de Copilot face à ses concurrents directs comme Cursor ou les offres Claude for Business. La transparence des coûts, longtemps perçue comme un avantage client, devient un terrain de compétition où les marges de chaque acteur seront exposées.

UELes développeurs français et européens utilisant GitHub Copilot devront surveiller activement leur consommation de tokens dès juin 2026 et réévaluer leurs budgets IA face à des alternatives comme Cursor ou Claude for Business.

💬 Microsoft vient de retirer le masque. Tant que le forfait fixe absorbait tout, personne ne regardait la consommation réelle, mais là, un agent autonome sur une grosse codebase, et la facture peut tripler sans prévenir. Le cas Uber, c'est pas une anecdote, c'est exactement ce qui attend les équipes qui ont dit oui à l'IA à grande échelle sans jamais compter les tokens.

OutilsOutil
1 source
AWS approfondit sa collaboration avec OpenAI pour séduire les grandes entreprises
287Le Big Data 

AWS approfondit sa collaboration avec OpenAI pour séduire les grandes entreprises

Amazon Web Services et OpenAI ont annoncé le 28 avril 2026 un élargissement significatif de leur partenariat, avec l'intégration des derniers modèles d'OpenAI directement dans Amazon Bedrock, la plateforme d'IA managée d'AWS. Concrètement, les entreprises clientes d'AWS peuvent désormais accéder aux modèles OpenAI via les mêmes API et outils que ceux déjà utilisés pour Anthropic, Meta, Mistral AI ou Cohere, sans changer d'environnement ni multiplier les contrats. Dans la foulée, AWS a annoncé le lancement de Codex sur Bedrock, l'agent de développement logiciel d'OpenAI déjà utilisé par plus de 4 millions de personnes chaque semaine, ainsi que le déploiement des Amazon Bedrock Managed Agents, une couche d'orchestration pour automatiser des workflows complexes en production. Pour les grandes organisations, l'enjeu dépasse le simple accès à de nouveaux modèles. Ce qui change concrètement, c'est la possibilité d'utiliser l'IA d'OpenAI sans renoncer aux garanties de sécurité et de conformité d'AWS : gestion des accès via IAM, chiffrement des données, journalisation avec CloudTrail, connectivité sécurisée via PrivateLink. Ces couches de gouvernance, déjà en place pour d'autres modèles Bedrock, s'appliquent désormais aux modèles OpenAI sans reconfiguration. À cela s'ajoute un avantage financier non négligeable : les usages OpenAI peuvent être imputés directement aux engagements cloud AWS existants, évitant la multiplication des fournisseurs et des lignes budgétaires. Pour les directions techniques et achats des grandes entreprises, c'est précisément le type de friction qui bloquait le passage du pilote à la production à grande échelle. Cette annonce s'inscrit dans une compétition acharnée entre les grands clouds pour capter les budgets IA des entreprises. Azure bénéficie depuis plusieurs années d'une exclusivité de fait sur OpenAI via l'investissement de Microsoft, qui détient une participation estimée à plusieurs dizaines de milliards de dollars dans la startup. En ouvrant Bedrock aux modèles OpenAI, AWS brouille cette distinction et positionne sa plateforme comme un guichet unique multi-modèles, où l'entreprise choisit le meilleur outil pour chaque cas d'usage sans dépendre d'un fournisseur unique. Pour OpenAI, l'accord élargit considérablement sa distribution commerciale au-delà de l'écosystème Microsoft, à une clientèle enterprise déjà ancrée dans AWS. Les prochains mois diront si cette convergence accélère l'adoption de Codex dans les équipes de développement, un marché où GitHub Copilot d'Amazon et Microsoft se livrent déjà une bataille directe.

UELes entreprises européennes déjà clientes d'AWS peuvent désormais déployer les modèles OpenAI en production via leur infrastructure cloud existante, avec les couches de conformité AWS déjà en place, supprimant un frein réglementaire majeur à l'adoption à grande échelle.

BusinessOpinion
1 source
Token, compute, dérive des usages : pourquoi l’IA peut coûter plus cher que vos équipes ?
288Le Big Data 

Token, compute, dérive des usages : pourquoi l’IA peut coûter plus cher que vos équipes ?

Dans certaines entreprises, la facture mensuelle liée à l'intelligence artificielle dépasse désormais celle des salaires humains. C'est le constat documenté par Axios dans une enquête publiée fin avril 2026, qui révèle que le coût du traitement des requêtes IA excède, dans certains cas, celui des équipes en chair et en os. Bryan Catanzaro, responsable chez Nvidia, a confirmé le phénomène pour ses propres équipes. Le New York Times rapporte que certains utilisateurs intensifs atteignent plus de 150 000 dollars de dépenses mensuelles en tokens, certains ingénieurs dépensant davantage en usage d'IA qu'ils ne touchent en salaire. Chez Uber, des équipes utilisant des outils comme Claude Code ont déjà épuisé leur budget annuel d'IA bien avant la fin de l'exercice, selon The Information. Le phénomène a même un nom dans les milieux tech : le "tokenmaxxing", pratique où les ingénieurs maximisent délibérément leur consommation de tokens, parfois comme indicateur implicite de performance. Ce glissement remet en cause la promesse fondatrice de l'IA en entreprise : réduire les coûts grâce à l'automatisation. L'équation est plus complexe que prévu. Chaque requête envoyée à un modèle consomme des tokens facturés, et lorsque les agents s'exécutent en parallèle sans supervision directe, les volumes explosent. La structure de coût des entreprises se transforme en profondeur : les dépenses, autrefois fixes et prévisibles via les ressources humaines, deviennent variables, dépendantes de l'usage, et donc difficiles à piloter. Pour les organisations qui n'ont pas mis en place de garde-fous, la dérive peut être rapide. Chez Meta, l'utilisation de l'IA est désormais intégrée dans l'évaluation des performances des employés, ce qui pousse mécaniquement à une consommation accrue. Google et Microsoft adoptent des dynamiques similaires, une grande part du code produit étant déjà générée par des modèles. Cette situation profite directement aux fournisseurs de modèles. OpenAI et Anthropic bénéficient de la hausse de consommation, Anthropic ayant d'ailleurs relevé ses tarifs récemment. Les investisseurs parient sur la capacité des modèles les plus efficaces à capter davantage de clients en offrant un meilleur ratio performance-coût. Du côté des entreprises consommatrices, les réponses restent expérimentales. Jensen Huang, PDG de Nvidia, a évoqué l'idée de distribuer des quotas de tokens aux employés, à l'image d'une enveloppe salariale dédiée à l'IA, ce qui transformerait l'accès à la puissance de calcul en véritable avantage compétitif individuel. Le compute est en passe de devenir une ligne budgétaire stratégique aussi sensible que la masse salariale, obligeant les directions financières à repenser leur manière de gouverner ces outils avant que la facture ne devienne incontrôlable.

UELes entreprises européennes adoptant des agents IA à grande échelle sont exposées aux mêmes dérives budgétaires documentées aux États-Unis, sans cadre de gouvernance des coûts IA encore établi au niveau sectoriel ou réglementaire.

BusinessOpinion
1 source
GitHub Copilot passe à une facturation à l’usage à partir du 1er juin
289Next INpact 

GitHub Copilot passe à une facturation à l’usage à partir du 1er juin

GitHub a annoncé mardi 27 avril que son assistant de programmation Copilot basculera vers une facturation à l'usage à compter du 1er juin 2025. Le principe repose sur un système de "crédits IA" alloués selon l'abonnement souscrit : un Copilot Pro à 10 dollars par mois donnera accès à 1 000 crédits, tandis qu'un Copilot Pro+ à 39 dollars par mois en offrira 3 900. Une fois l'enveloppe épuisée, l'utilisateur devra acheter des crédits supplémentaires pour continuer à accéder aux modèles génératifs avancés. En parallèle, Microsoft a annoncé le déploiement de Copilot auprès des 743 000 employés d'Accenture, le plus grand déploiement externe jamais annoncé pour l'outil. Ce changement marque la fin d'un modèle hybride qui combinait abonnement fixe et quota de "requêtes premium", dans lequel GitHub absorbait une part croissante des coûts d'inférence. La plateforme l'admet sans détour : "une simple question posée via le chat et une session de codage autonome de plusieurs heures peuvent coûter le même prix à l'utilisateur", ce qui rend l'ancien système intenable. La complétion automatique et les suggestions de code restent disponibles sans consommer de crédits, ce qui protège les usages basiques. En revanche, les développeurs qui utilisent Copilot en mode agent, sur plusieurs fichiers en continu, verront leur facture augmenter sensiblement. GitHub aligne ainsi sa tarification sur celle d'Anthropic et d'OpenAI, adoptant une logique de facturation au token qui était jusqu'ici propre aux API brutes. Cette décision s'inscrit dans une série de signaux qui se sont accumulés ces dernières semaines. Le 21 avril, GitHub avait déjà suspendu les nouvelles souscriptions individuelles, officiellement pour mieux gérer la charge. La montée en puissance des agents de codage autonomes, capables de travailler pendant des heures sur une codebase entière, a profondément déséquilibré l'économie des abonnements forfaitaires. Ces agents consomment des volumes de tokens sans commune mesure avec un simple chat, et leur adoption rapide a rendu inévitable une révision du modèle économique. Pour GitHub et Microsoft, l'enjeu est aussi stratégique : maintenir la qualité de service face à une utilisation intensive tout en retrouvant une rentabilité sur un produit qui génère des coûts d'infrastructure considérables. Les prochains mois diront si les développeurs acceptent ce passage au compteur ou se tournent vers des alternatives comme Cursor ou Windsurf, qui n'ont pas encore fait le même virage.

UELes développeurs français et européens utilisant GitHub Copilot en mode agent devront revoir leur budget ou migrer vers des alternatives, leur facture pouvant augmenter sensiblement à partir du 1er juin 2025.

OutilsOutil
1 source
Claude se connecte directement à vos applications personnelles comme Spotify, Uber Eats et TurboTax
290The Verge AI 

Claude se connecte directement à vos applications personnelles comme Spotify, Uber Eats et TurboTax

Anthropic élargit les capacités de son assistant Claude en lui permettant de se connecter directement à des applications personnelles du quotidien. Parmi les nouveaux connecteurs annoncés figurent Spotify, Audible, Uber, Instacart, AllTrails, TripAdvisor et TurboTax. L'intégration fonctionne de façon proactive : une fois une application connectée, Claude propose lui-même d'y recourir dans la conversation, par exemple en suggérant AllTrails pour planifier une randonnée ou Instacart pour commander des courses. Cette expansion marque un tournant dans la stratégie d'Anthropic, qui s'était jusqu'ici concentré sur les usages professionnels avec des intégrations comme Microsoft 365. En ciblant désormais les applications grand public, l'entreprise cherche à ancrer Claude dans la vie quotidienne des utilisateurs et non plus uniquement dans leur environnement de travail. L'enjeu est de taille : transformer un assistant de productivité en véritable interface personnelle, capable de coordonner achats, voyages, musique et finances depuis une seule conversation. La bataille des connecteurs d'applications s'accélère dans tout le secteur. OpenAI proposait déjà des intégrations similaires dans ChatGPT, notamment avec Spotify, ce qui place Anthropic en position de rattrapage sur ce terrain précis. En multipliant les partenariats avec des plateformes populaires, les deux entreprises cherchent à capter les habitudes numériques des utilisateurs et à devenir le point d'entrée central de leur vie connectée, une position stratégique dont dépendra en grande partie l'adoption massive des assistants IA dans les prochains mois.

UELes connecteurs Spotify et Uber bénéficieront aux utilisateurs européens de Claude, mais la majorité des intégrations annoncées (TurboTax, Instacart, AllTrails) sont exclusivement américaines et sans équivalent en France/UE.

OpenAI lance ChatGPT pour les cliniciens : la médecine change-t-elle ère ?
291Le Big Data 

OpenAI lance ChatGPT pour les cliniciens : la médecine change-t-elle ère ?

OpenAI a officiellement lancé le 23 avril 2026 une version gratuite de ChatGPT spécialement conçue pour les professionnels de santé, médecins, infirmiers praticiens, pharmaciens et assistants médicaux. Cette décision intervient alors que des millions de cliniciens utilisent déjà ChatGPT chaque semaine dans leur pratique, un usage qui a plus que doublé en un an selon OpenAI. L'outil cible les tâches administratives répétitives : rédaction de documentation clinique, lettres médicales, demandes d'autorisation préalable, synthèses de littérature médicale générées en quelques minutes à partir de publications validées. Il s'appuie sur GPT-5.4, la version la plus récente du modèle, et intègre des fonctionnalités de conformité HIPAA, une authentification multifactorielle, ainsi que la création de flux de travail réutilisables pour standardiser des tâches comme les instructions aux patients. Pour l'heure, le service est limité aux États-Unis, avec une extension progressive prévue via des partenaires du secteur médical. L'impact potentiel est significatif pour un secteur sous pression constante : la surcharge administrative est l'une des premières causes de burn-out chez les soignants, et tout outil capable d'absorber une partie de cette charge représente un gain concret de temps clinique. Pour valider le déploiement, OpenAI a mandaté des médecins-conseils pour analyser plus de 700 000 réponses générées par le système. Sur un panel de 6 924 conversations, 99,6 % des réponses ont été jugées sûres et correctes par ces experts. OpenAI a également publié HealthBench Professional, un référentiel ouvert qui évalue les conversations médicales réelles sur trois axes, consultation, documentation et recherche, à partir de 6 924 scénarios cliniques dont un tiers a été conçu comme tests de résistance par des médecins. Sur ce benchmark, GPT-5.4 obtient un score de 59, surpassant plusieurs modèles concurrents et certaines réponses rédigées par des humains. Des benchmarks externes comme MedHELM confirment ces performances. Cette initiative s'inscrit dans une compétition intense entre les grands acteurs de l'IA pour s'imposer dans le secteur médical, considéré comme l'un des débouchés les plus rentables et structurants de l'IA générative. Google, Microsoft et des startups spécialisées comme Nabla ou Abridge occupent déjà ce terrain. OpenAI, fort de sa base d'utilisateurs cliniciens déjà constituée, choisit d'accélérer en proposant un accès gratuit pour créer l'adhérence avant de monétiser via des offres entreprises ou des partenariats institutionnels. La limite reste néanmoins centrale et assumée : l'outil est conçu pour assister, jamais pour remplacer le jugement clinique. La question de la responsabilité médicale en cas d'erreur générée par l'IA reste entière, et sera probablement le prochain front réglementaire que ce déploiement mondial devra affronter.

UELe service est actuellement limité aux États-Unis, mais l'expansion progressive annoncée pourrait à terme concurrencer directement les acteurs européens du secteur comme la startup française Nabla, et soulève des questions réglementaires sur la conformité RGPD pour un éventuel déploiement en Europe.

OutilsOutil
1 source
Gemini tourne désormais sur un serveur isolé du réseau, et s'efface si on coupe le courant
292VentureBeat AI 

Gemini tourne désormais sur un serveur isolé du réseau, et s'efface si on coupe le courant

Cirrascale Cloud Services a annoncé lors du Google Cloud Next 2026 à Las Vegas un accord élargi avec Google Cloud pour déployer le modèle Gemini en mode entièrement déconnecté, sur des serveurs physiques isolés d'internet. Cirrascale devient ainsi le premier fournisseur de cloud spécialisé à proposer le modèle phare de Google sous forme d'appliance privée, installée soit dans les centres de données de Cirrascale, soit directement dans les locaux du client. Le système repose sur un serveur certifié Google, fabriqué par Dell, équipé de huit GPU Nvidia et protégé par des mécanismes de calcul confidentiel. Une préversion est disponible immédiatement, avec une disponibilité générale attendue en juin ou juillet 2026. Dave Driggers, PDG de Cirrascale, a insisté sur un point clé : il s'agit du modèle Gemini complet, sans aucune restriction ni version allégée, déployé dans un environnement où les données d'entrée comme de sortie restent entièrement sous le contrôle du client. Fait notable sur le plan technique, les poids du modèle résident uniquement en mémoire volatile : dès que l'alimentation est coupée, le modèle disparaît sans laisser de trace persistante. Cette annonce répond à un problème structurel qui bloque depuis des années les secteurs régulés comme la finance, la santé, la défense et les administrations publiques. Ces organisations devaient jusqu'ici choisir entre accéder aux modèles les plus puissants via des API cloud publiques, au risque d'exposer leurs données sensibles à l'infrastructure d'un tiers, ou se contenter de modèles open source moins performants hébergés en interne. Le déploiement Cirrascale entend supprimer ce compromis. Driggers décrit l'escalade du problème de confiance : après les inquiétudes sur les données propriétaires confiées aux hyperscalers, les entreprises ont pris conscience que les prompts et les réponses générées étaient également récupérés par ces mêmes plateformes pour alimenter leurs propres systèmes, ce qui a rendu la demande de souveraineté totale incontournable. Cette évolution s'inscrit dans un mouvement plus large de migration des modèles d'IA frontier hors des centres de données des grands hyperscalers, vers les infrastructures propres des clients, ce qui représente une rupture avec la logique cloud dominante de la dernière décennie. Driggers distingue explicitement cette offre des déploiements on-premises proposés par Microsoft Azure avec les modèles OpenAI ou par AWS Outposts : dans ces cas, les modèles restent liés à l'infrastructure de leurs éditeurs. Ici, Google ne possède pas le matériel, et son modèle fonctionne en dehors de tout réseau Google. Pour le géant de Mountain View, accepter ce niveau de délégation sur son modèle le plus avancé traduit une stratégie commerciale claire : conquérir les marchés réglementés qui lui étaient jusqu'ici fermés, quitte à renoncer au contrôle direct de l'inférence.

UECe mode de déploiement air-gap répond directement aux exigences du RGPD et de l'AI Act en matière de souveraineté des données, ouvrant potentiellement Gemini aux administrations publiques, établissements de santé et institutions financières européennes soumis à des contraintes strictes de localisation et d'isolation des données.

💬 Le truc des poids uniquement en mémoire volatile, c'est la partie que je trouve la plus maligne. Parce que le blocage dans les secteurs régulés c'était pas juste "mes données sortent du réseau", c'était aussi "quelqu'un peut extraire ou copier le modèle", et là, coupe l'alimentation, ça disparaît. Google accepte de perdre le contrôle de l'inférence de son meilleur modèle pour aller chercher des marchés qui lui étaient fermés depuis des années. Ça, c'est un vrai mouvement.

InfrastructureOpinion
1 source
Google lance des agents Deep Research capables d'explorer le web et vos données privées
293VentureBeat AI 

Google lance des agents Deep Research capables d'explorer le web et vos données privées

Google a dévoilé lundi une mise à jour majeure de ses agents de recherche autonomes, en lançant deux nouvelles versions de son outil Deep Research dans l'API Gemini : Deep Research et Deep Research Max. Construits sur le modèle Gemini 2.5 Pro, ces agents permettent pour la première fois aux développeurs de combiner des données issues du web ouvert avec des informations internes à l'entreprise via un seul appel API. Ils intègrent également la génération native de graphiques et d'infographies directement dans les rapports produits, ainsi que la connexion à des sources de données tierces grâce au protocole MCP (Model Context Protocol). Les deux agents sont disponibles dès aujourd'hui en prévisualisation publique dans les offres payantes de l'API Gemini. Sur le plan des performances, Google annonce des scores de 93,3 % sur le benchmark DeepSearchQA et 54,6 % sur HLE pour la version Max, selon un message du PDG Sundar Pichai publié sur X. Les deux agents répondent à des besoins différents selon une logique de compromis entre vitesse et exhaustivité. Deep Research, la version standard, est optimisée pour des usages interactifs à faible latence : elle convient aux interfaces utilisateurs qui doivent répondre à des questions analytiques complexes en quasi-temps réel, comme un tableau de bord financier. Deep Research Max, à l'inverse, mobilise un calcul étendu à l'inférence pour produire des analyses plus profondes et mieux sourcées, conçues pour des workflows asynchrones en arrière-plan. C'est l'outil pour une équipe d'analystes qui lance une série de rapports de due diligence avant de quitter le bureau et les récupère entièrement traités le lendemain matin. C'est surtout la prise en charge du protocole MCP qui constitue le saut qualitatif le plus significatif : elle permet aux agents d'interroger des bases de données privées, des référentiels documentaires internes et des services de données spécialisés, transformant Deep Research d'un outil de veille web en quelque chose qui s'approche d'un analyste de données universel. Ce lancement s'inscrit dans une course qui s'intensifie entre les grands acteurs de l'IA pour proposer des systèmes capables de conduire de manière autonome des recherches multi-sources, un travail qui mobilise traditionnellement des heures, voire des jours, d'analyse humaine. Google positionne cette infrastructure comme l'épine dorsale des workflows de recherche en entreprise, notamment dans la finance, les sciences du vivant et l'intelligence de marché. La première version de Deep Research avait été lancée en décembre 2025 via l'Interactions API, et le produit aurait « gagné beaucoup de terrain en trois mois », selon Logan Kilpatrick, responsable des relations développeurs chez Google AI. Ce déploiement accéléré signale que Google entend faire de son API Gemini une plateforme centrale pour les applications d'agents d'entreprise, un segment où OpenAI, Anthropic et Microsoft se disputent également une position dominante.

UELes entreprises européennes intégrant leurs données internes via MCP devront vérifier la conformité RGPD avant d'adopter cette API.

OutilsOutil
1 source
294Le Big Data 

NVIDIA Vera : quand le CPU devient le cerveau de l’IA autonome

Le 16 mars 2026, lors de la conférence GTC 2026, Jensen Huang a présenté le processeur CPU Vera, une puce conçue spécifiquement pour l'intelligence artificielle agentique. Architecturé autour de la plateforme Olympus, Vera embarque 88 cœurs personnalisés basés sur la technologie ARM Neoverse, une mémoire SOCAMM en LPDDR6 atteignant une bande passante de 1,2 To/s, et une conception monolithique qui réduit la latence interne au minimum physiquement possible. Contrairement aux GPU Blackwell et Rubin qui gèrent le traitement parallèle massif, Vera prend en charge l'exécution séquentielle et logique : la planification, la vérification, l'enchaînement de décisions. Sa capacité à manipuler des contextes de plusieurs millions de tokens en temps réel en fait un composant radicalement différent des processeurs x86 traditionnels, jugés trop lents pour les exigences actuelles de l'IA. L'enjeu est fondamental pour toute entreprise qui cherche à déployer des agents IA dans des workflows réels. Jusqu'ici, les systèmes d'IA buttaient sur le goulot d'étranglement du raisonnement séquentiel : générer du texte rapidement ne suffit pas pour gérer du code complexe, de la logistique ou de la prise de décision multi-étapes. Vera permet à l'IA de passer d'un outil passif à un collaborateur capable d'orchestrer des tâches sur la durée, de corriger ses propres erreurs et d'enchaîner des raisonnements structurés sans latence perceptible. Pour les développeurs et les entreprises, cela ouvre concrètement la voie à des agents autonomes opérationnels dans des environnements de production exigeants, là où les solutions actuelles restent trop fragiles ou trop lentes. Cette annonce s'inscrit dans une accélération que NVIDIA pilote depuis plusieurs années en construisant une pile matérielle complète pour l'IA. Après avoir dominé l'entraînement des modèles avec ses GPU, puis l'inférence avec la gamme Blackwell, l'entreprise complète aujourd'hui l'architecture avec un CPU qui lui est propre, réduisant sa dépendance aux processeurs Intel et AMD pour les charges de travail IA. Le concept rappelle la distinction cognitive entre Système 1 (rapide, instinctif) et Système 2 (analytique, délibéré) : les GPU couvrent le premier, Vera prend en charge le second. Si l'adoption suit, NVIDIA pourrait imposer une architecture propriétaire de bout en bout pour les data centers orientés agents, ce qui renforcerait encore davantage sa position dominante dans l'infrastructure de l'IA mondiale au moment où la course aux systèmes autonomes s'intensifie chez Google, Microsoft et Meta.

UELes opérateurs de data centers européens déployant des agents IA devront évaluer une migration vers cette architecture propriétaire NVIDIA pour contourner les goulots d'étranglement du raisonnement séquentiel.

💬 Le goulot d'étranglement du raisonnement séquentiel, c'est le truc qui fait ramer les agents en prod depuis 2 ans, et Vera s'attaque frontalement à ça. La distinction Système 1/Système 2 appliquée au silicium, c'est bien vu, pas juste du marketing. Le revers, c'est que si t'as besoin de Vera pour que tes agents tournent vraiment, t'achètes le stack NVIDIA complet, de bout en bout, et ils le savent.

InfrastructureOpinion
1 source
Claude Opus 4.7 : l’IA interdite Mythos entre les mains du grand public ?
295Le Big Data 

Claude Opus 4.7 : l’IA interdite Mythos entre les mains du grand public ?

Le 16 avril 2026, Anthropic a officiellement lancé Claude Opus 4.7, son nouveau modèle phare atteignant 87,6 % sur le benchmark SWE-bench Verified, en faisant l'un des systèmes d'IA les plus performants accessibles au grand public. Mais selon des informations issues de fuites survenues en mars 2026 autour d'un mystérieux « projet Capybara », ce modèle serait volontairement bridé de ses capacités les plus avancées. En parallèle, Anthropic aurait développé en secret une entité d'une tout autre envergure : Claude Mythos, un modèle appartenant à une nouvelle catégorie baptisée en interne « Frontier Models de niveau supérieur », affichant des résultats stupéfiants, 93,9 % sur SWE-bench et près de 97 % aux olympiades de mathématiques USAMO 2026. Ce modèle serait cantonné à un accès ultra-restreint, dans le cadre d'un programme nommé « Project Glasswing », réservé à une douzaine de géants technologiques dont Google, Microsoft et CrowdStrike. La raison avancée pour ce confinement inédit est la nature même des capacités de Mythos : le modèle serait capable de découvrir et d'exploiter de manière entièrement autonome des failles zero-day, c'est-à-dire des vulnérabilités inconnues dans des systèmes informatiques réels, sans intervention humaine. Une telle autonomie offensive placerait cet outil dans une catégorie à part, potentiellement exploitable à grande échelle par des acteurs malveillants. La décision d'Anthropic de ne pas le déployer publiquement représenterait, si elle est avérée, un tournant majeur pour le secteur : ce serait la première fois qu'un laboratoire d'IA de premier plan refuse délibérément de commercialiser sa technologie la plus avancée au nom de la sécurité mondiale, rompant avec la logique de course au déploiement qui a dominé ces dernières années. Ce scénario s'inscrit dans un contexte de tensions croissantes entre la vitesse d'innovation et les impératifs de sécurité. Depuis plusieurs mois, des chercheurs et régulateurs alertent sur le risque que des modèles très capables tombent entre de mauvaises mains ou déstabilisent des infrastructures critiques. Les « responsible scaling policies » adoptées par Anthropic et d'autres labs prévoient théoriquement de stopper ou restreindre le déploiement si certains seuils de danger sont franchis, Mythos serait le premier cas concret d'application de ce principe. Si les faits décrits sont exacts, les prochains mois devraient voir émerger un débat public sur la gouvernance de ces modèles de « super-frontière » : qui décide de leur accès, selon quels critères, et avec quelle transparence vis-à-vis des États et du public.

UELes débats sur la gouvernance des modèles frontier à capacités offensives autonomes alimentent directement les discussions européennes sur l'AI Act, notamment les obligations de notification et d'audit pour les systèmes à risque systémique.

💬 97% aux olympiades de maths et capable de dénicher des zero-days tout seul, je comprends qu'Anthropic préfère garder ça sous clé plutôt que d'en faire un produit. Ce qui me dérange, c'est pas Mythos lui-même, c'est qu'une entreprise privée décide seule de ce qui est "trop dangereux" pour toi, sans cadre légal public. Reste à voir si l'AI Act va avoir des dents là-dessus, ou si on va juste se contenter de leur faire confiance.

SécuritéOpinion
1 source
Les utilisateurs quittent-ils ChatGPT ? Ce que révèlent les chiffres
296Le Big Data 

Les utilisateurs quittent-ils ChatGPT ? Ce que révèlent les chiffres

Selon un rapport annuel de Similarweb publié en avril 2026, ChatGPT a perdu 20 points de part de marché en douze mois, passant de 77,43 % à 57 % du trafic généré par les outils d'intelligence artificielle générative. Dans le même temps, Gemini de Google a franchi la barre des 25 % d'audience, quadruplant quasiment son score en un an grâce à une intégration agressive dans l'écosystème Google, Gmail, Android, Chrome. Claude, le modèle d'Anthropic, a lui presque triplé sa part, atteignant 6,02 % contre 1,40 % un an plus tôt, avec une accélération particulièrement marquée sur les derniers mois. Des acteurs plus spécialisés comme DeepSeek et Perplexity restent sous la barre des 4 %, mais contribuent eux aussi à l'érosion du leadership d'OpenAI. Grok de xAI recule, et Microsoft Copilot peine à maintenir sa position. Ce rééquilibrage du marché signale la fin du monopole de fait qu'OpenAI exerçait depuis le lancement grand public de ChatGPT fin 2022. Les utilisateurs, plus matures et mieux informés, multiplient désormais les outils selon leurs besoins : Claude pour la qualité rédactionnelle et la nuance, Gemini pour son intégration native dans les services Google, Perplexity pour la recherche documentée. Cette diversification des usages complique la fidélisation pour OpenAI, dont la croissance en volume reste réelle mais dont la dynamique ralentit sensiblement. Pour les entreprises qui ont misé sur un seul fournisseur d'IA, le signal est clair : le marché devient multi-modèles, et les stratégies d'intégration pèsent autant que la performance brute des systèmes. Ce glissement s'inscrit dans une compétition qui s'est considérablement intensifiée depuis 2025. Google, longtemps critiqué pour une réponse tardive à l'essor de ChatGPT, a su transformer son avantage structurel en arme concurrentielle : des milliards d'utilisateurs déjà captifs de son écosystème représentent un levier de distribution qu'OpenAI ne peut pas répliquer. Anthropic, soutenu par des investissements massifs d'Amazon et Google, a quant à lui réussi à imposer Claude comme une référence sérieuse, notamment auprès des professionnels et des développeurs. La prochaine bataille se jouera sur les agents autonomes et l'intégration dans les outils de productivité du quotidien, un terrain où Google et Microsoft partent avec une longueur d'avance structurelle. OpenAI, de son côté, multiplie les annonces produit et tente d'élargir son offre au-delà du chatbot pour rester incontournable dans un marché qu'il a lui-même créé.

UELes entreprises et professionnels européens ayant misé sur un seul fournisseur IA doivent réévaluer leur stratégie d'intégration face à un marché désormais clairement multi-modèles.

BusinessOpinion
1 source
297VentureBeat AI 

Traza lève 2,1 millions de dollars auprès de Base10 pour automatiser les processus d'approvisionnement par IA

Traza, une startup new-yorkaise fondée récemment, a annoncé la clôture d'un tour de table pré-seed de 2,1 millions de dollars mené par Base10 Partners, avec la participation de Kfund, des scouts d'a16z, Clara Ventures, Masia Ventures, et plusieurs business angels dont Pepe Agell, l'homme qui avait porté Chartboost à 700 millions d'utilisateurs mensuels avant sa rachat par Zynga. L'entreprise développe des agents IA capables d'automatiser entièrement les processus d'approvisionnement en entreprise : envoi de demandes de devis, suivi des commandes, communications fournisseurs, traitement des factures, le tout sans supervision humaine continue. Selon ses premières données de déploiement, Traza revendique une réduction de 70 % du temps humain consacré aux tâches d'achat, et des cycles d'approvisionnement trois fois plus rapides que les processus manuels. L'enjeu est considérable. Le marché des logiciels de procurement dépasse déjà 8 milliards de dollars et croît d'environ 10 % par an, mais le vrai gisement de valeur se trouve ailleurs : dans les pertes silencieuses qui surviennent après la signature des contrats. Une étude de World Commerce & Contracting et Ironclad estime que les entreprises perdent en moyenne 11 % de la valeur totale de leurs contrats une fois ceux-ci signés, un phénomène baptisé "value leakage post-signature". Pour une grande entreprise avec 500 millions de dollars de dépenses contractualisées annuelles, cela représente 55 millions qui s'évaporent chaque année, non pas à cause de mauvaises négociations, mais faute de suivi opérationnel. La majorité des entreprises ne gèrent activement que leurs 20 % de fournisseurs principaux ; les 80 % restants sont largement laissés à l'abandon. Le secteur du procurement n'a pas manqué de solutions logicielles ces dernières années, SAP Ariba, Coupa, Zip, Fairmarkit ou encore Tonkean ont tous intégré des couches d'IA à leurs plateformes. Mais ces outils sont restés des copilotes : ils analysent, suggèrent, alertent, sans jamais agir. Traza représente un changement de posture, passant du conseil à l'exécution autonome. Le PDG et cofondateur Silvestre Jara Montes positionne explicitement sa startup dans la "couche opérationnelle" du contrat, là où la valeur se perd le plus concrètement. Avec un financement modeste mais des investisseurs emblématiques de l'écosystème IA, Traza entre sur un marché où les grands éditeurs ERP ont historiquement tardé à innover, et où la promesse des agents autonomes pourrait trouver son premier cas d'usage industriel à grande échelle.

BusinessOpinion
1 source
« L’IA va nous détruire » : le manifeste du premier terroriste anti-ChatGPT
298Le Big Data 

« L’IA va nous détruire » : le manifeste du premier terroriste anti-ChatGPT

Un homme a lancé un cocktail Molotov contre la résidence de Sam Altman, PDG d'OpenAI, située au 950 Lombard Street à San Francisco, dans le quartier de Russian Hill, une propriété estimée à 27 millions de dollars. L'attaque, survenue début avril 2026, s'inscrit dans le cadre d'un manifeste de 45 pages intitulé « La Dernière Résistance Humaine », diffusé sur X et 4chan, qui appelle au sabotage physique des centres de données et à la destruction des infrastructures d'intelligence artificielle générative. L'assaillant, radicalisé par les thèses néo-luddites, a été placé en garde à vue. Le manifeste identifie 12 sites critiques aux États-Unis, principalement en Californie et en Oregon, hébergeant des clusters de processeurs H100 de Nvidia, et réclame l'arrêt immédiat de l'entraînement de modèles comme GPT-5 ainsi que le démantèlement des infrastructures Microsoft Azure. Le FBI et le Department of Homeland Security classent désormais les extrémistes anti-technologie comme une menace prioritaire. Cet acte marque un tournant dans la perception des risques liés au développement de l'IA : pour la première fois, la violence physique ciblée contre des dirigeants tech s'organise autour d'une idéologie structurée et d'une liste de cibles précises. L'onde de choc a immédiatement atteint les investisseurs de Y Combinator et les dirigeants de Google DeepMind. OpenAI a multiplié son budget sécurité par cinq, déployant un blindage balistique de niveau NIJ III sur les vitres du domicile d'Altman et une garde rapprochée composée d'anciens Navy SEALs, pour un coût supérieur à 800 000 dollars par mois. Des algorithmes de surveillance des forums radicaux ont également été activés. La menace dépasse le cas individuel : elle interroge la capacité des entreprises d'IA à protéger leurs dirigeants et infrastructures dans un climat de défiance croissante. La rhétorique du manifeste est paradoxale : son auteur cite les propres avertissements de Sam Altman et du prix Nobel Geoffrey Hinton sur les risques existentiels de l'intelligence artificielle générale pour légitimer le recours à la violence. Ce retournement sémantique rappelle la trajectoire de Theodore Kaczynski, l'Unabomber, dont le manifeste fut publié par le New York Times en 1995 après une campagne d'attentats contre des universitaires et des compagnies aériennes. Là où les luddites du XIXe siècle s'en prenaient aux métiers à tisser pour protéger leurs emplois, et où Kaczynski visait la société industrielle en général, ce nouveau mouvement cible spécifiquement les architectes des grands modèles de langage et les GPU qui les font tourner. L'analyse de CrowdStrike confirme que le document circule dans des réseaux cryptés et pourrait inspirer des actes similaires, faisant basculer le débat sur les risques de l'IA du registre académique vers celui de la sécurité nationale.

UEL'émergence d'un mouvement néo-luddite violent aux États-Unis pourrait inspirer des actes similaires en Europe, contraignant les entreprises et infrastructures d'IA européennes à renforcer leur sécurité physique.

💬 On savait que la tension montait, mais là on a franchi un cap. Ce qui est glaçant, c'est pas l'acte en lui-même, c'est le manifeste : 45 pages structurées, une liste de 12 cibles précises, une idéologie qui recycle les propres mots d'Altman pour justifier la violence. C'est plus un dérangé isolé, c'est le début d'une doctrine.

SécuritéOpinion
1 source
299VentureBeat AI 

Une enquête révèle que 43 % du code généré par IA nécessite des corrections en production

Selon une enquête menée auprès de 200 responsables senior en fiabilité des systèmes et DevOps dans de grandes entreprises américaines, britanniques et européennes, 43 % des modifications de code générées par l'IA nécessitent un débogage manuel en production, même après avoir passé les tests d'assurance qualité et de staging. Ces chiffres sont tirés du rapport 2026 State of AI-Powered Engineering de Lightrun, publié en avant-première par VentureBeat. Aucun des répondants n'a indiqué pouvoir valider un correctif suggéré par l'IA en un seul cycle de redéploiement : 88 % en nécessitent deux à trois, et 11 % entre quatre et six. Fait marquant, zéro pourcent des responsables ingénierie se disent « très confiants » dans le bon comportement du code IA une fois en production. Ces résultats ont des conséquences concrètes et immédiates pour l'industrie. En mars 2026, Amazon a subi deux pannes majeures directement liées à des modifications de code assistées par IA déployées sans validation appropriée : le 2 mars, une interruption de six heures a causé 120 000 commandes perdues et 1,6 million d'erreurs sur le site ; le 5 mars, une panne encore plus sévère a provoqué une chute de 99 % du volume de commandes aux États-Unis, soit environ 6,3 millions de commandes annulées. Amazon a réagi en lançant une réinitialisation de sécurité sur 90 jours couvrant 335 systèmes critiques, et toute modification de code assistée par IA doit désormais être approuvée par un ingénieur senior avant déploiement. Pour Or Maimon, directeur commercial de Lightrun, ces incidents illustrent une réalité que les données confirment : « nos processus de validation ont été conçus pour l'échelle de l'ingénierie humaine, mais aujourd'hui les développeurs sont devenus des auditeurs de volumes massifs de code qu'ils n'ont pas écrit. » Le contexte est celui d'une adoption massive et rapide de l'IA dans le développement logiciel. Satya Nadella (Microsoft) et Sundar Pichai (Google) ont tous deux affirmé qu'environ un quart du code de leurs entreprises est désormais généré par IA. Le marché AIOps, dédié à la gestion de ces opérations, est estimé à 18,95 milliards de dollars en 2026 et devrait atteindre 37,79 milliards d'ici 2031. Pourtant, le rapport 2025 DORA de Google montre que l'adoption de l'IA est corrélée à une augmentation d'environ 10 % de l'instabilité du code, et que 30 % des développeurs font peu ou pas confiance au code généré automatiquement. La vitesse de production permise par ces outils dépasse largement la capacité des équipes à valider ce code en environnement réel, créant un déséquilibre structurel entre productivité affichée et fiabilité opérationnelle.

UELes entreprises européennes incluses dans l'étude sont directement exposées à ces risques opérationnels, et les équipes d'ingénierie en France et en UE devraient revoir leurs processus de validation du code généré par IA.

💬 43 % du code IA qui lâche en prod, c'est pas une surprise, c'est une confirmation de ce que beaucoup savaient déjà mais ne voulaient pas dire à voix haute. Les pannes Amazon en mars ont mis un visage sur des stats, et là ça devient difficile à ignorer pour les décideurs. Le vrai problème, c'est pas l'IA qui génère du mauvais code, c'est qu'on a accéléré la production sans toucher aux processus de validation, qui eux n'ont pas bougé d'un centimètre.

OutilsOutil
1 source
300Siècle Digital 

L’IA augmente la productivité des ingénieurs, mais ne les remplacera pas encore, selon le PDG de Salesforce

Marc Benioff, PDG de Salesforce, a pris position dans le débat sur l'avenir des développeurs logiciels à l'ère de l'IA générative. Sa réponse à ceux qui prédisent la disparition prochaine du métier d'ingénieur est directe : il suffit d'ouvrir les pages carrières de Meta, Google, Anthropic et OpenAI pour constater que ces entreprises, dont les modèles sont censés automatiser le code, continuent de recruter massivement des ingénieurs logiciels. Pour Benioff, ce signal de marché est plus éloquent que n'importe quel discours alarmiste. Son argument central est que l'IA augmente la productivité des ingénieurs sans les rendre obsolètes. Les outils de génération de code accélèrent certaines tâches répétitives, mais la conception architecturale, la résolution de problèmes complexes et la supervision des systèmes restent l'apanage des humains. Cette position tranche avec les déclarations de certains dirigeants tech qui évoquent des réductions d'effectifs liées à l'automatisation, comme Shopify ou Duolingo l'ont laissé entendre récemment. Le débat s'inscrit dans un contexte de tension croissante entre les promesses des grands modèles de langage et les réalités du marché du travail. D'un côté, des outils comme GitHub Copilot ou Cursor transforment concrètement le quotidien des développeurs. De l'autre, la demande de profils techniques qualifiés reste soutenue, notamment pour entraîner, affiner et maintenir ces mêmes modèles. La thèse de Benioff est que l'IA redéfinit le métier d'ingénieur plutôt qu'elle ne l'élimine, du moins pour les années à venir.

UELe débat sur l'avenir des ingénieurs logiciels face à l'IA concerne indirectement le marché européen, où la demande de profils techniques qualifiés reste soutenue malgré l'essor des outils de génération de code.

SociétéOpinion
1 source