Google a publié cette semaine DiffusionGemma, un modèle de langage expérimental qui bouleverse la façon dont un LLM génère du texte : plutôt que de produire les mots un à un, il en génère 256 en parallèle et s'autocorrige à la volée, à la manière des générateurs d'images comme Stable Diffusion. Construit sur l'architecture Gemma 4, ce modèle open source de 26 milliards de paramètres ouvre une piste sérieuse pour accélérer l'inférence, avec NVIDIA déjà dans la boucle pour l'optimiser en local.
Pendant ce temps, Anthropic traverse une zone de turbulences côté entreprises. Avec le lancement de Claude Fable, la société a introduit une politique de rétention des données de 30 jours, officiellement pour détecter les usages malveillants, et ça coince : Microsoft et plusieurs grands clients ont freiné l'adoption, inquiets des implications pour leurs données sensibles. Dans un secteur où la confiance se construit sur des années et se perd en une annonce, le timing est maladroit.
Côté usages, Visa a officialisé l'intégration de son infrastructure de paiement à ChatGPT, permettant désormais à des agents IA de finaliser des achats en ligne de bout en bout, sans intervention humaine. Un utilisateur formule une requête, l'agent sélectionne, commande et paie. Trois signaux d'un même mouvement : l'IA devient plus rapide, plus autonome, plus intégrée au quotidien, et les questions de confiance et de contrôle n'ont jamais été aussi centrales.
