Aller au contenu principal

Dossier Microsoft — page 7

1056 articles · page 7 sur 22

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

Google DeepMind publie les checkpoints QAT de Gemma 4 : Q4_0 et un nouveau format mobile réduisent la mémoire embarquée
301MarkTechPost LLMsOpinion

Google DeepMind publie les checkpoints QAT de Gemma 4 : Q4_0 et un nouveau format mobile réduisent la mémoire embarquée

Google DeepMind a publié de nouveaux checkpoints de quantification pour sa famille de modèles Gemma 4, en utilisant une technique appelée Quantization-Aware Training (QAT). Cette publication intervient quelques semaines après le lancement de Gemma 4 en avril 2026 et deux jours après la sortie d'un modèle 12B. La gamme cible deux variantes principales, E2B et E4B, proposées dans trois formats : BF16 pleine précision, Q40 QAT et un nouveau schéma mobile optimisé. En BF16, E2B requiert 9,6 Go de VRAM et E4B 15 Go. En Q40 QAT, ces empreintes tombent respectivement à 3,2 Go et 5 Go. Le format mobile va plus loin encore : E2B y occupe environ 1 Go de mémoire, et en version texte seul, sans encodeurs audio et vision, le modèle passe sous la barre du gigaoctet. La distinction avec la quantification classique post-entraînement (PTQ) est centrale. Là où la PTQ compresse un modèle achevé au risque de dégrader ses performances, le QAT simule la quantification pendant l'entraînement lui-même : le modèle apprend à compenser la perte de précision avant même d'être déployé. Google affirme que ses résultats QAT surpassent les baselines PTQ équivalentes en qualité, une affirmation cohérente avec les données Gemma 3 où le QAT avait réduit de 54 % la dégradation de perplexité en Q40. Concrètement, les formats Q40 QAT sont compatibles avec les outils les plus répandus : llama.cpp, Ollama, LM Studio, vLLM et MLX, permettant un déploiement sur GPU grand public, voire sur un Raspberry Pi 5. Le schéma mobile, lui, mobilise quatre techniques spécifiques : activation statique pré-calculée à l'entraînement, quantification par canal adaptée aux accélérateurs mobiles, compression ciblée en 2 bits sur les seules couches de génération de tokens, et optimisation des embeddings et du cache KV. Les couches de raisonnement central restent à précision plus élevée, préservant les capacités du modèle tout en réduisant l'empreinte mémoire. Cette publication s'inscrit dans une tendance de fond : depuis 2023, la course à l'efficacité sur les appareils edge s'est intensifiée, portée par les contraintes de latence, de confidentialité et de coût d'inférence cloud. Google, avec Gemma, positionne ses modèles ouverts face à Meta (Llama), Microsoft (Phi) et Apple (les modèles embarqués dans iOS). Le format mobile QAT ouvre la voie à des déploiements sur smartphones Android via LiteRT-LM, ainsi que dans des applications web légères avec Transformers.js. L'absence de scores de benchmark publiés pour Gemma 4 QAT dans l'annonce officielle constitue une limite notable : les déclarations de Google restent qualitatives. La prochaine étape logique sera la publication de mesures indépendantes sur des benchmarks standardisés comme MMLU ou HellaSwag, qui permettront de vérifier si la promesse de qualité préservée à 1 Go tient face aux alternatives déjà sur le marché.

UELes développeurs et entreprises européens peuvent déployer des modèles d'IA open source compétitifs directement sur appareils edge (smartphones Android, Raspberry Pi) sans cloud, réduisant latence et coûts d'inférence, avec des outils déjà populaires comme Ollama et llama.cpp.

1 source
OpenAI : Sam Altman voit l'IA proactive comme la prochaine grande étape après les chatbots et les agents
302The Decoder 

OpenAI : Sam Altman voit l'IA proactive comme la prochaine grande étape après les chatbots et les agents

Sam Altman, PDG d'OpenAI, a esquissé sa vision de la prochaine grande étape de l'intelligence artificielle : une "IA proactive" capable d'agir de manière autonome en arrière-plan, sans attendre qu'un utilisateur lui soumette une requête. Contrairement aux chatbots actuels, qui répondent à des questions ponctuelles, ou aux agents IA, qui exécutent des tâches déclenchées par l'humain, cette nouvelle génération d'outils surveillerait en continu l'environnement de travail et prendrait des initiatives de façon indépendante. Altman a également promis d'aider les entreprises à "obtenir plus de valeur pour moins de dépenses", au moment où les budgets IA explosent dans les organisations. Cette vision répond à deux problèmes concrets que rencontrent actuellement les entreprises : la flambée des coûts liés au déploiement de l'IA à grande échelle, et le fait que la majorité des employés ne savent tout simplement pas quoi demander à ces outils. Une IA qui agit sans être sollicitée pourrait contourner ce frein à l'adoption, en rendant les bénéfices accessibles même aux utilisateurs non techniques. L'enjeu est considérable : transformer l'IA d'un outil optionnel en infrastructure permanente du travail quotidien. Ce positionnement s'inscrit dans une course intense entre les grands acteurs du secteur. Google, Microsoft et Anthropic développent tous des systèmes d'agents et d'automatisation de plus en plus autonomes. La promesse d'une IA proactive soulève néanmoins des questions sérieuses sur la supervision humaine, la confidentialité des données et la responsabilité des décisions prises sans intervention humaine, des enjeux que l'industrie devra adresser pour convaincre les entreprises d'aller plus loin.

UELes entreprises européennes devront anticiper des enjeux de conformité RGPD et AI Act face à des systèmes IA agissant en arrière-plan sans déclenchement humain explicite.

LLMsOpinion
1 source
Le plan de GitHub pour les agents, par Kyle Daigle
303Latent Space 

Le plan de GitHub pour les agents, par Kyle Daigle

Kyle Daigle, directeur des opérations de GitHub, a accordé une longue interview au podcast AI Engineer World's Fair, enregistrée en marge de Microsoft Build, pour expliquer comment l'essor des agents de code transforme en profondeur la plateforme. Le chiffre clé de l'entretien : les contributions générées par des agents ont bondi de 1 400 % en 2026, une explosion qui se traduit concrètement par une multiplication massive des commits, des pull requests, des builds et des charges sur l'infrastructure GitHub, conçue à l'origine pour des développeurs humains travaillant à vitesse humaine. Face à cette pression, GitHub a connu des épisodes d'indisponibilité remarqués. Daigle détaille les outils que son équipe a déployés en interne : WorkIQ, des flux de travail Copilot intégrés dans Slack, Teams et l'e-mail, le protocole MCP, une nouvelle application de bureau Copilot, une interface CLI, et des agents cloud. Il décrit aussi sa propre routine du week-end, où il pilote jusqu'à quinze agents en parallèle pour préparer ses décisions stratégiques en consultant l'historique de contexte de l'entreprise. L'enjeu dépasse largement la fiabilité d'une plateforme : c'est la définition même du développeur et du logiciel qui est en train de changer. Quand n'importe quelle idée déclenche automatiquement un build, les systèmes CI/CD actuels atteignent leurs limites. Les mainteneurs de projets open source, eux, se retrouvent submergés de contributions automatiques de faible qualité, que Daigle qualifie de « slop forks ». GitHub doit donc inventer de nouveaux mécanismes de confiance, révision assistée par IA, système de parrainage, requêtes de prompt, pour préserver le contrat social qui a fait le succès de l'open source. Par ailleurs, Copilot n'est plus seulement un outil d'autocomplétion : il évolue vers un agent ambiant capable d'agir sur un contexte d'entreprise complet, ce qui redéfinit des fonctions comme celle de chef de cabinet ou d'analyste. GitHub aborde cette transition avec une histoire particulière : près de vingt ans de couches d'infrastructure accumulées, des webhooks aux Actions, en passant par le rachat de npm et l'intégration de Dependabot et de Semmle pour la sécurité de la chaîne d'approvisionnement. GitHub Actions, initialement pensé pour l'automatisation des workflows de développement, est devenu de facto une couche de calcul généraliste sur laquelle les agents s'appuient. Daigle reconnaît que cette évolution « casse » GitHub d'une façon inédite, mais il y voit aussi une opportunité : les anciens développeurs reconvertis dans le management pourraient avoir un avantage structurel dans cette ère où comprendre le code redevient une compétence décisionnelle clé. La prochaine étape, selon lui, est de faire en sorte que GitHub « agisse comme Kyle veut qu'il agisse », c'est-à-dire transformer la plateforme en système d'exploitation personnel pour agents.

UEL'essor des agents de code redéfinit les pratiques DevOps des équipes techniques européennes, qui devront adapter leurs workflows CI/CD et leur gouvernance des contributions open source face à la multiplication des commits automatisés.

OutilsOpinion
1 source
JetBrains lance Mellum2 : un modèle MoE de 12 milliards de paramètres pour les tâches spécialisées dans les pipelines IA multi-modèles
304MarkTechPost 

JetBrains lance Mellum2 : un modèle MoE de 12 milliards de paramètres pour les tâches spécialisées dans les pipelines IA multi-modèles

JetBrains a publié Mellum2, un nouveau modèle d'intelligence artificielle open source dont les poids sont disponibles sous licence Apache 2.0. Ce successeur de Mellum, un modèle dense de 4 milliards de paramètres orienté complétion de code, adopte une architecture Mixture-of-Experts (MoE) avec 12 milliards de paramètres au total, dont seulement 2,5 milliards sont activés à chaque token. Le modèle dispose de 64 experts, dont 8 sont sollicités simultanément, ce qui maintient un coût de calcul équivalent à un modèle dense de 2,5B tout en offrant une capacité de spécialisation bien supérieure. Sa fenêtre de contexte atteint 131 072 tokens, étendue après le pré-entraînement grâce à une méthode YaRN sélective par couche. L'entraînement a porté sur environ 10,6 billions de tokens répartis en trois phases progressivement orientées vers du code et des mathématiques, avec l'optimiseur Muon en précision hybride FP8. JetBrains publie six checkpoints couvrant l'ensemble du pipeline : modèle de base, variantes SFT, et modèles affinés par renforcement (RLVR) en versions Instruct et Thinking. Mellum2 ne vise pas à remplacer les modèles frontier comme GPT-4o ou Claude 3.5 Sonnet. JetBrains le positionne explicitement comme un "focal model", une brique rapide et spécialisée destinée à s'intégrer dans des pipelines multi-modèles. La variante Instruct répond directement, sans chaîne de raisonnement externalisée, ce qui la rend adaptée aux tâches à faible latence : appels d'outils, suivi d'instructions, génération de code à la volée. La variante Thinking, elle, produit une trace de raisonnement explicite avant sa réponse finale, utile pour le débogage complexe, la planification multi-étapes ou les flux agentiques. Sur les benchmarks autodéclarés par JetBrains, Mellum2 Instruct obtient 78,4 sur EvalPlus et 66,3 sur BFCL v3 (appels de fonctions), des scores compétitifs face aux modèles open-weight de 4B à 14B paramètres, notamment les Qwen3.5 et Ministral 3. Les résultats en raisonnement mathématique (41,7 sur AIME 2025+2026) et en connaissance générale (78,1 sur MMLU-Redux) restent en retrait par rapport à Qwen3.5 9B, ce qui reflète le choix assumé d'une spécialisation ingénierie logicielle. Ce lancement s'inscrit dans une tendance de fond : les éditeurs d'IDE et d'outils de développement construisent désormais leurs propres modèles plutôt que de dépendre exclusivement des API tierces. JetBrains, dont les produits, IntelliJ, PyCharm, WebStorm, sont utilisés par des millions de développeurs, dispose d'un corpus de code propriétaire et d'une connaissance fine des usages réels qui justifient cet investissement. La mise à disposition sous Apache 2.0 favorise l'adoption communautaire et positionne Mellum2 comme une alternative crédible aux modèles de Microsoft (Phi) ou de Alibaba (Qwen) dans l'écosystème open source. La prochaine étape logique sera l'intégration native dans les IDE JetBrains, transformant ce modèle de recherche en produit distribué à grande échelle.

UEJetBrains, entreprise tchèque basée dans l'UE, publie ce modèle sous Apache 2.0, offrant aux développeurs européens une alternative open source locale aux modèles américains (Microsoft Phi) et chinois (Alibaba Qwen) pour l'assistance au code dans les IDEs.

LLMsOpinion
1 source
Amazon Bedrock AgentCore : paiements par agents autonomes avec garde-fous intégrés
305AWS ML Blog 

Amazon Bedrock AgentCore : paiements par agents autonomes avec garde-fous intégrés

Amazon a annoncé en avant-première AgentCore Payments, une nouvelle fonctionnalité d'Amazon Bedrock développée en partenariat avec Coinbase Developer Platform et Stripe (via Privy), qui permet aux agents d'intelligence artificielle d'effectuer des transactions financières au nom de leurs utilisateurs. Disponible en préversion dans quatre régions, Virginie du Nord, Oregon, Francfort et Sydney, la solution repose sur un système de portefeuilles embarqués auto-custodiaux hébergés chez ces partenaires. Concrètement, chaque session de paiement est isolée, assortie d'un budget configurable et d'une durée de vie limitée (TTL), empêchant tout agent de dépenser librement au-delà du périmètre défini. Les informations sensibles, numéros de carte, codes CVV, clés d'API développeur, ne transitent jamais dans le contexte de l'agent, ce qui réduit considérablement la surface d'exposition en cas de compromission. Cette capacité répond à un verrou majeur dans le déploiement des agents autonomes : jusqu'ici, dès qu'une ressource web, un outil ou un endpoint MCP nécessitait un paiement, l'agent se retrouvait bloqué, incapable de finaliser la tâche sans intervention humaine. En intégrant la transaction directement dans l'infrastructure AWS, Amazon permet aux développeurs de construire des agents capables de mener à bien des missions complexes sans interruption. Les garde-fous sont conçus pour répondre aux trois risques principaux identifiés : les dépenses incontrôlées liées au comportement non-déterministe des grands modèles de langage, l'absence de délégation explicite de la part de l'utilisateur final, et la compromission des credentials développeur ou des tokens de portefeuille. Les limites de dépense sont appliquées au niveau de l'infrastructure, en dehors du modèle, ce qui les rend incontournables même si l'agent est manipulé ou mal configuré. Cette annonce s'inscrit dans une tendance de fond : les grandes plateformes cloud cherchent à industrialiser l'infrastructure nécessaire aux agents autonomes, au-delà des simples appels d'API. AWS positionne Bedrock AgentCore comme une couche de confiance entre les agents et les systèmes financiers réels, à un moment où la course à l'agentivité s'intensifie entre Amazon, Google et Microsoft. Le choix de Coinbase et Stripe comme partenaires n'est pas anodin : il permet de couvrir à la fois les paiements en crypto-monnaie et les paiements en monnaie fiduciaire, deux rails complémentaires selon les cas d'usage. La fonctionnalité reste en préversion, avec des API susceptibles d'évoluer avant la disponibilité générale, mais elle marque une étape concrète vers des agents capables d'agir pleinement en mandataires économiques de leurs utilisateurs, avec un cadre de responsabilité clairement défini.

UELa région Frankfurt est incluse dans les quatre régions de préversion, ouvrant l'accès aux développeurs européens, mais sans cadre réglementaire spécifique à l'UE mentionné pour encadrer les paiements délégués à des agents IA.

OutilsOutil
1 source
Apple relance son offensive pour une IA locale, sans passer par le cloud
306The Information AI 

Apple relance son offensive pour une IA locale, sans passer par le cloud

Lors de sa conférence annuelle des développeurs (WWDC), prévue le mois prochain, Apple devrait mettre en avant une série de mises à jour d'intelligence artificielle très attendues pour l'iPhone, tout en insistant sur une capacité souvent sous-estimée : celle de faire tourner des modèles d'IA directement sur ses appareils, sans passer par le cloud. Selon des personnes proches des plans de l'entreprise, Apple entend démontrer comment ses 15 ans d'expérience dans la conception de puces personnalisées pour l'iPhone, l'Apple Watch et les Mac lui confèrent un avantage concret pour exécuter des modèles d'IA localement. Cette approche contraste avec la norme du secteur, où la plupart des traitements IA s'effectuent dans des datacenters remplis de puces coûteuses. Certaines requêtes resteront néanmoins traitées dans le cloud, notamment celles qui nécessitent une complexité élevée ou un accès à de vastes bases de données en ligne : dans le cadre d'un accord avec Google, une nouvelle version de Siri fera tourner certaines requêtes sur Google Cloud, via une version sous licence du modèle Gemini. Apple a par ailleurs récemment approuvé une technologie de confidentialité développée par Nvidia pour cet environnement, ce qui suggère que l'entreprise utilisera également des puces Nvidia pour une partie de ses besoins de calcul dans Google Cloud. L'enjeu de l'IA embarquée est considérable : exécuter des modèles localement réduit la latence, améliore la confidentialité des données et diminue la dépendance à des infrastructures cloud onéreuses. Avec des milliards d'appareils Apple en circulation, la capacité à distribuer des traitements IA à cette échelle représente un levier différenciant face à des concurrents comme Google, Microsoft ou OpenAI, dont les offres reposent quasi exclusivement sur des serveurs distants. Apple accuse un retard significatif sur ses rivaux dans la course à l'IA générative. La WWDC du mois prochain sera donc un moment clé pour démontrer que la maîtrise du matériel, via ses puces Apple Silicon, peut constituer une réponse crédible à ce retard. La coexistence d'une stratégie on-device et d'un recours au cloud via des partenaires comme Google et Nvidia illustre la complexité de la position d'Apple : rattraper rapidement les leaders du secteur tout en préservant les promesses de confidentialité qui sont au coeur de son identité de marque.

UEL'approche on-device d'Apple réduit les transferts de données vers des serveurs distants, ce qui s'aligne naturellement avec les exigences du RGPD et pourrait renforcer la conformité des milliards d'appareils Apple utilisés en Europe.

💬 L'argument confidentialité tient moins bien avec Siri qui sous-traite à Google Cloud, mais c'est à côté du sujet. Ce qui compte, c'est que quinze ans de puces custom donnent à Apple une base que Google ou Microsoft ne peuvent pas copier en six mois : faire tourner de l'IA sur des milliards d'appareils sans passer par un datacenter, c'est une infrastructure inversée que personne d'autre n'a. Reste à voir si les modèles sont à la hauteur.

InfrastructureOpinion
1 source
Daily Brief : l’agent IA de Google pense déjà à votre journée avant vous
307Le Big Data 

Daily Brief : l’agent IA de Google pense déjà à votre journée avant vous

Google a présenté Daily Brief lors de Google I/O le 26 mai 2026, un agent IA intégré à Gemini conçu pour préparer automatiquement le début de journée de ses utilisateurs. Le système analyse en temps réel trois sources de données : la boîte Gmail, Google Calendar et Google Tasks. Chaque matin, il génère un briefing personnalisé qui résume les échanges importants, signale les échéances critiques et propose des actions concrètes comme répondre à un message ou planifier un rendez-vous. L'agent ne se contente pas de trier : il formule aussi des "étapes suivantes" contextuelles, prenant lui-même des initiatives sans attendre que l'utilisateur pose la moindre question. Pour les professionnels déjà ancrés dans l'écosystème Google Workspace, l'impact est immédiat : moins de temps passé à fouiller des dizaines de fils de discussion pour retrouver une information enfouie, plus de bande passante cognitive pour le travail réel. Daily Brief s'inscrit dans une tendance plus large où l'IA glisse d'un rôle réactif vers un rôle proactif, anticipant les besoins plutôt que d'y répondre. Google promet en outre une personnalisation progressive : les retours utilisateurs permettraient à Gemini d'affiner ses résumés et ses priorités au fil du temps, rendant l'outil théoriquement plus pertinent à mesure qu'il observe les habitudes de travail. Cette annonce s'inscrit dans la stratégie de Google visant à faire de Gemini le pivot central de toute la productivité numérique, face à la concurrence de Microsoft Copilot intégré à Office 365 et d'assistants tiers comme Notion AI ou Superhuman. Mais l'efficacité de Daily Brief repose entièrement sur un accès étendu aux données personnelles et professionnelles de l'utilisateur : agenda, courriers, rappels, habitudes quotidiennes. Google ne fait pas mystère de cette logique d'assistance proactive, déjà présente dans des fonctions comme Smart Reply ou les suggestions de Gmail, mais Daily Brief la pousse à un niveau inédit en agrégeant l'ensemble du contexte de vie numérique d'une personne. La vraie question, que Google n'a pas encore tranchée publiquement, est de savoir si les utilisateurs hors Workspace pourront accéder à cette fonctionnalité, et dans quelle mesure les données d'analyse resteront locales ou alimenteront les modèles d'entraînement de l'entreprise.

UEL'accès étendu aux données personnelles (Gmail, Calendar, tâches) par Daily Brief soulève des questions de conformité GDPR pour les utilisateurs européens, notamment sur la localisation des données analysées et leur éventuelle utilisation pour l'entraînement des modèles de Google.

💬 C'est le genre de truc qu'on attendait depuis qu'Agentic AI est devenu le mot du moment. Google coche les cases : Gmail, Calendar, Tasks agrégés en un brief du matin qui t'évite de passer vingt minutes à reconstituer ta journée, c'est utile pour de vrai. Sauf que tu leur confies littéralement l'intégralité de ton contexte de vie numérique, et ce que Google compte en faire, notamment pour l'entraînement, reste soigneusement flou.

OutilsOutil
1 source
OpenAI a généré près de 6 milliards de dollars de revenus au premier trimestre, porté par Codex
308The Information AI 

OpenAI a généré près de 6 milliards de dollars de revenus au premier trimestre, porté par Codex

OpenAI a généré environ 5,7 milliards de dollars de revenus au premier trimestre 2026, soit près d'un milliard de plus qu'Anthropic sur la même période, selon deux sources proches des chiffres. Cette performance a été portée par Codex, l'agent de codage de l'entreprise, ainsi que par une progression des ventes aux entreprises et les premiers tests publicitaires sur ChatGPT. Le chiffre représente une accélération significative pour la société fondée par Sam Altman, qui cherche à démontrer sa viabilité commerciale face à des investisseurs ayant engagé des dizaines de milliards de dollars. Ce résultat confirme qu'OpenAI reste le leader incontesté du secteur en termes de chiffre d'affaires, mais la situation évolue rapidement. Anthropic aurait depuis rattrapé puis dépassé son rival, et son taux de croissance actuel pourrait creuser l'écart en faveur de la startup cofondée par Dario Amodei d'ici la fin de l'année. Pour l'industrie, cette compétition directe entre les deux principaux laboratoires d'IA accélère l'innovation produit et tire les prix vers le bas pour les clients entreprises. Cette rivalité s'inscrit dans un contexte où les grandes entreprises technologiques investissent massivement pour capter le marché de l'IA générative professionnelle. OpenAI multiplie les paris stratégiques, agents autonomes, intégration publicitaire, partenariats comme celui avec Microsoft, tandis qu'Anthropic mise sur la fiabilité et la sécurité pour séduire les secteurs régulés. La course aux revenus entre ces deux acteurs structurera durablement l'ensemble du marché de l'IA en 2026.

UELa concurrence accrue entre OpenAI et Anthropic accélère la baisse des prix des API IA, bénéficiant aux entreprises européennes qui adoptent ces technologies.

💬 5,7 milliards en un trimestre, et c'est Codex qui tire les revenus, pas ChatGPT. Ça dit tout sur où est l'argent dans l'IA pro : les entreprises paient pour du code qui s'écrit, pas pour du chat poli. Et si Anthropic est vraiment passé devant depuis, bon, la course devient nettement plus intéressante à suivre.

BusinessActu
1 source
Bons plans, immo, week-ends : les agents IA de Google vont surveiller le web pour vous
309Le Big Data 

Bons plans, immo, week-ends : les agents IA de Google vont surveiller le web pour vous

Lors de la conférence Google I/O 2026, Google a dévoilé une nouvelle génération d'agents IA capables de parcourir le web de façon autonome et proactive, à la place des utilisateurs. Ces agents s'ajoutent à plusieurs annonces majeures de l'événement, dont les modèles Gemini Omni, Gemini Spark et Gemini 3.5 Flash. Concrètement, un utilisateur peut confier à ces agents une tâche récurrente, trouver un studio avec balcon près d'une gare sous un budget donné, repérer un concert, comparer des prix de voyage, et l'IA surveille en continu les sources pertinentes, SeLoger, Leboncoin ou autres, pour alerter dès qu'une offre correspond aux critères définis. L'interface est conversationnelle : les demandes s'affinent en langage naturel, sans avoir à reformuler des requêtes rigides. Ces agents seront d'abord réservés aux abonnés Google AI Pro et AI Ultra aux États-Unis, avant un déploiement plus large. Ce changement marque un basculement de la recherche passive vers la recherche proactive. Pendant des décennies, utiliser Google signifiait taper des mots-clés, parcourir des liens et recommencer la manœuvre régulièrement. Ici, c'est l'agent qui prend l'initiative, surveille, compare et synthétise, libérant l'utilisateur de la corvée de répétition. Pour les particuliers en quête d'un logement, d'un billet d'avion ou d'un bon plan commercial, le gain de temps est potentiellement considérable. Pour les sites d'annonces et comparateurs, la menace est symétrique : si Google devient le premier agrégateur de leurs données, leur trafic direct pourrait s'effondrer, restructurant en profondeur l'économie de l'information en ligne. Google prévoit de connecter ces agents à Gmail, Google Photos et bientôt Google Agenda, afin de personnaliser les réponses en fonction de la vie réelle de chaque utilisateur. La firme de Mountain View insiste sur le contrôle laissé aux utilisateurs, mais cette intégration dessine un écosystème où Google deviendrait l'intermédiaire central entre les internautes et le reste du web, connaissant habitudes, déplacements, projets et préférences avec une précision inédite. Ce mouvement s'inscrit dans une course accélérée entre les géants technologiques : Microsoft avec Copilot, OpenAI avec ses propres agents et Anthropic positionnent tous leurs modèles sur ce terrain de l'autonomie IA. Google, fort de ses données propriétaires et de sa maîtrise de l'infrastructure de recherche, joue ici une carte que ses concurrents ne peuvent pas facilement dupliquer, mais les questions sur la vie privée et la concentration du pouvoir numérique resteront au cœur du débat à mesure que ces outils se généraliseront.

UELes plateformes françaises d'annonces comme SeLoger et Leboncoin s'exposent à une chute de trafic si Google s'impose comme agrégateur central, et l'intégration de données personnelles dans Gmail et Photos soulève des questions de conformité RGPD pour les utilisateurs européens.

OutilsOutil
1 source
Deux assistants IA parviennent à accomplir des tâches de repositionnement de médicaments
310Ars Technica AI 

Deux assistants IA parviennent à accomplir des tâches de repositionnement de médicaments

La revue Nature a publié mardi deux articles décrivant des systèmes d'intelligence artificielle conçus pour assister les scientifiques dans le développement et la validation d'hypothèses. Le premier, baptisé Co-Scientist et développé par Google, fonctionne selon un modèle dit "scientist in the loop" : les chercheurs restent actifs dans la boucle et orientent le système par leurs jugements à chaque étape. Le second provient de FutureHouse, une organisation à but non lucratif, et va légèrement plus loin en entraînant un système capable d'évaluer de manière autonome des données biologiques issues de certaines catégories d'expériences spécifiques. Les deux équipes présentent exclusivement des données biologiques, portant principalement sur des hypothèses directes de repositionnement de médicaments, autrement dit : tester si un médicament existant peut traiter une autre maladie que celle pour laquelle il a été approuvé. Ces systèmes ne cherchent pas à remplacer les scientifiques ni le processus scientifique lui-même. Ils visent plutôt à prendre en charge ce que les IA actuelles font le mieux : parcourir et synthétiser des volumes massifs d'informations que les humains auraient du mal à absorber seuls. Les deux systèmes sont dits "agentiques" : ils fonctionnent en arrière-plan en appelant des outils externes pour accomplir leurs tâches. Ce type d'architecture permet une plus grande autonomie opérationnelle tout en restant guidé par des objectifs définis par les chercheurs. Cette publication s'inscrit dans une dynamique plus large d'investissement des géants technologiques dans l'IA scientifique. Microsoft a adopté une approche similaire avec son propre assistant scientifique, tandis qu'OpenAI fait figure d'exception en ayant simplement affiné un grand modèle de langage pour la biologie, sans architecture agentique. La multiplication de ces outils reflète un défi croissant pour la recherche : la littérature scientifique croît aujourd'hui bien plus vite qu'un chercheur humain ne peut la suivre, et l'IA commence à combler ce fossé de manière concrète.

UELes laboratoires pharmaceutiques et institutions de recherche européens pourraient à terme tirer parti d'approches similaires pour accélérer la découverte de nouvelles indications thérapeutiques, mais aucun impact direct sur la France ou l'UE n'est identifié.

RecherchePaper
1 source
X-OmniClaw : l'agent IA Android open source d'Oppo
311The Decoder 

X-OmniClaw : l'agent IA Android open source d'Oppo

L'équipe Multi-X d'Oppo a publié X-OmniClaw, un agent IA open source conçu pour fonctionner directement sur les appareils Android. Contrairement aux approches concurrentes qui dupliquent l'interface du téléphone dans le cloud, X-OmniClaw exploite les capteurs physiques de l'appareil, caméra, écran et microphone, pour percevoir l'environnement et agir dans de vraies applications. Le traitement lourd de raisonnement est délégué au cloud, mais les données sensorielles restent locales. Le code source est disponible publiquement sur GitHub. Ce positionnement "local-first" représente un avantage significatif en matière de confidentialité et de latence. L'agent peut interagir avec n'importe quelle application installée sans nécessiter d'intégration spécifique de la part des développeurs, ce qui élargit considérablement son champ d'action. Sa fonctionnalité de "clonage de parcours" est particulièrement notable : chaque séquence de tapotements qu'il exécute est enregistrée comme une compétence réutilisable, permettant ensuite d'atteindre des pages profondément imbriquées d'une application via un simple deeplink, sans rejouer toute la navigation. X-OmniClaw s'inscrit dans une course technologique intense autour des agents mobiles autonomes. Apple, Google, Samsung et Microsoft investissent massivement dans ce domaine, mais la plupart de leurs solutions reposent sur des environnements cloud contrôlés. En choisissant l'open source et l'exécution locale, Oppo mise sur la communauté des développeurs pour enrichir rapidement les capacités de l'agent, tout en se différenciant sur la question de la vie privée, un argument commercial de plus en plus décisif sur le marché des smartphones haut de gamme.

UEL'approche 'local-first' de X-OmniClaw, qui conserve les données sensorielles sur l'appareil, s'aligne avec l'esprit du RGPD et pourrait servir de référence pour les développeurs européens travaillant sur des agents IA mobiles respectueux de la vie privée.

💬 Le clonage de parcours, c'est le truc que j'attendais sans le savoir : l'agent mémorise ses propres gestes et les rejoue comme des macros, sans toucher au code de l'app. Oppo mise tout sur l'open source pour exister face aux géants, et c'est probablement le seul angle qui peut fonctionner pour eux. Bon, maintenant il faut que la communauté suive.

OutilsOutil
1 source
Nvidia franchit les 5 500 milliards en Bourse, du jamais-vu dans l’histoire
312Frandroid 

Nvidia franchit les 5 500 milliards en Bourse, du jamais-vu dans l’histoire

Nvidia a franchi ce mercredi 13 mai 2026 le seuil des 5 500 milliards de dollars de capitalisation boursière, un record absolu dans l'histoire des marchés financiers. Jamais aucune entreprise n'avait atteint une telle valorisation. Pour mettre ce chiffre en perspective, Nvidia pèse désormais plus d'une fois et demie le PIB annuel de la France, qui s'établit autour de 3 200 milliards de dollars. Le groupe californien, fondé par Jensen Huang, s'est imposé comme le fournisseur incontournable de puces GPU utilisées pour entraîner et faire tourner les modèles d'intelligence artificielle. Cette valorisation record illustre l'appétit insatiable des marchés pour tout ce qui touche à l'IA générative. Nvidia capte une part écrasante des dépenses d'infrastructure des géants technologiques, Microsoft, Google, Amazon, Meta, qui investissent des centaines de milliards de dollars dans leurs datacenters. Ses puces H100, H200 et Blackwell sont en rupture chronique depuis deux ans, ce qui confère à l'entreprise un pouvoir de fixation des prix exceptionnel et des marges brutes dépassant 70 %. Nvidia a profité d'une longueur d'avance stratégique grâce à CUDA, son écosystème logiciel développé depuis 2006, qui a rendu ses GPU quasi indétrônables dans la recherche et l'industrie IA. Ses concurrents, AMD et Intel côté puces, ou les solutions maison de Google (TPU) et Amazon (Trainium), peinent encore à rogner sa domination. La question qui se pose désormais est de savoir si cette croissance est soutenable, ou si un ralentissement des investissements en IA pourrait provoquer une correction aussi spectaculaire que l'ascension.

UELes startups et entreprises européennes développant des solutions IA restent structurellement dépendantes des puces Nvidia, dont les prix élevés et la pénurie chronique renchérissent le coût d'accès à l'infrastructure IA sur le marché européen.

InfrastructureOpinion
1 source
Claude sur AWS : toute la plateforme d'Anthropic
313Le Big Data 

Claude sur AWS : toute la plateforme d'Anthropic

Anthropic a annoncé ce 11 mai 2026 que l'intégralité de sa plateforme Claude est désormais accessible directement depuis Amazon Web Services, sous forme de disponibilité générale. Concrètement, les clients AWS peuvent désormais utiliser l'ensemble des fonctionnalités de l'API Claude, Claude Managed Agents pour déployer des agents IA à grande échelle, exécution de code Python via API, recherche web intégrée, et un système de Skills permettant à Claude d'apprendre des comportements ou méthodes de travail spécifiques, sans quitter leur environnement cloud habituel. L'intégration couvre l'authentification IAM, la facturation unifiée AWS, les audits via CloudTrail, et un accès immédiat aux nouvelles fonctionnalités au fil de leur sortie. Jusqu'ici, plusieurs capacités avancées de Claude restaient réservées à l'API native d'Anthropic. Pour les équipes techniques en entreprise, le gain est avant tout opérationnel : plus besoin de gérer des systèmes parallèles de connexion, de facturation ou de permissions. Cette simplification réduit la friction à l'adoption et abaisse la barrière d'entrée pour les organisations déjà investies dans AWS. Anthropic précise toutefois que le traitement des données sur cette plateforme s'effectue en dehors de l'infrastructure AWS classique, une nuance importante pour les entreprises soumises à des contraintes strictes de souveraineté ou de conformité. Pour celles-là, Anthropic maintient une offre distincte via Amazon Bedrock, où AWS reste l'opérateur principal et les données demeurent dans l'infrastructure Amazon, deux positionnements qui ciblent deux profils d'entreprises différents. Cette annonce s'inscrit dans une bataille industrielle plus large où les plateformes cloud sont devenues les principales portes d'entrée de l'IA générative. OpenAI pousse ChatGPT Enterprise, Google multiplie les intégrations Gemini dans son écosystème, Microsoft verrouille ses capacités IA dans Azure, et Anthropic devait muscler son jeu pour ne pas rester un fournisseur de modèles sans ancrage infrastructure. Le partenariat entre Anthropic et Amazon, qui s'est matérialisé par un investissement massif d'Amazon dans Anthropic ces dernières années, trouve ici une nouvelle expression concrète. En intégrant Claude profondément dans AWS, Anthropic gagne en distribution et en crédibilité enterprise, tandis qu'Amazon renforce l'attractivité de son cloud pour les projets IA. La prochaine étape sera de voir si cette intégration accélère effectivement l'adoption de Claude dans les grandes organisations, ou si la question non résolue de la localisation des données freinera les déploiements dans les secteurs les plus régulés.

UELes entreprises européennes sur AWS peuvent désormais accéder à l'ensemble de la plateforme Claude sans friction opérationnelle, mais le traitement des données hors infrastructure AWS standard soulève des questions de conformité pour les secteurs soumis aux exigences de souveraineté numérique de l'UE.

OutilsOpinion
1 source
☕️ Washington veut pouvoir tester les nouveaux modèles IA avant tout le monde
314Next INpact 

☕️ Washington veut pouvoir tester les nouveaux modèles IA avant tout le monde

Microsoft, Google et xAI ont conclu des accords avec le Centre américain pour les standards et l'innovation en IA (CAISI) afin de lui fournir un accès anticipé à leurs modèles les plus avancés avant tout déploiement public. Ces modèles seront livrés sans garde-fous de sécurité, ce qui permettra aux chercheurs gouvernementaux de tester leurs capacités dans des scénarios hostiles réalistes. Le CAISI, qui avait déjà signé des accords similaires avec OpenAI et Anthropic, compte à ce jour une quarantaine d'évaluations de modèles à son actif, dont certains n'avaient pas encore été mis à la disposition du grand public. Microsoft a confirmé auprès de Reuters cette collaboration visant à identifier des "comportements inattendus" dans ses systèmes, et a par ailleurs signé un accord comparable avec l'AI Security Institute britannique. Cette initiative répond à une préoccupation croissante à Washington : ne pas découvrir les capacités réelles d'un nouveau modèle IA en même temps que le reste du monde, hackers inclus. Le lancement récent de Mythos, le modèle de pointe d'Anthropic, a cristallisé ces inquiétudes chez les spécialistes de la cyberdéfense. Entre les mains de pirates informatiques, un tel système pourrait potentiellement identifier et exploiter des failles dans des infrastructures critiques à une vitesse et une échelle inédites. C'est précisément pour limiter ce risque que le déploiement de Mythos a été restreint à une cinquantaine d'organisations sélectionnées. Le CAISI a ainsi fait évoluer sa mission : au-delà du développement de standards de tests, il évalue désormais les risques stratégiques et militaires que font peser ces modèles sur la sécurité nationale. Créé sous l'administration Biden comme AI Safety Institute, rattaché au département du Commerce, cet organisme a été rebaptisé CAISI par l'administration Trump tout en conservant ses attributions fondamentales. Son rôle s'inscrit dans un resserrement général des liens entre Washington et l'industrie de l'IA. La semaine précédant ces annonces, le Pentagone dévoilait des accords avec plusieurs fournisseurs d'IA pour l'exploitation de leurs modèles dans des missions classifiées, écartant notamment Anthropic du lot principal, même si Mythos pourrait malgré tout y être intégré selon certaines sources. La course aux modèles de frontière confronte ainsi les grandes puissances à un dilemme inédit : plus ces systèmes sont capables, plus ils deviennent à la fois des atouts stratégiques et des vecteurs de risques que les États cherchent à anticiper avant que le marché ne les diffuse à tous.

UEL'approche américaine de tests pré-déploiement sans garde-fous, couplée à l'accord similaire avec l'AI Security Institute britannique, crée une référence normative qui pourrait renforcer les exigences d'évaluation des modèles frontières dans le cadre de l'AI Act européen.

SécuritéOpinion
1 source
Anthropic dévoile des agents IA pour automatiser les tâches financières
315Le Big Data 

Anthropic dévoile des agents IA pour automatiser les tâches financières

Anthropic a dévoilé le 5 mai 2026 une suite de dix agents IA spécialisés dans l'automatisation des tâches financières complexes. Construits sur Claude Opus 4.7, ces agents ciblent les banques, sociétés de gestion d'actifs et équipes finance d'entreprise. Ils couvrent un spectre large : préparation de pitchs commerciaux, analyse de résultats d'entreprises, suivi de marchés, modélisation financière, rapprochement comptable, clôture mensuelle, audit d'états financiers et vérification KYC. Chaque agent combine des compétences métiers, des connecteurs de données et des sous-agents spécialisés. Sur le benchmark Finance Agent de Vals AI, Anthropic revendique un score de 64,37 % pour Claude Opus 4.7, ce qui en ferait le modèle le plus performant du marché sur les usages financiers selon l'entreprise. En parallèle, Anthropic intègre nativement Claude à Microsoft 365 via des modules complémentaires pour Excel, PowerPoint et Word, avec une extension Outlook annoncée prochainement. Une fonctionnalité appelée Dispatch permet également d'assigner des tâches à distance par message ou commande vocale, l'agent poursuivant alors le travail en arrière-plan sur les fichiers locaux. L'enjeu opérationnel est considérable pour les services financiers, où une part significative du temps des analystes est absorbée par des tâches répétitives à faible valeur ajoutée. L'intégration native avec Microsoft 365 est particulièrement stratégique : Claude peut construire un modèle financier dans Excel, le transférer automatiquement dans PowerPoint et générer une présentation qui se met à jour en temps réel quand les données changent. Dans Word, il peut adapter des notes de crédit aux standards internes d'une institution. La continuité contextuelle entre applications, argument central d'Anthropic, élimine la friction habituelle : les analystes n'ont plus à réexpliquer leur travail lorsqu'ils changent d'outil. Pour les institutions qui souhaiteraient personnaliser les agents, Anthropic permet d'adapter les modèles aux règles de conformité, politiques de risque ou méthodes d'évaluation propres à chaque organisation. Cette offensive s'inscrit dans une compétition féroce entre les grands laboratoires d'IA pour s'implanter durablement dans les workflows des services financiers, secteur perçu comme l'un des plus rentables pour les déploiements à grande échelle. Anthropic s'appuie sur des connecteurs vers les plateformes de données de référence du secteur, FactSet, S&P Capital IQ, PitchBook, Morningstar, LSEG, pour crédibiliser son offre face à des acteurs comme OpenAI ou Microsoft Copilot, déjà bien installés dans les grandes institutions. D'après le Wall Street Journal, la demande des institutions financières pour des outils IA pleinement intégrés dans les processus métiers est en forte croissance, et Anthropic cherche à se positionner non plus comme un fournisseur de modèle, mais comme une véritable plateforme opérationnelle. Le déploiement en quelques jours promis par l'entreprise reste à vérifier à l'échelle, mais le signal envoyé au marché est clair : Claude vise désormais le cœur des opérations financières.

UELes institutions financières européennes (banques, sociétés de gestion d'actifs) peuvent accéder à ces agents via Microsoft 365, mais devront évaluer leur conformité avec l'AI Act et les réglementations sectorielles avant tout déploiement à grande échelle.

💬 C'est le virage qu'on attendait : Anthropic arrête d'être un fournisseur de modèle pour devenir une plateforme métier à part entière. L'intégration dans M365, avec Claude qui garde le fil entre Excel, PowerPoint et Word sans qu'on lui réexplique tout à chaque changement d'outil, c'est là que ça peut vraiment mordre face à Copilot. Le 64,37% sur le benchmark Finance, bon, c'est leur propre terrain de jeu, faut attendre les vrais déploiements pour voir si ça tient.

OutilsOutil
1 source
ServiceNow impose de nouvelles restrictions aux agents IA
316The Information AI 

ServiceNow impose de nouvelles restrictions aux agents IA

ServiceNow a annoncé lundi, lors de sa journée dédiée aux analystes financiers à Las Vegas, la création d'une nouvelle couche d'infrastructure baptisée "Action Fabric". Ce dispositif constitue un point de passage obligatoire que les agents d'intelligence artificielle devront traverser pour interagir avec les données hébergées dans les applications ServiceNow. Amit Zavery, directeur des opérations de l'entreprise, a précisé que ServiceNow mesurera la fréquence d'accès à cette Action Fabric, mettra en place un système de comptage et facturera les clients en conséquence. Concrètement, cette tarification s'apparente à une taxe imposée aux entreprises qui utilisent des agents IA externes, comme ceux de Microsoft, Salesforce ou d'autres fournisseurs, pour interroger leurs données stockées chez ServiceNow. L'analyste Mark Murphy de JPMorgan a qualifié le mécanisme en ces termes dans une note adressée aux investisseurs. ServiceNow rejoint ainsi HubSpot et Workday, qui ont récemment dévoilé des stratégies similaires de monétisation des accès par agents IA. Pour les entreprises clientes, cela signifie un coût supplémentaire chaque fois qu'un agent automatisé consulte ou manipule des données dans ces plateformes, quelle que soit l'origine de l'agent. Ce mouvement s'inscrit dans une tension croissante au sein de l'industrie du logiciel d'entreprise (SaaS). Alors que l'essor des agents IA remet en question les modèles de licences traditionnels basés sur le nombre d'utilisateurs humains, les éditeurs cherchent de nouveaux leviers de revenus. La stratégie des "péages logiciels" soulève cependant un débat stratégique de fond : ces barrières tarifaires protègent-elles la valeur des plateformes existantes, ou risquent-elles d'inciter les clients à migrer vers des écosystèmes plus ouverts et moins coûteux ? La réponse du marché dans les prochains trimestres sera déterminante pour savoir si cette approche renforce ou fragilise la compétitivité à long terme des grands éditeurs SaaS.

UELes entreprises européennes clientes de ServiceNow devront anticiper des coûts supplémentaires pour chaque accès de leurs agents IA aux données hébergées sur la plateforme.

BusinessOpinion
1 source
Amazon Bedrock AgentCore Identity permet de sécuriser des agents IA sur Amazon ECS
317AWS ML Blog 

Amazon Bedrock AgentCore Identity permet de sécuriser des agents IA sur Amazon ECS

Amazon a lancé AgentCore Identity, un service intégré à Amazon Bedrock, conçu pour sécuriser l'accès des agents d'intelligence artificielle aux services externes. Disponible en tant que service autonome, il s'intègre aux principales plateformes de calcul d'AWS, Amazon ECS, Amazon EKS, AWS Lambda, ainsi qu'aux environnements on-premises. La solution s'appuie sur deux protocoles standards : OAuth 2.0 (RFC 6749) pour l'autorisation des actions, et OpenID Connect (OIDC) pour l'authentification des utilisateurs. Le flux retenu est l'Authorization Code Grant, dit « 3-legged OAuth » : l'utilisateur s'authentifie auprès d'un fournisseur d'identité comme Microsoft Entra ID, donne son consentement explicite, et l'application échange un code d'autorisation contre un jeton d'accès à portée limitée. Ce jeton est ensuite conservé dans le coffre-fort de tokens d'AgentCore Identity, lié à l'identité précise de l'utilisateur, créant ainsi une chaîne d'audit traçable de l'authentification jusqu'à l'action de l'agent. Ce mécanisme répond à un problème concret et croissant en production : comment empêcher un agent IA d'agir au-delà de ce que l'utilisateur a expressément autorisé. AgentCore Identity introduit un « session binding » applicatif qui protège contre les attaques CSRF et les attaques par substitution de navigateur, deux vecteurs courants dans les flux OAuth mal implémentés. Chaque token est scopé à une session utilisateur individuelle, suivant le principe du moindre privilège : l'agent ne peut accéder qu'aux ressources pour lesquelles le consentement a été donné. La séparation des responsabilités entre le workload agent et le service de session binding permet en outre de réduire la surface d'attaque et de centraliser la gestion du cycle de vie des tokens, sans que l'application principale n'ait à gérer ce risque directement. La mise en production de cette architecture illustre une tendance de fond dans l'industrie cloud : les agents IA autonomes ne peuvent plus fonctionner sur la base de credentials statiques ou de permissions trop larges. AWS propose ici une implémentation de référence déployée sur Amazon ECS derrière un Application Load Balancer, avec chiffrement HTTPS via AWS Certificate Manager et routage DNS via Amazon Route 53. Le code source complet est disponible sur GitHub. Pour les équipes qui construisent des agents agissant pour le compte d'utilisateurs réels, assistants, automatisations, workflows délégués, cette approche standardisée autour d'OIDC et OAuth 2.0 constitue désormais une baseline de sécurité incontournable, d'autant qu'elle s'appuie sur des fournisseurs d'identité existants plutôt que de réinventer une gestion des identités propriétaire.

UELes équipes européennes déployant des agents IA sur AWS disposent d'une baseline de sécurité standardisée qui facilite la conformité RGPD grâce au consentement explicite, à la traçabilité des accès et au principe du moindre privilège.

SécuritéOutil
1 source
L’évolution du SEO face aux moteurs de recherche génératifs
318FrenchWeb 

L’évolution du SEO face aux moteurs de recherche génératifs

Les moteurs de recherche génératifs comme ChatGPT Search, Perplexity AI ou Google AI Overviews transforment en profondeur la manière dont les internautes accèdent à l'information. Là où Google acheminait autrefois les utilisateurs vers des sites tiers via des liens bleus, ces nouveaux outils synthétisent directement les réponses, réduisant mécaniquement le trafic de référence vers les éditeurs. Selon plusieurs études publiées début 2025, certains sites de contenu auraient enregistré des baisses de trafic organique de 20 à 40 % depuis le déploiement massif des résumés génératifs. Pour les entreprises et les créateurs de contenu, l'impact est structurel : le modèle économique fondé sur le volume de clics entrants est directement menacé. Les stratégies SEO classiques, optimisées pour apparaître en première page de Google, ne suffisent plus. Ce qui compte désormais, c'est d'être cité comme source par ces systèmes d'IA, une logique proche du journalisme de référence plutôt que du référencement par mots-clés. Les contenus d'autorité, précis et bien structurés, sont favorisés au détriment des articles optimisés pour les algorithmes. Cette évolution s'inscrit dans une mutation plus large du web, amorcée avec l'arrivée de ChatGPT en novembre 2022 et accélérée par l'intégration de l'IA dans les moteurs de recherche traditionnels. Google, Microsoft avec Bing, et des challengers comme Perplexity se livrent une bataille pour capter l'usage quotidien. Les éditeurs de presse et les agences de marketing digital doivent désormais repenser leurs indicateurs de succès, en intégrant la visibilité dans les réponses générées plutôt que le seul positionnement dans les SERP classiques.

UELes éditeurs de presse et agences marketing français subissent des baisses de trafic organique pouvant atteindre 40 %, les forçant à repenser entièrement leurs stratégies de visibilité en ligne.

💬 Le trafic organique s'effondre et tout le monde fait semblant de s'en remettre avec une formation "GEO" bien packagée. La vraie rupture, c'est que les moteurs IA récompensent les contenus d'autorité et punissent exactement les articles sur lesquels tu as passé des années à gratter des positions Google. Les agences qui ont bâti leur business sur le keyword stuffing vont payer l'addition.

SociétéOpinion
1 source
Big Tech prouve l'efficacité de ses dépenses en infrastructure IA, et augmente quand même la facture
319AI News 

Big Tech prouve l'efficacité de ses dépenses en infrastructure IA, et augmente quand même la facture

Microsoft, Alphabet, Meta et Amazon ont publié leurs résultats trimestriels le même jour, offrant la première vérification à grande échelle du pari colossal qu'elles ont engagé sur l'infrastructure IA. Le verdict est sans ambiguïté : les quatre entreprises ont dépassé les attentes des analystes, et toutes quatre ont simultanément rehaussé leurs prévisions de dépenses en capital pour 2026. Ensemble, elles s'engagent désormais sur une enveloppe totale comprise entre 630 et 650 milliards de dollars pour l'année. Microsoft a enregistré un chiffre d'affaires de 82,9 milliards de dollars au premier trimestre, en hausse de 18 % sur un an, avec une croissance d'Azure à 40 % en devise constante, au-delà des 38,8 % anticipés par le consensus CNBC. Les revenus annualisés liés à l'IA dépassent désormais 37 milliards de dollars. Alphabet a affiché sa plus forte croissance trimestrielle depuis 2022, avec un bond de 63 % pour Google Cloud et un bénéfice net de 62,57 milliards de dollars, en hausse de 81 % sur un an. Meta a de son côté enregistré une croissance de 33 % de ses revenus, à 56,31 milliards de dollars, son rythme le plus rapide depuis 2021. AWS d'Amazon a connu sa croissance la plus rapide en quinze trimestres. Ces chiffres importent parce qu'ils répondent à la question que les marchés posaient depuis des mois : l'infrastructure IA génère-t-elle des retours ? La réponse est oui, mais avec une nuance cruciale. Chez Meta, c'est la plateforme publicitaire Advantage+, dopée à l'IA, qui transforme les investissements en revenus. Chez Microsoft, les obligations de performances commerciales restantes ont bondi de 99 % à 627 milliards de dollars, signe d'une demande entreprise robuste. Chez Alphabet, le PDG Sundar Pichai a lui-même reconnu que la société est "contrainte à court terme par les capacités de calcul", ce qui signifie que la demande dépasse la vitesse de construction. Pourtant, malgré des résultats opérationnels solides, le titre Microsoft a reculé de plus de 3 % en après-marché, preuve que les investisseurs scrutent désormais les dépenses autant que les revenus. Cet épisode s'inscrit dans une dynamique plus large qui s'est accélérée depuis le lancement de ChatGPT fin 2022 : les grandes plateformes technologiques ont transformé leurs bilans en paris sur l'infrastructure IA, convaincues que celui qui construit le plus vite capturera la valeur de la prochaine décennie. Microsoft relève sa prévision de capex annuel à 190 milliards de dollars, bien au-delà des 154,6 milliards attendus. Meta porte la sienne à 125-145 milliards, en partie à cause de la hausse des prix des composants. Alphabet annonce que ses dépenses 2027 "augmenteront significativement" par rapport à 2026. La question ouverte est celle de la soutenabilité : les revenus publicitaires et cloud peuvent-ils continuer à financer des engagements qui rivalisent avec le PIB de certains États, à mesure que la concurrence entre Google, Microsoft, Meta et Amazon s'intensifie sur chaque couche de la pile IA ?

UELes engagements massifs de capex des géants américains conditionnent l'offre et les tarifs cloud IA accessibles aux entreprises européennes à moyen terme.

BusinessOpinion
1 source
Musk affronte l'avocat d'OpenAI sur les accusations de détournement de l'association
320The Information AI 

Musk affronte l'avocat d'OpenAI sur les accusations de détournement de l'association

Elon Musk a subi un contre-interrogatoire musclé mercredi lors du procès qui l'oppose à OpenAI, décrit comme le premier grand procès de l'ère de l'intelligence artificielle. Bill Savitt, avocat extérieur d'OpenAI et vétéran des confrontations juridiques avec Musk, a cherché à dépeindre le milliardaire comme animé par le ressentiment plutôt que par de réelles convictions juridiques. À plusieurs reprises, il a corrigé les souvenirs de Musk sur les débuts d'OpenAI en lisant des emails que le milliardaire avait lui-même rédigés à l'époque, créant des moments embarrassants pour le fondateur de Tesla et SpaceX. Le litige porte sur les accusations de Musk selon lesquelles OpenAI aurait trahi ses engagements envers lui et manqué à ses obligations caritatives en se transformant progressivement en entreprise commerciale. Si la stratégie de Savitt s'avère efficace, elle pourrait fragiliser la position juridique de Musk et réduire ses chances d'obtenir les injonctions réclamées contre l'organisation. L'issue du procès pourrait également redéfinir les règles de gouvernance applicables aux organisations à but non lucratif qui opèrent dans le secteur technologique. OpenAI a été fondée en 2015 par Musk, Sam Altman et d'autres cofondateurs, avec la promesse explicite de développer l'IA au bénéfice de l'humanité. Musk a quitté le conseil d'administration en 2018, avant qu'OpenAI ne conclue un partenariat évalué à plusieurs milliards de dollars avec Microsoft. Il accuse depuis ses anciens associés d'avoir dévoyé la mission originelle de la structure à but non lucratif, une plainte que l'avocat d'OpenAI cherche désormais à démolir en salle d'audience en retournant ses propres écrits contre lui.

RégulationReglementation
1 source
Le graphe de connaissances d'AWS Quick prend des décisions d'orchestration invisibles pour les plans de contrôle
321VentureBeat AI 

Le graphe de connaissances d'AWS Quick prend des décisions d'orchestration invisibles pour les plans de contrôle

AWS a élargi cette semaine son assistant Quick avec une version desktop dotée d'un graphe de connaissances personnel persistant, capable d'exécuter des actions sur des fichiers locaux et des outils SaaS sans attendre d'y être invité. Contrairement aux copilotes conversationnels qui réinitialisent leur contexte à chaque session, Quick construit désormais en continu un profil utilisateur à partir des fichiers locaux, du calendrier, des e-mails et des applications connectées comme Google Workspace, Microsoft 365, Zoom, Salesforce et Slack. Ce graphe lui permet de déclencher des actions de manière proactive, rappeler à un chef d'équipe d'organiser des points réguliers, par exemple, sans que l'utilisateur n'ait à formuler de requête. AWS avait lancé Quick en octobre 2024 comme alternative aux plateformes de productivité IA de Google, OpenAI et Anthropic, combinant accès aux données d'entreprise, construction d'agents, recherche approfondie et automatisation de workflows. Ce changement introduit ce que les experts appellent une "orchestration fantôme" : un niveau de décision personnalisé qui opère en dehors des couches d'orchestration centralisées que les équipes IT déploient habituellement pour garder le contrôle sur les agents IA. Plutôt que de suivre des workflows définis à l'avance, Quick prend des décisions fondées sur des déclencheurs implicites, des interprétations propres à chaque utilisateur et des temporalités variables. Upal Saha, cofondateur et CTO de Bem, résume le risque : "Quand vous déployez un agent qui raisonne en plusieurs étapes pour parvenir à une décision, vous avez déjà accepté de ne pas pouvoir en expliquer intégralement le déroulement après coup. C'est acceptable pour une démo, pas pour un pipeline de traitement de sinistres ou un workflow financier où un régulateur peut exiger un audit complet de chaque décision automatisée sur les trois dernières années." AWS insiste sur le fait que Quick reste encadré par les politiques de sécurité, les permissions et les identités d'entreprise, et que les intégrations passent toutes par des API ou des connexions MCP contrôlées. Jigar Thakkar, vice-président de la suite Quick chez AWS, positionne le produit comme "l'endroit unique où les employés peuvent accéder à toutes leurs informations et tâches." Cette évolution s'inscrit dans une tendance plus large de l'industrie : Anthropic avec ses Claude Managed Agents et OpenAI avec son Agent SDK poussent eux aussi vers des agents plus autonomes dans les workflows d'entreprise, mais en maintenant des périmètres d'orchestration définis. La question qui se pose désormais est de savoir si les entreprises sont prêtes à accepter ce compromis entre productivité gagnée par l'autonomie et traçabilité exigée par la conformité réglementaire.

UELes entreprises européennes utilisant AWS Quick devront évaluer la conformité de l'orchestration fantôme avec l'AI Act et le RGPD, qui exigent traçabilité et explicabilité des décisions automatisées dans les workflows réglementés.

OutilsOutil
1 source
ImageGen est sur la voie de l'AGI
322Latent Space 

ImageGen est sur la voie de l'AGI

GPT-Image-2, le dernier modèle de génération d'images d'OpenAI, s'impose comme l'un des outils les plus polyvalents du moment. Capable de produire des visuels éducatifs, des infographies précises, des illustrations issues de la culture populaire ou des assets graphiques en temps réel pendant qu'un développeur code, il s'intègre désormais directement dans Codex, l'agent de programmation d'OpenAI, comme compétence activable. Cette combinaison GPT-Image-2 plus Codex permet de générer des ressources visuelles de manière itérative au fil du développement, ce qui change concrètement le flux de travail des développeurs. La qualité du modèle en termes de fidélité et de faible taux d'hallucinations est telle que des concurrents comme Claude Design, pourtant présenté il y a peu comme la référence, ne figurent plus dans la conversation. Cette dynamique soulève une question stratégique sérieuse : les modèles de génération d'images sont-ils un luxe pour des laboratoires qui cherchent à atteindre l'intelligence artificielle générale, ou bien une nécessité ? La réponse semble de plus en plus claire : oui, ils sont nécessaires. Parce que le texte, le code et les données structurées ne suffisent plus à démontrer le "G" de "AGI". Une IA vraiment générale doit maîtriser la voix, le visuel, la génération multimodale, y compris les calques transparents. Fermer cette boucle créative, c'est prendre une avance décisive sur tous les concurrents qui se concentrent uniquement sur le code et la productivité d'entreprise. En parallèle, OpenAI a opéré un pivot stratégique majeur en révisant son partenariat exclusif avec Microsoft. Sam Altman a annoncé que si Microsoft reste le cloud partenaire principal, OpenAI peut désormais distribuer ses modèles sur tous les clouds, y compris Google TPU et AWS Bedrock, une confirmation d'Andy Jassy est attendue dans les prochaines semaines. La licence de Microsoft sur la propriété intellectuelle d'OpenAI devient ainsi non exclusive, et la clause AGI de l'accord original serait de facto caduque selon plusieurs observateurs. Sur le plan des benchmarks, GPT-5.5 affiche des résultats contrastés : 67,1 % sur WeirdML sans mode de réflexion, contre 57,4 % pour GPT-5.4, mais toujours en retrait face à Claude Opus 4.7 à 76,4 %. L'Arena LMSYS place le modèle en troisième position en mathématiques et deuxième en recherche, mais neuvième en code. Enfin, GitHub a annoncé la migration de Copilot vers une facturation à l'usage au 1er juin, un signal fort de la monétisation croissante des workflows agentiques, tandis qu'OpenAI a publié en open source Symphony, une couche d'orchestration reliant les gestionnaires de tickets à des agents Codex pour automatiser le cycle complet "issue → PR → revue humaine".

UELa restructuration du partenariat OpenAI-Microsoft vers une licence non exclusive pourrait faciliter l'accès aux modèles OpenAI via des fournisseurs cloud alternatifs utilisés par les entreprises européennes.

CréationActu
1 source
Les IPO de SpaceX et d'entreprises IA font peser des risques sur l'essor du secteur, selon des investisseurs
323The Information AI 

Les IPO de SpaceX et d'entreprises IA font peser des risques sur l'essor du secteur, selon des investisseurs

Lors d'un événement sur le financement de l'IA organisé par The Information à New York ce lundi, des investisseurs ont mis en garde contre les risques que font peser plusieurs introductions en bourse majeures sur l'ensemble de l'écosystème IA. SpaceX, Anthropic et OpenAI pourraient toutes entrer en bourse au cours de la même année civile, ce qui représenterait, selon Alexa von Tobel, fondatrice et associée gérante d'Inspired Capital, "trois des plus grandes IPO de l'histoire, potentiellement toutes dans le même calendrier". À l'heure où les grandes entreprises tech et IA cherchent à lever des centaines de milliards de dollars en capitaux propres et en dette pour construire des centres de données, la pression sur ces opérations est considérable. Le risque est simple : si ces introductions en bourse déçoivent les marchés, l'enthousiasme général pour l'investissement dans l'IA pourrait se refroidir brutalement. Von Tobel a utilisé l'expression "cold water on reality" pour décrire ce scénario, où de mauvaises performances boursières rendraient les capitaux environnants "plus prudents". Dans un secteur où la confiance des investisseurs alimente directement la construction d'infrastructures massives, un signal négatif sur les marchés publics aurait des répercussions bien au-delà des seules entreprises concernées, affectant potentiellement des dizaines de milliards de dollars de projets de data centers en cours. Ce contexte s'inscrit dans une période d'investissement sans précédent dans l'infrastructure IA : Microsoft, Google, Amazon et Meta ont annoncé des plans d'investissement totalisant plusieurs centaines de milliards de dollars pour 2025 et 2026. OpenAI et Anthropic, encore privées, sont valorisées respectivement à plusieurs centaines de milliards de dollars, et leur entrée en bourse constituerait un test grandeur nature de la confiance du marché public dans la rentabilité future de l'IA générative. La performance de ces IPO servira de baromètre pour toute une génération d'investissements technologiques à venir.

UEUn échec ou une déception de ces IPO américaines pourrait refroidir l'appétit des investisseurs européens pour l'IA et ralentir le financement des startups et projets d'infrastructure IA en Europe.

BusinessOpinion
1 source
Google prêt à investir 40 milliards dans Anthropic pour rivaliser avec OpenAI
324Le Big Data 

Google prêt à investir 40 milliards dans Anthropic pour rivaliser avec OpenAI

Google s'apprête à injecter au minimum 10 milliards de dollars dans Anthropic, avec une enveloppe totale pouvant atteindre 40 milliards si la startup atteint certains objectifs de performance. L'annonce, révélée par Bloomberg le 24 avril 2026, propulse la valorisation d'Anthropic à 350 milliards de dollars. Ce mouvement intervient quelques jours après qu'Amazon a lui-même engagé 5 milliards supplémentaires dans la même entreprise. Côté infrastructure, Google s'engage également à fournir 5 gigawatts de puissance de calcul via ses TPU sur cinq ans, une ressource aussi stratégique que le capital financier pour une startup dont les modèles tournent en permanence à pleine capacité. Google n'est pas un nouvel entrant dans le capital d'Anthropic, mais l'ampleur de cet engagement marque un changement d'échelle radical. Cet investissement révèle une logique qui dépasse le simple pari financier. Google cherche à sécuriser un accès privilégié aux technologies d'Anthropic pour combler son retard face à OpenAI, dont ChatGPT domine encore les usages professionnels et grand public. En échange, Anthropic consomme les infrastructures cloud et les puces de ses investisseurs, ce qui génère en retour des revenus pour Google Cloud, lesquels dépasseraient déjà ceux produits par Gemini selon des données de marché citées dans l'annonce. La startup attire ces capitaux grâce à la traction réelle de ses produits : les modèles Claude et notamment Claude Code connaissent une adoption rapide dans les environnements de développement logiciel, même si les gains de productivité restent inégaux selon les cas d'usage. La croissance brutale de la demande a cependant généré des tensions opérationnelles, avec des pannes et des limitations de service aux heures de pointe que l'entreprise tente de réguler en bridant certaines fonctionnalités pour les offres d'entrée de gamme. Cette opération s'inscrit dans une recomposition profonde du marché de l'IA, où les géants du cloud ne développent plus uniquement leurs propres modèles mais financent des acteurs indépendants pour diversifier leurs positions. Microsoft applique la même stratégie avec OpenAI depuis 2019, combinant investissement massif et fourniture d'infrastructures Azure. Amazon multiplie les paris avec Anthropic et d'autres startups. Google joue désormais sur les deux tableaux : Gemini en interne, Claude en externe. Ce modèle d'alliance hybride devient la norme dans une industrie où les coûts d'entraînement et d'inférence à grande échelle dépassent ce que même les mieux financés peuvent absorber seuls. La prochaine étape pour Anthropic sera de démontrer que cette valorisation de 350 milliards se justifie par des revenus récurrents solides, dans un marché où la concurrence entre OpenAI, Google, Meta et les challengers comme Mistral ne laisse aucune place à la stagnation.

UECet investissement massif consolide la domination américaine dans l'IA générative et intensifie la pression concurrentielle sur les acteurs européens, notamment Mistral, dans la course aux modèles fondateurs.

OpenAI intensifie sa présence sur AWS alors que ses clients se tournent vers la concurrence
325The Information AI 

OpenAI intensifie sa présence sur AWS alors que ses clients se tournent vers la concurrence

Amazon Web Services a annoncé un accord pour intégrer les modèles d'OpenAI à sa plateforme cloud, via une nouvelle offre orientée vers l'exécution d'agents IA. L'annonce, attendue depuis plusieurs années, marque la première présence officielle d'OpenAI sur AWS, le plus grand fournisseur de cloud au monde. Six entreprises interrogées, clientes d'AWS ou consultantes pour ses clients, ont réagi avec un enthousiasme modéré, soulignant qu'elles n'ont pas attendu pour trouver des alternatives. L'arrivée tardive d'OpenAI sur AWS change peu de chose pour une partie des acteurs du marché : beaucoup se sont déjà organisés autour d'autres modèles disponibles via le service Bedrock d'Amazon, notamment ceux d'Anthropic et les modèles maison Amazon Nova, réputés pour leur rapport qualité-prix. Certaines entreprises accèdent déjà aux modèles OpenAI via Microsoft Azure ou Google Cloud, rendant l'accord AWS moins stratégique qu'il n'y paraît. Pour elles, le changement de fournisseur représente un coût de migration difficile à justifier. Cet accord intervient trois ans après qu'OpenAI a déclenché la course mondiale à l'IA avec le lancement de ChatGPT, période durant laquelle les concurrents ont comblé une grande partie de l'écart technologique. Amazon a massivement investi dans Anthropic, et les clients ont eu le temps de construire des intégrations solides avec ces modèles alternatifs. L'enjeu pour OpenAI est désormais de convaincre un marché qui a appris à se passer de lui, dans un contexte où la fidélité aux fournisseurs cloud se construit sur des mois d'intégration technique.

UELes entreprises européennes hébergées sur ce cloud disposent désormais d'un canal supplémentaire pour accéder aux modèles d'OpenAI, mais l'impact pratique reste limité car la majorité a déjà construit des intégrations solides avec des alternatives compétitives.

BusinessOpinion
1 source
Google I/O : les entreprises veulent de l'aide pour exploiter l'IA
326The Information AI 

Google I/O : les entreprises veulent de l'aide pour exploiter l'IA

Lors de la conférence Google Cloud Next, le discours dominant a changé de cap par rapport à l'année précédente. En 2025, les dirigeants de Google vantaient la puissance brute de leurs modèles d'IA pour les entreprises. En 2026, le message central est devenu : comment aider concrètement les entreprises à faire fonctionner ces modèles. Des entretiens menés sur place auprès de clients et de revendeurs Google Cloud révèlent que de nombreuses organisations buttent sur des obstacles concrets dans leur adoption de l'IA, certaines peinent encore à déployer leur premier agent, tandis que d'autres se retrouvent à gérer une multitude d'agents dont la coordination devient ingérable. Ce glissement de priorité illustre un problème structurel de l'industrie : l'écart entre la promesse marketing des outils d'IA et leur déploiement opérationnel réel. Les entreprises ne manquent pas de modèles ni d'accès aux API, elles manquent d'expertise pour intégrer ces briques dans leurs processus métier, gérer les erreurs, orchestrer plusieurs agents en parallèle et maintenir des systèmes fiables en production. C'est un frein majeur à la monétisation pour les fournisseurs de cloud, qui misent sur la consommation à grande échelle. Google Cloud se retrouve dans une position partagée par ses concurrents Microsoft Azure et Amazon Web Services : après avoir massivement investi dans la course aux modèles, les hyperscalers doivent maintenant construire la couche de services, d'outillage et d'accompagnement qui transforme la puissance brute en valeur business. La conférence Next marque ainsi une maturité nouvelle du marché, où l'implémentation devient le vrai champ de bataille.

UELes entreprises européennes font face aux mêmes obstacles d'adoption de l'IA, et pourraient bénéficier des nouvelles couches de services et d'outillage que les hyperscalers développent pour faciliter le déploiement opérationnel.

BusinessOpinion
1 source
Health Data Hub : la France acte (enfin) son virage vers un cloud souverain / UNIVITY mise 27 millions d’euros sur une infrastructure spatiale 5G / De Mistral à xAI : Devendra Chaplot change de camp
327FrenchWeb 

Health Data Hub : la France acte (enfin) son virage vers un cloud souverain / UNIVITY mise 27 millions d’euros sur une infrastructure spatiale 5G / De Mistral à xAI : Devendra Chaplot change de camp

La Plateforme des données de santé a officiellement sélectionné Scaleway, filiale du groupe Iliad, pour héberger ses infrastructures, mettant fin à des années de dépendance vis-à-vis de Microsoft Azure. Ce choix, issu d'un appel d'offres rigoureux, éloigne les données médicales de millions de Français du spectre du Cloud Act américain et affirme un virage vers la souveraineté numérique. En parallèle, la startup UNIVITY annonce une levée de 27 millions d'euros pour déployer une infrastructure 5G spatiale combinant satellites et réseaux terrestres. Enfin, Devendra Chaplot, chercheur passé par Mistral AI, rejoint xAI, la société d'intelligence artificielle d'Elon Musk. Ces trois actualités convergent autour d'un même enjeu : la souveraineté technologique européenne. Le choix de Scaleway par le Health Data Hub répond aux alertes répétées de la CNIL sur les risques d'exposition des données de santé aux injonctions extraterritoriales américaines, et constitue un signal fort pour les opérateurs de cloud souverain français. L'investissement d'UNIVITY positionne l'Europe sur le marché de la connectivité satellitaire face à Starlink, tandis que le départ de Chaplot vers xAI illustre la capacité des mastodontes américains à capter les talents IA européens. La controverse autour du Health Data Hub remonte à 2020, quand le contrat Microsoft avait déclenché une vague de critiques de juristes et d'associations de défense des droits numériques. Scaleway, certifié hébergeur de données de santé (HDS), était depuis le candidat naturel à ce contrat stratégique. Plus largement, ces trois événements dessinent un écosystème européen en tension entre ambition souveraine et attraction irrésistible des géants américains de la tech.

UELe Health Data Hub migre de Microsoft Azure vers Scaleway (groupe Iliad), soustrayant les données médicales de millions de Français au Cloud Act américain, victoire directe pour la souveraineté numérique française et signal fort pour l'écosystème cloud souverain européen.

InfrastructureActu
1 source
Excel & Google Sheets : Fin des formules, ChatGPT débarque et fait tout le job
328Le Big Data 

Excel & Google Sheets : Fin des formules, ChatGPT débarque et fait tout le job

OpenAI a lancé le 22 avril 2026 une nouvelle fonctionnalité appelée ChatGPT Sidebar, qui s'intègre directement dans Excel et Google Sheets sous forme de barre latérale ou de complément. L'installation se fait en quelques clics via le menu des modules complémentaires sur Google Sheets, ou via l'onglet Compléments d'Excel. Une fois connecté à son compte OpenAI, l'utilisateur dispose d'un assistant capable de créer des structures de fichiers, modifier des données, mettre à jour des tableaux et analyser des tendances réparties sur plusieurs onglets, le tout en langage naturel. L'outil demande systématiquement confirmation avant d'effectuer toute modification, préservant ainsi le contrôle de l'utilisateur. Il prend également en charge l'import de fichiers dans un large éventail de formats : images (JPEG, PNG, GIF), documents (PDF, Word, Pages), présentations (PowerPoint), feuilles de calcul (CSV, Excel), ainsi que formats texte et code (JSON, YAML, HTML, Markdown). La limite est fixée à 20 fichiers par message, avec un maximum de 25 Mo par fichier. L'outil est actuellement en phase bêta et réservé aux abonnés payants des offres Plus, Pro, Business, Enterprise, Edu et K-12. Pour des millions de professionnels qui passent des heures à construire des formules complexes ou à chercher des anomalies dans des tableaux imbriqués, cette intégration représente un changement concret de flux de travail. L'assistant peut repérer des tendances de dépenses sur plusieurs onglets en secondes, là où un analyste aurait autrefois mobilisé une demi-journée. Selon Jack R. Curran et d'autres membres de l'équipe OpenAI, l'outil couvre aussi bien des usages personnels, comme l'organisation d'un mariage ou la gestion d'une activité en ligne, que des besoins professionnels comme la construction d'un plan d'affaires ou l'analyse de données. La capacité à interagir en langage naturel abaisse significativement la barrière d'entrée pour les utilisateurs non-téchniques, qui n'ont plus besoin de maîtriser les syntaxes de formules pour exploiter pleinement un tableur. Cette annonce s'inscrit dans une dynamique d'expansion agressive d'OpenAI vers les outils de productivité bureautique, un territoire jusqu'ici dominé par Microsoft avec Copilot intégré à Office 365, et par Google avec Gemini dans Workspace. En s'installant directement dans Excel, concurrent historique de ses propres partenaires Microsoft, OpenAI joue sur tous les tableaux simultanément. La limitation aux abonnés payants suggère une stratégie de montée en gamme : convaincre les entreprises de migrer vers des formules Business ou Enterprise. L'absence de synchronisation avec l'historique ChatGPT classique constitue une limitation notable pour l'instant, mais laisse anticiper une intégration plus profonde dans les prochaines versions. La bataille pour devenir le co-pilote universel du travail de bureau ne fait que commencer.

UELes professionnels français et européens abonnés aux offres payantes ont accès à cette intégration qui modifie concrètement les pratiques de travail sur tableur, sans impact réglementaire spécifique à l'UE pour l'instant.

💬 Installer ChatGPT directement dans Excel, le produit phare de Microsoft, c'est le genre de coup qui mérite qu'on s'y arrête. Pour les profils non-techs qui jonglent avec des tableaux sans vraiment maîtriser les formules, là c'est du concret, pas du vent. Abonnés payants seulement pour l'instant, donc la vraie adoption, on verra dans six mois.

OutilsOutil
1 source
OpenAI transforme ChatGPT en plateforme d'automatisation d'équipe avec des agents de travail
329The Decoder 

OpenAI transforme ChatGPT en plateforme d'automatisation d'équipe avec des agents de travail

OpenAI déploie une nouvelle fonctionnalité dans ChatGPT baptisée "workspace agents", qui représente une évolution majeure des GPTs personnalisés lancés en 2023. Ces agents, propulsés par Codex, le moteur de programmation d'OpenAI, sont conçus pour automatiser des flux de travail complexes au sein des équipes professionnelles. Contrairement aux interactions classiques avec un chatbot, ces agents peuvent s'exécuter en arrière-plan, sans surveillance humaine active, et enchaîner des tâches sur la durée. L'enjeu est considérable pour les entreprises : il ne s'agit plus de demander une réponse ponctuelle à un assistant IA, mais de déléguer des processus entiers, comme la gestion de rapports, la coordination entre outils ou le traitement de données récurrentes. Ce basculement transforme ChatGPT d'un simple outil conversationnel en véritable plateforme d'automatisation d'équipe, positionnant OpenAI en concurrence directe avec des solutions comme Microsoft Copilot, Notion AI ou encore les agents proposés par Google Workspace. Cette annonce s'inscrit dans une course effrénée à l'agentique, où les grands acteurs de l'IA cherchent à s'ancrer durablement dans les outils de productivité professionnelle. OpenAI a précisé que les GPTs personnalisés existants resteraient disponibles dans l'immédiat, une transition progressive devant être proposée ultérieurement. Le choix de Codex comme moteur sous-jacent suggère une orientation forte vers les tâches techniques et développeur, même si les usages visés dépassent largement ce seul périmètre.

UEL'adoption des workspace agents ChatGPT par les entreprises européennes soulève des enjeux de conformité RGPD, les processus métier et données sensibles étant délégués à une plateforme américaine.

OutilsOutil
1 source
Claude Code s'étend à toute l'organisation via Amazon Bedrock
330AWS ML Blog 

Claude Code s'étend à toute l'organisation via Amazon Bedrock

Anthropic et Amazon Web Services ont annoncé le lancement de Claude Cowork dans Amazon Bedrock, une intégration qui permet aux entreprises de déployer l'application de bureau Claude directement depuis leur infrastructure AWS. Concrètement, les utilisateurs téléchargent l'application Claude Desktop sur leur machine, puis le service informatique de l'entreprise pousse une configuration centralisée via des outils de gestion de parc comme Jamf, Microsoft Intune ou Group Policy. L'inférence est entièrement routée vers Amazon Bedrock dans les régions AWS choisies par l'organisation, sans licence par siège payée à Anthropic : la facturation est à la consommation, intégrée à l'accord AWS existant. L'application donne accès aux projets, artefacts, mémoire, import-export de fichiers, connecteurs distants et serveurs MCP. Les fonctionnalités nécessitant l'infrastructure Anthropic, onglet Chat, Computer Use, Skills Marketplace, sont exclues de cette offre. L'enjeu dépasse la seule productivité des développeurs. Claude Cowork vise à étendre l'adoption de l'IA à l'ensemble des travailleurs de la connaissance d'une organisation : chefs de produit, analystes, équipes juridiques ou RH peuvent déléguer de la recherche documentaire, de l'analyse de fichiers, de la génération de rapports, sans quitter leur environnement de travail habituel. Pour les entreprises soumises à des contraintes réglementaires strictes, l'argument central est la souveraineté des données : Amazon Bedrock ne stocke pas les prompts, fichiers, inputs ou outputs d'outils, ni les réponses du modèle, et ne les utilise pas pour entraîner des modèles fondamentaux. Les profils d'inférence régionaux, cross-régionaux ou globaux permettent de choisir le niveau de résidence des données adapté à chaque juridiction. Cette annonce s'inscrit dans une dynamique plus large de déploiement entreprise de l'IA générative, où les grands groupes cherchent à concilier puissance des modèles de pointe et exigences de conformité interne. AWS et Anthropic approfondissent ainsi un partenariat stratégique amorcé il y a plusieurs années, Amazon ayant investi plusieurs milliards de dollars dans Anthropic. Pour les organisations qui utilisent déjà Claude Code dans Bedrock pour leurs équipes techniques, la même configuration peut être réutilisée pour déployer Cowork. L'intégration avec IAM, VPC endpoints, CloudTrail et CloudWatch permet une gouvernance et une observabilité natives. La prochaine étape probable : étendre les capacités des serveurs MCP disponibles dans ce contexte géré, afin de connecter Claude aux systèmes métier internes sans compromettre l'isolation réseau.

UELes entreprises européennes soumises au RGPD peuvent déployer Claude à grande échelle via leurs régions AWS européennes, avec résidence des données garantie et sans que les prompts ou fichiers soient utilisés pour entraîner des modèles.

OutilsOutil
1 source
Les entreprises surestiment leur contrôle sur l'IA : 72 % ne sont pas aussi sécurisées qu'elles le croient
331VentureBeat AI 

Les entreprises surestiment leur contrôle sur l'IA : 72 % ne sont pas aussi sécurisées qu'elles le croient

Dans 72 % des entreprises interrogées, les décideurs affirment utiliser au moins deux plateformes d'intelligence artificielle qu'ils considèrent comme leur couche "primaire", selon une enquête menée par VentureBeat auprès de 40 grandes entreprises entre janvier et mars 2026. Ce chiffre révèle un écart béant entre la perception du contrôle et la réalité opérationnelle. L'exemple le plus frappant vient du système hospitalier Mass General Brigham (MGB), plus grand employeur du Massachusetts avec 90 000 salariés : l'an dernier, son directeur technique Nallan Sriraman a dû stopper un nombre incontrôlé de projets pilotes internes en IA qui avaient proliféré sans supervision. MGB a depuis construit une plateforme sécurisée maison autour de Microsoft Copilot, capable de supporter jusqu'à 30 000 utilisateurs, pour empêcher que les données de santé protégées (PHI) des patients ne soient transmises au fournisseur du modèle sous-jacent, OpenAI. En parallèle, l'hôpital doit bâtir un "plan de contrôle" central pour orchestrer les agents IA déployés séparément par Epic, Workday et ServiceNow, qui fonctionnent tous différemment. Ce phénomène de dispersion, que VentureBeat nomme "gouvernance mirage", traduit une contradiction structurelle : les entreprises croient avoir mis en place une gouvernance solide alors qu'elles n'ont défini ni responsabilités claires, ni garde-fous précis, ni processus d'évaluation ou de sécurité réels. Pour les responsables de la sécurité en particulier, cette multiplicité de plateformes, issues de Microsoft Azure, Google, OpenAI, Anthropic ou d'éditeurs applicatifs, élargit mécaniquement la surface d'attaque, à un moment où les cyberattaques assistées par IA gagnent en sophistication. Le paradoxe est d'autant plus aigu que les entreprises se sont tournées vers leurs grands fournisseurs logiciels existants pour éviter de dupliquer les efforts, mais se retrouvent malgré tout contraintes de construire autour de leurs lacunes. Ce contexte reflète la vitesse à laquelle les hyperscalers et les grands éditeurs ont intégré l'IA dans leurs offres, forçant leurs clients entreprise à absorber une complexité non anticipée. Comme l'explique Sriraman avec l'analogie des "six aveugles et l'éléphant", chaque fournisseur décrit l'IA à sa façon, rendant toute vision cohérente difficile à construire. Le marché reste "encore naissant", selon ses termes, ce qui rend les décisions stratégiques particulièrement hasardeuses. La prochaine étape pour des organisations comme MGB sera de stabiliser ces plans de contrôle multi-agents tout en attendant que les fournisseurs mûrissent leurs propres capacités de sécurité, un pari sur un calendrier que personne ne maîtrise vraiment.

UELes entreprises européennes soumises aux obligations de conformité de l'AI Act sont particulièrement exposées à ce risque de 'gouvernance mirage', où un écart entre gouvernance déclarée et réalité opérationnelle pourrait constituer une non-conformité réglementaire.

SécuritéActu
1 source
332Ars Technica AI 

Des retards de construction touchent 40 % des centres de données américains prévus pour 2026

Près de 40 % des projets de centres de données américains prévus pour 2026 accuseront un retard de plus de trois mois sur leur calendrier initial, selon une analyse publiée par le Financial Times. Ce constat repose sur des images satellites fournies par la société d'analyse géospatiale SynMax, croisées avec les déclarations publiques et documents de permis compilés par le groupe de recherche IIR Energy. Les projets concernés appartiennent à des géants technologiques comme Microsoft, Oracle et OpenAI. Les responsables de chantiers liés à OpenAI ont notamment signalé un manque critique d'artisans qualifiés, électriciens, monteurs de tuyauteries, pour mener de front plusieurs chantiers simultanément. Ce ralentissement menace directement les ambitions de l'industrie de l'intelligence artificielle, qui a engagé des centaines de milliards de dollars dans la construction de centres de données de plus en plus imposants, chacun pouvant consommer autant d'électricité que des centaines de milliers de foyers américains. Des retards de trois mois ou plus sur des infrastructures aussi stratégiques pèsent lourd : ils décalent la mise en production de capacités de calcul indispensables à l'entraînement et au déploiement des modèles d'IA, retardant par ricochet les lancements de produits et les engagements commerciaux pris auprès des clients cloud. Cette situation s'inscrit dans un contexte de course effrénée aux ressources : la demande de travailleurs spécialisés dans la construction de centres de données a explosé bien plus vite que l'offre disponible. À cela s'ajoutent des pénuries chroniques d'équipements électriques, des délais de raccordement au réseau électrique qui s'étendent parfois sur plusieurs années, et une résistance locale croissante dans certaines communautés qui s'inquiètent de l'impact de ces mégastructures sur la consommation d'eau et d'énergie. La question est désormais de savoir si l'industrie tech saura adapter son rythme d'investissement à la réalité des contraintes physiques et humaines du terrain.

UELes retards dans les capacités de calcul cloud américaines pourraient ralentir l'accès des entreprises européennes aux services d'IA et renchérir les coûts d'infrastructure.

InfrastructureActu
1 source
333The Verge AI 

Canva AI 2.0 mise tout sur les outils de design pilotés par prompts

Canva a dévoilé aujourd'hui une refonte majeure de sa suite de création, baptisée Canva AI 2.0, qui introduit une interface conversationnelle unifiée pour accéder à l'ensemble des outils de la plateforme. La nouveauté centrale est une couche d'orchestration permettant aux utilisateurs de piloter tous leurs projets par simple description textuelle : générer un visuel, ajuster une mise en page, modifier un texte ou créer une présentation en décrivant ce qu'ils souhaitent obtenir. Plus besoin de naviguer entre les menus, un seul chatbot centralise désormais toutes les actions. Pour les équipes marketing et les créatifs, ce changement est significatif : il réduit la friction technique et ouvre la plateforme à des profils moins familiers avec les outils de design traditionnel. En substituant la commande vocale/textuelle aux clics et aux paramètres manuels, Canva s'aligne sur le paradigme de l'IA générative que des acteurs comme Adobe Firefly ou Microsoft Designer cherchent eux aussi à imposer. L'enjeu commercial est direct : fidéliser les entreprises qui cherchent à centraliser leur production de contenu dans un seul outil. Cette mise à jour s'inscrit dans la stratégie de montée en gamme de Canva, qui vise depuis plusieurs années à concurrencer frontalement Adobe sur le segment professionnel. Valorisée à 26 milliards de dollars lors de sa dernière levée de fonds en 2021, la société australienne a multiplié les acquisitions et intégrations IA pour rester compétitive. L'approche "tout-en-un piloté par prompt" pourrait s'avérer décisive alors que le marché des outils de création se consolide rapidement autour de quelques plateformes dominantes.

UELes équipes marketing et créatives françaises et européennes utilisant Canva bénéficieront d'une interface unifiée par prompts qui réduit la barrière technique à la production de contenu professionnel.

OutilsOutil
1 source
Google et le Pentagone discutent d'un accord IA classifié, l'entreprise renouant avec le secteur militaire
334The Information AI 

Google et le Pentagone discutent d'un accord IA classifié, l'entreprise renouant avec le secteur militaire

Google est en négociation avec le Département de la Défense américain pour un accord qui permettrait au Pentagone de déployer les modèles d'intelligence artificielle Gemini dans des environnements classifiés. L'information, révélée par deux personnes ayant une connaissance directe des discussions, indique que les deux parties envisagent un contrat autorisant l'utilisation de l'IA de Google pour l'ensemble des usages légaux au sein des forces armées américaines. Selon l'une de ces sources, Google aurait proposé d'inclure dans le contrat des clauses restrictives visant à empêcher que ses modèles soient utilisés pour de la surveillance de masse intérieure ou pour des systèmes d'armes autonomes, notamment le ciblage, sans supervision humaine "appropriée". Cet accord marquerait un tournant majeur dans la relation entre Google et le secteur militaire. L'entreprise deviendrait un contractant technologique significatif du Pentagone, avec un accès potentiel à des infrastructures classifiées, un niveau d'engagement rarement atteint dans l'industrie tech civile. Pour l'armée américaine, intégrer Gemini dans des environnements sécurisés ouvrirait la voie à des capacités d'analyse, de traitement du renseignement et de prise de décision assistée par IA à une échelle et une vitesse sans précédent. Les garde-fous proposés par Google, bien que symboliquement importants, restent formulés de façon vague, notamment autour de la notion de contrôle humain "approprié", ce qui laisse une marge d'interprétation considérable. Ce rapprochement s'inscrit dans un renversement de position spectaculaire pour Google. En 2018, face à une fronde interne massive de ses employés, l'entreprise avait abandonné le projet Maven, un contrat avec le Pentagone portant sur l'analyse d'images de drones par IA, et s'était engagée à ne pas développer d'IA à usage militaire offensif. Depuis, la concurrence acharnée avec Microsoft, qui fournit déjà des services cloud et d'IA à l'armée via Azure et ses partenariats avec OpenAI, ainsi que la pression des actionnaires ont poussé Google à reconsidérer cette posture. La course aux contrats gouvernementaux dans le domaine de l'IA est désormais un enjeu stratégique majeur pour l'ensemble des grandes entreprises technologiques américaines.

UECe rapprochement militaro-technologique américain pourrait accélérer les débats européens sur la souveraineté technologique et l'encadrement de l'IA dans la défense.

BusinessActu
1 source
Broadcom et Meta : un partenariat à l’échelle du Gigawatt pour le futur de l’IA
335Le Big Data 

Broadcom et Meta : un partenariat à l’échelle du Gigawatt pour le futur de l’IA

Meta et Broadcom ont officialisé le 14 avril 2026 un partenariat stratégique pluriannuel pour bâtir l'une des infrastructures de calcul IA les plus massives jamais conçues. Dès la première phase, la capacité déployée dépasse 1 gigawatt, avec une trajectoire assumée vers plusieurs gigawatts dans les années à venir. Au cœur du dispositif : les puces propriétaires MTIA (Meta Training and Inference Accelerator), conçues pour optimiser à la fois l'entraînement et l'inférence des modèles d'IA. Broadcom fournit l'ensemble de la chaîne matérielle, de la conception des accélérateurs via sa plateforme XPU à leur interconnexion réseau haut débit. La collaboration est prévue pour durer jusqu'en 2029 au moins, avec des générations successives de puces MTIA adaptées aux besoins évolutifs de Meta. Ce partenariat représente un changement d'échelle radical dans la façon dont les grandes plateformes numériques abordent leurs besoins en calcul. Meta ne se contente plus d'acheter des GPU sur étagère : l'entreprise co-conçoit avec Broadcom des accélérateurs taillés sur mesure pour ses propres charges de travail, ce qui permet d'optimiser conjointement la logique de calcul, la gestion mémoire et les transferts de données à haute vitesse. L'enjeu est concret : alimenter des services utilisés quotidiennement par des milliards de personnes, de WhatsApp à Instagram en passant par Threads, tout en réduisant le coût total de possession. Mark Zuckerberg a affiché publiquement l'ambition d'apporter des capacités d'IA avancées à chaque utilisateur, jusqu'à ce qu'il décrit comme une forme de "superintelligence personnelle". À cette échelle, chaque point d'efficacité matérielle se traduit directement en milliards de dollars d'économies ou de capacités supplémentaires. Ce mouvement s'inscrit dans une tendance de fond qui redessine l'industrie du semi-conducteur et des infrastructures cloud. Face à la domination de Nvidia sur le marché des GPU d'IA, les hyperscalers comme Meta, Google ou Amazon investissent massivement dans des puces personnalisées pour réduire leur dépendance à un seul fournisseur et reprendre le contrôle de leur stack matériel. Broadcom, qui accompagne déjà Google avec ses TPU, se positionne comme le partenaire de référence pour ces projets de co-conception à grande échelle. Le choix d'une architecture réseau basée sur Ethernet ouvert plutôt que sur des protocoles propriétaires facilite l'évolutivité et l'intégration dans des data centers existants. Avec des investissements qui se chiffrent désormais en gigawatts plutôt qu'en mégawatts, la course à l'infrastructure IA prend une dimension comparable à celle de l'industrie énergétique, et les prochains trimestres diront si cette stratégie d'hyper-scalabilité donne à Meta l'avantage compétitif recherché face à OpenAI, Google et Microsoft.

InfrastructureOpinion
1 source
336Ars Technica AI 

Adobe amène Creative Cloud sur le terrain de Claude Code

Adobe vient de franchir une étape importante dans l'évolution de Creative Cloud en lançant Firefly AI Assistant, une interface conversationnelle capable de gérer des projets complexes et multi-modaux à travers plusieurs applications simultanément. Contrairement aux fonctionnalités d'IA ponctuelles déjà intégrées dans Photoshop, Illustrator ou Premiere Pro, ce nouvel outil fonctionne comme un chef d'orchestre entre les différentes applications de la suite, en interagissant régulièrement avec l'utilisateur pour poser des questions ou proposer des ajustements en cours de tâche. Les utilisateurs peuvent intervenir à tout moment pour apporter des précisions, un peu à la manière des outils de programmation assistée par IA comme Claude Code. L'outil répond à deux besoins distincts : offrir aux créatifs expérimentés un moyen efficace de déléguer les tâches répétitives et chronophages qui traversent plusieurs logiciels, tout en abaissant la barrière d'entrée pour les utilisateurs occasionnels ou débutants. Adobe reconnaît que la complexité croissante de ses outils a jusqu'ici "élargi le fossé entre l'idée et la réalisation", une formulation qui souligne un problème structurel dans l'expérience utilisateur de la suite Creative Cloud. Firefly AI Assistant entend combler cet écart en rendant l'orchestration de workflows multi-applications accessible via une simple conversation. Adobe proposait déjà des interfaces de chat dans certaines applications individuelles ainsi qu'un accès à des modèles génératifs via la marque Firefly. Mais la nouveauté réside dans la capacité à orchestrer des tâches à travers l'ensemble de l'écosystème Creative Cloud, et non plus application par application. Ce lancement s'inscrit dans une course industrielle où Microsoft, Google et de nombreuses startups cherchent à transformer leurs suites logicielles en agents autonomes capables d'exécuter des projets de bout en bout. Pour Adobe, dont le modèle repose sur des abonnements Creative Cloud à plusieurs dizaines d'euros par mois, l'enjeu est de justifier la valeur de la plateforme dans un contexte où des concurrents spécialisés en IA générative gagnent du terrain.

UELes professionnels créatifs français et européens abonnés à Creative Cloud pourront déléguer des workflows multi-applications via une interface conversationnelle, réduisant la barrière d'entrée à l'orchestration de projets complexes.

OutilsOutil
1 source
337VentureBeat AI 

Claude Managed Agents d'Anthropic offre aux entreprises un guichet unique mais soulève un risque de dépendance fournisseur

Anthropic a lancé la semaine dernière une nouvelle plateforme baptisée Claude Managed Agents, destinée aux entreprises souhaitant déployer des agents IA sans se confronter aux complexités techniques habituelles de l'orchestration. Selon Anthropic, la plateforme permet de passer d'un déploiement en semaines ou en mois à quelques jours seulement, en gérant nativement la définition des tâches, des outils et des garde-fous, ainsi que l'exécution des graphes d'état, le routage, la gestion des permissions et le traçage de bout en bout. Des données directionnelles de VentureBeat portant sur plusieurs dizaines d'entreprises au premier trimestre 2026 montrent par ailleurs que l'adoption des API d'orchestration native d'Anthropic est passée de 0 % à 5,7 % entre janvier et février, sur des panels respectifs de 56 et 70 organisations de plus de 100 employés. Microsoft Copilot Studio et Azure AI Studio restaient en tête avec 38,6 % des répondants en février, suivis d'OpenAI à 25,7 %. L'enjeu concret pour les entreprises est double. D'un côté, Claude Managed Agents promet de supprimer la couche d'orchestration externe, sandboxing, checkpointing, gestion des credentials, traçabilité, en l'absorbant directement dans le modèle. C'est un gain de vitesse et de simplicité réel pour des équipes déjà saturées par la multiplication des agents. De l'autre, cela implique de confier les données de session à une base gérée par Anthropic et de laisser l'exécution des agents se dérouler dans un environnement que l'entreprise ne contrôle pas pleinement. Le comportement des agents devient plus difficile à garantir, et les organisations s'exposent à des instructions contradictoires si leur seul levier de contrôle reste le prompting contextuel. Cette sortie s'inscrit dans une course à l'orchestration qui s'intensifie à mesure que les entreprises industrialisent leurs workflows agentiques. Anthropic, porté notamment par l'essor de Claude Code au cours de l'année écoulée, tente ainsi d'élargir son empreinte au-delà de la fourniture de modèles fondamentaux pour devenir le runtime de référence des agents d'entreprise. La stratégie ressemble à celle des grandes plateformes SaaS : créer un écosystème suffisamment intégré pour devenir difficile à quitter. C'est précisément ce que beaucoup d'entreprises espéraient éviter en adoptant l'IA, après avoir déjà subi les effets du lock-in avec leurs fournisseurs logiciels traditionnels. La question qui se pose désormais est de savoir si la promesse de simplicité et de rapidité justifie cette dépendance accrue à un fournisseur unique, et si les concurrents comme Microsoft ou OpenAI proposeront rapidement des alternatives comparables.

UELes entreprises européennes qui adoptent Claude Managed Agents s'exposent à un risque de dépendance fournisseur accru, sans cadre contractuel ou réglementaire spécifique encadrant la souveraineté des données de session confiées à Anthropic.

OutilsOpinion
1 source
L’IA gratuite, c’est terminé : les prix du compute s’envolent
338FrenchWeb 

L’IA gratuite, c’est terminé : les prix du compute s’envolent

Pendant deux ans, l'intelligence artificielle a été proposée à des tarifs quasi symboliques : APIs accessibles, chatbots gratuits, génération de contenu à la demande. Cette période d'abondance artificielle touche désormais à sa fin. Les coûts du compute, longtemps subventionnés par les levées de fonds massives des grands acteurs, remontent à la surface, et les hausses de prix se multiplient chez les principaux fournisseurs de services IA. Ce retournement a des conséquences directes pour les entreprises et développeurs qui ont bâti leurs produits sur des hypothèses de coût très basses. Les marges se réduisent, les modèles économiques sont à revoir, et les startups les plus dépendantes des APIs tierces se retrouvent sous pression. Pour les utilisateurs finaux, la fin des offres gratuites ou très généreuses signifie une recomposition du marché : les acteurs capables de maîtriser leur infrastructure prendront l'avantage sur ceux qui sous-traitent entièrement leur compute. Ce tournant s'explique par la conjonction de plusieurs facteurs : la demande mondiale en puissance GPU explose tandis que l'offre reste contrainte, les datacenters saturent, et les investisseurs commencent à exiger de la rentabilité après des années de croissance à perte. OpenAI, Anthropic, Google et Microsoft ont tous signalé des tensions sur leurs infrastructures. La prochaine phase de l'IA sera celle de la sélection économique : seuls survivront les usages dont la valeur justifie réellement le coût de calcul.

UELes startups et développeurs européens qui ont bâti leurs produits sur des APIs IA bon marché doivent revoir en urgence leurs modèles économiques face à la remontée des coûts de compute.

💬 On y est. J'avais mis un an à convaincre des clients que les APIs IA à 0,002$ du token, c'était pas un modèle viable sur le long terme, et là ça se confirme brutalement. Les startups qui ont bâti leur MRR sur du compute subventionné par la VC money vont avoir quelques trimestres difficiles. Reste à voir qui a les reins assez solides pour absorber la hausse, ou qui va simplement disparaître.

InfrastructureOpinion
1 source
Perplexity voit ses revenus grimper de 50% grâce aux agents IA
339Le Big Data 

Perplexity voit ses revenus grimper de 50% grâce aux agents IA

Perplexity, la startup américaine connue pour son moteur de recherche conversationnel, a vu son chiffre d'affaires annuel récurrent (ARR) bondir à 450 millions de dollars en mars 2026, soit une hausse de 50 % en un seul mois. Cette progression fait suite au lancement de Computer, un agent IA capable d'exécuter des tâches concrètes comme effectuer des achats en ligne, résumer l'actualité ou envoyer des e-mails à partir d'instructions en langage naturel. La société a également introduit un nouveau modèle de tarification à l'usage, qui facture les clients au-delà d'un certain quota de crédits, en complément de ses abonnements mensuels allant de 20 à 200 dollars. Perplexity revendique désormais plus de 100 millions d'utilisateurs actifs mensuels et plusieurs dizaines de milliers de clients professionnels. Pour replacer l'ampleur de cette croissance : l'ARR de la société était de 16 millions de dollars il y a deux ans, avant d'atteindre 305 millions début 2026. Ce bond de 50 % en un mois illustre un pivot stratégique majeur : Perplexity ne cherche plus seulement à concurrencer Google sur la recherche d'information, mais à se positionner sur le marché des agents IA autonomes, un segment en pleine explosion. En proposant des outils capables d'agir à la place de l'utilisateur, la startup s'attaque à un marché beaucoup plus vaste et potentiellement plus rentable que la simple requête web. L'ajout du navigateur Comet, qui intègre des fonctionnalités agentiques directement dans la navigation, et de Model Council, qui interroge plusieurs modèles d'IA en parallèle pour comparer leurs réponses, témoigne d'une diversification rapide de l'offre. Pour les entreprises et les professionnels, ces outils représentent une alternative crédible aux assistants IA des géants comme Google ou Microsoft. Cette ascension se déroule pourtant dans un contexte juridique tendu. Perplexity est visée par plusieurs poursuites d'éditeurs de presse, dont le New York Times et Britannica, pour violation de droits d'auteur et plagiat dans le cadre de son moteur de recherche. Une plainte distincte l'accuse également d'avoir partagé des données d'utilisateurs avec Google et Meta sans consentement, ce que la société rejette. Sur le plan financier, la rentabilité reste hors de portée : Perplexity dépend d'OpenAI, d'Anthropic et d'autres fournisseurs externes pour accéder aux modèles de langage, ce qui génère un coût à chaque requête. Malgré cela, les investisseurs maintiennent leur confiance. La valorisation de l'entreprise a atteint 20 milliards de dollars en septembre 2025, contre 500 millions début 2024, avec au capital des noms comme Nvidia, SoftBank, Jeff Bezos et Yann LeCun. La prochaine étape sera de transformer cette traction commerciale en profitabilité durable.

UELes entreprises européennes peuvent évaluer Perplexity comme alternative crédible aux assistants IA dominants, mais les poursuites pour violation de droits d'auteur soulèvent des questions de conformité avec la directive européenne sur le droit d'auteur.

BusinessActu
1 source
Anthropic dévoile Mythos, son modèle d’IA chasseur de failles… réservé à certains
340Next INpact 

Anthropic dévoile Mythos, son modèle d’IA chasseur de failles… réservé à certains

Anthropic a officialisé l'existence de Claude Mythos, un modèle d'intelligence artificielle spécialisé dans la cybersécurité, via le lancement du projet Glasswing. L'annonce est intervenue après plusieurs semaines de rumeurs et la fuite d'un billet de blog qui avait déjà éventé la surprise. Présenté comme plus capable qu'Opus, le modèle phare de la start-up californienne jusqu'alors, Mythos a été conçu pour détecter et exploiter des failles dans des logiciels avec une précision inédite. Son accès est strictement limité à un cercle de partenaires triés sur le volet : AWS, Apple, Google, Microsoft, NVIDIA, Cisco, Broadcom et la fondation Linux font partie des entreprises qui bénéficient d'un aperçu du modèle dans le cadre de Glasswing, un nom inspiré des papillons aux ailes transparentes. Anthropic reconnaît elle-même que Mythos est potentiellement trop dangereux pour une diffusion publique, ses capacités offensives en cybersécurité pouvant constituer une menace réelle si elles tombaient entre de mauvaises mains. En le réservant à de grands acteurs institutionnels et technologiques capables de l'encadrer, l'entreprise entend le transformer en outil défensif : sécuriser des logiciels critiques plutôt qu'en compromettre. Pour les entreprises partenaires, l'enjeu est considérable, car un modèle capable de scanner automatiquement des bases de code à la recherche de vulnérabilités inconnues représente un avantage stratégique majeur face aux attaques croissantes ciblant les infrastructures numériques mondiales. Cette annonce s'inscrit dans un contexte tendu pour Anthropic, frappée simultanément par une autre fuite involontaire concernant Claude Code, attribuée là encore à une "erreur humaine". La coïncidence de ces deux événements nourrit les interrogations sur la gestion interne de l'information chez la startup, fondée en 2021 par d'anciens d'OpenAI. La stratégie de communication autour de Mythos, d'abord entretenue dans le flou avant d'être officialisée sous une forme très contrôlée, intervient alors qu'Anthropic se prépare à une introduction en bourse et cherche à affirmer sa position face à OpenAI dans une compétition de plus en plus féroce. Limiter volontairement l'accès à son modèle le plus puissant, tout en le présentant comme potentiellement dangereux, est une manière de soigner à la fois son image de responsabilité et son aura technologique auprès des investisseurs et du grand public.

UEL'émergence d'un modèle IA dédié à la détection de vulnérabilités logicielles accentue la pression concurrentielle sur les acteurs européens de la cybersécurité et soulève des questions sur l'accès des infrastructures critiques européennes à ces capacités défensives de pointe.

LLMsOpinion
1 source
Manipulateur, sociopathe : qui est vraiment le patron de ChatGPT ?
341Le Big Data 

Manipulateur, sociopathe : qui est vraiment le patron de ChatGPT ?

Une enquête publiée par le New Yorker le 6 avril 2026, signée par les journalistes Ronan Farrow et Andrew Marantz, dresse un portrait sévère de Sam Altman, PDG d'OpenAI. Basée sur des mémos internes inédits et plus de 200 pages de documents, l'enquête compile des témoignages d'anciens collaborateurs qui décrivent un dirigeant au profil atypique : non pas un ingénieur visionnaire, mais un stratège de la persuasion. Altman dirige une entreprise valorisée près de 1 000 milliards de dollars, et son influence sur le secteur de l'intelligence artificielle est considérable. Pourtant, plusieurs sources lui reprochent un rapport très flexible à la vérité : renégociation d'accords après coup, déni d'engagements pourtant documentés, reformulation des faits selon les circonstances. Un ancien collaborateur décrit un effet "Jedi", une capacité à faire croire à chaque interlocuteur que la vision d'Altman est en réalité la sienne. L'impact de ces révélations dépasse le simple portrait de dirigeant. OpenAI occupe une position centrale dans le développement de l'IA mondiale, et la question de sa gouvernance touche directement à la confiance que lui accordent partenaires, régulateurs et utilisateurs. Le cas de Dario Amodei, ancien cadre d'OpenAI devenu PDG d'Anthropic, est particulièrement éloquent : lors des négociations avec Microsoft en 2019, des garanties strictes en matière de sécurité auraient été validées, avant qu'une clause clé ne soit discrètement modifiée. Altman aurait ensuite nié l'existence de ce changement malgré des preuves écrites. Microsoft, principal investisseur d'OpenAI, aurait également subi des revirements similaires : alors qu'OpenAI réaffirmait publiquement l'exclusivité de Azure comme fournisseur cloud, l'entreprise annonçait en parallèle un partenariat avec Amazon sur sa plateforme Frontier dédiée aux agents IA. Ce double discours érode la confiance des partenaires et brouille la lisibilité stratégique d'une entreprise dont chaque mouvement est scruté à l'échelle mondiale. Ces tensions s'inscrivent dans un contexte plus large de questionnement sur la gouvernance d'OpenAI. En novembre 2023, le conseil d'administration avait temporairement évincé Altman avant de le réintégrer sous pression des employés et des investisseurs, révélant déjà des fractures profondes. La conversion d'OpenAI d'organisation à but non lucratif en entreprise commerciale alimente les doutes sur la sincérité de ses engagements éthiques. Le terme "sociopathe" revient dans plusieurs témoignages, ce qui illustre la violence des jugements portés en interne. Altman, lui, continue de se présenter comme un acteur responsable de la transition vers l'IA générale. La question qui traverse toute l'enquête est finalement celle-ci : peut-on bâtir une technologie civilisationnelle en s'appuyant sur un leadership dont la méthode principale est la manipulation, même brillante ?

UELes révélations sur la gouvernance d'OpenAI pourraient renforcer la méfiance des régulateurs européens et compliquer les négociations de conformité dans le cadre de l'AI Act.

BusinessActu
1 source
Anthropic lance un nouveau modèle d'IA pour la cybersécurité
342The Verge AI 

Anthropic lance un nouveau modèle d'IA pour la cybersécurité

Anthropic lance un nouveau modèle d'intelligence artificielle dédié à la cybersécurité, dans le cadre d'un partenariat baptisé Project Glasswing réunissant Nvidia, Google, Amazon Web Services, Apple, Microsoft et d'autres grandes entreprises technologiques. Ce projet propose aux partenaires de lancement un accès à Claude Mythos Preview, un modèle généraliste inédit qu'Anthropic ne prévoit pas de rendre public en raison de préoccupations liées à la sécurité. L'objectif affiché est de permettre aux grandes organisations, et potentiellement aux gouvernements, de détecter automatiquement des vulnérabilités dans leurs systèmes avec une intervention humaine quasi nulle. L'enjeu est considérable pour les équipes de sécurité informatique qui font face à un volume croissant de menaces et manquent souvent de ressources pour les auditer manuellement. En automatisant la détection de failles, Claude Mythos Preview pourrait réduire drastiquement le temps de réponse face aux cyberattaques et permettre aux entreprises d'identifier des vulnérabilités avant que des acteurs malveillants ne les exploitent. Newton Cheng, responsable cyber au sein de l'équipe red team d'Anthropic, indique que le modèle vise à donner aux équipes de sécurité un avantage structurel sur leurs adversaires. Cette initiative s'inscrit dans une tendance de fond où les grands laboratoires d'IA cherchent à positionner leurs modèles sur des secteurs critiques à haute valeur ajoutée. Anthropic, qui se distingue par son approche axée sur la sécurité des systèmes d'IA, choisit ici de restreindre l'accès à ce modèle plutôt que de le diffuser largement, une décision rare qui soulève des questions sur la gouvernance des outils d'IA offensifs et défensifs dans un contexte géopolitique tendu.

UELes organisations européennes et gouvernements de l'UE pourraient accéder à cet outil de détection automatique de vulnérabilités via le programme partenaires, renforçant leur posture de cybersécurité face aux menaces croissantes.

L'IA est insatiable
343IEEE Spectrum AI 

L'IA est insatiable

L'intelligence artificielle provoque une pénurie mondiale de mémoire informatique, et plus précisément de mémoire à haute bande passante (HBM), un composant spécialement conçu pour alimenter les processeurs d'IA. Les fabricants de puces comme Nvidia et AMD exigent des quantités croissantes de HBM pour chacun de leurs processeurs, sous la pression de géants comme Google, Microsoft, OpenAI et Anthropic, qui financent une expansion sans précédent de leurs centres de données. Le site Hyperion de Meta en Louisiane, prévu à 5 gigawatts, illustre l'ampleur pharaonique de ces infrastructures. La pénurie ne se limite pas à la mémoire : la consommation électrique de l'IA pourrait atteindre 12 % de l'ensemble de la production américaine d'électricité d'ici 2028, tandis que les requêtes d'IA générative, qui ont consommé 15 térawattheures en 2025, devraient grimper à 347 TWh d'ici 2030. Les conséquences de cette tension sur les approvisionnements se répercutent bien au-delà des data centers. La pression des hyperscalers sur la demande en mémoire fait monter les prix de tous les appareils électroniques grand public, y compris des ordinateurs à bas coût comme le Raspberry Pi. Cette inflation technologique est amplifiée par la hausse générale des prix et l'instabilité du régime des droits de douane américains, rendant difficile pour les consommateurs et les entreprises d'évaluer le vrai coût de la pénurie. Pour les industriels de la tech, la contrainte d'approvisionnement oblige à repenser l'architecture des systèmes, potentiellement au détriment des performances. Les trois grands fabricants de HBM sont Micron, Samsung et SK Hynix, et tout ajustement de leur calendrier de production constituerait un signal fort d'un éventuel retour à l'équilibre. Du côté de la demande, les data centers pourraient se tourner vers des équipements sacrifiant une partie des performances pour réduire leur consommation de mémoire, tandis que les startups pourraient être contraintes de repenser leurs produits pour limiter leurs besoins en RAM. Cette pénurie, bien que pénalisante à court terme, pourrait aussi stimuler des innovations inattendues dans la conception de systèmes plus sobres en ressources, une dynamique que les observateurs de l'industrie suivront de près dans les prochains trimestres.

UELa pénurie de mémoire HBM fait monter les prix des composants électroniques en Europe, affectant les consommateurs et les entreprises tech européennes qui dépendent de ces approvisionnements.

💬 Le Raspberry Pi qui augmente à cause des data centers d'OpenAI, c'est le genre d'effet domino qu'on n'anticipe pas. La pression des hyperscalers sur le HBM, ça se répercute sur toute la chaîne, du GPU H100 jusqu'au tinkerer qui commande une carte à 35 euros. Reste à voir si la contrainte d'approvisionnement pousse vraiment vers des architectures plus sobres, ou si c'est juste un argument de comm' le temps que Micron et SK Hynix rattrapent la demande.

InfrastructureOpinion
1 source
Claude Code et Cowork permettent désormais à l'IA d'Anthropic de prendre le contrôle de votre ordinateur
344The Decoder 

Claude Code et Cowork permettent désormais à l'IA d'Anthropic de prendre le contrôle de votre ordinateur

Anthropic a annoncé que son assistant IA Claude est désormais capable de prendre directement le contrôle d'un ordinateur Mac ou Windows pour accomplir des tâches à la place de l'utilisateur. Cette fonctionnalité est intégrée à deux produits distincts : Claude Code, l'outil en ligne de commande destiné aux développeurs, et Cowork, une interface de collaboration homme-machine. Concrètement, Claude peut désormais naviguer dans des applications, manipuler des fichiers, remplir des formulaires ou exécuter des séquences d'actions complexes sur le bureau de l'utilisateur, sans intervention humaine à chaque étape. L'enjeu est considérable pour les professionnels techniques comme pour les usages grand public. Un développeur peut confier à Claude Code des tâches de refactorisation, de débogage ou de déploiement qui nécessitaient auparavant une attention manuelle constante. Pour les équipes utilisant Cowork, cela ouvre la voie à une véritable délégation de workflows entiers à l'IA, avec un gain de productivité potentiellement significatif. Cette capacité à agir dans un environnement graphique réel, et non seulement à générer du texte, représente un saut qualitatif dans l'utilité pratique des assistants IA. Cette annonce s'inscrit dans la continuité des travaux d'Anthropic sur le "computer use", une capacité expérimentale présentée fin 2024 via leur API, qui permettait déjà à Claude d'interagir avec des interfaces graphiques dans des environnements contrôlés. Le passage à une intégration native dans des produits grand public comme Claude Code et Cowork marque une étape de maturité. Anthropic entre ainsi en concurrence directe avec OpenAI et son opérateur d'ordinateur, ainsi qu'avec Microsoft Copilot, tous engagés dans la course aux agents IA capables d'agir de manière autonome sur les postes de travail.

UELes développeurs et entreprises européens peuvent désormais déléguer des workflows complets à l'IA via Claude Code et Cowork, sans attendre un équivalent européen — renforçant la dépendance du marché européen aux agents autonomes américains.

OutilsOutil
1 source
ADeLe : prédire et expliquer les performances de l'IA selon les tâches
345Microsoft Research 

ADeLe : prédire et expliquer les performances de l'IA selon les tâches

Des chercheurs de Microsoft, en collaboration avec l'Université de Princeton et l'Universitat Politècnica de València, ont publié dans la revue Nature une méthode inédite d'évaluation des modèles d'IA baptisée ADeLe — pour AI Evaluation with Demand Levels. Présentée dans l'article « General Scales Unlock AI Evaluation with Explanatory and Predictive Power », cette approche évalue simultanément les tâches et les modèles selon 18 capacités fondamentales — attention, raisonnement, connaissances de domaine, métacognition, entre autres — en leur attribuant un score de 0 à 5. Appliquée à 15 grands modèles de langage dont GPT-4o et Llama-3.1, la méthode permet de prédire les performances sur des tâches inédites avec une précision d'environ 88 %. Les travaux ont bénéficié du programme de financement AFMR (Accelerating Foundation Models Research) de Microsoft. L'apport concret d'ADeLe réside dans sa capacité à dépasser les scores agrégés des benchmarks classiques, qui mesurent ce qu'un modèle réussit sans expliquer pourquoi il échoue ni anticiper ses comportements sur de nouvelles tâches. En construisant un profil de capacités pour chaque modèle — une cartographie structurée de ses forces et faiblesses — et en le confrontant aux exigences précises d'une tâche donnée, ADeLe identifie les lacunes spécifiques à l'origine des erreurs. La méthode révèle également que de nombreux benchmarks largement utilisés donnent une image incomplète, voire trompeuse : un test censé mesurer le raisonnement logique peut en réalité dépendre fortement de connaissances spécialisées ou de métacognition, faussant ainsi l'interprétation des résultats. Pour les équipes qui développent ou déploient des LLMs, cette granularité change radicalement la façon d'interpréter une évaluation. L'évaluation des LLMs souffre depuis plusieurs années d'un problème structurel : les benchmarks standard comme MMLU ou HumanEval mesurent des performances globales sur des jeux de tests fixes, sans permettre de généraliser ni de diagnostiquer. ADeLe s'inscrit dans une tendance plus large de la communauté de recherche à vouloir rendre l'évaluation plus explicable et plus prédictive, à mesure que les modèles deviennent des composants critiques dans des systèmes professionnels. La publication dans Nature — une revue généraliste de premier rang, inhabituelle pour ce type de travaux en IA — signale l'ambition scientifique du projet. Les prochaines étapes pourraient inclure l'extension du cadre à des modalités au-delà du texte, et son adoption par des organismes d'évaluation indépendants cherchant des alternatives aux classements simplistes.

UELa co-participation de l'Universitat Politècnica de València positionne ADeLe comme candidat naturel pour les organismes d'évaluation européens chargés de mettre en œuvre les exigences de l'AI Act sur la transparence et la robustesse des modèles.

💬 Les benchmarks classiques te donnent un score global, mais zéro explication sur ce qui foire et pourquoi. ADeLe décompose ça en 18 capacités mesurables, confronte le profil du modèle aux exigences précises de la tâche, et prédit les perfs à 88% sur des cas inédits, ce qui est franchement solide pour de la recherche académique. Publication dans Nature en plus, c'est le genre de signal qui dit que l'évaluation des LLMs commence enfin à être traitée comme un vrai problème scientifique.

RecherchePaper
1 source
Les outils IA pour la santé et la guerre culturelle du Pentagone contre Anthropic
346MIT Technology Review 

Les outils IA pour la santé et la guerre culturelle du Pentagone contre Anthropic

Un juge américain a temporairement bloqué une décision du Pentagone qui cherchait à qualifier Anthropic de risque pour la chaîne d'approvisionnement et à interdire aux agences gouvernementales d'utiliser ses technologies d'intelligence artificielle. Cette intervention judiciaire met fin, au moins provisoirement, à une confrontation qui avait rapidement dégénéré : le gouvernement avait court-circuité les procédures habituelles de gestion des litiges et amplifié la polémique sur les réseaux sociaux, transformant un différend administratif en bras de fer public. Parallèlement, Microsoft, Amazon et OpenAI ont chacun lancé ces derniers mois des chatbots médicaux destinés au grand public, un mouvement qui révèle une demande croissante face aux difficultés d'accès aux soins, mais qui soulève des inquiétudes quant à l'absence d'évaluation externe sérieuse avant leur mise sur le marché. Ces deux affaires illustrent une tension de fond dans l'écosystème de l'IA : entre la vitesse de déploiement des outils et la robustesse des garde-fous qui les encadrent. Dans le domaine médical, des recommandations erronées ou biaisées délivrées à des millions d'utilisateurs vulnérables pourraient avoir des conséquences sanitaires graves, sans que les régulateurs n'aient eu le temps d'évaluer ces systèmes. Dans le secteur gouvernemental, l'affaire Anthropic montre que l'instrumentalisation politique de questions techniques peut nuire à la crédibilité des institutions et fragiliser des partenariats stratégiques dans un secteur où les États-Unis cherchent à maintenir leur avance mondiale. Ce contexte s'inscrit dans une période de turbulences réglementaires aux États-Unis : la Californie a adopté de nouvelles normes sur l'IA malgré l'opposition de l'administration Trump, qui avait demandé aux États de suspendre leurs initiatives en la matière — une résistance qui préfigure un conflit fédéral-état durable. Par ailleurs, les grandes entreprises technologiques font face à une double pression : leurs investissements cumulés dans l'IA dépassent 635 milliards de dollars, mais la crise énergétique liée aux tensions au Moyen-Orient menace leurs plans d'expansion des datacenters. Dans ce tableau, la société finlandaise Nebius annonce un centre de données IA de 10 milliards de dollars en Finlande, signe que l'Europe cherche à s'imposer dans la course aux infrastructures. L'ensemble de ces signaux converge vers une même réalité : l'IA entre dans une phase de maturité où les décisions techniques, politiques et économiques sont désormais indissociables.

UELa société finlandaise Nebius annonce un datacenter IA de 10 milliards de dollars en Finlande, renforçant la position européenne dans la course aux infrastructures IA.

RégulationReglementation
1 source
Google dévoile AppFunctions pour connecter les agents IA aux applications Android
347InfoQ AI 

Google dévoile AppFunctions pour connecter les agents IA aux applications Android

Google a dévoilé AppFunctions, une nouvelle fonctionnalité en bêta anticipée pour Android, conçue pour permettre aux agents d'intelligence artificielle d'interagir directement avec les applications installées sur l'appareil. L'initiative s'inscrit dans une vision que Google qualifie d'OS « agent-first » : plutôt que d'ouvrir des applications manuellement, l'utilisateur formule un objectif, et un agent IA orchestre les briques fonctionnelles exposées par les apps pour l'accomplir. Ce changement de paradigme redéfinit le rôle des applications mobiles : elles ne sont plus des interfaces autonomes, mais des fournisseurs de capacités que les assistants IA peuvent assembler à la demande. Concrètement, un utilisateur pourrait demander à son assistant de « réserver un restaurant et d'ajouter l'événement au calendrier » sans jamais toucher manuellement ces deux apps — l'agent s'en chargerait via leurs AppFunctions respectives. Pour les développeurs, cela implique d'exposer leurs fonctionnalités sous une nouvelle forme d'API destinée aux agents. Cette annonce s'inscrit dans la course que se livrent Apple, Google et Microsoft pour intégrer l'IA générative au cœur des systèmes d'exploitation. Apple a lancé Apple Intelligence avec des capacités similaires via les App Intents, tandis que Microsoft pousse Copilot dans Windows. Google, fort de son modèle Gemini, cherche à faire d'Android la plateforme de référence pour les agents autonomes sur mobile — un terrain stratégique alors que l'usage des LLM sur appareil progresse rapidement.

UELes développeurs européens d'applications Android devront exposer leurs fonctionnalités via AppFunctions pour rester compatibles avec les agents IA intégrés à Android.

OutilsActu
1 source
Mistral publie un nouveau modèle open source pour la génération vocale
348TechCrunch AI 

Mistral publie un nouveau modèle open source pour la génération vocale

Mistral AI a publié un nouveau modèle open source dédié à la génération vocale, conçu pour fonctionner directement sur des appareils à faibles ressources comme des smartphones ou des montres connectées. Cette annonce marque une étape notable pour la startup française, qui continue d'élargir son portefeuille au-delà des modèles de texte vers des modalités multimédia plus complexes. L'enjeu principal est la démocratisation de la synthèse vocale de qualité sans dépendance au cloud. En permettant une exécution entièrement locale sur des terminaux embarqués, Mistral ouvre la voie à des applications vocales respectueuses de la vie privée, sans latence réseau et utilisables hors connexion — un différenciateur fort face aux solutions propriétaires de Google, Apple ou Microsoft qui centralisent le traitement. Mistral s'impose depuis 2023 comme l'acteur européen le plus actif dans la course aux modèles open source performants. Après Mistral 7B, Mixtral et plusieurs modèles spécialisés, cette incursion dans la génération audio suit la tendance générale du secteur vers des modèles multimodaux compacts. La capacité à tourner sur une montre connectée suggère une optimisation agressive via des techniques de quantification ou de distillation, un terrain où les ingénieurs de Mistral ont démontré leur expertise. --- Note : l'article source ne fournit que le titre et la ligne d'accroche — certains détails spécifiques (nom du modèle, benchmarks, date de sortie exacte) ne figuraient pas dans le texte transmis.

UEMistral AI, startup française de référence, lance un modèle de synthèse vocale open source exécutable en local sur appareils embarqués, renforçant la souveraineté technologique européenne face aux solutions cloud américaines.

LLMsActu
1 source
Les géants de la tech intensifient leurs acquisitions de startup IA
349Le Big Data 

Les géants de la tech intensifient leurs acquisitions de startup IA

Les géants de la technologie, comme Microsoft, Google, Amazon et Meta, intensifient leurs acquisitions de startups IA depuis 2019. Plus de 100 opérations stratégiques ont été enregistrées, avec les États-Unis en tête (111 acquisitions), suivis du Royaume-Uni (19). Ce boom est alimenté par la croissance rapide du marché de l'IA, estimé à 244 milliards de dollars en 2025 et destiné à dépasser un billion de dollars d'ici 2031. Les entreprises acquièrent pour intégrer directement les talents et solutions opérationnelles, plutôt que de développer tout cela in-house, qui prendrait du temps et présente des risques. De plus, ces rachats permettent de verrouiller des marchés prometteurs avant qu'ils ne deviennent concurrentiels et de neutraliser les menaces potentielles.

UELes grandes entreprises technologiques américaines intensifient leurs acquisitions de startups IA, ce qui peut avoir des répercussions sur la concurrence et l'innovation au sein de l'Union Européenne.

BusinessActu
1 source
Photoshop : vous pouvez désormais demander à son assistant IA de modifier vos images
350The Verge AI 

Photoshop : vous pouvez désormais demander à son assistant IA de modifier vos images

Adobe lance en bêta publique un assistant IA dans Photoshop (web et mobile) permettant aux utilisateurs de modifier des images par simple description conversationnelle — suppression d'éléments, changement de fond, retouche lumière et couleur. Cette fonctionnalité, testée en bêta privée depuis octobre, s'étend désormais à d'autres applications Creative Cloud comme Acrobat et Express. Adobe annonce également l'intégration de certaines de ces apps directement dans le service Copilot de Microsoft.

UELes professionnels créatifs français et européens utilisant Photoshop peuvent désormais modifier leurs images par simple description en langage naturel, simplifiant les workflows de retouche pour les studios, agences et indépendants du secteur.

OutilsOutil
1 source