Aller au contenu principal

Dossier Microsoft — page 11

1056 articles · page 11 sur 22

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

ModuLoop : génération de code bas niveau pour le contrôle robotique via synthétiseur modulaire et débogueur en boucle fermée
501arXiv cs.RO RobotiquePaper

ModuLoop : génération de code bas niveau pour le contrôle robotique via synthétiseur modulaire et débogueur en boucle fermée

Un groupe de chercheurs a publié sur arXiv (2606.03047, juin 2026) la description d'un framework baptisé Closed-Loop Modular Code Synthesizer, également appelé ModuLoop, conçu pour générer automatiquement du code de contrôle bas niveau destiné à des robots physiques. L'approche repose sur un LLM pré-entraîné généraliste, utilisé sans aucun fine-tuning spécifique à la tâche : le modèle décompose le problème en modules, génère le code correspondant, l'exécute sur le système réel, puis insère des sondes de débogage pour observer le comportement en cours d'exécution. Cette boucle fermée itère jusqu'à produire un programme exécutable et stable. La validation porte sur deux scénarios concrets : la calibration d'une caméra RGB-D couplée à un bras robotique (problème dit eye-hand calibration), suivie d'une tâche pick-and-place exploitant directement la calibration obtenue. Les auteurs rapportent une haute précision d'exécution et un haut degré d'autonomie sur ces deux tâches, sans fournir de métriques chiffrées précises dans l'abstract, ce qui limite l'évaluation indépendante des performances annoncées. L'intérêt principal de cette approche est d'adresser l'un des verrous les plus persistants de la robotique LLM : descendre au niveau du code bas niveau, là où la précision temporelle et la dépendance à l'environnement rendent les agents généralistes habituellement inefficaces. Contrairement aux modèles de type VLA (Vision-Language-Action) comme Pi-0, GR00T N2 ou Helix, qui nécessitent des phases d'entraînement ou de fine-tuning coûteuses, ModuLoop propose une architecture sans coût d'adaptation au domaine. Pour un intégrateur ou un OEM, cela ouvre la perspective d'automatiser des étapes de configuration et de calibration d'installations robotiques sans pipeline ML dédié. La boucle de débogage systématique est également une réponse directe au sim-to-real gap : le système apprend des erreurs d'exécution en conditions réelles plutôt qu'en simulation. Cette publication s'inscrit dans un courant de recherche actif depuis Code as Policies (Google, 2022) et les travaux PaLM-E, qui explorent les LLMs comme couche de planification et de génération de code pour la robotique. ModuLoop se distingue par son accent sur le débogage en boucle fermée plutôt que sur la seule génération. Côté concurrence, des approches comme CodeAct ou les travaux récents de Microsoft Research sur RobotCodeGen couvrent un espace similaire. L'article reste un preprint non encore évalué par les pairs, ce qui invite à la prudence sur la généralisation des résultats à des manipulateurs industriels multi-DOF ou à des environnements non structurés. Aucun déploiement terrain ni partenariat industriel n'est mentionné à ce stade.

1 source
Amazon Bedrock AgentCore Gateway étend sa prise en charge du protocole MCP
502AWS ML Blog 

Amazon Bedrock AgentCore Gateway étend sa prise en charge du protocole MCP

Amazon a annoncé cette semaine une extension significative des capacités d'AgentCore Gateway, son service de passerelle centralisée pour le protocole MCP (Model Context Protocol) au sein d'Amazon Bedrock. Les nouvelles fonctionnalités couvrent notamment la prise en charge étendue des schémas d'outils MCP, l'intégration des primitives MCP prompts et ressources, la découverte dynamique de serveurs MCP à l'exécution, la gestion de sessions pour les interactions temps réel, un mécanisme d'élicitation permettant des demandes d'entrée en cours d'exécution, et un échange de jetons OAuth 2.0 pour l'authentification déléguée. Ces ajouts s'appliquent à un service qui sert déjà de point d'entrée unique entre les serveurs MCP d'une organisation et les clients qui les consomment, en centralisant la gestion des identifiants, l'observabilité et la connectivité sécurisée. L'enjeu est directement opérationnel pour les équipes engineering en entreprise. Sans passerelle centralisée, chaque serveur MCP déployé, qu'il gère les contrats pour l'équipe juridique, les données financières ou les incidents opérationnels, doit gérer indépendamment ses propres mécanismes d'authentification, de contrôle d'accès et de journalisation. Cela multiplie les délais d'approbation, fragmente la visibilité sur l'usage des outils et oblige les équipes sécurité à auditer chaque serveur séparément. AgentCore Gateway réduit ce fardeau en laissant chaque équipe se concentrer sur la logique métier de son serveur MCP, tandis que la passerelle prend en charge tout le reste : agrégation des capacités, politiques d'accès basées sur les ressources, isolation réseau via AWS PrivateLink, logs d'audit centralisés, et guardrails déterministes via AgentCore Policy. MCP, le protocole lancé par Anthropic fin 2024 pour standardiser la façon dont les agents IA interagissent avec des outils et services externes, a rapidement été adopté par les grands acteurs du cloud, dont AWS, Microsoft et Google. Amazon intègre AgentCore Gateway dans son écosystème Bedrock, qui concurrence directement Azure AI et Google Cloud Vertex AI dans la course aux infrastructures d'agents IA en entreprise. La montée en puissance des architectures multi-agents, où plusieurs modèles coopèrent en orchestrant des dizaines d'outils, rend ce type de couche de gouvernance centrale de plus en plus stratégique. Les prochaines étapes probables incluent une intégration plus poussée avec les outils d'identité AWS IAM et une extension du support aux agents tiers via les flux OAuth 2.0 maintenant disponibles dans la passerelle.

InfrastructureOpinion
1 source
L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA
503NVIDIA AI Blog 

L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA

NVIDIA accélère la construction d'une infrastructure mondiale d'« usines à IA », en s'appuyant sur un écosystème croissant de partenaires cloud. Jensen Huang, fondateur et PDG de NVIDIA, a annoncé lors d'une communication officielle que cet écosystème couvre désormais six continents, avec l'arrivée de deux nouveaux partenaires : Cassava en Afrique et Claro en Amérique du Sud. Des acteurs comme CoreWeave, Firmus, IREN et Nscale élargissent leurs capacités pour répondre à la demande des laboratoires d'IA, des entreprises et des gouvernements. En Australie, Firmus Technologies déploie son « Project Southgate », un programme de data centers en Tasmanie, Melbourne, Australie-du-Sud et Nouvelle-Galles du Sud, en privilégiant les énergies renouvelables et les infrastructures modulaires. La société a également ouvert des installations à Singapour en partenariat avec ST Telemedia Global Data Centres. Cet élargissement répond à une explosion de la demande en tokens, l'unité de traitement des modèles de langage, portée par les applications d'IA agentique, les copilotes d'entreprise et les modèles frontières. Pour les nations et industries réglementées, ces clouds régionaux permettent de respecter des exigences de souveraineté numérique et de conformité locale, sans dépendre d'infrastructures centralisées aux États-Unis. Pour les développeurs et startups, ils réduisent la latence et simplifient l'accès aux GPU NVIDIA, combinés aux logiciels d'IA et aux réseaux haute performance de la marque. L'argument économique mis en avant par NVIDIA est le coût par token et le débit par watt, deux métriques déterminantes pour qui exploite des modèles d'IA en production à grande échelle. Cette expansion s'inscrit dans une stratégie plus large de NVIDIA pour s'imposer non plus seulement comme fabricant de puces, mais comme architecte de l'ensemble de la chaîne d'infrastructure IA, du silicium aux logiciels en passant par le cloud. Face à la montée en puissance de concurrents comme AMD et aux investissements massifs des hyperscalers (Google, Microsoft, Amazon) dans leurs propres puces, NVIDIA cherche à verrouiller l'écosystème via des partenariats cloud qui intègrent sa pile technologique complète. Des partenaires comme GMI Cloud, Naver Cloud, Indosat Ooredoo Hutchison ou YTL ancrent cette stratégie dans des marchés à forte croissance : Asie du Sud-Est, Moyen-Orient, Afrique. La prochaine étape sera d'observer si ces capacités régionales parviennent à absorber la demande des grands modèles frontières, dont les coûts d'entraînement continuent de croître exponentiellement.

UELes clouds régionaux NVIDIA permettent aux entreprises et industries réglementées européennes de répondre aux exigences de souveraineté numérique sans dépendre d'infrastructures centralisées aux États-Unis.

InfrastructureActu
1 source
Construire des systèmes multi-agents LangGraph serverless et scalables sur AWS avec Amazon Bedrock AgentCore
504AWS ML Blog 

Construire des systèmes multi-agents LangGraph serverless et scalables sur AWS avec Amazon Bedrock AgentCore

Amazon Web Services a présenté une architecture de référence pour déployer des systèmes multi-agents d'IA générative à grande échelle sur AWS, en combinant LangGraph, AWS Lambda, AWS Step Functions et les deux nouveaux services Amazon Bedrock AgentCore Memory et AgentCore Observability. L'approche repose sur une infrastructure entièrement serverless : les agents LangGraph sont packagés dans des conteneurs Docker exécutés sur Lambda, ce qui permet une montée en charge automatique sans gestion d'infrastructure. Pour illustrer le concept, AWS décrit un système concret de révision de campagnes marketing orchestrant trois agents spécialisés en parallèle, un agent "persona reviewer" qui évalue la résonance du contenu auprès de différents profils démographiques, un agent "validator" qui vérifie la conformité juridique et les chartes de marque, et un agent "finalizer" qui synthétise les retours en recommandations actionnables. Une interface React permet aux utilisateurs de télécharger leurs documents et de consulter les résultats en temps réel. Ce type d'architecture répond à un problème concret que rencontrent les entreprises en production : les agents IA performants en démo s'effondrent souvent sous la charge réelle, perdent le contexte entre les sessions et restent des boîtes noires difficiles à déboguer. AgentCore Memory résout la question de la mémoire en offrant à la fois un contexte conversationnel à court terme et une base de connaissances persistante entre sessions. AgentCore Observability capture quant à lui chaque invocation avec ses entrées et sorties LLM, la latence, et les métriques de chaîne d'outils sur l'ensemble des composants distribués. Pour les équipes en charge de systèmes critiques, c'est un changement de paradigme : il devient possible d'auditer exactement comment un agent a raisonné, quelle décision il a prise à quelle étape, et pourquoi. Cette publication s'inscrit dans une accélération visible chez AWS pour proposer une pile complète d'IA agentique cloud-native, face à la concurrence de Google (Vertex AI Agents) et Microsoft (Azure AI Foundry). LangGraph, développé par LangChain, s'impose progressivement comme standard de facto pour l'orchestration d'agents grâce à son modèle d'exécution en graphe orienté qui rend le flux de contrôle déterministe, parallélisable et conditionnel. L'intégration native avec Lambda et Step Functions est particulièrement stratégique pour les charges de travail "bursty" typiques des agents IA, où la demande est imprévisible et les coûts d'une infrastructure dédiée permanente seraient prohibitifs. La prochaine étape logique pour AWS sera d'étendre ces patterns à des workflows plus complexes impliquant des boucles de feedback humain et des agents à longue durée de vie, un segment encore largement inexploré en production.

InfrastructureActu
1 source
☕️ Les agences de renseignement américaines à court de puissance de calcul pour leurs IA
505Next INpact 

☕️ Les agences de renseignement américaines à court de puissance de calcul pour leurs IA

La Maison Blanche aurait approuvé une enveloppe de 9 milliards de dollars destinée à doter les agences de renseignement américaines en puces IA de dernière génération, selon des informations rapportées par le New York Times. Ce financement, qui doit encore passer par le Congrès, vise à permettre à la CIA, la NSA et leurs homologues de faire tourner les modèles d'intelligence artificielle les plus récents sur des infrastructures à la hauteur. L'administration Trump aurait par ailleurs déjà redirigé 800 millions de dollars pour accélérer des achats de capacités de calcul en urgence. Parallèlement, la Maison Blanche aurait autorisé la NSA à continuer d'exploiter Mythos, le modèle le plus avancé d'Anthropic, dans le cadre d'un contrat classifié en préparation qui inclurait des restrictions sur le traitement de données concernant des citoyens américains. Les agences américaines se retrouvent dans la même situation que n'importe quel acteur privé : les infrastructures capables d'accueillir les grands modèles d'OpenAI, d'Anthropic ou de Google affichent complet, et les composants les plus puissants, comme les puces Grace Blackwell de NVIDIA, exigent des centres de données dotés de systèmes d'alimentation massifs. Or les réseaux infonuagiques classifiés du gouvernement, dont ceux opérés par AWS, ne peuvent pas être modernisés rapidement. Les agences n'auraient tout simplement pas anticipé les besoins en calcul de ces modèles, et les délais de déploiement restent incompressibles même avec de l'argent disponible. Résultat : les 800 millions déjà mobilisés représentent une goutte d'eau face à l'ampleur des besoins réels, et les 9 milliards supplémentaires n'arriveraient pas immédiatement sur le terrain. Cette situation s'inscrit dans une séquence de tensions entre Washington et les labos d'IA. Le Pentagone avait exigé un accès très large aux modèles avancés d'Anthropic pour ses opérations classifiées, ce qu'Anthropic a refusé, une affaire encore devant les tribunaux. Le DoD a finalement constitué un cercle de fournisseurs IA pour ses opérations secret défense, retenant OpenAI, Google, Microsoft et AWS, mais laissant Anthropic à l'écart, du moins officiellement. Le Pentagone qualifiait même l'entreprise de "risque" pour la chaîne d'approvisionnement et la sécurité nationale, ce qui rend d'autant plus notable la décision d'autoriser la NSA à continuer d'utiliser Mythos. Cette contradiction illustre la difficulté pour les institutions américaines de concilier impératifs de souveraineté numérique, besoins opérationnels croissants en IA, et dépendance inévitable envers quelques entreprises privées qui contrôlent les modèles les plus performants.

UELe retard des agences de renseignement américaines illustre les risques de dépendance envers quelques fournisseurs privés d'IA, un avertissement indirect pour les institutions européennes engagées dans des démarches de souveraineté numérique.

💬 9 milliards pour rattraper un retard que tout le monde voyait venir. Ce qui me frappe, c'est la contradiction : le Pentagone liste officiellement Anthropic comme un "risque sécurité" pour la chaîne d'approvisionnement, et pendant ce temps la NSA continue d'utiliser Mythos via un contrat classifié. Ça dit tout sur ce que vaut la "souveraineté numérique" quand les seuls modèles utilisables sont dans les mains de trois boîtes privées.

InfrastructureOpinion
1 source
Une école voulait filmer des enfants pour entraîner l’IA : les parents pètent les plombs
506Le Big Data 

Une école voulait filmer des enfants pour entraîner l’IA : les parents pètent les plombs

L'Université de Washington a dû abandonner un projet de recherche après une levée de boucliers de parents d'élèves. L'étude prévoyait d'équiper des enseignants de maternelle de caméras embarquées et d'installer des dispositifs fixes dans les salles de classe, afin de capter les interactions quotidiennes entre professeurs et enfants. Ces enregistrements devaient alimenter des modèles d'intelligence artificielle capables d'analyser la qualité pédagogique des échanges en classe. Le dispositif reposait sur un opt-out qui incluait automatiquement tous les enfants, sauf refus explicite des parents. Selon 404 Media, qui a consulté les documents transmis aux familles, les vidéos pouvaient être traitées via des services d'IA hébergés dans le cloud, sans que les entreprises impliquées ni les modèles utilisés ne soient nommément identifiés. Face aux protestations, l'université a confirmé l'arrêt du programme peu après les premières réactions négatives. Les parents ont soulevé des questions concrètes restées sans réponse satisfaisante : que devenait l'image d'un enfant dont la famille refusait de participer, dans une classe où tous les autres élèves étaient filmés ? Les chercheurs promettaient de masquer visages et noms "dans la mesure du possible", une formulation jugée nettement insuffisante. S'y ajoutaient des problèmes d'accessibilité : de nombreuses familles issues de l'immigration ne parlaient pas anglais, et aucun formulaire traduit n'était disponible. Faith Boninger, codirectrice du National Education Policy Center, a également pointé l'opacité du dispositif, notamment l'absence de réponse claire sur qui pouvait accéder aux données, combien de temps elles seraient conservées, et qui finançait réellement la recherche. Un parent interrogé anonymement par 404 Media résumait l'inquiétude collective : "Je suis troublé par l'idée que l'image de mon enfant soit utilisée dans des outils d'IA inconnus." Cet incident s'inscrit dans un mouvement de fond : l'IA s'impose rapidement dans l'éducation, portée par des investissements massifs d'entreprises comme OpenAI, Anthropic et Microsoft, qui multiplient partenariats universitaires et accès gratuits aux outils génératifs pour les étudiants et enseignants. Mais développer des modèles spécialisés dans l'éducation nécessite des volumes considérables de données réelles, et c'est précisément là que le bât blesse. Les établissements scolaires, qui accueillent des mineurs dans un cadre légalement protégé, deviennent des terrains convoités pour la collecte de données d'entraînement. L'échec du projet de l'Université de Washington illustre la tension croissante entre les besoins de l'industrie IA et les droits fondamentaux des familles, en particulier autour du consentement éclairé. À mesure que ces projets se multiplient, la gouvernance des données issues des environnements scolaires ne peut plus être reléguée en note de bas de page d'un formulaire incompréhensible.

UELe RGPD impose en Europe un consentement explicite pour le traitement des données de mineurs, rendant un dispositif d'opt-out similaire illégal, mais l'incident souligne la vigilance nécessaire face aux projets de recherche en IA dans les établissements scolaires européens.

ÉthiqueOpinion
1 source
MatterSim : vers une IA pour les matériaux plus rapide, multi-tâches et orientée synthèse expérimentale
507Microsoft Research 

MatterSim : vers une IA pour les matériaux plus rapide, multi-tâches et orientée synthèse expérimentale

Microsoft Research a annoncé plusieurs avancées majeures autour de MatterSim, son modèle d'intelligence artificielle dédié à la simulation des matériaux. L'équipe a d'abord validé expérimentalement une prédiction du modèle : le phosphure de tantale tétragonal (TaP) a été synthétisé en laboratoire et sa conductivité thermique mesurée à 152 W/m/K, une valeur proche de celle du silicium. Ce résultat confirme la fiabilité de MatterSim-v1, qui avait identifié ce matériau après avoir passé en revue plus de 240 000 candidats. Ces travaux ont été menés en collaboration avec l'Université du Texas à Dallas, l'Université de l'Illinois à Urbana-Champaign et l'Université de Californie à Davis. En parallèle, l'équipe a accéléré l'inférence du modèle de trois à cinq fois et l'a intégré au logiciel de simulation LAMMPS, autorisant des calculs à grande échelle sur plusieurs GPU simultanément. Microsoft lance également MatterSim-MT, un modèle de fondation multi-tâches capable de simuler des phénomènes impliquant plusieurs propriétés complexes que les approches classiques de surfaces d'énergie potentielle ne peuvent pas capturer seules. La conception de nouveaux matériaux sous-tend des pans entiers de l'innovation technologique, de la nanoélectronique au stockage d'énergie, mais les cycles de développement restent longs et onéreux. Les potentiels interatomiques par apprentissage automatique comme MatterSim visent à transformer ce paradigme : ils opèrent des ordres de grandeur plus vite que les simulations ab initio traditionnelles, ramenant des calculs autrefois prohibitifs à quelques heures de traitement. La validation du TaP illustre concrètement ce gain : au lieu de mois d'exploration empirique en laboratoire, MatterSim a permis de cibler un candidat à haute conductivité thermique parmi un quart de million de matériaux avant même toute synthèse. Les matériaux conducteurs de chaleur jouent un rôle critique dans la gestion thermique des processeurs, de l'électronique de puissance et des technologies aérospatiales. Disposer d'outils prédictifs fiables à cette échelle pourrait donc accélérer substantiellement le développement de composants de nouvelle génération. MatterSim-v1 avait été lancé par Microsoft Research et s'était rapidement imposé dans la communauté des sciences des matériaux grâce à sa capacité à simuler les matériaux dans des conditions réalistes, y compris à température et pression variables. Le nouveau modèle multi-tâches MatterSim-MT s'inscrit dans une tendance de fond : l'émergence de modèles de fondation couvrant un spectre de propriétés toujours plus large, au-delà de la simple stabilité structurelle. Microsoft n'est pas seul dans cette course : Google DeepMind avec GNoME et Meta avec ses outils FAIR-Chem développent des approches comparables. L'IA pour la découverte de matériaux attire des investissements croissants, portée par les besoins de l'industrie des semi-conducteurs, de la transition énergétique et de l'électronique avancée. Les prochaines étapes pour MatterSim passeront vraisemblablement par l'extension à de nouvelles propriétés simulables et une intégration plus étroite dans les workflows expérimentaux des laboratoires partenaires.

RecherchePaper
1 source
Le capital, et non la puissance de calcul, est le vrai goulet d'étranglement de l'IA
508The Information AI 

Le capital, et non la puissance de calcul, est le vrai goulet d'étranglement de l'IA

L'explosion de la demande en infrastructure IA a déclenché l'un des cycles d'investissement les plus colossaux de l'histoire moderne. Jensen Huang, PDG de Nvidia, estime qu'un gigawatt de capacité de calcul peut coûter jusqu'à 50 milliards de dollars. McKinsey projette que la demande mondiale en centres de données pourrait atteindre 156 gigawatts d'ici 2030, ce qui porterait l'investissement total nécessaire à près de 7 000 milliards de dollars. Lors d'un récent panel organisé par The Information, trois dirigeants du secteur ont dressé un constat convergent : ce n'est pas le manque de GPU qui freine le déploiement de l'IA, mais bien le capital. Charles Fisher, directeur financier de Lambda, Marc Boroditsky, directeur commercial de Nebius, et Nick Robbins, vice-président développement chez CoreWeave, ont tous pointé la même tension : les GPU sont disponibles aujourd'hui, mais les infrastructures nécessaires pour les déployer à grande échelle prennent des années à financer et à construire. Ce goulot d'étranglement financier tient en partie à des idées reçues persistantes dans le monde bancaire. Les prêteurs rechignent à financer des actifs dont la durée de vie estimée est de six ans seulement, contre plusieurs décennies pour les réseaux câblés. Ils supposent également que la demande se concentre sur une poignée de géants du cloud, ignorant la réalité du marché. Lambda compte plus de 10 000 clients sur son cloud public, représentant environ un tiers de ses revenus, avec des comportements d'abonnement très fidèles. Chez CoreWeave, Robbins souligne que les anciens GPU Nvidia V100 et A100 continuent de générer des rendements solides bien au-delà de leur durée de vie théorique. Les contrats fermes avec des clients solvables restent le principal levier pour débloquer des financements : Nebius a ainsi conclu un accord plurimilliardaire avec Meta Platforms qui garantit l'absorption des GPU non vendus, permettant à Nebius d'utiliser la solidité financière de Meta comme caution implicite. Le vrai défi n'est donc pas tant financier que logistique. Fisher parle d'un problème de "chorégraphie" : la demande des clients se matérialise bien plus vite que la construction des centres de données ne peut suivre. Nebius répond à cette contrainte en menant tous les chantiers simultanément, sécurisant les terrains, générant la demande et levant le capital en parallèle. Au-delà des hyperscalers comme Microsoft, Google ou Amazon, qui captent l'essentiel de l'attention médiatique, la prochaine vague de croissance proviendrait de startups IA en forte croissance et de l'adoption enterprise. Des entreprises comme Cursor ou Harvey sont citées comme signaux avant-coureurs d'un marché qui dépasse largement les seuls géants technologiques, et dont le financement structuré reste encore à inventer.

InfrastructureOpinion
1 source
Google met fin au projet Mariner
509The Verge AI 

Google met fin au projet Mariner

Google a officiellement mis fin à Project Mariner le 4 mai 2026. Ce projet expérimental, dévoilé en décembre 2024, permettait à une intelligence artificielle d'effectuer des tâches autonomes sur le web au nom de l'utilisateur, comme naviguer sur des sites, remplir des formulaires ou rechercher des informations. La page d'accueil du projet affiche désormais un message d'adieu : "Merci d'avoir utilisé Project Mariner. Il a été arrêté le 4 mai 2026 et sa technologie a voyagé vers d'autres produits Google." L'information a d'abord été rapportée par Wired. La fermeture ne signifie pas que la technologie disparaît : Google indique clairement que les avancées de Mariner ont été intégrées à d'autres outils, notamment Gemini Agent. Cette décision illustre une tendance forte chez les grandes plateformes, qui absorbent leurs expérimentations dans leurs produits grand public plutôt que de les maintenir comme projets isolés. Pour les utilisateurs, cela signifie que les capacités agentiques testées dans Mariner, comme l'exécution de jusqu'à dix tâches simultanées annoncée lors d'une mise à jour intermédiaire, pourraient se retrouver dans des produits plus larges et mieux intégrés. Project Mariner s'inscrivait dans la course que se livrent Google, OpenAI, Microsoft et Anthropic autour des agents IA capables d'agir de manière autonome sur ordinateur et sur le web. Lancé dans un contexte de forte compétition avec des outils comme Operator d'OpenAI ou Claude Computer Use d'Anthropic, Mariner n'a existé que dix-sept mois en tant que projet distinct. Sa dissolution dans l'écosystème Gemini suggère que Google mise désormais sur une approche unifiée plutôt que sur des expériences en silo.

OutilsActu
1 source
Des data centers IA flottants alimentés par les vagues de l'océan : la Silicon Valley mise sur cette piste
510Ars Technica AI 

Des data centers IA flottants alimentés par les vagues de l'océan : la Silicon Valley mise sur cette piste

Des investisseurs de la Silicon Valley, dont Peter Thiel, cofondateur de Palantir, ont misé des centaines de millions de dollars sur un concept inédit : des centres de données flottants alimentés par l'énergie des vagues océaniques. Le dernier tour de financement, d'un montant de 140 millions de dollars annoncé le 4 mai, doit permettre à la startup Panthalassa de finaliser une installation pilote de fabrication près de Portland, en Oregon, et d'accélérer le déploiement de ses "nœuds" marins. Ces plateformes flottantes captent l'énergie des vagues pour alimenter directement des puces d'intelligence artificielle embarquées, puis transmettent les résultats des modèles, sous forme de tokens d'inférence, aux clients via liaison satellite, sans jamais passer par un data center terrestre. L'enjeu est de taille : ce modèle transforme un problème de transport d'énergie en un problème de transport de données, une substitution potentiellement décisive. Comme l'explique Benjamin Lee, ingénieur et architecte informatique à l'Université de Pennsylvanie, "réaliser du calcul IA sur l'océan nécessite de transférer les modèles vers les nœuds en mer, puis de répondre aux requêtes". Concrètement, cela signifie que les opérateurs n'auraient plus besoin de construire des lignes à haute tension ni de négocier l'accès au réseau électrique terrestre, deux obstacles majeurs qui ralentissent actuellement le déploiement de l'infrastructure IA à grande échelle. Cette initiative émerge dans un contexte où les géants de la tech font face à des difficultés croissantes pour implanter des data centers sur la terre ferme : contraintes foncières, pénuries énergétiques locales, délais de raccordement au réseau et oppositions réglementaires freinent les projets de Microsoft, Google ou Amazon. Le secteur cherche des alternatives radicales, qu'il s'agisse de l'énergie nucléaire modulaire ou, désormais, de l'offshore. Panthalassa devra encore démontrer la fiabilité de ses nœuds face aux conditions marines extrêmes, la latence acceptable pour les cas d'usage IA, et la viabilité économique à grande échelle, autant de défis techniques que le pilote de Portland sera chargé de valider.

InfrastructureActu
1 source
Interdiction de Doom, meme coins et 7 autres faits marquants du procès Musk contre OpenAI
511The Information AI 

Interdiction de Doom, meme coins et 7 autres faits marquants du procès Musk contre OpenAI

Le procès opposant Elon Musk à OpenAI a tenu toutes ses promesses lors de sa première semaine d'audiences au tribunal fédéral de San Francisco. Musk a témoigné sous un contre-interrogatoire musclé mené par l'avocat d'OpenAI, Bill Savitt, vétéran du barreau. Les échanges ont été tendus : Musk a accusé Savitt de vouloir le "piéger" avec ses questions, les comparant à des formulations rhétoriques manipulatrices, avant d'être rappelé à l'ordre par la juge Yvonne Gonzalez Rogers. Sam Altman et Greg Brockman, cofondateur d'OpenAI, ont suivi les débats depuis les tribunes du public, Brockman devant témoigner la semaine suivante. Dehors, des étudiants de Stanford et des journalistes faisaient la queue dès 5 heures du matin pour obtenir une place, certains se retrouvant finalement assis par terre dans une salle de débordement. L'un des moments les plus révélateurs de la semaine concerne les jurés eux-mêmes. Les neuf personnes appelées à trancher l'avenir d'OpenAI ne sont pas des initiés de la tech : parmi eux, un soignant, une infirmière, un peintre et un ancien responsable de programme chez Lockheed Martin. Fait saisissant, deux d'entre eux déclarent ne pas utiliser l'IA, deux la trouvent utile au travail, et deux autres estiment qu'elle leur fait perdre du temps car ils doivent systématiquement vérifier ses résultats. Cette composition illustre le fossé qui sépare encore l'industrie de l'intelligence artificielle du grand public. Sur le fond, Musk a appuyé une partie de son témoignage sur un article de The Information publié en 2022, révélant l'investissement de 10 milliards de dollars de Microsoft dans ChatGPT, qu'il a présenté comme la preuve d'un "bait and switch" orchestré par Altman. Ce procès s'inscrit dans une rupture profonde entre deux figures fondatrices de l'IA générative. Musk, cofondateur d'OpenAI en 2015, a quitté le conseil d'administration en 2018 avant de lancer sa propre entreprise, xAI, en 2023. Il reproche à OpenAI d'avoir trahi sa mission non-lucrative en se rapprochant de Microsoft et en orientant ses activités vers le profit. Pour trancher, la juge Gonzalez Rogers dirige les débats avec une fermeté remarquée, imposant notamment une trêve sur les réseaux sociaux aux trois protagonistes principaux, pourtant habitués des publications quotidiennes. La presse spécialisée américaine compare déjà l'atmosphère à celle d'un procès people, une comparaison qui en dit long sur la place qu'occupent désormais ces batailles juridiques dans la culture technologique américaine.

💬 Ce qui me frappe dans ce procès, c'est pas le show Musk (prévisible), c'est la composition du jury : une infirmière, un peintre, des gens qui trouvent l'IA chiante parce qu'ils doivent tout revérifier. Ce sont eux qui vont trancher l'avenir d'OpenAI, et franchement, c'est presque poétique. L'industrie jugée par ceux qu'elle n'a pas encore convaincus.

RégulationReglementation
1 source
L'« AI co-clinician » de Google DeepMind devance GPT-5.4 aux tests en aveugle, mais reste derrière les médecins expérimentés
512The Decoder 

L'« AI co-clinician » de Google DeepMind devance GPT-5.4 aux tests en aveugle, mais reste derrière les médecins expérimentés

Google DeepMind développe un système d'intelligence artificielle baptisé "AI co-clinician", conçu pour assister les médecins dans la prise en charge des patients. Selon une étude publiée par le laboratoire de recherche d'Alphabet, ce modèle surpasse GPT-5.4 d'OpenAI lors de tests en aveugle réalisés par des médecins, où les évaluateurs ne savaient pas quelle IA produisait quelle réponse. Malgré ces résultats encourageants obtenus dans des environnements simulés, le système reste en deçà des performances des médecins expérimentés en exercice. Cette recherche illustre à la fois les progrès réels de l'IA médicale et ses limites persistantes. Qu'un modèle de Google surpasse GPT-5.4 dans un contexte clinique simulé est significatif : cela montre que des architectures spécialisées, entraînées sur des données médicales, peuvent dépasser des modèles généralistes de dernière génération. Mais l'écart qui subsiste avec les cliniciens humains rappelle que la médecine exige un niveau de fiabilité et de nuance que les systèmes actuels n'atteignent pas encore. L'étude souligne également que le mode vocal de ChatGPT n'est pas adapté à des tâches sérieuses, et certainement pas aux consultations médicales. La course à l'IA médicale implique désormais les plus grands acteurs technologiques mondiaux, avec Google, Microsoft et plusieurs startups spécialisées en compétition directe. L'idée d'un "co-clinicien" artificiel, qui seconderait le médecin sans le remplacer, représente une approche volontairement prudente, cherchant à contourner les résistances réglementaires et éthiques. Ces travaux de DeepMind s'inscrivent dans une trajectoire où l'IA pourrait d'abord s'imposer comme outil d'aide à la décision avant toute autonomie clinique.

UELes systèmes d'aide à la décision clinique étant classés à haut risque par l'AI Act européen, ces résultats accélèrent la pression réglementaire sur les éditeurs de logiciels médicaux et les hôpitaux en France et en Europe.

💬 DeepMind bat GPT-5.4 en aveugle sur des cas cliniques, et c'est là que c'est intéressant : un modèle spécialisé qui dépasse le généraliste de dernière génération, ça prouve que la spécialisation a encore de l'avenir. Rester derrière les médecins expérimentés, c'est pas une surprise, c'est même rassurant que personne ne le cache. "Co-clinicien" plutôt que "diagnostic AI", c'est le choix de vocabulaire qui permet de déployer sans déclencher l'AI Act.

RecherchePaper
1 source
Configurer Amazon Bedrock AgentCore Gateway pour un accès sécurisé aux ressources privées
513AWS ML Blog 

Configurer Amazon Bedrock AgentCore Gateway pour un accès sécurisé aux ressources privées

Amazon a dévoilé une nouvelle fonctionnalité pour son service Bedrock AgentCore Gateway : la connectivité VPC gérée, qui permet aux agents d'intelligence artificielle d'accéder à des ressources privées hébergées derrière des réseaux Amazon Virtual Private Cloud (VPC) sans exposer le trafic sur l'internet public. Concrètement, ce mécanisme repose sur un composant appelé Resource Gateway, qui provisionne automatiquement des interfaces réseau élastiques (ENI) directement à l'intérieur du VPC cible, à raison d'une interface par sous-réseau. Deux modes de fonctionnement sont proposés : le mode managé, où AgentCore prend en charge l'intégralité de l'infrastructure réseau à partir des identifiants VPC, de sous-réseau et des groupes de sécurité fournis par l'utilisateur ; et le mode auto-géré, qui laisse davantage de contrôle à l'équipe technique. Trois scénarios pratiques illustrent ces cas d'usage : la connexion à un endpoint privé Amazon API Gateway, l'intégration avec un serveur MCP (Model Context Protocol) hébergé sur Amazon Elastic Kubernetes Service (EKS), et l'accès à une API REST privée dans un réseau isolé. Pour les équipes qui déploient des agents IA en production, cette capacité représente un gain opérationnel significatif. Jusqu'ici, chaque chemin de connexion entre un agent et un outil interne (base de données, API métier, microservice) nécessitait une configuration réseau manuelle, ralentissant les déploiements et multipliant les risques de mauvais paramétrage. Avec AgentCore Gateway VPC egress, une Resource Configuration délimite précisément l'endpoint accessible, un nom de domaine ou une adresse IP, plutôt que d'ouvrir l'accès à l'ensemble du VPC. La Service Network Resource Association, créée et gérée automatiquement par AgentCore, connecte ensuite cette configuration au réseau de service, ce qui permet à l'agent d'invoquer l'endpoint privé de façon sécurisée et traçable. Pour les organisations avec des architectures multi-VPC ou hybrides, le service s'intègre nativement avec AWS Transit Gateway et le VPC peering inter-régions. Cette annonce s'inscrit dans la stratégie plus large d'Amazon pour rendre ses agents IA exploitables dans des environnements d'entreprise contraints, où la sécurité réseau et la conformité interdisent tout transit par l'internet public. Bedrock AgentCore est la couche d'infrastructure d'Amazon dédiée à l'orchestration et au déploiement d'agents autonomes en production, concurrençant directement les offres de Microsoft Azure AI Foundry et Google Vertex AI Agent Builder. La prise en charge du protocole MCP, standard ouvert porté par Anthropic pour connecter les agents à des outils externes, signale une convergence de l'écosystème autour d'interfaces interopérables. À mesure que les agents IA migrent du prototype vers le système critique, la capacité à les brancher sur des ressources internes sans compromettre le périmètre de sécurité devient un prérequis incontournable pour les DSI, ce qu'Amazon positionne désormais comme une fonctionnalité de première classe.

UELes organisations européennes soumises au RGPD déployant des agents IA peuvent exploiter cette connectivité VPC privée pour maintenir leurs données internes hors de l'internet public, facilitant ainsi la conformité réglementaire.

InfrastructureTuto
1 source
Box Automate : la fin des tâches répétitives en entreprise
514Le Big Data 

Box Automate : la fin des tâches répétitives en entreprise

Box a lancé Box Automate, une nouvelle solution d'automatisation intégrée à sa plateforme de gestion de contenu, avec pour ambition de transformer les documents statiques en déclencheurs d'actions autonomes. Développée en collaboration avec les modèles d'OpenAI, d'Anthropic et de Google, la solution repose sur un éditeur no-code basé sur le glisser-déposer, permettant à n'importe quel responsable de service de concevoir des flux de travail automatisés sans intervention du département informatique. Le système orchestre des agents IA spécialisés qui analysent le contenu des fichiers, extraient les métadonnées pertinentes et n'impliquent un humain que pour les décisions critiques. Parmi les premiers déploiements notables, Samsung utilise déjà l'outil pour automatiser l'onboarding de ses nouvelles recrues, en connectant des systèmes RH comme Workday et Greenhouse à Box DocGen pour générer des documents personnalisés en temps réel. L'enjeu central de Box Automate est de réduire drastiquement le délai entre la réception d'un document et l'action qui en découle, un goulot d'étranglement chronique dans la majorité des organisations. Les applications couvrent des fonctions très diverses : les services juridiques peuvent automatiser l'évaluation des risques contractuels, les équipes crédit croiser automatiquement les pièces justificatives pour instruire des dossiers de prêt, et les agences de recherche piloter la conformité de leurs rapports techniques. Aaron Levie, PDG de Box, positionne explicitement cette capacité d'automatisation du quotidien comme le véritable retour sur investissement de l'IA en entreprise, au-delà des usages ponctuels ou expérimentaux. Pour les utilisateurs finaux, le gain est immédiat : des traitements qui prenaient plusieurs jours peuvent désormais s'effectuer en quelques minutes. Box s'inscrit dans une tendance de fond qui voit les plateformes de gestion documentaire muer en véritables orchestrateurs de processus métier. Face à des concurrents comme Microsoft SharePoint ou Google Workspace qui intègrent eux aussi des couches d'automatisation IA, Box mise sur la flexibilité architecturale et la neutralité vis-à-vis des fournisseurs de modèles pour se différencier. Le choix d'une architecture ouverte, compatible avec plusieurs grands LLMs, permet à ses clients de bénéficier des avancées technologiques sans reconstruire leurs workflows internes. La commercialisation est déjà effective, avec une offre graduée selon les licences : les versions Business couvrent l'automatisation de base, tandis que l'Enterprise Advanced donne accès à l'orchestration complète par agents IA via Box AI Studio. La prochaine étape sera d'observer si ces promesses d'automatisation tiennent à l'échelle dans des environnements complexes, notamment sur les questions de gouvernance et de traçabilité des décisions prises par les agents.

UELes entreprises européennes utilisant Box peuvent automatiser leurs flux documentaires sans compétences techniques, mais devront évaluer la conformité RGPD des traitements automatisés par agents IA.

OutilsOutil
1 source
Plus besoin de bosser vos fichiers : Gemini crée des documents en quelques secondes
515Le Big Data 

Plus besoin de bosser vos fichiers : Gemini crée des documents en quelques secondes

Google a annoncé le 29 avril 2026 une nouvelle fonctionnalité pour son assistant Gemini : la génération directe de fichiers téléchargeables depuis l'interface de chat. Les utilisateurs peuvent désormais demander à Gemini de produire des documents Word, des feuilles Excel, des PDF et d'autres formats compatibles avec Google Workspace ou Microsoft Office, sans quitter la conversation. Il suffit de décrire son besoin en langage naturel, un rapport client, un CV, un tableau de données, et l'IA génère le fichier complet en quelques secondes, structuré et prêt à l'emploi. Aucun modèle à importer, aucune manipulation préalable requise. La fonctionnalité a été présentée par le compte officiel @GeminiApp sur X, accompagnée d'une vidéo montrant la création simultanée de plusieurs fichiers à partir d'une seule requête. Ce changement supprime une friction majeure dans les flux de travail quotidiens : le copier-coller entre Gemini et un logiciel de bureautique. Pour les professionnels qui utilisent l'IA comme outil de production, rédaction de rapports, construction de tableaux de bord, préparation de présentations, le gain de temps est substantiel. Ce qui prenait auparavant plusieurs logiciels et une série d'allers-retours se centralise désormais en un seul point de saisie. L'impact touche aussi bien les indépendants que les équipes en entreprise, notamment pour les tâches répétitives à faible valeur ajoutée. La nuance tient cependant à la qualité : générer vite ne garantit pas générer juste. Sans relecture humaine, les documents produits peuvent manquer de précision ou de pertinence contextuelle, en particulier pour des livrables destinés à des clients ou des décideurs. Cette annonce s'inscrit dans une tendance de fond chez les grands acteurs de l'IA générative : transformer les assistants conversationnels en outils de production à part entière, capables de remplacer non seulement la réflexion mais aussi l'exécution technique. Microsoft intègre Copilot directement dans Office depuis 2023, OpenAI pousse ses Canvas et ses outils de génération de contenu, et Google accélère l'intégration de Gemini dans Workspace. La bataille se joue désormais sur le terrain de la productivité concrète, mesurable en heures économisées par semaine. Pour Google, cette fonctionnalité renforce la position de Gemini face à ses concurrents directs, notamment ChatGPT et Copilot, sur le marché des assistants professionnels. Les suites logicielles traditionnelles comme Microsoft 365 ou Google Docs ne disparaissent pas pour autant, mais leur rôle évolue : de point d'entrée, elles deviennent potentiellement un simple format de sortie.

UELes professionnels français et européens peuvent immédiatement tester cette fonctionnalité pour réduire le temps consacré à la production documentaire bureautique.

OutilsOutil
1 source
[AINews] Rien de notable aujourd'hui
516Latent Space 

[AINews] Rien de notable aujourd'hui

La journée du 27-28 avril 2026 n'a pas produit de séisme dans l'industrie de l'IA, mais plusieurs sorties de modèles méritent attention. NVIDIA a lancé Nemotron 3 Nano Omni, un modèle multimodal open-source de 30 milliards de paramètres actifs (3B actifs, architecture MoE) capable de traiter texte, images, vidéo, audio et documents, avec une fenêtre de contexte de 256 000 tokens orientée vers les usages agentiques. Sa distribution a été immédiate : OpenRouter, LM Studio, Ollama, Fireworks, Together et une dizaine d'autres plateformes ont annoncé sa disponibilité le jour même. Le modèle intègre un encodeur audio Parakeet, fonctionne pour l'instant uniquement en anglais, et affiche un taux d'erreur de 5,95 % sur le benchmark Open ASR, avec un débit annoncé neuf fois supérieur à des modèles omni comparables. Du côté de Poolside, la startup a publié son premier modèle public, Laguna XS.2, un modèle de code MoE de 33 milliards de paramètres totaux (3B actifs) entraîné intégralement en interne, distribué sous licence Apache 2.0, et conçu pour tourner sur un seul GPU. Microsoft, de son côté, a sorti TRELLIS.2, un modèle open-source de 4 milliards de paramètres pour la génération de scènes 3D texturées à partir d'images, avec une résolution allant jusqu'à 1536 cubes et une compression spatiale 16x. Ces sorties illustrent une tendance de fond : la compétition sur l'efficacité d'inférence s'intensifie, et les acteurs cherchent à démocratiser des capacités avancées sur du matériel accessible. Que Poolside publie un modèle de code haute performance tournant sur un seul GPU, ou que NVIDIA intègre audio et vidéo dans un modèle ouvert, le message est clair : les capacités multimodales et agentiques descendent rapidement vers des configurations matérielles grand public. Pour les développeurs et les entreprises, cela signifie des coûts d'infrastructure moindres pour déployer des agents capables de comprendre des documents complexes ou de générer des assets 3D. En parallèle, l'infrastructure d'inférence connaît sa propre effervescence. La version 0.20.0 de vLLM, framework open-source de référence pour servir les grands modèles, embarque un cache KV 2 bits (TurboQuant) offrant quatre fois plus de capacité, ainsi qu'une amélioration de latence de 2,1 % grâce à une fusion d'opérations. Les benchmarks publiés par SemiAnalysis sur les puces B300 de NVIDIA indiquent un débit jusqu'à huit fois supérieur à celui des H200 pour des charges DeepSeek V4 Pro. Dans ce contexte, des voix techniques soulignent que DeepSeek s'éloigne progressivement de la dépendance exclusive à CUDA via ses TileKernels, ouvrant la voie à des déploiements sur accélérateurs hétérogènes, y compris des puces non-NVIDIA. Les prochaines semaines devraient confirmer si GPT-6, dont le buzz commence à monter, reconfigurera à nouveau les priorités de l'écosystème.

UELes modèles open-source publiés ce jour (Nemotron 3 Nano Omni, Laguna XS.2, TRELLIS.2) sont immédiatement accessibles aux développeurs et entreprises européennes via Ollama, Hugging Face et autres plateformes, réduisant les coûts d'infrastructure pour déployer des agents multimodaux sur du matériel grand public.

LLMsActu
1 source
Elon Musk témoigne au procès contre OpenAI
517The Verge 

Elon Musk témoigne au procès contre OpenAI

Elon Musk a pris la barre des témoins dans le procès qu'il a intenté contre Sam Altman, PDG d'OpenAI, et Greg Brockman, président de la société. Les trois hommes faisaient partie de l'équipe fondatrice originale d'OpenAI, Musk ayant investi jusqu'à 38 millions de dollars dans les premières années. Les tensions sont nées de désaccords profonds sur la structure et la mission de l'organisation, notamment sur la question d'intégrer OpenAI à Tesla. Musk a finalement quitté l'organisation, avant de fonder xAI, son propre concurrent direct, aujourd'hui détenu par SpaceX. Ce procès est l'un des plus médiatisés de l'industrie technologique, mettant face à face deux des figures les plus influentes de l'intelligence artificielle. Musk a déposé pas moins de quatre poursuites distinctes contre OpenAI, signalant une guerre juridique qui pourrait peser sur la gouvernance future des entreprises d'IA. Au coeur du litige se trouvent des questions fondamentales : une organisation à but non lucratif peut-elle légitimement se muer en entreprise commerciale, et quelles obligations les fondateurs ont-ils envers leur mission initiale ? La relation entre Musk et Altman s'est dégradée progressivement après le départ de Musk du conseil d'administration d'OpenAI en 2018. Depuis lors, OpenAI a levé des milliards de dollars, notamment auprès de Microsoft, et a entamé une transformation vers un statut à but lucratif que Musk présente comme une trahison de la mission originelle. Parallèlement, xAI concurrence directement OpenAI sur le marché des grands modèles de langage, ce qui donne à ce procès une dimension à la fois personnelle, idéologique et commerciale.

UECe procès pourrait établir un précédent juridique sur la légitimité de la transformation d'une organisation à but non lucratif en entreprise commerciale, une question pertinente pour la gouvernance des structures d'IA opérant en Europe.

Amazon Quick Flows automatise les tâches répétitives
518AWS ML Blog 

Amazon Quick Flows automatise les tâches répétitives

Amazon a lancé Quick Flows, une fonctionnalité d'automatisation des flux de travail intégrée à sa suite Amazon Quick, qui permet de créer des automatisations intelligentes en langage naturel, sans écrire une seule ligne de code ni posséder la moindre expertise en machine learning. Le principe est simple : l'utilisateur décrit en quelques phrases ce qu'il souhaite automatiser, et le système génère automatiquement le flux correspondant. Amazon illustre l'outil avec deux cas d'usage concrets : un analyseur de performance financière, capable de collecter en temps réel des cours boursiers, des ratios clés (PER, capitalisation boursière, revenus), des titres d'actualité financière et des recommandations d'analystes à partir d'un simple nom d'entreprise ou d'un ticker symbol, ainsi qu'un système d'automatisation de l'onboarding des employés. Quick Flows s'inscrit dans la suite Amazon Quick, un ensemble de fonctionnalités d'IA permettant d'analyser des données et d'obtenir des insights via des conversations en langage naturel. La seule condition d'accès est de disposer d'un compte AWS actif avec Amazon Quick activé. L'enjeu de productivité est considérable. Une tâche aussi banale que la compilation d'un rapport hebdomadaire, qui exige de copier manuellement des données depuis plusieurs systèmes puis de les reformater pour différents interlocuteurs, peut absorber plusieurs heures chaque lundi. Multipliée sur l'ensemble d'une équipe, la perte de temps devient structurelle. Quick Flows vise à libérer ces heures au profit de travaux à plus forte valeur ajoutée. En rendant l'automatisation accessible à des profils non techniques, c'est potentiellement l'ensemble des fonctions support, finance, RH ou opérations qui peuvent reconfigurer leurs processus sans dépendre d'une équipe d'ingénieurs. La capacité à partager des flux créés avec d'autres membres d'une équipe renforce encore la dimension collaborative et l'impact organisationnel de l'outil. Cette annonce s'inscrit dans la compétition intense que se livrent les grands acteurs du cloud pour proposer des couches d'automatisation basées sur l'IA générative. Microsoft, avec Power Automate et Copilot Studio, et Google, avec ses Workspace Flows, ont déjà pris position sur ce segment. Amazon répond avec une approche centrée sur l'interface conversationnelle et l'intégration native à l'écosystème AWS. Quick Flows permet également de convertir une conversation existante avec un agent de chat en flux automatisé, ce qui réduit encore la friction à l'adoption. La génération de contenu par l'IA restant par nature variable, Amazon prévient explicitement que les résultats peuvent différer d'une exécution à l'autre. La prochaine étape annoncée consiste à passer de l'analyse financière à des automatisations plus complexes comme l'onboarding RH, signal que la plateforme vise des cas d'usage à fort volume de données et d'interactions humaines.

UELes entreprises européennes utilisant AWS peuvent désormais automatiser leurs flux de travail en langage naturel sans compétences techniques, dans un segment où Microsoft et Google proposent déjà des offres concurrentes.

OutilsOutil
1 source
Affaire Musk-OpenAI et résultats des géants tech au programme cette semaine
519The Information AI 

Affaire Musk-OpenAI et résultats des géants tech au programme cette semaine

Cette semaine s'annonce décisive pour la Silicon Valley : Elon Musk et Sam Altman se retrouvent devant un tribunal de Californie pour un procès portant sur les origines d'OpenAI. Le milliardaire conteste les fondements de l'organisation qu'il a lui-même cofondée, réclamant notamment des réparations liées à ce qu'il considère comme une trahison de la mission initiale à but non lucratif de la société. En parallèle, mercredi soir, quatre des plus grandes entreprises technologiques mondiales, Google, Meta Platforms, Microsoft et Amazon, publient simultanément leurs résultats financiers du premier trimestre 2025, quelques minutes d'intervalle seulement après la clôture des marchés. Apple suit le jeudi avec ses propres chiffres trimestriels. L'issue du procès Musk-Altman devrait avoir peu de conséquences directes sur OpenAI et sur son produit phare, ChatGPT. Les chances que Musk obtienne gain de cause sur l'ensemble de ses revendications restent faibles selon les observateurs juridiques, même si une victoire partielle n'est pas exclue. Ce qui est en jeu dépasse le simple différend personnel : le procès soulève des questions fondamentales sur la gouvernance des organisations d'IA, la transformation d'une structure à but non lucratif en entité commerciale valorisée à plusieurs centaines de milliards de dollars, et la responsabilité des fondateurs vis-à-vis de la mission originelle d'une entreprise. La publication quasi simultanée des résultats des quatre géants tech mercredi témoigne de la concentration extrême du pouvoir économique dans ce secteur. Google, Meta, Microsoft et Amazon représentent ensemble une part écrasante des investissements mondiaux dans l'IA, et leurs chiffres trimestriels seront scrutés pour mesurer le retour concret de ces dépenses colossales. Le procès Musk-OpenAI s'inscrit quant à lui dans une série de batailles juridiques et idéologiques autour du contrôle de l'intelligence artificielle générale, un enjeu que plusieurs acteurs, dont Musk avec sa propre société xAI, cherchent à orienter selon des visions radicalement différentes de l'avenir technologique.

UELes résultats financiers des géants tech et l'issue du procès Musk-OpenAI influenceront indirectement les stratégies d'investissement IA en Europe, sans impact direct sur les entreprises ou la réglementation française.

BusinessActu
1 source
Google Cloud propose un nouvel outil pour organiser les données de votre entreprise
520Le Big Data 

Google Cloud propose un nouvel outil pour organiser les données de votre entreprise

Google Cloud a annoncé le 22 avril 2026, lors de son événement Google Cloud Next, le lancement de Knowledge Catalog, un moteur de contexte unifié intégré à sa plateforme Dataplex. L'outil agrège les métadonnées issues de multiples systèmes, aussi bien natifs comme BigQuery que des plateformes tierces, pour créer une source unique de vérité accessible en temps réel. Au-delà du simple inventaire technique, Knowledge Catalog automatise l'enrichissement des données en analysant schémas, requêtes et contenus non structurés pour générer des descriptions en langage naturel, construire des glossaires métiers et cartographier les relations entre entités. Des agents spécialisés, dont un basé sur LookML, permettent de générer et harmoniser automatiquement les règles métier. Des entreprises comme Bloomberg Media exploitent déjà cette approche pour permettre à des utilisateurs non techniques d'interroger des lacs de données complexes via des requêtes en langage courant. Le problème que Google Cloud cherche à résoudre est structurel : les agents d'IA en entreprise produisent des résultats médiocres non pas par manque de puissance de calcul, mais par manque de contexte fiable. Lorsque les mêmes indicateurs coexistent sous plusieurs définitions selon les équipes, l'automatisation devient fragile et l'analyse peu fiable. En unifiant ce socle sémantique, Knowledge Catalog permet aux agents de raisonner sur des bases cohérentes et partagées, réduisant les erreurs d'interprétation et accélérant l'accès à l'information. L'intégration avec Gemini renforce encore ce dispositif : même des fichiers bruts non structurés deviennent exploitables directement dans l'écosystème data. Google introduit également la notion de "produits de données", des ensembles packagés conçus pour être consommés directement par des agents ou des équipes métier, ce qui marque un changement de paradigme dans la façon dont les organisations distribuent l'accès à la donnée. La sortie de Knowledge Catalog s'inscrit dans une course que se livrent les grands fournisseurs cloud pour devenir la couche d'infrastructure de référence des entreprises qui déploient des agents d'IA à grande échelle. Microsoft, avec son écosystème Fabric et ses connecteurs Copilot, et AWS, avec son offre autour de Bedrock et des catalogues de données Lake Formation, avancent sur le même terrain. Le défi commun est de dépasser la promesse technique pour s'imposer comme le standard de gouvernance des données en contexte agentique. Pour Google Cloud, qui dispose d'un avantage compétitif avec Gemini et BigQuery, ce catalogue universel représente un levier pour verrouiller les grands comptes dans son écosystème. La prochaine étape sera d'observer si l'enrichissement automatique tient ses promesses à l'échelle, là où la curation manuelle a toujours montré ses limites.

UELes entreprises européennes déployant des agents IA sur Google Cloud peuvent améliorer la gouvernance de leurs données métier, sans impact réglementaire ou institutionnel spécifique pour la France ou l'UE.

OutilsOutil
1 source
Google Meet va aussi prendre des notes IA pour les réunions en présentiel
521The Verge 

Google Meet va aussi prendre des notes IA pour les réunions en présentiel

Google étend les capacités de son assistant IA Gemini aux réunions en présentiel : la fonction de prise de notes automatique, jusqu'ici réservée aux appels Google Meet, peut désormais générer des résumés et des transcriptions lors de réunions physiques, mais aussi lors de visioconférences Zoom et Microsoft Teams. Cette évolution, révélée par 9to5Google, marque une sortie de la phase alpha où la fonctionnalité était uniquement disponible sur Android pour un groupe restreint d'utilisateurs. Elle est désormais accessible plus largement, sans contrainte de salle de réunion ni de rendez-vous planifié à l'avance. L'impact est significatif pour les professionnels qui alternent entre réunions virtuelles et physiques : Gemini devient un assistant de réunion universel, indépendant du support utilisé. La possibilité de capturer automatiquement les échanges lors d'une discussion informelle dans un couloir ou d'une réunion de dernière minute représente un gain de temps concret. Google précise également qu'un participant distant peut rejoindre une réunion en présentiel en basculant vers un appel vidéo classique. Cette annonce s'inscrit dans une course entre les grands acteurs technologiques pour intégrer l'IA dans les flux de travail quotidiens. Microsoft propose des fonctions similaires via Copilot dans Teams, et plusieurs startups comme Otter.ai ou Fireflies.ai ont bâti leur modèle entier sur la transcription de réunions. En élargissant Gemini au-delà de son propre écosystème, Google adopte une stratégie d'ubiquité visant à fidéliser les utilisateurs professionnels quel que soit leur environnement de collaboration.

UELes professionnels européens utilisant Google Workspace peuvent désormais bénéficier de la prise de notes automatique Gemini dans leurs réunions physiques et sur Zoom ou Teams, sans dépendre d'un outil tiers.

OutilsOutil
1 source
Meta surveille désormais l'activité informatique de ses employés pour entraîner ses agents IA
522The Verge 

Meta surveille désormais l'activité informatique de ses employés pour entraîner ses agents IA

Meta installe en ce moment un outil de surveillance sur les ordinateurs de ses employés basés aux États-Unis, selon une information révélée par Reuters. L'outil, baptisé Model Capability Initiative (MCI), tourne en arrière-plan dans les applications et sites web liés au travail et enregistre les mouvements de souris, les clics, les frappes au clavier ainsi que des captures d'écran ponctuelles. L'objectif affiché par l'entreprise est d'utiliser ces données comportementales pour entraîner ses modèles d'intelligence artificielle à interagir avec les ordinateurs de la même façon que le font les humains au quotidien. Meta précise que les données collectées ne seront pas utilisées à des fins d'évaluation des performances des salariés. Cette initiative s'inscrit dans la course aux agents IA capables d'automatiser des tâches informatiques complexes, remplir des formulaires, naviguer dans des interfaces, exécuter des workflows bureautiques. En capturant directement les gestes réels de travailleurs qualifiés, Meta cherche à constituer un jeu de données d'entraînement à haute valeur, bien plus représentatif que des données synthétiques. Pour les employés concernés, cela soulève des questions concrètes sur la frontière entre contribution au produit et surveillance au travail. La démarche rappelle celle d'autres géants tech qui collectent des données humaines pour affiner leurs systèmes d'automatisation, comme Google ou Microsoft avec leurs outils Copilot. Meta, qui développe activement ses propres agents IA sous l'impulsion de Mark Zuckerberg, considère visiblement ses équipes internes comme un terrain d'entraînement privilégié. Le fait que le programme soit pour l'instant limité aux États-Unis suggère des contraintes légales en Europe, où le RGPD encadre strictement ce type de collecte en milieu professionnel.

UELe RGPD protège directement les salariés européens de Meta contre ce type de surveillance systématique, ce qui explique que le programme soit pour l'instant limité aux États-Unis et soulève des questions sur la conformité des pratiques de collecte de données en milieu professionnel au sein de l'UE.

523The Verge AI 

Google met à jour son mode IA pour ouvrir les liens sans quitter la page

Google enrichit son mode IA dans Chrome avec une nouvelle fonctionnalité permettant d'ouvrir des liens sources directement aux côtés de la conversation, sans quitter la page. Concrètement, lorsqu'un utilisateur clique sur une source citée par l'IA, le site s'affiche en vue partagée, côte à côte avec le chat, plutôt que dans un nouvel onglet. Cette mise à jour s'applique à AI Mode, l'interface de recherche conversationnelle intégrée à Google Search depuis 2025. Ce changement améliore significativement la fluidité du parcours de recherche : l'utilisateur peut désormais consulter la source primaire tout en continuant à poser des questions à l'IA sur le contenu affiché. Pour les professionnels et chercheurs qui jonglent entre sources multiples, cela réduit la friction entre la vérification des faits et l'exploration assistée. Google positionne ainsi AI Mode comme un véritable environnement de travail intégré, pas seulement un moteur de réponses. AI Mode a été lancé l'an dernier comme une surcouche conversationnelle à Google Search, logée dans un panneau latéral. Depuis, Google y a progressivement ajouté des capacités comme la génération d'images de tenues ou de décoration, la visualisation de voyages, et la recherche de réservations de restaurants. Cette nouvelle fonctionnalité s'inscrit dans une course plus large entre Google, Microsoft (Copilot dans Edge) et d'autres acteurs pour transformer le navigateur lui-même en interface d'IA contextuelle, où la frontière entre recherche et navigation s'efface progressivement.

UELes utilisateurs français de Chrome bénéficient directement de cette amélioration de l'interface AI Mode, qui réduit la friction lors de la vérification des sources dans les recherches assistées par IA.

OutilsOutil
1 source
Google lance 'Skills' dans Chrome : des prompts IA réutilisables en actions navigateur en un clic
524MarkTechPost 

Google lance 'Skills' dans Chrome : des prompts IA réutilisables en actions navigateur en un clic

Google a lancé le 14 avril 2026 une nouvelle fonctionnalité baptisée "Skills" dans Chrome, intégrée directement à Gemini in Chrome. Disponible sur Mac, Windows et ChromeOS pour les utilisateurs dont la langue est réglée sur l'anglais américain, cette fonction permet de sauvegarder des invites (prompts) fréquemment utilisées sous forme de workflows réutilisables, activables en un clic. Concrètement, un utilisateur peut créer une "Skill" à partir de son historique de conversation avec Gemini, puis la rappeler à tout moment en tapant "/" ou en cliquant sur le bouton "+" dans l'interface. La Skill s'exécute alors sur la page en cours de consultation, ou simultanément sur plusieurs onglets sélectionnés par l'utilisateur. Google lance également une bibliothèque de Skills préconfigurées couvrant des tâches courantes : décomposer les ingrédients d'un produit consulté en ligne, comparer des spécifications techniques sur plusieurs onglets, ou encore identifier le cadeau idéal en croisant un budget avec les intérêts du destinataire. Ce que cette fonctionnalité résout est plus fondamental qu'il n'y paraît : jusqu'ici, chaque navigation vers une nouvelle page obligeait à ressaisir manuellement la même invite pour effectuer la même opération, que ce soit analyser une recette, comparer des produits ou extraire des informations clés d'un document long. Skills introduit une couche persistante et nommée entre l'utilisateur et le modèle de langage, supprimant cette friction répétitive. La capacité d'exécution multi-onglets est particulièrement significative : elle permet de traiter plusieurs pages simultanément comme un corpus de récupération unifié, un schéma familier aux ingénieurs qui travaillent avec des pipelines de recherche documentaire, mais désormais accessible sans écrire une seule ligne de code. La bibliothèque de Skills préconfigurées étend encore la portée en proposant des modèles prêts à l'emploi, personnalisables selon les besoins. Cette évolution s'inscrit dans une tendance plus large : l'intégration d'agents IA directement au niveau du navigateur, compétition dans laquelle Microsoft (avec Copilot dans Edge) et Apple (avec des fonctionnalités IA dans Safari) sont également engagés. Google avait déjà commencé à tisser Gemini dans Chrome au cours des derniers mois, mais Skills marque un saut qualitatif en introduisant de la gestion de prompts et une forme d'automatisation légère sans passer par des extensions tierces ou des outils comme LangChain. Le concept, bien connu des développeurs travaillant avec des API de modèles de langage, est ici abstrait et livré à des utilisateurs non techniques via une interface navigateur. Les questions de sécurité et de confidentialité restent en suspens, notamment concernant l'accès aux contenus de plusieurs onglets simultanément, un point que Google devra préciser à mesure que le déploiement s'élargit au-delà de l'anglais américain.

UEFonctionnalité actuellement limitée à l'anglais américain, sans déploiement ni impact direct sur le marché français ou européen à ce stade.

525AWS ML Blog 

AWS propose un cadre pratique pour réussir son adoption de l'IA générative

Amazon Web Services a publié un cadre méthodologique baptisé "Generative AI Path-to-Value" (P2V), conçu pour aider les entreprises à transformer leurs projets pilotes d'IA générative en systèmes opérationnels créateurs de valeur durable. Cette initiative intervient alors qu'un nombre croissant d'organisations constatent un écart entre la phase d'expérimentation, souvent prometteuse, et le déploiement en production à grande échelle. Le cadre identifie quatre catégories de blocages récurrents : la valeur (absence de ROI clairement défini et de critères de succès mesurables), le risque (exposition légale, confidentialité des données, conformité réglementaire), la technologie (intégration avec les systèmes existants, qualité des données, observabilité, scalabilité, gestion des coûts cloud) et les ressources humaines (résistance au changement, manque de compétences, redéfinition des rôles). L'enjeu est considérable pour les équipes techniques et les directions métier : sans méthode structurée, la majorité des initiatives d'IA générative restent bloquées entre le prototype et la mise en production, sans jamais produire de bénéfices mesurables. Le cadre P2V repositionne la mise en production non pas comme une finalité, mais comme une étape intermédiaire sur un chemin plus long vers la création de valeur pérenne. Concrètement, cela oblige les organisations à définir des métriques d'évaluation, à constituer des jeux de données de test, à mettre en place un monitoring continu de la qualité, et à intégrer des pratiques FinOps pour maîtriser les coûts d'infrastructure. Pour les utilisateurs finaux et les équipes IT, cela se traduit par des projets mieux gouvernés, des déploiements plus stables et un retour sur investissement plus facile à justifier auprès des décideurs. Ce travail de formalisation s'inscrit dans une dynamique plus large : après l'euphorie des années 2023-2024 marquées par l'explosion des POC, les grandes entreprises entrent dans une phase de maturité où l'accent passe de l'expérimentation à l'industrialisation. AWS n'est pas seul sur ce terrain, Microsoft Azure, Google Cloud et des cabinets de conseil comme McKinsey ou Accenture publient des cadres similaires pour accompagner cette transition. La bataille se joue désormais sur l'adoption en entreprise, et les hyperscalers qui fourniront les meilleures méthodologies d'intégration auront un avantage décisif. La prochaine étape pour AWS sera probablement d'ancrer ce cadre P2V dans ses offres de services managés et de conseil, transformant une publication méthodologique en levier commercial concret.

UELes entreprises européennes utilisant AWS peuvent s'appuyer sur ce cadre méthodologique pour structurer l'industrialisation de leurs projets d'IA générative et mieux justifier leur ROI auprès des décideurs.

OutilsOutil
1 source
Google Chrome introduit "Skills" : des invites IA sauvegardables et réutilisables en un clic
526The Decoder 

Google Chrome introduit "Skills" : des invites IA sauvegardables et réutilisables en un clic

Google intègre une nouvelle fonctionnalité appelée "Skills" dans son navigateur Chrome, permettant aux utilisateurs de sauvegarder des prompts d'intelligence artificielle et de les réutiliser en un seul clic. Concrètement, plutôt que de retaper la même instruction à chaque session, l'utilisateur l'enregistre une fois sous forme de "skill" et peut l'appliquer instantanément sur n'importe quel site web. Google propose également une bibliothèque de skills préconfigurés couvrant des tâches courantes, accessibles directement sans configuration préalable. Cette fonctionnalité réduit considérablement la friction liée à l'utilisation quotidienne de l'IA dans le navigateur. Pour les professionnels qui s'appuient sur des workflows répétitifs, comme résumer des pages, reformuler du texte ou extraire des données, Skills transforme une démarche manuelle en automatisme. Cela positionne Chrome non plus simplement comme un outil de navigation, mais comme une couche d'automatisation IA intégrée au flux de travail, sans passer par des extensions tierces ou des outils externes. Cette évolution s'inscrit dans la stratégie plus large de Google visant à intégrer Gemini au coeur de ses produits grand public. Chrome, avec plus de trois milliards d'utilisateurs actifs, devient un vecteur d'adoption massif pour l'IA générative. Face à la concurrence de Microsoft, qui pousse Copilot dans Edge, Google accélère l'intégration native de capacités IA directement dans le navigateur. Les Skills représentent une première étape vers un navigateur véritablement "augmenté", où l'IA anticipe et automatise les actions répétitives de l'utilisateur.

UEL'intégration native de Gemini dans Chrome via les Skills, sur un navigateur dominant en Europe, pourrait attirer l'attention de la Commission européenne dans le cadre du DMA sur les pratiques de couplage de services.

527MarkTechPost 

Google AI propose Vantage : un protocole basé sur les LLM pour mesurer la collaboration, la créativité et la pensée critique

Des chercheurs de Google Research ont publié un article présentant Vantage, un système d'évaluation basé sur des grands modèles de langage (LLM) conçu pour mesurer trois compétences humaines longtemps considérées comme impossibles à tester à grande échelle : la collaboration, la créativité et la pensée critique. L'étude, conduite auprès de 188 participants âgés de 18 à 25 ans recrutés via la plateforme Prolific, a généré 373 transcriptions de conversations entre humains et groupes d'agents IA. Chaque session durait 30 minutes et impliquait des tâches collaboratives structurées, comme la conception d'une expérience scientifique ou un débat argumenté. Les modèles utilisés sont Gemini 2.5 Pro pour les modules de collaboration et Gemini 3 pour la créativité et la pensée critique. L'apport technique central de Vantage est ce que les chercheurs appellent l'architecture "Executive LLM" : plutôt que de faire fonctionner un agent IA distinct pour chaque participant simulé, un seul LLM orchestre tous les personnages artificiels de la conversation. Ce modèle coordinateur a accès à la rubrique d'évaluation en temps réel et s'en sert activement pour piloter les échanges vers des situations révélatrices. Si la compétence ciblée est la résolution de conflits, l'Executive LLM peut faire exprimer un désaccord par l'un de ses personnages et le maintenir jusqu'à ce que le participant humain réagisse. Les tests ont montré que cette approche surpasse significativement une configuration où des agents indépendants interagissent sans coordination : sans pilotage, les conversations peuvent se dérouler sans jamais créer les conditions nécessaires à l'évaluation d'une compétence donnée. Les scores attribués automatiquement par le système ont atteint un niveau de fiabilité comparable à celui d'experts humains formés à la notation. Ce travail s'attaque à un problème de mesure vieux de plusieurs décennies. Les tests standardisés classiques, comme le PISA 2015 sur la résolution collaborative de problèmes, ont tenté de simuler le travail en groupe via des interfaces à choix multiples avec des coéquipiers scriptés, sacrifiant l'authenticité au profit du contrôle. Les évaluations humaines réelles font l'inverse, mais ne passent pas à l'échelle. Google positionne les LLM comme la première technologie capable de satisfaire simultanément ces deux exigences contradictoires : produire des interactions conversationnelles naturelles tout en maintenant des conditions reproductibles et comparables. Les implications dépassent largement le cadre académique : cette approche pourrait transformer les recrutements en entreprise, les certifications professionnelles ou les outils pédagogiques adaptatifs. Avec des entreprises comme Google, Microsoft et OpenAI qui investissent massivement dans les agents conversationnels, Vantage illustre une nouvelle frontière où les LLM ne servent plus seulement à produire du texte, mais à modéliser et évaluer le comportement humain lui-même.

UECe système d'évaluation automatisée pourrait influencer les pratiques de recrutement et les certifications professionnelles en Europe, ainsi que les outils pédagogiques utilisés dans les systèmes éducatifs européens.

RecherchePaper
1 source
528Frandroid 

Le Nobel de chimie qui dirige l’IA chez Google : « J’aurais préféré guérir le cancer avant de lancer ChatGPT »

Demis Hassabis, PDG de Google DeepMind et lauréat du prix Nobel de chimie 2024 pour ses travaux sur AlphaFold, a exprimé publiquement un regret profond : selon lui, le lancement de ChatGPT par OpenAI en novembre 2022 a précipité l'ensemble de l'industrie dans une course commerciale qui a détourné l'IA de ses applications les plus prometteuses, notamment la recherche médicale et scientifique. Il aurait préféré que les grandes avancées en intelligence artificielle servent d'abord à guérir le cancer ou à résoudre des problèmes biologiques complexes, avant d'être massivement déployées pour automatiser des tâches bureautiques. Cet aveu touche un point sensible : la tension entre IA scientifique et IA commerciale est réelle et structurelle. Les laboratoires comme DeepMind avaient construit leur identité autour de la recherche fondamentale, AlphaFold a prédit la structure de plus de 200 millions de protéines, une révolution pour la biologie. Le pivot brutal vers les assistants conversationnels grand public a redirigé les talents, les financements et l'attention médiatique vers des produits générant des revenus immédiats, au détriment de projets à impact potentiellement transformateur mais à retour plus lent. Hassabis n'est pas le premier à formuler cette critique, mais sa position est singulière : il dirige l'un des laboratoires les plus puissants au monde, intégré à Google, donc lui-même acteur de cette course commerciale. Sa déclaration illustre les contradictions internes d'une industrie tiraillée entre ambitions scientifiques de long terme et pressions concurrentielles immédiates imposées par la montée en puissance d'OpenAI et de Microsoft.

UELe débat soulevé par Hassabis sur la priorité accordée à l'IA scientifique versus commerciale résonne en Europe, où l'AI Act et les institutions européennes cherchent précisément à orienter les développements de l'IA vers des applications à impact sociétal mesurable.

💬 Hassabis a raison sur le fond, mais bon, il dirige Google DeepMind, donc il participe à la même course qu'il dénonce. Ce qui me retient dans cette déclaration, c'est moins le regret que l'aveu implicite : l'industrie sait très bien ce qu'elle sacrifie quand elle court après les revenus. AlphaFold, c'était la promesse que l'IA allait servir à quelque chose de vraiment utile, et on a bifurqué vers des chatbots pour rédiger des mails.

SociétéOpinion
1 source
529Numerama 

L’IA aurait dû rester en laboratoire : le patron de Google DeepMind regrette que ChatGPT soit sorti trop vite

Demis Hassabis, PDG de Google DeepMind et lauréat du prix Nobel de chimie 2024, a exprimé publiquement ses regrets quant à la vitesse à laquelle l'IA générative a été déployée auprès du grand public. Invité du podcast de Cleo Abram, il est revenu sur le choc de novembre 2022 : le lancement de ChatGPT par OpenAI avait alors pris Google complètement par surprise, forçant l'entreprise à accélérer brutalement ses propres calendriers de publication. Hassabis se demande ouvertement si cette course à la commercialisation n'a pas été prématurée. Selon lui, les laboratoires de recherche auraient pu consacrer davantage de temps à comprendre en profondeur les modèles, à résoudre des problèmes fondamentaux de sécurité et d'alignement, plutôt que de se battre pour des parts de marché et des titres de presse. La sortie rapide de ChatGPT a enclenché une dynamique compétitive qui contraint désormais tous les acteurs à publier vite, parfois au détriment de la rigueur scientifique. Ce témoignage illustre une tension de fond dans l'industrie de l'IA : la pression commerciale des entreprises technologiques entre en conflit direct avec les recommandations des chercheurs qui plaident pour une approche plus prudente et progressive. Google, Microsoft, Anthropic et Meta sont aujourd'hui engagés dans une compétition effrénée où chaque annonce de modèle déclenche une réaction en chaîne. Les propos d'Hassabis alimentent un débat plus large sur la gouvernance de l'IA et la responsabilité des laboratoires face à des technologies dont les implications à long terme restent mal comprises.

UELes propos d'Hassabis renforcent la position européenne en faveur d'une régulation prudente de l'IA, soutenant les arguments derrière l'AI Act face à la pression compétitive des grandes plateformes américaines.

ÉthiqueOpinion
1 source
530Le Big Data 

L’intelligence artificielle transforme l’expérience collaborateur malgré un déficit d’écoute des directions

Le rapport 2026 de Qualtrics sur l'expérience collaborateur, conduit auprès de plus de 33 000 salariés dans 24 pays, révèle que 80 % des employés utilisent des outils d'intelligence artificielle non fournis par leur employeur. Ce phénomène, désigné sous le terme de "Shadow AI", se manifeste indépendamment des politiques internes et des dispositifs officiels déployés par les directions informatiques. L'étude montre également que l'introduction d'outils d'IA dans le cadre professionnel s'accompagne d'une hausse de 10 points de l'engagement des salariés, atteignant 78 % chez ceux exposés à ces technologies. 65 % d'entre eux rapportent une exécution plus rapide de leurs tâches, 58 % constatent une amélioration de la qualité de leur travail, et 37 % affirment pouvoir accomplir des missions qui leur étaient auparavant inaccessibles. Ce recours massif à des solutions externes traduit un décalage profond entre les stratégies des directions et les besoins concrets du terrain. Les salariés, soumis à une pression croissante de productivité, choisissent les outils les plus accessibles sans attendre le déploiement de solutions validées en interne, sous-estimant souvent les risques associés comme la fuite de données sensibles ou l'absence de traçabilité. Liza Le Derff, Senior Consultant chez Qualtrics, interprète ce comportement non comme une rébellion mais comme un signal d'alarme : les outils internes sont jugés trop limités ou insuffisamment communiqués. Par ailleurs, 42 % des salariés réclament une meilleure écoute de leur hiérarchie, alors que seulement 25 % des entreprises ont renforcé leurs dispositifs d'écoute au cours de l'année 2025. Ce déficit empêche les directions RH et IT de capter les besoins réels, ce qui pousse les collaborateurs à contourner les politiques officielles. Malgré tout, 21 % des salariés expriment encore des craintes vis-à-vis de l'IA, illustrant que l'adhésion reste partielle et conditionnée à l'accompagnement proposé. Ce rapport s'inscrit dans un contexte où l'IA générative s'est imposée en quelques années comme outil du quotidien dans de nombreuses professions, bien avant que les organisations n'aient pu structurer une réponse cohérente. Les grandes entreprises technologiques comme Microsoft, Google ou Salesforce ont accéléré l'intégration de fonctionnalités d'IA dans leurs suites collaboratives, rendant l'adoption quasi inévitable. Les directions RH se retrouvent désormais face à un défi double : encadrer un usage déjà répandu pour limiter les risques de sécurité et de conformité, tout en proposant des outils internes suffisamment performants pour que les salariés n'aient plus à chercher ailleurs. L'enjeu pour les prochains mois sera de transformer cette écoute en actions concrètes, en impliquant les collaborateurs dans la sélection et le déploiement des solutions, plutôt que de les exposer à des décisions descendantes déconnectées de leurs réalités opérationnelles.

UELe Shadow AI documenté dans ce rapport représente un risque de conformité RGPD concret pour les entreprises européennes, dont les salariés utilisent des outils non validés susceptibles de transmettre des données sensibles vers des serveurs hors UE.

SociétéActu
1 source
Exclusif : Peter Hoeschele, cadre du projet 'Stargate' chez OpenAI, quitte l'entreprise
531The Information AI 

Exclusif : Peter Hoeschele, cadre du projet 'Stargate' chez OpenAI, quitte l'entreprise

Peter Hoeschele, cadre chez OpenAI en charge de l'initiative Stargate, a quitté l'entreprise, selon une source proche du dossier. Il faisait partie de l'équipe originelle du projet Stargate, le programme d'infrastructure de centres de données qu'OpenAI entend construire et opérer en propre. Sa sortie intervient alors que ce chantier titanesque, annoncé en janvier 2025 avec un investissement de 500 milliards de dollars sur quatre ans, porté par OpenAI, SoftBank et Oracle, entre dans sa phase de déploiement concrète sur le territoire américain. Le départ d'un exécutif fondateur de Stargate soulève des questions sur la stabilité interne du projet à un moment critique. Stargate représente le pari stratégique central d'OpenAI pour s'affranchir de sa dépendance à Microsoft Azure et disposer de sa propre capacité de calcul à grande échelle. Toute turbulence dans l'équipe dirigeante du programme pourrait ralentir des décisions d'ingénierie et de partenariat dont dépend la compétitivité d'OpenAI face à Google, Amazon et Meta dans la course aux infrastructures IA. Hoeschele rejoint une liste croissante de cadres de haut rang ayant quitté OpenAI ces dix-huit derniers mois, dans un contexte de transformation accélérée de l'entreprise, passage au statut de société à but lucratif, levées de fonds record, et pression concurrentielle intense. OpenAI n'a pas commenté officiellement ce départ. La direction opérationnelle de Stargate et l'identité de son successeur éventuel n'ont pas été précisées.

BusinessActu
1 source
532AWS ML Blog 

Amazon Bedrock AgentCore permet d'intégrer un agent IA de navigation en direct dans une application React

Amazon a lancé le composant BrowserLiveView dans son SDK TypeScript Bedrock AgentCore, permettant aux développeurs d'intégrer un flux vidéo en temps réel d'une session de navigation autonome directement dans leurs applications React. Concrètement, trois lignes de JSX suffisent pour embarquer ce flux live : le composant reçoit une URL présignée SigV4 générée côté serveur, établit une connexion WebSocket persistante, et diffuse la session du navigateur distant via le protocole Amazon DCV. L'architecture repose sur trois couches : le navigateur React de l'utilisateur qui affiche le flux, un serveur applicatif qui orchestre les sessions via l'API Bedrock AgentCore, et l'infrastructure AWS Cloud qui héberge les sessions navigateur isolées. Les sessions peuvent également être enregistrées sur Amazon S3 pour un visionnage différé depuis la console AWS. Cette visibilité en temps réel répond à un problème concret de confiance dans les agents IA autonomes. Lorsqu'un agent navigue sur le web, remplit des formulaires ou traite des données sensibles au nom d'un utilisateur, celui-ci n'a jusqu'ici aucune fenêtre sur ces actions. Avec BrowserLiveView, l'utilisateur suit chaque navigation, chaque soumission de formulaire et chaque interaction au moment où elle se produit, ce qui est nettement plus rassurant que recevoir une simple confirmation textuelle après coup. Pour les workflows supervisés, notamment dans les secteurs régulés comme la finance ou la santé, un superviseur peut observer l'agent en direct et intervenir sans quitter l'application. L'outil répond aussi aux exigences d'audit : la preuve visuelle des actions de l'agent constitue une traçabilité exploitable pour la conformité réglementaire et le débogage. Amazon Bedrock AgentCore s'inscrit dans la stratégie plus large d'AWS pour industrialiser les agents IA fiables en entreprise. La question de la transparence des agents autonomes est devenue centrale alors que les grandes organisations cherchent à déléguer des tâches complexes à des systèmes IA tout en conservant un contrôle humain. Plusieurs acteurs, dont Google avec ses agents Gemini et Microsoft avec Copilot Studio, développent des approches similaires de supervision d'agents web. AWS positionne ici son offre sur la simplicité d'intégration et la sécurité native, avec une authentification déléguée sans infrastructure streaming à maintenir côté développeur. La prochaine étape logique sera l'extension de cette visibilité à d'autres types d'agents au-delà de la navigation web, et probablement des mécanismes d'intervention manuelle directement depuis le flux live pour renforcer encore le contrôle humain dans la boucle.

UELes entreprises françaises et européennes utilisant AWS Bedrock pour des agents autonomes dans des secteurs régulés (finance, santé) disposent d'un mécanisme de traçabilité visuelle directement exploitable pour répondre aux exigences d'audit et de conformité imposées par le droit européen.

OutilsOutil
1 source
533Microsoft Research 

L'IA accélère les mutations du travail, mais les bénéfices restent inégaux

Microsoft a publié la nouvelle édition de son rapport annuel "New Future of Work", qui analyse en profondeur comment l'intelligence artificielle transforme le monde du travail. Cette année, le constat est particulièrement tranché : l'IA générative ne se contente plus d'automatiser des tâches isolées, elle s'intègre désormais dans les processus de création, de décision et de collaboration. Les données d'adoption sont significatives, en Allemagne, 38 % des actifs interrogés déclarent utiliser l'IA dans leur travail, mais les écarts restent importants selon les secteurs et les profils. Les hommes déclarent recourir à ces outils professionnellement plus souvent que les femmes, et les pays à hauts revenus dominent encore l'usage global, même si la croissance la plus rapide s'observe dans les régions à revenus faibles et intermédiaires. Ce rapport marque un tournant conceptuel important : l'IA n'est plus présentée comme un simple accélérateur de productivité, mais comme un partenaire de travail actif. Les organisations qui l'abordent sous cet angle enregistrent les gains les plus substantiels. Le rôle des travailleurs évolue en conséquence : il ne s'agit plus seulement d'exécuter des tâches, mais de guider, critiquer et améliorer le travail produit par les systèmes d'IA. Cette bascule amplifie l'importance de l'expertise humaine plutôt qu'elle ne la diminue. En revanche, l'adoption inégale crée des risques structurels : ceux qui maîtrisent ces outils accèdent à de meilleures opportunités d'apprentissage, de productivité et d'évolution de carrière, creusant potentiellement l'écart avec ceux qui restent à l'écart. Le rapport souligne aussi que lorsque les modèles ne supportent pas les langues locales, les utilisateurs basculent vers l'anglais pour obtenir des résultats fiables, un vecteur de fracture supplémentaire si les investissements dans le multilingue n'augmentent pas. Ce rapport s'inscrit dans une série publiée depuis cinq ans par les chercheurs de Microsoft, qui documentent les mutations du travail à partir d'analyses à grande échelle, d'études de terrain et de travaux théoriques. Les éditions précédentes se concentraient sur la montée du télétravail et l'automatisation des tâches répétitives ; cette année, le passage à l'IA générative accélère brutalement la trajectoire. Le message central est délibérément volontariste : l'avenir du travail n'est pas prédéterminé, il se construit par les choix des individus, les normes des équipes et les systèmes que les organisations décident d'adopter. La question qui se pose désormais à l'ensemble de l'industrie est de savoir comment concevoir et déployer des outils d'IA qui élargissent les opportunités plutôt que de les concentrer, un enjeu qui dépasse largement le seul périmètre technologique pour toucher à l'éducation, à la politique industrielle et aux standards de développement des modèles.

UELes inégalités d'adoption documentées et les barrières linguistiques des modèles IA concernent directement les travailleurs et entreprises européens, avec un enjeu structurel fort pour la France sur la formation et le développement de modèles multilingues.

SociétéOpinion
1 source
L'exode des experts en sécurité d'OpenAI a enfin une explication : le ressenti de Sam Altman
534The Decoder 

L'exode des experts en sécurité d'OpenAI a enfin une explication : le ressenti de Sam Altman

Dans un long portrait publié par le New Yorker et fondé sur plus de cent entretiens, Sam Altman a fourni sa version des départs répétés de chercheurs en sécurité chez OpenAI. Sa réponse, lapidaire : "My vibes don't really fit" -- ses ondes ne correspondent tout simplement pas. Le PDG d'OpenAI reconnaît aussi que ses engagements passés, que certains qualifieraient de promesses non tenues, font simplement partie du métier de dirigeant dans un secteur aussi mouvant. Cette explication désinvolte intervient après une série de démissions retentissantes au sein de l'équipe dédiée à la sécurité d'OpenAI, dont des figures comme Ilya Sutskever, Paul Christiano ou encore des membres de l'équipe Superalignment dissoute en 2024. Que le dirigeant de l'entreprise supposément la plus avancée sur l'IA générale réduise ces départs à une question de compatibilité personnelle inquiète une partie de l'industrie : cela suggère que les désaccords de fond sur la gestion des risques sont traités comme des problèmes de culture d'entreprise plutôt que comme des alertes techniques sérieuses. OpenAI traverse depuis plusieurs années une tension structurelle entre sa mission d'origine -- développer une IA sûre au bénéfice de l'humanité -- et ses impératifs commerciaux croissants, accélérés par les investissements massifs de Microsoft et la concurrence de Google DeepMind et Anthropic. Le profil du New Yorker, qui s'annonce comme l'un des portraits les plus fouillés d'Altman à ce jour, risque de relancer le débat sur la gouvernance réelle d'une entreprise valorisée à plusieurs centaines de milliards de dollars.

UELa gestion désinvolte des alertes de sécurité chez OpenAI renforce les arguments européens en faveur d'une surveillance renforcée des systèmes d'IA à haut risque sous l'AI Act.

SécuritéOpinion
1 source
Les créateurs de contenu sommés de prouver qu'ils n'ont pas utilisé l'IA
535The Verge AI 

Les créateurs de contenu sommés de prouver qu'ils n'ont pas utilisé l'IA

Face à la montée en puissance des outils de génération d'images et de texte, une tendance inquiétante émerge dans les communautés créatives en ligne : les humains sont désormais soupçonnés de produire du contenu artificiel, même lorsqu'il s'agit de leur propre travail. Des plateformes comme Instagram, X ou DeviantArt peinent à détecter et étiqueter de manière fiable le contenu généré par IA, laissant illustrateurs, photographes et écrivains se défendre seuls face aux accusations de tromperie. Cette situation crée une asymétrie profondément injuste. Les créateurs humains subissent une présomption de culpabilité tandis que les systèmes d'IA — Midjourney, DALL-E, Sora ou autres — ne sont soumis à aucune obligation d'identification cohérente de leurs productions. Pour les artistes et journalistes qui tirent leurs revenus de leur travail original, cette confusion érode la confiance du public et dévalue leur création. L'absence d'étiquetage fiable profite avant tout aux plateformes et aux entreprises d'IA, au détriment des producteurs de contenu humain. Une solution radicale commence à s'imposer dans le débat : instaurer un label universel pour le contenu humain, comparable au logo Fair Trade ou au label bio, qui permettrait aux créateurs de certifier l'origine de leur travail. Cette idée, portée notamment par des chroniqueurs de The Verge, renverse la logique habituelle — plutôt que de traquer l'IA, on authentifie l'humain. Des initiatives comme C2PA (Coalition for Content Provenance and Authenticity), soutenue par Adobe, Microsoft et d'autres, explorent déjà des standards techniques de provenance, mais leur adoption reste fragmentée et volontaire.

UELes créateurs indépendants européens — illustrateurs, photographes, journalistes — subissent la même présomption de culpabilité sans cadre contraignant ; l'AI Act pourrait servir de levier pour imposer un étiquetage obligatoire des contenus IA à l'échelle de l'UE.

SociétéOpinion
1 source
Anthropic injecte 400 millions de dollars en actions dans une startup pharma IA de huit mois comptant moins de dix salariés
536The Decoder 

Anthropic injecte 400 millions de dollars en actions dans une startup pharma IA de huit mois comptant moins de dix salariés

Anthropic a annoncé l'acquisition d'une startup spécialisée dans l'intelligence artificielle appliquée à la pharmacologie pour un montant de 400 millions de dollars en actions. L'entreprise rachetée n'a que huit mois d'existence et compte moins de dix employés, ce qui en fait l'une des acquisitions les plus spectaculaires par employé de l'histoire récente de la tech. L'investisseur initial ressort de l'opération avec un retour sur investissement de 38 513 %, un chiffre qui illustre l'ampleur de la prime payée par Anthropic. Ce rachat signale qu'Anthropic cherche activement à étendre son périmètre au-delà des modèles de langage grand public, en s'attaquant au secteur pharmaceutique, où l'IA promet d'accélérer radicalement la découverte de médicaments et la recherche clinique. Pour une startup aussi jeune et aussi petite, une valorisation de 400 millions de dollars reflète avant tout la valeur perçue de la technologie ou des équipes fondatrices, et non des revenus ou des produits établis. Cela place aussi Anthropic en concurrence directe avec des acteurs comme Isomorphic Labs (DeepMind) ou Recursion Pharmaceuticals sur le terrain de la bio-IA. Cette transaction s'inscrit dans une course effrénée entre les grands laboratoires d'IA pour prendre position dans la drug discovery, un marché estimé à plusieurs centaines de milliards de dollars. OpenAI, Google et Microsoft investissent eux aussi massivement dans la convergence entre IA et sciences du vivant. Pour Anthropic, qui a levé plusieurs milliards de dollars ces dernières années auprès d'Amazon et Google notamment, cette acquisition marque une diversification stratégique majeure, et pose la question de son positionnement à long terme : pure-player IA ou acteur intégré dans les industries à fort enjeu scientifique.

UEL'accélération de la consolidation en bio-IA par les grands laboratoires américains renforce leur avance compétitive sur les acteurs européens de la découverte médicamenteuse.

BusinessOpinion
1 source
Anthropic acquiert la biotech Coefficient Bio pour 400 millions de dollars
537TechCrunch AI 

Anthropic acquiert la biotech Coefficient Bio pour 400 millions de dollars

Anthropic a acquis Coefficient Bio, une startup discrète spécialisée dans l'IA appliquée aux biotechnologies, pour un montant de 400 millions de dollars en actions. L'opération a été révélée par The Information et le journaliste Eric Newcomer. Coefficient Bio opérait en mode furtif, sans communication publique significative, avant que cette transaction ne soit divulguée. Cette acquisition marque une diversification stratégique majeure pour Anthropic, jusqu'ici centré sur les grands modèles de langage généralistes. En intégrant une équipe spécialisée dans l'IA biomédicale, la société se positionne sur l'un des marchés les plus prometteurs et les plus concurrentiels de la décennie : l'accélération de la recherche en biologie, découverte de médicaments et médecine de précision. Anthropic rejoint ainsi une course engagée par Google DeepMind (AlphaFold), Microsoft et plusieurs startups comme Recursion Pharmaceuticals ou Isomorphic Labs. La convergence entre IA fondationnelle et biotechnologie attire des investissements massifs, les grands acteurs cherchant à contrôler à la fois les modèles et les applications verticales. À 400 millions de dollars, cet achat en actions suggère qu'Anthropic mise sur des talents et une propriété intellectuelle spécifiques plutôt que sur un produit commercialisé.

UELa consolidation IA-biotech aux États-Unis intensifie la pression sur les acteurs européens de la pharma et de la biologie computationnelle, qui devront rivaliser pour les talents et les capitaux face à des concurrents dotés de moyens considérables.

BusinessActu
1 source
Google Vids : l’outil gratuit de création vidéo en un clic reçoit une énorme mise à jour
53801net 

Google Vids : l’outil gratuit de création vidéo en un clic reçoit une énorme mise à jour

Google a déployé une mise à jour majeure de son outil de création vidéo Vids, intégré à Google Workspace, en y incorporant ses modèles d'intelligence artificielle les plus récents, dont Veo 2, capable de générer des séquences vidéo réalistes à partir de simples descriptions textuelles. L'outil, accessible gratuitement aux abonnés Workspace, permet désormais de produire des vidéos complètes en quelques secondes, avec des visuels nettement plus convaincants qu'auparavant. Pour les équipes professionnelles, ce saut qualitatif est significatif : là où il fallait des heures de montage ou un budget dédié à la production vidéo, une présentation, un tutoriel ou une communication interne peuvent désormais être générés automatiquement. Google cible directement les PME, les équipes RH et marketing qui n'ont pas de ressources vidéo en interne. Cette mise à jour s'inscrit dans la guerre que se livrent Google, Microsoft et OpenAI sur le terrain des outils de productivité augmentés par l'IA. Google cherche à consolider Workspace face à Copilot de Microsoft, qui intègre également des capacités vidéo via des partenariats avec des outils tiers. L'enjeu est de fidéliser les entreprises dans leur écosystème respectif avant que le marché ne se stabilise.

UELes PME et équipes marketing européennes utilisant Google Workspace peuvent dès maintenant tester la génération vidéo automatisée via Vids, réduisant potentiellement leurs coûts de production.

OutilsOutil
1 source
Meta lance KernelEvolve, un agent IA pour optimiser les infrastructures d'entraînement
539Meta Engineering ML 

Meta lance KernelEvolve, un agent IA pour optimiser les infrastructures d'entraînement

Meta a présenté KernelEvolve, un système d'optimisation de kernels piloté par intelligence artificielle, développé en interne pour accélérer ses modèles de publicité et d'IA générative. Intégré à l'agent Ranking Engineer Agent, KernelEvolve automatise la création et l'optimisation de kernels — ces programmes bas niveau qui traduisent les opérations de haut niveau d'un modèle en instructions spécifiques à chaque puce. Le système cible une infrastructure hétérogène composée de GPU NVIDIA, de GPU AMD, de CPU classiques et des puces MTIA, les accélérateurs personnalisés de Meta. Les résultats publiés sont substantiels : plus de 60 % d'amélioration du débit d'inférence pour le modèle publicitaire Andromeda sur GPU NVIDIA, et plus de 25 % de gain en débit d'entraînement sur les puces MTIA. Des travaux qui auraient normalement demandé plusieurs semaines à des ingénieurs spécialisés ont été accomplis en quelques heures. L'article associé sera présenté au 53e International Symposium on Computer Architecture (ISCA) 2026. L'enjeu est direct et massif : Meta sert chaque jour des milliards d'expériences alimentées par l'IA, des recommandations personnalisées aux assistants génératifs. Chaque requête d'entraînement ou d'inférence repose sur une couche de kernels hautement optimisés, et à mesure que les modèles gagnent en complexité et que le parc matériel se diversifie, le nombre de configurations possibles explose — atteignant des milliers de combinaisons selon le hardware, l'architecture du modèle et le type d'opérateur. L'optimisation manuelle par des experts ne peut plus suivre ce rythme, créant un goulot d'étranglement critique qui freine l'adoption de nouveaux matériels et ralentit les cycles d'itération des modèles. KernelEvolve résout ce problème en traitant l'optimisation comme une recherche automatisée : un environnement d'évaluation dédié teste chaque kernel candidat, renvoie les diagnostics au LLM, et pilote une exploration continue sur des centaines d'alternatives — dépassant les performances des kernels écrits à la main par des experts humains. Cette initiative s'inscrit dans une tendance de fond chez les grandes plateformes technologiques : déléguer des tâches d'ingénierie de bas niveau à des agents IA pour absorber la complexité croissante des infrastructures de calcul. Meta fait face à la même contrainte que Google, Microsoft ou Amazon — accélérer sans cesse les modèles tout en maîtrisant les coûts de calcul sur un parc matériel qui ne cesse de se diversifier. KernelEvolve génère des kernels dans des langages aussi bien de haut niveau comme Triton ou CuteDSL que de bas niveau comme CUDA, HIP ou MTIA C++, ce qui lui confère une portabilité rare. À terme, ce type d'agent pourrait devenir standard dans l'industrie, réduisant drastiquement le besoin d'ingénieurs spécialisés en optimisation matérielle et accélérant la mise en production de nouvelles architectures de modèles sur des puces encore inconnues.

InfrastructureActu
1 source
Google Vids : créez, modifiez et partagez des vidéos gratuitement
540Google AI Blog 

Google Vids : créez, modifiez et partagez des vidéos gratuitement

Google enrichit son outil de création vidéo Vids avec de nouvelles fonctionnalités d'intelligence artificielle, en intégrant ses modèles maison Lyria 3 pour la génération audio et Veo 3.1 pour la vidéo. La nouveauté centrale : ces capacités de génération vidéo haute qualité sont désormais accessibles gratuitement, sans frais supplémentaires pour les utilisateurs de Google Workspace. C'est un signal fort dans la course aux outils créatifs IA. En rendant la génération vidéo professionnelle accessible sans surcoût, Google s'attaque directement à des acteurs comme Runway, Sora d'OpenAI ou Kling, qui facturent leurs fonctionnalités premium. Pour les équipes marketing, les créateurs de contenu et les entreprises utilisant déjà l'écosystème Google, cela élimine une barrière d'entrée significative à la production vidéo assistée par IA. Google Vids a été lancé en 2024 comme réponse à Canva et aux outils de présentation vidéo, intégré à Google Workspace aux côtés de Docs, Sheets et Slides. L'intégration de Veo 3.1, version mise à jour du modèle vidéo présenté à Google I/O 2025, et de Lyria 3 pour la bande sonore, montre la volonté de Google de consolider sa suite bureautique autour de l'IA générative multimodale, face à Microsoft qui déploie Copilot dans Office.

UELes équipes et entreprises françaises déjà abonnées à Google Workspace peuvent désormais accéder gratuitement à la génération vidéo IA professionnelle, supprimant le besoin de souscrire à des outils tiers payants comme Runway ou Kling.

OutilsOutil
1 source
GitHub intègre l'IA pour améliorer la gestion des problèmes d'accessibilité et automatiser le tri des retours
541InfoQ AI 

GitHub intègre l'IA pour améliorer la gestion des problèmes d'accessibilité et automatiser le tri des retours

GitHub a déployé un système de gestion automatisée des retours d'accessibilité s'appuyant sur l'intelligence artificielle. Développé en interne par l'ingénieure Leela Kumili, le workflow combine GitHub Actions, GitHub Copilot et les APIs GitHub Models pour centraliser les signalements d'accessibilité, analyser leur conformité aux normes WCAG (Web Content Accessibility Guidelines) et automatiser le triage des tickets. L'objectif est de traiter à grande échelle des volumes de retours qui dépassaient les capacités humaines de traitement manuel. L'impact concret est une réduction significative du temps de résolution des problèmes d'accessibilité signalés par les utilisateurs. Le système ne remplace pas la validation humaine, qu'il maintient comme étape obligatoire, mais supprime les tâches répétitives de classification et de priorisation. Pour les équipes produit et les équipes d'accessibilité, cela se traduit par une meilleure collaboration transversale et une inclusion numérique plus rapide à mettre en oeuvre. Les utilisateurs en situation de handicap bénéficient ainsi d'un temps de réponse raccourci sur leurs remontées. Cette initiative s'inscrit dans une tendance plus large chez les grandes plateformes tech à intégrer l'IA directement dans leurs processus internes de qualité et de conformité. GitHub, détenu par Microsoft depuis 2018, capitalise ici sur ses propres outils pour démontrer leur valeur en conditions réelles, une approche dite "dogfooding". La gestion de l'accessibilité représente un enjeu réglementaire croissant, notamment avec le renforcement de l'European Accessibility Act applicable depuis juin 2025, ce qui pousse les éditeurs logiciels à industrialiser leurs processus de conformité.

UEL'European Accessibility Act, applicable depuis juin 2025, pousse les éditeurs logiciels européens à industrialiser leur conformité accessibilité, rendant ce type d'automatisation directement pertinent pour les équipes produit en France et dans l'UE.

OutilsOutil
1 source
La « boîte de réception IA » débarque dans Gmail, si vous y mettez le prix
542Frandroid 

La « boîte de réception IA » débarque dans Gmail, si vous y mettez le prix

Google a commencé à déployer une fonctionnalité baptisée « AI Inbox » dans Gmail, réservée aux abonnés payants de ses offres premium. Cette boîte de réception augmentée par l'intelligence artificielle repose sur Gemini, le modèle maison de Google, et propose notamment le tri automatique des messages, la rédaction assistée, la synthèse des fils de discussion et des suggestions de réponses contextuelles. L'accès est conditionné à un abonnement Google One AI Premium, facturé autour de 20 euros par mois, ou à certaines formules Google Workspace pour les entreprises. Pour les utilisateurs concernés, le gain de productivité promis est significatif : moins de temps passé à trier et rédiger des emails, une meilleure gestion des priorités et un assistant capable de répondre à des questions sur le contenu de la boîte mail. Mais pour les centaines de millions d'utilisateurs du Gmail gratuit, ces fonctionnalités restent hors de portée, creusant un écart net entre l'expérience premium et l'offre de base. Cette stratégie s'inscrit dans un mouvement plus large de monétisation de l'IA par les grandes plateformes. Google, comme Microsoft avec Copilot dans Outlook, fait le choix de placer les fonctionnalités IA les plus avancées derrière un paywall, transformant l'intelligence artificielle en argument commercial différenciant plutôt qu'en amélioration universelle du service. La question de l'accessibilité de ces outils pour le grand public reste entière.

UELes utilisateurs Gmail en France et en Europe peuvent accéder à ces fonctionnalités via Google One AI Premium à environ 20 €/mois, creusant un fossé entre utilisateurs payants et gratuits.

OutilsOutil
1 source
Oracle licencie jusqu’à 30 000 personnes par mail pour financer son pari IA à 500 milliards
543Siècle Digital 

Oracle licencie jusqu’à 30 000 personnes par mail pour financer son pari IA à 500 milliards

Oracle a procédé au licenciement de plusieurs milliers de salariés, jusqu'à 30 000 selon certaines estimations, dans le cadre d'une vaste réorganisation interne. La nouvelle a été révélée par Business Insider, qui a obtenu le contenu du message envoyé par l'entreprise : une formule lapidaire informant les employés que leur poste était supprimé et qu'« aujourd'hui est votre dernier jour de travail ». La procédure, menée intégralement par courriel, a touché des équipes à travers plusieurs divisions du groupe américain, fondé et dirigé par Larry Ellison. Cette compression massive de personnel vise à libérer des ressources financières pour financer le virage IA d'Oracle, évalué à 500 milliards de dollars. Le groupe s'est engagé dans le projet Stargate aux côtés d'OpenAI et SoftBank, une initiative colossale de construction d'infrastructures cloud et de centres de données dédiés à l'intelligence artificielle aux États-Unis. Pour Oracle, il s'agit de repositionner son modèle économique autour des services cloud IA, un segment en croissance explosive, au détriment de ses activités traditionnelles jugées moins rentables à long terme. Oracle n'est pas seul dans cette dynamique : Microsoft, Google et Amazon ont tous engagé des cycles similaires de réduction d'effectifs pour réallouer du capital vers l'IA. Ce qui distingue Oracle, c'est l'ampleur des suppressions de postes par rapport à sa taille et la brutalité de la méthode choisie, un simple mail sans préavis visible, qui a provoqué une vive polémique sur les pratiques sociales des grandes entreprises technologiques américaines. La question des conditions de sortie et des recours juridiques pour les salariés concernés reste entière.

UEOracle étant présent dans plusieurs pays européens, une vague de licenciements similaire pourrait toucher les équipes locales, bien que l'article ne mentionne aucune suppression de poste hors des États-Unis.

BusinessActu
1 source
IBM publie Granite 4.0 3B Vision : un modèle de langage visuel pour l'extraction de données documentaires en entreprise
544MarkTechPost 

IBM publie Granite 4.0 3B Vision : un modèle de langage visuel pour l'extraction de données documentaires en entreprise

IBM a lancé Granite 4.0 3B Vision, un modèle de langage visuel (VLM) conçu spécifiquement pour l'extraction de données documentaires en entreprise. Contrairement aux grands modèles multimodaux monolithiques, ce modèle adopte une architecture modulaire : il se présente sous forme d'adaptateur LoRA d'environ 0,5 milliard de paramètres, conçu pour se greffer sur le modèle de base Granite 4.0 Micro (3,5 milliards de paramètres). Cette configuration permet un déploiement en « double mode » — le modèle texte fonctionne de manière autonome, et le composant visuel n'est activé qu'en cas de besoin. Pour traiter les images haute résolution, le modèle découpe les documents en tuiles de 384×384 pixels via l'encodeur visuel SigLIP2 de Google, tout en conservant une vue globale réduite de l'image. Les tokens visuels sont ensuite injectés dans le modèle de langage en 8 points d'ancrage distincts grâce à l'architecture DeepStack, assurant un alignement précis entre contenu sémantique et mise en page spatiale. En matière de performances, le modèle atteint 85,5 % de correspondance exacte en extraction de paires clé-valeur sur le benchmark VAREX (zéro-shot), et se classe troisième parmi les modèles de 2 à 4 milliards de paramètres sur ce leaderboard en mars 2026. L'enjeu principal de cette sortie est de permettre aux entreprises d'automatiser l'extraction structurée de données à partir de documents complexes — tableaux financiers, graphiques analytiques, formulaires — avec un modèle compact et déployable localement. Là où les grands modèles généralistes sacrifient la précision structurelle au profit de la polyvalence, Granite 4.0 3B Vision est entraîné spécifiquement sur la conversion de graphiques en CSV ou JSON, la reconnaissance de structures de tableaux en HTML, et l'extraction de paires clé-valeur. IBM a notamment utilisé ChartNet, un dataset multimodal à l'échelle du million d'exemples, ainsi qu'une pipeline d'entraînement « guidée par le code » qui aligne le code de génération d'un graphique, son rendu visuel et la table de données sous-jacente. Cette approche permet au modèle de comprendre la relation structurelle entre une représentation visuelle et sa source, plutôt que de simplement décrire une image. Ce lancement s'inscrit dans la stratégie d'IBM de positionner sa gamme Granite comme une alternative open-source et souveraine aux solutions propriétaires de Microsoft, Google ou Anthropic pour les usages entreprise. La tendance à l'architecture modulaire — un socle texte augmenté d'adaptateurs spécialisés — reflète une évolution plus large du secteur vers des modèles efficaces en ressources, déployables sur des infrastructures maîtrisées plutôt que dans le cloud public. Avec la prolifération des obligations réglementaires autour de la traçabilité des données (RGPD, AI Act européen), des modèles capables de traiter des documents sensibles en local représentent un avantage concurrentiel significatif. La prochaine étape pour IBM sera d'intégrer ce composant dans ses pipelines documentaires Watson et de le rendre accessible via watsonx, sa plateforme d'IA d'entreprise.

UELe déploiement local de Granite 4.0 3B Vision facilite la conformité RGPD et AI Act pour les entreprises européennes traitant des documents sensibles, en évitant tout transfert vers le cloud américain.

LLMsOpinion
1 source
Oracle licencie des milliers d'employés pour financer ses investissements massifs en infrastructure IA
545The Decoder 

Oracle licencie des milliers d'employés pour financer ses investissements massifs en infrastructure IA

Oracle a procédé à des licenciements massifs touchant plusieurs milliers d'employés, selon des informations rapportées par The Decoder. Ces suppressions de postes s'inscrivent dans une stratégie de réduction des coûts opérationnels destinée à financer un programme colossal de construction de centres de données dédiés à l'intelligence artificielle. L'entreprise, dont le cours de bourse a chuté de 25 % ces derniers mois, accumule par ailleurs une dette croissante liée à ces investissements d'infrastructure. Pour justifier cette mise à l'échelle forcée, Oracle s'appuie sur un carnet de commandes impressionnant, dont un contrat avec OpenAI valorisé à 455 milliards de dollars. Ces engagements contractuels sont présentés en interne comme une garantie de revenus futurs suffisamment solides pour absorber les coûts sociaux et financiers de la transformation. Mais la concrétisation de ces commandes reste incertaine : dans un secteur où les annonces de partenariats précèdent souvent de loin les paiements effectifs, la prudence s'impose. Oracle se positionne ainsi dans la course aux infrastructures IA aux côtés d'Amazon, Microsoft et Google, tous engagés dans une expansion agressive de leurs capacités de calcul. La décision de sacrifier des emplois pour accélérer cette transition illustre une tendance de fond dans la tech : les grandes entreprises réorientent leurs ressources humaines et financières vers l'IA à marche forcée, quitte à prendre des risques considérables si la demande ne suit pas au rythme escompté.

UEOracle étant présent en Europe avec plusieurs milliers d'employés, ces suppressions de postes massives pourraient toucher ses filiales européennes, bien que l'ampleur locale reste indéterminée.

Midterms 2026 : David SACKS pousse l’agenda pro-IA de Donald Trump face à une Amérique de plus en plus hostile
546FrenchWeb 

Midterms 2026 : David SACKS pousse l’agenda pro-IA de Donald Trump face à une Amérique de plus en plus hostile

À huit mois des élections de mi-mandat de novembre 2026, l'intelligence artificielle s'impose comme un enjeu politique majeur aux États-Unis. David Sacks, nommé « AI & Crypto Czar » par Donald Trump en janvier 2025, pilote une offensive réglementaire et rhétorique visant à faire des États-Unis le leader mondial de l'IA. L'administration Trump a déjà signé un décret exécutif abrogeant les restrictions imposées par Biden sur les modèles d'IA, et prépare un cadre favorable aux grandes entreprises technologiques comme OpenAI, Google, Microsoft et Meta, dont les dirigeants entretiennent des liens étroits avec la Maison-Blanche. L'enjeu est considérable : selon plusieurs sondages récents, une majorité d'Américains se déclarent inquiets des effets de l'IA sur l'emploi, la désinformation et la vie privée. Cette méfiance croissante constitue un handicap politique potentiel pour les républicains, qui risquent de se retrouver en porte-à-faux avec une base électorale peu enthousiaste à l'idée de financer massivement une technologie perçue comme menaçante pour les travailleurs. Cette tension reflète un clivage plus profond entre les intérêts des grandes plateformes technologiques, qui investissent des centaines de milliards de dollars dans l'IA générative, et une société civile qui réclame davantage de garde-fous. Les démocrates cherchent à exploiter ce fossé pour les midterms, tandis que Sacks et ses alliés parient sur la promesse de compétitivité face à la Chine pour rallier l'opinion. Le résultat de ce bras de fer idéologique influencera directement la trajectoire réglementaire de l'IA aux États-Unis pour les années à venir.

UELa trajectoire réglementaire pro-IA de l'administration Trump crée une asymétrie croissante avec l'AI Act européen, risquant de désavantager les entreprises soumises aux exigences de conformité européennes face à des acteurs américains moins contraints.

RégulationReglementation
1 source
Google négocierait le financement d'un data center de plusieurs milliards pour Anthropic
547The Information AI 

Google négocierait le financement d'un data center de plusieurs milliards pour Anthropic

Google serait en négociation pour financer partiellement la construction d'un datacenter de plusieurs milliards de dollars au Texas, destiné à être loué par Anthropic, selon des informations du Financial Times. Le montage financier envisagé passerait par des prêts à la construction accordés à Nexus Data Centers, l'opérateur du site qui détient le bail avec Anthropic. Le montant exact n'a pas été divulgué, mais l'expression « multibillion-dollar » laisse entrevoir une infrastructure d'envergure. Ce projet illustre la dépendance croissante des laboratoires d'IA aux investissements massifs en infrastructure de calcul. Pour Anthropic, accéder à une capacité de calcul dédiée et à grande échelle est indispensable pour entraîner et déployer ses modèles Claude à un niveau compétitif face à OpenAI et Google DeepMind. Pour Google, financer l'infrastructure de son partenaire stratégique — dans lequel il a déjà investi plus de 2 milliards de dollars — renforce un écosystème dans lequel ses propres intérêts sont engagés. Ce mouvement s'inscrit dans une course mondiale aux datacenters alimentée par l'explosion de la demande en IA générative. Microsoft construit des infrastructures pour OpenAI, Amazon pour ses propres services et Anthropic via AWS. Le fait que Google joue désormais aussi le rôle de bailleur de fonds pour Anthropic, en plus de partenaire cloud, témoigne de l'intrication croissante entre financement, infrastructure et développement des modèles dans l'industrie de l'IA.

InfrastructureOpinion
1 source
Il n’y a pas que ChatGPT dans la vie : Apple préparerait un Siri compatible avec toutes les IA
54801net 

Il n’y a pas que ChatGPT dans la vie : Apple préparerait un Siri compatible avec toutes les IA

Avec iOS 27, Apple préparerait une refonte majeure de Siri en lui permettant de dialoguer avec n'importe quel chatbot d'intelligence artificielle installé sur l'iPhone, et non plus uniquement ChatGPT. Selon les informations disponibles, cette nouvelle architecture transformerait Siri en véritable hub d'IA, capable de router les requêtes des utilisateurs vers le modèle de leur choix — qu'il s'agisse de Gemini, Claude, Mistral ou d'autres assistants à venir. Ce changement représente un virage stratégique considérable pour Apple, qui reconnaît implicitement que son assistant vocal natif ne peut rivaliser seul avec les grands modèles de langage du marché. Pour les utilisateurs, cela signifie une liberté de choix inédite sur iPhone : accéder à la puissance de n'importe quel LLM sans quitter l'écosystème Apple, simplement en ayant l'application correspondante installée. Cette évolution s'inscrit dans un contexte où Apple accuse un retard significatif en IA générative face à Google, Microsoft et OpenAI. Le partenariat avec OpenAI, annoncé en 2024 et intégré dès iOS 18, n'était qu'une première étape. En ouvrant Siri à toutes les IA tierces, Apple adopte une posture de plateforme plutôt que de compétiteur direct — une approche qui rappelle sa stratégie avec les applications tierces lors du lancement de l'App Store.

UELes utilisateurs européens d'iPhone pourraient bénéficier d'un accès facilité à des modèles comme Mistral directement via Siri, renforçant la visibilité des LLMs européens sur iOS.

OutilsOutil
1 source
ElevenLabs et IBM unissent leurs forces pour des agents IA vocaux
549Le Big Data 

ElevenLabs et IBM unissent leurs forces pour des agents IA vocaux

ElevenLabs et IBM ont annoncé le 25 mars 2026 un partenariat stratégique visant à intégrer les technologies vocales d'ElevenLabs — synthèse vocale (TTS) et reconnaissance vocale (STT) — à IBM WatsonX Orchestrate, la plateforme unifiée d'IBM pour la création, le déploiement et la gestion d'agents IA. Concrètement, les clients d'IBM auront accès à un catalogue de plus de 10 000 voix générées par IA, avec des garanties de conformité de niveau entreprise : certification PCI, mode « Zéro rétention » pour les données HIPAA, et résidence des données configurable. ElevenLabs, fondée en janvier 2023, compte aujourd'hui plus de 10 millions d'utilisateurs enregistrés et plus d'un million d'utilisateurs actifs quotidiens. Sa base de clients entreprise est passée d'environ 50 à 500 en dix-huit mois, signe d'une adoption rapide dans les secteurs exigeants. Ce partenariat marque un tournant concret dans la façon dont les entreprises déploient leurs agents conversationnels. Jusqu'ici, la majorité des agents IA en entreprise fonctionnaient en mode texte — chatbots, assistants intégrés aux workflows. L'ajout d'une couche vocale expressive et multilingue change radicalement l'expérience utilisateur : les banques, assureurs, établissements de santé ou fournisseurs d'énergie peuvent désormais proposer une assistance vocale naturelle, dans plusieurs langues et accents régionaux, sans sacrifier la conformité réglementaire. Les administrations publiques y voient également un levier pour informer leurs citoyens dans des contextes sensibles — santé, services sociaux, éducation — avec une accessibilité accrue. Comme le résume Nick Holda, vice-président des partenariats technologiques IA chez IBM : « Nos clients veulent des expériences intuitives et accessibles. » Ce rapprochement s'inscrit dans une tendance de fond : la voix devient le prochain front de bataille pour les agents IA en entreprise. IBM, déjà solide sur l'orchestration des agents et la gestion des données d'entreprise via WatsonX, manquait d'une brique vocale crédible. ElevenLabs apporte exactement cela — une synthèse vocale réputée quasi humaine, déjà adoptée massivement dans les médias, le divertissement et l'éducation. Pour ElevenLabs, l'alliance avec IBM ouvre l'accès aux grands comptes dans des secteurs régulés (finance, santé, télécoms) où sa crédibilité seule n'aurait pas suffi à convaincre les directions des systèmes d'information. Mati Staniszewski, cofondateur d'ElevenLabs, l'a dit sans détour : « C'est par la voix que l'IA gagne ou perd la confiance. » La suite logique pourrait inclure une intégration plus profonde avec Red Hat OpenShift et les environnements cloud hybrides d'IBM, positionnant les deux entreprises face à des concurrents comme Microsoft Azure AI Speech ou Google Cloud Text-to-Speech sur le marché des agents vocaux d'entreprise.

UELes garanties de conformité (résidence des données configurable, mode zéro rétention) et le support multilingue ouvrent des perspectives pour les entreprises et administrations européennes des secteurs régulés, en cohérence avec les exigences du RGPD.

OutilsOutil
1 source
Nscale fait irruption dans la cour des grands du développement de centres de données
550The Information AI 

Nscale fait irruption dans la cour des grands du développement de centres de données

Nscale, jeune entreprise dirigée par Josh Payne (ancien mineur de charbon), a levé 2 milliards de dollars à une valorisation de 14,6 milliards, nommé Sheryl Sandberg et Nick Clegg à son conseil d'administration, et signé une lettre d'intention pour fournir 1,35 GW de puissance de calcul à Microsoft. La société prévoit d'acquérir American Intelligence & Power pour développer ce qui pourrait devenir le plus grand complexe de data centers des États-Unis en Virginie-Occidentale, avec 8 GW de capacité planifiés d'ici 2031. Nscale table sur une croissance de revenus de 1,5 milliard à 30 milliards de dollars entre 2025 et 2027, soutenue par des investissements de Nvidia et des partenariats avec Dell.

BusinessActu
1 source