Dossier Microsoft — page 6

1397 articles · page 6 sur 28

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

251VentureBeat AI InfrastructureActu

Weka lance une plateforme de stockage qui met en cache tous les tokens précalculés d'un modèle IA, pour réduire le besoin en GPU

La société de stockage Weka a lancé NeuralMesh 6, une nouvelle plateforme logicielle accompagnée de sa première ligne de matériel conçue en interne, baptisée Wekapod 3. Cette version étend l'approche "Augmented Memory Grid" de l'entreprise, qui agrège de la mémoire flash NAND pour qu'elle se comporte comme de la mémoire GPU, à une fraction du coût. Selon Liran Zvibel, cofondateur et PDG de Weka, les clients actuels courent avant tout après la disponibilité du calcul : dès qu'ils obtiennent une nouvelle allocation de GPU, ils veulent pouvoir l'exploiter immédiatement. NeuralMesh 6 ajoute quatre fonctions principales. La première combine des clusters composables offrant une isolation matérielle complète et une multi-location virtuelle via le tissu RDMA de Weka, capable de gérer plus de 1 000 locataires par cluster avec un provisionnement en moins de 30 minutes, soit jusqu'à 50 000 locataires pour un cluster regroupant 50 clusters composables. La deuxième unifie le stockage fichier et objet sur une même donnée physique, sans couche de traduction ni copie supplémentaire, une approche que Zvibel dit vouloir déployer chez des clouds GPU hors AWS comme Lambda, Nebius, G42 et CoreWeave, avec des performances environ cent fois supérieures au S3 classique et une tarification basée sur la capacité plutôt que sur les appels API. La troisième, une réplication centrée sur les métadonnées, rend un environnement de destination consultable avant même l'arrivée complète des données, réduisant un processus qui prenait auparavant des jours voire des semaines à environ une heure. La quatrième, AlloyFlash, mélange mémoire flash TLC rapide et QLC moins coûteuse au sein d'un même cluster pour router automatiquement les charges selon leur sensibilité à la latence. L'enjeu est concret : mieux exploiter des investissements GPU coûteux, réduire les coûts d'inférence et accélérer le déploiement de nouvelles charges d'IA sans attendre des mois une capacité GPU supplémentaire. La technologie vise surtout les entreprises qui exploitent déjà l'IA à grande échelle ou anticipent une forte croissance d'usage, notamment celles qui déploient des copilotes internes, des agents de service client, des assistants de développement logiciel ou des systèmes de recherche documentaire à fenêtres de contexte longues. Les déploiements plus modestes, où l'utilisation des GPU n'est pas encore un facteur limitant, devraient en tirer un bénéfice moins immédiat. Ce lancement s'inscrit dans un marché du stockage pour l'IA de plus en plus disputé, où Dell, NetApp, Pure Storage et VAST se sont tous repositionnés vers l'infrastructure IA au cours des deux dernières années. Weka cherche à se démarquer en affirmant avoir conçu sa plateforme spécifiquement pour ce moment, plutôt que de s'y être simplement adaptée après coup, alors que la mémoire GPU s'impose comme la ressource la plus rare et la plus chère de l'IA en production.

Dossier Microsoft — page 6

Weka lance une plateforme de stockage qui met en cache tous les tokens précalculés d'un modèle IA, pour réduire le besoin en GPU

NVIDIA Vera Rubin améliore la performance par watt et réduit le coût par token pour ses partenaires dans le monde

IREN : pourquoi la demande en infrastructures IA dépasse déjà les capacités disponibles ?

Chine : des modèles ouverts bon marché, mais à quel prix pour Washington ?

Recherche entreprise pour agents avec Amazon Bedrock Managed Knowledge Base

« Nous avons peut-être 20 mois » pour rebâtir face aux agents IA, selon la VP infrastructure de Meta à VB Transform 2026

Préparer les appels clients avec Google Gemini

Claude Fable 5 indisponible plusieurs semaines : deux tiers des entreprises ont déjà un plan de secours

« Le mémo interne de Microsoft détaille la refonte de ses applis IA pour "mériter le droit d'exister" »

Microsoft Office face à un nouveau rival : 30 millions de dollars misés sur une alternative IA

IA à Wall Street : la tokenomie s'invite dans la finance

Les agents IA ne sont pas vos collègues

Scam.ai annonce un partenariat avec Qualcomm et lance Halo, son modèle de détection de deepfakes, au Computex 2026

L'IA avance, les pull requests stagnent : comment repenser le SDLC

OpenAI met à jour GPT-5.5 Instant : voici qu’est-ce que ça change

Google Chrome : Gemini peut désormais analyser ce qui s’affiche sur votre écran

Les calculs derrière la puce Jalapeño d'OpenAI

OpenAI et Broadcom annoncent une puce dédiée à l'inférence de grands modèles de langage

Claude Tag : découvrez une nouvelle façon de travailler avec Claude dans Slack

Objectifs climatiques ou IA ? Pour le lobby des data centers, l’Europe doit choisir

ChatGPT renforce ses fonctions d'assistant personnel avec de nouveaux contrôles de tâches planifiées

ChatGPT met de l’ordre dans vos tâches planifiées avec cette nouvelle interface

☕️ Microsoft se tournerait vers AWS pour absorber l’explosion des usages IA sur GitHub

Les puces IA moins coûteuses d'Amazon séduisent les entreprises

Satya sur Loopcraft : construire des écosystèmes frontier

Au-delà du gadget : comment structurer l’usage de l’IA dans le quotidien des équipes marketing

☕️ KPMG retire un rapport chantant les louanges de l’IA après la découverte d’hallucinations

Codex : OpenAI vous laisse désormais choisir quand réinitialiser votre quota

Le rachat de GLADIA par OVHcloud marquerait une nouvelle étape de l’IA européenne

Gemini 3.5 Translate va faire tomber la barrière des langues

Nvidia AI PC : quand la puissance des supercalculateurs s’invite dans votre ordinateur

Il abandonne ses abonnements IA pour un Mac Mini et économise 2 500 $ par an

xAI aurait entraîné ses modèles de code sur les réponses de Claude pendant des mois, avant d'en perdre l'accès

IBM et Google Cloud veulent accélérer l’adoption de l’IA dans les entreprises

[AINews] Reve 2 et Ideogram 4 : mises en page dans la génération d'images

Gemma 4 12B : Google apporte l’IA multimodale sur les PC grand public

Comment choisir son assistant IA pour maximiser la productivité des développeurs

Alphabet prépare un financement géant de 80 milliards de dollars pour l’IA

Dès le premier jour, la facture à l’usage de GitHub Copilot interroge les devs

☕️ Alphabet veut lever 80 milliards : l’IA se finance à crédit même quand on s’appelle Google

Les utilisateurs de GitHub Copilot réagissent au nouveau système de tarification à l'usage

Asana rachète Stack AI pour renforcer ses agents IA no-code

Comment Nvidia veut s’emparer du « cerveau » de nos ordinateurs personnels

L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA

NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark

ANTHROPIC ne lève plus du capital, elle achète désormais des gigawatts

☕️ Quand l’IA agentique coûte plus cher que de payer ses employés humains

George Hotz : les agents de codage seront "l'une des erreurs les plus coûteuses" du développement logiciel

Pourquoi ne pas laisser la sélection du modèle par défaut dans Copilot, Gemini et autres outils IA

Hark obtient 700 millions de dollars pour son projet d’assistant IA universel