Aller au contenu principal
☕️ Microsoft se tournerait vers AWS pour absorber l’explosion des usages IA sur GitHub
InfrastructureNext INpact3h· 2 min de lecture

☕️ Microsoft se tournerait vers AWS pour absorber l’explosion des usages IA sur GitHub

Source originale ↗·

Microsoft aurait discrètement conclu un accord avec Amazon Web Services pour absorber le trop-plein de trafic sur GitHub, selon deux sources internes citées par Business Insider. La plateforme de code, rachetée par Microsoft en 2018, subit depuis fin 2024 une pression sans précédent liée à l'explosion des outils de développement assistés par IA, notamment GitHub Copilot et ses agents autonomes. Le 3 avril 2026, Kyle Daigle, directeur des opérations de GitHub, chiffrait publiquement l'ampleur du phénomène : la plateforme enregistrait désormais 275 millions de commits par semaine, contre un milliard sur l'ensemble de l'année 2025, soit un rythme annualisé de 14 milliards. Microsoft n'a pas confirmé le recours spécifique à AWS, mais un porte-parole a reconnu une "stratégie multi-cloud", évoquant "l'incroyable pic du développement des agents" qui aurait "mis à l'épreuve les limites de l'infrastructure".

La situation illustre un paradoxe industriel saisissant : ce sont les propres outils d'IA de Microsoft qui génèrent une demande que son cloud maison, Azure, ne parvient plus à satisfaire. Fin avril, plusieurs développeurs influents avaient publiquement annoncé leur intention de quitter GitHub en raison de pannes répétées imputées à cette surcharge. L'ironie est d'autant plus mordante que Microsoft avait annoncé en octobre dernier vouloir migrer intégralement GitHub vers Azure dans un délai de 24 mois, faisant de la plateforme une vitrine stratégique de sa puissance cloud. Devoir solliciter son principal concurrent pour tenir debout fragilise ce discours commercial et interroge la capacité d'Azure à accompagner les pics de croissance liés à l'IA générative, précisément le segment où Microsoft entend dominer.

GitHub occupe une position centrale dans l'écosystème mondial du développement logiciel, avec plus de 100 millions de développeurs enregistrés. Son passage sous pavillon Microsoft avait déjà suscité des inquiétudes sur l'indépendance de la plateforme ; la dépendance croissante à Copilot et l'introduction récente d'une facturation à l'usage de cet outil ont ravivé ces tensions. La question du multi-cloud n'est pas nouvelle dans l'industrie, mais elle prend une dimension politique particulière quand elle oppose deux géants du secteur en compétition directe sur l'IA. Microsoft doit désormais arbitrer entre la priorité donnée à Azure comme infrastructure de référence et la nécessité opérationnelle de garantir la stabilité d'un service critique, sans quoi GitHub risque de perdre la confiance de la communauté des développeurs au profit d'alternatives comme GitLab ou Codeberg.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Microsoft lance le Surface RTX Spark Dev Box pour faire tourner de grands modèles IA sans recourir au cloud
1VentureBeat AI 

Microsoft lance le Surface RTX Spark Dev Box pour faire tourner de grands modèles IA sans recourir au cloud

Microsoft a dévoilé lundi le Surface RTX Spark Dev Box lors de la conférence Build 2026, un ordinateur de bureau compact destiné aux développeurs de logiciels qui souhaitent faire tourner de grands modèles d'intelligence artificielle en local, sans passer par le cloud. La machine embarque le nouveau processeur RTX Spark d'Nvidia, basé sur l'architecture Blackwell, et dispose de 128 gigaoctets de mémoire unifiée partagée dynamiquement entre le CPU et le GPU. Cette configuration permet d'atteindre un pétaflop de puissance de calcul IA, ce qui autorise l'exécution de modèles dépassant 120 milliards de paramètres sans envoyer la moindre requête vers un serveur distant. Pavan Davuluri, vice-président exécutif de Windows et Devices chez Microsoft, a précisé que la mémoire joue un rôle critique : à 100 000 tokens de contexte, le cache clé-valeur d'un grand modèle peut à lui seul consommer entre 40 et 50 gigaoctets, ce qui explique le choix de ce pool mémoire de 128 Go. L'appareil sera commercialisé exclusivement sur Microsoft.com aux États-Unis d'ici la fin de l'année, sans prix annoncé à ce stade. L'enjeu est directement économique. Les entreprises de toutes tailles font face à des factures cloud GPU qui s'accumulent de façon imprévisible : chaque appel d'inférence, chaque cycle de fine-tuning, chaque workflow agentique qui itère sur un modèle frontier génère des coûts qui s'emballent pour un développeur testant son prototype des dizaines de fois par jour. Andrew Hill, vice-président de Surface, a résumé la promesse dans le billet d'annonce : le Dev Box "change l'équation" en permettant aux équipes de "réserver les appels aux modèles frontier aux vrais problèmes frontier, et de traiter le reste sur leur propre matériel." La proposition n'est pas que le cloud soit dépassé, mais qu'une large partie des tâches actuellement envoyées à des datacenters distants ne justifie pas des modèles de pointe et serait mieux servie par du matériel local à coût fixe et prévisible. Ce lancement marque un tournant stratégique notable pour Microsoft, dont Azure génère plusieurs dizaines de milliards de dollars de revenus annuels. En commercialisant explicitement un appareil qui réduit la dépendance au cloud de ses propres clients, l'entreprise reconnaît une tension structurelle qui monte dans l'industrie depuis l'explosion des coûts d'inférence. Le pari de Redmond est que les développeurs qui prototypent en local déploieront ensuite sur Azure lorsqu'ils auront besoin de passer à l'échelle, et que contrôler les deux extrémités de ce cycle de développement est plus rentable que de n'en posséder qu'une. L'architecture RTX Spark, qui fusionne CPU ARM et GPU Blackwell en un seul chip avec mémoire unifiée, remplace quatre composants distincts d'un PC classique et ouvre la voie à une nouvelle génération de postes de travail IA autonomes.

InfrastructureOpinion
1 source
Anthropic en négociations pour utiliser les puces IA de Microsoft
2The Information AI 

Anthropic en négociations pour utiliser les puces IA de Microsoft

Anthropic serait en discussions avec Microsoft pour louer des serveurs équipés de puces d'intelligence artificielle conçues en interne par le géant de Redmond. Selon deux personnes ayant eu des échanges directs avec des dirigeants impliqués dans les négociations, la startup fondatrice de Claude cherche à augmenter sa capacité de calcul pour répondre à une demande croissante pour ses modèles d'IA. Aucun accord n'a encore été officialisé, mais les tractations sont en cours. Pour Microsoft, convaincre Anthropic d'adopter ses propres puces constituerait une victoire symbolique et commerciale majeure. L'effort de design de puces maison de l'entreprise a accusé des retards en 2024, compliquant sa stratégie d'indépendance vis-à-vis des fournisseurs externes. Séduire un acteur aussi visible qu'Anthropic permettrait à Microsoft de valider publiquement ses capacités matérielles et de diversifier les revenus issus de son infrastructure cloud Azure. La démarche s'inscrit dans une tendance de fond : les grands fournisseurs de cloud cherchent à réduire leur dépendance aux puces Nvidia, qui dominent aujourd'hui presque l'intégralité du marché des accélérateurs IA et dont la disponibilité reste contrainte. Google dispose déjà de ses TPU, Amazon de ses puces Trainium et Inferentia. Microsoft, en retard sur ce front, tente de combler l'écart. Anthropic, de son côté, bénéficie déjà d'investissements massifs d'Amazon et de Google, ce qui rend un partenariat avec Microsoft d'autant plus significatif sur le plan stratégique.

InfrastructureActu
1 source
Microsoft et Nvidia s'associent pour des PC IA capables d'exécuter de vrais agents autonomes
3The Decoder 

Microsoft et Nvidia s'associent pour des PC IA capables d'exécuter de vrais agents autonomes

Microsoft et Nvidia s'apprêtent à dévoiler conjointement une nouvelle génération d'ordinateurs sous Windows, prévue pour la semaine prochaine lors des conférences Computex et Build. Pour la première fois, Nvidia y imposera ses propres puces en tant que processeur principal, rompant avec le monopole d'Intel et AMD sur ce segment. Les premiers appareils concernés seront des machines Dell ainsi que des modèles de la gamme Surface de Microsoft, confirmant une collaboration industrielle inédite entre les deux géants. Le tournant majeur réside dans le logiciel : Microsoft prépare une nouvelle plateforme logicielle basée sur le framework OpenClaw, conçue pour permettre à des agents IA d'exécuter des tâches directement en local sur les PC Windows. Contrairement aux assistants cloud, ces agents fonctionneraient sans connexion internet, traitant données et automatisations directement sur la machine. Pour les professionnels et entreprises soucieux de confidentialité ou de latence, cela représente un changement de paradigme concret dans l'usage quotidien de l'IA. Cette initiative s'inscrit dans la tentative de Microsoft de relancer sa vision des PC augmentés par l'IA, après l'échec commercial relatif des Copilot+ PC lancés en 2024, dont les fonctionnalités comme Recall avaient suscité plus de controverses que d'enthousiasme. En s'appuyant cette fois sur les puces Nvidia et un cadre d'agents autonomes plus opérationnel, Microsoft cherche à convaincre le marché que l'IA embarquée peut tenir ses promesses de productivité réelle. La bataille pour définir le PC de l'ère agentique ne fait que commencer.

UELes entreprises françaises et européennes, particulièrement sensibles au RGPD, bénéficieront d'agents IA fonctionnant en local sans transfert de données vers le cloud, réduisant les risques de conformité.

💬 Après le fiasco Recall, Microsoft repart avec Nvidia et des agents qui tournent en local, sans connexion. Pour les boîtes coincées entre IA et RGPD, c'est le premier truc qui tient vraiment la route depuis longtemps. Bon, faut quand même que ça tienne en prod, parce que les promesses sur les PC IA, on commence à connaître.

InfrastructureOpinion
1 source
AMD : ce mini PC fait tourner des IA géantes… sans cloud ni abonnement
4Le Big Data 

AMD : ce mini PC fait tourner des IA géantes… sans cloud ni abonnement

Lors de la conférence Computex 2026, Lisa Su, PDG d'AMD, a pris la scène avec un mini PC pas plus grand qu'un livre épais pour y faire tourner en direct un modèle d'intelligence artificielle de 235 milliards de paramètres, sans datacenter, sans cloud, sans carte graphique dédiée externe. La machine utilisée est équipée du processeur Ryzen AI Max+ 395 (nom de code Strix Halo), intégré notamment dans le GMKtec EVO-X2. Sa particularité tient à son architecture de mémoire unifiée : jusqu'à 128 Go de RAM partagée, dont 96 Go peuvent être alloués au GPU intégré en guise de VRAM. C'est précisément ce volume qui permet de charger des modèles d'une taille normalement réservée aux serveurs professionnels. Le tout s'exécute via des outils open source gratuits comme Ollama, sans abonnement ni limite d'usage imposée par un tiers. Ce qui change concrètement, c'est la barrière d'accès à l'inférence locale de très grands modèles. Jusqu'ici, faire tourner un LLM de plusieurs dizaines de milliards de paramètres exigeait soit une carte graphique haut de gamme à plusieurs milliers d'euros avec ses limitations de VRAM, soit la location de GPU dans le cloud, une facture récurrente qui peut vite peser sur les marges d'un indépendant ou d'une petite structure. AMD montre ici qu'un mini PC compact peut absorber ces charges de travail localement. Pour les entreprises manipulant des données sensibles, cabinets juridiques, services de santé, bureaux d'études, la promesse est double : confidentialité totale des documents traités et réduction significative des coûts d'infrastructure IA. Un consultant cité dans la démonstration affirme avoir remplacé ses locations de GPU par cette configuration, avec un impact positif sur la rentabilité de son activité. AMD ne part pas de zéro dans cette course, mais accuse encore du retard sur Nvidia. Son écosystème logiciel ROCm, équivalent maison du CUDA de Nvidia, progresse rapidement en compatibilité mais n'a pas encore atteint la maturité de son concurrent, ce qui peut freiner certains workflows spécialisés. Face à une RTX 5090, les performances de ce Ryzen AI Max+ 395 restent inférieures sur les modèles les plus exigeants. La démonstration d'AMD s'inscrit néanmoins dans une tendance de fond : la décentralisation de l'IA vers le matériel personnel, portée aussi bien par Apple Silicon que par les puces NPU embarquées dans les PC Copilot+. Le marché de l'IA embarquée représente un enjeu stratégique majeur pour les prochaines années, et cette annonce positionne AMD comme un acteur sérieux de l'inférence locale, aux côtés d'un Nvidia dont la domination sur le segment serveur reste, pour l'instant, intacte.

UELes entreprises européennes soumises au RGPD, cabinets juridiques, services de santé, bureaux d'études, disposent d'une option d'inférence IA locale à coût réduit, garantissant la confidentialité des données sans dépendance à des services cloud tiers.

💬 235 milliards de paramètres dans un boîtier format livre, c'est le genre de démo Computex qu'on met de côté... sauf que là, ça repose sur quelque chose de réel : la mémoire unifiée qui résout enfin le problème de VRAM qui nous bloquait depuis des années. Pour les cabinets, les services de santé, toutes les structures qui ne peuvent pas balancer leurs données sur le cloud, c'est une vraie porte qui s'ouvre. ROCm n'est pas encore CUDA, attention, mais pour de l'inférence locale avec Ollama, ça passe.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic