InfrastructureNext INpact · 17 juin 2026, 18:38· 2 min de lecture

☕️ Microsoft se tournerait vers AWS pour absorber l’explosion des usages IA sur GitHub

Microsoft aurait discrètement conclu un accord avec Amazon Web Services pour absorber le trop-plein de trafic sur GitHub, selon deux sources internes citées par Business Insider. La plateforme de code, rachetée par Microsoft en 2018, subit depuis fin 2024 une pression sans précédent liée à l'explosion des outils de développement assistés par IA, notamment GitHub Copilot et ses agents autonomes. Le 3 avril 2026, Kyle Daigle, directeur des opérations de GitHub, chiffrait publiquement l'ampleur du phénomène : la plateforme enregistrait désormais 275 millions de commits par semaine, contre un milliard sur l'ensemble de l'année 2025, soit un rythme annualisé de 14 milliards. Microsoft n'a pas confirmé le recours spécifique à AWS, mais un porte-parole a reconnu une "stratégie multi-cloud", évoquant "l'incroyable pic du développement des agents" qui aurait "mis à l'épreuve les limites de l'infrastructure".

La situation illustre un paradoxe industriel saisissant : ce sont les propres outils d'IA de Microsoft qui génèrent une demande que son cloud maison, Azure, ne parvient plus à satisfaire. Fin avril, plusieurs développeurs influents avaient publiquement annoncé leur intention de quitter GitHub en raison de pannes répétées imputées à cette surcharge. L'ironie est d'autant plus mordante que Microsoft avait annoncé en octobre dernier vouloir migrer intégralement GitHub vers Azure dans un délai de 24 mois, faisant de la plateforme une vitrine stratégique de sa puissance cloud. Devoir solliciter son principal concurrent pour tenir debout fragilise ce discours commercial et interroge la capacité d'Azure à accompagner les pics de croissance liés à l'IA générative, précisément le segment où Microsoft entend dominer.

GitHub occupe une position centrale dans l'écosystème mondial du développement logiciel, avec plus de 100 millions de développeurs enregistrés. Son passage sous pavillon Microsoft avait déjà suscité des inquiétudes sur l'indépendance de la plateforme ; la dépendance croissante à Copilot et l'introduction récente d'une facturation à l'usage de cet outil ont ravivé ces tensions. La question du multi-cloud n'est pas nouvelle dans l'industrie, mais elle prend une dimension politique particulière quand elle oppose deux géants du secteur en compétition directe sur l'IA. Microsoft doit désormais arbitrer entre la priorité donnée à Azure comme infrastructure de référence et la nécessité opérationnelle de garantir la stabilité d'un service critique, sans quoi GitHub risque de perdre la confiance de la communauté des développeurs au profit d'alternatives comme GitLab ou Codeberg.

Dans nos dossiers

Microsoft Azure AWS

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Decoder

Nvidia perd du terrain sur les puces IA : Microsoft se tourne vers AMD, et Anthropic pourrait suivre

Microsoft élargit l'infrastructure IA d'Azure en intégrant Helios, la nouvelle plateforme d'AMD, qui doit concurrencer directement les systèmes GPU de Nvidia à partir du second semestre 2026. Cette annonce marque un tournant dans la stratégie d'approvisionnement en puces du géant du cloud, jusqu'ici très dépendant de Nvidia pour ses charges de travail liées à l'intelligence artificielle. Un profil GitHub public suggère par ailleurs qu'Anthropic teste également du matériel AMD, ce qui indique que l'entreprise pourrait suivre le mouvement amorcé par Microsoft et diversifier ses propres fournisseurs de calcul. Cette évolution représente une pression supplémentaire sur le pouvoir de fixation des prix de Nvidia, qui domine largement le marché des puces dédiées à l'entraînement et à l'inférence des modèles d'IA. Pour les grands fournisseurs de cloud et les laboratoires d'IA, disposer d'une alternative crédible comme AMD permet de négocier de meilleurs tarifs et de réduire la dépendance à un fournisseur unique, un enjeu stratégique majeur compte tenu des sommes colossales investies dans les infrastructures de calcul. Pour les utilisateurs finaux, une concurrence accrue pourrait à terme se traduire par une baisse des coûts d'accès aux services d'IA hébergés sur le cloud. Ce mouvement s'inscrit dans un contexte plus large où les grands acteurs technologiques cherchent à diversifier leurs sources d'approvisionnement en puces, face à la demande explosive de capacité de calcul pour l'IA générative et aux tensions sur les chaînes d'approvisionnement. Nvidia reste pour l'instant le leader incontesté du marché, mais l'arrivée de plateformes concurrentes crédibles comme Helios d'AMD, combinée à l'intérêt manifesté par des clients de poids comme Microsoft et potentiellement Anthropic, pourrait redessiner les rapports de force dans les prochaines années et inciter d'autres acteurs à suivre cette diversification.

InfrastructureActu

1 source

2VentureBeat AI

Microsoft lance le Surface RTX Spark Dev Box pour faire tourner de grands modèles IA sans recourir au cloud

Microsoft a dévoilé lundi le Surface RTX Spark Dev Box lors de la conférence Build 2026, un ordinateur de bureau compact destiné aux développeurs de logiciels qui souhaitent faire tourner de grands modèles d'intelligence artificielle en local, sans passer par le cloud. La machine embarque le nouveau processeur RTX Spark d'Nvidia, basé sur l'architecture Blackwell, et dispose de 128 gigaoctets de mémoire unifiée partagée dynamiquement entre le CPU et le GPU. Cette configuration permet d'atteindre un pétaflop de puissance de calcul IA, ce qui autorise l'exécution de modèles dépassant 120 milliards de paramètres sans envoyer la moindre requête vers un serveur distant. Pavan Davuluri, vice-président exécutif de Windows et Devices chez Microsoft, a précisé que la mémoire joue un rôle critique : à 100 000 tokens de contexte, le cache clé-valeur d'un grand modèle peut à lui seul consommer entre 40 et 50 gigaoctets, ce qui explique le choix de ce pool mémoire de 128 Go. L'appareil sera commercialisé exclusivement sur Microsoft.com aux États-Unis d'ici la fin de l'année, sans prix annoncé à ce stade. L'enjeu est directement économique. Les entreprises de toutes tailles font face à des factures cloud GPU qui s'accumulent de façon imprévisible : chaque appel d'inférence, chaque cycle de fine-tuning, chaque workflow agentique qui itère sur un modèle frontier génère des coûts qui s'emballent pour un développeur testant son prototype des dizaines de fois par jour. Andrew Hill, vice-président de Surface, a résumé la promesse dans le billet d'annonce : le Dev Box "change l'équation" en permettant aux équipes de "réserver les appels aux modèles frontier aux vrais problèmes frontier, et de traiter le reste sur leur propre matériel." La proposition n'est pas que le cloud soit dépassé, mais qu'une large partie des tâches actuellement envoyées à des datacenters distants ne justifie pas des modèles de pointe et serait mieux servie par du matériel local à coût fixe et prévisible. Ce lancement marque un tournant stratégique notable pour Microsoft, dont Azure génère plusieurs dizaines de milliards de dollars de revenus annuels. En commercialisant explicitement un appareil qui réduit la dépendance au cloud de ses propres clients, l'entreprise reconnaît une tension structurelle qui monte dans l'industrie depuis l'explosion des coûts d'inférence. Le pari de Redmond est que les développeurs qui prototypent en local déploieront ensuite sur Azure lorsqu'ils auront besoin de passer à l'échelle, et que contrôler les deux extrémités de ce cycle de développement est plus rentable que de n'en posséder qu'une. L'architecture RTX Spark, qui fusionne CPU ARM et GPU Blackwell en un seul chip avec mémoire unifiée, remplace quatre composants distincts d'un PC classique et ouvre la voie à une nouvelle génération de postes de travail IA autonomes.

InfrastructureOpinion

1 source

3Le Big Data

Avec 3M, Microsoft accélère la course aux infrastructures qui feront tourner l’IA de demain

Microsoft et 3M ont annoncé le 15 juillet 2026 un partenariat stratégique autour des infrastructures d'intelligence artificielle. Selon le communiqué officiel, Azure deviendra le premier fournisseur de cloud hyperscale à déployer la technologie propriétaire Expanded Beam Optical (EBO) de 3M dans ses centres de données. En contrepartie, 3M intégrera les plateformes d'IA de Microsoft afin d'accélérer sa propre transformation numérique dans plusieurs fonctions de l'entreprise. Cette technologie de connectique optique utilise un faisceau élargi plutôt qu'un contact direct entre les fibres, ce qui limite les effets de la poussière et des contaminations lors de l'installation et de la maintenance des réseaux. Microsoft affirme que ses premiers déploiements internes ont permis de raccourcir les délais de mise en service du réseau dans certains environnements, sans toutefois communiquer de chiffres précis sur ces gains. Cet accord illustre un déplacement du terrain de compétition dans l'IA. Pendant longtemps, la rivalité entre géants technologiques s'est jouée sur les modèles génératifs et les puces de calcul, à l'image des processeurs Maia et Cobalt que Microsoft développe en interne pour ses centres de données, comme l'avait rapporté Reuters. Désormais, la fiabilité et la rapidité de déploiement des infrastructures physiques deviennent un enjeu tout aussi déterminant. Face à l'explosion des charges de travail liées à l'IA générative, chaque amélioration apportée à la connectivité, à la consommation énergétique ou à la fiabilité des équipements se traduit directement par des économies sur les coûts d'exploitation et par une mise en service plus rapide des nouvelles capacités de calcul. Pour les opérateurs de cloud comme pour leurs clients entreprises, cela signifie des services d'IA disponibles plus vite et potentiellement moins coûteux à faire tourner. Ce rapprochement s'inscrit dans une tendance plus large où les industriels traditionnels deviennent des partenaires stratégiques des géants du cloud. Face à la demande croissante des hyperscalers, 3M annonce augmenter ses capacités de production et poursuivre la standardisation de sa technologie via l'accord multi-sources EBO (MSA), dans l'objectif de favoriser son adoption par d'autres opérateurs de centres de données au-delà de Microsoft. Cette dynamique rappelle que la course à l'IA ne se limite plus aux laboratoires de recherche ou aux fabricants de semi-conducteurs : les fournisseurs de matériaux avancés, de connectique et de solutions industrielles pour data centers deviennent eux aussi des maillons critiques de la chaîne de valeur, alors que les besoins en capacité de calcul continuent de croître à un rythme soutenu.

InfrastructureActu

1 source

4The Information AI

L'AWS fait face a une forte demande, poussant de plus en plus de startups a se tourner vers de nouveaux fournisseurs cloud

Arcee, une startup spécialisée dans l'intelligence artificielle open-source, avait signé en 2024 un engagement de 8 millions de dollars sur trois ans avec Amazon Web Services pour stocker ses données et faire tourner ses modèles d'IA. Problème selon son PDG Mark McQuade : l'entreprise n'est pas parvenue à obtenir suffisamment de serveurs équipés de puces Nvidia sur AWS pour répondre à ses besoins de calcul. Résultat, Arcee a fini par exécuter la majorité de ses modèles ailleurs, notamment chez des acteurs cloud plus récents comme Hugging Face et Together, plutôt que chez le géant du secteur. Cette situation illustre une tension croissante dans l'industrie de l'IA : la demande en puissance de calcul explose plus vite que les grands fournisseurs cloud ne peuvent l'absorber, même pour des clients ayant contractuellement réservé des ressources. Pour des startups comme Arcee, dépendre d'un fournisseur historique saturé devient un frein direct à l'innovation et à la mise en production de leurs modèles. Cela ouvre une brèche commerciale pour des plateformes spécialisées dans l'hébergement et l'exécution de modèles d'IA, capables de proposer un accès plus rapide au matériel Nvidia. Le cas d'Arcee reflète un mouvement plus large où des clients d'AWS, historiquement fidèles au leader du cloud, se tournent vers des alternatives pour contourner les pénuries de capacité GPU. Cette pénurie, alimentée par la ruée mondiale vers l'entraînement et le déploiement de grands modèles de langage, redessine les rapports de force entre fournisseurs cloud traditionnels et nouveaux entrants spécialisés dans l'infrastructure IA.

💬 Bon, ça devait arriver. Réserver du GPU contractuellement chez AWS et se retrouver quand même à sec, c'est le signe que même les géants du cloud n'ont plus la marge pour absorber la demande. La vraie nouvelle, c'est pas qu'Arcee change de crémerie, c'est que la pénurie de calcul redistribue les cartes entre gros clouds et acteurs spécialisés comme Hugging Face ou Together. Selon Le Fil IA, la fidélité à AWS ne pèse plus rien face à une puce Nvidia disponible ailleurs.

InfrastructureActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic