InfrastructureLe Big Data6h· 2 min de lecture

Google aurait limité l’usage de Gemini par Meta, mais pourquoi ?

Selon le Financial Times, Google a demandé à Meta de réduire sa consommation de ressources liées à son modèle Gemini dès le mois de mars 2026, après avoir atteint les limites de sa capacité de calcul. Meta ne sollicitait pas Gemini pour de simples expérimentations : l'entreprise s'appuyait déjà sur le modèle de Google pour des opérations critiques, notamment le développement logiciel interne, les chatbots publicitaires, le service client et la détection de contenus frauduleux. Ce recours massif à une IA externe s'explique par des performances supérieures à celles des solutions maison de Meta sur plusieurs cas d'usage stratégiques, ce qui a entraîné une montée en charge que Google n'a finalement pas pu absorber sans friction.

Cet épisode illustre une réalité que l'on tend à oublier face aux annonces triomphales des géants de la tech : les infrastructures physiques restent le véritable goulot d'étranglement de l'industrie de l'IA. Construire des centres de données prend des années, et la demande en puissance de calcul croît plus vite que les capacités mondiales de production. Pour Meta, la situation est d'autant plus inconfortable que l'entreprise ne dispose d'aucun service cloud grand public qui lui permettrait d'amortir ses besoins en mutualisant les ressources. Résultat : l'un des groupes les plus capitalisés au monde se retrouve dépendant de son concurrent direct pour faire tourner des fonctions commerciales essentielles, une vulnérabilité stratégique considérable.

Le paradoxe va plus loin encore : Google lui-même n'est pas à l'abri de ces tensions sur les ressources. La firme de Mountain View loue désormais des serveurs auprès de SpaceX pour environ un milliard de dollars par mois afin d'alimenter ses propres services. Meta a annoncé prévoir 600 milliards de dollars d'investissements dans ses infrastructures, mais ces capacités mettront des années à sortir de terre. En attendant, toute l'industrie se retrouve dans une situation absurde où les acteurs les plus puissants se disputent les mêmes ressources rares. Les analystes pointent régulièrement l'écart grandissant entre les investissements colossaux consentis et des revenus liés à l'IA encore marginaux, tandis que le prix des tokens continue d'augmenter. Cette pénurie de calcul n'est pas un accident conjoncturel : c'est la contrainte structurelle qui va redessiner les rapports de force entre les grands acteurs de l'IA dans les prochaines années.

Dans nos dossiers

Gemini Meta IA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Next INpact

☕️ Google va louer de l’infra IA chez SpaceX pour 920 millions de dollars par mois

Google a signé le 5 juin un accord avec SpaceX pour louer jusqu'à 110 000 GPU NVIDIA opérés par xAI, l'entreprise d'intelligence artificielle d'Elon Musk. Le contrat, révélé dans un document déposé auprès de la SEC, prévoit un loyer mensuel de 920 millions de dollars sur une période allant d'octobre 2026 à juin 2029, pour un montant total estimé à 30,3 milliards de dollars. Une phase de mise à disposition progressive est prévue dès septembre 2026, et Google dispose d'une clause de sortie sans pénalité entre octobre et décembre 2026 si SpaceX ne peut pas fournir les capacités promises. Cet accord intervient trois jours après que Google a annoncé son intention de lever 80 milliards de dollars pour financer ses propres infrastructures de calcul, tout en révélant un carnet de commandes lié à l'IA de 460 milliards de dollars, dont la moitié doit être réalisée dans les 24 prochains mois. Que le premier fournisseur de cloud mondial soit contraint de louer des ressources informatiques à un concurrent dit quelque chose de la pression extraordinaire qui s'exerce sur les capacités de calcul IA en ce moment. Google justifie l'accord comme "opportun et à court terme" pour répondre à une demande dépassant ses prévisions sur Gemini Enterprise, sa plateforme d'agents d'entreprise. L'ampleur du contrat illustre concrètement ce que signifie une pénurie de GPU à l'échelle industrielle : même les géants du cloud ne peuvent pas toujours livrer dans les délais sans externaliser. Pour les entreprises clientes de Google, c'est une garantie de capacité ; pour l'industrie, c'est le signal que la course aux infrastructures IA crée des dépendances croisées inédites entre concurrents directs. Ce deal s'inscrit dans une relation plus complexe qu'une simple transaction commerciale. Google détenait 6,11 % du capital de SpaceX fin 2025, et conserverait environ 5 % après la fusion de SpaceX avec X et xAI selon Bloomberg, ce qui fait de Mountain View l'un des actionnaires d'Elon Musk. Pour SpaceX, l'accord tombe à un moment stratégique : l'entreprise prépare activement son introduction en bourse à 135 dollars l'action, pour une valorisation d'environ 1 750 milliards de dollars, et ce contrat démontre sa capacité à monétiser ses investissements IA malgré leur coût élevé. SpaceX avait déjà signé un accord similaire avec Anthropic, portant sur les GPU du datacenter Colossus I pour 1,25 milliard de dollars par mois. Si ces deux contrats sont honorés à pleine mesure, la question se pose de savoir quelles ressources de calcul resteront disponibles pour entraîner et faire tourner les propres modèles d'IA de SpaceX.

UELes entreprises européennes clientes de Gemini Enterprise bénéficient indirectement de la garantie de capacité de calcul, mais l'accord ne crée pas d'impact réglementaire ou économique direct sur la France ou l'UE.

💬 Le premier fournisseur de cloud mondial qui loue des GPU chez un concurrent pour tenir ses clients, ça résume mieux que n'importe quel rapport l'état réel de la pénurie. Ce qui me perturbe, c'est qu'Anthropic a signé un deal similaire chez SpaceX au même moment pour 1,25 milliard par mois : tu te demandes bien comment les mêmes machines vont servir deux gros clients en simultané. La clause de sortie sans pénalité en fin 2026 montre que Google n'est pas totalement dupe, ce qui est peut-être la seule vraie bonne nouvelle ici.

InfrastructureOpinion

1 source

2The Information AI

Google négocierait le financement d'un data center de plusieurs milliards pour Anthropic

Google serait en négociation pour financer partiellement la construction d'un datacenter de plusieurs milliards de dollars au Texas, destiné à être loué par Anthropic, selon des informations du Financial Times. Le montage financier envisagé passerait par des prêts à la construction accordés à Nexus Data Centers, l'opérateur du site qui détient le bail avec Anthropic. Le montant exact n'a pas été divulgué, mais l'expression « multibillion-dollar » laisse entrevoir une infrastructure d'envergure. Ce projet illustre la dépendance croissante des laboratoires d'IA aux investissements massifs en infrastructure de calcul. Pour Anthropic, accéder à une capacité de calcul dédiée et à grande échelle est indispensable pour entraîner et déployer ses modèles Claude à un niveau compétitif face à OpenAI et Google DeepMind. Pour Google, financer l'infrastructure de son partenaire stratégique — dans lequel il a déjà investi plus de 2 milliards de dollars — renforce un écosystème dans lequel ses propres intérêts sont engagés. Ce mouvement s'inscrit dans une course mondiale aux datacenters alimentée par l'explosion de la demande en IA générative. Microsoft construit des infrastructures pour OpenAI, Amazon pour ses propres services et Anthropic via AWS. Le fait que Google joue désormais aussi le rôle de bailleur de fonds pour Anthropic, en plus de partenaire cloud, témoigne de l'intrication croissante entre financement, infrastructure et développement des modèles dans l'industrie de l'IA.

InfrastructureOpinion

1 source

3Next INpact

☕️ Microsoft se tournerait vers AWS pour absorber l’explosion des usages IA sur GitHub

Microsoft aurait discrètement conclu un accord avec Amazon Web Services pour absorber le trop-plein de trafic sur GitHub, selon deux sources internes citées par Business Insider. La plateforme de code, rachetée par Microsoft en 2018, subit depuis fin 2024 une pression sans précédent liée à l'explosion des outils de développement assistés par IA, notamment GitHub Copilot et ses agents autonomes. Le 3 avril 2026, Kyle Daigle, directeur des opérations de GitHub, chiffrait publiquement l'ampleur du phénomène : la plateforme enregistrait désormais 275 millions de commits par semaine, contre un milliard sur l'ensemble de l'année 2025, soit un rythme annualisé de 14 milliards. Microsoft n'a pas confirmé le recours spécifique à AWS, mais un porte-parole a reconnu une "stratégie multi-cloud", évoquant "l'incroyable pic du développement des agents" qui aurait "mis à l'épreuve les limites de l'infrastructure". La situation illustre un paradoxe industriel saisissant : ce sont les propres outils d'IA de Microsoft qui génèrent une demande que son cloud maison, Azure, ne parvient plus à satisfaire. Fin avril, plusieurs développeurs influents avaient publiquement annoncé leur intention de quitter GitHub en raison de pannes répétées imputées à cette surcharge. L'ironie est d'autant plus mordante que Microsoft avait annoncé en octobre dernier vouloir migrer intégralement GitHub vers Azure dans un délai de 24 mois, faisant de la plateforme une vitrine stratégique de sa puissance cloud. Devoir solliciter son principal concurrent pour tenir debout fragilise ce discours commercial et interroge la capacité d'Azure à accompagner les pics de croissance liés à l'IA générative, précisément le segment où Microsoft entend dominer. GitHub occupe une position centrale dans l'écosystème mondial du développement logiciel, avec plus de 100 millions de développeurs enregistrés. Son passage sous pavillon Microsoft avait déjà suscité des inquiétudes sur l'indépendance de la plateforme ; la dépendance croissante à Copilot et l'introduction récente d'une facturation à l'usage de cet outil ont ravivé ces tensions. La question du multi-cloud n'est pas nouvelle dans l'industrie, mais elle prend une dimension politique particulière quand elle oppose deux géants du secteur en compétition directe sur l'IA. Microsoft doit désormais arbitrer entre la priorité donnée à Azure comme infrastructure de référence et la nécessité opérationnelle de garantir la stabilité d'un service critique, sans quoi GitHub risque de perdre la confiance de la communauté des développeurs au profit d'alternatives comme GitLab ou Codeberg.

InfrastructureOpinion

1 source

4Le Big Data

Broadcom et Meta : un partenariat à l’échelle du Gigawatt pour le futur de l’IA

Meta et Broadcom ont officialisé le 14 avril 2026 un partenariat stratégique pluriannuel pour bâtir l'une des infrastructures de calcul IA les plus massives jamais conçues. Dès la première phase, la capacité déployée dépasse 1 gigawatt, avec une trajectoire assumée vers plusieurs gigawatts dans les années à venir. Au cœur du dispositif : les puces propriétaires MTIA (Meta Training and Inference Accelerator), conçues pour optimiser à la fois l'entraînement et l'inférence des modèles d'IA. Broadcom fournit l'ensemble de la chaîne matérielle, de la conception des accélérateurs via sa plateforme XPU à leur interconnexion réseau haut débit. La collaboration est prévue pour durer jusqu'en 2029 au moins, avec des générations successives de puces MTIA adaptées aux besoins évolutifs de Meta. Ce partenariat représente un changement d'échelle radical dans la façon dont les grandes plateformes numériques abordent leurs besoins en calcul. Meta ne se contente plus d'acheter des GPU sur étagère : l'entreprise co-conçoit avec Broadcom des accélérateurs taillés sur mesure pour ses propres charges de travail, ce qui permet d'optimiser conjointement la logique de calcul, la gestion mémoire et les transferts de données à haute vitesse. L'enjeu est concret : alimenter des services utilisés quotidiennement par des milliards de personnes, de WhatsApp à Instagram en passant par Threads, tout en réduisant le coût total de possession. Mark Zuckerberg a affiché publiquement l'ambition d'apporter des capacités d'IA avancées à chaque utilisateur, jusqu'à ce qu'il décrit comme une forme de "superintelligence personnelle". À cette échelle, chaque point d'efficacité matérielle se traduit directement en milliards de dollars d'économies ou de capacités supplémentaires. Ce mouvement s'inscrit dans une tendance de fond qui redessine l'industrie du semi-conducteur et des infrastructures cloud. Face à la domination de Nvidia sur le marché des GPU d'IA, les hyperscalers comme Meta, Google ou Amazon investissent massivement dans des puces personnalisées pour réduire leur dépendance à un seul fournisseur et reprendre le contrôle de leur stack matériel. Broadcom, qui accompagne déjà Google avec ses TPU, se positionne comme le partenaire de référence pour ces projets de co-conception à grande échelle. Le choix d'une architecture réseau basée sur Ethernet ouvert plutôt que sur des protocoles propriétaires facilite l'évolutivité et l'intégration dans des data centers existants. Avec des investissements qui se chiffrent désormais en gigawatts plutôt qu'en mégawatts, la course à l'infrastructure IA prend une dimension comparable à celle de l'industrie énergétique, et les prochains trimestres diront si cette stratégie d'hyper-scalabilité donne à Meta l'avantage compétitif recherché face à OpenAI, Google et Microsoft.

InfrastructureOpinion

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic