Aller au contenu principal
BusinessVentureBeat AI4h· 2 min de lecture

Claude Fable 5 indisponible plusieurs semaines : deux tiers des entreprises ont déjà un plan de secours

Source originale ↗·

Deux tiers des entreprises avaient déjà couvert leurs paris sur l'IA avant même la panne de Claude Fable 5, selon une nouvelle étude de VentureBeat Pulse Research menée auprès de 145 entreprises en juin 2026. Le 12 juin, un ordre de contrôle des exportations américain a mis hors ligne Claude Fable 5, le modèle le plus performant du marché, pour tous les clients, sans préavis ni calendrier de retour. Anthropic, incapable de vérifier la nationalité des utilisateurs en temps réel, a dû suspendre l'accès pour tout le monde. Le modèle est revenu cette semaine avec des garde-fous renforcés, mais entre-temps la société chinoise Z.ai avait profité du vide en publiant son modèle à poids ouverts GLM-5.2, suivi mercredi d'un environnement de codage agentique appelé Zcode. OpenAI a de son côté dévoilé un aperçu de sa gamme GPT-5.6 le 26 juin. L'étude révèle que 51% des entreprises combinent déjà modèles propriétaires fermés et modèles open-weight déployés sur leur propre infrastructure, et que 16% supplémentaires retirent carrément leurs flux de travail critiques des API fermées. Un tiers seulement misait tout sur les écosystèmes fermés au moment de la coupure.

Cette panne a mis en lumière un problème plus profond que la simple dépendance à un fournisseur: le manque criant de supervision. Seulement une entreprise sur dix dispose d'une surveillance automatisée capable de détecter une dérive, un dysfonctionnement ou une panne d'un modèle d'IA en production. Environ un quart des entreprises ne découvriraient un problème qu'après un signalement par les utilisateurs, ou n'ont tout simplement aucune visibilité pour le détecter. Plus préoccupant encore, 79% des organisations ont déjà subi un impact financier ou opérationnel réel lié à des agents autonomes, le plus souvent via du "shadow AI": des employés lançant des agents non autorisés sur leurs propres cartes de crédit professionnelles, en dehors de tout contrôle. Les chercheurs baptisent cet écart entre l'agressivité du déploiement de l'IA et la capacité réelle à la superviser le "Control Gap", un fossé que la panne de juin a transformé en test de résistance grandeur nature.

Ce épisode s'inscrit dans un printemps déjà marqué par la découverte du coût réel de la dépendance à l'IA. Uber avait épuisé tout son budget IA 2026 en quatre mois seulement, après que l'adoption de Claude Code a atteint 84% de ses quelque 5 000 ingénieurs, selon Forbes. Microsoft a de son côté annulé la majorité des licences internes Claude Code dans ses divisions Windows et Microsoft 365, réorientant ses équipes vers ses propres outils, rapporte The Verge. Fable 5 avait pourtant été lancé le 9 juin sous les acclamations, malgré un tarif élevé de 10 dollars par million de tokens en entrée et 50 dollars en sortie. La leçon de juin est plus dure: le modèle dont dépendent vos flux de travail peut disparaître du jour au lendemain, sur simple décision gouvernementale, sans que ni vous ni votre fournisseur n'y soyez pour quelque chose, pendant que des acteurs chinois comme DeepSeek continuent de proposer des modèles puissants et perturbateurs.

Impact France/UE

Les entreprises françaises et européennes dépendant de l'API Claude via des flux de travail critiques sont exposées au même risque de coupure soudaine et doivent renforcer leur supervision et leurs plans de secours.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Le prochain défi de Claude en entreprise : pas les modèles, mais le plan de contrôle des agents
1VentureBeat AI 

Le prochain défi de Claude en entreprise : pas les modèles, mais le plan de contrôle des agents

Selon de nouvelles données publiées par VentureBeat Pulse, la prochaine bataille stratégique dans l'IA d'entreprise ne portera pas sur la qualité des modèles, mais sur le contrôle de la couche d'orchestration des agents. Le tracker indépendant VB Pulse, qui mesure régulièrement les préférences de décideurs techniques qualifiés en entreprise, révèle que Microsoft Copilot Studio et Azure AI Studio dominent ce segment avec 38,6 % d'adoption principale en février 2026, en hausse depuis 35,7 % en janvier. L'API Assistants et Responses d'OpenAI occupe la deuxième place avec 25,7 %, contre 23,2 % un mois plus tôt. Anthropic, lui, fait sa première apparition dans ce tracker : passant de 0 % en janvier à 5,7 % en février pour l'usage de ses outils et workflows natifs, soit quatre répondants sur un panel de 70 décideurs. Sur la couche modèle, les données sont encore plus spectaculaires pour l'entreprise de Dario Amodei : Claude est passé de 23,9 % en janvier à 28,6 % en février, puis à 56,2 % en mars, bien que cette dernière mesure soit qualifiée de directionnelle en raison d'un échantillon réduit à 16 répondants. Ce glissement d'Anthropic depuis la couche modèle vers l'orchestration native représente un signal stratégique significatif, même si les chiffres absolus restent modestes. Les entreprises ne choisissent plus seulement un chatbot ou un moteur de génération de texte : elles décident où installer la machinerie opérationnelle de leur IA, quels outils les agents peuvent appeler, quelles données ils peuvent consulter, quels workflows ils peuvent déclencher, et comment prouver aux équipes de sécurité que ces agents n'ont rien fait d'interdit. Tom Findling, PDG de la startup de cybersécurité IA Conifers, résume l'enjeu : les entreprises déplacent leur focus de la qualité du modèle vers le plan de contrôle qui l'entoure, notamment en matière de gouvernance, d'auditabilité et d'orchestration dans des environnements clients complexes. L'enjeu est d'autant plus lourd que remplacer un modèle reste relativement simple en théorie, une entreprise peut router une tâche vers Claude, une autre vers GPT, une troisième vers Gemini. Remplacer un runtime d'agents, en revanche, implique de reconfigurer des pipelines entiers, des intégrations d'outils, des politiques d'accès aux données et des mécanismes d'audit. Celui qui contrôle cette couche crée une dépendance bien plus profonde que celle d'un modèle. Microsoft dispose d'un avantage de distribution considérable dans les entreprises, et OpenAI d'une base installée bien plus large en orchestration. Mais la montée en puissance de Claude sur la couche modèle commence visiblement à se propager vers l'orchestration, et c'est précisément là que se joueront les parts de marché les plus durables des prochaines années.

💬 Anthropic gagne la bataille des modèles, et c'est bien, mais la vraie guerre se joue ailleurs. Changer de LLM, c'est l'affaire d'une clé API, mais démonter un runtime d'agents complet avec ses pipelines, ses intégrations et ses politiques d'accès, c'est des mois de boulot. Microsoft tient l'orchestration à 38 % et Anthropic débarque tout juste à 5,7 %, autant dire que c'est encore loin.

BusinessOpinion
1 source
Les organisations IA en entreprise ont un problème d'exécution, pas un problème de modèle, et la plupart construisent la mauvaise solution
2VentureBeat AI 

Les organisations IA en entreprise ont un problème d'exécution, pas un problème de modèle, et la plupart construisent la mauvaise solution

Une enquête publiée par VentureBeat en mai 2026, menée auprès de 132 responsables technologiques de grandes entreprises, révèle que le principal problème de l'IA agentique en production n'est pas le modèle d'intelligence artificielle lui-même, mais l'infrastructure d'exécution. Conduite dans le cadre de la série Pulse Research, l'étude interroge des dirigeants de sociétés d'au moins 100 salariés, dont 35 % dans des entreprises de plus de 10 000 employés, couvrant des secteurs comme la technologie (42 %), les services financiers (20 %) ou la santé (7 %). Résultat central : les agents IA déployés sur des infrastructures sans état, scripts Python, chaînes LangChain, orchestrations improvisées, s'effondrent au contact des exigences opérationnelles réelles. Les redémarrages de conteneurs effacent le contexte, les coûts en tokens dépassent les prévisions, et les hallucinations produites à l'étape 3 d'un workflow se transforment en échecs catastrophiques à l'étape 12. Ce constat a des conséquences concrètes pour des milliers d'équipes d'ingénierie : la majorité d'entre elles consacrent davantage de temps à gérer la "plomberie" de ces systèmes qu'à construire l'intelligence qui était censée justifier l'investissement. L'enquête introduit une distinction structurante entre le "cerveau" (la capacité de raisonnement du modèle) et la "colonne vertébrale" (l'infrastructure d'exécution qui gère l'état, la résilience et la coordination). Si les problèmes d'intégration et de gouvernance restent le premier facteur de défaillance cité, les problèmes d'infrastructure arrivent juste derrière. Et 17 % des répondants identifient encore le modèle lui-même comme la cause principale, ce qui n'est pas anecdotique : ces entreprises signalent que les modèles restent insuffisamment fiables pour les cas limites que leurs workflows génèrent. Ce rapport s'inscrit dans une série de recherches commencée au premier trimestre 2026 autour du concept de "Governance Mirage" : 43 % des entreprises interrogées alors déclaraient avoir une équipe centrale responsable de la gouvernance IA, tandis que 23 % ne s'accordaient pas sur cette question, et 31 % pointaient l'opacité des fournisseurs comme obstacle principal. Le parallèle avec la vague RPA (automatisation robotique des processus) il y a dix ans est explicitement évoqué : un cimetière de pilotes brillants incapables de passer le cap du "Jour 2". Selon VentureBeat, les organisations qui survivront à ce qu'il appelle l'"Agentic Reckoning" seront celles qui traiteront la durabilité de l'infrastructure d'exécution comme une priorité d'ingénierie de premier ordre, et non comme un problème à corriger à coups de relances et de prompts.

BusinessOpinion
1 source
Une entreprise aurait dépensé 500 millions de dollars en Claude en un mois, faute de limites d'utilisation
3The Decoder 

Une entreprise aurait dépensé 500 millions de dollars en Claude en un mois, faute de limites d'utilisation

Une entreprise dont l'identité n'a pas été divulguée aurait dépensé 500 millions de dollars en licences Claude en l'espace d'un seul mois, selon des informations rapportées par The Decoder. La cause serait aussi simple que coûteuse : aucun plafond d'utilisation n'avait été configuré. Le déploiement de l'IA d'Anthropic s'est ainsi propagé sans contrôle au sein de l'organisation, accumulant des appels au modèle à un rythme que personne n'avait anticipé ni encadré. Ce cas illustre une réalité que les directions informatiques commencent à découvrir à leurs dépens : l'adoption rapide de l'IA générative, sans gouvernance technique, peut transformer une promesse de productivité en gouffre financier. Sans expertise en sélection de modèles, en ingénierie du contexte ou en optimisation des requêtes, chaque usage superflu s'additionne silencieusement. Les coûts d'inférence, souvent perçus comme marginaux à l'échelle individuelle, deviennent massifs à l'échelle d'une grande organisation sans garde-fous. L'incident s'inscrit dans une période où les entreprises signent des contrats pluriannuels avec Anthropic, OpenAI ou Google pour intégrer leurs modèles en profondeur dans leurs flux de travail. Anthropic, valorisée à plus de 60 milliards de dollars, compte parmi ses clients des géants de la tech et de la finance qui déploient Claude à grande échelle. Cette anecdote, quelle que soit son exactitude, pointe vers un enjeu structurel : la maîtrise des coûts liés à l'IA est désormais une compétence critique, au même titre que la cybersécurité ou la gestion de l'infrastructure cloud.

UELes entreprises françaises et européennes déployant des LLMs à grande échelle s'exposent au même risque de dérive budgétaire en l'absence de gouvernance technique et de plafonds d'utilisation.

💬 500 millions en un mois parce que personne n'a pensé à mettre un plafond, c'est presque admirable comme négligence. Ce qui me frappe, c'est que ça va arriver à beaucoup d'autres, et pas seulement aux géants : dès qu'on déploie un modèle en interne sans rate limiting ni monitoring des coûts, la facture monte en silence. La gouvernance des APIs LLM, c'est devenu aussi critique que la gestion des droits IAM, et la plupart des équipes ne l'ont pas encore intégré.

BusinessOpinion
1 source
Pourquoi les entreprises chinoises de l’IA accélèrent leur expansion mondiale ?
4Le Big Data 

Pourquoi les entreprises chinoises de l’IA accélèrent leur expansion mondiale ?

En l'espace de quelques jours fin avril 2026, trois startups chinoises d'intelligence artificielle ont concentré à elles seules plus de 11 milliards de dollars de financements potentiels ou confirmés. DeepSeek, fondée en 2023 avec le soutien du fonds quantitatif HighFlyer, s'apprête à réaliser sa toute première levée de fonds externe : le tour de table, initialement envisagé à 300 millions de dollars pour une valorisation de 10 milliards, pourrait atteindre 7 milliards de dollars et valoriser l'entreprise à près de 50 milliards. Moonshot AI, créateur des modèles Kimi, a de son côté levé 2 milliards de dollars sous la conduite de Meituan, portant ses financements cumulés à 3,9 milliards en six mois et sa valorisation au-delà de 20 milliards. StepFun, basée à Shanghai, serait quant à elle proche de finaliser une levée de 2,5 milliards de dollars, selon des sources proches du dossier. Ces chiffres signalent un tournant dans la perception des acteurs chinois de l'IA par les investisseurs mondiaux. Pendant des années, le capital-risque technologique en Chine a stagné depuis 2021, les investisseurs doutant de la capacité des startups locales à transformer leurs modèles en revenus durables. Ce doute s'estompe : les entreprises chinoises ont démontré qu'elles pouvaient non seulement produire des modèles de classe mondiale, mais aussi les intégrer dans des usages concrets et monétisables. Moonshot, par son partenariat avec Meituan, déploie des agents capables de réserver des hôtels ou commander des repas, tandis que son modèle Kimi K2.6 peut orchestrer jusqu'à 300 sous-agents simultanément pour automatiser des tâches complexes en programmation. StepFun déploie déjà ses modèles sur des millions d'appareils, des smartphones aux véhicules intelligents, visant une IA embarquée à grande échelle plutôt qu'un simple chatbot. Ce regain de dynamisme s'inscrit dans un contexte de compétition mondiale accélérée avec les laboratoires américains comme OpenAI, Google DeepMind ou Anthropic. DeepSeek avait marqué les esprits début 2025 en publiant en open source ses modèles R1 puis V4, prouvant qu'un acteur chinois pouvait rivaliser techniquement avec des budgets bien inférieurs. Cette stratégie ouverte a construit une crédibilité internationale que les investisseurs valorisent aujourd'hui massivement. La question qui se pose désormais est celle de l'expansion hors de Chine : ces entreprises ne cherchent plus seulement à rattraper la Silicon Valley, elles visent à imposer leurs plateformes, leurs infrastructures et leurs standards dans les marchés asiatiques, européens et émergents, là où les acteurs américains n'ont pas encore consolidé leur position.

UELes startups chinoises de l'IA ciblent explicitement les marchés européens pour leur expansion, ce qui pourrait modifier l'équilibre concurrentiel et offrir aux acteurs européens des alternatives aux plateformes américaines.

💬 11 milliards en quelques jours, c'est plus le signal d'un rattrapage, c'est celui d'une offensive. Ce qui a changé par rapport à 2023, c'est que Moonshot ou StepFun ne vendent plus des benchmarks : ils déploient des agents qui réservent des hôtels et font tourner de l'IA embarquée sur des millions d'appareils. Et l'Europe, là-dedans, c'est exactement le terrain que ces boîtes visent, là où ni Google ni OpenAI n'ont vraiment verrouillé quoi que ce soit.

BusinessOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic