Dossier OpenAI — page 16

1852 articles · page 16 sur 38

Toute l'actualité d'OpenAI : nouvelles versions de ChatGPT et GPT, stratégie produit, partenariats, controverses et décisions de Sam Altman.

751Le Big Data InfrastructureOpinion

Claude en panne : Anthropic reconnaît un incident, mais que s’est-il passé ?

Le mardi 23 juin 2026, les utilisateurs de Claude ont subi une panne significative touchant plusieurs modèles de l'assistant d'Anthropic. L'incident a débuté à 14h19 UTC (16h19 heure de Paris) et s'est manifesté par des conversations interrompues, des réponses incomplètes et des messages d'erreur bloquant l'accès au chatbot. En quelques dizaines de minutes, plusieurs milliers de signalements ont afflué sur DownDetector, tandis que les réseaux sociaux s'enflammaient entre frustration et réactions humoristiques. Anthropic a rapidement reconnu le problème, indiquant qu'un taux d'erreur élevé affectait plusieurs de ses modèles. Une trentaine de minutes après les premières alertes, l'entreprise annonçait avoir identifié l'origine de l'incident et commencé le déploiement d'un correctif. Peu après, elle confirmait la résolution et le retour progressif à la normale. Cette panne illustre la fragilité des infrastructures sur lesquelles reposent aujourd'hui des millions d'utilisateurs professionnels et grand public. Claude est utilisé massivement en entreprise pour la rédaction, l'analyse de données, le développement logiciel et bien d'autres tâches critiques. Une interruption, même brève, peut bloquer des workflows entiers, retarder des livrables et exposer les organisations à des pertes de productivité réelles. Le fait que l'incident ait suscité autant de réactions en si peu de temps révèle à quel point ces outils sont devenus des dépendances structurelles dans le quotidien professionnel, et non de simples gadgets optionnels. Anthropic reste cependant très discret sur les causes techniques exactes : pas de mention d'un problème d'infrastructure, d'une mise à jour défectueuse ou d'un incident interne précis. Cette prudence communicationnelle est courante dans le secteur, les entreprises attendant généralement la fin de l'analyse complète avant de publier un post-mortem détaillé. Il s'agit par ailleurs d'une nouvelle panne pour Claude, dans un contexte où la fiabilité des IA génératives est un enjeu concurrentiel croissant face à OpenAI, Google et d'autres acteurs. À mesure que ces services s'imposent comme infrastructure critique, les exigences de disponibilité se rapprochent de celles du cloud traditionnel, avec une pression forte sur les fournisseurs pour publier des SLA (accords de niveau de service) clairs et des analyses d'incidents transparentes. Anthropic devra vraisemblablement renforcer sa communication technique si ce type d'incident venait à se reproduire.

UELes utilisateurs professionnels européens, dont les Français, ont subi une interruption de leurs workflows dépendant de Claude, révélant le besoin de SLA transparents de la part des fournisseurs d'IA opérant sur le marché européen.

Aussi sur Numerama

752MarkTechPost

Prime Intellect publie prime-rl 0.6.0 pour entraîner des modèles MoE à mille milliards de paramètres sur des tâches RL à base d'agents

Prime Intellect a publié la version 0.6.0 de son framework open source prime-rl, conçu pour entraîner des modèles de langage de très grande taille via du reinforcement learning asynchrone. Cette mise à jour majeure cible spécifiquement les modèles Mixture-of-Experts (MoE) à l'échelle du trillion de paramètres, avec un focus sur des tâches dites "agentiques" longues et complexes, comme la résolution autonome de bugs logiciels. Pour illustrer les capacités du framework, l'équipe a entraîné GLM-5, le modèle de l'organisation zai-org, sur des tâches d'ingénierie logicielle (SWE) avec des séquences allant jusqu'à 131 000 tokens. Résultat : des temps d'étape inférieurs à cinq minutes, des batchs de 256 rollouts, le tout sur seulement 28 noeuds H200, une efficacité matérielle remarquable pour cette classe de modèles. Le framework est également compatible avec d'autres modèles MoE massifs comme Kimi-K2.7-Code de Moonshot AI ou le Nemotron-3-Ultra-550B de NVIDIA. Ce type d'infrastructure répond à un problème concret du reinforcement learning à grande échelle : les tâches agentiques génèrent des "outliers" temporels, certains rollouts de code pouvant s'étirer sur plusieurs heures. Dans un système synchrone classique, les GPU restent à l'arrêt en attendant la fin de ces longues exécutions avant chaque mise à jour de politique. prime-rl résout ce goulot d'étranglement en découplant complètement le moteur d'inférence du moteur d'entraînement : les deux fonctionnent et scalent indépendamment, avec un unique point de synchronisation au moment de la mise à jour des poids. Côté inférence, le système combine calcul en FP8 avec les kernels DeepEP et DeepGEMM, un "Wide Expert Parallelism" répartissant les experts sur 32 GPU ou plus, une séparation des workers de prefill et de decode, et un système de gestion hiérarchique du cache KV avec offloading vers CPU ou disque. Le mécanisme "Router Replay" (R3) est particulièrement notable : il rejoue les décisions de routage de l'inférence directement sur le trainer, réduisant le décalage KL d'un ordre de grandeur. Cette publication s'inscrit dans une course à la scalabilité du post-training par RL, accélérée par le succès des modèles de raisonnement comme DeepSeek-R1 ou les modèles de la série o1 d'OpenAI. L'approche MoE est devenue centrale pour atteindre des capacités de niveau "trillion de paramètres" sans exploser les coûts de calcul à l'inférence, mais elle impose des contraintes d'orchestration redoutables, notamment la coordination des experts entre des dizaines de GPU. Prime Intellect, qui se positionne sur l'entraînement distribué open source, mise sur prime-rl pour démocratiser l'accès à ces techniques jusqu'ici réservées aux grands laboratoires disposant de clusters propriétaires. La compatibilité avec Slurm et des routeurs comme NVIDIA Dynamo suggère une orientation claire vers des déploiements en production à l'échelle industrielle.

UELes laboratoires et startups européens travaillant sur le post-training par RL peuvent bénéficier de cet outil open source pour entraîner des modèles MoE à très grande échelle sans dépendre de clusters propriétaires.

💬 Le vrai problème du RL agentique, c'est pas la puissance brute, c'est les rollouts qui s'étirent sur des heures et laissent les GPU à l'arrêt. prime-rl règle ça en découplant complètement inférence et entraînement, avec un seul point de synchro, et leur mécanisme R3 réduit le décalage KL d'un ordre de grandeur. Un labo européen sans cluster propriétaire a désormais un chemin crédible vers le post-training RL à l'échelle trillion.

Dossier OpenAI — page 16

Claude en panne : Anthropic reconnaît un incident, mais que s’est-il passé ?

Prime Intellect publie prime-rl 0.6.0 pour entraîner des modèles MoE à mille milliards de paramètres sur des tâches RL à base d'agents

☕️ ChatGPT va illustrer ses réponses avec les photos de Getty Images

DeepSeek réalise une levée géante de plus de 7 milliards de dollars

Dans la foulée de son IPO, SpaceX rachète Cursor et ses modèles dédiés aux développeurs

Anthropic alerte sur l'auto-amélioration récursive des IA

Microsoft Build : MAI-Thinking-1 et la famille de modèles MAI

Opus 4.8

De Google Remy à Gemini Spark : l’avènement de l’agent IA autonome

Anthropic frappe fort : Claude Opus 4.8 écrase déjà GPT-5.5 et Mythos arrive bientôt

DeepSWE : Claude n’est pas aussi doué qu’on ne le pensait en codage, il a triché !

Alexa+ débarque en France : un assistant plus bavard, plus malin et plus cher

Alexa+ arrive en France : Amazon promet une IA « vraiment française » dès aujourd’hui

Deepseek rend permanente sa réduction de 75 %, avec des tokens de sortie jusqu'à 34 fois moins chers que GPT-5.5

Les grands labos d'IA sont désormais des labos d'agents

Musk et Zuckerberg ont convaincu Trump d'abroger le décret présidentiel sur l'IA

Anthropic présente Code with Claude, l'avenir du code selon eux

Google I/O 2026 : Gemini 3.5 Flash, Omni (NanoBanana pour la vidéo), Spark (agents en arrière-plan) et Antigravity 2.0

Gemini Omni : l’IA vidéo de Google maîtrise enfin la physique et les personnages constants

Google lance un agent IA capable de rédiger vos emails, surveiller votre boîte et gérer vos dépenses

Google I/O : nouveaux modèles, agent cloud permanent et refonte de l'application Gemini

L'action Cerebras double presque le premier jour, valorisant le fabricant de puces IA à 100 milliards de dollars

Pourquoi les entreprises chinoises de l’IA accélèrent leur expansion mondiale ?

Pourquoi Claude faisait du chantage ? Anthropic explique enfin (et c’est dingue)

Anthropic utilise le datacenter Colossus-1 de SpaceX et ses 220 000 GPU pour alimenter Claude

[AINews] Silicon Valley prend les services au sérieux

Le gouvernement américain obtient un accès pré-déploiement aux modèles IA de cinq grands laboratoires à des fins de sécurité nationale

MolmoAct2 : un modèle de raisonnement d'action pour le déploiement réel

Le tournant de l'inférence

NVIDIA Nemotron 3 Nano Omni intègre le raisonnement d'agents multimodaux dans un modèle ouvert et efficace

☕️ La Chine bloque l’acquisition de Manus par Meta

DeepSeek réduit ses prix d'API et établit un nouveau plancher pour les grands modèles

SpaceX s’allie à Cursor avec une option de rachat à 60 milliards

Anthropic lance un nouveau modèle Opus dans l'effervescence de la préversion Mythos

Comprendre l'état actuel de l'IA : ces graphiques sont essentiels

Vos développeurs font déjà tourner l'IA en local : pourquoi l'inférence sur appareil est l'angle mort du RSSI

Sauver la France et l’Europe face à l’IA : Mistral AI pousse 22 mesures d’urgence

Meta lance Muse Spark, son premier modèle frontier à poids fermés

Claude Code permet à Anthropic de dépasser le chiffre d’affaires d’Open AI pour la première fois

De GPT-2 à Claude Mythos : le retour des modèles d'IA jugés trop dangereux à publier

Claude Mythos, une IA vraiment trop puissante pour notre propre bien ?

Pourquoi le Royaume-Uni veut Anthropic : son refus de militariser l'IA

Anthropic change ses règles du jeux, des applications tierces aux limites des sessions

Actualité : “Joyeux, il devient complaisant ; désespéré, il triche” : Anthropic révèle que Claude a des émotions et qu'elles pèsent sur ses décisions

Le code source complet du CLI Claude Code a fuité via un fichier map exposé

Cohere lance un modèle ASR open-weight avec 5,4 % d'erreur — suffisant pour remplacer les API vocales en production

Les outils d'IA pour la santé se multiplient, mais sont-ils vraiment efficaces ?

Une « erreur humaine » provoque la fuite de Claude Mythos : le prochain modèle d’Anthropic qui inquiète jusqu’à ses créateurs

Anthropic envisage une IPO au T4 et prépare les modèles 'Claude Mythos' et 'Capybara

Arm se lance dans la fabrication de ses propres puces