DeepSeek dévoile un nouveau modèle d'IA, un an…

DeepSeek réduit ses prix d'API et établit un nouveau plancher pour les grands modèles

52

1Pandaily

DeepSeek réduit ses prix d'API et établit un nouveau plancher pour les grands modèles

DeepSeek a annoncé le 26 avril une réduction massive des tarifs de son API, établissant de nouveaux planchers mondiaux pour les grands modèles de langage. Sur l'ensemble de la gamme V4, les prix des requêtes en cache d'entrée ont été divisés par dix par rapport aux tarifs initiaux. Le modèle phare V4-Pro bénéficie en outre d'une promotion temporaire de 75 % valable jusqu'au 5 mai 2026, portant le coût du cache d'entrée à seulement 0,025 yuan par million de tokens (environ 0,0035 dollar), un niveau sans précédent dans l'industrie. Pour V4-Flash, le tarif passe de 0,2 yuan à 0,02 yuan par million de tokens (0,0028 dollar). Sur V4-Pro, les entrées non mises en cache tombent de 12 à 3 yuans (0,41 dollar) et les sorties de 24 à 6 yuans (0,83 dollar). Ces baisses surviennent deux jours après la mise en open source de DeepSeek-V4, disponible en versions Pro et Flash, avec un support de contextes allant jusqu'à un million de tokens. Ces tarifs redéfinissent ce qui est économiquement viable pour les développeurs et les entreprises qui intègrent des modèles de langage dans leurs produits. À moins de 0,004 dollar par million de tokens en cache, des usages autrefois coûteux deviennent accessibles : agents autonomes, traitement massif de documents, pipelines de code avancés. L'argument économique est renforcé par des performances solides : en interne chez DeepSeek, V4 est jugé supérieur à Claude Sonnet 4.5 sur les tâches de programmation, avec une qualité approchant celle de Claude Opus 4.6 en mode non-raisonné. Dans les benchmarks généraux, V4-Pro surpasse tous les modèles open source et ne cède qu'aux meilleurs modèles propriétaires comme Gemini Pro 3.1 ; en mathématiques, STEM et coding compétitif, il égale ou dépasse les leaders du marché. Ces baisses de prix reposent sur des avancées architecturales concrètes. V4-Pro n'active que 49 milliards de paramètres sur 33 000 milliards de tokens d'entraînement, mais son coût de calcul par token est réduit à 27 % de celui de son prédécesseur V3.2, et l'utilisation du cache KV chute de 90 %. Le nouveau mécanisme d'attention creuse développé en interne (DSA) compresse les dimensions des tokens pour offrir de hautes performances sur les longs contextes avec des besoins en mémoire réduits. Stratégiquement, la série V4 est entièrement compatible avec les supernœuds Huawei Ascend, marquant un ancrage renforcé dans l'infrastructure de calcul domestique chinoise. Goldman Sachs a récemment souligné l'importance stratégique de DeepSeek-V4, et la mise en production massive des supernœuds Ascend prévue d'ici fin 2026 laisse entrevoir de nouvelles baisses tarifaires. Dans un secteur où OpenAI, Google et Anthropic s'affrontent déjà sur les prix, cette annonce amplifie la pression sur l'ensemble de l'écosystème mondial de l'IA.

UELa réduction massive des prix de l'API DeepSeek V4 offre aux développeurs et entreprises européens un accès à des modèles de pointe à des coûts jusqu'à dix fois inférieurs, rendant économiquement viables des usages IA auparavant réservés aux grandes structures.

💬 0,004 dollar par million de tokens, c'est le prix où les agents continus et le traitement massif de docs deviennent des trucs normaux, pas des projets de grande entreprise. Et que V4 passe devant Sonnet sur le code, ça commence à faire mal pour les modèles US sur le segment développeurs. Reste à voir si ça tient à l'échelle, mais le rapport de force change.

LLMsOpinion

1 source

Le nouveau modèle d'Anthropic cible les utilisateurs avancés mais coupe l'accès aux rivaux IA

54

2The Information AI

Le nouveau modèle d'Anthropic cible les utilisateurs avancés mais coupe l'accès aux rivaux IA

Anthropic a publié mardi une version publique de Claude Fable 5, son modèle de nouvelle génération, une itération légèrement bridée du système baptisé en interne "Mythos", dont les rumeurs circulaient depuis plusieurs semaines dans les milieux du développement. Les premiers accès au modèle ont été ouverts aux développeurs d'applications, qui ont pu l'évaluer dans des conditions réelles. Leurs retours confirment l'essentiel des attentes : Fable 5 surpasse nettement les générations précédentes d'Anthropic sur le code, le raisonnement spatial et les tâches de connaissance générale. Une restriction notable a toutefois été intégrée dès le lancement : toute requête touchant à la cybersécurité est automatiquement redirigée vers le modèle Claude Opus 4.8, jugé moins puissant, afin de limiter les risques de détournement. Ce qui frappe dans les retours des testeurs, c'est moins la performance brute que la nature des tâches sur lesquelles Fable 5 se distingue vraiment. Sur des questions simples ou de difficulté intermédiaire, le type de requêtes qu'on adresserait à Google Search ou à ChatGPT, l'amélioration par rapport aux modèles précédents d'Anthropic reste difficile à percevoir. En revanche, sur des travaux longs et complexes, le bond est significatif : des développeurs ont rapporté avoir généré un jeu vidéo complet à partir d'un seul prompt, un cas d'usage qui illustre une montée en gamme qualitative sur les tâches nécessitant planification, cohérence prolongée et enchaînement logique sur plusieurs étapes. Ce lancement s'inscrit dans une compétition frontale entre les grands laboratoires d'IA, où chaque sortie de modèle est scrutée comme un indicateur de positionnement stratégique. Anthropic, adossé à des milliards de dollars d'investissements d'Amazon et Google, cherche à affirmer sa place face à OpenAI et Google DeepMind sur le segment des utilisateurs avancés et des équipes de développement professionnelles. La décision de limiter les capacités liées à la cybersécurité révèle également la pression croissante pesant sur ces entreprises pour démontrer que la puissance des modèles peut être déployée de façon responsable, sans devenir un vecteur d'exploitation. Les prochaines semaines diront si la version complète de Mythos franchit un nouveau palier.

UELes développeurs et équipes techniques en France et en Europe peuvent intégrer ce nouveau modèle dans leurs workflows, avec des gains significatifs sur les tâches complexes de code et de raisonnement.

💬 Le gap sur les tâches simples, je m'en fous. C'est sur les enchaînements longs et complexes que ça change quelque chose, et les testeurs qui ont généré un jeu vidéo complet depuis un seul prompt en sont la meilleure illustration. La restriction cybersec vers Opus 4.8, c'est du pragmatisme habillé en éthique, mais dans le contexte actuel difficile de faire autrement.

LLMsOpinion

1 source

Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés

53

3Next INpact

Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés

À l'occasion de la WWDC 2026, Apple a présenté la troisième génération de ses modèles d'IA maison, les Apple Foundation Models (AFM 3), qui alimenteront Apple Intelligence sous iOS 27 et les autres systèmes d'exploitation en version 27. La famille compte cinq modèles distincts : deux fonctionnent directement sur l'appareil, AFM 3 Core (3 milliards de paramètres) et AFM 3 Core Advanced (20 milliards de paramètres, mais n'en activant dynamiquement qu'1 à 4 milliards selon les requêtes), et trois dans le cloud, AFM 3 Cloud pour les tâches courantes, ADM 3 Cloud pour la génération et l'édition d'images, et AFM 3 Cloud Pro pour le raisonnement complexe et les outils agentiques. Ce dernier tourne sur des serveurs NVIDIA hébergés dans Google Cloud, une infrastructure étendue au système Private Cloud Compute d'Apple. Les modèles reposent sur une base Gemini de Google, conformément à l'accord conclu entre les deux entreprises en janvier 2026. Pour profiter du modèle local le plus puissant, il faut un iPhone Air, un iPhone 17 Pro, un Mac M3 ou un iPad M4 avec au moins 12 Go de RAM, l'iPhone 17 standard, limité à 8 Go, est exclu. Cette annonce est importante à plusieurs égards. Sur le plan technique, la méthode d'activation dynamique des paramètres d'AFM 3 Core Advanced est une innovation notable : elle permet à Apple de faire tourner un modèle de 20 milliards de paramètres en puisant dans la mémoire flash plutôt que dans la RAM, contournant ainsi les limites physiques des appareils mobiles. Concrètement, cela se traduit par un Siri plus expressif, des voix personnalisables et une dictée vocale améliorée. Mais au-delà des performances annoncées, l'aveu implicite d'Apple est révélateur : en ne comparant plus ses nouveaux modèles aux benchmarks sectoriels standardisés utilisés l'an dernier face à GPT-4o ou Gemma, la firme de Cupertino semble reconnaître discrètement que la génération précédente était en deçà des attentes, ce que le retard du nouveau Siri et les critiques répétées autour d'Apple Intelligence avaient déjà largement signalé. Cette troisième génération d'AFM s'inscrit dans un contexte de rattrapage accéléré pour Apple, qui accuse un retard structurel sur ses rivaux en matière d'IA générative. L'accord avec Google pour baser ses modèles sur Gemini, combiné à l'utilisation de GPU NVIDIA dans le cloud, marque une dépendance rare pour une entreprise qui a bâti son identité sur la maîtrise totale de sa chaîne technologique, du silicium au logiciel. Apple se retrouve ainsi tributaire de deux de ses principaux concurrents stratégiques. La question qui se pose désormais est celle de la durabilité de ce positionnement : soit Apple accélère le développement de ses propres modèles fondamentaux, soit elle consolide ces partenariats, au risque de perdre encore davantage de souveraineté sur la couche IA, qui deviendra centrale dans tous ses produits.

UELes millions d'utilisateurs européens d'appareils Apple seront directement concernés par le traitement de leurs données via l'infrastructure Google Cloud sous iOS 27, soulevant des questions de conformité RGPD pour Apple Intelligence.

💬 La partie la plus révélatrice, c'est le silence sur les benchmarks. L'an dernier ils s'y comparaient fièrement, cette année le tableau de chasse a disparu, et tout le monde a compris le message. Baser ses modèles sur Gemini et faire tourner le tout sur des GPU NVIDIA dans Google Cloud, c'est peut-être le chemin le plus rapide, mais c'est le genre de dépendance qu'Apple a passé vingt ans à éviter, et là ils la construisent vis-à-vis de deux rivaux directs.

LLMsOpinion

1 source

Le nouveau modèle V4 de DeepSeek : trois raisons pour lesquelles il compte

54

4MIT Technology Review

Le nouveau modèle V4 de DeepSeek : trois raisons pour lesquelles il compte

DeepSeek a publié vendredi une version préliminaire de V4, son nouveau modèle phare attendu depuis plusieurs mois. Disponible en open source, le modèle se décline en deux versions : V4-Pro, conçu pour le code et les tâches d'agents complexes, et V4-Flash, plus léger et optimisé pour la vitesse. Sur les principaux benchmarks, V4-Pro rivalise avec les meilleurs modèles fermés du marché, se situant au niveau de Claude Opus de chez Anthropic, de GPT-5 d'OpenAI et de Gemini de Google. Face aux autres modèles open source, notamment Qwen d'Alibaba ou GLM de Z.ai, V4 les surpasse en codage, mathématiques et disciplines scientifiques. L'entreprise rapporte qu'une enquête interne auprès de 85 développeurs expérimentés a montré que plus de 90 % d'entre eux classent V4-Pro parmi leurs premiers choix pour les tâches de programmation. DeepSeek a également optimisé le modèle pour des frameworks d'agents populaires comme Claude Code ou CodeBuddy. Ce qui distingue V4, c'est son rapport performance-prix particulièrement agressif. V4-Pro est facturé 1,74 dollar par million de tokens en entrée et 3,48 dollars en sortie, une fraction du tarif pratiqué par OpenAI ou Anthropic pour des modèles comparables. V4-Flash descend encore plus bas, à 0,14 dollar par million de tokens en entrée et 0,28 dollar en sortie, ce qui en fait l'un des modèles haut de gamme les moins chers du marché. Pour les développeurs et les entreprises, cela signifie un accès à des capacités d'IA frontier sans les coûts habituellement prohibitifs des API propriétaires. Les deux versions intègrent un mode de raisonnement pas à pas, et V4 introduit une nouvelle architecture qui améliore significativement la gestion de longs contextes, ouvrant la voie à des applications sur des documents ou des bases de code entières. Cette sortie intervient dans un contexte particulier pour DeepSeek. La firme de Hangzhou avait provoqué un séisme dans l'industrie en janvier 2025 avec R1, un modèle de raisonnement entraîné avec des ressources limitées qui avait mis en question la suprématie américaine en matière d'IA. Depuis, l'entreprise a traversé des mois difficiles, marqués par des départs de personnels clés, des retards dans ses lancements et une surveillance accrue des gouvernements américain et chinois. V4 constitue son retour sur la scène des modèles frontier, même si l'effet de surprise de R1 ne se reproduira probablement pas. L'enjeu est désormais de confirmer que DeepSeek peut tenir dans la durée face à des adversaires disposant de ressources computationnelles autrement plus importantes, et de s'imposer comme une alternative crédible et pérenne dans un écosystème open source en pleine effervescence.

UELes développeurs et entreprises européennes accèdent à des capacités frontier en open source à des tarifs très inférieurs aux API propriétaires, élargissant concrètement les options pour les startups et PME du continent.

LLMsOpinion

1 source

DeepSeek dévoile un nouveau modèle d'IA, un an après avoir secoué ses rivaux américains

À lire aussi

DeepSeek réduit ses prix d'API et établit un nouveau plancher pour les grands modèles

Le nouveau modèle d'Anthropic cible les utilisateurs avancés mais coupe l'accès aux rivaux IA

Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés

Le nouveau modèle V4 de DeepSeek : trois raisons pour lesquelles il compte