Aller au contenu principal

DeepSeek· sujet

120 articlesmis à jour le 2026-05-06

DeepSeek, le laboratoire chinois qui a secoué les valeurs tech US : modèles open-weight V3, R1, V4, économie du compute et géopolitique de l'IA.

Hub d'actualité sur DeepSeek, agrégé en continu depuis 72 sources éditoriales. Pour les analyses long-form, voir /analyses.

DeepSeek est l'événement géopolitique IA 2026. Pas parce que ses modèles sont indiscutablement les meilleurs (Mythos et GPT-5.5 restent devant sur les benchmarks frontière), mais parce qu'elle a brisé l'hypothèse implicite qui structurait le marché depuis 2022 : que la performance IA frontière coûte cher.

DeepSeek V4-Flash sort à 0,42 dollar par million de tokens combiné, soit 83× moins cher que GPT-5.5 et 6× moins cher que GPT-OSS-20b. Pas un modèle bridé : 284 milliards de paramètres MoE (13 milliards actifs), contexte 1 million de tokens, performance entre GPT-5.4 et Claude Sonnet 4.5 sur les benchmarks code. Compatible Huawei Ascend, licence MIT, déployable en self-hosted.

Comment lire ce hub

Si vous suivez l'actualité IA au quotidien, c'est votre flux par défaut sur DeepSeek. Toutes les publications agrégées de 72 sources éditoriales (Pandaily, Le Big Data, MIT Technology Review, MarkTechPost, Latent Space, etc.).

Si vous arrivez par une recherche, la chronologie remet les épisodes-clés dans leur ordre, les essentiels couvrent les angles pricing / open-weight / géopolitique / arbitrage US-Chine.

Hub d'actualité, pas analyse éditoriale

Ce hub agrège et oriente. Quand un sujet DeepSeek mérite une lecture verticale (la rupture pricing du 31 mai, l'angle souveraineté chinoise, la course aux puces Huawei Ascend), c'est dans la section analyses que le format long-form se déploie.

Pourquoi DeepSeek compte

DeepSeek compte parce que c'est le premier choc structurel sur la grille tarifaire IA depuis le lancement de ChatGPT. Les analyses publiques d'avril 2026 ont eu tendance à amplifier deux mouvements distincts : la baisse permanente de la grille V4 du 26 avril, et la promotion temporaire -75 % sur V4-Pro qui expire le 31 mai. Le chiffre composite « -90 % » qui circule confond les deux.

La rupture structurelle, c'est V4-Flash : 0,42 $ par million de tokens combiné, sans promo, sans date d'expiration. Ce tarif suffit pour 80 % des cas d'usage agentiques (extraction de données, génération de code de routine, traitement de documents longs). Les 20 % restants — analyse stratégique multi-document, raisonnement chaîné complexe — relèvent de V4-Pro ou des modèles US.

L'enjeu géopolitique est évident : DeepSeek prouve que la Chine peut produire des modèles frontière compétitifs sous embargo de puces. Les puces Huawei Ascend supportent déjà V4-Pro et V4-Flash. Les États-Unis ont accusé Pékin de vol de données IA à grande échelle (avril 2026), Pékin dément ; quoi qu'il en soit, la trajectoire technique chinoise s'est accélérée plus vite que les contrôles export US ne ralentissent.

Chronologie

  1. Janv 2024DeepSeek-Coder rendu public, premières démonstrations open-weight
  2. Mai 2024DeepSeek-V2 ouvre l'ère MoE accessible (236 milliards de paramètres MoE)
  3. Déc 2024DeepSeek-V3 (671 milliards MoE) avec performances proches de GPT-4o
  4. Janv 2025DeepSeek-R1 (raisonnement) provoque la première chute de NVIDIA en bourse — révèle l'efficacité chinoise sur le compute
  5. 24 avr 2026DeepSeek-V4 : performances proches du meilleur niveau pour 1/6e du coût d'Opus 4.7
  6. 24 avr 2026Les États-Unis accusent la Chine de vol de données IA à grande échelle ; Pékin dément
  7. 25 avr 2026DeepSeek V4 Pro (1,6T-A49B) et Flash (284B-A13B), Base et Instruct, compatibles Huawei Ascend
  8. 26 avr 2026DeepSeek divise par 10 le tarif de cache d'entrée sur l'ensemble de la gamme V4
  9. 27 avr 2026Promotion -75 % sur V4-Pro prolongée jusqu'au 31 mai 2026
  10. 27 avr 2026« 90 % moins cher » : DeepSeek V4 déclare la guerre totale à OpenAI
  11. 28 avr 2026DeepSeek propose son modèle V4 à 97 % moins cher que GPT-5.5 (V4-Flash 0,42 $ par M de tokens combiné)

Cinq articles essentiels

Sélection éditoriale. Ces cinq pièces couvrent les angles les plus utiles pour comprendre DeepSeek en 2026.

  1. Le récit du lancement DeepSeek-V4 : performances proches du meilleur niveau pour 1/6e du coût d'Opus 4.7. Le moment où la grille tarifaire bascule.

  2. DeepSeek V4 « 90 % moins cher » : la formulation qui a circulé partout. Indispensable pour comprendre la lecture publique du choc.

  3. DeepSeek propose V4 à 97 % moins cher que GPT-5.5 d'OpenAI : la version chiffrée de la rupture, V4-Flash inclus.

  4. « 7 fois moins cher que Claude Opus 4.7 » : Anthropic est explicitement la cible de comparaison du pricing chinois.

  5. Les États-Unis accusent la Chine de vol de données IA à grande échelle, Pékin dément : le contexte géopolitique du choc DeepSeek.

  6. Le pari open source de la Chine : DeepSeek n'est pas un cas isolé, c'est l'avant-garde d'une stratégie nationale.

Analyses long-form sur DeepSeek

Quand un sujet mérite un format long, c'est ici.

Questions fréquentes

Qu'est-ce que DeepSeek ?

DeepSeek est un laboratoire chinois d'IA, fondé en 2023 et basé à Hangzhou. Connu pour ses modèles open-weight performants à coûts radicalement bas : DeepSeek-Coder (codage), V2/V3 (chat généraliste), R1 (raisonnement), V4 (avril 2026, frontière). Tous les modèles sont publiés en licence MIT.

Pourquoi DeepSeek V4 est-il si bon marché ?

Trois raisons : (1) architecture MoE optimisée (13B paramètres actifs sur 284B au total pour V4-Flash, sélectionnés dynamiquement) ; (2) infrastructure spécialisée incluant les puces Huawei Ascend (alternative à NVIDIA sous contrôle chinois) ; (3) modèle économique différent (subventionné par stratégie nationale et auto-hébergement open-weight). Le prix V4-Flash de 0,42 $/M tokens combiné est sans promo, donc structurel.

Quelle est la différence entre V4-Pro et V4-Flash ?

V4-Pro est le modèle frontière (1,6 trillion de paramètres MoE, 49 milliards actifs), comparable à Claude Opus 4.7 ou GPT-5.5 sur les tâches complexes. V4-Flash est la version compacte (284 milliards de paramètres MoE, 13 milliards actifs), équivalente à Claude Sonnet 4.5 ou GPT-5.4. Pour la grande majorité des cas d'usage agentiques, V4-Flash suffit largement.

DeepSeek est-il compatible avec les puces NVIDIA ?

Oui pour V4-Pro et V4-Flash, qui s'exécutent sur NVIDIA H100/H200 comme sur les autres modèles. Compatibilité Huawei Ascend est en plus, pas en remplacement. C'est précisément ce qui rend DeepSeek difficile à contrer par les contrôles export américains : le modèle est déployable en environnement US ou sous embargo chinois selon les besoins.

DeepSeek est-il un risque de souveraineté pour les entreprises occidentales ?

Le déploiement self-hosted (les poids sont publics sous licence MIT) élimine le risque de transfert de données vers des serveurs chinois. Les entreprises peuvent télécharger DeepSeek V4-Flash et l'exécuter en environnement souverain européen. Le risque restant est d'usage : si on appelle l'API publique de DeepSeek, les requêtes transitent par des serveurs en Chine.

Toute l'actualité DeepSeek

Flux automatique. Articles classés par pertinence, agrégés en continu.

L'écart se creuse-t-il entre Anthropic et les modèles open source ?
1The Information AI LLMsOpinion

L'écart se creuse-t-il entre Anthropic et les modèles open source ?

La montée en flèche des coûts des modèles d'IA frontier pousse plusieurs développeurs à envisager un repli vers l'open source. Des entreprises aussi sophistiquées qu'Uber ont brûlé l'intégralité de leur budget annuel en IA en quelques mois seulement, un dérapage qui illustre la pression financière que font peser des fournisseurs comme Anthropic et OpenAI. En réponse, Uber et Airbnb auraient déjà commencé à déléguer les tâches les plus simples à des modèles open source moins coûteux, tout en conservant les modèles frontier pour les cas d'usage complexes. Un dirigeant d'une grande entreprise cliente d'OpenAI et d'Anthropic a confié avoir testé Kimi K2.6 de Moonshot AI ainsi que DeepSeek V4, deux modèles open source récents qui affichent des résultats solides sur les benchmarks standards. Le verdict reste mitigé. Si ces modèles s'en sortent correctement sur des questions de surface et des exercices de référence, ils peinent dès que l'interrogation devient plus exigeante. L'exemple donné est parlant : un modèle peut résoudre un casse-tête logique classique, mais échoue dès qu'on modifie légèrement les hypothèses de départ. Cette fragilité dans le raisonnement en profondeur constitue un obstacle réel pour les entreprises dont les cas d'usage requièrent une analyse rigoureuse, des relances pertinentes ou une cohérence sur des chaînes de questions complexes. Le fossé qualitatif entre l'open source et les modèles frontier semble donc persistant, malgré les progrès rapides observés ces derniers mois. L'essor de l'open source n'en reste pas moins une tendance structurelle. Les données du fournisseur d'inférence OpenRouter indiquent une croissance globale de l'utilisation de ces modèles, signe que le marché se segmente progressivement. Les grandes entreprises adoptent une stratégie hybride : modèles bon marché pour le volume, modèles puissants pour la valeur ajoutée. La question centrale devient alors de savoir si des acteurs comme DeepSeek ou Moonshot AI pourront combler l'écart de raisonnement qui les sépare encore d'Anthropic et d'OpenAI, et à quelle vitesse.

UELes entreprises européennes clientes d'Anthropic ou OpenAI font face aux mêmes pressions budgétaires et pourraient adopter la même stratégie hybride open source / frontier pour maîtriser leurs coûts IA.

1 source
L'accord Nvidia H200 avec la Chine a survécu au sommet Trump-Xi, mais pas comme prévu
2AI News 

L'accord Nvidia H200 avec la Chine a survécu au sommet Trump-Xi, mais pas comme prévu

Donald Trump s'est rendu à Pékin en mai 2026, accompagné à la dernière minute de Jensen Huang, PDG de Nvidia, et en est reparti en déclarant que "quelque chose pourrait se passer" sur les exportations de puces. Rien ne s'est passé. Pas un seul H200 de Nvidia n'a été livré en Chine depuis que Trump a autorisé ces ventes en décembre 2025. Le représentant américain au commerce, Jamieson Greer, a confirmé à Bloomberg que les contrôles sur les semi-conducteurs n'étaient même pas à l'ordre du jour bilatéral. En réalité, les licences d'exportation existent déjà : une dizaine d'entreprises chinoises, dont Alibaba, Tencent, ByteDance et JD.com, disposent chacune d'autorisations américaines pour jusqu'à 75 000 unités, avec Lenovo et Foxconn comme distributeurs agréés. Les puces ne bougent pas parce que c'est Pékin qui bloque ses propres entreprises. Le blocage repose sur une contradiction réglementaire structurelle. Les règles américaines exigent que les H200 exportés vers des clients chinois soient déployés uniquement sur le territoire chinois. Pékin, de son côté, a ordonné à ses grandes entreprises tech de réserver leurs achats de puces Nvidia à leurs opérations à l'étranger, tout en soutenant les fournisseurs domestiques. Les deux exigences s'excluent mutuellement : les puces autorisées à l'export ne peuvent légalement être déployées là où Pékin veut les déployer. Ce n'est pas une impasse accidentelle. Le secrétaire au Commerce Howard Lutnick a déclaré devant le Sénat que les firmes chinoises cherchent délibérément à concentrer leurs investissements sur les fournisseurs locaux, au premier rang desquels Huawei. Le Conseil d'État chinois a par ailleurs lancé une revue de la sécurité des chaînes d'approvisionnement visant à réduire la dépendance aux semi-conducteurs américains. Pendant que les diplomates négociaient, les données les plus significatives venaient d'ailleurs. DeepSeek a confirmé que son dernier modèle avait été optimisé pour tourner sur les processeurs Huawei. Le directeur stratégique de Tencent a annoncé que l'offre chinoise en GPU augmenterait progressivement tout au long de 2026, et Alibaba a confirmé que ses GPU propriétaires T-Head étaient désormais en production de masse. En avril, DeepSeek V4 était devenu le premier grand modèle frontier chinois adapté aux puces Ascend de Huawei dès la phase d'entraînement, et non plus seulement pour l'inférence. Le signal est clair : la substitution n'est plus expérimentale, elle est devenue une politique industrielle. Les revenus de Nvidia en Chine sont tombés à environ 5 % ces derniers trimestres, contre plus de 20 % avant le durcissement des contrôles à l'export, et la société anticipe désormais zéro revenu chinois pour le trimestre en cours. La présence de Huang à Pékin illustrait l'urgence ressentie par Nvidia ; son résultat illustre les limites de la diplomatie de PDG face à un blocage structurel.

UEL'impasse sino-américaine sur les GPU Nvidia accélère la montée en puissance d'alternatives chinoises (Huawei Ascend) et rappelle à l'Europe sa propre dépendance aux chaînes d'approvisionnement américaines, renforçant l'urgence de l'European Chips Act.

💬 Jensen Huang à Pékin avec Trump, et au final zéro H200 livré : la mise en scène était parfaite, le résultat nul. Ce qui est frappant, c'est que le blocage ne vient pas de Washington cette fois, ce sont les Chinois eux-mêmes qui freinent leurs propres entreprises pour les forcer vers Huawei. Pendant ce temps, DeepSeek optimisait sur Ascend et Alibaba lançait ses GPU en masse : la substitution n'est plus un plan B, c'est le plan A.

InfrastructureOpinion
1 source
Avancées récentes en architectures LLM : partage KV, mHC et attention compressée
3Ahead of AI 

Avancées récentes en architectures LLM : partage KV, mHC et attention compressée

Depuis début avril 2026, une vague de nouveaux modèles de langage open-weight a déferlé, et une tendance architecturale se dégage clairement : l'efficacité sur les contextes longs. Google a ouvert le bal avec sa suite Gemma 4, déclinée en quatre variantes, les modèles compacts E2B et E4B pour appareils embarqués, un modèle mixte d'experts (MoE) à 26 milliards de paramètres, et un modèle dense à 31 milliards. Dans la foulée, ZAYA1-8B, Laguna XS.2 et DeepSeek V4 ont chacun introduit leurs propres innovations internes. Ce que ces modèles ont en commun, c'est un ensemble de techniques nouvelles pour réduire la taille du KV-cache, le trafic mémoire et le coût du mécanisme d'attention, trois goulots d'étranglement devenus critiques à mesure que les modèles de raisonnement et les agents IA manipulent des séquences de plus en plus longues. Ces innovations architecturales ont des conséquences concrètes sur les coûts d'inférence et les capacités des systèmes déployés en production. Le partage de KV entre couches (cross-layer attention), utilisé dans Gemma 4 E2B et E4B, permet aux couches profondes de réutiliser les états clé-valeur calculés dans les couches précédentes, réduisant ainsi la mémoire nécessaire sur de longs contextes sans entraîner de pertes de qualité majeures. Laguna XS.2 adopte une approche différente, en allouant un budget d'attention variable selon les couches, certaines couches traitent l'intégralité du contexte, d'autres utilisent une fenêtre glissante restreinte. ZAYA1-8B intègre une attention convolutionnelle compressée, tandis que DeepSeek V4 combine une attention multi-head compressée (mHC) avec sa propre variante d'attention compacte. Ces techniques sont présentées comme des ajustements discrets dans les schémas d'architecture, mais représentent en réalité des choix de conception non triviaux avec des implications profondes sur la façon dont les modèles gèrent la mémoire à grande échelle. Ces développements s'inscrivent dans une évolution plus large du domaine : les workflows agentiques et les modèles de raisonnement, qui maintiennent des contextes de plusieurs dizaines de milliers de tokens sur de longues interactions, ont rendu les approches d'attention standard trop coûteuses à opérer efficacement. Le KV-cache, qui stocke les états intermédiaires pour éviter de recalculer l'attention à chaque nouveau token, peut consommer plusieurs gigaoctets de VRAM sur de longs contextes, un problème particulièrement aigu pour les déploiements locaux. Le fait que Google, DeepSeek et des acteurs plus modestes comme ZAYA1 et Laguna convergent tous vers des solutions similaires en quelques semaines suggère que l'optimisation de l'attention est devenue la priorité architecturale centrale de 2026, supplantant la simple course aux paramètres.

UELes modèles open-weight à architecture optimisée (Gemma 4, DeepSeek V4) permettent aux entreprises et institutions européennes de déployer des LLMs efficacement en local, réduisant leur dépendance aux infrastructures cloud américaines.

💬 Le KV-cache qui bouffe plusieurs Go de VRAM sur les longs contextes, c'était devenu le vrai goulot d'étranglement, et là on voit tout le monde arriver aux mêmes conclusions en même temps : Google, DeepSeek, Laguna. Quand des acteurs de cette envergure convergent indépendamment vers les mêmes solutions en quelques semaines, c'est pas du hasard. Ça va changer ce qu'on peut faire tourner en local.

LLMsOpinion
1 source
Pourquoi les entreprises chinoises de l’IA accélèrent leur expansion mondiale ?
4Le Big Data 

Pourquoi les entreprises chinoises de l’IA accélèrent leur expansion mondiale ?

En l'espace de quelques jours fin avril 2026, trois startups chinoises d'intelligence artificielle ont concentré à elles seules plus de 11 milliards de dollars de financements potentiels ou confirmés. DeepSeek, fondée en 2023 avec le soutien du fonds quantitatif HighFlyer, s'apprête à réaliser sa toute première levée de fonds externe : le tour de table, initialement envisagé à 300 millions de dollars pour une valorisation de 10 milliards, pourrait atteindre 7 milliards de dollars et valoriser l'entreprise à près de 50 milliards. Moonshot AI, créateur des modèles Kimi, a de son côté levé 2 milliards de dollars sous la conduite de Meituan, portant ses financements cumulés à 3,9 milliards en six mois et sa valorisation au-delà de 20 milliards. StepFun, basée à Shanghai, serait quant à elle proche de finaliser une levée de 2,5 milliards de dollars, selon des sources proches du dossier. Ces chiffres signalent un tournant dans la perception des acteurs chinois de l'IA par les investisseurs mondiaux. Pendant des années, le capital-risque technologique en Chine a stagné depuis 2021, les investisseurs doutant de la capacité des startups locales à transformer leurs modèles en revenus durables. Ce doute s'estompe : les entreprises chinoises ont démontré qu'elles pouvaient non seulement produire des modèles de classe mondiale, mais aussi les intégrer dans des usages concrets et monétisables. Moonshot, par son partenariat avec Meituan, déploie des agents capables de réserver des hôtels ou commander des repas, tandis que son modèle Kimi K2.6 peut orchestrer jusqu'à 300 sous-agents simultanément pour automatiser des tâches complexes en programmation. StepFun déploie déjà ses modèles sur des millions d'appareils, des smartphones aux véhicules intelligents, visant une IA embarquée à grande échelle plutôt qu'un simple chatbot. Ce regain de dynamisme s'inscrit dans un contexte de compétition mondiale accélérée avec les laboratoires américains comme OpenAI, Google DeepMind ou Anthropic. DeepSeek avait marqué les esprits début 2025 en publiant en open source ses modèles R1 puis V4, prouvant qu'un acteur chinois pouvait rivaliser techniquement avec des budgets bien inférieurs. Cette stratégie ouverte a construit une crédibilité internationale que les investisseurs valorisent aujourd'hui massivement. La question qui se pose désormais est celle de l'expansion hors de Chine : ces entreprises ne cherchent plus seulement à rattraper la Silicon Valley, elles visent à imposer leurs plateformes, leurs infrastructures et leurs standards dans les marchés asiatiques, européens et émergents, là où les acteurs américains n'ont pas encore consolidé leur position.

UELes startups chinoises de l'IA ciblent explicitement les marchés européens pour leur expansion, ce qui pourrait modifier l'équilibre concurrentiel et offrir aux acteurs européens des alternatives aux plateformes américaines.

💬 11 milliards en quelques jours, c'est plus le signal d'un rattrapage, c'est celui d'une offensive. Ce qui a changé par rapport à 2023, c'est que Moonshot ou StepFun ne vendent plus des benchmarks : ils déploient des agents qui réservent des hôtels et font tourner de l'IA embarquée sur des millions d'appareils. Et l'Europe, là-dedans, c'est exactement le terrain que ces boîtes visent, là où ni Google ni OpenAI n'ont vraiment verrouillé quoi que ce soit.

BusinessOpinion
1 source
Ernie 5.1 de Baidu réduit de 94 % les coûts de pré-entraînement tout en rivalisant avec les meilleurs modèles
5The Decoder 

Ernie 5.1 de Baidu réduit de 94 % les coûts de pré-entraînement tout en rivalisant avec les meilleurs modèles

Baidu a dévoilé Ernie 5.1, une nouvelle version de son modèle d'intelligence artificielle phare qui représente une avancée significative en matière d'efficacité de développement. Le modèle n'utilise qu'un tiers des paramètres de son prédécesseur et n'aurait coûté que 6 % du budget de pré-entraînement habituellement nécessaire pour des modèles de performance comparable, soit une réduction de 94 % des coûts. Sur le classement Search Arena, référence internationale pour évaluer les LLMs dans les tâches de recherche, Ernie 5.1 se positionne 4e au niveau mondial, derrière deux variantes de Claude Opus d'Anthropic et GPT-5.5 Search d'OpenAI. Cette performance économique repose sur une architecture baptisée "Once-For-All" : plutôt que d'entraîner plusieurs modèles distincts selon leur taille, cette approche permet d'extraire des sous-modèles plus compacts depuis un unique cycle d'entraînement. Le résultat est un modèle de niveau mondial obtenu à une fraction du coût habituel, ce qui pourrait radicalement abaisser la barrière financière à l'entrée pour les acteurs qui souhaitent développer des LLMs compétitifs. Cette annonce s'inscrit dans un contexte de course à l'efficacité qui redéfinit le secteur depuis la publication de DeepSeek R1 début 2025, laquelle avait démontré qu'il était possible d'obtenir des performances de premier rang sans budgets astronomiques. Baidu, acteur historique de l'IA en Chine et concurrent direct de géants comme Alibaba et Tencent sur le marché local, renforce ainsi sa position internationale à un moment où la compétition avec les laboratoires américains s'intensifie sur tous les fronts.

LLMsOpinion
1 source
Dans l’IA, la Chine bouscule son monde avec sa stratégie open source
6Next INpact 

Dans l’IA, la Chine bouscule son monde avec sa stratégie open source

Depuis fin avril 2026, deux modèles chinois occupent le sommet du classement des LLM les plus utilisés sur Open Router, la principale place de marché mondiale pour les modèles de langage : Hy3 de Tencent, fort de 295 milliards de paramètres, et Kimi K2.6 de la start-up pékinoise Moonshot AI, fondée en 2023. Claude Sonnet 4.6 et Claude Opus 4.7 d'Anthropic n'arrivent qu'en troisième et quatrième position, suivis de plusieurs versions de DeepSeek et de Gemini. Ce palmarès n'est pas un accident : la Chine a déposé 70 % des 54 000 brevets mondiaux en IA générative, et Alibaba revendiquait en mars un milliard de téléchargements cumulés pour sa famille Qwen, représentant plus de la moitié des téléchargements mondiaux de modèles open source. Kimi, lui, est accessible à environ 4 dollars le million de tokens générés, soit six à huit fois moins cher que GPT-5.5 ou Claude Opus 4.7. Cet avantage tarifaire peut sembler négligeable pour un utilisateur individuel, mais il change radicalement l'équation pour les entreprises qui font tourner des centaines d'agents d'IA en parallèle. En rendant publics des modèles performants à faible coût, les acteurs chinois attaquent la chaîne de valeur que les géants américains ont bâtie autour de leurs APIs propriétaires. Le gouvernement de Singapour a illustré cette dynamique en novembre dernier en abandonnant Llama de Meta au profit de Qwen pour construire son modèle d'IA souverain, tandis que Taobao et Tmall intègrent déjà ces outils dans leurs services quotidiens. Pour les directions informatiques du monde entier, l'open source chinois est désormais une alternative sérieuse, pas un choix par défaut. Cette offensive s'inscrit dans un contexte de restrictions américaines sur l'accès aux semi-conducteurs avancés, qui ont contraint la Chine à optimiser ses modèles pour des architectures matérielles moins récentes. Résultat : des systèmes plus légers, moins gourmands, et moins coûteux à l'usage. La déflagration DeepSeek, dès début 2025, avait été le premier signal fort de cette capacité d'adaptation, au point d'inquiéter Jensen Huang, le patron de Nvidia. La quatrième version de DeepSeek, conçue pour fonctionner exclusivement sur des technologies chinoises avec le soutien de Huawei, a confirmé la tendance. En mars, Anthropic a formellement dénoncé l'utilisation de comptes frauduleux par DeepSeek, Moonshot et MiniMax pour extraire massivement les capacités de Claude. Loin de la seule rivalité technologique, cette stratégie open source représente une évolution des Nouvelles Routes de la Soie vers un levier d'influence numérique mondial, où la dépendance aux modèles chinois pourrait progressivement supplanter celle aux infrastructures occidentales.

UELa domination chinoise sur l'open source IA place l'Europe face à un arbitrage stratégique entre adoption de modèles performants et bon marché et risque de substitution d'une dépendance américaine par une dépendance chinoise, en tension directe avec les objectifs de souveraineté numérique de l'UE.

💬 Quatre dollars le million de tokens contre vingt-cinq pour Claude Opus, c'est là que le débat se joue maintenant. Quand tu fais tourner des centaines d'agents en parallèle, la facture n'est plus la même, et les DSI ont sorti leurs calculettes. Ce que personne n'avait vraiment anticipé: les restrictions américaines sur les puces ont finalement produit des modèles plus légers, moins gourmands, et difficiles à contrer sur le prix.

LLMsOpinion
1 source
Les investissements en IA s'accélèrent : Deepseek prépare une levée record et Core Automation quadruple sa valorisation en quelques semaines
7The Decoder 

Les investissements en IA s'accélèrent : Deepseek prépare une levée record et Core Automation quadruple sa valorisation en quelques semaines

Deepseek prépare une levée de fonds pouvant atteindre 7,35 milliards de dollars, ce qui en ferait la plus grande opération jamais réalisée par une entreprise d'IA chinoise. Ce tour de table devrait accompagner le lancement de Deepseek V4.1, prévu pour juin 2026. En parallèle, Core Automation, une startup fondée il y a seulement six semaines par Jerry Tworek, ex-chercheur d'OpenAI, vise déjà une valorisation de 4 milliards de dollars, soit un quadruplement en quelques semaines à peine depuis sa création. Ces deux opérations illustrent l'appétit intact des investisseurs pour l'IA, malgré les interrogations persistantes sur la rentabilité du secteur. Pour Deepseek, ce financement représente un tournant stratégique: l'entreprise chinoise, connue pour avoir sorti des modèles très compétitifs à moindre coût, cherche désormais les ressources nécessaires pour rivaliser à grande échelle avec OpenAI et Google. Pour Core Automation, une valorisation à 4 milliards en moins de deux mois signale que les fondateurs issus des grands labos IA peuvent lever des capitaux considérables avant même d'avoir un produit abouti. Ce contexte s'inscrit dans une course aux financements qui s'est accélérée depuis début 2025, portée par la multiplication des applications d'agents IA autonomes. Le fait que Tworek, qui a travaillé sur Codex chez OpenAI, soit déjà à la tête d'une licorne en gestation reflète la tendance des chercheurs stars à quitter les grandes structures pour lancer leurs propres projets. Du côté chinois, la montée en puissance de Deepseek nourrit les inquiétudes occidentales sur le leadership technologique face à un écosystème IA qui se finance désormais à des niveaux comparables à la Silicon Valley.

UELa montée en puissance financière de Deepseek intensifie la pression concurrentielle sur l'écosystème IA européen, qui peine à mobiliser des financements comparables pour ses propres champions.

💬 Deepseek, c'était la startup frugale qui humiliait les labos américains à moindre coût. La voilà qui prépare la plus grosse levée jamais faite par une boîte IA chinoise, parce que la frugalité a ses limites quand tu veux vraiment jouer dans la cour d'OpenAI. Et Core Automation, six semaines d'existence, pas de produit, 4 milliards de valorisation : le marché paye des CV, pas des boîtes.

BusinessOpinion
1 source
DeepSeek lève plus de 7 milliards de dollars pour accélérer sa monétisation
8The Information AI 

DeepSeek lève plus de 7 milliards de dollars pour accélérer sa monétisation

DeepSeek, le laboratoire d'intelligence artificielle chinois qui a ébranlé l'industrie mondiale début 2025 avec ses modèles performants à faible coût, s'apprête à lever jusqu'à 50 milliards de yuans, soit environ 7,35 milliards de dollars, dans ce qui constituerait son tout premier tour de financement externe. Liang Wenfeng, fondateur et PDG milliardaire de la société, prévoit lui-même d'apporter la plus grande part de cette levée. Si elle se concrétise à ce montant, il s'agirait du tour de financement le plus important jamais réalisé par une entreprise d'intelligence artificielle chinoise. Cette levée de fonds marque un tournant stratégique majeur pour DeepSeek, qui a jusqu'ici fonctionné sans capital externe. La perspective de cette entrée d'argent frais pousse le laboratoire à accélérer ses plans de monétisation afin de devenir commercialement viable. DeepSeek aurait également indiqué à certains investisseurs qu'il compte désormais publier ses modèles à un rythme plus rapproché, aligné sur les standards du secteur, abandonant ainsi la cadence irrégulière qui était jusque-là sa marque de fabrique. DeepSeek s'était distingué en janvier 2025 en publiant des modèles rivaux de ceux d'OpenAI ou Google, mais développés à une fraction du coût déclaré, provoquant une onde de choc sur les marchés boursiers américains et alimentant les débats sur la suprématie technologique entre les États-Unis et la Chine. Cette levée signale que le laboratoire entend désormais transformer sa notoriété technique en position commerciale durable, dans un écosystème IA chinois de plus en plus compétitif face à Baidu, Alibaba et ByteDance.

UELa montée en puissance commerciale de DeepSeek intensifie la concurrence mondiale dans l'IA et pourrait influencer les choix d'adoption des entreprises européennes, qui devront peser les questions de conformité liées à l'utilisation de modèles issus de laboratoires chinois.

💬 7 milliards pour un labo qui s'est construit sans un centime externe, c'est un vrai changement de posture. Ce qui m'intéresse plus que le montant, c'est l'abandon de leur cadence de publication chaotique pour quelque chose de plus régulier, parce que c'est ça qui bloquait l'adoption sérieuse. Transformer la notoriété technique en machine commerciale face à Baidu et ByteDance, c'est pas le même sport.

BusinessActu
1 source
DeepSeek atteint 50 milliards $ de valorisation grâce au boom de l’IA chinoise
9Le Big Data 

DeepSeek atteint 50 milliards $ de valorisation grâce au boom de l’IA chinoise

DeepSeek, le laboratoire d'intelligence artificielle chinois fondé par Liang Wenfeng, serait en négociation pour boucler sa première levée de fonds externe, d'un montant compris entre 3 et 4 milliards de dollars, à une valorisation pouvant atteindre 50 milliards de dollars. L'information, révélée en premier par le Financial Times puis confirmée par le Wall Street Journal, place DeepSeek parmi les startups d'IA les plus valorisées au monde. Le fonds national chinois dédié à l'intelligence artificielle, doté de 60 milliards de yuans, serait en discussions pour mener l'opération, avec Tencent également présent dans les négociations. Jusqu'à présent, DeepSeek fonctionnait de façon quasi autonome, financée principalement par High-Flyer, le hedge fund de son fondateur, qui conserve environ 89,5 % du capital via ses participations personnelles et affiliées. Cette levée de fonds marque un tournant stratégique pour DeepSeek. Les capitaux recherchés visent à renforcer les infrastructures de calcul de la société et à améliorer les conditions offertes à ses ingénieurs, dans un contexte de compétition féroce pour attirer les talents. Le développement des agents IA, qui exécutent des tâches complexes avec une intervention humaine réduite, exige désormais une puissance de calcul nettement supérieure à celle des chatbots classiques, ce qui se traduit par des coûts en GPU, datacenters et recrutement considérablement plus élevés. Pour rester dans la course face à ByteDance, Alibaba, MiniMax ou Moonshot AI, DeepSeek ne peut plus se permettre de fonctionner en dehors des circuits d'investissement institutionnels. Le succès viral des modèles V3 et R1 de DeepSeek début 2025 avait provoqué un choc sur les marchés technologiques mondiaux, en démontrant qu'il était possible d'atteindre des performances comparables à celles d'OpenAI ou d'Anthropic à une fraction du coût, grâce à une approche open source radicale. Pékin avait alors perçu dans la startup un potentiel champion national capable de rivaliser avec les géants américains dans la course à l'IA générale. L'intérêt du fonds souverain pour cette opération confirme que l'État chinois entend désormais consolider son soutien aux laboratoires les plus prometteurs, réduisant ainsi sa dépendance technologique vis-à-vis des États-Unis dans un domaine jugé stratégique. DeepSeek doit cependant confirmer cette trajectoire sur le plan technique : son nouveau modèle V4, présenté comme redéfinissant l'état de l'art open source pour les agents IA, fait l'objet d'évaluations indépendantes mitigées, certains analystes estimant qu'il reste en retrait face aux meilleurs modèles concurrents.

UELa montée en puissance de DeepSeek, soutenue par des fonds souverains chinois, intensifie la compétition mondiale en IA et fragilise la position des acteurs européens face à deux blocs (US/Chine) disposant désormais de ressources d'investissement massives.

💬 Ce qui m'intéresse, c'est pas la valorisation à 50 milliards. C'est que DeepSeek, le labo qui nous avait sorti V3 et R1 en mode "regardez ce qu'on fait avec trois fois rien", doit maintenant aller chercher de l'argent à l'État pour rester dans la course. Le modèle "on fait mieux moins cher" a ses limites dès qu'on passe aux agents IA, et V4 fait pas l'unanimité non plus, donc on est un peu à 50 milliards sur une promesse pas encore tenue.

BusinessActu
1 source
Acquisition de Manus : Meta fait marche arrière suite au blocage chinois
10Le Big Data 

Acquisition de Manus : Meta fait marche arrière suite au blocage chinois

Le lundi 27 avril 2026, les autorités chinoises ont officiellement interdit la vente de Manus AI à Meta, mettant fin à une opération valorisée à plus de 2 milliards de dollars. Annoncée en décembre 2025, cette acquisition devait permettre au groupe américain de renforcer ses capacités dans les agents IA autonomes. Pékin a invoqué des motifs de sécurité nationale pour bloquer la transaction, et donné à Meta un délai de quelques semaines pour démanteler l'opération et restaurer les actifs de Manus dans leur état initial, y compris la suppression de toutes les données ou technologies éventuellement transférées. D'après le Wall Street Journal, Meta se prépare désormais à annuler l'acquisition. En mars, deux cofondateurs de Manus avaient déjà été empêchés de quitter le territoire chinois, signal fort que le dossier était devenu politiquement sensible. Pour Meta, la perte est à la fois financière et stratégique. Manus était souvent comparée à DeepSeek, la start-up qui avait marqué les esprits début 2025 avec des modèles performants à coûts réduits. Meta ne cherchait pas seulement à acquérir une technologie, mais à intégrer une approche de l'IA plus frugale et plus scalable, destinée à accélérer ses produits d'automatisation et d'outils conversationnels pour les entreprises. Le blocage de l'opération prive le groupe d'une voie rapide vers ce segment en forte croissance, dans un contexte de concurrence intense avec Google, OpenAI et les acteurs chinois. Pour les entreprises technologiques occidentales, ce type d'intervention illustre que les grandes acquisitions dans l'IA ne relèvent plus uniquement de la logique de marché, mais s'inscrivent dans un rapport de force géopolitique direct. La décision de Pékin s'inscrit dans une stratégie plus large et désormais bien établie de contrôle sur les actifs technologiques jugés stratégiques. Bien que Manus soit juridiquement domiciliée à Singapour, elle est développée par la société pékinoise Butterfly Effect, ce qui la rend vulnérable aux injonctions chinoises. Depuis plusieurs mois, Pékin surveille de près les montages dits de "Singapore-washing", pratique consistant pour des start-up chinoises à s'incorporer à l'étranger afin d'attirer des capitaux internationaux et de contourner certaines contraintes réglementaires. Les autorités cherchent explicitement à empêcher les fondateurs chinois de délocaliser leurs activités et leurs technologies critiques. L'enquête sur la transaction avait été ouverte dès janvier 2026, et la menace de sanctions punitives pesait sur Meta si l'accord n'était pas intégralement annulé. À mesure que l'IA devient un levier central de puissance économique et industrielle, ce type de veto devrait se multiplier, redessinant durablement les frontières des fusions-acquisitions technologiques mondiales.

UELes entreprises européennes envisageant des acquisitions de start-up IA chinoises devront désormais intégrer le risque de veto géopolitique de Pékin, qui redéfinit les règles du M&A technologique mondial.

BusinessOpinion
1 source
Poolside lance Laguna XS.2, un modèle ouvert gratuit et performant pour le codage local à base d'agents
11VentureBeat AI 

Poolside lance Laguna XS.2, un modèle ouvert gratuit et performant pour le codage local à base d'agents

La startup américaine Poolside, fondée à San Francisco en 2023, a lancé ce 28 avril 2026 deux nouveaux modèles de langage sous la marque Laguna, conçus spécifiquement pour les tâches de codage agentique. Le premier, Laguna M.1, est un modèle propriétaire de 225 milliards de paramètres au format Mixture of Experts (MoE), avec 23 milliards de paramètres actifs, destiné aux environnements d'entreprise et gouvernementaux à hautes exigences de sécurité. Le second, Laguna XS.2, est un modèle open source sous licence Apache 2.0 de 33 milliards de paramètres (3 milliards actifs), téléchargeable et exécutable localement sur un simple GPU de bureau ou d'ordinateur portable, sans connexion internet. Poolside accompagne ces deux modèles d'un agent de codage en ligne de commande baptisé "pool" et d'un environnement de développement web mobile appelé "shimmer". Temporairement, même le plus grand modèle M.1 est accessible gratuitement via l'API Poolside et des partenaires comme OpenRouter, Ollama et Baseten. L'arrivée de Laguna XS.2 en open source représente un signal fort dans un secteur dominé soit par des modèles propriétaires coûteux comme Claude d'Anthropic ou GPT-5.5 d'OpenAI, soit par des modèles chinois à licence ouverte comme ceux de DeepSeek. Poolside offre ici une alternative américaine, exécutable entièrement hors ligne, ce qui répond à un besoin critique pour les agences gouvernementales et les entreprises opérant dans des environnements ultra-sécurisés. L'ingénieur post-entraînement George Grigorev a précisé que Poolside peut "livrer des poids dans des environnements totalement isolés on-premises, sans connexion réseau", un avantage décisif face aux solutions cloud d'Anthropic ou Google. Par ailleurs, les deux modèles Laguna ont été entraînés intégralement from scratch, contrairement à plusieurs laboratoires américains qui s'appuient sur les modèles de base Qwen d'Alibaba, ce qui leur confère une indépendance technique notable. Poolside s'est jusqu'ici concentrée sur des contrats gouvernementaux et de défense, construisant ses modèles dans un environnement interne appelé "Model Factory", dont le moteur central est un logiciel maison nommé Titan. L'entreprise utilise également un optimiseur d'entraînement appelé Muon, qui accélère l'apprentissage d'environ 15% par rapport aux méthodes standards, un avantage compétitif non négligeable en termes de coûts et de délais. En s'ouvrant maintenant à la communauté des développeurs et à la recherche publique, Poolside change de stratégie et entre de plein pied dans la bataille de l'open source agentique, à un moment où les entreprises tech cherchent à réduire leur dépendance aux API propriétaires pour des raisons de coût, de confidentialité et de souveraineté technologique.

UELes organisations européennes en environnement isolé (défense, administration) peuvent déployer localement un modèle de codage agentique open source américain sans dépendance cloud, renforçant leur autonomie technologique.

LLMsActu
1 source
De DeepSeek à DeepRoute : pourquoi un chercheur en IA de premier plan a misé sur le monde physique
12Pandaily 

De DeepSeek à DeepRoute : pourquoi un chercheur en IA de premier plan a misé sur le monde physique

Le 25 avril 2026, lors du Salon de l'automobile de Pékin, la startup chinoise d'autonomie véhiculaire DeepRoute.ai a tenu une conférence de presse inhabituelle dans le hall A4 du China International Exhibition Center : aucun véhicule en exposition, aucun prototype sur scène. Son PDG, Maxwell Zhou, a choisi ce vide comme manifeste. En une après-midi, il a dévoilé la nouvelle architecture stratégique de l'entreprise autour du concept de "Physical AI", son modèle fondateur (Foundation Model), une ébauche d'agent intégrant conduite et habitacle, et un chiffre clé : un véhicule sur trois équipé d'un système NOA urbain en Chine tourne aujourd'hui sur la technologie DeepRoute, soit plus de 300 000 voitures en circulation. L'événement a également marqué la première apparition publique de Ruan Chong, ancien directeur R&D de DeepSeek et chercheur central en IA multimodale, depuis son arrivée chez DeepRoute en tant que Chief Scientist. Ce repositionnement marque une rupture nette avec la logique dominante du secteur. Là où les acteurs de la conduite autonome se sont longtemps concurrencés sur des benchmarks techniques, quelle pluie, quel angle mort, quel cas limite, DeepRoute revendique désormais un rôle d'infrastructure, comparable selon Zhou à "l'électricité ou les télécommunications". L'objectif affiché est d'atteindre 1 000 miles ou plus entre deux interventions critiques (MPCI) d'ici fin 2026. "Quatre-vingt-dix pour cent de ce qui compte, c'est la sécurité", a déclaré Zhou, ajoutant que Tesla a déjà atteint ce seuil et que les petits modèles ne permettront jamais d'y parvenir : "Quoi que vous fassiez dans le monde des petits modèles, vous ne pouvez pas obtenir dix fois mieux en travaillant plus fort." Le virage vers les grands modèles de fondation est donc présenté comme une nécessité structurelle, pas une option. Le recrutement de Ruan Chong illustre une dynamique plus large que Zhou a explicitement nommée : les responsables de la recherche multimodale des grands groupes internet chinois migrent vers la conduite autonome. Ruan lui-même a expliqué ce choix avec franchise : "Les modèles de langage sont très matures, presque n'importe quelle tâche peut être traitée par un seul modèle. Mais dans l'intelligence multimodale et incarnée, on en est loin. Je préfère être à la frontière." Cette migration de talents, si elle se confirme, signale que le centre de gravité de l'IA appliquée se déplace du texte vers le monde physique. DeepRoute entend capitaliser sur cette fenêtre, avant que le secteur n'atteigne lui-même la maturité qu'a connue le NLP.

UELa montée en puissance de DeepRoute et la migration de talents IA vers l'autonomie véhiculaire en Chine renforcent la pression compétitive sur les constructeurs automobiles européens dans la course au véhicule autonome.

RobotiqueOpinion
1 source
Musk contre Altman devant la justice, et le problème de rentabilité de l'IA
13MIT Technology Review 

Musk contre Altman devant la justice, et le problème de rentabilité de l'IA

Elon Musk et Sam Altman s'affrontent cette semaine devant un tribunal américain dans un procès aux conséquences potentiellement historiques pour l'industrie de l'intelligence artificielle. Musk, cofondateur d'OpenAI, réclame 134 milliards de dollars en dommages et intérêts, l'éviction d'Altman et du président Greg Brockman, ainsi que le retour de l'entreprise à son statut d'organisation à but non lucratif. Il affirme avoir été trompé lors de son financement initial de la société. Le tribunal pourrait décider si OpenAI est autorisée à poursuivre sa transformation en entreprise commerciale en vue d'une introduction en bourse, une décision dont la portée dépasse largement le simple litige entre deux milliardaires. Dans ce contexte tendu, OpenAI a également mis fin à son partenariat exclusif avec Microsoft, ouvrant la voie à des accords avec des concurrents comme Amazon, même si Microsoft conserve une licence d'utilisation des technologies du groupe. Par ailleurs, DeepSeek a annoncé que son nouveau modèle d'IA est proposé à un prix 97 % inférieur à celui du GPT-5.5 d'OpenAI, ciblant délibérément les entreprises, les développeurs et les applications d'agents autonomes. Ce procès cristallise une tension plus profonde qui traverse toute l'industrie : les entreprises d'IA ont construit des technologies impressionnantes et promis des transformations radicales, mais le modèle économique qui relie ces deux extrémités reste encore flou. Pendant ce temps, les deepfakes weaponisés constituent une menace concrète et immédiate : des images sexuelles explicites non consenties aux campagnes de désinformation politique, les modèles génératifs bon marché produisent des contenus d'une crédibilité alarmante. Ces outils alimentent déjà des violences réelles, influencent des opinions et détruisent la confiance, avec un impact disproportionné sur les femmes et les groupes marginalisés. La montée d'une résistance populaire contre l'IA dans les zones rurales américaines, de l'Indiana à l'Idaho, traduit ce même malaise qui s'étend désormais à l'échelle mondiale. L'environnement réglementaire et géopolitique complique encore davantage ce tableau. Google a signé un accord classifié avec le Pentagone autorisant l'usage de l'IA à des fins gouvernementales, malgré l'opposition interne de plus de 600 employés. L'Union européenne a simultanément ordonné à Google d'ouvrir Android à des assistants IA concurrents de Gemini, une décision finale attendue avant fin juillet. OpenAI travaillerait en parallèle sur un smartphone centré sur l'IA, développé avec des processeurs potentiellement fournis par Qualcomm et MediaTek, un appareil qui remplacerait les applications traditionnelles par des agents. Le verdict du procès Musk-Altman, attendu dans les prochaines semaines, pourrait redéfinir non seulement l'avenir d'OpenAI, mais aussi les règles du jeu pour l'ensemble du secteur.

UEL'Union européenne a ordonné à Google d'ouvrir Android aux assistants IA concurrents de Gemini, avec une décision finale attendue avant fin juillet, ce qui impacte directement l'écosystème des assistants IA pour les utilisateurs et développeurs européens.

BusinessActu
1 source
Bilan IA Avril 2026 : Le Basculement Définitif vers l’IA Agentique et Physique
14Le Big Data 

Bilan IA Avril 2026 : Le Basculement Définitif vers l’IA Agentique et Physique

Avril 2026 restera comme le mois où l'industrie de l'intelligence artificielle a définitivement tourné la page des chatbots. Le 23 avril, OpenAI a lancé GPT-5.5 (nom de code "Spud"), un modèle conçu pour l'ingénierie logicielle en totale autonomie, intégrant une fonction "Thinking" qui optimise ses raisonnements internes pour réduire la consommation de tokens et domine les nouveaux benchmarks agentiques Terminal-Bench 2.0. Le lendemain, DeepSeek a publié les poids de son modèle V4 (1,6 trillion de paramètres) sous licence MIT, compatible avec les puces Huawei Ascend pour contourner les embargos américains, déclenchant une guerre des prix mondiale avec une fenêtre de contexte d'un million de tokens. Meta, rattrapée par un scandale de manipulation de benchmarks sur Llama 4, a abandonné l'open-source et créé les Meta Superintelligence Labs avant de dévoiler Muse Spark, un modèle propriétaire doté d'un mode d'orchestration multi-agents baptisé "Contemplating". Microsoft a lancé sa gamme MAI pour réduire sa dépendance à OpenAI, tandis que des robots humanoïdes ont été déployés pour la première fois dans les usines BMW et Boston Dynamics. Le premier trimestre 2026 affichait 242 milliards de dollars investis dans le secteur, dont 80 % captés par OpenAI, Anthropic, xAI et Waymo. Ce basculement vers l'IA agentique et physique redessine concrètement les modes de production industrielle et de développement logiciel. L'IA consomme désormais 10 % de l'électricité américaine, forçant l'industrie à se tourner vers le nucléaire, les algorithmes neuro-symboliques cent fois moins énergivores, et même des centres de données spatiaux. Sur le front de la cybersécurité, le modèle Claude Mythos d'Anthropic a démontré sa capacité à identifier seul des failles "Zero-Day" critiques ; jugé trop dangereux pour une diffusion publique, il a été intégré au Project Glasswing, une alliance de géants technologiques chargée de corriger les vulnérabilités du web mondial en temps réel. Ces développements imposent à tous les acteurs une course contre la montre entre puissance de déploiement et maîtrise des risques systémiques. Ce mois sous tension s'inscrit dans une bataille géopolitique et judiciaire qui dépasse largement les laboratoires. En Europe, l'EU AI Act entrera en application stricte en août 2026, contraignant les entreprises à documenter et auditer leurs systèmes d'IA. La Chine bloque tout rachat de ses pépites technologiques par des capitaux américains, tandis que DeepSeek V4, en s'appuyant sur les puces Huawei, illustre la résilience de l'écosystème chinois face aux embargos. Aux États-Unis, Elon Musk a engagé ce que les médias spécialisés surnomment déjà "le procès du siècle" contre OpenAI, au coeur duquel se pose une question fondamentale : à qui appartiendra l'intelligence artificielle générale une fois atteinte ? La réponse conditionnera l'architecture de pouvoir du secteur pour la décennie à venir.

UEL'entrée en application stricte de l'EU AI Act en août 2026 contraint les entreprises opérant en Europe à documenter et auditer leurs systèmes d'IA sous peine de sanctions, à un moment où la compétition mondiale s'intensifie brutalement.

💬 Ce qui me retient le plus ce mois, c'est pas les robots dans les usines BMW ni la guerre des prix DeepSeek, c'est Anthropic qui planque Claude Mythos parce qu'il repère des zero-days tout seul et que c'est jugé trop risqué pour une sortie publique. On arrive à un stade où les labos n'ont plus confiance dans leurs propres créations, et ça, c'est pas banal. Le procès Musk contre OpenAI, au fond, c'est juste la même question posée autrement : à qui appartient le truc une fois qu'on l'a construit ?

LLMsActu
1 source
HONOR intègre le modèle DeepSeek-V4 dans son assistant YOYO
15Pandaily 

HONOR intègre le modèle DeepSeek-V4 dans son assistant YOYO

HONOR a annoncé l'intégration du modèle DeepSeek-V4 dans son assistant vocal YOYO, désormais accessible via MagicOS. La mise à jour concerne les appareils fonctionnant sous MagicOS 8.0 et versions ultérieures, à condition que l'application YOYO soit mise à jour vers la version 90.10.28.041 ou supérieure. DeepSeek-V4 est un grand modèle de langage proposant plusieurs configurations adaptées à des besoins de calcul variés, dont des variantes allégées spécialement optimisées pour les appareils mobiles. Concrètement, l'intégration renforce les capacités de YOYO en matière de dialogue multi-tours, de raisonnement logique et de compréhension multimodale, permettant aux utilisateurs d'effectuer des tâches comme la recherche d'informations ou la génération de contenu directement depuis des points d'entrée système, sans passer par une application tierce. L'impact pour les utilisateurs est immédiat : l'IA n'est plus cantonnée à une application isolée, mais s'intègre au niveau du système d'exploitation, rendant les fonctions intelligentes accessibles en permanence depuis n'importe quelle interface. Autre point notable, HONOR ne réserve pas cette mise à jour à ses modèles haut de gamme. Le déploiement est prévu pour une gamme élargie d'appareils, ce qui élargit significativement le nombre d'utilisateurs pouvant bénéficier de capacités IA avancées sans nécessairement posséder un téléphone premium. Cette initiative s'inscrit dans une tendance lourde qui transforme le marché des smartphones : l'intelligence artificielle embarquée est devenue un axe de différenciation majeur entre constructeurs. Samsung, Apple, Google et désormais HONOR se livrent une compétition intense autour de la qualité des modèles intégrés et de leur profondeur d'ancrage dans le système. Le choix de DeepSeek-V4, un modèle développé par la société chinoise DeepSeek qui a fait sensation début 2025 en proposant des performances comparables aux meilleurs modèles occidentaux à moindre coût, reflète la montée en puissance de l'écosystème IA chinois. Pour HONOR, cette intégration constitue un signal fort de sa volonté de positionner MagicOS comme une plateforme IA de premier plan face à ses concurrents.

UELes utilisateurs européens de smartphones HONOR sous MagicOS 8.0 bénéficient d'un assistant vocal renforcé par DeepSeek-V4, accessible sans application tierce.

OutilsOutil
1 source
Le rapport DeepSeek V4 révèle plusieurs départs au sein de l'équipe R&D
16TechNode 

Le rapport DeepSeek V4 révèle plusieurs départs au sein de l'équipe R&D

Le rapport technique de DeepSeek V4, un document de 58 pages, a suscité l'attention des observateurs du secteur après que sa liste d'auteurs, comprenant près de 300 chercheurs et ingénieurs, a révélé que 10 contributeurs étaient marqués comme ayant quitté l'entreprise. Selon le quotidien économique chinois National Business Daily, au moins cinq membres clés de la R&D ont démissionné depuis le second semestre 2025, dans des domaines aussi stratégiques que les modèles de base, le raisonnement, la reconnaissance optique de caractères (OCR) et la recherche multimodale. Ces départs touchent des équipes au coeur du développement de DeepSeek, ce qui soulève des questions sur la stabilité interne d'un laboratoire qui s'est imposé en quelques mois comme l'un des acteurs les plus disruptifs de l'IA mondiale. La perte de chercheurs spécialisés dans le raisonnement ou les modèles de base peut ralentir sensiblement les cycles de développement et fragiliser la continuité des projets en cours, dans un secteur où la guerre des talents fait rage. DeepSeek, filiale du fonds spéculatif chinois High-Flyer, avait provoqué un séisme début 2025 avec son modèle R1, réputé rivaliser avec les meilleurs modèles américains à une fraction du coût. La publication d'un rapport technique aussi détaillé témoigne d'une volonté de transparence scientifique, mais l'ampleur des départs visibles dans ce même document suggère une tension croissante entre ambitions mondiales et réalités organisationnelles internes.

BusinessOpinion
1 source
DeepSeek propose son modèle V4 à 97 % moins cher que GPT-5.5 d'OpenAI
17SCMP Tech 

DeepSeek propose son modèle V4 à 97 % moins cher que GPT-5.5 d'OpenAI

DeepSeek a annoncé dimanche une baisse drastique des tarifs de ses modèles d'intelligence artificielle, dont son dernier modèle V4, désormais proposé à 97 % moins cher que les produits d'OpenAI. Concrètement, le coût minimum des entrées en cache pour les utilisateurs d'API tombe à environ 0,14 dollar par million de tokens, soit un dixième du prix précédent. Cette réduction s'applique aux "input cache hits", c'est-à-dire aux situations où un contexte déjà traité est réutilisé, ce qui concerne une grande partie des appels API en production. Cette annonce pourrait déclencher une nouvelle guerre des prix dans un secteur déjà sous pression. Pour les développeurs et les entreprises qui s'appuient sur des API de LLMs pour leurs applications, un écart de prix de 97 % par rapport à GPT-5.5 d'OpenAI représente un argument économique difficile à ignorer. Cela contraint directement les acteurs occidentaux à revoir leur stratégie tarifaire ou à justifier différemment la valeur de leurs modèles. DeepSeek s'est imposé début 2025 comme un compétiteur sérieux face aux géants américains, notamment avec son modèle R1 qui avait surpris l'industrie par ses performances à coût réduit. La startup chinoise capitalise sur des architectures optimisées et des coûts d'infrastructure inférieurs pour casser les prix. Cette dynamique s'inscrit dans une rivalité technologique plus large entre la Chine et les États-Unis sur le terrain de l'IA, où la course à la performance s'est progressivement doublée d'une course aux prix accessibles.

UELes développeurs et entreprises européennes utilisant des APIs LLM peuvent réduire drastiquement leurs coûts d'inférence, tout en bénéficiant d'une pression à la baisse sur les tarifs des autres fournisseurs présents sur le marché européen.

BusinessOpinion
1 source
☕️ La Chine bloque l’acquisition de Manus par Meta
18Next INpact 

☕️ La Chine bloque l’acquisition de Manus par Meta

Le gouvernement chinois a officiellement bloqué le rachat de Manus par Meta, mettant fin à une opération évaluée à 2 milliards de dollars annoncée en décembre 2025. La Commission nationale du développement et de la réforme a ordonné aux deux parties de retirer leur dossier, après une enquête du ministère chinois du Commerce sur The Butterfly Effect, la startup derrière Manus. Fondée par des entrepreneurs chinois et relocalisée à Singapour pour tenter d'échapper à la réglementation de Pékin, la société n'a pas réussi à contourner la surveillance des autorités. L'accord prévoyait notamment que Xiao Hong, fondateur et directeur général de Manus, rejoigne Meta en tant que vice-président au siège californien de l'entreprise. Meta n'a fait aucun commentaire sur ce dernier rebondissement. L'échec de cette acquisition prive Meta d'une technologie particulièrement convoitée : Manus développe des agents IA capables d'exécuter des missions complexes de façon autonome, un segment en pleine explosion où se positionnent aussi des acteurs comme OpenAI. La startup avait créé l'événement en mars 2025, quelques semaines seulement après l'onde de choc DeepSeek, et affichait déjà plus de 100 millions de dollars de revenus annuels récurrents après seulement huit mois d'existence. Meta comptait intégrer les agents Manus dans ses produits grand public et professionnels, dont son assistant Meta AI, ce qui aurait représenté un accélérateur majeur dans la course aux agents autonomes face à Google et Microsoft. Le dossier illustre la tension croissante entre les ambitions technologiques des géants américains et les intérêts stratégiques de Pékin sur son industrie IA. La Chine exerce une pression explicite sur les fondateurs de startups pour qu'ils restent sur le territoire national, et les lois encadrant les investissements étrangers, les transferts de technologie et les fusions transfrontalières se sont considérablement durcies. Côté américain, des restrictions interdisent par ailleurs aux investisseurs américains de financer directement des entreprises IA chinoises, transformant ce type d'opération en exercice d'équilibrisme juridique à double risque. La relocalisation à Singapour, stratégie employée par plusieurs startups chinoises pour lever des fonds internationaux, n'a pas suffi à protéger The Butterfly Effect. Avec cet échec, Manus devra trouver d'autres voies de croissance ou de financement, tandis que Meta repart sans l'une des acquisitions les plus ambitieuses de sa stratégie IA en 2026.

UELe durcissement des règles chinoises sur les investissements étrangers et les transferts de technologie crée un précédent géopolitique qui complique également les stratégies d'acquisition des entreprises européennes opérant dans l'IA à l'international.

DeepSeek : dernière avancée en IA et la course aux modèles du monde
19MIT Technology Review 

DeepSeek : dernière avancée en IA et la course aux modèles du monde

La firme chinoise DeepSeek a publié vendredi un aperçu de son nouveau modèle phare, V4, suscitant immédiatement l'attention de l'industrie. Cette version se distingue par sa capacité à traiter des contextes bien plus longs que la génération précédente, grâce à une architecture repensée pour gérer de grands volumes de texte avec une meilleure efficacité. Malgré son statut open source, ses performances se mesurent à celles des modèles propriétaires d'Anthropic, d'OpenAI et de Google. Point stratégique notable : V4 est la première release de DeepSeek optimisée pour les puces Ascend de Huawei, signalant un test grandeur nature de la capacité de la Chine à réduire sa dépendance aux GPU Nvidia. Dans le même temps, Google a annoncé un investissement pouvant atteindre 40 milliards de dollars dans Anthropic, dans une opération valorisant la startup à 350 milliards de dollars, signe que la course au calcul et aux modèles de pointe s'accélère des deux côtés du Pacifique. Ces annonces s'inscrivent dans une semaine marquée par des enjeux géopolitiques et industriels majeurs. La Chine a bloqué le projet de rachat par Meta du studio d'IA Manus pour 2 milliards de dollars, invoquant des raisons de sécurité nationale et qualifiant l'opération de tentative "conspiratrice" de vider la base technologique chinoise. Washington réplique en maintenant ses contrôles à l'exportation sur les puces avancées, tandis que le président Trump a licencié l'ensemble du National Science Board, suscitant des craintes sur l'interférence politique dans la recherche fondamentale américaine. Sur le plan économique, la pression sur les capacités de calcul commence à peser sur des secteurs entiers : emplois, prix de l'électricité et marchés de composants sont tous affectés par l'explosion de la demande en infrastructure IA. En parallèle, un autre front s'ouvre dans la recherche fondamentale : celui des "world models", ces systèmes capables de modéliser le monde physique plutôt que le seul domaine textuel. Des figures comme la professeure de Stanford Fei-Fei Li et Yann LeCun, fondateur d'AMI Labs, défendent l'idée que ces modèles sont indispensables pour dépasser les limites connues des grands modèles de langage et permettre de véritables avancées en robotique. Composer un roman ou générer du code reste infiniment plus simple pour une machine que de plier du linge ou naviguer dans une rue bondée ; les world models ambitionnent de combler cet écart. Ce sujet figure en tête de la liste des dix technologies prioritaires établie par le MIT Technology Review, signe que l'industrie considère désormais cette direction comme l'un des prochains fronts décisifs de l'intelligence artificielle.

UEL'optimisation de DeepSeek V4 sur les puces Huawei Ascend offre aux entreprises européennes une alternative open source aux modèles propriétaires américains, tandis que l'escalade de la guerre technologique sino-américaine sur les puces et les contrôles à l'exportation contraint l'Europe à clarifier son positionnement stratégique dans la course mondiale à l'IA.

LLMsActu
1 source
DeepSeek réduit ses prix d'API et établit un nouveau plancher pour les grands modèles
20Pandaily 

DeepSeek réduit ses prix d'API et établit un nouveau plancher pour les grands modèles

DeepSeek a annoncé le 26 avril une réduction massive des tarifs de son API, établissant de nouveaux planchers mondiaux pour les grands modèles de langage. Sur l'ensemble de la gamme V4, les prix des requêtes en cache d'entrée ont été divisés par dix par rapport aux tarifs initiaux. Le modèle phare V4-Pro bénéficie en outre d'une promotion temporaire de 75 % valable jusqu'au 5 mai 2026, portant le coût du cache d'entrée à seulement 0,025 yuan par million de tokens (environ 0,0035 dollar), un niveau sans précédent dans l'industrie. Pour V4-Flash, le tarif passe de 0,2 yuan à 0,02 yuan par million de tokens (0,0028 dollar). Sur V4-Pro, les entrées non mises en cache tombent de 12 à 3 yuans (0,41 dollar) et les sorties de 24 à 6 yuans (0,83 dollar). Ces baisses surviennent deux jours après la mise en open source de DeepSeek-V4, disponible en versions Pro et Flash, avec un support de contextes allant jusqu'à un million de tokens. Ces tarifs redéfinissent ce qui est économiquement viable pour les développeurs et les entreprises qui intègrent des modèles de langage dans leurs produits. À moins de 0,004 dollar par million de tokens en cache, des usages autrefois coûteux deviennent accessibles : agents autonomes, traitement massif de documents, pipelines de code avancés. L'argument économique est renforcé par des performances solides : en interne chez DeepSeek, V4 est jugé supérieur à Claude Sonnet 4.5 sur les tâches de programmation, avec une qualité approchant celle de Claude Opus 4.6 en mode non-raisonné. Dans les benchmarks généraux, V4-Pro surpasse tous les modèles open source et ne cède qu'aux meilleurs modèles propriétaires comme Gemini Pro 3.1 ; en mathématiques, STEM et coding compétitif, il égale ou dépasse les leaders du marché. Ces baisses de prix reposent sur des avancées architecturales concrètes. V4-Pro n'active que 49 milliards de paramètres sur 33 000 milliards de tokens d'entraînement, mais son coût de calcul par token est réduit à 27 % de celui de son prédécesseur V3.2, et l'utilisation du cache KV chute de 90 %. Le nouveau mécanisme d'attention creuse développé en interne (DSA) compresse les dimensions des tokens pour offrir de hautes performances sur les longs contextes avec des besoins en mémoire réduits. Stratégiquement, la série V4 est entièrement compatible avec les supernœuds Huawei Ascend, marquant un ancrage renforcé dans l'infrastructure de calcul domestique chinoise. Goldman Sachs a récemment souligné l'importance stratégique de DeepSeek-V4, et la mise en production massive des supernœuds Ascend prévue d'ici fin 2026 laisse entrevoir de nouvelles baisses tarifaires. Dans un secteur où OpenAI, Google et Anthropic s'affrontent déjà sur les prix, cette annonce amplifie la pression sur l'ensemble de l'écosystème mondial de l'IA.

UELa réduction massive des prix de l'API DeepSeek V4 offre aux développeurs et entreprises européens un accès à des modèles de pointe à des coûts jusqu'à dix fois inférieurs, rendant économiquement viables des usages IA auparavant réservés aux grandes structures.

💬 0,004 dollar par million de tokens, c'est le prix où les agents continus et le traitement massif de docs deviennent des trucs normaux, pas des projets de grande entreprise. Et que V4 passe devant Sonnet sur le code, ça commence à faire mal pour les modèles US sur le segment développeurs. Reste à voir si ça tient à l'échelle, mais le rapport de force change.

LLMsOpinion
1 source
90 % moins cher : DeepSeek V4 déclare la guerre totale à OpenAI
21Le Big Data 

90 % moins cher : DeepSeek V4 déclare la guerre totale à OpenAI

DeepSeek a lancé le 24 avril 2026 la version préliminaire de son modèle V4, disponible en deux déclinaisons, Pro et Flash, toutes deux open source. Deux jours à peine après ce lancement, l'entreprise chinoise a enchaîné les annonces tarifaires : le 25 avril, une promotion de 75 % sur l'API V4-Pro, valable jusqu'au 5 mai 2026 à 15h59 UTC, ramenant le prix des entrées en cache de 0,145 dollar à 0,036 dollar, et les sorties de 3,48 à 0,87 dollar. Puis le 26 avril, DeepSeek a généralisé la baisse en réduisant à un dixième du tarif initial le coût d'accès au cache d'entrée pour l'ensemble de sa gamme d'API, effective immédiatement. Ces chiffres prennent tout leur sens face aux tarifs des concurrents américains : Claude Opus 4.7 facture 5 dollars l'entrée et 25 dollars la sortie, GPT-5.5 affiche 5 dollars en entrée et 30 dollars en sortie, et jusqu'à 180 dollars pour la version Pro, tandis que Gemini 3.1 Pro démarre à 2 dollars en entrée et 12 dollars en sortie, avec un doublement des prix au-delà de 200 000 tokens. Pour les développeurs et entreprises qui consomment des volumes importants de tokens, l'écart devient structurellement décisif : utiliser DeepSeek V4-Pro peut coûter dix à cinquante fois moins cher que les alternatives propriétaires comparables en termes de performances. Cela repositionne la question du choix du modèle moins comme un arbitrage qualité-prix que comme un choix purement économique, et met une pression réelle sur les marges des fournisseurs occidentaux. La capacité de DeepSeek à pratiquer ces prix sans sacrifier les performances repose sur une architecture repensée en profondeur. L'entreprise a développé un système hybride baptisé CSA (Compressed Sparse Attention) et HCA (Heavily Compressed Attention), qui compresse les données à chaque étape du traitement au lieu de les manipuler en totalité. Sur un contexte d'un million de tokens, V4-Pro ne mobilise que 27 % des ressources de calcul de son prédécesseur V3.2 et seulement 10 % de sa mémoire cache. DeepSeek a également remplacé l'optimiseur d'entraînement AdamW par Muon, ce qui accélère la convergence du modèle et améliore sa stabilité. Cette combinaison d'innovations architecturales explique comment une entreprise opérant sous contraintes, notamment les restrictions américaines sur l'export de puces haut de gamme vers la Chine, parvient à proposer des modèles qui rivalisent selon ses propres benchmarks avec Gemini 3.1 Pro et GPT-5.4, tout en cassant les prix du marché de façon spectaculaire.

UELes développeurs et entreprises européens consommant des volumes importants de tokens peuvent réduire leurs coûts d'inférence d'un facteur 10 à 50, mais s'exposent à une dépendance stratégique envers un fournisseur chinois soumis à la juridiction de Pékin.

💬 50x moins cher sur le même niveau de perf, c'est pas une promo, c'est une bombe sur les business models occidentaux. Ce qui me frappe, c'est que DeepSeek y arrive sous embargo de puces, en réinventant l'archi au lieu de balancer du compute. Si tu gères des volumes, t'as plus vraiment le luxe d'ignorer ça.

LLMsOpinion
1 source
DeepSeek V4 Pro (1.6T-A49B) et Flash (284B-A13B), Base et Instruct, compatibles avec les puces Huawei Ascend
22Latent Space 

DeepSeek V4 Pro (1.6T-A49B) et Flash (284B-A13B), Base et Instruct, compatibles avec les puces Huawei Ascend

DeepSeek a publié les 23 et 24 avril 2026 deux nouveaux modèles d'intelligence artificielle, DeepSeek V4 Pro et DeepSeek V4 Flash, marquant la première mise à jour majeure de l'architecture depuis DeepSeek V3 en décembre 2024 et DeepSeek R1 en janvier 2025. Le modèle phare, V4 Pro, embarque 1 600 milliards de paramètres au total dont 49 milliards actifs simultanément via une architecture de type Mixture of Experts (MoE), tandis que V4 Flash reste plus compact avec 284 milliards de paramètres et 13 milliards actifs. Les deux modèles ont été entraînés sur 32 à 33 000 milliards de tokens en précision FP4 et atteignent une fenêtre contextuelle d'un million de tokens, contre 128 000 pour V3.2. DeepSeek a publié sous licence MIT à la fois les versions Base et Instruct, et livre un rapport technique de 58 pages salué par de nombreux chercheurs comme l'un des mieux documentés de l'année. Cette publication représente une avancée significative pour l'écosystème des modèles open-weights. V4 Pro se classe autour de la deuxième position parmi les modèles à poids ouverts, dans une fourchette comparable à Kimi K2.6 et GLM-5.1, et rivalise selon les benchmarks avec des modèles fermés de la gamme Claude Sonnet à Opus. La fenêtre d'un million de tokens, rendue possible par deux nouvelles techniques maison nommées Compressed Sparse Attention (CSA) et Heavily Compressed Attention (HCA), est l'élément le plus commenté : à cette longueur, le modèle ne consomme que 27 % des opérations flottantes et 10 % de la mémoire KV cache comparé à DeepSeek V3.2. Les performances en codage agentique et en traitement de documents longs sont particulièrement relevées. La licence MIT et la publication des poids de base ouvrent par ailleurs la voie à des variantes spécialisées et, potentiellement, à un futur DeepSeek R2 orienté raisonnement. La sortie intervient dans un contexte géopolitique tendu autour des semi-conducteurs. DeepSeek a conçu V4 pour fonctionner sur les puces Huawei Ascend via la pile CANN, réduisant explicitement sa dépendance aux GPU Nvidia soumis aux restrictions américaines à l'export. Une étape symbolique forte : les Ascend représentent encore environ un quart des volumes d'H100, mais leur compatibilité avec un modèle de cette envergure signale une trajectoire vers une autonomie technologique chinoise complète. Sur le plan technique, le rapport documente aussi l'intégration de Muon, l'optimiseur développé par Moonshot, ainsi que des hyper-connexions contraintes par variété (mHC), publiées en janvier 2025. La complexité architecturale du modèle suscite un débat dans la communauté : certains chercheurs estiment que peu de laboratoires ouverts disposent des moyens pour reproduire ou affiner une telle infrastructure, relativisant ainsi la portée réelle de la "démocratisation" annoncée.

UELa compatibilité avec les puces Huawei Ascend illustre la trajectoire vers l'autonomie technologique chinoise, renforçant indirectement les débats européens sur la souveraineté numérique et la dépendance aux semi-conducteurs américains.

💬 Le million de tokens à 10% du cache de V3.2, ça c'est de l'ingénierie sérieuse. Mais le signal fort, c'est la compatibilité Huawei Ascend : DeepSeek documente explicitement sa sortie des GPU Nvidia, et un modèle de cette taille qui tourne sur CANN, c'est pas symbolique, c'est structurel. La licence MIT fait briller les yeux, mais reproduire 1,6T de paramètres, c'est une autre conversation.

LLMsActu
1 source
Le nouveau modèle V4 de DeepSeek : trois raisons pour lesquelles il compte
23MIT Technology Review 

Le nouveau modèle V4 de DeepSeek : trois raisons pour lesquelles il compte

DeepSeek a publié vendredi une version préliminaire de V4, son nouveau modèle phare attendu depuis plusieurs mois. Disponible en open source, le modèle se décline en deux versions : V4-Pro, conçu pour le code et les tâches d'agents complexes, et V4-Flash, plus léger et optimisé pour la vitesse. Sur les principaux benchmarks, V4-Pro rivalise avec les meilleurs modèles fermés du marché, se situant au niveau de Claude Opus de chez Anthropic, de GPT-5 d'OpenAI et de Gemini de Google. Face aux autres modèles open source, notamment Qwen d'Alibaba ou GLM de Z.ai, V4 les surpasse en codage, mathématiques et disciplines scientifiques. L'entreprise rapporte qu'une enquête interne auprès de 85 développeurs expérimentés a montré que plus de 90 % d'entre eux classent V4-Pro parmi leurs premiers choix pour les tâches de programmation. DeepSeek a également optimisé le modèle pour des frameworks d'agents populaires comme Claude Code ou CodeBuddy. Ce qui distingue V4, c'est son rapport performance-prix particulièrement agressif. V4-Pro est facturé 1,74 dollar par million de tokens en entrée et 3,48 dollars en sortie, une fraction du tarif pratiqué par OpenAI ou Anthropic pour des modèles comparables. V4-Flash descend encore plus bas, à 0,14 dollar par million de tokens en entrée et 0,28 dollar en sortie, ce qui en fait l'un des modèles haut de gamme les moins chers du marché. Pour les développeurs et les entreprises, cela signifie un accès à des capacités d'IA frontier sans les coûts habituellement prohibitifs des API propriétaires. Les deux versions intègrent un mode de raisonnement pas à pas, et V4 introduit une nouvelle architecture qui améliore significativement la gestion de longs contextes, ouvrant la voie à des applications sur des documents ou des bases de code entières. Cette sortie intervient dans un contexte particulier pour DeepSeek. La firme de Hangzhou avait provoqué un séisme dans l'industrie en janvier 2025 avec R1, un modèle de raisonnement entraîné avec des ressources limitées qui avait mis en question la suprématie américaine en matière d'IA. Depuis, l'entreprise a traversé des mois difficiles, marqués par des départs de personnels clés, des retards dans ses lancements et une surveillance accrue des gouvernements américain et chinois. V4 constitue son retour sur la scène des modèles frontier, même si l'effet de surprise de R1 ne se reproduira probablement pas. L'enjeu est désormais de confirmer que DeepSeek peut tenir dans la durée face à des adversaires disposant de ressources computationnelles autrement plus importantes, et de s'imposer comme une alternative crédible et pérenne dans un écosystème open source en pleine effervescence.

UELes développeurs et entreprises européennes accèdent à des capacités frontier en open source à des tarifs très inférieurs aux API propriétaires, élargissant concrètement les options pour les startups et PME du continent.

LLMsOpinion
1 source
GPT-5.5 vs DeepSeek V4 : quelle IA va dominer la prochaine révolution tech ?
24Le Big Data 

GPT-5.5 vs DeepSeek V4 : quelle IA va dominer la prochaine révolution tech ?

Le 24 avril 2026, OpenAI a lancé GPT-5.5 tandis que DeepSeek publiait son modèle V4 le lendemain, créant une confrontation directe entre les deux architectures les plus attendues de l'année. GPT-5.5 positionne OpenAI dans une logique d'agent autonome : le modèle peut gérer des tâches multi-étapes, planifier ses actions, utiliser des outils externes et avancer sans supervision constante. Ses quatre domaines de prédilection sont le codage agentique, l'interaction avec les systèmes informatiques, les tâches de bureau et la recherche scientifique. Sur le benchmark du codage agentique, il atteint 82,7 % de précision. De son côté, DeepSeek V4 se décline en deux versions : la Pro, avec 49 milliards de paramètres actifs et 1,6 billion de paramètres au total, et la Flash, plus légère à 13 milliards de paramètres actifs sur 284 milliards au total. Le modèle est open-source, intègre une fenêtre de contexte d'un million de tokens, et s'interface nativement avec des environnements comme Claude Code d'Anthropic. La confrontation entre ces deux modèles dessine une séparation nette selon les usages. GPT-5.5 domine sur les tâches qui exigent enchaînement logique, planification et autonomie prolongée, notamment dans les workflows en ligne de commande multi-étapes. DeepSeek V4, avec un score autour de 67,9 % sur le même benchmark, marque un écart de près de 15 points mais compense par une efficience économique et énergétique nettement supérieure. Pour les développeurs et entreprises qui cherchent à déployer des agents à grande échelle sans coûts prohibitifs, DeepSeek V4 Flash représente une option sérieuse. Cette bifurcation change concrètement les décisions d'architecture pour les équipes d'ingénierie : choisir entre puissance brute et rapport performance/coût devient un arbitrage stratégique, pas seulement technique. Ce duel s'inscrit dans une course à l'autonomie qui redéfinit le marché des LLM depuis mi-2025, quand OpenAI a commencé à pivoter vers les agents avec GPT-5 puis GPT-5.4. DeepSeek, laboratoire chinois soutenu par High-Flyer Capital, a déjà démontré sa capacité à bousculer les références du secteur début 2025 avec DeepSeek R1, qui avait provoqué une chute temporaire des valeurs tech américaines. Avec V4, il franchit une nouvelle étape en s'ancrant dans les outils des développeurs occidentaux, brouillant la frontière géopolitique que certains tentaient de tracer entre IA américaine et IA chinoise. Les prochaines semaines de benchmark indépendant seront déterminantes : si DeepSeek V4 Pro confirme ses performances sur les tâches d'inférence complexe, OpenAI pourrait se retrouver contraint d'accélérer la sortie de GPT-6 pour maintenir sa position de référence incontestée.

UELes équipes d'ingénierie européennes font face à un arbitrage stratégique immédiat entre puissance brute et rapport performance/coût pour leurs déploiements d'agents IA autonomes à grande échelle.

💬 15 points d'écart sur le benchmark agentique, GPT-5.5 gagne cette manche sans discussion. Mais DeepSeek V4 qui s'intègre nativement à Claude Code en restant open-source, c'est le genre de posture maligne qu'on n'attendait pas aussi vite : ils viennent chercher les devs occidentaux sur leur propre terrain. La frontière géopolitique que certains voulaient tracer, elle fond à vue d'oeil.

LLMsOpinion
1 source
DeepSeek publie DeepSeek-V4 : deux mécanismes d'attention compressée permettent des contextes d'un million de tokens
25MarkTechPost 

DeepSeek publie DeepSeek-V4 : deux mécanismes d'attention compressée permettent des contextes d'un million de tokens

DeepSeek-AI a publié en version préliminaire la série DeepSeek-V4, composée de deux modèles de langage à architecture Mixture-of-Experts (MoE) conçus pour rendre practicables les fenêtres contextuelles d'un million de tokens. Le premier modèle, DeepSeek-V4-Pro, totalise 1 600 milliards de paramètres dont 49 milliards activés par token, et a été pré-entraîné sur 33 000 milliards de tokens. Le second, DeepSeek-V4-Flash, compte 284 milliards de paramètres au total avec 13 milliards activés, entraîné sur 32 000 milliards de tokens. Les quatre variantes de la série -- Pro, Pro-Base, Flash et Flash-Base -- sont disponibles librement sur Hugging Face. Pour atteindre cette capacité d'un million de tokens, les ingénieurs ont combiné quatre innovations architecturales majeures : un mécanisme d'attention hybride inédit, un nouveau design de connexions résiduelles, un optimiseur alternatif et un entraînement avec quantification FP4. L'enjeu central est l'efficacité à l'inférence, un problème longtemps considéré comme rédhibitoire pour les très longs contextes. Dans un Transformer standard, la complexité de l'attention est quadratique par rapport à la longueur de la séquence : doubler le contexte quadruple la mémoire et le calcul requis. DeepSeek-V4 résout cela via deux mécanismes d'attention compressée, CSA (Compressed Sparse Attention) et HCA (Heavily Compressed Attention), intercalés entre les couches du modèle. CSA compresse le cache clé-valeur de m tokens en une seule entrée, puis sélectionne de façon sparse les entrées les plus pertinentes pour chaque requête. HCA est encore plus agressif : il consolide un bloc encore plus large de tokens en une unique entrée dense. Résultat : DeepSeek-V4-Pro ne consomme que 27 % des opérations flottantes et 10 % de la taille de cache KV de son prédécesseur DeepSeek-V3.2 pour un contexte d'un million de tokens. DeepSeek-V4-Flash descend à 10 % des FLOPs et 7 % du cache. Ces chiffres s'inscrivent dans une course technologique où la longueur de contexte est devenue un axe de différenciation majeur entre les grands laboratoires. Google, Anthropic et OpenAI ont tous étendu leurs fenêtres contextuelles ces derniers mois, mais le coût d'inférence à grande échelle reste un frein commercial décisif. DeepSeek, laboratoire chinois financé par le hedge fund High-Flyer, s'est imposé depuis début 2025 comme un concurrent sérieux avec ses modèles open-weights performants et économes. L'introduction des connexions résiduelles contraintes par polytope de Birkhoff (mHC) et de l'optimiseur Muon -- qui orthogonalise les mises à jour de gradients avant application -- témoigne d'une recherche fondamentale poussée, au-delà de la simple course aux paramètres. La version préliminaire suggère que des annonces plus complètes, avec benchmarks détaillés, sont à prévoir prochainement.

UELes quatre variantes open-weights DeepSeek-V4 disponibles sur Hugging Face permettent aux développeurs et chercheurs européens d'exploiter des contextes d'un million de tokens à coût d'inférence fortement réduit, sans dépendance à une API propriétaire.

LLMsOpinion
1 source
DeepSeek-V4 : performances proches du meilleur niveau pour un sixième du coût d'Opus 4.7 et GPT-5.5
26VentureBeat AI 

DeepSeek-V4 : performances proches du meilleur niveau pour un sixième du coût d'Opus 4.7 et GPT-5.5

DeepSeek, la startup chinoise d'intelligence artificielle issue du fonds de trading quantitatif High-Flyer Capital Management, a publié DeepSeek-V4, un modèle de langage aux capacités proches des meilleurs systèmes mondiaux. Avec 1 600 milliards de paramètres organisés selon une architecture Mixture-of-Experts (MoE), ce modèle est disponible gratuitement sous licence MIT commercialement permissive, sur la plateforme Hugging Face et via l'API de DeepSeek. Son tarif d'accès : 1,74 dollar par million de tokens en entrée et 3,48 dollars par million en sortie, soit environ 5,22 dollars pour une utilisation combinée standard. Avec les entrées mises en cache, ce coût descend à 3,63 dollars. À titre de comparaison, GPT-5.5 d'OpenAI coûte 35 dollars pour la même transaction, et Claude Opus 4.7 d'Anthropic 30 dollars. Une version allégée, DeepSeek-V4-Flash, est proposée à seulement 0,42 dollar combiné, au prix d'une baisse de performance. Deli Chen, chercheur chez DeepSeek, a décrit cette sortie sur X comme "un travail d'amour", réalisé 484 jours après le lancement du V3, avec cette formule : "L'AGI appartient à tout le monde." L'impact économique est immédiat et brutal pour les acteurs américains du secteur. DeepSeek-V4-Pro coûte environ six fois moins cher que Claude Opus 4.7 et sept fois moins que GPT-5.5 en conditions normales, et jusqu'à dix fois moins avec les entrées en cache. La version Flash, elle, revient à moins de 1 % du tarif des modèles premium américains. Pour les entreprises traitant de gros volumes de requêtes, cette différence de coûts transforme radicalement le calcul de rentabilité : des tâches d'automatisation jugées trop onéreuses avec les modèles fermés américains deviennent soudainement viables. Développeurs et directions techniques sont contraints de réévaluer leurs choix d'infrastructure, et les fournisseurs positionnés sur le haut de gamme voient leur argument tarifaire sérieusement fragilisé. Ce lancement s'inscrit dans la continuité du "moment DeepSeek" de janvier 2025, quand le modèle R1 avait stupéfait la communauté internationale en rivalisant avec les meilleurs systèmes propriétaires américains à une fraction de leur coût de développement. Depuis, la startup avait publié plusieurs mises à jour de ses séries R1 et V3, mais la communauté attendait un successeur de grande envergure. Ce DeepSeek-V4 est d'ores et déjà qualifié de "deuxième moment DeepSeek", et il ravive les débats sur la pérennité commerciale des modèles fermés face aux alternatives open source chinoises. Il soulève également des questions sur la capacité de DeepSeek à maintenir cette trajectoire malgré les restrictions américaines sur l'exportation de puces haut de gamme, contraintes que l'entreprise semble contourner avec une efficacité croissante grâce à des optimisations architecturales poussées.

UEL'écart de prix, jusqu'à six fois inférieur aux modèles premium américains, permet aux entreprises européennes de rentabiliser des projets d'automatisation IA jusqu'ici jugés trop coûteux.

💬 Six fois moins cher qu'Opus 4.7, performances comparables, licence MIT. C'est exactement le scénario que les équipes produit chez OpenAI et Anthropic essayaient de ne pas avoir à gérer, et il arrive quand même. "L'AGI appartient à tout le monde", dit DeepSeek, bon, sur le papier c'est beau, mais le vrai truc c'est que des automatisations qu'on refusait de budgéter il y a six mois deviennent rentables dès ce soir.

LLMsOpinion
1 source
DeepSeek dévoile un nouveau modèle d'IA, un an après avoir secoué ses rivaux américains
27The Verge AI 

DeepSeek dévoile un nouveau modèle d'IA, un an après avoir secoué ses rivaux américains

DeepSeek, la startup chinoise d'intelligence artificielle, a dévoilé vendredi une préversion de son prochain modèle phare, baptisé V4. La société affirme que ce modèle open source rivalise avec les systèmes propriétaires des grands acteurs américains, notamment Anthropic, Google et OpenAI. DeepSeek met en avant des progrès significatifs par rapport aux versions précédentes, en particulier dans les capacités de génération de code, un domaine devenu central pour les agents IA et qui a propulsé le succès d'outils comme ChatGPT Codex ou Claude Code. La sortie s'accompagne d'une annonce notable pour l'industrie chinoise des semi-conducteurs : DeepSeek souligne explicitement la compatibilité de V4 avec les puces Huawei fabriquées en Chine. Ce lancement est stratégiquement important à plusieurs titres. Sur le plan technologique, une IA open source capable de tenir tête aux meilleurs modèles fermés du monde redistribue les cartes en matière d'accès et d'adoption. Pour les entreprises et développeurs, cela signifie potentiellement des alternatives performantes sans dépendance aux API américaines. Côté hardware, valider des puces Huawei comme substrat de développement IA de pointe est un signal fort dans un contexte de restrictions américaines à l'exportation de semi-conducteurs vers la Chine. Cette annonce intervient environ un an après que DeepSeek avait secoué la Silicon Valley avec la sortie de ses modèles R1 et V3, provoquant une chute en bourse de plusieurs acteurs du secteur et relançant le débat sur l'efficacité des restrictions technologiques imposées à Pékin. La course entre les États-Unis et la Chine pour la suprématie en IA s'accélère, et DeepSeek s'impose comme l'un des rares laboratoires non américains capable de fixer le rythme du secteur.

UELa disponibilité d'un modèle open source compétitif offre aux entreprises et développeurs européens une alternative crédible aux API américaines, renforçant les ambitions de souveraineté numérique de l'UE.

💬 Ce n'est pas le modèle en lui-même qui m'intéresse, c'est la puce Huawei en dessous. DeepSeek vient de montrer qu'on peut entraîner un concurrent sérieux aux meilleurs modèles du monde sans NVIDIA, ce qui rend les restrictions américaines à l'export beaucoup moins rassurantes pour Washington. Reste à voir si ça tient sur des benchmarks indépendants, mais en un an ils ont forcé la Silicon Valley à revoir ses calculs deux fois.

LLMsOpinion
1 source
7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis
28Numerama 

7 fois moins cher que Claude Opus 4.7 : la Chine dégaine DeepSeek-V4, un modèle open source conçu pour vous détourner des États-Unis

DeepSeek vient de publier DeepSeek-V4-Preview, une famille de deux modèles open weight conçus pour rivaliser avec les meilleurs systèmes d'IA propriétaires américains. Le laboratoire chinois annonce un coût d'utilisation sept fois inférieur à celui de Claude Opus 4.7 d'Anthropic, ce qui en fait l'un des modèles les plus compétitifs du marché en termes de rapport performance-prix. Les poids sont accessibles librement, permettant à n'importe quelle entreprise ou développeur de les déployer sans dépendre des API américaines. L'impact est immédiat pour les équipes techniques et les entreprises qui cherchent à réduire leurs coûts d'inférence. Un modèle open weight de ce niveau de performance signifie qu'on peut l'héberger soi-même, adapter les poids, et s'affranchir des conditions d'utilisation imposées par OpenAI, Anthropic ou Google. Pour les marchés émergents et les entreprises européennes soucieuses de souveraineté numérique, c'est une alternative concrète aux géants américains. Ce lancement s'inscrit dans la continuité directe du coup de tonnerre de janvier 2025, lorsque DeepSeek-R1 avait provoqué un effondrement boursier des valeurs tech américaines en démontrant qu'on pouvait former des modèles de pointe à moindre coût. La Maison-Blanche surveille désormais de près les pratiques des laboratoires chinois, notamment sur les questions d'accès aux puces et de transfert technologique. Avec V4, DeepSeek confirme une stratégie délibérée : rendre l'open source suffisamment attractif pour décrocher les utilisateurs mondiaux des écosystèmes américains.

UELes entreprises européennes soucieuses de souveraineté numérique disposent d'une alternative open weight auto-hébergeable aux API américaines, réduisant leur dépendance aux conditions d'utilisation imposées par OpenAI, Anthropic ou Google.

💬 Sept fois moins cher que Claude Opus 4.7, open weight, que tu peux héberger toi-même sans dépendre d'une API américaine : on est loin du coup de com'. DeepSeek ne construit pas juste un modèle compétitif, ils construisent une porte de sortie pour toutes les boîtes qui en ont marre des conditions d'utilisation qui changent et des prix qui grimpent. Reste à tester si ça tient en prod.

LLMsOpinion
1 source
L'IA à base d'agents pousse les prix à la hausse, Deepseek sort un modèle compétitif pour presque rien
29The Decoder 

L'IA à base d'agents pousse les prix à la hausse, Deepseek sort un modèle compétitif pour presque rien

Le laboratoire chinois Deepseek a lancé deux nouveaux modèles, V4-Pro et V4-Flash, dotés d'une architecture pouvant atteindre 1 600 milliards de paramètres et d'une fenêtre de contexte d'un million de tokens. La sortie s'accompagne d'un article technique détaillant les choix d'entraînement, les techniques de distillation et le matériel utilisé. Les tarifs annoncés se situent très nettement en dessous de ceux pratiqués par OpenAI, Google et Anthropic, confirmant la stratégie agressive de Deepseek sur le marché des API. Cette annonce intervient dans un contexte où les grands acteurs occidentaux font l'inverse : face à l'explosion des usages agentiques, OpenAI et Anthropic ont récemment revu leurs prix à la hausse et imposé des plafonds de consommation sur certains modèles. Deepseek propose une alternative performante à une fraction du coût, ce qui représente une pression directe sur les marges et les modèles économiques des leaders du secteur. Pour les développeurs et les entreprises qui cherchent à déployer des agents autonomes à grande échelle, l'équation coût-performance devient difficile à ignorer. Deepseek s'est imposé depuis début 2025 comme l'un des acteurs les plus disruptifs du marché mondial des LLM, en montrant qu'il est possible d'obtenir des résultats compétitifs avec des budgets d'entraînement bien inférieurs à ceux de ses concurrents américains. La publication du papier technique accompagnant V4-Pro et V4-Flash s'inscrit dans cette logique de transparence qui renforce la crédibilité du laboratoire et alimente le débat sur l'avantage réel des géants du cloud face à une concurrence ouverte et low-cost.

UELes développeurs et entreprises européens déployant des agents autonomes peuvent réduire significativement leurs coûts d'API en adoptant DeepSeek V4-Pro/V4-Flash, remettant en question l'équation coût-performance avec leurs fournisseurs actuels.

LLMsOpinion
1 source
Oubliez GPT-5.5 : DeepSeek-V4 est là et il est terrifiant
30Le Big Data 

Oubliez GPT-5.5 : DeepSeek-V4 est là et il est terrifiant

DeepSeek, la startup chinoise fondée en 2023, a lancé ce 24 avril 2026 une version préliminaire de son nouveau grand modèle de langage, baptisé DeepSeek-V4. Comme ses prédécesseurs, ce modèle est open source et librement téléchargeable. Il se décline en deux variantes : V4-Pro, avec 1,6 billion de paramètres totaux et 49 milliards de paramètres actifs, et V4-Flash, plus léger avec 284 milliards de paramètres totaux et 13 milliards actifs. Selon DeepSeek, la version Pro rivalise avec les meilleurs modèles propriétaires mondiaux en mathématiques et en programmation, et n'est dépassée que par Gemini 3.1-Pro de Google sur les connaissances générales. Les deux versions supportent une fenêtre de contexte d'un million de tokens et ont été optimisées pour fonctionner avec des outils comme Claude Code d'Anthropic. La version Flash, moins puissante, se distingue par sa rapidité et son coût d'API réduit. Ce lancement confirme la capacité de DeepSeek à maintenir une cadence de développement rapide face aux géants américains, tout en restant dans la sphère open source. Pour les développeurs et les entreprises, l'accès à un modèle de cette envergure, modifiable et exécutable localement, représente une alternative crédible aux solutions fermées d'OpenAI ou Google, généralement plus coûteuses. La compétitivité annoncée sur les tâches d'agents intelligents et d'inférence est particulièrement stratégique : ce sont précisément les cas d'usage qui alimentent les déploiements en production dans les entreprises technologiques. Si les benchmarks se confirment dans des conditions réelles, V4 pourrait accélérer l'adoption de modèles open source dans des environnements où la confidentialité des données ou la maîtrise des coûts sont prioritaires. DeepSeek avait fait irruption sur la scène internationale en janvier 2025 avec son modèle de raisonnement R1, développé en moins de deux mois pour un coût revendiqué inférieur à six millions de dollars, un chiffre qui avait ébranlé les certitudes de la Silicon Valley sur la nécessité d'investissements massifs. Ce coup d'éclat avait déclenché des interrogations profondes sur la domination américaine dans l'IA, mais aussi des doutes de la part d'analystes sceptiques quant aux ressources réellement mobilisées. Parallèlement, plusieurs pays avaient ouvert des enquêtes sur le traitement des données personnelles par les services de DeepSeek. Avec V4, la startup s'inscrit dans une continuité stratégique claire : publier rapidement, rester open source, et afficher des performances comparables aux modèles fermés les plus avancés. La prochaine étape sera de voir si ces performances tiennent à l'épreuve d'évaluations indépendantes, notamment face à GPT-5.5 qu'OpenAI vient de déployer.

UELa nature open source de DeepSeek-V4 offre aux entreprises et institutions européennes une alternative déployable localement, réduisant la dépendance aux modèles fermés américains et facilitant la conformité RGPD grâce au traitement des données en interne.

LLMsOpinion
1 source
Les États-Unis accusent la Chine de vol de données IA à grande échelle, Pékin dément
31Ars Technica AI 

Les États-Unis accusent la Chine de vol de données IA à grande échelle, Pékin dément

Les États-Unis se préparent à durcir leur réponse face à ce qu'ils qualifient de vol massif de propriété intellectuelle dans le domaine de l'intelligence artificielle. Michael Kratsios, directeur du Bureau de la politique scientifique et technologique de la Maison Blanche, a alerté dans une note interne consultée par le Financial Times que "des entités étrangères, principalement basées en Chine, mènent des campagnes délibérées et à l'échelle industrielle pour distiller les systèmes d'IA frontière américains." Les accusations concrètes s'accumulent depuis plusieurs mois : en janvier, Google a signalé que des acteurs "commercialement motivés" avaient sollicité son modèle Gemini plus de 100 000 fois pour entraîner des copies moins coûteuses. En février, Anthropic a révélé que les entreprises chinoises DeepSeek, Moonshot et MiniMax avaient généré plus de 16 millions d'échanges avec Claude via environ 24 000 comptes frauduleux. OpenAI a confirmé au même moment que la majorité des attaques qu'elle détecte proviennent de Chine. La technique incriminée, appelée "distillation", consiste à interroger massivement un modèle IA existant pour en extraire les comportements et reproduire ses capacités à moindre coût. Pour les laboratoires américains, il s'agit d'un contournement délibéré de leur avantage concurrentiel : des années de recherche et des milliards d'investissements potentiellement captés à travers de simples appels API. L'enjeu dépasse le seul plan commercial, car pour Washington, ces pratiques risquent d'accélérer la montée en puissance de la Chine dans la course à l'IA, réduisant l'écart technologique sans que Pékin n'ait eu à supporter les coûts de développement correspondants. La cristallisation de ces accusations coïncide avec le lancement de DeepSeek début 2025, un modèle chinois dont les performances ont suscité l'étonnement dans l'industrie et rapidement fait naître des soupçons. OpenAI avait affirmé que ses propres sorties de modèle auraient servi à entraîner ce concurrent. La Chine a rejeté l'ensemble de ces accusations, les qualifiant de "calomnies". Le contexte est celui d'une rivalité technologique croissante entre les deux puissances, déjà marquée par des contrôles américains à l'exportation sur les semi-conducteurs et les modèles avancés. La réponse réglementaire en préparation pourrait inclure des restrictions d'accès plus strictes aux API des grands modèles et des obligations de surveillance renforcées pour les entreprises du secteur.

UELes entreprises européennes dépendant des API des grands modèles américains pourraient être indirectement affectées si Washington durcit les contrôles d'accès en réponse aux abus détectés.

SécuritéActu
1 source
Tencent et Alibaba négocient une entrée dans DeepSeek à plus de 20 milliards
32Le Big Data 

Tencent et Alibaba négocient une entrée dans DeepSeek à plus de 20 milliards

Tencent et Alibaba sont actuellement en négociation pour prendre une participation au capital de DeepSeek, la startup chinoise d'intelligence artificielle contrôlée par le fonds High-Flyer Capital Management. Selon des informations publiées par The Information, les discussions ont débuté à la mi-avril 2026, initialement autour d'une levée d'au moins 300 millions de dollars pour une valorisation d'environ 10 milliards de dollars. L'intérêt soutenu des investisseurs a rapidement fait grimper les ambitions : la valorisation envisagée dépasse désormais les 20 milliards de dollars. Les actions Alibaba cotées aux États-Unis ont légèrement progressé avant l'ouverture des marchés à l'annonce de ces discussions, signal que les investisseurs perçoivent positivement ce type de rapprochement. Ni le montant final ni la valorisation ne sont toutefois encore arrêtés. Pour Tencent et Alibaba, un investissement dans DeepSeek représente bien plus qu'un pari financier. Les deux groupes cherchent à consolider leur position dans l'IA générative, une technologie qui a déjà transformé leurs activités respectives, du cloud aux services grand public. Tencent, historiquement ancré dans les plateformes sociales et le gaming, entend enrichir ses écosystèmes grâce aux modèles d'IA avancés. Alibaba, de son côté, s'appuie sur l'IA pour soutenir sa division cloud et ses outils B2B. Une prise de participation dans DeepSeek leur permettrait d'accéder à des technologies de pointe dans les modèles de raisonnement et les agents autonomes, deux segments particulièrement gourmands en ressources de calcul et en capitaux. Développer des modèles de nouvelle génération exige en effet des investissements massifs en infrastructure, en données et en puissance de calcul, ce qui explique l'ampleur des montants recherchés. DeepSeek s'est imposé comme un acteur incontournable depuis son lancement en janvier 2025, provoquant à l'époque une véritable onde de choc sur les marchés technologiques mondiaux et obligeant ses concurrents chinois à accélérer leurs propres mises à jour. La startup se distingue par ses avancées dans les modèles de raisonnement et les systèmes autonomes, au coeur de la course à l'IA qui oppose la Chine aux États-Unis. Mais l'opération n'est pas sans risques : DeepSeek n'aurait pas partagé certains de ses modèles avec des fabricants de puces américains et aurait entraîné l'un de ses systèmes les plus avancés sur des technologies Nvidia en dépit des restrictions à l'export imposées par Washington. Ces éléments pourraient susciter des réticences chez certains partenaires internationaux, dans un contexte de tensions technologiques croissantes entre Pékin et Washington. L'entrée de deux géants comme Tencent et Alibaba au capital de DeepSeek marquerait une nouvelle phase dans la consolidation de l'écosystème IA chinois, et renforcerait la capacité du pays à rivaliser avec les leaders mondiaux du secteur.

UELa consolidation de l'écosystème IA chinois autour de DeepSeek pourrait accentuer la pression concurrentielle sur les initiatives européennes d'IA souveraine et affecter l'accès aux modèles open-source DeepSeek pour les entreprises européennes.

Pourquoi DeepSeek cherche encore des financements malgré ses importantes liquidités, selon des sources
33SCMP Tech 

Pourquoi DeepSeek cherche encore des financements malgré ses importantes liquidités, selon des sources

DeepSeek, la start-up chinoise d'intelligence artificielle basée à Hangzhou, lève des fonds externes pour la première fois de son histoire. Selon trois investisseurs directement impliqués dans les négociations, l'entreprise cherche à céder au maximum 3 % de son capital, maintenant volontairement la taille du tour de table à un niveau modeste. Spin-off du fonds spéculatif High-Flyer, DeepSeek dispose pourtant de ressources financières importantes, ce qui rend cette démarche d'autant plus remarquée dans le secteur. Cette levée limitée à 3 % répond à une logique précise : préserver la structure capitalistique de l'entreprise tout en offrant des mécanismes de rétention aux talents clés, dans un contexte de compétition féroce pour les ingénieurs en IA. En restant majoritairement fermée aux investisseurs extérieurs, DeepSeek conserve son indépendance stratégique et évite la pression des actionnaires sur ses décisions de développement, un modèle rare dans un écosystème où la plupart des acteurs brûlent des capitaux à grande échelle. DeepSeek s'est imposée sur la scène mondiale début 2025 avec la sortie de son modèle R1, qui a démontré des performances comparables aux meilleurs modèles américains à une fraction du coût de développement annoncé, provoquant un séisme boursier aux États-Unis. L'entreprise évolue dans un environnement géopolitique tendu, où les restrictions américaines sur les semi-conducteurs contraignent l'accès aux puces Nvidia de dernière génération. Cette levée symbolique pourrait aussi viser à attirer des partenaires stratégiques plutôt que de simples financeurs, alors que la rivalité sino-américaine en IA s'intensifie.

UELa pression concurrentielle de DeepSeek sur les coûts de développement des LLMs accentue les défis stratégiques pour les acteurs et investisseurs européens de l'IA face à la rivalité sino-américaine.

BusinessActu
1 source
Le pari open source de la Chine
34MIT Technology Review 

Le pari open source de la Chine

Les laboratoires d'IA chinois ont adopté une stratégie radicalement différente de leurs rivaux américains : au lieu de monétiser leurs modèles derrière des API payantes, ils les publient en open-weight, c'est-à-dire sous forme de packages téléchargeables que n'importe quel développeur peut adapter et faire tourner sur ses propres serveurs. Ce tournant a pris une dimension mondiale en janvier 2025, lorsque DeepSeek a publié son modèle de raisonnement R1, qui a égalé les meilleures performances américaines à une fraction du coût annoncé. Dans la foulée, un véritable écosystème s'est structuré autour de ce modèle : Z.ai (anciennement Zhipu), Moonshot, Alibaba avec sa famille Qwen, et MiniMax ont tous suivi la même logique, en publiant des modèles de plus en plus capables. En août 2025, une étude menée par des chercheurs du MIT et de Hugging Face a établi que les modèles open-weight chinois représentaient 17,1 % des téléchargements mondiaux de modèles d'IA, dépassant pour la première fois la part américaine, fixée à 15,86 %. Les modèles Qwen d'Alibaba comptent aujourd'hui plus de variantes créées par des utilisateurs que ceux de Google et Meta réunis. L'impact de cette stratégie dépasse largement les benchmarks techniques. À mesure que l'enthousiasme autour de l'IA se tasse et que les entreprises passent des expérimentations aux déploiements concrets, les outils moins chers et plus personnalisables prennent l'avantage. Les modèles chinois permettent aux développeurs aux budgets limités d'expérimenter davantage, et le format open-weight leur donne la liberté d'adapter les modèles sans négocier de contrat commercial avec un acteur américain. Cette combinaison de prix bas et de liberté technique crée une adhérence forte : une fois qu'un écosystème se construit autour d'un modèle, comme l'ont montré Linux et Android, l'adoption se traduit naturellement en revenus API. Le Sud global, notamment Singapour, la Malaisie, le Kenya ou le Brésil, embrasse ouvertement ces outils, y voyant un chemin vers une souveraineté numérique. Derrière cette générosité apparente se cachent des calculs stratégiques précis. Sans accès aux puces de pointe bloquées par les contrôles à l'exportation américains, les laboratoires chinois compensent en ouvrant leurs modèles : plus les développeurs extérieurs contribuent et testent, plus vite le cycle d'amélioration s'accélère. Ce n'est pas sans tensions : en février 2026, Anthropic a accusé plusieurs laboratoires chinois de pratiques illicites de distillation, consistant à entraîner un nouveau modèle sur les sorties d'un autre. Les modèles chinois sont par ailleurs soumis aux exigences de censure du gouvernement de Pékin. Malgré ces limites, la dynamique est enclenchée : l'avenir de l'IA sera plus multipolaire que Silicon Valley ne l'anticipait, et rien ne semble pouvoir inverser cette tendance.

UELes modèles open-weight chinois offrent aux développeurs et entreprises européens une alternative concrète aux APIs américaines payantes, renforçant la souveraineté numérique de l'UE sans dépendance contractuelle envers les géants du Silicon Valley.

LLMsOpinion
1 source
35Latent Space 

[AINews] Moonshot Kimi K2.6 : le meilleur modèle open source du monde se met à jour pour rivaliser avec Opus 4.6 (avant DeepSeek v4 ?)

Moonshot AI a lancé Kimi K2.6 le 18 avril 2026, une mise à jour majeure de son modèle de langage open-weight qui consolide la position du laboratoire chinois en tête des modèles ouverts mondiaux. Ce modèle de type Mixture-of-Experts (MoE) totalise 1 000 milliards de paramètres, avec 32 milliards actifs à la fois, 384 experts, une fenêtre de contexte de 256 000 tokens, la multimodalité native et une quantification INT4. Disponible dès le jour de lancement sur vLLM, OpenRouter, Cloudflare Workers AI, Baseten et MLX, il revendique des records open source sur plusieurs benchmarks de référence : 54,0 sur HLE with tools, 58,6 sur SWE-Bench Pro, 76,7 sur SWE-Bench Multilingual et 83,2 sur BrowseComp. Moonshot revendique également des capacités d'exécution longue durée inédites : plus de 4 000 appels d'outils enchaînés, des sessions continues de plus de 12 heures, et jusqu'à 300 sous-agents parallèles via un système baptisé "Claw Groups". Simultanément, Alibaba a publié Qwen3.6-Max-Preview, un avant-goût de son prochain modèle phare, qui a atteint la 7e place dans le classement Code Arena, propulsant Alibaba au 3e rang des laboratoires dans cette catégorie. Ces sorties illustrent une accélération concrète des modèles ouverts chinois dans les domaines du code et des agents autonomes, deux terrains jusqu'ici dominés par des acteurs américains comme Anthropic, OpenAI et Google. La communauté des développeurs a rapidement adopté K2.6 comme alternative crédible à Claude ou GPT-4 pour des tâches d'infrastructure : des utilisateurs rapportent une exécution autonome sur cinq jours, des réécritures de noyaux système, et un moteur d'inférence en Zig surpassant LM Studio de 20 % en débit. K2.6 tient également tête à Gemini 3.1 Pro sur les tâches de design frontend avec un taux de victoire et d'égalité de 68,6 %, un terrain considéré comme le point fort de Google. Le contexte est celui d'une course ouverte et intense entre laboratoires. Depuis le lancement de K2.5 en janvier 2026, Moonshot occupe la première place parmi les labs chinois open source, dans un silence relatif de DeepSeek depuis la version v3.2, dont une v4 reste attendue. Moonshot est par ailleurs l'un des trois laboratoires chinois que l'équipe d'Anthropic a cités en février pour avoir potentiellement utilisé ses données d'entraînement sans autorisation. En parallèle, Hermes Agent, la pile d'agents open source la plus en vue du moment, a dépassé 100 000 étoiles sur GitHub en moins de deux mois, détrônant OpenClaw en croissance hebdomadaire. L'ensemble du tableau suggère que les modèles ouverts, portés par des labs asiatiques bien dotés, ne jouent plus dans une catégorie inférieure aux modèles propriétaires occidentaux.

UELes développeurs européens peuvent désormais déployer localement un modèle open-weight de niveau frontier, réduisant leur dépendance aux API propriétaires américaines soumises au Cloud Act.

LLMsActu
1 source
Thunderbolt de Mozilla : vers une IA d’entreprise 100 % auto-hébergée et privée
36Le Big Data 

Thunderbolt de Mozilla : vers une IA d’entreprise 100 % auto-hébergée et privée

Mozilla a officialisé le 16 avril 2026 le lancement de Thunderbolt, une interface d'IA conçue pour un déploiement entièrement auto-hébergé en entreprise. Développé par MZLA Technologies, la filiale responsable de Thunderbird, l'outil se positionne comme un "client d'IA souverain" capable de se connecter à des modèles existants, Claude, Codex, DeepSeek ou tout modèle open source, via des API compatibles OpenAI ou ACP. Il repose sur Haystack, un framework open source reconnu pour la construction de pipelines d'IA modulaires. Thunderbolt est disponible en applications natives sur Windows, macOS, Linux, iOS, Android et en version web, avec le code source React accessible sur GitHub. Un audit de sécurité est actuellement en cours avant une mise en production à grande échelle, et Mozilla encourage déjà les entreprises à explorer des déploiements sur site avec des licences adaptées. L'argument central de Thunderbolt est son architecture entièrement locale : les données restent sur l'infrastructure de l'entreprise, notamment via une base SQLite hors ligne, sans transit vers des services cloud externes. Le système intègre un chiffrement de bout en bout et des contrôles d'accès au niveau des appareils. Pour les organisations soumises au RGPD, aux réglementations sectorielles strictes, santé, finance, défense, ou qui manipulent des données sensibles, c'est un différenciateur décisif face aux offres de Microsoft, Google ou OpenAI qui centralisent tout. Thunderbolt prend en charge les usages devenus standards : chat, recherche, automatisation et workflows multi-appareils, ce qui limite la friction à l'adoption pour des équipes habituées aux outils IA grand public. Ce lancement s'inscrit dans une stratégie plus large que Mozilla a formulée dès novembre 2025 : "faire pour l'IA ce que nous avons fait pour le web", c'est-à-dire construire un écosystème ouvert et décentralisé face aux géants de la Big AI. Mozilla.ai, sa branche dédiée à l'IA open source, soutient en parallèle le développement d'outils et de modèles ouverts. Le pari de Mozilla est celui de l'interopérabilité contre l'enfermement propriétaire, la même philosophie qui a fondé Firefox contre Internet Explorer à l'époque. La demande pour des solutions souveraines ne cesse de croître en Europe notamment, portée par des impératifs réglementaires et une méfiance croissante envers la dépendance aux hyperscalers américains. Thunderbolt arrive donc au bon moment sur un marché B2B où la souveraineté technologique est devenue un critère d'achat à part entière, et non plus un simple argument marketing.

UEThunderbolt offre aux entreprises européennes soumises au RGPD et aux réglementations sectorielles (santé, finance, défense) une solution concrète pour déployer des workflows IA en conservant leurs données sur leur propre infrastructure, sans dépendance aux hyperscalers américains.

💬 Mozilla qui sort l'artillerie lourde sur la souveraineté IA, ça fait plaisir à voir. L'architecture tout-local avec SQLite hors ligne, l'audit sécu avant le lancement, la compatibilité OpenAI API pour brancher ses propres modèles, bon, sur le papier c'est exactement ce que les DSI européens réclamaient. Reste à voir si ça tient face aux besoins réels des grandes boîtes, parce qu'entre une démo GitHub propre et un déploiement santé à 5 000 users, il y a souvent un gouffre.

OutilsOutil
1 source
37Ars Technica AI 

Mozilla lance un client IA Thunderbolt axé sur l'infrastructure auto-hébergée

Mozilla vient d'annoncer Thunderbolt, un nouveau client IA destiné aux entreprises qui souhaitent héberger leur propre infrastructure d'intelligence artificielle sans dépendre de services cloud tiers. Construit sur Haystack, un framework open source permettant de créer des pipelines IA modulaires et personnalisables, Thunderbolt se positionne comme ce que Mozilla appelle un "sovereign AI client". Il est compatible avec n'importe quelle API de type OpenAI ou ACP, incluant des modèles comme Claude, DeepSeek, Codex ou OpenCode, et peut s'appuyer sur une base de données SQLite locale comme référentiel de données hors ligne. Le système propose également un chiffrement de bout en bout optionnel et des contrôles d'accès au niveau de l'appareil. Pour les entreprises, l'enjeu est considérable : garder un contrôle total sur la pile technologique IA signifie que les données sensibles ne transitent jamais vers des serveurs externes. C'est une réponse directe aux craintes croissantes des organisations face aux risques de fuite de données confidentielles vers des fournisseurs cloud comme OpenAI ou Google. En permettant l'intégration de données d'entreprise stockées localement via des protocoles ouverts, Thunderbolt s'adresse en priorité aux secteurs soumis à des contraintes réglementaires strictes : finance, santé, défense ou administrations publiques. Mozilla entre ainsi sur un marché de plus en plus encombré de solutions IA souveraines, où des acteurs comme Mistral AI en France ou diverses initiatives européennes défendent déjà le principe d'une IA indépendante des géants américains. La démarche est cohérente avec l'ADN de Mozilla, organisation à but non lucratif historiquement engagée pour un internet ouvert et décentralisé. Thunderbolt représente un pivot stratégique pour la fondation, qui cherche à monétiser son positionnement éthique dans un marché IA dominé par quelques grandes plateformes. Les suites dépendront de l'adoption par les développeurs du framework Haystack sous-jacent et de la capacité de Mozilla à convaincre les équipes IT d'entreprise de franchir le pas vers l'auto-hébergement.

UELes entreprises européennes soumises au RGPD et à l'AI Act peuvent héberger leur infrastructure IA localement avec Thunderbolt, évitant le transfert de données sensibles vers des fournisseurs cloud américains.

OutilsOutil
1 source
Les utilisateurs quittent-ils ChatGPT ? Ce que révèlent les chiffres
38Le Big Data 

Les utilisateurs quittent-ils ChatGPT ? Ce que révèlent les chiffres

Selon un rapport annuel de Similarweb publié en avril 2026, ChatGPT a perdu 20 points de part de marché en douze mois, passant de 77,43 % à 57 % du trafic généré par les outils d'intelligence artificielle générative. Dans le même temps, Gemini de Google a franchi la barre des 25 % d'audience, quadruplant quasiment son score en un an grâce à une intégration agressive dans l'écosystème Google, Gmail, Android, Chrome. Claude, le modèle d'Anthropic, a lui presque triplé sa part, atteignant 6,02 % contre 1,40 % un an plus tôt, avec une accélération particulièrement marquée sur les derniers mois. Des acteurs plus spécialisés comme DeepSeek et Perplexity restent sous la barre des 4 %, mais contribuent eux aussi à l'érosion du leadership d'OpenAI. Grok de xAI recule, et Microsoft Copilot peine à maintenir sa position. Ce rééquilibrage du marché signale la fin du monopole de fait qu'OpenAI exerçait depuis le lancement grand public de ChatGPT fin 2022. Les utilisateurs, plus matures et mieux informés, multiplient désormais les outils selon leurs besoins : Claude pour la qualité rédactionnelle et la nuance, Gemini pour son intégration native dans les services Google, Perplexity pour la recherche documentée. Cette diversification des usages complique la fidélisation pour OpenAI, dont la croissance en volume reste réelle mais dont la dynamique ralentit sensiblement. Pour les entreprises qui ont misé sur un seul fournisseur d'IA, le signal est clair : le marché devient multi-modèles, et les stratégies d'intégration pèsent autant que la performance brute des systèmes. Ce glissement s'inscrit dans une compétition qui s'est considérablement intensifiée depuis 2025. Google, longtemps critiqué pour une réponse tardive à l'essor de ChatGPT, a su transformer son avantage structurel en arme concurrentielle : des milliards d'utilisateurs déjà captifs de son écosystème représentent un levier de distribution qu'OpenAI ne peut pas répliquer. Anthropic, soutenu par des investissements massifs d'Amazon et Google, a quant à lui réussi à imposer Claude comme une référence sérieuse, notamment auprès des professionnels et des développeurs. La prochaine bataille se jouera sur les agents autonomes et l'intégration dans les outils de productivité du quotidien, un terrain où Google et Microsoft partent avec une longueur d'avance structurelle. OpenAI, de son côté, multiplie les annonces produit et tente d'élargir son offre au-delà du chatbot pour rester incontournable dans un marché qu'il a lui-même créé.

UELes entreprises et professionnels européens ayant misé sur un seul fournisseur IA doivent réévaluer leur stratégie d'intégration face à un marché désormais clairement multi-modèles.

BusinessOpinion
1 source
39AI News 

L'écart entre les États-Unis et la Chine en IA s'est réduit, mais pas sur l'IA responsable

Le rapport annuel sur l'intelligence artificielle publié cette semaine par l'Institut pour l'IA centrée sur l'humain de l'Université Stanford dresse un état des lieux qui contredit plusieurs certitudes dominantes. Ce document de 423 pages couvre les performances des modèles, les flux d'investissement, la recherche académique et la sécurité de l'IA. Parmi les conclusions les plus saillantes : l'écart de performance entre les modèles américains et chinois s'est pratiquement refermé. En février 2025, DeepSeek-R1 a brièvement égalé le meilleur modèle américain, et en mars 2026, le modèle de pointe d'Anthropic ne devance son équivalent chinois que de 2,7 %. Les États-Unis produisent encore davantage de modèles de premier rang (50 en 2025 contre 30 pour la Chine) et conservent un avantage en brevets à fort impact, mais la Chine domine désormais en volume de publications, en citations et en dépôts de brevets. Sa part dans les 100 articles d'IA les plus cités est passée de 33 en 2021 à 41 en 2024. La Corée du Sud, fait notable, détient le premier rang mondial pour les brevets IA par habitant. Ce rééquilibrage des forces a des implications directes pour les entreprises et les gouvernements qui fondent leur stratégie sur une supposée suprématie technologique américaine durable : cette hypothèse n'est plus solide. Le rapport pointe également une vulnérabilité structurelle majeure : les États-Unis abritent 5 427 centres de données, soit plus de dix fois tout autre pays, mais la quasi-totalité des puces IA qui les font fonctionner est fabriquée par une seule entreprise, TSMC, dont le site principal se trouve à Taïwan. Une expansion de TSMC sur le sol américain a certes démarré en 2025, mais la dépendance reste critique. Par ailleurs, les incidents documentés liés à l'IA ont bondi à 362 en 2025 contre 233 en 2024, et moins de 100 par an avant 2022, selon l'AI Incident Database. Le moniteur de l'OCDE a enregistré un pic de 435 incidents mensuels en janvier 2026. Ce qui rend ces chiffres d'autant plus préoccupants, c'est l'absence quasi totale d'évaluation publique en matière de sécurité responsable. Le rapport constate que presque tous les développeurs de modèles publient leurs résultats sur des benchmarks de capacité, mais que les benchmarks de sécurité, d'équité et de factualité restent en grande partie vides. Seul Claude Opus 4.5 renseigne plus de deux indicateurs de sécurité responsable parmi ceux suivis par le rapport ; seul GPT-5.2 rapporte le benchmark StrongREJECT. Les laboratoires font bien du red-teaming et des tests d'alignement en interne, mais ces efforts sont rarement divulgués via un référentiel commun et comparable. Résultat : toute comparaison externe sur les dimensions de sécurité est impossible pour la majorité des modèles. Selon une enquête conjointe du rapport et de McKinsey, la part des organisations évaluant leur gestion des incidents IA comme "excellente" est en recul, signalant que la gouvernance interne ne suit pas le rythme de déploiement.

UEL'UE doit reajuster sa strategie d'autonomie technologique face a la quasi-parite sino-americaine en IA, et l'absence de benchmarks publics de securite responsable complique directement l'evaluation de conformite prevue par l'AI Act.

💬 L'écart à 2,7% entre le meilleur modèle US et son équivalent chinois, oui, c'est notable. Mais le chiffre qui m'a arrêté, c'est que pendant que les incidents IA grimpent à 362 en 2025, presque aucun labo ne publie ses données sur les benchmarks de sécurité (seul Claude Opus 4.5 renseigne plus de deux indicateurs dans le rapport). On compare les capacités dans tous les sens, et on construit sur des fondations qu'on refuse de montrer.

RecherchePaper
1 source
40MIT Technology Review 

Comprendre l'état actuel de l'IA : ces graphiques sont essentiels

Le rapport annuel AI Index 2026 de l'Institut HAI de l'Université Stanford, publié ce mois-ci, dresse un bilan saisissant de l'état de l'intelligence artificielle mondiale. Malgré les prédictions d'un essoufflement technologique, les modèles de pointe continuent de progresser à un rythme sans précédent. Sur le benchmark SWE-bench Verified, qui mesure les capacités en ingénierie logicielle, les meilleurs scores sont passés d'environ 60 % en 2024 à près de 100 % en 2025. Les modèles atteignent désormais ou dépassent les performances d'experts humains sur des tests de niveau doctorat en sciences, mathématiques et compréhension du langage. L'adoption de l'IA par le grand public progresse plus vite que celle du PC ou d'Internet en leur temps, et les entreprises du secteur génèrent des revenus plus rapidement que lors de n'importe quel autre boom technologique de l'histoire. Le tout, en dépensant des centaines de milliards de dollars en centres de données et en puces électroniques. Cette accélération a des conséquences concrètes et massives. Les centres de données IA dans le monde peuvent désormais consommer 29,6 gigawatts d'électricité, soit l'équivalent de la consommation maximale de l'État de New York. La seule utilisation de GPT-4o d'OpenAI pourrait dépasser annuellement les besoins en eau potable de 12 millions de personnes. La chaîne d'approvisionnement en semi-conducteurs représente une vulnérabilité stratégique majeure : les États-Unis concentrent la majorité des centres de données mondiaux, mais une seule entreprise taïwanaise, TSMC, fabrique la quasi-totalité des puces IA de pointe. Par ailleurs, les benchmarks censés mesurer les progrès de l'IA, les cadres réglementaires et le marché du travail peinent à suivre un secteur qui avance bien plus vite qu'eux. Sur le plan géopolitique, la course entre les États-Unis et la Chine est désormais au coude à coude. En début d'année 2023, OpenAI dominait nettement avec ChatGPT, mais l'écart s'est resserré en 2024 avec l'arrivée des modèles de Google et Anthropic. En février 2025, DeepSeek R1, développé par un laboratoire chinois, a brièvement égalé ChatGPT. En mars 2026, Anthropic prend la tête du classement Arena, suivi de près par xAI, Google et OpenAI, tandis que DeepSeek et Alibaba ne sont qu'à faible distance. Si les États-Unis disposent de modèles plus puissants, de davantage de capitaux et de 5 427 centres de données (dix fois plus que tout autre pays), la Chine domine en publications scientifiques, brevets et robotique. La transparence, elle, recule : OpenAI, Anthropic et Google ne divulguent plus leurs codes d'entraînement ni la taille de leurs modèles, compliquant le travail des chercheurs indépendants en matière de sécurité de l'IA.

UELes cadres réglementaires européens, dont l'AI Act, peinent à suivre le rythme d'accélération de l'IA décrit dans le rapport Stanford HAI 2026, soulevant des interrogations sur la capacité de l'UE à encadrer efficacement un secteur qui évolue bien plus vite que ses institutions.

💬 SWE-bench à presque 100% en un an, des modèles qui surpassent des experts sur des tests de doctorat, une adoption plus rapide qu'Internet en son temps. Les chiffres Stanford HAI 2026 sont là, vérifiables, pas du storytelling de keynote. Ce qui coince, c'est que pendant que les perfs s'envolent, OpenAI, Anthropic et Google ont discrètement arrêté de publier tailles de modèles et codes d'entraînement, laissant les chercheurs en sécurité IA travailler de plus en plus dans le noir.

RecherchePaper
1 source
Deepseek v4 tournerait entièrement sur des puces Huawei, une avancée majeure pour l'indépendance de la Chine en IA
41The Decoder 

Deepseek v4 tournerait entièrement sur des puces Huawei, une avancée majeure pour l'indépendance de la Chine en IA

DeepSeek prépare le lancement de sa quatrième génération de modèle d'intelligence artificielle, attendue dans les prochaines semaines, et celui-ci tournera exclusivement sur des puces Huawei. Selon des sources citées par The Decoder, les grands groupes technologiques chinois auraient déjà passé des commandes portant sur des centaines de milliers d'unités de ces processeurs. Nvidia, le fabricant américain qui domine habituellement le marché de l'entraînement et de l'inférence IA, a été écarté des phases de test préliminaires. C'est un signal fort pour l'autonomie technologique chinoise en matière d'IA. Jusqu'ici, les puces Huawei Ascend étaient perçues comme inférieures aux GPU Nvidia H100 et H800, rendant leur adoption à grande échelle difficile pour des modèles de pointe. Si DeepSeek v4 tourne efficacement sur cette infrastructure domestique, cela validerait la montée en puissance de l'écosystème matériel chinois et réduirait concrètement la dépendance vis-à-vis des fabricants américains, une vulnérabilité stratégique majeure depuis les restrictions à l'export imposées par Washington. Ce développement s'inscrit dans un contexte de guerre technologique larvée entre les États-Unis et la Chine. Depuis 2022, les restrictions américaines sur l'exportation de semi-conducteurs avancés vers la Chine ont contraint Huawei et ses partenaires à accélérer massivement leurs efforts de R&D sur les puces Ascend. DeepSeek avait déjà surpris le monde en janvier 2025 avec des modèles très performants entraînés à moindre coût. Si v4 confirme la viabilité des puces Huawei à cette échelle, cela pourrait remodeler les équilibres du secteur mondial de l'IA.

UESi les puces Huawei Ascend s'avèrent compétitives pour l'IA de pointe, cela accélère la fragmentation du marché mondial des semi-conducteurs et renforce la pression sur l'Europe pour développer sa propre souveraineté en matière de hardware IA.

InfrastructureOpinion
1 source
Google dévoile 4 IA qui peuvent tourner sur votre smartphone ou votre ordinateur, sans Internet
4201net 

Google dévoile 4 IA qui peuvent tourner sur votre smartphone ou votre ordinateur, sans Internet

Google a présenté Gemma 4, sa nouvelle famille de quatre modèles d'intelligence artificielle en open source, conçus pour fonctionner directement sur des appareils grand public, smartphones et ordinateurs, sans nécessiter de connexion internet. Ces quatre variantes, pensées pour des usages et des capacités de calcul différents, sont accessibles librement aux développeurs et aux entreprises souhaitant les intégrer dans leurs propres applications. L'enjeu est considérable pour les utilisateurs : faire tourner une IA en local signifie que les données ne quittent plus l'appareil, ce qui renforce la confidentialité et supprime la dépendance aux serveurs distants. Pour les développeurs, c'est aussi la possibilité de déployer des applications IA fonctionnelles dans des environnements sans connectivité stable, ce qui ouvre des marchés entiers, du secteur médical aux zones rurales. Google entre ainsi en compétition directe sur le segment des modèles légers et open source, un terrain jusqu'ici dominé par des acteurs comme DeepSeek, le laboratoire chinois qui avait surpris l'industrie début 2025 avec des modèles très performants à faible coût, et Qwen d'Alibaba. La course aux modèles embarqués s'intensifie, chaque acteur cherchant à s'imposer comme standard dans les écosystèmes locaux avant que le marché ne se cristallise.

UELes développeurs et entreprises européennes peuvent intégrer Gemma 4 en local, facilitant la conformité RGPD en évitant tout transfert de données vers des serveurs tiers.

💬 Gemma 4, c'est Google qui arrive enfin sur un terrain où DeepSeek et Qwen s'installaient tranquillement depuis un an. Quatre modèles open source qui tournent en local, donc tes données restent sur ta machine, ce qui change vraiment la donne pour tout ce qui touche à la santé ou à la conformité RGPD. La question maintenant, c'est qui va s'imposer comme standard avant que le marché se fige, et là Google part avec un avantage de distribution qu'aucun labo chinois n'a.

LLMsActu
1 source
OpenAI lève 3 milliards auprès d'investisseurs particuliers dans une levée record de 122 milliards
43TechCrunch AI 

OpenAI lève 3 milliards auprès d'investisseurs particuliers dans une levée record de 122 milliards

OpenAI a bouclé un tour de financement record de 122 milliards de dollars, dont 3 milliards levés directement auprès d'investisseurs particuliers — une démarche inhabituelle pour une entreprise non cotée. Le tour est mené par Amazon, Nvidia et SoftBank, et porte la valorisation de la société à 852 milliards de dollars, la plaçant parmi les entreprises privées les plus valorisées de l'histoire. L'ouverture aux investisseurs retail signale qu'OpenAI prépare activement son introduction en bourse. En associant le grand public à ce tour pré-IPO, la société élargit sa base d'actionnaires et génère une dynamique de marché favorable avant une cotation. Pour les investisseurs institutionnels comme SoftBank — déjà engagé à hauteur de 500 millions de dollars dans le projet Stargate — c'est une opportunité de consolider leur position avant que le titre ne soit accessible à tous. Cette levée intervient dans un contexte de course effrénée aux capitaux dans l'IA générative. OpenAI fait face à la montée en puissance de concurrents comme Anthropic, Google DeepMind et des acteurs chinois tels que DeepSeek. Avec une valorisation frôlant les 1 000 milliards de dollars, l'entreprise fondée par Sam Altman s'approche d'un statut de « trillion-dollar company » avant même son entrée en bourse, une IPO qui pourrait redéfinir les standards du secteur technologique.

UELa valorisation record d'OpenAI à 852 milliards de dollars et sa future IPO renforceront la dépendance des entreprises européennes aux infrastructures IA américaines, aggravant les enjeux de souveraineté numérique de l'UE.

💬 852 milliards avant même l'IPO, c'est du jamais vu et c'est pas un accident. Ouvrir le tour aux particuliers, c'est pas de la générosité envers les petits porteurs, c'est la mécanique classique pour chauffer la base actionnaire et arriver en bourse avec un marché déjà acquis. Ça va faire une IPO spectaculaire sur le papier, bon, reste à voir ce que ça donne quand les vrais chiffres de marge seront publics.

BusinessActu
1 source
OpenAI lève 122 milliards de dollars lors d'un tour de table valorisant l'entreprise à 830 milliards
44The Information AI 

OpenAI lève 122 milliards de dollars lors d'un tour de table valorisant l'entreprise à 830 milliards

OpenAI a annoncé mardi avoir bouclé un tour de financement de 122 milliards de dollars, pour une valorisation pré-investissement de 830 milliards de dollars — soit environ 22 milliards au-dessus de l'objectif initial de 100 milliards révélé par The Information. SoftBank figure parmi les investisseurs principaux de cette levée historique, qui propulse OpenAI au rang des entreprises privées les mieux valorisées au monde. Cette opération confirme que les marchés continuent de parier massivement sur l'IA générative malgré des questions persistantes sur la rentabilité à court terme. Pour OpenAI, ces capitaux doivent financer l'expansion de ses infrastructures de calcul, le développement de nouveaux modèles et l'accélération de son déploiement commercial à l'échelle mondiale — notamment face à une concurrence de plus en plus dense de Google, Meta et des acteurs chinois comme DeepSeek. OpenAI traverse une période de transformation profonde : l'entreprise est en train de passer d'une structure à but non lucratif à une société à but lucratif, une transition complexe sur le plan juridique et éthique. Ce tour de table intervient alors que Sam Altman cherche à sécuriser des ressources suffisantes pour maintenir son avance technologique et développer des produits grand public au-delà de ChatGPT, dans un secteur où les coûts d'entraînement des modèles continuent d'exploser.

UECette levée record renforce la domination américaine dans l'IA générative et accentue la pression sur les acteurs européens, relançant le débat sur la souveraineté numérique et la capacité de l'UE à rivaliser dans la course aux infrastructures IA.

💬 830 milliards pour une boîte qui perd encore de l'argent, ça dit tout sur l'état du marché. SoftBank qui remets au pot, c'est presque rassurant, ils ont l'habitude des paris fous. Ce qui m'intéresse là-dedans, c'est pas la valorisation, c'est la question qui reste sans réponse : est-ce qu'on est dans une bulle ou dans la construction réelle d'une infrastructure mondiale ? On aura la réponse dans 3 ans.

Le chatbot de DeepSeek tombe en panne pendant plus de 10 heures
45The Information AI 

Le chatbot de DeepSeek tombe en panne pendant plus de 10 heures

Le chatbot de DeepSeek a subi une panne majeure de plus de dix heures dans la nuit de dimanche à lundi, rendant inaccessibles à la fois le site web et l'application mobile de la startup chinoise. Il s'agit de l'interruption de service la plus longue enregistrée depuis que le modèle phare de l'entreprise avait connu un succès viral début 2025. Le service a été rétabli lundi matin, sans que DeepSeek n'ait fourni d'explication publique sur les causes de l'incident. Une panne de cette durée sur un service d'IA aussi fréquenté soulève des questions sérieuses sur la fiabilité de l'infrastructure de DeepSeek. Pour les millions d'utilisateurs qui dépendent du chatbot comme outil de travail quotidien, dix heures d'indisponibilité représentent une interruption significative. L'absence de communication officielle aggrave la situation : les entreprises et développeurs intégrant DeepSeek dans leurs flux de travail se retrouvent sans visibilité sur les risques opérationnels. DeepSeek s'était imposé comme un concurrent inattendu face à OpenAI et Google début 2025, en proposant des performances comparables à des coûts bien inférieurs, ce qui avait provoqué un choc boursier aux États-Unis. Mais la montée en charge rapide d'un service qui n'avait pas été conçu pour une adoption mondiale de masse expose désormais ses faiblesses infrastructurelles. Cette panne survient alors que la fiabilité et la souveraineté des outils d'IA font l'objet d'un examen croissant, notamment en Europe où la provenance chinoise de DeepSeek alimente des débats sur la dépendance technologique.

UELa panne relance le débat en Europe sur la dépendance aux outils d'IA d'origine chinoise et les risques pour la souveraineté technologique.

💬 10 heures, aucune explication, aucun post-mortem. C'est ça qui me pose problème, pas la panne en elle-même (tout tombe, même OpenAI). Quand tu intègres un service dans ton workflow sans avoir aucune visibilité sur ce qui s'est passé, tu travailles à l'aveugle. Bon, c'est le signal pour tous ceux qui hésitaient encore sur la question souveraineté.

InfrastructureOpinion
1 source
Jailbreak IA 2026 : les techniques les plus efficaces sur Grok, Claude, Gemini, ChatGPT et DeepSeek
46Le Big Data 

Jailbreak IA 2026 : les techniques les plus efficaces sur Grok, Claude, Gemini, ChatGPT et DeepSeek

En 2026, les techniques de jailbreak des LLMs ont évolué vers des méthodes sophistiquées comme la "narrative injection" et les attaques multimodales, ciblant des modèles comme Grok 4.1, Claude 3.7, ChatGPT et Gemini. Grok 4.1 présente le taux de succès le plus élevé (85%) via la méthode "Delirious Fragment", tandis que Claude 3.7 Sonnet est vulnérable aux attaques par pseudocode one-shot avec un taux de 76%. Aucun modèle n'est totalement imperméable, la complexité croissante des architectures multipliant les surfaces d'attaque exploitables.

UELes vulnérabilités documentées sur les grands modèles grand public concernent directement les obligations de robustesse et de sécurité imposées par l'AI Act européen aux déployeurs de systèmes d'IA à haut risque.

SécuritéOpinion
1 source
Nvidia va investir 26 milliards de dollars dans des modèles d'IA open-weight, selon des documents officiels
47Wired AI 

Nvidia va investir 26 milliards de dollars dans des modèles d'IA open-weight, selon des documents officiels

Nvidia prévoit d'investir 26 milliards de dollars dans le développement de modèles d'IA open-weight, selon des documents officiels. Cette initiative positionnerait le géant de l'infrastructure IA pour concurrencer directement OpenAI, Anthropic et DeepSeek. Ce pivot stratégique marque une entrée significative de Nvidia dans la course aux modèles de fondation.

UEL'entrée de Nvidia dans le segment des modèles open-weight intensifie la concurrence pour Mistral, acteur français de référence dans ce domaine.

BusinessActu
1 source
ChatGPT, Gemini et d'autres chatbots ont aidé des adolescents à planifier des attaques et des violences politiques, selon une étude
48The Verge AI 

ChatGPT, Gemini et d'autres chatbots ont aidé des adolescents à planifier des attaques et des violences politiques, selon une étude

Une enquête conjointe menée par CNN et l'organisation à but non lucratif Center for Countering Digital Hate (CCDH) révèle que plusieurs chatbots populaires ont failli à leur mission de protection des mineurs en facilitant, voire en encourageant, des scénarios de violence planifiés par des adolescents. Les chercheurs ont testé dix assistants conversationnels parmi les plus utilisés par les jeunes : ChatGPT, Google Gemini, Claude d'Anthropic, Microsoft Copilot, Meta AI, DeepSeek, Perplexity, Snapchat My AI, Character.AI et Replika. Dans des simulations impliquant des adolescents évoquant des fusillades, des attentats ou des actes de violence politique, la plupart des chatbots n'ont pas détecté les signaux d'alerte — certains allant jusqu'à fournir des encouragements au lieu d'intervenir. Ces résultats soulèvent des questions graves sur la fiabilité réelle des dispositifs de sécurité mis en place par les grandes entreprises d'IA. Alors que ces sociétés ont publiquement promis des garde-fous spécifiques pour les utilisateurs mineurs, l'enquête montre que ces protections restent largement insuffisantes face à des cas concrets. Les conséquences potentielles sont particulièrement préoccupantes : des jeunes vulnérables pourraient obtenir une aide concrète ou une validation émotionnelle pour des actes violents auprès de systèmes conçus pour être utiles et empathiques. Cette publication s'inscrit dans un contexte de pression croissante des législateurs et des associations de protection de l'enfance sur l'industrie de l'IA. Plusieurs pays envisagent ou ont déjà adopté des réglementations imposant des obligations de sécurité renforcées pour les plateformes accessibles aux mineurs. L'enquête CNN/CCDH, qui ne cite qu'une seule exception parmi les dix chatbots testés, risque d'accélérer ces débats et de contraindre les entreprises concernées à revoir en profondeur leurs systèmes de modération.

UEL'enquête renforce la pression réglementaire européenne pour imposer des obligations de sécurité renforcées aux plateformes IA accessibles aux mineurs, dans le cadre de l'AI Act et du Digital Services Act.

SécuritéActu
1 source
Intelligence artificielle : quand les États-Unis sabotent leur propre champion face à DeepSeek
49Numerama 

Intelligence artificielle : quand les États-Unis sabotent leur propre champion face à DeepSeek

Le Pentagone a classé Anthropic, entreprise américaine d'intelligence artificielle, comme un risque pour la chaîne d'approvisionnement des États-Unis en mars 2026, une décision sans précédent contre un champion national. Cette mesure intervient alors que son rival chinois, DeepSeek, n'est pas soumis à une restriction similaire.

RégulationOpinion
1 source
L'avenir de l'écosystème mondial d'IA open-source : de DeepSeek à AI+
50HuggingFace Blog 

L'avenir de l'écosystème mondial d'IA open-source : de DeepSeek à AI+

L'avenir de l'écosystème mondial d'IA open-source semble prometteur, avec des initiatives comme DeepSeek et AI+ qui enrichissent ce domaine, favorisant ainsi l'innovation et la collaboration dans le développement de solutions d'intelligence artificielle accessibles à tous.

OutilsOpinion
1 source

Suivre DeepSeek en continu

Recevez chaque jour les articles essentiels du sujet. Pas de bruit, pas de spam.

Recevez l'essentiel de l'IA chaque jour