LLMsNext INpact · 11 juin 2026, 10:01· 2 min de lecture

Apple détaille ses cinq nouveaux modèles d’IA et admet à demi-mot ses ratés

Résumé IASource uniqueImpact UE Take éditorial

À l'occasion de la WWDC 2026, Apple a présenté la troisième génération de ses modèles d'IA maison, les Apple Foundation Models (AFM 3), qui alimenteront Apple Intelligence sous iOS 27 et les autres systèmes d'exploitation en version 27. La famille compte cinq modèles distincts : deux fonctionnent directement sur l'appareil, AFM 3 Core (3 milliards de paramètres) et AFM 3 Core Advanced (20 milliards de paramètres, mais n'en activant dynamiquement qu'1 à 4 milliards selon les requêtes), et trois dans le cloud, AFM 3 Cloud pour les tâches courantes, ADM 3 Cloud pour la génération et l'édition d'images, et AFM 3 Cloud Pro pour le raisonnement complexe et les outils agentiques. Ce dernier tourne sur des serveurs NVIDIA hébergés dans Google Cloud, une infrastructure étendue au système Private Cloud Compute d'Apple. Les modèles reposent sur une base Gemini de Google, conformément à l'accord conclu entre les deux entreprises en janvier 2026. Pour profiter du modèle local le plus puissant, il faut un iPhone Air, un iPhone 17 Pro, un Mac M3 ou un iPad M4 avec au moins 12 Go de RAM, l'iPhone 17 standard, limité à 8 Go, est exclu.

Cette annonce est importante à plusieurs égards. Sur le plan technique, la méthode d'activation dynamique des paramètres d'AFM 3 Core Advanced est une innovation notable : elle permet à Apple de faire tourner un modèle de 20 milliards de paramètres en puisant dans la mémoire flash plutôt que dans la RAM, contournant ainsi les limites physiques des appareils mobiles. Concrètement, cela se traduit par un Siri plus expressif, des voix personnalisables et une dictée vocale améliorée. Mais au-delà des performances annoncées, l'aveu implicite d'Apple est révélateur : en ne comparant plus ses nouveaux modèles aux benchmarks sectoriels standardisés utilisés l'an dernier face à GPT-4o ou Gemma, la firme de Cupertino semble reconnaître discrètement que la génération précédente était en deçà des attentes, ce que le retard du nouveau Siri et les critiques répétées autour d'Apple Intelligence avaient déjà largement signalé.

Cette troisième génération d'AFM s'inscrit dans un contexte de rattrapage accéléré pour Apple, qui accuse un retard structurel sur ses rivaux en matière d'IA générative. L'accord avec Google pour baser ses modèles sur Gemini, combiné à l'utilisation de GPU NVIDIA dans le cloud, marque une dépendance rare pour une entreprise qui a bâti son identité sur la maîtrise totale de sa chaîne technologique, du silicium au logiciel. Apple se retrouve ainsi tributaire de deux de ses principaux concurrents stratégiques. La question qui se pose désormais est celle de la durabilité de ce positionnement : soit Apple accélère le développement de ses propres modèles fondamentaux, soit elle consolide ces partenariats, au risque de perdre encore davantage de souveraineté sur la couche IA, qui deviendra centrale dans tous ses produits.

Impact France/UE

Les millions d'utilisateurs européens d'appareils Apple seront directement concernés par le traitement de leurs données via l'infrastructure Google Cloud sous iOS 27, soulevant des questions de conformité RGPD pour Apple Intelligence.

💬 L'analyse de Mathieu

La partie la plus révélatrice, c'est le silence sur les benchmarks. L'an dernier ils s'y comparaient fièrement, cette année le tableau de chasse a disparu, et tout le monde a compris le message. Baser ses modèles sur Gemini et faire tourner le tout sur des GPU NVIDIA dans Google Cloud, c'est peut-être le chemin le plus rapide, mais c'est le genre de dépendance qu'Apple a passé vingt ans à éviter, et là ils la construisent vis-à-vis de deux rivaux directs.

Dans nos dossiers

Apple Intelligence Gemini NVIDIA Souveraineté IA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Decoder

Google I/O : nouveaux modèles, agent cloud permanent et refonte de l'application Gemini

Lors de sa conférence développeurs Google I/O, tenue cette semaine, Google a dévoilé plusieurs annonces majeures dans le domaine de l'intelligence artificielle. Au programme : un nouveau modèle de langage baptisé Gemini 3.5 Flash, conçu pour allier rapidité et efficacité, un modèle multimodal nommé Gemini Omni capable de traiter simultanément texte, images, audio et vidéo, ainsi qu'un agent personnel cloud appelé Gemini Spark, pensé pour fonctionner en continu, vingt-quatre heures sur vingt-quatre. L'application Gemini bénéficie par ailleurs d'une refonte visuelle et fonctionnelle complète. L'introduction de Gemini Spark marque un tournant dans la vision de Google pour l'IA personnelle. Contrairement aux assistants classiques qui se contentent de répondre à des requêtes ponctuelles, un agent cloud permanent peut exécuter des tâches de façon autonome, anticiper des besoins, surveiller des données ou déclencher des actions sans intervention humaine. Pour les développeurs comme pour les utilisateurs grand public, cela ouvre la voie à une nouvelle catégorie d'assistants proactifs, toujours disponibles et potentiellement connectés à l'ensemble des services Google. Ces annonces s'inscrivent dans une course effrénée à l'IA agentique que se livrent Google, OpenAI et Microsoft depuis début 2025. Google cherche à reprendre l'initiative après avoir été perçu comme en retrait face aux avancées de GPT-4o et des agents d'OpenAI. Avec cette vague de lancements, l'entreprise signale sa volonté de positionner Gemini non plus comme un simple chatbot, mais comme une infrastructure d'IA omniprésente, ancrée dans le cloud et intégrée à l'ensemble de son écosystème.

UELes nouveaux modèles Gemini et l'agent cloud permanent seront accessibles aux développeurs et entreprises européens, accélérant l'adoption de l'IA agentique dans l'écosystème Google en Europe.

LLMsActu

1 source

2The Verge AI

DeepSeek dévoile un nouveau modèle d'IA, un an après avoir secoué ses rivaux américains

DeepSeek, la startup chinoise d'intelligence artificielle, a dévoilé vendredi une préversion de son prochain modèle phare, baptisé V4. La société affirme que ce modèle open source rivalise avec les systèmes propriétaires des grands acteurs américains, notamment Anthropic, Google et OpenAI. DeepSeek met en avant des progrès significatifs par rapport aux versions précédentes, en particulier dans les capacités de génération de code, un domaine devenu central pour les agents IA et qui a propulsé le succès d'outils comme ChatGPT Codex ou Claude Code. La sortie s'accompagne d'une annonce notable pour l'industrie chinoise des semi-conducteurs : DeepSeek souligne explicitement la compatibilité de V4 avec les puces Huawei fabriquées en Chine. Ce lancement est stratégiquement important à plusieurs titres. Sur le plan technologique, une IA open source capable de tenir tête aux meilleurs modèles fermés du monde redistribue les cartes en matière d'accès et d'adoption. Pour les entreprises et développeurs, cela signifie potentiellement des alternatives performantes sans dépendance aux API américaines. Côté hardware, valider des puces Huawei comme substrat de développement IA de pointe est un signal fort dans un contexte de restrictions américaines à l'exportation de semi-conducteurs vers la Chine. Cette annonce intervient environ un an après que DeepSeek avait secoué la Silicon Valley avec la sortie de ses modèles R1 et V3, provoquant une chute en bourse de plusieurs acteurs du secteur et relançant le débat sur l'efficacité des restrictions technologiques imposées à Pékin. La course entre les États-Unis et la Chine pour la suprématie en IA s'accélère, et DeepSeek s'impose comme l'un des rares laboratoires non américains capable de fixer le rythme du secteur.

UELa disponibilité d'un modèle open source compétitif offre aux entreprises et développeurs européens une alternative crédible aux API américaines, renforçant les ambitions de souveraineté numérique de l'UE.

💬 Ce n'est pas le modèle en lui-même qui m'intéresse, c'est la puce Huawei en dessous. DeepSeek vient de montrer qu'on peut entraîner un concurrent sérieux aux meilleurs modèles du monde sans NVIDIA, ce qui rend les restrictions américaines à l'export beaucoup moins rassurantes pour Washington. Reste à voir si ça tient sur des benchmarks indépendants, mais en un an ils ont forcé la Silicon Valley à revoir ses calculs deux fois.

LLMsOpinion

1 source

3Pandaily

DeepSeek réduit ses prix d'API et établit un nouveau plancher pour les grands modèles

DeepSeek a annoncé le 26 avril une réduction massive des tarifs de son API, établissant de nouveaux planchers mondiaux pour les grands modèles de langage. Sur l'ensemble de la gamme V4, les prix des requêtes en cache d'entrée ont été divisés par dix par rapport aux tarifs initiaux. Le modèle phare V4-Pro bénéficie en outre d'une promotion temporaire de 75 % valable jusqu'au 5 mai 2026, portant le coût du cache d'entrée à seulement 0,025 yuan par million de tokens (environ 0,0035 dollar), un niveau sans précédent dans l'industrie. Pour V4-Flash, le tarif passe de 0,2 yuan à 0,02 yuan par million de tokens (0,0028 dollar). Sur V4-Pro, les entrées non mises en cache tombent de 12 à 3 yuans (0,41 dollar) et les sorties de 24 à 6 yuans (0,83 dollar). Ces baisses surviennent deux jours après la mise en open source de DeepSeek-V4, disponible en versions Pro et Flash, avec un support de contextes allant jusqu'à un million de tokens. Ces tarifs redéfinissent ce qui est économiquement viable pour les développeurs et les entreprises qui intègrent des modèles de langage dans leurs produits. À moins de 0,004 dollar par million de tokens en cache, des usages autrefois coûteux deviennent accessibles : agents autonomes, traitement massif de documents, pipelines de code avancés. L'argument économique est renforcé par des performances solides : en interne chez DeepSeek, V4 est jugé supérieur à Claude Sonnet 4.5 sur les tâches de programmation, avec une qualité approchant celle de Claude Opus 4.6 en mode non-raisonné. Dans les benchmarks généraux, V4-Pro surpasse tous les modèles open source et ne cède qu'aux meilleurs modèles propriétaires comme Gemini Pro 3.1 ; en mathématiques, STEM et coding compétitif, il égale ou dépasse les leaders du marché. Ces baisses de prix reposent sur des avancées architecturales concrètes. V4-Pro n'active que 49 milliards de paramètres sur 33 000 milliards de tokens d'entraînement, mais son coût de calcul par token est réduit à 27 % de celui de son prédécesseur V3.2, et l'utilisation du cache KV chute de 90 %. Le nouveau mécanisme d'attention creuse développé en interne (DSA) compresse les dimensions des tokens pour offrir de hautes performances sur les longs contextes avec des besoins en mémoire réduits. Stratégiquement, la série V4 est entièrement compatible avec les supernœuds Huawei Ascend, marquant un ancrage renforcé dans l'infrastructure de calcul domestique chinoise. Goldman Sachs a récemment souligné l'importance stratégique de DeepSeek-V4, et la mise en production massive des supernœuds Ascend prévue d'ici fin 2026 laisse entrevoir de nouvelles baisses tarifaires. Dans un secteur où OpenAI, Google et Anthropic s'affrontent déjà sur les prix, cette annonce amplifie la pression sur l'ensemble de l'écosystème mondial de l'IA.

UELa réduction massive des prix de l'API DeepSeek V4 offre aux développeurs et entreprises européens un accès à des modèles de pointe à des coûts jusqu'à dix fois inférieurs, rendant économiquement viables des usages IA auparavant réservés aux grandes structures.

💬 0,004 dollar par million de tokens, c'est le prix où les agents continus et le traitement massif de docs deviennent des trucs normaux, pas des projets de grande entreprise. Et que V4 passe devant Sonnet sur le code, ça commence à faire mal pour les modèles US sur le segment développeurs. Reste à voir si ça tient à l'échelle, mais le rapport de force change.

LLMsOpinion

1 source

4The Verge AI

Meta revient dans la course à l'IA avec un nouveau modèle appelé "Muse Spark

Meta Superintelligence Labs lance son premier modèle d'intelligence artificielle depuis la refonte massive des ambitions IA de Mark Zuckerberg, qui a investi des milliards dans ce virage stratégique. Baptisé Muse Spark, ce modèle alimente désormais l'application Meta AI et le site meta.ai aux États-Unis. Dans les prochaines semaines, il sera intégré à WhatsApp, Instagram, Facebook, Messenger et les lunettes connectées de Meta, avec un déploiement progressif dans d'autres pays. Une version privée sera également mise à disposition de certains partenaires sélectionnés par l'entreprise. Muse Spark représente le premier modèle d'une nouvelle série et positionne Meta comme un concurrent direct de Google Gemini sur le terrain de l'intégration native dans un écosystème produit. Comme Google l'a fait avec ses propres services, Meta parie sur une IA "conçue spécifiquement pour ses produits", ce qui lui permet de toucher instantanément plusieurs milliards d'utilisateurs actifs sur ses plateformes. Cette intégration transversale donne à Meta un avantage de distribution considérable face aux modèles indépendants comme GPT-4o ou Claude. Ce lancement intervient après des mois de restructuration interne chez Meta, marqués par la création de Meta Superintelligence Labs et le recrutement agressif de chercheurs de pointe. Zuckerberg avait publiquement reconnu que Meta accusait un retard sur OpenAI et Google dans la course aux modèles frontier. Muse Spark est la réponse directe à cette lacune, avec l'ambition de transformer les milliards d'interactions quotidiennes sur les applications Meta en terrain d'apprentissage et de déploiement à grande échelle.

UELe déploiement progressif de Muse Spark sur WhatsApp, Instagram et Facebook touchera des centaines de millions d'utilisateurs européens dans les prochaines semaines.

💬 Meta joue pas dans la même cour que les labos de recherche pure, et ça tombe bien parce qu'ils jouent un autre jeu. Intégrer un modèle maison dans WhatsApp, Instagram et les Ray-Ban d'un coup, c'est une approche que même Google galère encore à coordonner à cette échelle. Si Muse Spark est juste "bon", la distribution fait le reste.

LLMsActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic