LLMsArs Technica AI · 28 mai 2026, 21:30· 1 min de lecture

Apple tente d'intégrer le grand modèle Gemini dans l'iPhone pour améliorer Siri

Apple travaille à intégrer le modèle d'intelligence artificielle Gemini de Google directement dans l'iPhone pour transformer Siri en profondeur, selon un rapport de The Information publié à l'approche de la Worldwide Developers Conference (WWDC) prévue début juin 2026. Promis une première fois en 2024, le nouveau Siri dopé à l'IA générative a été repoussé à plusieurs reprises. La version finale s'appuiera sur un fonctionnement hybride : une partie du traitement se fera sur l'appareil, mais la majorité des opérations complexes sera déléguée aux serveurs cloud de Google et de Nvidia.

Ce virage représente un recul significatif par rapport à la position historique d'Apple sur la confidentialité. La marque à la pomme a longtemps mis en avant le traitement local des données comme garantie de vie privée, en opposant son approche à celle des concurrents qui centralisent tout dans le cloud. Confier l'essentiel du traitement IA à Google soulève des questions concrètes pour les utilisateurs soucieux de leurs données personnelles : chaque requête adressée à Siri pourrait transiter par des infrastructures tierces. Pour l'industrie, cela confirme que même Apple, avec ses puces Neural Engine réputées optimisées pour l'IA, ne peut pas faire tourner des modèles de grande taille uniquement en local.

Le problème technique est fondamental : les smartphones actuels manquent de RAM pour charger des modèles d'IA massifs en mémoire, et les NPUs (unités de traitement neuronal) restent moins performants que les GPU pour inférer de gros modèles, contrairement à ce que les discours marketing laissent entendre. Apple se retrouve dans une position délicate, coincée entre son positionnement premium sur la vie privée et la course aux capacités IA imposée par ses concurrents. Le partenariat avec Google, déjà actif pour le moteur de recherche sur Safari, s'étend ainsi au coeur de l'assistant vocal, renforçant une dépendance que la firme de Cupertino cherchait pourtant à réduire.

Impact France/UE

Les utilisateurs européens d'iPhone pourraient voir leurs requêtes Siri transiter par les serveurs de Google, soulevant des questions de conformité RGPD et de protection des données personnelles sous le droit européen.

Dans nos dossiers

Apple Intelligence Gemini NVIDIA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1The Information AI

Apple peut « distiller » le grand modèle Gemini de Google

Apple et Google ont conclu un accord de partenariat IA bien plus profond qu'il n'y paraissait. Au-delà du simple ajustement (fine-tuning) du modèle Gemini, Apple dispose d'un accès complet au modèle dans ses propres infrastructures de data centers. Cet accès permet à Apple de produire des modèles plus petits, optimisés pour des tâches spécifiques ou suffisamment légers pour tourner directement sur les appareils Apple — une technique appelée « distillation ». Cela change considérablement la donne pour Siri et les fonctionnalités IA promises depuis longtemps. En exécutant des modèles distillés localement, Apple gagne en vitesse de traitement et en confidentialité, deux avantages cruciaux pour sa clientèle. La dépendance aux serveurs distants diminue, ce qui réduit aussi les coûts d'infrastructure — un enjeu d'autant plus pressant que les capacités serveur sont actuellement en tension dans tout le secteur. En parallèle, OpenAI traverse sa propre restructuration : son PDG Sam Altman vient de réorganiser l'entreprise, lancé un nouveau modèle baptisé « Spud » et mis fin à l'application vidéo Sora — jugée trop gourmande en serveurs dans le cadre d'une stratégie de recentrage sur les produits prioritaires.

LLMsOpinion

1 source

2Frandroid

Faire tenir une IA de 54 Go dans votre poche : voici PrismML sur iPhone qui intéresse Apple

PrismML, jeune pousse soutenue par le fonds de capital-risque de Vinod Khosla, affirme être parvenue à compresser un modèle d'intelligence artificielle de 27 milliards de paramètres, qui occupe habituellement environ 54 Go en mémoire, pour le faire tenir dans moins de 4 Go sur un iPhone 17 Pro. Selon les informations rapportées par The Information, Apple s'intéresserait de près à cette technologie, sans que la nature exacte des discussions (partenariat, licence ou rachat) n'ait été précisée à ce stade. La prouesse technique repose sur des méthodes de quantification poussées, permettant de réduire drastiquement la taille d'un modèle sans le faire tourner sur des serveurs distants. Cette avancée compte parce qu'elle permettrait de faire fonctionner des modèles proches de la taille des meilleurs LLM actuels directement sur un smartphone, sans connexion internet ni envoi de données vers le cloud. Pour Apple, empêtrée dans un retard perçu sur l'IA générative embarquée face à Google et Samsung, disposer d'un modèle puissant tournant nativement sur ses puces représenterait un argument de poids pour Apple Intelligence, tout en renforçant sa promesse historique de confidentialité. Le crédit accordé à cette rumeur tient largement à la réputation de Khosla, investisseur précoce et influent dans OpenAI, dont le flair pour repérer les technologies d'IA de rupture reste une référence dans la Silicon Valley. Apple, de son côté, a multiplié ces derniers mois les discussions et rachats discrets dans l'IA pour combler son retard, rendant cette piste d'autant plus plausible dans un marché où la compression de modèles devient un enjeu stratégique majeur.

💬 La vraie nouvelle, c'est pas la compression en soi, c'est que 27 milliards de paramètres qui tiennent dans 4 Go sur un iPhone, ça veut dire qu'Apple pourrait faire tourner un LLM quasi frontier sans jamais toucher le cloud. Bon, sur le papier ça règle direct le problème de confidentialité qui plombe Apple Intelligence depuis le début. Reste que Khosla a un flair qui ne s'est pas trompé sur OpenAI, alors quand son fonds mise sur une boîte de quantification, ça mérite d'être suivi de près, rachat ou pas au bout du compte.

LLMsOutil

1 source

3The Information AI

Google constitue une équipe spécialisée pour améliorer ses modèles de code

Google a constitué une équipe spéciale de chercheurs et ingénieurs au sein de DeepMind, dédiée à l'amélioration de ses modèles d'IA pour la génération de code. Cette initiative, révélée par trois sources internes, vise à automatiser davantage le développement logiciel en interne, et à terme, à accélérer la recherche en intelligence artificielle elle-même. L'opération a été lancée en réponse directe aux récentes sorties de modèles d'Anthropic, selon deux des personnes interrogées. L'enjeu est considérable : les chercheurs de Google DeepMind estiment que les outils de codage d'Anthropic surpassent actuellement les capacités de Gemini dans ce domaine. Pour une entreprise dont l'infrastructure logicielle est l'une des plus complexes au monde, perdre du terrain sur la génération de code représente un désavantage compétitif majeur, aussi bien en productivité interne qu'en attractivité commerciale face aux développeurs. Cette mobilisation s'inscrit dans une course effrénée entre les grands laboratoires d'IA autour du codage autonome. Anthropic a fait de Claude un outil de référence pour les développeurs, notamment via des agents capables de modifier des bases de code entières. Google, malgré ses ressources considérables et ses modèles Gemini, se retrouve en position de rattrapage sur ce créneau stratégique. La capacité à automatiser sa propre recherche en IA constitue potentiellement un avantage décisif dans la compétition à long terme.

UELes développeurs et entreprises européens utilisant des outils de génération de code IA pourraient bénéficier à terme d'une amélioration des capacités de Gemini dans ce domaine concurrentiel.

LLMsActu

1 source

4The Information AI

Startup soutenu par Khosla revendique une avancée avec le plus grand modèle IA jamais déployé sur iPhone

La startup américaine PrismML, soutenue par le fonds Khosla Ventures et sortie du mode furtif au début de l'année, affirme avoir fait tourner sur un iPhone 17 Pro le plus grand modèle d'intelligence artificielle jamais exécuté sur un téléphone mobile. L'entreprise a réussi à compresser Qwen 3.6, un grand modèle de langage open source développé par le géant chinois Alibaba, pour le faire fonctionner directement sur l'appareil. Ce modèle compte 27 milliards de paramètres, ces variables qui s'apparentent aux synapses du cerveau et qui déterminent la capacité d'un système à traiter des données complexes. À titre de comparaison, la plupart des modèles conçus pour les smartphones ne mobilisent que quelques milliards de paramètres actifs simultanément. Cette prouesse technique s'inscrit dans une tendance de fond de l'industrie : faire tourner des modèles d'IA puissants directement sur l'appareil plutôt que dans le cloud. L'intérêt est double. D'un côté, cela réduit fortement les coûts de calcul liés aux serveurs distants, qui pèsent lourd sur les marges des entreprises d'IA. De l'autre, cela renforce la confidentialité des utilisateurs, puisque les données n'ont plus besoin de transiter vers des serveurs externes pour être traitées. Apple elle-même poursuit activement cet objectif de réduction des modèles pour ses iPhones, cherchant à limiter sa dépendance aux infrastructures cloud tout en respectant ses engagements en matière de vie privée. La percée de PrismML, encore une jeune pousse peu connue, illustre la compétition croissante entre grands groupes et startups pour dominer ce segment stratégique de l'IA embarquée, où Alibaba, via son modèle Qwen, s'impose déjà comme un acteur open source incontournable.

LLMsActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic