Aller au contenu principal
Apple tente d'intégrer le grand modèle Gemini dans l'iPhone pour améliorer Siri
LLMsArs Technica AI23h

Apple tente d'intégrer le grand modèle Gemini dans l'iPhone pour améliorer Siri

Résumé IASource uniqueImpact UE
Source originale ↗·

Apple travaille à intégrer le modèle d'intelligence artificielle Gemini de Google directement dans l'iPhone pour transformer Siri en profondeur, selon un rapport de The Information publié à l'approche de la Worldwide Developers Conference (WWDC) prévue début juin 2026. Promis une première fois en 2024, le nouveau Siri dopé à l'IA générative a été repoussé à plusieurs reprises. La version finale s'appuiera sur un fonctionnement hybride : une partie du traitement se fera sur l'appareil, mais la majorité des opérations complexes sera déléguée aux serveurs cloud de Google et de Nvidia.

Ce virage représente un recul significatif par rapport à la position historique d'Apple sur la confidentialité. La marque à la pomme a longtemps mis en avant le traitement local des données comme garantie de vie privée, en opposant son approche à celle des concurrents qui centralisent tout dans le cloud. Confier l'essentiel du traitement IA à Google soulève des questions concrètes pour les utilisateurs soucieux de leurs données personnelles : chaque requête adressée à Siri pourrait transiter par des infrastructures tierces. Pour l'industrie, cela confirme que même Apple, avec ses puces Neural Engine réputées optimisées pour l'IA, ne peut pas faire tourner des modèles de grande taille uniquement en local.

Le problème technique est fondamental : les smartphones actuels manquent de RAM pour charger des modèles d'IA massifs en mémoire, et les NPUs (unités de traitement neuronal) restent moins performants que les GPU pour inférer de gros modèles, contrairement à ce que les discours marketing laissent entendre. Apple se retrouve dans une position délicate, coincée entre son positionnement premium sur la vie privée et la course aux capacités IA imposée par ses concurrents. Le partenariat avec Google, déjà actif pour le moteur de recherche sur Safari, s'étend ainsi au coeur de l'assistant vocal, renforçant une dépendance que la firme de Cupertino cherchait pourtant à réduire.

Impact France/UE

Les utilisateurs européens d'iPhone pourraient voir leurs requêtes Siri transiter par les serveurs de Google, soulevant des questions de conformité RGPD et de protection des données personnelles sous le droit européen.

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

Apple peut « distiller » le grand modèle Gemini de Google
1The Information AI 

Apple peut « distiller » le grand modèle Gemini de Google

Apple et Google ont conclu un accord de partenariat IA bien plus profond qu'il n'y paraissait. Au-delà du simple ajustement (fine-tuning) du modèle Gemini, Apple dispose d'un accès complet au modèle dans ses propres infrastructures de data centers. Cet accès permet à Apple de produire des modèles plus petits, optimisés pour des tâches spécifiques ou suffisamment légers pour tourner directement sur les appareils Apple — une technique appelée « distillation ». Cela change considérablement la donne pour Siri et les fonctionnalités IA promises depuis longtemps. En exécutant des modèles distillés localement, Apple gagne en vitesse de traitement et en confidentialité, deux avantages cruciaux pour sa clientèle. La dépendance aux serveurs distants diminue, ce qui réduit aussi les coûts d'infrastructure — un enjeu d'autant plus pressant que les capacités serveur sont actuellement en tension dans tout le secteur. En parallèle, OpenAI traverse sa propre restructuration : son PDG Sam Altman vient de réorganiser l'entreprise, lancé un nouveau modèle baptisé « Spud » et mis fin à l'application vidéo Sora — jugée trop gourmande en serveurs dans le cadre d'une stratégie de recentrage sur les produits prioritaires.

LLMsOpinion
1 source
Google constitue une équipe spécialisée pour améliorer ses modèles de code
2The Information AI 

Google constitue une équipe spécialisée pour améliorer ses modèles de code

Google a constitué une équipe spéciale de chercheurs et ingénieurs au sein de DeepMind, dédiée à l'amélioration de ses modèles d'IA pour la génération de code. Cette initiative, révélée par trois sources internes, vise à automatiser davantage le développement logiciel en interne, et à terme, à accélérer la recherche en intelligence artificielle elle-même. L'opération a été lancée en réponse directe aux récentes sorties de modèles d'Anthropic, selon deux des personnes interrogées. L'enjeu est considérable : les chercheurs de Google DeepMind estiment que les outils de codage d'Anthropic surpassent actuellement les capacités de Gemini dans ce domaine. Pour une entreprise dont l'infrastructure logicielle est l'une des plus complexes au monde, perdre du terrain sur la génération de code représente un désavantage compétitif majeur, aussi bien en productivité interne qu'en attractivité commerciale face aux développeurs. Cette mobilisation s'inscrit dans une course effrénée entre les grands laboratoires d'IA autour du codage autonome. Anthropic a fait de Claude un outil de référence pour les développeurs, notamment via des agents capables de modifier des bases de code entières. Google, malgré ses ressources considérables et ses modèles Gemini, se retrouve en position de rattrapage sur ce créneau stratégique. La capacité à automatiser sa propre recherche en IA constitue potentiellement un avantage décisif dans la compétition à long terme.

UELes développeurs et entreprises européens utilisant des outils de génération de code IA pourraient bénéficier à terme d'une amélioration des capacités de Gemini dans ce domaine concurrentiel.

LLMsActu
1 source
Tencent dévoile son premier grand modèle IA, dirigé par un ancien chercheur d'OpenAI
3SCMP Tech 

Tencent dévoile son premier grand modèle IA, dirigé par un ancien chercheur d'OpenAI

Tencent Holdings a dévoilé jeudi son nouveau modèle d'intelligence artificielle phare, baptisé HY3-Preview, marquant une étape importante dans la stratégie IA du groupe de Shenzhen. C'est le premier grand modèle lancé depuis que Yao Shunyu, ancien chercheur chez OpenAI, a rejoint l'entreprise pour diriger ses efforts en IA fondamentale. Fermé et non accessible au public en open source, HY3-Preview se distingue par une architecture relativement compacte de 295 milliards de paramètres, une taille modeste pour un modèle de cette ambition. Tencent positionne HY3-Preview comme son modèle le plus puissant à ce jour, comparable aux meilleures solutions chinoises disponibles, mais encore en retrait face aux leaders américains comme OpenAI et Google DeepMind. L'arrivée de Yao Shunyu, figure reconnue de la recherche en IA, signale la volonté du groupe de monter en gamme sur les fondations mêmes de ses systèmes, au-delà de ses applications existantes comme Weixin ou Tencent Cloud. Ce lancement s'inscrit dans une intense course technologique entre les géants technologiques chinois, qui cherchent à réduire l'écart avec les États-Unis dans un contexte de restrictions à l'export de puces Nvidia. Alibaba, Baidu, et ByteDance ont chacun intensifié leurs investissements en modèles fondationnels ces derniers mois. Que Tencent, longtemps perçu comme plus discret sur ce terrain, franchisse ce cap avec un recrutement aussi symbolique qu'un ex-OpenAI, témoigne d'une accélération générale de la compétition IA en Asie.

LLMsActu
1 source
Google I/O : nouveaux modèles, agent cloud permanent et refonte de l'application Gemini
4The Decoder 

Google I/O : nouveaux modèles, agent cloud permanent et refonte de l'application Gemini

Lors de sa conférence développeurs Google I/O, tenue cette semaine, Google a dévoilé plusieurs annonces majeures dans le domaine de l'intelligence artificielle. Au programme : un nouveau modèle de langage baptisé Gemini 3.5 Flash, conçu pour allier rapidité et efficacité, un modèle multimodal nommé Gemini Omni capable de traiter simultanément texte, images, audio et vidéo, ainsi qu'un agent personnel cloud appelé Gemini Spark, pensé pour fonctionner en continu, vingt-quatre heures sur vingt-quatre. L'application Gemini bénéficie par ailleurs d'une refonte visuelle et fonctionnelle complète. L'introduction de Gemini Spark marque un tournant dans la vision de Google pour l'IA personnelle. Contrairement aux assistants classiques qui se contentent de répondre à des requêtes ponctuelles, un agent cloud permanent peut exécuter des tâches de façon autonome, anticiper des besoins, surveiller des données ou déclencher des actions sans intervention humaine. Pour les développeurs comme pour les utilisateurs grand public, cela ouvre la voie à une nouvelle catégorie d'assistants proactifs, toujours disponibles et potentiellement connectés à l'ensemble des services Google. Ces annonces s'inscrivent dans une course effrénée à l'IA agentique que se livrent Google, OpenAI et Microsoft depuis début 2025. Google cherche à reprendre l'initiative après avoir été perçu comme en retrait face aux avancées de GPT-4o et des agents d'OpenAI. Avec cette vague de lancements, l'entreprise signale sa volonté de positionner Gemini non plus comme un simple chatbot, mais comme une infrastructure d'IA omniprésente, ancrée dans le cloud et intégrée à l'ensemble de son écosystème.

UELes nouveaux modèles Gemini et l'agent cloud permanent seront accessibles aux développeurs et entreprises européens, accélérant l'adoption de l'IA agentique dans l'écosystème Google en Europe.

LLMsActu
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour