Aller au contenu principal
Apple présente la troisième génération de ses modèles de fondation
LLMsApple Machine Learning1j

Apple présente la troisième génération de ses modèles de fondation

Résumé IASource uniqueImpact UE
Source originale ↗·

Apple a dévoilé la troisième génération de ses Apple Foundation Models (AFM), une famille de cinq modèles d'intelligence artificielle développés en collaboration avec Google. Ces modèles, présentés comme le coeur de la prochaine version d'Apple Intelligence, couvrent un spectre allant des modèles fonctionnant directement sur l'appareil jusqu'aux modèles hébergés sur des serveurs via l'infrastructure Private Cloud Compute. Ils alimenteront notamment une refonte complète de Siri ainsi qu'une série d'outils intelligents intégrés aux systèmes d'exploitation Apple.

Ce partenariat avec Google marque un tournant stratégique pour Apple, qui avait jusqu'ici développé ses modèles en interne. L'enjeu est considérable : Apple doit rattraper son retard sur des concurrents comme OpenAI, Google et Microsoft dans la course aux assistants IA natifs. En distribuant le traitement entre l'appareil local et le cloud sécurisé, Apple cherche à offrir des capacités IA avancées sans sacrifier la confidentialité des données, un argument différenciateur central face à des services cloud classiques.

Cette annonce s'inscrit dans la stratégie Apple Intelligence lancée en 2024, dont le déploiement progressif avait suscité des critiques sur la lenteur des livraisons. La collaboration avec Google est particulièrement significative : les deux entreprises, habituellement rivales sur les moteurs de recherche et les systèmes mobiles, s'associent ici sur la couche infrastructure IA. La famille de cinq modèles suggère une segmentation fine des cas d'usage, de la compréhension vocale embarquée aux tâches complexes nécessitant de la puissance serveur.

Impact France/UE

L'architecture vie-privée-first d'Apple (traitement local via Private Cloud Compute) s'aligne avec les exigences du RGPD, ce qui pourrait faciliter l'adoption d'Apple Intelligence par les entreprises et institutions européennes soucieuses de la souveraineté des données.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

SenseTime lance SenseNova U1, vers une ère de modèles unifiés pour la compréhension et la génération
1Pandaily 

SenseTime lance SenseNova U1, vers une ère de modèles unifiés pour la compréhension et la génération

SenseTime a officiellement lancé et mis en open source le 29 avril 2026 sa série SenseNova U1, un modèle unifié natif combinant compréhension et génération multimodale. Développé sur l'architecture maison NEO-unify présentée en mars 2026, ce modèle intègre dans un cadre unique la compréhension, le raisonnement et la génération visuelle et textuelle. La série se décline en deux variantes légères : SenseNova-U1-8B-MoT, basé sur une architecture dense, et SenseNova-U1-A3B-MoT, reposant sur un mélange d'experts (MoE). Ce qui distingue fondamentalement SenseNova U1 des approches dominantes, c'est l'abandon des encodeurs visuels séparés (VE) et des autoencodeurs variationnels (VAE) traditionnellement empilés dans les modèles multimodaux. NEO-unify reconstruit à la place un espace de représentation unifié profondément intégré à chaque couche de calcul, traitant le langage et les entrées visuelles comme un ensemble composite cohérent. Ce choix architectural permet d'améliorer simultanément les capacités de compréhension et de génération, en préservant à la fois la richesse sémantique et la fidélité visuelle au niveau pixel. Le modèle affiche également de bonnes performances en raisonnement logique et en intelligence spatiale, notamment pour interpréter des environnements physiques complexes. SenseTime, géant chinois de la vision par ordinateur et de l'intelligence artificielle, positionne SenseNova U1 comme une brique fondatrice pour la robotique incarnée : l'objectif est qu'un seul modèle gère en boucle fermée la perception, le raisonnement et l'exécution de tâches physiques. Ce lancement s'inscrit dans une course mondiale à l'unification des modalités, où des acteurs comme Google DeepMind, Meta ou des startups chinoises cherchent à dépasser les architectures hybrides au profit de modèles natifs plus cohérents. La mise en open source de la version légère signal une stratégie d'adoption communautaire, tout en réservant probablement les versions plus puissantes à un usage commercial ou propriétaire.

UELa mise en open source de SenseNova U1 offre aux chercheurs et développeurs européens un accès à cette architecture unifiée novatrice, mais l'impact direct sur la France ou l'UE reste limité à court terme, SenseTime étant un acteur chinois sans ancrage réglementaire ou commercial européen significatif.

LLMsOpinion
1 source
Google I/O : nouveaux modèles, agent cloud permanent et refonte de l'application Gemini
2The Decoder 

Google I/O : nouveaux modèles, agent cloud permanent et refonte de l'application Gemini

Lors de sa conférence développeurs Google I/O, tenue cette semaine, Google a dévoilé plusieurs annonces majeures dans le domaine de l'intelligence artificielle. Au programme : un nouveau modèle de langage baptisé Gemini 3.5 Flash, conçu pour allier rapidité et efficacité, un modèle multimodal nommé Gemini Omni capable de traiter simultanément texte, images, audio et vidéo, ainsi qu'un agent personnel cloud appelé Gemini Spark, pensé pour fonctionner en continu, vingt-quatre heures sur vingt-quatre. L'application Gemini bénéficie par ailleurs d'une refonte visuelle et fonctionnelle complète. L'introduction de Gemini Spark marque un tournant dans la vision de Google pour l'IA personnelle. Contrairement aux assistants classiques qui se contentent de répondre à des requêtes ponctuelles, un agent cloud permanent peut exécuter des tâches de façon autonome, anticiper des besoins, surveiller des données ou déclencher des actions sans intervention humaine. Pour les développeurs comme pour les utilisateurs grand public, cela ouvre la voie à une nouvelle catégorie d'assistants proactifs, toujours disponibles et potentiellement connectés à l'ensemble des services Google. Ces annonces s'inscrivent dans une course effrénée à l'IA agentique que se livrent Google, OpenAI et Microsoft depuis début 2025. Google cherche à reprendre l'initiative après avoir été perçu comme en retrait face aux avancées de GPT-4o et des agents d'OpenAI. Avec cette vague de lancements, l'entreprise signale sa volonté de positionner Gemini non plus comme un simple chatbot, mais comme une infrastructure d'IA omniprésente, ancrée dans le cloud et intégrée à l'ensemble de son écosystème.

UELes nouveaux modèles Gemini et l'agent cloud permanent seront accessibles aux développeurs et entreprises européens, accélérant l'adoption de l'IA agentique dans l'écosystème Google en Europe.

LLMsActu
1 source
Mistral publie un nouveau modèle open source pour la génération vocale
3TechCrunch AI 

Mistral publie un nouveau modèle open source pour la génération vocale

Mistral AI a publié un nouveau modèle open source dédié à la génération vocale, conçu pour fonctionner directement sur des appareils à faibles ressources comme des smartphones ou des montres connectées. Cette annonce marque une étape notable pour la startup française, qui continue d'élargir son portefeuille au-delà des modèles de texte vers des modalités multimédia plus complexes. L'enjeu principal est la démocratisation de la synthèse vocale de qualité sans dépendance au cloud. En permettant une exécution entièrement locale sur des terminaux embarqués, Mistral ouvre la voie à des applications vocales respectueuses de la vie privée, sans latence réseau et utilisables hors connexion — un différenciateur fort face aux solutions propriétaires de Google, Apple ou Microsoft qui centralisent le traitement. Mistral s'impose depuis 2023 comme l'acteur européen le plus actif dans la course aux modèles open source performants. Après Mistral 7B, Mixtral et plusieurs modèles spécialisés, cette incursion dans la génération audio suit la tendance générale du secteur vers des modèles multimodaux compacts. La capacité à tourner sur une montre connectée suggère une optimisation agressive via des techniques de quantification ou de distillation, un terrain où les ingénieurs de Mistral ont démontré leur expertise. --- Note : l'article source ne fournit que le titre et la ligne d'accroche — certains détails spécifiques (nom du modèle, benchmarks, date de sortie exacte) ne figuraient pas dans le texte transmis.

UEMistral AI, startup française de référence, lance un modèle de synthèse vocale open source exécutable en local sur appareils embarqués, renforçant la souveraineté technologique européenne face aux solutions cloud américaines.

LLMsActu
1 source
Apple tente d'intégrer le grand modèle Gemini dans l'iPhone pour améliorer Siri
4Ars Technica AI 

Apple tente d'intégrer le grand modèle Gemini dans l'iPhone pour améliorer Siri

Apple travaille à intégrer le modèle d'intelligence artificielle Gemini de Google directement dans l'iPhone pour transformer Siri en profondeur, selon un rapport de The Information publié à l'approche de la Worldwide Developers Conference (WWDC) prévue début juin 2026. Promis une première fois en 2024, le nouveau Siri dopé à l'IA générative a été repoussé à plusieurs reprises. La version finale s'appuiera sur un fonctionnement hybride : une partie du traitement se fera sur l'appareil, mais la majorité des opérations complexes sera déléguée aux serveurs cloud de Google et de Nvidia. Ce virage représente un recul significatif par rapport à la position historique d'Apple sur la confidentialité. La marque à la pomme a longtemps mis en avant le traitement local des données comme garantie de vie privée, en opposant son approche à celle des concurrents qui centralisent tout dans le cloud. Confier l'essentiel du traitement IA à Google soulève des questions concrètes pour les utilisateurs soucieux de leurs données personnelles : chaque requête adressée à Siri pourrait transiter par des infrastructures tierces. Pour l'industrie, cela confirme que même Apple, avec ses puces Neural Engine réputées optimisées pour l'IA, ne peut pas faire tourner des modèles de grande taille uniquement en local. Le problème technique est fondamental : les smartphones actuels manquent de RAM pour charger des modèles d'IA massifs en mémoire, et les NPUs (unités de traitement neuronal) restent moins performants que les GPU pour inférer de gros modèles, contrairement à ce que les discours marketing laissent entendre. Apple se retrouve dans une position délicate, coincée entre son positionnement premium sur la vie privée et la course aux capacités IA imposée par ses concurrents. Le partenariat avec Google, déjà actif pour le moteur de recherche sur Safari, s'étend ainsi au coeur de l'assistant vocal, renforçant une dépendance que la firme de Cupertino cherchait pourtant à réduire.

UELes utilisateurs européens d'iPhone pourraient voir leurs requêtes Siri transiter par les serveurs de Google, soulevant des questions de conformité RGPD et de protection des données personnelles sous le droit européen.

LLMsOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour