InfrastructureLe Big Data1h

ChatGPT Phone : tout ce qu’on sait du smartphone IA agentique qui veut tuer l’iPhone

1 source couvre ce sujet·Source originale ↗·

OpenAI prépare son propre smartphone, baptisé en interne « Agentic Phone » ou « ChatGPT Phone », pour un lancement commercial prévu à l'horizon 2028. Le projet est orchestré par Sam Altman et le designer britannique Jony Ive, ancien directeur du design chez Apple et père de l'iPhone, qui travaille désormais pour OpenAI via son studio LoveFrom. Les premiers prototypes circulent déjà en interne depuis 2026. Financé en partie par SoftBank, l'appareil repose sur des puces NPU sur mesure développées en partenariat avec Qualcomm et MediaTek, conçues pour exécuter des modèles d'IA directement sur l'appareil, sans dépendre du cloud, garantissant rapidité et confidentialité.

Ce qui distingue fondamentalement ce projet des smartphones existants, c'est le concept d'IA « agentique » : l'appareil ne se contente pas de répondre à des requêtes, il agit à la place de l'utilisateur. Fini l'enchaînement d'applications séparées pour réserver un taxi, envoyer un message et bloquer un créneau dans son agenda. L'utilisateur formule une instruction globale, et l'IA exécute l'ensemble des micro-tâches via les API concernées, sans interaction avec un écran. Ce modèle dits « Zéro UI » rend structurellement obsolète le paradigme de l'App Store, sur lequel reposent les revenus d'Apple, qui génère des dizaines de milliards de dollars annuels via ses commissions. Pour les développeurs, les utilisateurs et les plateformes, le changement de modèle serait radical : l'interface disparaît au profit d'une couche d'abstraction pilotée par l'IA.

Ce projet s'inscrit dans une course plus large à la reconfiguration de l'informatique personnelle. Depuis l'émergence des grands modèles de langage comme GPT-4 puis GPT-5, plusieurs acteurs cherchent à transposer leur puissance dans le hardware du quotidien. Le Humane Pin et le Rabbit R1 ont tenté l'exercice avant OpenAI, avec des résultats décevants, faute de modèles suffisamment capables. OpenAI parie que ses prochaines générations de modèles, GPT-5.5 et au-delà, atteindront le niveau d'autonomie nécessaire pour que l'expérience soit réellement fluide. Apple, de son côté, reste contraint par la logique de l'App Store et de ses partenariats développeurs, ce qui ralentit sa capacité à adopter une interface agentique complète. Si OpenAI réussit à combiner un hardware performant, une IA locale robuste et une expérience sans friction, le rapport de force dans l'industrie mobile pourrait changer pour la première fois depuis 2007.

Impact France/UE

Si ce smartphone agentique atteint le marché européen d'ici 2028, il pourrait fragiliser le modèle économique des développeurs d'applications européens dépendant des app stores, et soulève des questions réglementaires au regard de l'AI Act sur les systèmes IA autonomes à haute autonomie d'action.

Dans nos dossiers

OpenAI GPT-5.5 Agents IA Sam Altman

À lire aussi

1Le Big Data

World ID : la startup qui veut donner une identité humaine à chaque agent IA

La startup World, cofondée par Sam Altman et connue pour avoir lancé la cryptomonnaie WorldCoin en 2023, a dévoilé une version bêta d'Agent Kit, un système conçu pour relier les agents IA à des identités humaines vérifiées. Le principe repose sur World ID, une identité numérique unique stockée sur smartphone et validée via un scan de l'iris effectué par des sphères physiques déployées dans le monde entier. À ce jour, environ 18 millions de personnes auraient complété ce processus à travers près de 1 000 orbes répartis sur plusieurs continents, avec environ 18 000 nouveaux inscrits récemment. Techniquement, Agent Kit s'appuie sur le protocole x402, développé en collaboration avec Cloudflare et Coinbase, et qui permet de vérifier les requêtes d'agents IA via des micropaiements ou des jetons d'identité avant d'accorder l'accès à un service. L'enjeu est considérable : l'explosion des agents IA autonomes permet désormais à n'importe qui de déployer des milliers de bots en parallèle en quelques clics, saturant les systèmes en ligne dans des scénarios proches des attaques Sybil. World propose une réponse concrète — plutôt que de bloquer tous les bots indistinctement, les sites web pourraient exiger un jeton World ID pour filtrer les accès et s'assurer qu'un agent représente bien une personne réelle et unique. Un agent pourrait ainsi réserver un restaurant, acheter des billets de spectacle ou accéder à des offres d'essai gratuit, à condition de prouver qu'il agit pour un humain identifié. Forums, sondages et plateformes sociales pourraient également s'appuyer sur ce mécanisme pour lutter contre la manipulation automatisée et les campagnes de spam à grande échelle. Le système soulève néanmoins des questions sérieuses. La collecte biométrique reste son talon d'Achille : un scan d'iris est irréversible, et contrairement à un mot de passe, il ne peut pas être réinitialisé en cas de fuite ou de piratage. World affirme que les données sont chiffrées et stockées localement sur l'appareil, mais la promesse ne suffit pas à dissiper les inquiétudes sur la vie privée, d'autant que le projet a déjà essuyé des critiques réglementaires dans plusieurs pays dès le lancement de WorldCoin. Sur le plan de l'adoption, le défi reste entier : convaincre des centaines de millions d'utilisateurs de scanner leur iris en l'absence d'une application grand public vraiment incontournable constitue un obstacle majeur. Enfin, le protocole x402 peut ralentir les attaques massives en les rendant coûteuses, mais un acteur malveillant bien financé peut tout à fait payer pour les contourner — ce qui signifie que World ID ne résout pas le problème à lui seul, mais en augmente seulement le prix d'entrée.

UELe RGPD encadre strictement la collecte de données biométriques et plusieurs pays européens ont déjà suspendu WorldCoin — l'expansion d'Agent Kit en Europe se heurtera aux mêmes obstacles réglementaires.

InfrastructureOpinion

1 source

2ZDNET FR

Arm entre dans l'arène du silicium : le CPU AGI prêt à propulser l'IA agentique, mais au milieu d'une forte concurrence

Arm, le concepteur britannique de puces dont l'architecture équipe la quasi-totalité des smartphones mondiaux, a annoncé le lancement de son propre processeur destiné aux data centers : l'Arm AGI CPU. Contrairement à son modèle historique de simple vente de licences d'architecture, Arm entre cette fois directement sur le marché du silicium, ciblant spécifiquement les charges de travail liées à l'IA agentique — ces systèmes autonomes capables d'enchaîner des tâches complexes sans intervention humaine. Cette annonce marque un tournant stratégique majeur pour l'industrie. L'IA agentique exige des processeurs capables de gérer des flux de raisonnement continus et intensifs, un segment jusqu'ici dominé par les GPU de Nvidia et les puces custom de Google (TPU) ou Amazon (Trainium). En proposant un CPU optimisé pour ces usages, Arm s'attaque à un marché en croissance explosive, tout en challengeant ses propres clients comme Qualcomm et Apple qui s'appuient sur ses licences. Le mouvement s'inscrit dans un contexte de consolidation verticale accélérée : Meta, Microsoft et Amazon développent leurs propres puces, tandis que SoftBank — propriétaire d'Arm depuis 2016 et reintroduit en bourse en 2023 — pousse à une montée en valeur ajoutée. La concurrence sera néanmoins rude face à des acteurs comme AMD, Intel et surtout Nvidia, dont l'emprise sur l'infrastructure IA reste considérable. Les prochains mois révéleront si Arm peut transformer son omniprésence architecturale en avantage commercial direct sur ce segment stratégique.

UEArm étant une entreprise britannique stratégique soutenue par SoftBank, son entrée sur le marché des processeurs pour data centers pourrait renforcer l'écosystème européen des semi-conducteurs et influencer les choix d'infrastructure IA des acteurs cloud opérant en Europe.

InfrastructureOpinion

1 source

3NVIDIA AI Blog

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents

NVIDIA et Google Cloud ont annoncé cette semaine, lors de la conférence Google Cloud Next à Las Vegas, une nouvelle étape majeure dans leur partenariat vieux de plus de dix ans. Au cœur de l'annonce : le lancement des instances bare-metal A5X, alimentées par les systèmes rack NVIDIA Vera Rubin NVL72, qui promettent un coût d'inférence jusqu'à dix fois inférieur et un débit de tokens dix fois plus élevé par mégawatt par rapport à la génération précédente. Ces infrastructures s'appuient sur les interconnexions NVIDIA ConnectX-9 SuperNICs couplées au réseau Google Virgo de nouvelle génération, permettant de déployer des clusters allant jusqu'à 80 000 GPU Rubin sur un site unique, et jusqu'à 960 000 GPU dans une configuration multisite. Par ailleurs, Google Cloud met en préversion les modèles Gemini sur Google Distributed Cloud avec les GPU NVIDIA Blackwell et Blackwell Ultra, ainsi que des machines virtuelles confidentielles garantissant le chiffrement des données en cours d'utilisation. Des acteurs comme OpenAI et Thinking Machines Lab utilisent déjà ces infrastructures pour des charges d'inférence massives, notamment pour faire tourner ChatGPT. Ces annonces représentent un saut qualitatif significatif pour les entreprises qui cherchent à industrialiser l'IA agentique et l'IA physique, c'est-à-dire les systèmes capables d'agir de manière autonome dans des environnements réels, comme les robots ou les jumeaux numériques en usine. La réduction drastique des coûts d'inférence change concrètement l'équation économique pour les développeurs d'applications IA à grande échelle. La possibilité de déployer les modèles Gemini en environnement souverain, sur des données sensibles restant chiffrées y compris pendant leur traitement, répond à une exigence croissante des entreprises et des gouvernements en matière de conformité et de confidentialité. L'intégration de modèles ouverts NVIDIA Nemotron dans la plateforme Gemini Enterprise Agent Platform élargit également les options des équipes techniques qui souhaitent combiner modèles propriétaires et open source. Ce partenariat s'inscrit dans une compétition intense entre les grands fournisseurs de cloud pour capter les budgets d'infrastructure IA, qui se chiffrent désormais en dizaines de milliards de dollars annuellement. Google Cloud cherche à rattraper son retard sur AWS et Microsoft Azure, qui ont pris de l'avance sur l'hébergement des charges d'entraînement et d'inférence des grands modèles de langage. En s'associant étroitement à NVIDIA, dont les GPU dominent encore largement le marché de l'accélération IA, Google se positionne comme une plateforme de référence pour la prochaine vague, celle des agents autonomes et de la robotique industrielle. La feuille de route annoncée, avec la transition de Blackwell vers Vera Rubin, suggère que la cadence d'innovation s'accélère et que les entreprises devront adapter leur infrastructure régulièrement pour rester compétitives.

UELe déploiement souverain de Gemini sur Google Distributed Cloud avec chiffrement des données en cours d'utilisation répond aux exigences RGPD des entreprises européennes traitant des données sensibles.

InfrastructureOpinion

1 source

4Pandaily

Anker présente son propre chip "Thus" pour déployer l'IA embarquée sur toute sa gamme

Anker a officiellement présenté son propre processeur baptisé "Thus", conçu en interne pour intégrer des capacités d'intelligence artificielle directement dans ses produits, sans recours au cloud. La société le décrit comme le premier chip audio IA du monde basé sur l'informatique en mémoire pour les réseaux de neurones. Le coup d'envoi aura lieu lors de l'événement "Anker Day" le 21 mai prochain, où seront dévoilés les premiers écouteurs équipés de cette puce, vraisemblablement les Soundcore Liberty 5 Pro Max à 229,99 dollars et les Liberty 5 Pro à 169,99 dollars, selon des informations relayées par The Verge le 22 avril. Ces deux modèles embarqueront huit microphones MEMS et deux capteurs de conduction osseuse pour isoler précisément la voix de l'utilisateur. L'enjeu technique est considérable. Les architectures classiques séparent stockage et calcul, ce qui impose des transferts de données constants lors de l'inférence, consommant énergie et espace. Thus effectue les calculs directement là où réside le modèle, supprimant ces allers-retours et réduisant drastiquement la consommation. Résultat : là où les écouteurs traditionnels ne peuvent faire tourner que des réseaux de quelques centaines de milliers de paramètres, faute de batterie et d'espace, Thus permet d'en exécuter comptant plusieurs millions. En pratique, cela se traduit par une réduction de bruit en appel nettement plus robuste dans les environnements très bruités, sans écraser la voix de l'interlocuteur, un compromis que les solutions actuelles peinent à tenir. Anker, surtout connu pour ses chargeurs et batteries, opère ici un virage stratégique majeur. En développant son propre silicium, la marque suit la trajectoire d'Apple avec ses puces M et A, ou de Google avec ses Tensor : maîtriser la chaîne complète du matériel au logiciel pour différencier ses produits. Le choix des écouteurs comme terrain d'expérimentation n'est pas anodin : c'est précisément là que les contraintes matérielles sont les plus sévères, ce qui en fait un banc d'essai idéal avant un déploiement plus large dans les accessoires mobiles et les objets connectés de la gamme Soundcore et au-delà. Si le chip tient ses promesses à la commercialisation, Anker pourrait bousculer un segment audio premium dominé par Sony et Bose, tout en ouvrant la voie à une IA embarquée dans l'ensemble de son écosystème de produits.

UELes écouteurs Soundcore équipés du chip Thus seront disponibles à la vente en Europe dès leur commercialisation, sans impact réglementaire ou industriel direct pour la France ou l'UE.

InfrastructureOpinion

1 source