Aller au contenu principal
ChatGPT Phone : tout ce qu’on sait du smartphone IA agentique qui veut tuer l’iPhone
InfrastructureLe Big Data6sem· 2 min de lecture

ChatGPT Phone : tout ce qu’on sait du smartphone IA agentique qui veut tuer l’iPhone

Source originale ↗·

OpenAI prépare son propre smartphone, baptisé en interne « Agentic Phone » ou « ChatGPT Phone », pour un lancement commercial prévu à l'horizon 2028. Le projet est orchestré par Sam Altman et le designer britannique Jony Ive, ancien directeur du design chez Apple et père de l'iPhone, qui travaille désormais pour OpenAI via son studio LoveFrom. Les premiers prototypes circulent déjà en interne depuis 2026. Financé en partie par SoftBank, l'appareil repose sur des puces NPU sur mesure développées en partenariat avec Qualcomm et MediaTek, conçues pour exécuter des modèles d'IA directement sur l'appareil, sans dépendre du cloud, garantissant rapidité et confidentialité.

Ce qui distingue fondamentalement ce projet des smartphones existants, c'est le concept d'IA « agentique » : l'appareil ne se contente pas de répondre à des requêtes, il agit à la place de l'utilisateur. Fini l'enchaînement d'applications séparées pour réserver un taxi, envoyer un message et bloquer un créneau dans son agenda. L'utilisateur formule une instruction globale, et l'IA exécute l'ensemble des micro-tâches via les API concernées, sans interaction avec un écran. Ce modèle dits « Zéro UI » rend structurellement obsolète le paradigme de l'App Store, sur lequel reposent les revenus d'Apple, qui génère des dizaines de milliards de dollars annuels via ses commissions. Pour les développeurs, les utilisateurs et les plateformes, le changement de modèle serait radical : l'interface disparaît au profit d'une couche d'abstraction pilotée par l'IA.

Ce projet s'inscrit dans une course plus large à la reconfiguration de l'informatique personnelle. Depuis l'émergence des grands modèles de langage comme GPT-4 puis GPT-5, plusieurs acteurs cherchent à transposer leur puissance dans le hardware du quotidien. Le Humane Pin et le Rabbit R1 ont tenté l'exercice avant OpenAI, avec des résultats décevants, faute de modèles suffisamment capables. OpenAI parie que ses prochaines générations de modèles, GPT-5.5 et au-delà, atteindront le niveau d'autonomie nécessaire pour que l'expérience soit réellement fluide. Apple, de son côté, reste contraint par la logique de l'App Store et de ses partenariats développeurs, ce qui ralentit sa capacité à adopter une interface agentique complète. Si OpenAI réussit à combiner un hardware performant, une IA locale robuste et une expérience sans friction, le rapport de force dans l'industrie mobile pourrait changer pour la première fois depuis 2007.

Impact France/UE

Si ce smartphone agentique atteint le marché européen d'ici 2028, il pourrait fragiliser le modèle économique des développeurs d'applications européens dépendant des app stores, et soulève des questions réglementaires au regard de l'AI Act sur les systèmes IA autonomes à haute autonomie d'action.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

World ID : la startup qui veut donner une identité humaine à chaque agent IA
1Le Big Data 

World ID : la startup qui veut donner une identité humaine à chaque agent IA

La startup World, cofondée par Sam Altman et connue pour avoir lancé la cryptomonnaie WorldCoin en 2023, a dévoilé une version bêta d'Agent Kit, un système conçu pour relier les agents IA à des identités humaines vérifiées. Le principe repose sur World ID, une identité numérique unique stockée sur smartphone et validée via un scan de l'iris effectué par des sphères physiques déployées dans le monde entier. À ce jour, environ 18 millions de personnes auraient complété ce processus à travers près de 1 000 orbes répartis sur plusieurs continents, avec environ 18 000 nouveaux inscrits récemment. Techniquement, Agent Kit s'appuie sur le protocole x402, développé en collaboration avec Cloudflare et Coinbase, et qui permet de vérifier les requêtes d'agents IA via des micropaiements ou des jetons d'identité avant d'accorder l'accès à un service. L'enjeu est considérable : l'explosion des agents IA autonomes permet désormais à n'importe qui de déployer des milliers de bots en parallèle en quelques clics, saturant les systèmes en ligne dans des scénarios proches des attaques Sybil. World propose une réponse concrète — plutôt que de bloquer tous les bots indistinctement, les sites web pourraient exiger un jeton World ID pour filtrer les accès et s'assurer qu'un agent représente bien une personne réelle et unique. Un agent pourrait ainsi réserver un restaurant, acheter des billets de spectacle ou accéder à des offres d'essai gratuit, à condition de prouver qu'il agit pour un humain identifié. Forums, sondages et plateformes sociales pourraient également s'appuyer sur ce mécanisme pour lutter contre la manipulation automatisée et les campagnes de spam à grande échelle. Le système soulève néanmoins des questions sérieuses. La collecte biométrique reste son talon d'Achille : un scan d'iris est irréversible, et contrairement à un mot de passe, il ne peut pas être réinitialisé en cas de fuite ou de piratage. World affirme que les données sont chiffrées et stockées localement sur l'appareil, mais la promesse ne suffit pas à dissiper les inquiétudes sur la vie privée, d'autant que le projet a déjà essuyé des critiques réglementaires dans plusieurs pays dès le lancement de WorldCoin. Sur le plan de l'adoption, le défi reste entier : convaincre des centaines de millions d'utilisateurs de scanner leur iris en l'absence d'une application grand public vraiment incontournable constitue un obstacle majeur. Enfin, le protocole x402 peut ralentir les attaques massives en les rendant coûteuses, mais un acteur malveillant bien financé peut tout à fait payer pour les contourner — ce qui signifie que World ID ne résout pas le problème à lui seul, mais en augmente seulement le prix d'entrée.

UELe RGPD encadre strictement la collecte de données biométriques et plusieurs pays européens ont déjà suspendu WorldCoin — l'expansion d'Agent Kit en Europe se heurtera aux mêmes obstacles réglementaires.

InfrastructureOpinion
1 source
Comment Apple fait tourner une IA géante dans l’iPhone sans saturer la RAM
2Frandroid 

Comment Apple fait tourner une IA géante dans l’iPhone sans saturer la RAM

Apple a publié lors de la WWDC 2026 un billet de recherche détaillant une technique d'ingénierie inédite pour faire tourner son modèle d'IA le plus puissant directement sur iPhone, sans surcharger la mémoire vive. L'approche consiste à stocker les poids du modèle dans la mémoire flash de l'appareil plutôt qu'en RAM, puis à les charger dynamiquement à la demande, par petits blocs, au moment de l'inférence. Cette méthode, baptisée inférence par déchargement flash, permet de faire fonctionner localement un modèle dont la taille dépasse largement la capacité RAM disponible sur un smartphone. L'enjeu est considérable pour Apple, qui a fait de la confidentialité un argument commercial central. Faire tourner l'IA entièrement on-device signifie que les données de l'utilisateur ne quittent jamais l'appareil, contrairement aux architectures cloud ou hybrides. Pour les centaines de millions d'utilisateurs d'iPhone, cela implique des fonctionnalités IA avancées disponibles hors connexion, sans latence réseau, et sans que les requêtes soient transmises à des serveurs tiers. Cette avancée s'inscrit dans une course technologique où Apple, Google et Qualcomm cherchent chacun à maximiser les capacités d'inférence locale sur puces mobiles. Apple avait déjà franchi un cap avec les puces M et A-series, mais la contrainte mémoire restait le goulot d'étranglement principal pour les grands modèles. En résolvant partiellement ce verrou par le logiciel plutôt que par le seul matériel, Apple ouvre la voie à des modèles encore plus ambitieux embarqués dans les prochaines générations d'iPhone.

UELes utilisateurs français d'iPhone bénéficieront de fonctionnalités IA plus avancées en local, renforçant la confidentialité des données personnelles sans recours au cloud.

InfrastructureOpinion
1 source
Arm entre dans l'arène du silicium : le CPU AGI prêt à propulser l'IA agentique, mais au milieu d'une forte concurrence
3ZDNET FR 

Arm entre dans l'arène du silicium : le CPU AGI prêt à propulser l'IA agentique, mais au milieu d'une forte concurrence

Arm, le concepteur britannique de puces dont l'architecture équipe la quasi-totalité des smartphones mondiaux, a annoncé le lancement de son propre processeur destiné aux data centers : l'Arm AGI CPU. Contrairement à son modèle historique de simple vente de licences d'architecture, Arm entre cette fois directement sur le marché du silicium, ciblant spécifiquement les charges de travail liées à l'IA agentique — ces systèmes autonomes capables d'enchaîner des tâches complexes sans intervention humaine. Cette annonce marque un tournant stratégique majeur pour l'industrie. L'IA agentique exige des processeurs capables de gérer des flux de raisonnement continus et intensifs, un segment jusqu'ici dominé par les GPU de Nvidia et les puces custom de Google (TPU) ou Amazon (Trainium). En proposant un CPU optimisé pour ces usages, Arm s'attaque à un marché en croissance explosive, tout en challengeant ses propres clients comme Qualcomm et Apple qui s'appuient sur ses licences. Le mouvement s'inscrit dans un contexte de consolidation verticale accélérée : Meta, Microsoft et Amazon développent leurs propres puces, tandis que SoftBank — propriétaire d'Arm depuis 2016 et reintroduit en bourse en 2023 — pousse à une montée en valeur ajoutée. La concurrence sera néanmoins rude face à des acteurs comme AMD, Intel et surtout Nvidia, dont l'emprise sur l'infrastructure IA reste considérable. Les prochains mois révéleront si Arm peut transformer son omniprésence architecturale en avantage commercial direct sur ce segment stratégique.

UEArm étant une entreprise britannique stratégique soutenue par SoftBank, son entrée sur le marché des processeurs pour data centers pourrait renforcer l'écosystème européen des semi-conducteurs et influencer les choix d'infrastructure IA des acteurs cloud opérant en Europe.

InfrastructureOpinion
1 source
ChatGPT et Claude en panne : que s’est-il réellement passé ?
4Le Big Data 

ChatGPT et Claude en panne : que s’est-il réellement passé ?

Le 20 avril 2026, en début d'après-midi, les deux assistants IA les plus utilisés au monde ont connu des perturbations simultanées. ChatGPT d'OpenAI et Claude d'Anthropic ont affiché des temps de réponse anormalement longs, voire des pannes complètes pour certains utilisateurs. Les premières alertes ont émergé autour de 16h, heure française, avec une hausse nette des signalements sur DownDetector. Les requêtes s'accumulaient sans réponse, les délais s'allongeaient, et les utilisateurs constataient rapidement que le problème ne se limitait pas à un seul service. Copilot de Microsoft et Gemini de Google ont également montré des signes de ralentissement au même moment, avec une latence inhabituelle bien que leurs services soient restés partiellement opérationnels. La panne a touché simultanément plusieurs acteurs majeurs, ce qui a immédiatement orienté les soupçons vers une cause commune en amont des applications elles-mêmes. Le principal suspect est Cloudflare, l'un des fournisseurs d'infrastructure réseau les plus critiques d'Internet. Ce service joue un rôle de relais et de filtre entre les utilisateurs et les serveurs des plateformes : il accélère le trafic, absorbe les attaques DDoS et gère la distribution des requêtes à l'échelle mondiale. Quand Cloudflare rencontre des difficultés, l'effet peut se propager en cascade sur des dizaines de services dépendants. La page de statut officielle de Cloudflare a effectivement signalé ce jour-là des dégradations sur plusieurs composants clés, notamment Analytics, Rules, Workers et Zero Trust. Ces modules sont au coeur du fonctionnement de nombreuses applications web modernes. Aucun lien officiel n'a toutefois été confirmé entre cet incident Cloudflare et les pannes de ChatGPT et Claude, mais la coïncidence temporelle et la nature simultanée des perturbations sur plusieurs plateformes indépendantes renforcent fortement cette hypothèse. Cet incident illustre une vulnérabilité structurelle de l'écosystème IA actuel : la concentration de l'infrastructure critique entre les mains d'un petit nombre de fournisseurs. OpenAI, Anthropic, Microsoft et Google ont beau opérer des produits concurrents, ils partagent souvent les mêmes couches d'infrastructure réseau, de CDN et de sécurité. Une défaillance à ce niveau peut donc paralyser simultanément des services qui semblent pourtant indépendants. À mesure que les outils d'IA s'intègrent dans les workflows professionnels quotidiens, rédaction, développement, analyse, leur indisponibilité, même temporaire, génère un impact économique et opérationnel réel. Cet épisode devrait relancer les discussions sur la résilience des infrastructures IA et la nécessité, pour les grands acteurs, de diversifier leurs dépendances techniques pour éviter qu'un seul point de défaillance ne mette à genoux l'ensemble du secteur.

UELes professionnels français utilisant ChatGPT ou Claude dans leurs workflows quotidiens ont subi une interruption de service, révélant la dépendance structurelle de l'écosystème IA européen envers quelques fournisseurs d'infrastructure réseau américains.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic