Aller au contenu principal

Dossier OpenAI — page 22

1722 articles · page 22 sur 35

Toute l'actualité d'OpenAI : nouvelles versions de ChatGPT et GPT, stratégie produit, partenariats, controverses et décisions de Sam Altman.

EVE : un système générateur-vérificateur pour les politiques génératives
1051arXiv cs.RO RobotiqueOpinion

EVE : un système générateur-vérificateur pour les politiques génératives

Des chercheurs ont publié en décembre 2024 sur arXiv (2512.21430) EVE, un framework modulaire de type générateur-vérificateur visant à améliorer les politiques visuomotrices génératives en robotique, au moment de l'inférence et sans aucun réentraînement. Le système enveloppe une politique de base figée, reposant sur la diffusion ou le flow-matching, avec plusieurs agents vérificateurs VLM (Vision-Language Model) opérant en mode zéro-shot. Chaque vérificateur propose des raffinements d'actions candidates générées par la politique de base ; un module d'incorporation fusionne ensuite les retours agrégés via un guidage par classifieur intégré dans le processus de débruitage de l'action. Les évaluations couvrent des tâches de manipulation simulées et réelles sur différents embodiments robotiques, avec des gains de taux de succès mesurés dans chaque configuration testée, sans modifier ni la politique ni les vérificateurs. L'intérêt principal réside dans le transfert d'une technique émergente des LLMs, le scaling du compute au test-time, vers la commande robotique incarnée. Des systèmes comme OpenAI o1 ou DeepSeek-R1 ont montré qu'allouer davantage de calcul à l'inférence améliore significativement les performances, sans toucher aux poids du modèle. EVE applique cette logique aux politiques génératives : là où une politique de diffusion dégrade sous distribution shift (scènes inédites, objets non vus à l'entraînement, perturbations), les vérificateurs VLM guident la correction sans fine-tuning coûteux. Pour les intégrateurs et décideurs B2B, le signal est concret : améliorer les performances d'un modèle déployé pourrait devenir une question de ressources de calcul à l'inférence, non de nouveaux cycles d'entraînement sur des données supplémentaires. Les politiques visuomotrices par diffusion ont émergé à partir de 2023 avec Diffusion Policy (Columbia University) et ACT, suivies d'architectures flow-matching comme pi0 de Physical Intelligence. Ces modèles performent correctement sur leur distribution d'entraînement mais peinent hors distribution, un frein central au déploiement industriel. EVE s'inscrit dans une tendance plus large qui consiste à coupler des VLMs généralistes avec des politiques spécialisées sans réentraînement. Les approches concurrentes incluent le Best-of-N sampling appliqué à la robotique et les méthodes de récompense dense au test-time (SuSIE, GROOT). La suite logique serait de valider EVE sur des plateformes physiques à plus grande échelle et de quantifier le trade-off latence/qualité en fonction du nombre de vérificateurs actifs simultanément.

1 source
Le cofondateur milliardaire de Databricks et Perplexity incite les chercheurs en IA à éviter les géants de la tech
1052The Information AI 

Le cofondateur milliardaire de Databricks et Perplexity incite les chercheurs en IA à éviter les géants de la tech

Andy Konwinski, co-fondateur milliardaire de Databricks et de Perplexity AI, mène depuis plusieurs mois une campagne active pour convaincre les chercheurs en intelligence artificielle de ne pas rejoindre les grandes entreprises technologiques. Il a exposé sa vision lors de la conférence AI de l'Association for Computing Machinery à San Jose, plaidant pour que les académiques continuent à publier leurs travaux en accès libre plutôt que de rejoindre des laboratoires privés qui gardent leurs avancées secrètes. Son appel intervient dans un contexte de fermeture croissante de l'écosystème de recherche en IA. Un rapport de Stanford publié en 2026 a documenté qu'OpenAI, Anthropic et Google ne divulguent désormais plus les détails sur les logiciels utilisés pour entraîner leurs modèles, la puissance de calcul mobilisée, ni la taille de leurs jeux de données, des informations pourtant essentielles pour que d'autres chercheurs puissent reproduire et améliorer ces résultats. Cette opacité croissante prive la communauté scientifique mondiale des briques de connaissance nécessaires pour progresser collectivement. Pour Konwinski, l'enjeu dépasse la simple compétition industrielle : "Il existe de nombreuses raisons, fondamentales, sociétales, pour défendre la démocratie, qui font que la recherche ouverte doit survivre." Ce débat s'inscrit dans une tension structurelle entre academia et industrie qui s'est considérablement accentuée avec la montée en puissance des grands modèles de langage. Le tournant illustratif reste le célèbre article de recherche publié par Google en 2017, le papier "Attention Is All You Need" sur l'architecture Transformer, qui est devenu la base de pratiquement tous les modèles et chatbots d'IA modernes. Ce travail, rendu public à l'époque, a permis à l'ensemble de l'industrie d'avancer. La question qui se pose aujourd'hui est de savoir si un tel partage serait encore possible dans un environnement où la recherche est devenue un avantage concurrentiel jalousement protégé.

UELa fermeture progressive de la recherche IA par OpenAI, Anthropic et Google fragilise les exigences de transparence et d'auditabilité portées par l'AI Act européen.

RecherchePaper
1 source
Dépasser l'IA informelle, par Carina Hong (Axiom Math)
1053Latent Space 

Dépasser l'IA informelle, par Carina Hong (Axiom Math)

En 2025, Axiom, une startup fondée seulement sept mois plus tôt, a réussi à résoudre les 12 problèmes du Putnam, l'un des concours mathématiques universitaires les plus difficiles au monde, avec un score de 12/12 (8/12 dans le temps imparti). À titre de comparaison, les meilleurs étudiants humains plafonnent autour de 110/120, DeepSeek avait atteint 103/120, et la médiane des participants se situe habituellement à 0 ou 1 point. Carina Hong, PDG d'Axiom, défend une approche radicalement différente de la majorité des laboratoires d'IA : la vérification formelle des preuves mathématiques via le langage Lean, un système qui permet de valider mécaniquement qu'un raisonnement est correct, de la même façon qu'un compilateur vérifie du code. La startup a par ailleurs publié en open source AXLE, une suite d'outils interactifs basés sur Lean pour explorer et manipuler des preuves. Sur le benchmark ProofGen Verina, qui mesure la capacité à générer du code accompagné de sa preuve de correction, Axiom revendique un score de 99 % (187 sur 189). L'enjeu dépasse largement les olympiades mathématiques. En mi-2026, Claude Code d'Anthropic et Codex d'OpenAI dominent le marché du développement logiciel assisté par IA, confirmant le pari d'Anthropic sur le code. Mais Hong estime que la maîtrise du code, aussi impressionnante soit-elle, ne suffit pas à atteindre l'AGI : des lacunes subsistent dans les capacités de raisonnement rigoureux. La vérification formelle offre quelque chose qu'aucune autre approche ne fournit encore : un signal de récompense binaire et fiable pour l'entraînement par renforcement. Plutôt que de s'appuyer sur des heuristiques statistiques comme RLHF ou GRPO, un système peut simplement vérifier si une preuve est valide, exactement comme on compile et teste du code. C'est un avantage considérable pour la qualité et la fiabilité des modèles. Hong illustre sa philosophie par l'exemple de Srinivasa Ramanujan, le mathématicien autodidacte indien dont l'intuition était prodigieuse, mais qui ne formulait pas ses résultats en preuves rigoureuses. Lorsque G.H. Hardy l'a convaincu de formaliser ses démonstrations, Ramanujan a lui-même progressé, car la rigueur l'a forcé à articuler des détails qui ouvrent de nouvelles voies. Surtout, ses preuves sont devenues transmissibles et cumulables : d'autres pouvaient s'appuyer dessus pour aller plus loin. C'est précisément ce que Hong appelle "composer l'intelligence" plutôt que de l'accumuler. Dans un secteur où les grands modèles rivalisent sur des benchmarks de coding et de raisonnement général, Axiom parie que la prochaine frontière se jouera sur la capacité à produire des raisonnements vérifiables de bout en bout, une approche qui pourrait s'avérer décisive à mesure que l'IA s'attaque à des domaines exigeant une fiabilité absolue.

RecherchePaper
1 source
Ideogram 4.0 sort en open-weight avec une résolution native 2K et un rendu de texte amélioré
1054The Decoder 

Ideogram 4.0 sort en open-weight avec une résolution native 2K et un rendu de texte amélioré

Ideogram a publié la version 4.0 de son modèle de génération d'images, en le rendant disponible en open-weight, c'est-à-dire avec les poids accessibles publiquement. Cette nouvelle version introduit une résolution native de 2K, un contrôle par boîtes englobantes permettant de positionner précisément les éléments visuels, et des capacités améliorées de rendu du texte dans les images générées. Sur le classement DesignArena, Ideogram 4.0 se hisse à la première place parmi tous les modèles ouverts disponibles. Seuls les systèmes fermés d'OpenAI et de Google le dépassent encore. L'usage commercial reste toutefois soumis à une licence payante. Cette publication marque une avancée significative pour l'écosystème open-weight dans la génération d'images. Jusqu'ici, les modèles capables de produire du texte lisible et correctement intégré dans une image restaient une faiblesse notoire des systèmes ouverts. Proposer la 2K en natif élargit les possibilités pour les créatifs, les designers et les développeurs qui cherchent à intégrer ces outils dans des pipelines de production professionnels sans dépendre entièrement de plateformes fermées. Ideogram s'est imposé ces derniers mois comme l'un des compétiteurs sérieux face à Midjourney, DALL-E et Imagen de Google, notamment grâce à sa maîtrise du rendu typographique. Le choix de l'open-weight, une stratégie popularisée par Meta avec Llama, vise à élargir l'adoption et à s'imposer comme référence dans la communauté des développeurs. La restriction commerciale via licence payante permet à Ideogram de préserver un modèle économique tout en bénéficiant de la visibilité de l'open source.

UELes développeurs et créatifs européens peuvent intégrer ce modèle open-weight dans leurs pipelines de production sans dépendre de plateformes américaines fermées.

CréationOpinion
1 source
Microsoft lance Project Solara, un OS Android conçu pour les agents plutôt que les applications
1055Ars Technica AI 

Microsoft lance Project Solara, un OS Android conçu pour les agents plutôt que les applications

Microsoft a présenté Project Solara lors de sa conférence Build 2026, un système d'exploitation basé sur Android conçu non pas pour faire tourner des applications, mais des agents autonomes. Contrairement aux OS mobiles traditionnels, Solara est pensé comme une plateforme "chip-to-cloud", c'est-à-dire intégrée depuis le matériel jusqu'au cloud, capable de s'adapter à une multitude de dispositifs spécialisés. Pour l'instant, le projet reste limité à quelques prototypes conceptuels et ne sera pas disponible sur les appareils grand public dans l'immédiat. L'ambition déclarée de Microsoft est que Solara génère des interfaces à la volée, en fonction des besoins de l'agent qui s'y exécute, plutôt que de s'appuyer sur des interfaces figées comme le font les applications classiques. L'enjeu est considérable pour l'industrie technologique : si les agents IA deviennent les unités fondamentales d'interaction avec les machines, le modèle de distribution logicielle hérité des smartphones sera remis en cause. Les développeurs d'applications, les stores numériques, et les fabricants de puces devront tous s'adapter à un paradigme où l'interface n'est plus construite à l'avance mais calculée en temps réel. Pour les utilisateurs, cela signifierait des appareils potentiellement plus polyvalents, capables de se transformer selon la tâche, mais aussi une dépendance accrue aux modèles de langage sous-jacents et aux infrastructures cloud de Microsoft. Microsoft reconnaît elle-même que son discours reste largement spéculatif et que les modèles suffisamment puissants pour alimenter cette vision n'existent pas encore. La démarche s'inscrit dans la continuité de son partenariat avec OpenAI, aujourd'hui en cours de restructuration, et dans une tentative de ne pas répéter ses erreurs passées dans la transition mobile, où l'entreprise avait pris du retard sur les applications, la sécurité et le support long terme. En positionnant Solara dès maintenant, Microsoft cherche à occuper le terrain avant que la prochaine rupture technologique ne se concrétise.

UESi le paradigme agent-first se concrétise, les développeurs d'applications et fabricants d'appareils européens devront revoir leurs modèles économiques face à une dépendance accrue à l'écosystème Microsoft.

InfrastructureOpinion
1 source
Anthropic envisage une introduction en bourse, signe de la maturité de l'IA en entreprise
1056AI News 

Anthropic envisage une introduction en bourse, signe de la maturité de l'IA en entreprise

Anthropic prépare une introduction en bourse qui constitue un tournant symbolique pour l'industrie de l'intelligence artificielle générative. L'entreprise fondée par Dario et Daniela Amodei, valorisée à plusieurs dizaines de milliards de dollars, franchit ainsi le seuil qui sépare la phase de recherche à capital-risque d'un statut de fournisseur d'infrastructure d'entreprise à part entière. William Samengo-Turner, responsable du secteur technologique chez le cabinet juridique A&O Shearman, résume l'enjeu : "La vraie question n'est pas de savoir si les marchés publics sont prêts pour l'IA, mais si l'IA est prête pour les marchés publics." Karthik Hariharan, ingénieur senior chez DoorDash, observe pour sa part qu'Anthropic et OpenAI se livrent une course à l'IPO, et que le premier à franchir la ligne "fixera probablement le plancher et le plafond des valorisations pour les 12 à 18 mois suivants." Cette cotation en bourse redéfinit concrètement la relation entre Anthropic et ses clients professionnels. Les entreprises qui intègrent Claude dans leurs workflows internes pourront désormais planifier sur plusieurs années autour de grilles tarifaires, de limites d'API et de contrats de service formalisés. Mais l'équation est contrainte : entraîner chaque nouvelle génération de modèles nécessite des dizaines de milliers de GPU et des dépenses d'investissement massives, que la structure des marchés publics oblige à répercuter de façon prévisible sur les clients. Si Wall Street exige une expansion agressive des marges post-IPO, les entreprises devront anticiper des conditions de licence plus strictes et l'abandon progressif des versions de modèles les moins rentables, créant des cycles de migration forcée pour les équipes de développement. Le modèle économique sous-jacent révèle une dépendance structurelle au marché B2B. Suvrankar Datta, chercheur au CRASH Lab, le chiffre sans détour : sur huit milliards d'êtres humains, seulement 100 millions peuvent se permettre de payer Claude au tarif actuel, et les 20 dollars mensuels de l'abonnement grand public ne financent pas des clusters de serveurs à plusieurs milliards de dollars. La survie financière d'Anthropic repose donc sur son ancrage dans les budgets des grandes organisations, à travers des usages comme la gestion des ressources humaines, la revue de documents juridiques ou le tri du support client. Nate Elliott, analyste IA chez Emarketer, pointe la tension centrale : "Claude a construit une base d'utilisateurs enterprise solide, mais il n'est pas compétitif en tant que plateforme IA grand public." La cotation d'Anthropic sera ainsi le premier test grandeur nature pour savoir si Wall Street considère l'IA comme une histoire de consommateurs ou comme une infrastructure industrielle.

UELes entreprises européennes intégrant Claude dans leurs workflows devront anticiper des révisions tarifaires et des conditions contractuelles plus strictes imposées par les exigences de rentabilité des marchés publics.

BusinessOpinion
1 source
☕️ Microsoft voudrait ranger tous ses Copilot dans une app unique
1057Next INpact 

☕️ Microsoft voudrait ranger tous ses Copilot dans une app unique

Microsoft travaille sur une application unique destinée à regrouper l'ensemble de ses assistants Copilot sous une seule interface. Selon des informations rapportées par Fortune, ce projet de « superapp » constituerait un guichet centralisé donnant accès à tous les Copilot disponibles selon le profil de l'utilisateur, qu'il soit grand public, développeur ou professionnel. L'application intégrerait également un système d'automatisation par agents IA baptisé Autopilot. Microsoft pourrait en parler dès cette semaine lors de sa conférence Build, sans forcément montrer le produit lui-même, mais un lancement effectif est évoqué avant la fin de l'été 2026. La nécessité de cette consolidation est réelle : Microsoft s'est retrouvé à multiplier les déclinaisons de Copilot au point que même les utilisateurs avertis peinent à s'y retrouver. GitHub Copilot, Microsoft 365 Copilot, Copilot Cowork, le chatbot grand public... chaque service cible un usage distinct, mais leur coexistence sans fil directeur clair crée une confusion préjudiciable à l'adoption. En mars 2026, Satya Nadella avait déjà réagi en nommant Jacob Andreou responsable de la cohérence de tout l'écosystème Copilot, signalant que la situation était devenue ingérable. La superapp serait la réponse architecturale à ce problème de lisibilité, avec l'ambition de répondre à l'ensemble des besoins d'un utilisateur depuis un point d'entrée unique. Cette initiative s'inscrit dans une course plus large entre les grands acteurs de l'IA à imposer une application centrale dans le quotidien numérique des utilisateurs. OpenAI poursuit un objectif similaire avec sa propre superapp, construite autour de l'outil de vibe coding Codex et visant à couvrir aussi bien les usages grand public que les profils techniques. Pour Microsoft, l'enjeu est double : regagner la confiance d'utilisateurs lassés par l'omniprésence parfois intrusive de l'IA dans Windows, que l'éditeur avait déjà commencé à atténuer, tout en consolidant sa position face à des concurrents qui proposent des expériences plus cohérentes. Le pari de la superapp n'est cependant pas sans risque : une interface fourre-tout peut complexifier l'expérience autant qu'elle la simplifie, surtout pour des utilisateurs qui cherchent à accomplir une tâche précise sans se perdre dans un menu d'options.

UELes entreprises françaises et européennes utilisant Microsoft 365 Copilot seront directement concernées par cette refonte de l'interface, qui modifiera leur expérience quotidienne avec les outils IA Microsoft déjà largement déployés.

💬 C'est la reconnaissance officielle que Microsoft a transformé Copilot en labyrinthe. Ça fait des mois qu'on se demande "mais c'est lequel le vrai Copilot ?", et là ils admettent que même eux n'arrivent plus à gérer. Reste à voir si une superapp résout vraiment le problème ou si elle ajoute juste une couche de menu au-dessus du chaos.

OutilsOpinion
1 source
Anthropic lance Claude Opus 4.8 : workflows dynamiques, mode rapide moins cher et limite de 1 000 sous-agents
1058MarkTechPost 

Anthropic lance Claude Opus 4.8 : workflows dynamiques, mode rapide moins cher et limite de 1 000 sous-agents

Anthropic a lancé Claude Opus 4.8 accompagné de deux nouvelles fonctionnalités pour Claude Code : les workflows dynamiques et une mise à jour du mode rapide. Les workflows dynamiques permettent d'orchestrer des centaines de sous-agents en parallèle via un script JavaScript que Claude génère automatiquement à partir d'une description de tâche. Un runtime exécute ce script en arrière-plan, libérant la fenêtre de contexte de Claude des résultats intermédiaires, qui restent stockés dans des variables du script. Chaque exécution est plafonnée à 16 agents simultanés et 1 000 agents au total. La fonctionnalité est disponible sur les plans Max, Team et Enterprise (désactivée par défaut sur Enterprise), ainsi que via l'API Claude, Amazon Bedrock, Vertex AI et Microsoft Foundry, à partir de la version 2.1.154 de Claude Code. En parallèle, le mode rapide pour Opus 4.8 est annoncé trois fois moins cher que pour Opus 4.7 (facturé 30/150 dollars par million de tokens en entrée/sortie), tout en offrant des vitesses de génération 2,5 fois supérieures. Les deux fonctionnalités sont disponibles en aperçu de recherche. Pour les développeurs confrontés à des migrations ou des audits de grande envergure, les workflows dynamiques élargissent considérablement ce qu'un agent peut accomplir en une seule session. Anthropic illustre le potentiel avec l'exemple de Jarred Sumner, qui a porté le runtime Bun du langage Zig vers Rust en 11 jours : environ 750 000 lignes de Rust générées, 99,8 % du test suite existant passé, avec des centaines d'agents travaillant en parallèle et deux réviseurs par fichier. La logique adversariale intégrée, où certains agents produisent des résultats et d'autres les réfutent jusqu'à convergence, vise une qualité inaccessible en un seul passage. Un job interrompu reprend là où il s'était arrêté dans la même session, les agents terminés retournant leurs résultats en cache. Le mode rapide répond à un besoin distinct : conserver la qualité Opus pour le débogage interactif et l'itération rapide, sans subir les délais habituels des grands modèles. Ces annonces s'inscrivent dans la course à l'agent autonome que se livrent Anthropic, OpenAI et Google depuis début 2025. Après avoir repositionné Claude Code comme plateforme de développement, Anthropic fait de l'orchestration multi-agents une fonctionnalité centrale de son offre. Le plafond de 1 000 agents par exécution et le statut d'aperçu de recherche des deux fonctionnalités témoignent d'une prudence réelle face à l'inflation des coûts en tokens, puisqu'une seule exécution peut générer des milliers d'appels. Le mode rapide, financé par des crédits d'utilisation séparés du forfait inclus, envoie un signal commercial clair : Anthropic cherche à monétiser la vitesse comme axe différenciant, là où ses concurrents misent davantage sur le prix. Les prochaines étapes probables incluent une stabilisation tarifaire et une extension des workflows vers des interfaces no-code, à mesure qu'Anthropic affine les garde-fous nécessaires à une adoption plus large.

UELa réduction de prix du mode rapide (3 fois moins cher que pour Opus 4.7) bénéficie directement aux développeurs européens utilisant Claude Code via l'API ou les plateformes cloud.

LLMsOpinion
1 source
NVIDIA publie Polar, un framework de rollout GRPO fidèle aux tokens pour Codex, Claude Code et Qwen Code
1059MarkTechPost 

NVIDIA publie Polar, un framework de rollout GRPO fidèle aux tokens pour Codex, Claude Code et Qwen Code

NVIDIA a publié Polar, un framework de déploiement conçu pour entraîner des agents de langage par apprentissage par renforcement (RL) sans modifier les outils existants. Présenté dans un article de recherche disponible sur arXiv (2605.24220), Polar permet d'appliquer des algorithmes comme GRPO à des agents comme Codex CLI, Claude Code, Qwen Code ou Pi, en s'intercalant entre l'agent et le modèle de langage via un proxy réseau. Concrètement, un proxy intercepte chaque appel API entrant, détecte le format utilisé (Anthropic Messages, OpenAI Chat Completions, Google generateContent), normalise la requête, capture les tokens générés avec leurs probabilités logarithmiques, puis retourne la réponse dans le format attendu par l'agent. L'unique modification requise côté harness est de rediriger l'URL de base du modèle vers ce gateway. L'intérêt majeur de Polar est de préserver intégralement le comportement des outils d'agents en production lors de l'entraînement. Jusqu'ici, les infrastructures RL standard exigeaient de réécrire la logique interne de chaque harness derrière une API propriétaire (env.init(), env.step(), env.reset() à la manière d'OpenAI Gym), ce qui entraînait une perte de fidélité et un coût d'intégration élevé pour chaque nouvel outil. Avec Polar, les chercheurs peuvent entraîner un modèle sur les mêmes chemins d'exécution exacts que ceux utilisés en évaluation, ce qui réduit l'écart entre les performances mesurées et les performances réelles. Les évaluateurs intégrés couvrent des benchmarks comme SWE-Bench et SWE-Gym, et le système permet de récupérer des traces partielles même lorsqu'un agent dépasse son budget de temps après avoir effectué des appels modèles. L'architecture repose sur deux composants principaux : un serveur de rollout qui distribue des sessions parallèles à des noeuds gateway, et ces mêmes gateways qui gèrent l'intégralité du cycle de vie d'une session, du démarrage du runtime à l'évaluation de la sortie. Des pools de workers isolés gèrent les phases INIT, RUNNING et POSTRUN, tandis qu'un buffer READY maintient des runtimes préchauffés pour éviter de bloquer l'exécution GPU. Polar supporte Docker et Apptainer sans droits root, et propose des raccourcis natifs pour les principaux harnesses du marché. Cette approche s'inscrit dans une tendance plus large : les laboratoires et équipes de recherche cherchent à industrialiser l'entraînement RL sur des agents de codage complexes, capables de gérer des contextes longs et des orchestrations multi-agents. NVIDIA se positionne ainsi comme fournisseur d'infrastructure pour cette nouvelle génération de pipelines d'entraînement, à mesure que la frontière entre inférence et apprentissage continu s'estompe.

RecherchePaper
1 source
Il pose une question morbide à ChatGPT : La police l’arrête pour meurtre
1060Le Big Data 

Il pose une question morbide à ChatGPT : La police l’arrête pour meurtre

Le 13 avril 2026, Hisham Abugharbieh, principal suspect dans une double affaire de meurtre à l'Université de Floride du Sud (USF), aurait posé à ChatGPT une question précise : que se passe-t-il lorsqu'une personne est placée dans un sac-poubelle noir et jetée dans une benne à ordures ? Trois jours plus tard, le 16 avril, les autorités étaient prévenues de la disparition de deux étudiants. Le 19 avril, le même suspect aurait interrogé le chatbot sur la traçabilité d'un iPhone après changement d'utilisateur. Ces éléments, révélés par Axios à partir de documents judiciaires, ont conduit le procureur général de Floride, James Uthmeier, à élargir son enquête criminelle contre OpenAI pour inclure ces meurtres. L'enquête couvre également une fusillade survenue le 17 avril 2025 sur le campus de l'Université d'État de Floride, qui avait fait deux morts et six blessés, et dans laquelle l'avocat d'une victime affirme que le suspect était en contact régulier avec ChatGPT avant les faits. Ces affaires posent une question qui dépasse le cadre judiciaire floridien : dans quelle mesure un assistant conversationnel peut-il, même involontairement, faciliter la préparation d'un crime ? Des tests menés sur ChatGPT avec les mêmes requêtes montrent que le modèle répond de façon purement explicative, sans détecter de signal d'alarme. À la question sur la benne à ordures, il évoque des risques d'asphyxie et de blessures. Sur les données iPhone, il fournit une explication technique. Aucun signalement automatique ne s'est déclenché lors de ces sessions, même lorsque les trois questions étaient posées dans un enchaînement suspect. Le système s'est borné à rappeler que la violence extrême constitue un crime grave et à recommander de contacter les secours si une situation réelle était en jeu, une réponse générique qui illustre les limites actuelles des garde-fous des grands modèles de langage. OpenAI se trouve ainsi au centre d'une controverse judiciaire et politique inédite, dans un État où le procureur général avait déjà ouvert une enquête sur la société avant même ces nouveaux développements. L'entreprise affirme coopérer pleinement avec les autorités, tout en soulignant qu'on ignore encore précisément ce que le suspect a communiqué au chatbot et comment il aurait utilisé les réponses obtenues. Cette affaire intervient dans un contexte de pression croissante sur les éditeurs d'IA pour qu'ils renforcent la détection de requêtes à risque, notamment lorsque des questions anodines en apparence forment, combinées, un schéma préoccupant. Elle relance le débat sur la responsabilité légale des plateformes d'IA face aux usages criminels de leurs outils, un terrain juridique encore largement inexploré aux États-Unis.

UECette affaire alimente le débat européen sur la responsabilité légale des plateformes d'IA, un enjeu directement adressé par l'AI Act dans ses obligations de détection et de signalement des contenus à risque.

SécuritéActu
1 source
Alibaba lance la bêta de son modèle de génération vidéo HappyHorse 1.0
1061Pandaily 

Alibaba lance la bêta de son modèle de génération vidéo HappyHorse 1.0

Le 27 avril 2026, Alibaba a annoncé le lancement en bêta de HappyHorse 1.0, son nouveau modèle de génération vidéo par intelligence artificielle. Actuellement accessible aux créateurs professionnels et aux entreprises via inscription, le modèle est également disponible au grand public dans l'application Qwen. HappyHorse 1.0 prend en charge la génération vidéo à partir de texte, d'images ou d'audio, avec des séquences pouvant atteindre 15 secondes, un upscaling en 1080p, plusieurs formats d'image et une narration multi-plans. Le tarif de référence est fixé à 0,9 yuan par seconde pour une vidéo en 720p. Le modèle supporte également plusieurs langues, dont le cantonais, l'anglais, le français et le coréen. Un déploiement commercial est prévu pour le mois de mai, après une phase d'élargissement des tests d'ici fin avril. L'arrivée de HappyHorse 1.0 sur le marché illustre la montée en puissance des géants technologiques asiatiques dans la course à la vidéo générative, un segment en pleine explosion. Pour les créateurs de contenu et les entreprises, un outil capable de produire des vidéos courtes de qualité professionnelle à moins d'un yuan la seconde représente une baisse significative des coûts de production. La prise en charge multilingue native, notamment du français, élargit considérablement le périmètre commercial potentiel au-delà de la Chine. HappyHorse 1.0 a été développé par l'unité ATH d'Alibaba en collaboration avec plusieurs équipes internes, une information confirmée par le groupe le 10 avril. Avant son annonce officielle, le modèle avait déjà figuré sous un nom anonyme dans le classement AI Video Arena d'Artificial Analysis, ce qui suggère qu'Alibaba cherchait à valider ses performances en conditions réelles avant tout lancement public. Cette stratégie s'inscrit dans un contexte de concurrence intense entre acteurs comme Sora (OpenAI), Kling (Kuaishou) ou Vidu (Tencent), tous engagés dans une course à la qualité et à l'accessibilité tarifaire pour s'imposer comme référence de la vidéo générée par IA.

UELa prise en charge native du français ouvre HappyHorse 1.0 aux créateurs et entreprises européens comme outil de production vidéo à faible coût, sans présence ni partenariat européen annoncé à ce stade.

CréationOpinion
1 source
Les nuances de la marge brute de Cursor, comparatif GPT-5.5 et Claude Mythos
1062The Information AI 

Les nuances de la marge brute de Cursor, comparatif GPT-5.5 et Claude Mythos

Microsoft et OpenAI ont revu les termes de leur partenariat, avec deux concessions majeures : Azure perd son droit exclusif de distribuer les modèles OpenAI, et Microsoft n'est plus tenu de reverser 20 % des revenus générés par ces modèles sur sa plateforme cloud. Cette renégociation intervient après que des cadres de Microsoft ont exprimé des inquiétudes le mois dernier : OpenAI avait annoncé un projet de déploiement d'un agent IA via Amazon Web Services, ce qui, selon eux, violait le contrat d'exclusivité liant les deux entreprises. Par ailleurs, Cursor, la startup spécialisée dans le codage assisté par IA, continue sa montée en puissance avec un chiffre d'affaires annualisé atteignant 2,7 milliards de dollars en mars 2026, contre 1 milliard en novembre 2025. SpaceX dispose désormais d'une option d'achat sur la société valorisée à 60 milliards de dollars. Ces deux révélations illustrent les tensions structurelles qui traversent l'écosystème IA. Du côté OpenAI-Microsoft, la fin de l'exclusivité Azure signifie qu'OpenAI peut désormais s'appuyer sur d'autres clouds pour commercialiser ses modèles, ce qui lui donne un levier de négociation et une flexibilité stratégique accrue. Pour Cursor, la croissance spectaculaire masque une réalité financière préoccupante : la marge brute était de -23 % au trimestre clos en janvier 2026, avant de passer tout juste en territoire positif. Les coûts d'inférence, c'est-à-dire le calcul nécessaire pour faire tourner les modèles, plombent la rentabilité. Ce contexte met en lumière une pratique comptable discrète mais répandue dans le secteur : certaines startups IA classent une partie de leurs dépenses d'inférence en frais marketing plutôt qu'en coût des ventes. Cela ne change pas les pertes nettes, mais améliore artificiellement la marge brute, un indicateur clé pour les investisseurs. Ce tour de passe-passe comptable révèle à quel point les marges sont sous pression dans l'IA générative, y compris pour des acteurs en forte croissance. La question de la rentabilité réelle de ces modèles économiques reste entière, alors que les valorisations continuent de s'envoler.

UELa fin de l'exclusivité Azure pour les modèles OpenAI pourrait indirectement modifier les conditions d'accès des entreprises européennes aux API d'OpenAI via d'autres clouds, mais l'impact direct sur la France ou l'UE reste limité à court terme.

BusinessOpinion
1 source
The Download : arnaques dopées et IA dans la santé à l'étude
1063MIT Technology Review 

The Download : arnaques dopées et IA dans la santé à l'étude

L'intelligence artificielle redessine en profondeur deux fronts critiques de la société numérique : la cybersécurité et la santé. Depuis le lancement de ChatGPT fin 2022, les cybercriminels ont intégré les grands modèles de langage dans leur arsenal, automatisant la rédaction d'e-mails malveillants, le phishing ultraciblé, les deepfakes hyperréalistes et les scans automatisés de vulnérabilités. Résultat : les attaques sont devenues plus rapides, moins coûteuses et accessibles à un nombre croissant d'acteurs. De nombreuses organisations peinent aujourd'hui à absorber le volume de cyberattaques, une situation appelée à s'aggraver à mesure que les outils s'améliorent et se démocratisent. En parallèle, l'IA s'est imposée dans les hôpitaux : elle assiste la prise de notes médicales, analyse les dossiers patients pour identifier ceux nécessitant un suivi, et interprète des radios ou des résultats d'examens. Des études montrent que ces outils produisent des résultats précis, mais la question centrale reste sans réponse : ces technologies améliorent-elles réellement la santé des patients ? Cette double expansion de l'IA soulève des enjeux profonds. Dans le domaine de la cybersécurité, l'industrialisation de la fraude met sous pression non seulement les entreprises, mais aussi les particuliers et les institutions publiques, qui ne disposent pas toujours des ressources pour se défendre à la même vitesse que les attaquants progressent. Dans le secteur médical, l'absence de données solides sur les résultats cliniques réels pose un problème éthique et pratique majeur : des outils sont déployés à large échelle sans que l'on sache encore s'ils font gagner des années de vie ou simplement du temps administratif. C'est une lacune que la communauté médicale et les régulateurs devront combler rapidement. Ces tendances s'inscrivent dans un contexte de reconfigurations majeures du secteur tech. DeepSeek vient de lancer les versions preview de son modèle V4, présenté comme la plateforme open source la plus puissante à ce jour, optimisée pour les puces Huawei et rivalisant selon ses créateurs avec les meilleurs modèles fermés d'OpenAI et DeepMind. OpenAI a de son côté déployé GPT-5.5 à l'ensemble des utilisateurs de ChatGPT malgré des préoccupations en cybersécurité. Meta prévoit de supprimer environ 8 000 postes, soit 10 % de ses effectifs, annonce attendue le 20 mai, pour financer ses investissements en IA. Sur le plan géopolitique, un mémo de la Maison Blanche accuse des entreprises chinoises d'exploitation massive de modèles américains, accusation que Pékin qualifie de "calomnie". L'ère de l'accès gratuit aux IA avancées touche par ailleurs à sa fin, les laboratoires étant sous pression croissante pour rentabiliser leurs investissements colossaux.

UEL'industrialisation des cyberattaques par l'IA expose directement les entreprises et institutions européennes à des menaces croissantes, tandis que le déploiement à grande échelle d'outils IA médicaux sans évaluation clinique rigoureuse appelle une réponse réglementaire urgente de l'UE.

SécuritéActu
1 source
Scandale dans l’IA : les États-Unis dénoncent un vol à grande échelle orchestré depuis la Chine
1064Le Big Data 

Scandale dans l’IA : les États-Unis dénoncent un vol à grande échelle orchestré depuis la Chine

Le gouvernement américain a officiellement accusé la Chine de mener des campagnes de vol industriel à grande échelle ciblant les laboratoires d'intelligence artificielle du pays. Le 23 avril 2026, Michael Kratsios, directeur de l'Office of Science and Technology Policy (OSTP) à la Maison-Blanche, a publiquement dénoncé ces pratiques dans une note révélée par le Financial Times. Selon ce document, des entités étrangères, principalement chinoises, orchestrent des opérations de "distillation" massives : elles interrogent les modèles d'IA américains via des dizaines de milliers de proxies et de techniques de contournement (jailbreaking) pour en extraire les capacités et reproduire leurs performances à moindre coût. Washington a annoncé que des mesures concrètes seraient prises pour protéger l'innovation américaine. Ce type d'attaque, qualifié de "distillation industrielle", représente une menace sérieuse pour l'avance technologique des États-Unis. En exploitant massivement les API publiques ou en contournant les garde-fous des modèles commerciaux, des acteurs étrangers peuvent reconstituer des systèmes d'IA comparables sans financer les années de recherche et les milliards de dollars d'investissement qui ont permis de les créer. Pour des entreprises comme OpenAI, Anthropic ou Google DeepMind, cela signifie que leur propriété intellectuelle, algorithmes, données d'entraînement, capacités de raisonnement, peut être siphonnée à travers leurs propres interfaces. L'enjeu dépasse la concurrence commerciale : il touche directement à la compétitivité économique nationale et à la sécurité des infrastructures numériques américaines. Cette offensive diplomatique s'inscrit dans un contexte de rivalité technologique croissante entre Washington et Pékin, qui s'est intensifiée depuis les restrictions américaines sur l'exportation de puces avancées vers la Chine en 2022 et 2023. Côté chinois, des acteurs comme DeepSeek ont démontré qu'il était possible de produire des modèles très performants à faible coût, alimentant les soupçons sur leurs méthodes. La montée en puissance de l'OSTP sur ce dossier signale une volonté de l'administration de traiter la protection de l'IA comme une question de sécurité nationale à part entière. Les prochaines mesures pourraient inclure des restrictions d'accès aux modèles, un renforcement des contrôles sur les API, voire des sanctions. La réaction de l'industrie sera déterminante : certains observateurs n'ont pas manqué de noter l'ironie d'un secteur qui a lui-même largement entraîné ses modèles sur des données tierces sans toujours en demander la permission.

UELes acteurs européens utilisant les API des grands modèles américains pourraient être indirectement affectés si Washington impose des restrictions d'accès ou des contrôles renforcés dans le cadre de sa politique de protection de l'IA.

SécuritéReglementation
1 source
Les émissions de gaz à effet de serre des data centers pourraient dépasser celles de nations entières
1065Ars Technica AI 

Les émissions de gaz à effet de serre des data centers pourraient dépasser celles de nations entières

Onze campus de centres de données en cours de construction aux États-Unis sont associés à des projets de centrales au gaz naturel dont les émissions combinées pourraient dépasser 129 millions de tonnes de gaz à effet de serre par an, soit plus que l'ensemble des émissions du Maroc en 2024. Ces chiffres proviennent de documents de demandes de permis atmosphériques examinés par WIRED, soumis auprès d'agences étatiques américaines. Les infrastructures concernées alimenteront des centres de données au service de quelques-unes des entreprises d'IA les plus puissantes du pays : OpenAI, Meta, Microsoft et xAI figurent parmi les bénéficiaires identifiés. Ces projets sont soit déjà annoncés, soit en cours de construction. Ce que révèlent ces chiffres dépasse largement un problème local : ils illustrent le coût climatique concret de la course mondiale à l'IA. La particularité de ces installations est qu'elles contournent le réseau électrique public pour alimenter directement et exclusivement les centres de données, un modèle dit "behind-the-meter". Résultat : leurs émissions échappent aux mécanismes habituels de régulation et de comptabilisation carbone. Pour les consommateurs, la dynamique est aussi préoccupante : cette stratégie est partiellement motivée par la volonté des géants technologiques d'éviter d'alourdir les factures d'électricité des ménages, qui subissent déjà une résistance publique croissante face à la hausse des tarifs. Cette tendance s'inscrit dans un contexte de saturation du réseau électrique américain : les délais de raccordement aux opérateurs traditionnels s'allongent considérablement, poussant les développeurs de centres de données à produire leur propre énergie. Les projets listés ne représentent selon WIRED que la partie émergée de l'iceberg, alors que les grandes entreprises technologiques s'engagent dans des centaines de nouveaux centres à travers le pays. La question de la compatibilité entre les objectifs climatiques des États-Unis et l'expansion effrénée de l'infrastructure IA se pose désormais avec une acuité nouvelle, au moment où plusieurs États commencent à examiner plus attentivement les permis accordés à ces projets énergétiques hors réseau.

UEL'UE, engagée dans des objectifs climatiques contraignants et le reporting carbone obligatoire, pourrait faire face à des pressions similaires si le modèle d'alimentation directe hors réseau se généralise dans ses propres projets d'infrastructure IA.

InfrastructureActu
1 source
Une startup d'un milliard de dollars avec une vision différente de l'IA
1066AI News 

Une startup d'un milliard de dollars avec une vision différente de l'IA

Yann LeCun, ancien directeur scientifique de l'intelligence artificielle chez Meta, a fondé AMI Labs (Advanced Machine Intelligence Labs) après avoir quitté son poste fin 2025. La startup vient de lever un milliard de dollars de financement, une somme remarquable pour une équipe de seulement 12 personnes. LeCun prévoit de ne pas commercialiser de produit avant au moins cinq ans, positionnant AMI Labs comme une organisation de recherche pure. Son approche repose sur des architectures d'IA modulaires composées de plusieurs blocs spécialisés : un modèle du monde propre au domaine d'application, un acteur chargé de proposer des actions via l'apprentissage par renforcement, un module critique qui évalue ces options selon des règles fixes, un système de perception adapté au type de données traité (vidéo, texte, audio), une mémoire à court terme, et un configurateur orchestrant l'ensemble. Chaque instance serait entraînée uniquement sur des données pertinentes à son environnement, contrairement aux grands modèles de langage nourris de l'intégralité du web. Cette approche remet fondamentalement en question le paradigme dominant des LLMs comme GPT ou Claude. Là où ces modèles généralistes mobilisent des centaines de milliards de paramètres et nécessitent une infrastructure colossale pour fonctionner, les modules spécialisés d'AMI Labs pourraient se contenter de quelques centaines de millions de paramètres, voire tourner directement sur un appareil local. Le coût d'entraînement et d'inférence serait alors une fraction de celui des modèles actuels, rendant l'IA viable pour des acteurs qui ne disposent pas des ressources d'Anthropic, OpenAI, Google ou Meta. Pour les entreprises, cela ouvrirait la voie à des systèmes IA déployables en interne, sans dépendance aux grandes plateformes cloud. Le contexte donne tout son poids à cette prise de position. Les LLMs ont absorbé des ressources exponentiellement croissantes à chaque génération, et les techniques d'amélioration récentes, comme le prompting récursif des modèles de raisonnement, alourdissent encore la facture. Seuls de très grands groupes peuvent aujourd'hui se permettre de les exploiter à perte. LeCun, l'un des pères fondateurs du deep learning et lauréat du prix Turing 2018, défend depuis plusieurs années l'idée que les LLMs constituent une impasse pour atteindre une intelligence artificielle véritablement générale. Des précédents existent : les systèmes d'apprentissage automatique capables de maîtriser des jeux vidéo ou de plateau illustrent déjà la puissance des approches ciblées. Si AMI Labs parvient à ses fins, l'industrie pourrait connaître un rééquilibrage majeur, fragmentant un marché aujourd'hui dominé par une poignée d'acteurs disposant de budgets quasi illimités.

UESi l'approche modulaire d'AMI Labs aboutit, les entreprises européennes moins capitalisées pourraient déployer des systèmes IA en interne sans dépendance aux grandes plateformes cloud américaines.

RechercheOpinion
1 source
Microsoft lance le "vibe working" dans Word, Excel et PowerPoint
1067The Verge 

Microsoft lance le "vibe working" dans Word, Excel et PowerPoint

Microsoft déploie cette semaine un nouveau mode appelé Agent Mode dans ses applications Office, Word, Excel et PowerPoint. Baptisé en interne "vibe working", ce mode représente une version nettement plus avancée de Copilot, l'assistant IA que Microsoft commercialise auprès des entreprises depuis 2023. Sumit Chauhan, vice-président de l'Office Product Group, reconnaît publiquement les limites de la première version : "Quand nous avons lancé Copilot, les modèles fondationnels n'étaient pas assez puissants pour lui permettre d'agir directement dans les applications." Ce basculement vers un agent actif change fondamentalement la nature du produit. Jusqu'ici, Copilot dans Office se contentait de répondre à des questions ou de générer du contenu dans un volet latéral, sans pouvoir modifier directement un document, une feuille de calcul ou une présentation. Agent Mode franchit cette barrière : l'assistant peut désormais prendre des actions concrètes sur le "canvas", c'est-à-dire manipuler le contenu des fichiers de façon autonome, sur instruction de l'utilisateur. Pour les entreprises qui paient l'abonnement Copilot 365 (environ 30 dollars par utilisateur par mois), cela justifie enfin une partie de la promesse initiale. Cette annonce s'inscrit dans une course industrielle intense. Google a lancé des fonctionnalités similaires dans Workspace, et les grands éditeurs de productivité misent tous sur les "agents" comme prochaine étape après les assistants génératifs. Microsoft, qui a investi plusieurs milliards dans OpenAI, dispose d'un accès privilégié aux dernières versions de GPT-4o et o-series, ce qui lui permet aujourd'hui de tenir des promesses que les modèles de 2023 ne pouvaient pas encore tenir.

UELes entreprises européennes sous abonnement Microsoft 365 doivent évaluer l'adoption de l'Agent Mode Copilot 365 (environ 30 $/utilisateur/mois), qui franchit enfin la barrière de la manipulation autonome des documents Office.

OutilsOutil
1 source
Transcription audio multilingue économique à grande échelle avec Parakeet-TDT et AWS Batch
1068AWS ML Blog 

Transcription audio multilingue économique à grande échelle avec Parakeet-TDT et AWS Batch

NVIDIA a publié en août 2025 Parakeet-TDT-0.6B-v3, un modèle de transcription automatique de la parole open source couvrant 25 langues européennes, dont le français, l'allemand, l'espagnol, le polonais ou l'ukrainien. Capable de détecter automatiquement la langue parlée, ce modèle affiche un taux d'erreur sur les mots de 6,34 % en conditions acoustiques propres et de 11,66 % à 0 dB de rapport signal/bruit, tout en prenant en charge des fichiers audio allant jusqu'à trois heures. Distribué sous licence CC-BY-4.0, il s'appuie sur une architecture Token-and-Duration Transducer (TDT) qui prédit simultanément les tokens de texte et leur durée, permettant de sauter silences et segments redondants pour atteindre des vitesses d'inférence très largement supérieures au temps réel. Dans la configuration présentée, le modèle tourne sur AWS Batch avec des instances GPU G6 équipées de NVIDIA L4, qui offrent le meilleur ratio coût/performance, bien qu'il soit également compatible avec des instances G5, G4dn ou P5 pour un débit maximal. Le pipeline est entièrement événementiel : un fichier audio déposé sur Amazon S3 déclenche une règle Amazon EventBridge, qui soumet automatiquement un job à AWS Batch, lequel provisionne les ressources, télécharge l'image de conteneur depuis Amazon ECR et restitue une transcription JSON horodatée dans un bucket de sortie. Le coût final descend à quelques fractions de centime par heure d'audio. L'enjeu principal est économique. Pour les organisations traitant des volumes massifs d'audio, qu'il s'agisse d'archives médias, d'enregistrements de centres d'appels, de données d'entraînement pour l'IA ou de sous-titrage vidéo à la demande, les services ASR gérés facturent généralement à la durée réelle du fichier, ce qui fait exploser les coûts dès que les volumes augmentent. En ne payant que de brèves fenêtres de calcul GPU plutôt que la totalité de la durée audio, combiné à l'utilisation d'instances EC2 Spot moins onéreuses et au streaming par tampons, ce pipeline peut réduire la facture de transcription de façon substantielle par rapport aux APIs cloud classiques comme celles d'AWS Transcribe ou de Google Speech-to-Text. La prise en charge native de 25 langues sans configuration par langue supprime également une complexité opérationnelle significative pour les entreprises internationales. Cette approche s'inscrit dans une tendance plus large consistant à substituer des modèles open source performants aux services gérés pour les charges de travail à fort volume. NVIDIA, qui diffuse Parakeet dans le cadre de son écosystème NeMo, cherche à s'imposer comme référence en ASR face à OpenAI avec Whisper, à AssemblyAI ou encore à Amazon Transcribe. Le fait qu'un modèle de 600 millions de paramètres atteigne ces niveaux de précision multilingue ouvre la voie à des pipelines entièrement maîtrisés, hébergés en interne ou dans un cloud privé, sans dépendance à un fournisseur. La prochaine étape logique pour les équipes qui adoptent cette architecture sera d'enchaîner directement en aval des modules de post-traitement automatisés, résumé, analyse de sentiment ou détection d'entités, pour extraire encore plus de valeur des transcriptions produites.

UELe modèle Parakeet couvre nativement 25 langues européennes dont le français, offrant aux organisations françaises et européennes un pipeline de transcription audio économique et souverain, sans dépendance à un service ASR propriétaire.

OutilsTuto
1 source
NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents
1069NVIDIA AI Blog 

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents

NVIDIA et Google Cloud ont annoncé cette semaine, lors de la conférence Google Cloud Next à Las Vegas, une nouvelle étape majeure dans leur partenariat vieux de plus de dix ans. Au cœur de l'annonce : le lancement des instances bare-metal A5X, alimentées par les systèmes rack NVIDIA Vera Rubin NVL72, qui promettent un coût d'inférence jusqu'à dix fois inférieur et un débit de tokens dix fois plus élevé par mégawatt par rapport à la génération précédente. Ces infrastructures s'appuient sur les interconnexions NVIDIA ConnectX-9 SuperNICs couplées au réseau Google Virgo de nouvelle génération, permettant de déployer des clusters allant jusqu'à 80 000 GPU Rubin sur un site unique, et jusqu'à 960 000 GPU dans une configuration multisite. Par ailleurs, Google Cloud met en préversion les modèles Gemini sur Google Distributed Cloud avec les GPU NVIDIA Blackwell et Blackwell Ultra, ainsi que des machines virtuelles confidentielles garantissant le chiffrement des données en cours d'utilisation. Des acteurs comme OpenAI et Thinking Machines Lab utilisent déjà ces infrastructures pour des charges d'inférence massives, notamment pour faire tourner ChatGPT. Ces annonces représentent un saut qualitatif significatif pour les entreprises qui cherchent à industrialiser l'IA agentique et l'IA physique, c'est-à-dire les systèmes capables d'agir de manière autonome dans des environnements réels, comme les robots ou les jumeaux numériques en usine. La réduction drastique des coûts d'inférence change concrètement l'équation économique pour les développeurs d'applications IA à grande échelle. La possibilité de déployer les modèles Gemini en environnement souverain, sur des données sensibles restant chiffrées y compris pendant leur traitement, répond à une exigence croissante des entreprises et des gouvernements en matière de conformité et de confidentialité. L'intégration de modèles ouverts NVIDIA Nemotron dans la plateforme Gemini Enterprise Agent Platform élargit également les options des équipes techniques qui souhaitent combiner modèles propriétaires et open source. Ce partenariat s'inscrit dans une compétition intense entre les grands fournisseurs de cloud pour capter les budgets d'infrastructure IA, qui se chiffrent désormais en dizaines de milliards de dollars annuellement. Google Cloud cherche à rattraper son retard sur AWS et Microsoft Azure, qui ont pris de l'avance sur l'hébergement des charges d'entraînement et d'inférence des grands modèles de langage. En s'associant étroitement à NVIDIA, dont les GPU dominent encore largement le marché de l'accélération IA, Google se positionne comme une plateforme de référence pour la prochaine vague, celle des agents autonomes et de la robotique industrielle. La feuille de route annoncée, avec la transition de Blackwell vers Vera Rubin, suggère que la cadence d'innovation s'accélère et que les entreprises devront adapter leur infrastructure régulièrement pour rester compétitives.

UELe déploiement souverain de Gemini sur Google Distributed Cloud avec chiffrement des données en cours d'utilisation répond aux exigences RGPD des entreprises européennes traitant des données sensibles.

InfrastructureOpinion
1 source
Meta formerait des agents IA en surveillant les souris et claviers de ses employés
1070Ars Technica AI 

Meta formerait des agents IA en surveillant les souris et claviers de ses employés

Meta va commencer à collecter les mouvements de souris, clics et frappes clavier de ses employés américains pour entraîner ses futurs agents d'intelligence artificielle. L'initiative, baptisée Model Capability Initiative, a été annoncée en interne via des mémos publiés par l'équipe Meta Superintelligence Labs et révélée par Reuters. Le logiciel de suivi fonctionnera sur des applications et sites web professionnels spécifiques, et prendra également des captures d'écran périodiques pour fournir du contexte aux données d'entraînement. Selon le mémo interne, "c'est là où tous les employés de Meta peuvent aider nos modèles à s'améliorer simplement en faisant leur travail quotidien." Cette approche vise à produire des données d'entraînement de haute qualité pour les agents IA, c'est-à-dire des systèmes capables d'accomplir des tâches complexes de manière autonome sur un ordinateur. Reproduire fidèlement les comportements humains réels dans des environnements de travail concrets est un défi majeur pour ce type d'IA, et les données synthétiques ou publiques ne suffisent plus. En utilisant le travail quotidien de milliers d'employés comme source de données, Meta espère accélérer le développement d'agents capables de naviguer dans des interfaces réelles. Cette initiative s'inscrit dans une course effrénée entre les grandes entreprises technologiques pour développer des agents IA performants, un marché que Microsoft, Google et OpenAI ciblent également activement. La question de la surveillance des employés à des fins commerciales soulève néanmoins des questions éthiques et juridiques, notamment en matière de consentement et de vie privée au travail. Il reste à voir si Meta étendra ce programme à ses employés hors des États-Unis, où les réglementations comme le RGPD européen imposent des contraintes bien plus strictes.

UELe RGPD impose un consentement explicite pour la collecte de données comportementales des employés, rendant une extension de ce programme aux salariés européens de Meta juridiquement très complexe, voire impossible sans refonte du dispositif.

ÉthiqueActu
1 source
Démonstration Qwen 3.6-35B-A3B : inférence multimodale, raisonnement, appel d'outils, MoE, RAG et persistance de session
1071MarkTechPost 

Démonstration Qwen 3.6-35B-A3B : inférence multimodale, raisonnement, appel d'outils, MoE, RAG et persistance de session

Alibaba a publié Qwen 3.6-35B-A3B, un modèle de langage multimodal à architecture MoE (Mixture of Experts) de 35 milliards de paramètres, dont seulement 3,6 milliards sont activés par inférence. Un tutoriel complet, publié en avril 2026, détaille comment déployer ce modèle de bout en bout dans un environnement Google Colab équipé d'un GPU A100 ou L4. L'implémentation couvre un spectre large de fonctionnalités : inférence multimodale avec traitement d'images, contrôle du budget de raisonnement, génération en streaming avec séparation des traces de réflexion et des réponses finales, appel d'outils externes, génération JSON structurée, inspection du routage MoE, benchmarking, génération augmentée par récupération (RAG) et persistance de session. Le code charge le modèle de manière adaptative selon la VRAM disponible : en précision complète bfloat16 au-delà de 75 Go, en quantification int8 entre 40 et 75 Go, et en int4 en dessous, réduisant ainsi les besoins matériels d'un modèle qui pèse environ 70 Go à télécharger. Ce type d'implémentation représente un tournant concret pour les développeurs et chercheurs qui souhaitent expérimenter avec des modèles de frontier-level sans infrastructure cloud dédiée. La capacité à contrôler explicitement le budget de raisonnement, c'est-à-dire la profondeur de réflexion que le modèle alloue avant de répondre, ouvre des usages précis : réduire la latence pour des tâches simples, ou au contraire laisser le modèle « penser » longuement sur des problèmes complexes de code ou de raisonnement logique. L'intégration native du RAG permet de connecter le modèle à des bases de connaissances externes sans fine-tuning, tandis que la persistance de session autorise des conversations longues et cohérentes sur plusieurs échanges. Pour les équipes produit, cela signifie qu'un prototype d'assistant multimodal capable d'appeler des API, d'analyser des images et de maintenir un contexte conversationnel peut être construit sur une seule machine GPU en quelques heures. Qwen 3.6-35B-A3B s'inscrit dans la série Qwen 3 d'Alibaba Cloud, dont plusieurs variantes ont été publiées en open-source début 2025, positionnant le groupe chinois comme concurrent direct d'OpenAI, Google DeepMind et Meta sur le segment des grands modèles accessibles. L'architecture MoE est au coeur de cette stratégie : en n'activant qu'une fraction des paramètres à chaque inférence, elle permet de combiner la capacité d'un très grand modèle avec un coût de calcul réduit. Le tutoriel en question s'adresse aux praticiens qui veulent dépasser l'usage via API et comprendre les mécanismes internes, notamment le routage des experts, observable directement dans le code fourni. La prochaine étape naturelle pour la communauté sera d'évaluer ces capacités sur des benchmarks standardisés et d'intégrer ces modèles dans des pipelines de production, un domaine où la persistance de session et l'appel d'outils deviennent des critères de sélection aussi importants que les scores académiques.

UELes développeurs et équipes produit européens peuvent déployer ce modèle open-source de niveau frontier sur une seule machine GPU, réduisant la dépendance aux APIs cloud propriétaires pour des prototypes multimodaux.

LLMsTuto
1 source
1072Next INpact 

AI Overviews : Google conteste le taux de 10% d’erreurs, mais en dénombre lui-même… 22%

Le New York Times a mandaté la start-up Oumi pour analyser les AI Overviews de Google, ces résumés générés par IA qui apparaissent en tête des résultats de recherche, à l'aide du benchmark SimpleQA, publié par OpenAI en 2024 et comportant plus de 4 000 questions à réponses vérifiables. Deux séries de tests ont été conduites : une première en octobre 2025 avec le modèle Gemini 2, une seconde en février 2026 après migration vers Gemini 3, sur un corpus identique de 4 326 recherches Google. Résultat : Gemini 2 répondait correctement dans 85 % des cas, Gemini 3 dans 91 %. Mais le NYT souligne un autre problème : plus de la moitié des réponses correctes de Gemini 3 sont « non étayées », c'est-à-dire qu'elles renvoient vers des sources qui ne confirment pas entièrement l'information fournie, un taux qui a bondi de 37 % à 56 % entre octobre et février, soit une hausse de 50 %. Google a contesté ces chiffres, jugeant que SimpleQA, conçu par un concurrent direct, constitue un benchmark biaisé. Le problème dépasse la simple question de précision technique. Google traite plus de cinq mille milliards de recherches par an, ce qui signifie, selon le calcul du NYT, que des dizaines de millions de réponses erronées sont distribuées chaque heure. À cette échelle, une marge d'erreur de 9 % se traduit par des centaines de milliers d'inexactitudes par minute, diffusées à des utilisateurs qui, selon une étude citée dans l'article, ne vérifient pas les réponses fournies par les IA dans 92 % des cas. La mention « L'IA peut se tromper » affichée en petits caractères sous chaque résumé apparaît donc largement insuffisante face à l'ampleur du phénomène. Le paradoxe central de cette affaire est que Google, en contestant le benchmark d'OpenAI, a mis en avant son propre outil de mesure, révisé pour être, selon ses termes, « plus précis ». Or cet outil interne aboutit à un taux d'erreur supérieur à 20 %, soit le double du chiffre que Google cherchait à réfuter. La situation illustre la tension structurelle à laquelle font face les grands moteurs de recherche : intégrer des LLMs pour rester compétitifs face à ChatGPT et Perplexity, tout en assumant une responsabilité éditoriale sur des milliards de réponses quotidiennes. Gemini 3 progresse en précision brute, mais dégrade simultanément la traçabilité des sources, un compromis qui soulève des questions durables sur la fiabilité des interfaces IA comme point d'entrée unique vers l'information.

UELes utilisateurs européens de Google Search sont directement exposés à ces taux d'erreur élevés, soulevant des questions de transparence et de responsabilité éditoriale dans le cadre des obligations de l'AI Act.

SociétéActu
1 source
1073MIT Technology Review 

The Download : l'état de l'IA et la protection des ours par drones

Le rapport annuel Stanford AI Index 2026, publié cette semaine, dresse un état des lieux chiffré de l'intelligence artificielle mondiale et confirme une réalité fracturée. Parmi ses données les plus frappantes : 73 % des experts américains estiment que l'IA a un impact positif sur l'emploi, contre seulement 23 % du grand public. Cet écart se retrouve dans les domaines de la santé et de l'économie. Par ailleurs, un homme du Texas a été inculpé pour tentative de meurtre sur la personne de Sam Altman, PDG d'OpenAI, après avoir lancé un cocktail Molotov sur sa résidence vendredi dernier. Le suspect aurait détenu une liste d'autres dirigeants de l'industrie de l'IA. Dans le même temps, un mémo interne leaked révèle qu'OpenAI planifie une offensive directe contre son concurrent Anthropic, tout en accusant Microsoft d'avoir "limité sa capacité" à atteindre ses clients, et en cultivant une alliance naissante avec Amazon. Ces développements illustrent les tensions profondes qui traversent l'écosystème IA. Le fossé entre experts et grand public n'est pas anodin : ceux qui utilisent l'IA au quotidien pour le code et les tâches techniques la voient à son meilleur, tandis que le reste de la population fait face à une expérience bien plus inégale. Ce décalage de perception alimente des débats politiques et sociaux mal calibrés. Sur le front compétitif, la rivalité entre grands laboratoires s'intensifie à un moment critique : les meilleurs agents IA n'accomplissent encore que la moitié des tâches complexes qu'un expert humain avec un doctorat peut réaliser, selon une étude publiée dans Nature. L'IA commence néanmoins à transformer les mathématiques en prouvant de nouveaux résultats à un rythme soutenu, et trouve des failles logicielles plus vite qu'elles ne peuvent être corrigées, ce qui représente un risque réel d'exploitation par des hackers. Le rapport Stanford s'inscrit dans un contexte où la rivalité sino-américaine en matière d'IA s'accélère et où les percées de modèles se succèdent plus vite que les capacités de régulation. Les inscriptions en informatique aux États-Unis chutent massivement, une tendance attribuée en partie à la dévaluation perçue du diplôme face aux outils de codage automatisés. Meta s'apprête quant à elle à dépasser Google en revenus publicitaires en 2026, devenant ainsi la première plateforme mondiale de publicité numérique, signe du repositionnement des géants tech autour de l'IA. L'index Stanford rappelle que derrière les annonces spectaculaires, la technologie évolue plus vite que les institutions, les entreprises et les individus ne peuvent s'y adapter.

UELe rapport Stanford AI Index 2026 met en évidence un fossé de perception entre experts et grand public sur l'impact de l'IA sur l'emploi, un enjeu central pour les politiques européennes de régulation et d'adaptation au marché du travail.

SociétéActu
1 source
1074Le Big Data 

Nvidia vs Meta : qui contrôle vraiment l’IA en 2026 ?

En 2026, deux géants se livrent une bataille ouverte pour le contrôle de l'infrastructure de l'intelligence artificielle mondiale. D'un côté, Nvidia capte entre 80 et 90 % du marché des GPU pour centres de données, enchaînant les trimestres records grâce à une demande pour ses puces Blackwell qui dépasse toutes les prévisions. De l'autre, Meta, dirigé par Mark Zuckerberg, a décidé de rompre sa dépendance à ce fournisseur unique en annonçant jusqu'à 135 milliards de dollars d'investissements en capital pour 2026, dont un contrat historique de 6 gigawatts de puces AMD. Le marché mondial de l'IA générative devrait franchir 100 milliards de dollars d'ici fin 2026, porté par une adoption professionnelle massive : près de 80 % des entreprises prévoient d'intégrer des API d'IA ou de déployer des modèles personnalisés dans leurs processus. Les revenus issus des applications mobiles boostées à l'IA devraient doubler entre 2024 et 2026, avec une répartition géographique marquée : 37,3 milliards de dollars pour les États-Unis (+60 %), 14,7 milliards pour la Chine (+72 %), et une projection de 20 milliards pour la France à horizon 2030. L'enjeu dépasse la simple guerre commerciale entre deux entreprises. Ce que Meta cherche à construire, c'est une souveraineté technologique sur sa propre pile IA, de l'infrastructure physique jusqu'aux modèles. Tant que Nvidia reste le passage obligé pour tout acteur sérieux de l'IA, le géant de Menlo Park reste exposé à des pénuries, des hausses de prix et des délais de livraison qu'il ne contrôle pas. La diversification vers AMD n'est pas un choix technique anodin : c'est un signal politique adressé à toute l'industrie. En parallèle, les joueurs grand public risquent de subir les conséquences de cette course aux serveurs IA, Nvidia orientant clairement sa production vers les centres de données au détriment du segment gaming. La véritable forteresse de Nvidia ne réside pas dans ses puces mais dans son écosystème logiciel CUDA, standard industriel dominant depuis plus de quinze ans, que la concurrence peine à détrôner malgré des investissements considérables. L'architecture Rubin, attendue en succession des Blackwell, devrait creuser encore l'écart en termes de performances brutes. Meta n'est pas seul dans cette tentative de diversification : Google avec ses TPU, Amazon avec ses Trainium, et Microsoft via ses investissements dans OpenAI cherchent tous à réduire leur exposition à un seul fournisseur. La question qui structure désormais toute la filière est celle des infrastructures : les réseaux électriques, les capacités de refroidissement et les chaînes d'approvisionnement en semi-conducteurs peuvent-ils absorber une demande qui double tous les dix-huit mois ? C'est sur ce terrain physique, autant que logiciel, que se jouera la prochaine phase de la course à l'IA.

UELes entreprises européennes restent structurellement dépendantes de l'écosystème Nvidia/CUDA pour leurs projets IA, rendant leur accès à l'infrastructure coûteux et soumis aux arbitrages de production d'acteurs hors UE.

InfrastructureOpinion
1 source
1075AWS ML Blog 

AWS Agent Registry : la gestion des agents à grande échelle désormais en prévisualisation

Amazon Web Services a lancé en preview l'AWS Agent Registry, une nouvelle fonctionnalité intégrée à sa plateforme Amazon Bedrock AgentCore, conçue pour permettre aux entreprises de découvrir, partager et réutiliser leurs agents IA à grande échelle. Disponible dès maintenant via la console AgentCore, les SDK AWS et une API dédiée, le registre centralise les métadonnées de chaque agent, outil, serveur MCP, compétence d'agent ou ressource personnalisée sous forme de fiches structurées. Chaque entrée documente l'auteur, les protocoles supportés, les capacités exposées et les modalités d'invocation. Le registre prend en charge nativement les standards ouverts MCP (Model Context Protocol) et A2A, et peut indexer des agents hébergés n'importe où : sur AWS, chez d'autres fournisseurs cloud ou dans des environnements on-premises. Il est également accessible comme serveur MCP, ce qui le rend interrogeable directement depuis des clients compatibles comme Kiro ou Claude Code. L'enjeu est considérable pour les entreprises qui opèrent des centaines ou des milliers d'agents simultanément. Sans registre central, trois problèmes se cumulent : l'invisibilité (personne ne sait ce qui existe), l'absence de gouvernance (n'importe qui peut publier n'importe quoi), et la duplication (plusieurs équipes reconstruisent les mêmes capacités en parallèle). AWS Agent Registry répond à ces trois défis en un seul endroit. La recherche hybride combine correspondance par mots-clés et compréhension sémantique : une requête sur "traitement de paiements" remonte ainsi des outils étiquetés "facturation" ou "invoicing", même s'ils portent des noms différents. Pour les organisations avec des fournisseurs d'identité tiers, un accès basé sur OAuth permet aux équipes de construire leurs propres interfaces de découverte sans dépendre des credentials IAM d'AWS. Ce lancement s'inscrit dans une tendance de fond : l'industrialisation des architectures multi-agents, où les organisations ne déploient plus un ou deux agents expérimentaux mais des écosystèmes entiers interconnectés. AWS positionne AgentCore comme la couche d'infrastructure universelle pour ces systèmes, indépendante du modèle, du framework ou du fournisseur cloud. Le registre est la pièce manquante qui transforme une collection d'agents dispersés en un actif organisationnel géré, versionné et auditable. La roadmap annoncée prévoit des workflows d'approbation pour la publication, des capacités de monitoring en production et des mécanismes de retrait des agents obsolètes. Dans un secteur où OpenAI, Google et Microsoft développent leurs propres orchestrateurs d'agents, AWS mise sur l'ouverture et l'interopérabilité comme différenciateurs pour conquérir les grandes entreprises déjà ancrées dans des architectures hybrides.

UELes entreprises européennes déployant des agents IA sur AWS peuvent désormais centraliser leur gouvernance et audit, facilitant la conformité aux exigences de traçabilité de l'AI Act.

InfrastructureOpinion
1 source
Amazon Nova 2 Sonic : créer des podcasts conversationnels en temps réel
1076AWS ML Blog 

Amazon Nova 2 Sonic : créer des podcasts conversationnels en temps réel

Amazon a lancé Nova Sonic 2, un modèle de compréhension et de génération vocale intégré à sa plateforme Bedrock, capable de produire des conversations audio naturelles en temps réel avec une latence très faible. Le modèle prend en charge sept langues dont le français, l'allemand, l'espagnol et l'hindi, et dispose d'une fenêtre de contexte pouvant atteindre un million de tokens. Nova Sonic 2 offre une API de streaming pour les conversations multi-tours, avec des capacités d'instruction complexe, d'appel d'outils externes et de bascule fluide entre voix et texte. Amazon illustre ses usages avec un générateur de podcasts automatisé : deux hôtes IA conversent en temps réel sur n'importe quel sujet, sans intervention humaine, depuis la recherche jusqu'à la diffusion audio finale. L'enjeu est direct pour les créateurs de contenu et les organisations médias. Produire un podcast traditionnel mobilise studio, matériel, talents vocaux, montage et coordination de planning, des contraintes qui limitent la cadence de publication et le volume de sujets couverts. Nova Sonic 2 supprime la plupart de ces frictions : pas de conflits d'agenda, pas d'irrégularités liées à la disponibilité humaine, et une personnalisation potentielle en temps réel selon le profil de l'auditeur. Pour les entreprises qui cherchent à déployer du contenu audio à grande échelle, formation interne, support client vocal, newsletters audio, le rapport coût-performance revendiqué par Amazon représente un changement structurel dans l'économie de la production audio. Le marché du podcast a connu une croissance explosive ces dernières années, porté par son avantage d'accessibilité unique : il se consomme en faisant autre chose, là où le contenu visuel exige l'attention totale. Plusieurs acteurs technologiques cherchent à capter cette dynamique avec de l'IA générative vocale. OpenAI avec ses voix dans ChatGPT, Google avec NotebookLM Audio Overviews, qui génère déjà des podcasts synthétiques à partir de documents, et ElevenLabs avec ses outils de clonage vocal se positionnent sur ce segment. Amazon entre dans la compétition avec l'avantage de l'intégration native à Bedrock, ses Guardrails de sécurité, ses Agents et ses bases de connaissances, ce qui facilite l'adoption en entreprise. La prochaine étape logique sera la personnalisation dynamique du contenu par auditeur, un terrain encore peu défriché mais que Nova Sonic 2, avec sa fenêtre de contexte d'un million de tokens, semble techniquement en mesure d'adresser.

UELe support natif du français et l'intégration à AWS Bedrock facilitent l'adoption par les médias et entreprises européennes souhaitant automatiser leur production audio.

OutilsOpinion
1 source
ChatGPT, Gemini, Claude… Pika donne un visage (et une voix) à toutes vos IA !
1077Le Big Data 

ChatGPT, Gemini, Claude… Pika donne un visage (et une voix) à toutes vos IA !

Pika Labs a lancé le 2 avril 2026 PikaStream 1.0, un modèle temps réel qui transforme n'importe quel agent IA -- ChatGPT, Claude, Gemini ou autre -- en interlocuteur visible et vocal dans une visioconférence. Concrètement, l'outil permet à un agent IA de rejoindre une réunion Google Meet sous forme d'avatar animé, avec une voix clonée en quelques secondes d'enregistrement. Le tarif annoncé est de 0,20 dollar la minute d'utilisation. Le module principal, pikastream-video-meeting, est distribué en open source sur GitHub dans le cadre d'une initiative plus large baptisée Pika Skills, un ensemble de briques modulaires destinées à étendre les capacités des agents IA. L'intégration ne requiert pas de configuration complexe : il suffit de partager un lien de réunion pour que l'agent prenne le relais. Ce que PikaStream change fondamentalement, c'est le passage de l'IA textuelle à l'IA incarnée. Jusqu'ici, interagir avec un modèle comme Claude ou Gemini restait confiné à une interface de chat, parfois augmentée de la voix, mais sans présence visuelle. PikaStream franchit ce cap en dotant l'agent d'un avatar cohérent avec l'identité de l'utilisateur ou de son entreprise, d'une voix personnalisée et d'une mémoire persistante des échanges passés. L'agent sait avec qui il travaille, ce qui a déjà été discuté, et maintient une personnalité stable d'une réunion à l'autre. Il peut aussi agir en direct pendant l'appel -- chercher un document, rédiger un compte rendu, mettre à jour un outil de gestion de projet ou envoyer un e-mail -- sans interrompre la conversation. Pour les équipes distribuées, cela ouvre la possibilité de déléguer les réunions de routine à un agent, réduisant la fatigue liée aux appels vidéo répétitifs. La sortie de PikaStream s'inscrit dans une course plus large entre les acteurs de l'IA à rendre leurs modèles physiquement présents dans les workflows professionnels. Des projets comme Microsoft Copilot ou les agents vocaux d'OpenAI explorent des territoires proches, mais PikaStream se distingue par son approche ouverte et son interopérabilité explicite avec les agents existants, quelle que soit leur origine. Le choix de l'open source est stratégique : en laissant les développeurs adapter et enrichir le module, Pika Labs mise sur une adoption rapide dans les environnements techniques, là où les solutions fermées butent souvent sur des résistances d'intégration. Les questions éthiques restent cependant ouvertes -- cloner une voix et un visage pour qu'une IA parle en votre nom en réunion soulève des enjeux de consentement, d'authenticité et de responsabilité qui n'ont pas encore de réponse réglementaire claire. La prochaine étape probable sera l'intégration avec d'autres plateformes de visioconférence comme Zoom ou Microsoft Teams.

UELa technologie de clonage vocal et d'avatar IA soulève des enjeux de consentement et d'authenticité non encadrés par l'AI Act européen, dont les dispositions sur les systèmes d'identification biométrique pourraient s'appliquer à ce type d'usage professionnel.

OutilsOutil
1 source
TensorWave peut-il dépasser l'avantage concurrentiel de Nvidia ?
1078The Information AI 

TensorWave peut-il dépasser l'avantage concurrentiel de Nvidia ?

Nick Tatarchuk, fondateur de la startup TensorWave, a organisé mercredi à San Francisco un événement intitulé Beyond Summit, anciennement appelé Beyond CUDA. Ce changement de nom n'est pas anodin : l'édition précédente, tenue à San Jose en 2025 lors de la conférence GTC de Nvidia, avait attiré des centaines de participants désireux de discuter des alternatives au logiciel de Nvidia. Cette année, des sponsors et participants potentiels ont exprimé des réticences à s'associer à un événement aussi explicitement positionné contre le géant des puces. Tatarchuk lui-même reconnaît cette pression, d'autant que sa salle habituelle à San Jose avait été réservée pour plusieurs années... par Nvidia. L'événement réunit des startups qui développent des compilateurs, des noyaux et des couches d'optimisation pour concurrencer l'écosystème logiciel de Nvidia, dont plusieurs ont figuré dans les classements Top 50 Startups de 2024 et 2025. L'enjeu central est CUDA, la plateforme logicielle de Nvidia considérée comme son véritable fossé concurrentiel : elle simplifie radicalement l'utilisation du matériel Nvidia pour l'entraînement et l'inférence de modèles d'IA. Mais ce monopole commence à se fissurer. OpenAI et Meta ont récemment annoncé des accords importants avec AMD, rival direct de Nvidia, pour utiliser ses puces dans leurs infrastructures d'IA. Tatarchuk affirme que des laboratoires d'IA commencent désormais à réaliser des entraînements à grande échelle sur du matériel AMD, une pratique qui était à peine évoquée publiquement il y a encore peu. Pour la première fois depuis des années, des clients seraient prêts à envisager sérieusement des alternatives à CUDA, estime-t-il : "Il y a tellement d'entreprises sophistiquées qui n'ont pas besoin de CUDA." Ce mouvement s'inscrit dans un contexte de transformation profonde de l'industrie du calcul pour l'IA. La domination de Nvidia, dont les GPU représentent l'essentiel du marché de l'entraînement des grands modèles, est contestée à la fois par des fabricants de puces alternatifs et par un écosystème logiciel naissant. En parallèle, une autre initiative illustre l'effervescence du secteur : à l'université Stanford, un cours universitaire de premier cycle sur l'infrastructure IA est devenu un événement majeur, surnommé le "Compute Coachella". Le cours, complet, réunit cette semaine Jensen Huang (Nvidia), Lisa Su (AMD), Sam Altman (OpenAI), Satya Nadella (Microsoft) et Andrej Karpathy comme intervenants. Il est enseigné par Anjney Midha, ancien associé d'Andreessen Horowitz et investisseur précoce d'Anthropic, et Michael Abbott, ancien responsable ingénierie chez Apple, tous deux impliqués dans AMP, une initiative visant à faciliter l'accès aux ressources de calcul pour les entreprises.

UEL'émergence d'alternatives viables à CUDA pourrait à terme réduire la dépendance des entreprises et laboratoires européens envers Nvidia pour leurs infrastructures d'entraînement IA.

InfrastructureActu
1 source
Les IA sycophantes peuvent corrompre même les penseurs rationnels idéaux, prouvent des chercheurs
1079The Decoder 

Les IA sycophantes peuvent corrompre même les penseurs rationnels idéaux, prouvent des chercheurs

Des chercheurs du MIT et de l'Université de Washington ont publié une étude démontrant formellement qu'un chatbot IA trop complaisant peut conduire même des utilisateurs parfaitement rationnels vers des spirales de pensée déformée. Les auteurs ont modélisé mathématiquement le comportement d'agents bayésiens idéaux, c'est-à-dire des raisonneurs théoriquement irréprochables, et ont montré que la flatterie systématique d'un système IA suffit à biaiser leurs croyances de manière durable. L'étude souligne que ni l'éducation des utilisateurs ni le déploiement de bots de vérification des faits ne constituent des remèdes suffisants contre ce phénomène. Si même un raisonneur idéal peut être piégé, cela signifie que le problème n'est pas cognitif mais structurel : il est inscrit dans la dynamique de l'interaction entre un humain et un système conçu pour approuver plutôt que corriger. Pour les millions d'utilisateurs qui consultent des assistants IA au quotidien, pour des décisions médicales, financières ou politiques, ce résultat a des implications directes sur la fiabilité de ces outils. La sycophanie des modèles de langage est un sujet de préoccupation croissant dans la communauté de l'IA. Les grands modèles comme GPT-4 ou Claude ont tendance à valider les positions exprimées par l'utilisateur plutôt qu'à les contredire, un comportement renforcé par les méthodes d'entraînement par feedback humain. Cette étude apporte une preuve formelle à ce qui était jusqu'ici surtout observé empiriquement, augmentant la pression sur les laboratoires comme OpenAI, Anthropic ou Google pour traiter ce biais comme un risque de sécurité à part entière.

UECette preuve formelle renforce les arguments pour intégrer la sycophanie comme critère de risque dans le cadre réglementaire de l'AI Act européen, qui exige des évaluations de sécurité pour les modèles à usage général.

SécuritéOpinion
1 source
On a testé Perplexity Computer : c’est révolutionnaire, mais ça coute cher
108001net 

On a testé Perplexity Computer : c’est révolutionnaire, mais ça coute cher

Perplexity a lancé Perplexity Computer, un agent IA capable de prendre le contrôle d'un PC Windows pour exécuter des tâches complexes de façon autonome, sans intervention humaine. Pour évaluer ses capacités réelles, les testeurs ont tenté une expérience concrète : créer intégralement une boutique Shopify en laissant l'IA tout faire, de la configuration initiale à la mise en ligne des produits. Le résultat est mitigé : l'outil est techniquement impressionnant, mais les coûts d'utilisation s'envolent rapidement, bien avant que le projet ne soit abouti. L'enjeu est significatif pour quiconque envisage de déléguer des tâches administratives ou e-commerce à une IA. Perplexity Computer représente une nouvelle génération d'agents dits "computer use", capables de naviguer dans des interfaces graphiques, remplir des formulaires et enchaîner des actions comme le ferait un humain. Mais le modèle économique repose sur un usage à la session ou au crédit, ce qui rend les opérations longues et répétitives particulièrement onéreuses pour des résultats encore incomplets. Cette publication s'inscrit dans une course intense entre Anthropic, OpenAI et désormais Perplexity pour imposer des agents capables d'automatiser le travail sur ordinateur. Anthropic a son propre "computer use" via Claude, Microsoft intègre Copilot dans Windows, et OpenAI pousse ses Operators. Perplexity, connu pour son moteur de recherche génératif, cherche à élargir son positionnement bien au-delà de la simple réponse aux requêtes. La question centrale reste la même pour tous : à quel prix l'automatisation devient-elle vraiment rentable ?

💬 Le "computer use", ça fait deux ans qu'on attend que ça soit vraiment utilisable, et le test Shopify est exactement le bon filtre : si l'IA ne finit pas la tâche et que la note s'emballe avant, le modèle économique est cassé. Pas la techno, le modèle. Facturer à la session des tâches qui peuvent durer des heures, c'est juste pas viable pour des workflows réels. Reste à voir qui va trouver la bonne structure tarifaire en premier, parce que la course est lancée.

OutilsOutil
1 source
Transcription, voix, image : Microsoft déploie ses modèles maison dans Foundry
1081Blog du Modérateur 

Transcription, voix, image : Microsoft déploie ses modèles maison dans Foundry

Microsoft a intégré trois nouveaux modèles propriétaires à sa plateforme Azure AI Foundry : un modèle de transcription audio, un modèle de synthèse vocale et un modèle de traitement d'image. Ces outils, développés en interne par les équipes de recherche de la firme de Redmond, sont désormais disponibles pour les développeurs et entreprises via l'interface Foundry, la plateforme centralisée de Microsoft pour déployer et tester des modèles d'IA. Cette initiative marque une étape significative dans la stratégie de diversification de Microsoft, qui cherche à réduire sa dépendance technologique à l'égard d'OpenAI, son partenaire de référence depuis l'investissement massif de 13 milliards de dollars. En proposant ses propres modèles spécialisés sur des tâches précises comme la transcription ou la reconnaissance visuelle, Microsoft offre aux entreprises clientes des alternatives intégrées à l'écosystème Azure, potentiellement moins coûteuses et plus facilement personnalisables. Cette évolution s'inscrit dans une tendance de fond : les grandes plateformes cloud cherchent toutes à maîtriser leur chaîne de valeur IA de bout en bout. Google avec Gemini, Amazon avec Titan et Nova, et désormais Microsoft avec ses modèles maison renforcent chacun leurs capacités propriétaires, réduisant le pouvoir de négociation des fournisseurs tiers et consolidant leur emprise sur les entreprises qui bâtissent sur leur infrastructure.

UELes entreprises européennes sur Azure AI Foundry disposent désormais de modèles propriétaires Microsoft pour la transcription, la synthèse vocale et l'image, comme alternatives intégrées aux solutions OpenAI.

OutilsOutil
1 source
Passer de ChatGPT à Gemini sans repartir de zéro
1082ZDNET AI 

Passer de ChatGPT à Gemini sans repartir de zéro

Google a lancé une fonctionnalité permettant aux utilisateurs de ChatGPT de migrer leur historique de conversations, leurs préférences et leurs souvenirs personnalisés directement vers Gemini, sans repartir de zéro. Concrètement, la procédure passe par les paramètres de Gemini, où une option d'importation permet de connecter son compte OpenAI et de transférer les données stockées, y compris les instructions personnalisées et les mémos que l'assistant avait mémorisés au fil du temps. Ce type de portabilité représente un changement significatif dans la manière dont les assistants IA cherchent à fidéliser ou à attirer des utilisateurs. Jusqu'ici, changer d'outil signifiait tout réapprendre à son assistant : habitudes de travail, ton préféré, contexte professionnel. En supprimant ce frein, Google abaisse concrètement le coût du changement pour les millions d'utilisateurs de ChatGPT, notamment les abonnés Plus qui ont construit une base de mémoire sur plusieurs mois. La bataille pour la rétention des utilisateurs d'IA s'intensifie alors qu'OpenAI, Google et Anthropic se disputent les mêmes professionnels et créateurs. Google avait déjà intégré Gemini dans Workspace, mais la portabilité des données personnalisées constitue un argument nouveau. Cette fonctionnalité pourrait aussi pousser OpenAI à proposer des options d'export plus complètes, et alimenter le débat réglementaire autour de l'interopérabilité des données entre plateformes d'IA.

UELa portabilité des données entre plateformes d'IA s'inscrit dans les débats réglementaires européens sur l'interopérabilité, notamment dans le cadre du Digital Markets Act et de l'AI Act.

💬 Google qui joue la carte de la portabilité, c'est un coup bien pensé. Ça fait des mois qu'on sait que la vraie valeur d'un assistant, c'est pas le modèle, c'est tout ce qu'on lui a appris sur nous. Reste à voir si les souvenirs importés survivent vraiment au transfert, ou si c'est juste un argument marketing pour faire parler d'un Gemini qui peine encore à convaincre sans béquilles.

OutilsOutil
1 source
Améliorer la qualité et la robustesse des systèmes de synthèse vocale basés sur les LLM
1083Amazon Science 

Améliorer la qualité et la robustesse des systèmes de synthèse vocale basés sur les LLM

Les chercheurs d'Amazon ont publié le 1er avril 2026 une série d'avancées techniques destinées à résoudre trois problèmes persistants dans les systèmes de synthèse vocale basés sur des grands modèles de langage (LLM) : la fuite d'accent en mode polyglotte, le manque d'expressivité, et les défaillances de fiabilité. Pour corriger la fuite d'accent — phénomène où la voix clonée d'un locuteur anglophone garde un accent étranger en passant au français ou à l'allemand — l'équipe a appliqué une technique d'adaptation à faible rang (LoRA) pour affiner leurs modèles sur des données fortement pondérées vers les langues cibles. Pour l'expressivité, ils ont eu recours au guidage sans classifieur (CFG), une méthode issue des modèles de diffusion, pour générer des échantillons audio de référence synthétiques plus expressifs, utilisés ensuite comme conditionnement à l'inférence. Les résultats, mesurés selon le protocole d'écoute MUSHRA, montrent une amélioration de 5 % à 20 % sur neuf paramètres régionaux couvrant l'anglais, le français, l'italien, l'allemand et l'espagnol, par rapport à la génération de modèles précédente. Ces améliorations ont des implications concrètes pour tous les acteurs qui déploient des assistants vocaux, des systèmes de navigation, ou des outils d'accessibilité à l'échelle internationale. La possibilité de cloner une voix enregistrée dans une seule langue et de la déployer nativement dans plusieurs autres — sans perte d'identité vocale ni accent résiduel — réduit drastiquement les coûts de production de contenu audio multilingue. Le troisième axe de travail, la fiabilité, s'attaque à un défaut structurel des LLM : leur génération autorégressive, token par token, sans modélisation explicite de la durée, provoque des répétitions hallucinées, des coupures inattendues et des prononciations incohérentes. Amazon indique travailler sur ce point, bien que les détails techniques associés n'aient pas encore été entièrement divulgués. La synthèse vocale neuronale a franchi un cap majeur ces deux dernières années avec l'émergence de systèmes capables de cloner une voix à partir de quelques secondes d'audio. Des acteurs comme ElevenLabs, OpenAI avec sa voix Vox, ou encore Microsoft ont largement popularisé cette technologie, mais la barrière multilingue reste un point faible commun. Amazon, via ses divisions Alexa et AWS Polly, a un intérêt commercial direct à résoudre ce problème à grande échelle pour ses marchés européens et latino-américains. L'approche LoRA pour le fine-tuning ciblé par locale permet de mutualiser un modèle de base tout en l'adaptant à faible coût — une architecture qui pourrait devenir standard dans le secteur. Les prochaines étapes probables incluent l'extension à des langues à tons comme le mandarin ou le japonais, où la fuite d'accent pose des défis encore plus complexes.

UELes améliorations du clonage vocal multilingue (français, allemand, italien, espagnol) réduisent directement les coûts de production audio pour les entreprises et services européens déployant des assistants vocaux ou outils d'accessibilité.

💬 La fuite d'accent, c'était le truc qu'on acceptait comme une fatalité dans le clonage vocal multilingue, et ça m'a toujours semblé être un problème évitable. Amazon montre que LoRA + un dataset bien pesé règle une bonne partie du problème, et les +5 à 20 % sur MUSHRA, tu peux pas ignorer ça. Le volet fiabilité reste flou (les hallucinations audio, c'est un vrai sujet en prod), mais sur la partie multilingue, ils livrent enfin du concret.

RecherchePaper
1 source
Coup dur pour Android Auto, ChatGPT est maintenant disponible sur CarPlay
1084Presse-citron 

Coup dur pour Android Auto, ChatGPT est maintenant disponible sur CarPlay

Avec la mise à jour iOS 26.4, Apple ouvre CarPlay à ChatGPT, permettant aux conducteurs d'interagir avec l'assistant d'OpenAI directement depuis l'interface de leur véhicule. C'est une première : jusqu'ici, CarPlay restait fermé aux assistants IA tiers, Siri conservant le monopole de la voix dans l'écosystème Apple en voiture. Apple annonce également que d'autres chatbots IA pourront à terme intégrer CarPlay, ouvrant la plateforme à une concurrence inédite. Pour les utilisateurs, cela signifie un accès mains-libres à un assistant bien plus capable que Siri pour des tâches complexes — rédiger un message, répondre à une question technique, naviguer dans une conversation — sans sortir le téléphone. Pour Android Auto, qui n'a pas encore annoncé d'équivalent, c'est un signal de retard compétitif potentiellement significatif sur ce segment du quotidien connecté. Cette ouverture s'inscrit dans la stratégie d'Apple d'intégrer progressivement l'IA générative à son écosystème depuis le lancement d'Apple Intelligence en 2024, en partenariat avec OpenAI pour combler les lacunes de Siri. En élargissant CarPlay à d'autres IA à venir — Google Gemini, Claude ou d'autres — Apple transforme sa plateforme automobile en marketplace d'assistants, tout en gardant la maîtrise de l'environnement matériel et de l'expérience utilisateur.

UELes utilisateurs iPhone en France et dans l'UE disposant d'un véhicule compatible CarPlay peuvent accéder à ChatGPT en mains libres dès iOS 26.4.

💬 Apple qui ouvre CarPlay à ChatGPT, c'est le genre de truc que Siri méritait depuis longtemps, sauf que c'est pas Siri qui en profite. La vraie nouvelle c'est l'ouverture de la plateforme à d'autres IA à venir, Google, Claude, etc., Apple transforme CarPlay en terrain de jeu plutôt qu'en forteresse. Android Auto a du boulot.

OutilsOutil
1 source
Amazon Nova Act accélère la livraison logicielle grâce à l'automatisation des tests par agents
1085AWS ML Blog 

Amazon Nova Act accélère la livraison logicielle grâce à l'automatisation des tests par agents

Amazon a lancé Nova Act, un service AWS conçu pour automatiser les tests d'assurance qualité (QA) dans les pipelines de livraison logicielle. Contrairement aux frameworks traditionnels qui s'appuient sur des sélecteurs CSS, des identifiants d'éléments ou des références structurelles pour naviguer dans les interfaces, Nova Act utilise un modèle de compréhension visuelle et le langage naturel — exactement comme le ferait un utilisateur humain. La solution s'accompagne de QA Studio, une interface de référence incluant un frontend web, une API et une CLI, construite sur une infrastructure serverless AWS. Les équipes peuvent y créer des suites de tests via un assistant de parcours utilisateur, déclencher des exécutions à la demande, les planifier ou les intégrer directement dans leurs pipelines CI/CD. L'ensemble s'appuie sur Amazon Bedrock AgentCore Browser pour la prévisualisation en direct et AWS Secrets Manager pour la saisie sécurisée des données sensibles. L'enjeu est considérable pour les équipes produit et engineering. Dans les organisations actuelles, les critères d'acceptance sont définis par les product managers en langage métier, implémentés par les développeurs, puis retranscrits en code d'automatisation — souvent par ces mêmes développeurs. Ce fossé entre ceux qui comprennent les besoins utilisateurs et ceux qui maintiennent les tests crée une dette technique permanente : chaque refactoring d'interface ou ajustement de layout casse des dizaines de tests, même quand les fonctionnalités restent intactes. Nova Act supprime ce goulot d'étranglement en permettant à n'importe quel membre de l'équipe — y compris des non-développeurs — de rédiger et maintenir des tests en langage naturel. Quand un designer déplace un bouton ou qu'un développeur restructure un composant React, les tests s'adaptent automatiquement sans intervention manuelle. Cette annonce s'inscrit dans une course plus large des grands fournisseurs cloud à proposer des agents capables d'interagir avec des interfaces graphiques. OpenAI avec Operator, Anthropic avec Computer Use, et désormais AWS avec Nova Act ciblent tous le même marché : remplacer les scripts d'automatisation fragiles par des agents visuels autonomes. Pour AWS, l'intégration native dans l'écosystème Bedrock et les services managés représente un avantage compétitif face aux solutions standalone. Le marché du test logiciel automatisé pèse plusieurs milliards de dollars et souffre d'un taux d'échec élevé des projets d'automatisation traditionnels — souvent abandonnés après quelques mois faute de ressources pour maintenir les scripts. Si Nova Act tient ses promesses de résilience aux changements UI, il pourrait redistribuer significativement les cartes dans ce secteur et accélérer l'adoption de l'approche "shift-left" où les tests sont écrits dès la définition des exigences.

UELes équipes engineering européennes utilisant AWS peuvent intégrer Nova Act dans leurs pipelines CI/CD, mais aucun impact réglementaire ou institutionnel direct sur la France ou l'UE.

OutilsOutil
1 source
Google dévoile la révolution TurboQuant sans partager le code : un développeur seul le recrée en 7 jours grâce à l’IA
1086Frandroid 

Google dévoile la révolution TurboQuant sans partager le code : un développeur seul le recrée en 7 jours grâce à l’IA

Google a présenté TurboQuant, une méthode de quantification avancée capable de réduire drastiquement l'empreinte mémoire des grands modèles de langage, sans dévoiler le code source. Face à cette rétention, un développeur indépendant a décidé d'agir seul : en sept jours seulement, en s'appuyant sur l'assistant IA Claude d'Anthropic, il a réimplémenté la technique à partir des seules informations disponibles dans l'article scientifique de Google. Le résultat est fonctionnel et permet de faire tourner des modèles de plusieurs dizaines de milliards de paramètres sur un MacBook Air standard. Cet exploit illustre un changement de paradigme majeur dans l'accès à l'IA. Jusqu'ici, les modèles les plus puissants exigeaient des GPU professionnels avec des dizaines de gigaoctets de VRAM, réservant leur usage aux entreprises ou aux chercheurs disposant d'infrastructure lourde. TurboQuant contourne cette contrainte en compressant les poids des modèles avec une précision inédite, préservant les performances tout en divisant l'occupation mémoire. Si la méthode se généralise, elle pourrait démocratiser l'inférence locale pour des millions d'utilisateurs. La situation s'inscrit dans une tension croissante entre les laboratoires qui publient des recherches sans ouvrir le code — pratique de plus en plus courante chez Google, OpenAI ou Anthropic — et une communauté open source réactive, capable de combler les lacunes à vitesse record. Ce cas rappelle celui de llama.cpp ou d'autres réimplémentations communautaires qui ont précédé des publications officielles. La prochaine étape sera d'intégrer cette technique dans des outils grand public comme Ollama ou LM Studio, accélérant encore la course vers l'IA locale accessible à tous.

LLMsPaper
1 source
Les succès d'Anthropic provoquent une pénurie de serveurs
1087The Information AI 

Les succès d'Anthropic provoquent une pénurie de serveurs

Anthropic a plus que doublé son chiffre d'affaires annualisé pour atteindre 19 milliards de dollars sur les deux premiers mois de 2025, porté par l'essor de ses outils de codage automatisé. Cette croissance fulgurante rapproche l'entreprise de son rival OpenAI, longtemps dominant. Mais dans un billet de blog non publié rendu public par erreur, Anthropic a révélé les coulisses de son prochain modèle phare, Claude Mythos : un modèle "large et gourmand en calcul", décrit comme "très coûteux à servir" et "très coûteux pour les clients". L'entreprise a précisé qu'elle devrait le rendre "bien plus efficace avant tout lancement grand public". Ce succès commercial s'accompagne d'une tension croissante sur les infrastructures. Plus Anthropic attire d'utilisateurs et de revenus, plus elle enregistre de problèmes de fiabilité — la disponibilité de Claude pour ses clients se dégrade, la capacité de ses serveurs ne parvenant pas à suivre la demande. Pour les entreprises qui intègrent Claude dans des workflows critiques, notamment de développement logiciel, ces interruptions de service représentent un risque opérationnel réel. Et si Claude Mythos s'avère trop coûteux à déployer à grande échelle, cela pourrait freiner l'adoption du modèle ou contraindre Anthropic à des arbitrages difficiles entre performance et accessibilité. Anthropic se retrouve ainsi face au paradoxe classique de la croissance rapide dans le secteur de l'IA : plus le produit séduit, plus les besoins en infrastructure explosent, et plus les coûts de calcul pèsent sur les marges. OpenAI a traversé des défis similaires lors de l'essor de ChatGPT en 2023. Pour Anthropic, qui reste dépendant d'investissements massifs — notamment d'Amazon et Google — la capacité à scaler ses serveurs tout en maîtrisant les coûts de ses modèles les plus puissants sera déterminante pour consolider sa position face à une concurrence qui ne ralentit pas.

UELes entreprises européennes intégrant Claude dans des workflows critiques sont exposées à des risques d'interruption de service et d'incertitude tarifaire liés aux tensions infrastructurelles d'Anthropic.

BusinessOpinion
1 source
Apple change de cap : Siri va regrouper ChatGPT, Gemini et toutes les IA !
1088Le Big Data 

Apple change de cap : Siri va regrouper ChatGPT, Gemini et toutes les IA !

Apple prépare une transformation majeure de Siri avec iOS 27, prévu pour l'été 2026. Selon Mark Gurman, journaliste de Bloomberg et source fiable sur Apple depuis des années, l'entreprise développerait un système d'extensions permettant à n'importe quel chatbot disponible sur l'App Store de s'interfacer directement avec Siri. Concrètement, des assistants comme Claude d'Anthropic, Google Gemini ou d'autres IA tierces pourraient être sollicités via Siri comme intermédiaire : l'utilisateur précise quel modèle utiliser, et Siri relaie la requête. Cette ouverture marquerait la fin de l'exclusivité dont bénéficie actuellement ChatGPT d'OpenAI, intégré depuis iOS 18. Apple travaille depuis 2024 sur cette version refondue, parfois appelée Siri 2.0, qui inclurait également une application Siri dédiée, une interface repensée dans la Dynamic Island, et une fusion avec Spotlight Search. Pour les utilisateurs, l'impact serait considérable : Siri deviendrait un hub centralisé capable de mobiliser des dizaines de modèles spécialisés selon la tâche — analyse de documents, génération de contenu, planification, code. Plus besoin de jongler entre applications : un seul point d'entrée vocal donnerait accès à l'ensemble de l'écosystème IA disponible sur iPhone et iPad. Pour Apple, l'enjeu financier est tout aussi important : la firme prélèverait une commission sur les abonnements souscrits via l'App Store pour accéder aux IA tierces, transformant Siri en levier de monétisation de l'explosion des assistants intelligents. Cette stratégie permettrait à Apple de rivaliser directement avec Amazon Alexa, Microsoft Copilot et Meta AI, sans avoir à développer elle-même des modèles de pointe. Ce pivot s'inscrit dans un contexte délicat pour Apple sur le terrain de l'IA. L'entreprise a accumulé du retard face à Google, Microsoft et OpenAI, et Siri a longtemps été moqué pour ses limitations face à des concurrents bien plus capables. Le partenariat avec OpenAI, annoncé à la WWDC 2024, était une première réponse, mais insuffisante pour couvrir l'ensemble des usages. L'ouverture à tous les chatbots via un modèle d'extensions — similaire à ce qu'Apple a fait avec les widgets ou les extensions de clavier — serait une façon de contourner le problème sans avoir à choisir un seul gagnant. Des questions réglementaires se poseront inévitablement : l'acheminement de données personnelles vers de multiples fournisseurs d'IA soulève des enjeux de confidentialité que les autorités européennes notamment scruteront de près. Apple devra démontrer que cette ouverture reste compatible avec ses engagements en matière de protection des données, un pilier central de son image de marque.

UEL'acheminement de données personnelles vers de multiples fournisseurs d'IA via Siri soulève des questions de conformité RGPD que la CNIL et les autorités européennes devront examiner.

OutilsOpinion
1 source
Adieu Safari sur l’iPhone : on l’a remplacé par Comet, le navigateur IA de Perplexity
108901net 

Adieu Safari sur l’iPhone : on l’a remplacé par Comet, le navigateur IA de Perplexity

Perplexity a lancé Comet, son navigateur dopé à l'intelligence artificielle, sur iPhone, étendant ainsi une offre jusqu'ici réservée aux ordinateurs de bureau. Le navigateur intègre directement le moteur de recherche conversationnel de Perplexity au cœur de l'expérience de navigation, permettant de poser des questions sur n'importe quelle page web sans quitter le navigateur ni ouvrir un onglet séparé. L'enjeu est de taille : Comet cible directement Safari, le navigateur par défaut d'Apple qui domine massivement l'usage sur iPhone. En proposant une alternative où l'IA répond aux questions contextuelles en temps réel, Perplexity parie que les utilisateurs sont prêts à abandonner un outil qu'ils n'ont jamais vraiment choisi. Sur mobile, la promesse prend un sens particulier : chercher de l'information en déplacement est un cas d'usage quotidien pour des centaines de millions de personnes. Perplexity s'inscrit dans une course plus large où plusieurs acteurs — dont OpenAI avec son propre navigateur annoncé, et Google avec Chrome intégrant Gemini — tentent de faire du navigateur le nouveau point d'entrée de l'IA générative. Pour la startup valorisée à plusieurs milliards de dollars, conquérir l'iPhone représente un test grandeur nature de sa capacité à s'imposer face aux géants déjà installés sur ce territoire.

💬 Perplexity joue gros avec Comet sur iPhone : Safari n'est pas juste un navigateur, c'est un réflexe conditionné chez des centaines de millions d'utilisateurs. La vraie question n'est pas si l'IA dans le navigateur est utile (elle l'est), c'est si les gens vont changer une habitude aussi ancrée pour ça. Reste à voir si c'est suffisant face à Google qui pousse Gemini dans Chrome et OpenAI qui arrive aussi sur ce terrain.

OutilsOutil
1 source
Gemini facilite le passage depuis ChatGPT : voici comment
1090ZDNET AI 

Gemini facilite le passage depuis ChatGPT : voici comment

Google a annoncé que Gemini permet désormais aux utilisateurs d'importer leurs souvenirs, leur historique de conversations et leurs préférences depuis d'autres assistants IA comme ChatGPT. Cette fonctionnalité de migration, déployée en 2026, vise à éliminer l'un des principaux freins au changement de plateforme : la perte de tout le contexte accumulé avec un assistant au fil du temps. Concrètement, un utilisateur de ChatGPT qui a configuré ses préférences, alimenté sa mémoire personnalisée et accumulé des mois d'historique peut basculer vers Gemini sans repartir de zéro. C'est un changement significatif dans l'expérience utilisateur : jusqu'ici, changer d'assistant IA ressemblait à changer de téléphone sans pouvoir transférer ses données — une friction délibérée qui fidélisait les utilisateurs malgré eux. Cette initiative s'inscrit dans une guerre d'acquisition d'utilisateurs qui s'intensifie entre Google et OpenAI. Alors que ChatGPT reste le leader avec plusieurs centaines de millions d'utilisateurs actifs, Google mise sur l'intégration profonde de Gemini dans son écosystème (Android, Workspace, Search) et sur ce type de fonctionnalités pour convaincre les indécis de franchir le pas. La portabilité des données IA pourrait devenir un argument compétitif central en 2026, voire un terrain de régulation à venir.

UELa portabilité des données entre assistants IA pourrait devenir un terrain réglementaire en Europe, dans le cadre du DMA ou d'extensions futures de l'AI Act visant à garantir l'interopérabilité des plateformes numériques.

OutilsOutil
1 source
Actualité : Claude est encore en panne, un mois noir pour Anthropic
1091Les Numériques IA 

Actualité : Claude est encore en panne, un mois noir pour Anthropic

Le service Claude d'Anthropic traverse une période de turbulences inédite : depuis plusieurs semaines, l'assistant IA enchaîne les pannes à un rythme préoccupant. Le 27 mars 2026, une nouvelle interruption de service touche le modèle Opus 4.6, s'ajoutant à une série d'incidents techniques et d'attaques par déni de service distribué (DDoS) qui ont perturbé l'accès à la plateforme pour des milliers d'utilisateurs et d'entreprises dans le monde. Ces défaillances répétées posent un problème concret pour les équipes et développeurs qui ont intégré Claude dans leurs workflows professionnels. Contrairement à une panne isolée, une succession d'interruptions sur un mois fragilise la confiance des entreprises clientes, notamment celles ayant souscrit à des abonnements API ou à des offres Teams et Enterprise. Pour des usages critiques — rédaction automatisée, support client, analyse de données — chaque indisponibilité se traduit directement en perte de productivité et en remise en question des choix d'infrastructure IA. Anthropic, valorisée à plusieurs dizaines de milliards de dollars après ses dernières levées de fonds, est en pleine montée en charge pour faire face à une demande explosive depuis le lancement de ses modèles Claude 4. Cette croissance rapide met à l'épreuve la robustesse de ses infrastructures, dans un secteur où OpenAI et Google DeepMind investissent massivement dans la résilience de leurs services. La récurrence des incidents soulève des questions sur la capacité d'Anthropic à industrialiser son infrastructure au même rythme que sa croissance commerciale — un défi structurel pour l'ensemble des acteurs de l'IA générative.

UELes entreprises et développeurs européens ayant intégré l'API Claude dans des workflows critiques subissent directement ces interruptions répétées, les poussant à reconsidérer leur dépendance à cette infrastructure.

InfrastructureOpinion
1 source
Google publie Gemini 2.0 Flash Live : un modèle vocal multimodal en temps réel pour agents IA
1092MarkTechPost 

Google publie Gemini 2.0 Flash Live : un modèle vocal multimodal en temps réel pour agents IA

Google a lancé Gemini 3.1 Flash Live en préversion pour les développeurs via la Gemini Live API dans Google AI Studio. Ce nouveau modèle se positionne comme le « modèle audio et vocal de la plus haute qualité » jamais produit par Google, capable de traiter en temps réel des flux multimodaux combinant voix, vidéo et appels d'outils. Concrètement, il accepte de l'audio PCM 16 bits à 16 kHz, renvoie de l'audio PCM natif sans passer par une synthèse vocale séparée, et peut ingérer des flux vidéo à environ une image par seconde. Sur le benchmark ComplexFuncBench Audio, qui mesure la capacité à enchaîner des appels de fonctions complexes à partir de la seule voix, le modèle atteint un score de 90,8 %. Il obtient également 36,1 % sur l'Audio MultiChallenge, un test mesurant la résistance aux interruptions et aux environnements bruités, thème central pour les cas d'usage réels. Ce lancement s'attaque à un problème structurel qui plombait jusque-là les assistants vocaux : la « pile d'attente », enchaînement séquentiel de la détection d'activité vocale, de la transcription, de la génération de texte et de la synthèse vocale. Gemini 3.1 Flash Live court-circuite cette chaîne en traitant l'acoustique directement, sans transcrire au préalable. Le modèle gère mieux la prosodie — ton, débit, hésitations — que son prédécesseur Gemini 2.5 Flash Native Audio, et discrimine la parole pertinente des bruits ambiants comme la circulation ou le brouhaha d'un bureau. L'interface de programmation repose sur un protocole WebSocket bidirectionnel et persistant, permettant la continuité de session, la synchronisation audio-transcription en un seul événement serveur, et le « barge-in » : l'utilisateur peut couper la parole à l'IA en plein milieu d'une phrase, et le modèle interrompt immédiatement sa génération pour traiter le nouvel énoncé. Une fenêtre de contexte de 128 000 tokens supporte la mémoire de session et les définitions d'outils. Ce modèle arrive dans un contexte de compétition intense entre Google, OpenAI et les startups spécialisées dans la voix temps réel. OpenAI avait ouvert la voie avec son mode vocal avancé dans GPT-4o, mais la fiabilité en environnements dégradés restait un talon d'Achille pour l'ensemble de l'industrie. Google mise ici sur la robustesse au bruit et sur l'inférence agentique — la capacité à raisonner et à exécuter des tâches complexes (retrouver des factures, envoyer des e-mails sous conditions) sans passer par un intermédiaire textuel. Pour les développeurs qui construisent des agents d'assistance client, des interfaces mobiles ou des outils professionnels à commande vocale, cette combinaison de faible latence, de multimodalité native et de raisonnement structuré représente un changement de catégorie. Les prochaines étapes attendues concernent la sortie en disponibilité générale et l'intégration dans l'écosystème Vertex AI pour les entreprises.

UELes développeurs européens peuvent accéder dès maintenant à l'API en préversion via Google AI Studio pour construire des agents vocaux, sans impact réglementaire ou institutionnel spécifique à la France/UE.

LLMsActu
1 source
Tout le monde se fait berner par les flatteries de l'IA, selon une étude
1093Sciences et Avenir Tech 

Tout le monde se fait berner par les flatteries de l'IA, selon une étude

Une étude récente révèle que les grands modèles de langage — dont ChatGPT, Gemini et DeepSeek — approuvent des comportements problématiques ou carrément dangereux dans 47 % des cas testés. Ce phénomène, désigné sous le terme de « sycophantie », désigne la tendance des IA à valider les propos de l'utilisateur plutôt qu'à le corriger, même lorsque ce dernier exprime des idées fausses, risquées ou moralement douteuses. L'enjeu est loin d'être anodin : lorsqu'un utilisateur cherche une confirmation dans une décision médicale, financière ou légale, une IA qui acquiesce par défaut devient un vecteur de désinformation. Ce biais flatteur peut renforcer des croyances erronées, encourager des prises de risque et éroder la capacité critique des utilisateurs qui font confiance à ces outils au quotidien — y compris des professionnels. Ce problème est inhérent à la façon dont ces modèles sont entraînés : le renforcement par feedback humain (RLHF) pousse les IA à maximiser l'approbation immédiate des utilisateurs, ce qui favorise mécaniquement les réponses agréables plutôt que les réponses exactes. OpenAI, Google et d'autres acteurs ont reconnu ce défaut et travaillent à des correctifs, mais l'équilibre entre utilité perçue et fiabilité reste un défi technique et éthique central du développement actuel des IA génératives.

UELes professionnels européens (santé, finance, droit) utilisant ces modèles au quotidien sont exposés au même risque de désinformation par validation automatique de leurs décisions.

SécuritéActu
1 source
IA pratique : cessez de confier vos secrets aux services d’IA
1094ZDNET FR 

IA pratique : cessez de confier vos secrets aux services d’IA

OpenAI, Google, Microsoft et d'autres géants du cloud proposent des services d'intelligence artificielle capables d'analyser des documents, rédiger des emails et automatiser des tâches complexes — mais à quel prix pour la confidentialité ? Chaque texte soumis à ces plateformes transite par des serveurs distants, où il peut être stocké, analysé par des ingénieurs pour améliorer les modèles, ou exposé lors de violations de données. Des entreprises comme Samsung ont déjà subi des fuites après que des employés ont collé du code source propriétaire dans ChatGPT, illustrant concrètement ce risque souvent sous-estimé. Pour les professionnels manipulant des données sensibles — contrats juridiques, dossiers médicaux, informations financières ou secrets industriels — utiliser des services d'IA cloud sans précautions revient à confier ses dossiers à un tiers inconnu. Les conditions d'utilisation de la plupart des plateformes autorisent explicitement l'usage des données soumises pour entraîner ou améliorer leurs modèles, sauf opt-out explicite. Les risques sont amplifiés dans les secteurs régulés : une fuite peut entraîner des sanctions RGPD pouvant atteindre 4 % du chiffre d'affaires annuel mondial, voire engager la responsabilité pénale. Des alternatives existent : déploiement de modèles en local via des outils comme Ollama ou LM Studio, utilisation d'offres cloud avec garanties de confidentialité renforcées (Azure OpenAI avec data residency, Mistral AI en souverain européen), ou anonymisation systématique avant soumission. La montée en puissance des modèles locaux performants — Llama 3, Mistral, Gemma — rend désormais viables ces approches pour de nombreux cas d'usage professionnels, réduisant la dépendance aux services cloud tout en préservant la confidentialité des données critiques.

UELes entreprises françaises et européennes sont directement exposées aux sanctions RGPD (jusqu'à 4 % du CA mondial) en cas de fuite de données via des services IA cloud, et peuvent se tourner vers Mistral AI comme alternative souveraine européenne.

SécuritéOpinion
1 source
1095Wired AI 

Le "Mode Adulte" de ChatGPT pourrait ouvrir une nouvelle ère de surveillance intime

OpenAI prévoit d'autoriser des conversations à caractère sexuel avec ChatGPT via un "mode adulte". Selon un expert en interaction humain-IA, cette fonctionnalité pourrait représenter un cauchemar pour la vie privée des utilisateurs. Cette évolution risque d'ouvrir une nouvelle ère de surveillance intime à grande échelle.

UELe RGPD et l'AI Act imposent des contraintes strictes sur le traitement de données intimes, ce mode pourrait forcer une mise en conformité ou un blocage du service dans l'UE.

ÉthiqueOpinion
1 source
NemoClaw, analyse et prise en main de la « prison » pour sécuriser les agents IA
1096Next INpact 

NemoClaw, analyse et prise en main de la « prison » pour sécuriser les agents IA

NVIDIA a annoncé NemoClaw lors de la GTC, un projet open source en version alpha conçu pour sécuriser les agents IA, notamment OpenClaw. NemoClaw propose un environnement avec des garde-fous de confidentialité et de sécurité, donnant aux utilisateurs le contrôle sur le comportement de leurs agents et la gestion de leurs données. OpenClaw, anciennement Clawdbot/Moltbot, est un agent IA open source développé par Peter Steinberger (désormais chez OpenAI) permettant d'accéder à des données personnelles pour agir comme assistant virtuel.

OutilsOpinion
1 source
[AINews] Bulletin Claude Cowork : la réponse d'Anthropic à OpenClaw
1097Latent Space 

[AINews] Bulletin Claude Cowork : la réponse d'Anthropic à OpenClaw

Anthropic a lancé Claude Cowork, une réponse directe à OpenClaw qui est saluée favorablement par des personnalités comme Simon Willison et Ethan Mollick. OpenAI a simultanément déployé GPT-5.4 mini et nano, des modèles compacts 2x plus rapides que GPT-5 mini, avec une fenêtre de contexte de 400k tokens et ciblant le code, les agents et l'utilisation multimodale — mais à des prix plus élevés (0,75 $/M tokens en entrée pour mini). L'infrastructure agentique s'impose comme le nouveau centre de gravité du secteur, avec une course aux sandbox sécurisés, à l'orchestration et aux outils de déploiement au-delà des seuls modèles de base.

LLMsActu
1 source
Trustpilot s'associe à des entreprises d'IA face au déclin de la recherche traditionnelle
1098AI News 

Trustpilot s'associe à des entreprises d'IA face au déclin de la recherche traditionnelle

Trustpilot s'associe avec de grandes entreprises e-commerce pour valoriser ses données d'avis auprès des agents IA, alors que les clics provenant des recherches basées sur l'IA ont bondi de 1 490 % en un an. Le PDG Adrian Blair vise une marge opérationnelle de 30 % d'ici 2030, portée en partie par l'utilisation de son contenu par les LLMs — Trustpilot était le 5e domaine le plus cité dans ChatGPT en janvier 2026. Dans ce contexte, Amazon, Walmart, Shopify et Microsoft multiplient les partenariats avec OpenAI, Google et PayPal pour permettre des transactions directement depuis les interfaces d'IA comme Gemini ou Copilot.

UETrustpilot, entreprise cotée à Londres, se positionne comme source de données fiables pour les LLMs, ce qui pourrait renforcer son influence sur le marché européen des avis en ligne face aux géants américains.

BusinessOpinion
1 source
Comment une IA associé à un labo automatisé accélère la recherche biologique
1099Le Big Data 

Comment une IA associé à un labo automatisé accélère la recherche biologique

Des chercheurs d'OpenAI et de Ginkgo Bioworks ont combiné une IA (GPT-5) avec un laboratoire automatisé pour accélérer la recherche biologique. En utilisant la technique de synthèse protéique acellulaire (CFPS), l'IA a conçu des expériences, analysé les résultats et ajusté ses approches en environ une heure par itération, démontrant ainsi la capacité de l'IA à formuler des hypothèses et à mener des expériences dans le domaine complexe de la biologie.

RecherchePaper
1 source
MCP (Model Context Protocol) : expliqué simplement
1100Towards AI 

MCP (Model Context Protocol) : expliqué simplement

Le MCP (Model Context Protocol) est un standard ouvert publié par Anthropic en novembre 2024 qui permet aux modèles d'IA de se connecter à des outils externes — fichiers, bases de données, calendriers, Slack — sans code personnalisé pour chaque intégration. Avant MCP, connecter 10 modèles IA à 20 outils nécessitait 200 intégrations séparées ; MCP réduit cela à 30 (10 + 20), chaque outil n'étant construit qu'une seule fois. En moins d'un an, ce standard a été adopté par OpenAI, Google DeepMind et la quasi-totalité des acteurs majeurs de l'IA, un consensus rarissime dans l'industrie.

UEL'adoption universelle du MCP profite directement aux acteurs européens comme Mistral AI, qui peuvent désormais connecter leurs modèles à l'ensemble de l'écosystème d'outils existants sans développement d'intégrations propriétaires.

OutilsTuto
1 source