Aller au contenu principal

Dossier OpenAI — page 27

1884 articles · page 27 sur 38

Toute l'actualité d'OpenAI : nouvelles versions de ChatGPT et GPT, stratégie produit, partenariats, controverses et décisions de Sam Altman.

Les 16 meilleurs outils IA génératives pour le code en 2026 : comparatif et cas d'usage
1301MarkTechPost OutilsOutil

Les 16 meilleurs outils IA génératives pour le code en 2026 : comparatif et cas d'usage

En 2026, les outils de génération de code alimentés par l'intelligence artificielle ont profondément transformé la manière dont les développeurs construisent des logiciels. Ce qui n'était, il y a quelques années, qu'un simple système d'autocomplétion ligne par ligne est devenu une infrastructure capable de générer des applications entières, des pipelines multi-agents et des interfaces en langage naturel pour des bases de code complexes. Parmi les seize outils recensés cette année, plusieurs se démarquent nettement. Atoms se positionne comme une plateforme qui transforme une description en langage naturel en application déployable complète, avec frontend, backend, base de données, authentification et paiements Stripe intégrés via Atoms Cloud. Son mode Race Mode permet de faire tourner plusieurs modèles ou équipes d'agents en parallèle sur le même prompt pour comparer les résultats. GitHub Copilot, développé par GitHub et OpenAI, reste l'assistant le plus utilisé avec ses suggestions en temps réel dans VS Code, Visual Studio et JetBrains, désormais enrichies de modes agents pour les modifications multi-fichiers. Tabnine mise sur la confidentialité en permettant aux équipes de faire tourner les modèles sur leur propre infrastructure. Replit offre un environnement de développement cloud complet avec déploiement intégré, tandis que Warp modernise le terminal en traduisant le langage naturel en commandes shell exécutables. L'impact de ces outils est concret et immédiat pour les ingénieurs logiciels, les data scientists et les développeurs indépendants. Ils réduisent drastiquement le temps de prototypage, éliminent les tâches répétitives d'infrastructure et abaissent la barrière d'entrée pour lancer des produits numériques. Des plateformes comme Atoms ou Replit permettent aujourd'hui de passer d'une idée à une application fonctionnelle en quelques heures sans configuration locale, ce qui modifie structurellement les coûts de développement et la vitesse de mise sur le marché pour les startups comme pour les grandes entreprises. Hugging Face, de son côté, reste une ressource centrale pour les équipes qui souhaitent s'appuyer sur des modèles open source pour l'autocomplétion, la refactorisation ou l'explication de code, sans dépendre de solutions propriétaires. Ce mouvement s'inscrit dans une évolution rapide du marché depuis l'émergence des grands modèles de langage entraînés sur du code, notamment GPT-4, Gemini et les modèles spécialisés comme StarCoder. La concurrence s'est intensifiée entre solutions propriétaires et open source, entre outils intégrés à l'éditeur et plateformes autonomes de génération d'applications. Les enjeux portent désormais sur la confidentialité des données, la qualité du code produit, l'intégration dans les workflows existants et la capacité à gérer des projets de grande envergure. La prochaine phase d'évolution semble pointer vers des agents capables de gérer l'intégralité du cycle de vie logiciel, de la conception à la maintenance, avec une intervention humaine réduite à la validation.

UEHugging Face, entreprise française, est identifiée comme ressource centrale pour les équipes souhaitant s'appuyer sur des modèles open source sans dépendance aux solutions propriétaires américaines.

1 source
Pourquoi Canva ne considere pas ChatGPT et Claude comme une menace
1302The Information AI 

Pourquoi Canva ne considere pas ChatGPT et Claude comme une menace

Canva, la plateforme de design graphique valorisée à 42 milliards de dollars, affiche une sérénité notable face à l'émergence des outils de design propulsés par l'intelligence artificielle. Alors que des concurrents comme Figma s'inquiètent ouvertement de la menace que représente Claude Design, le nouvel outil lancé par Anthropic, Canva adopte une posture radicalement différente. Anwar Haneef, responsable de l'écosystème chez Canva, décrit explicitement Claude Design comme « un produit complémentaire » plutôt que comme un rival direct. Selon lui, si ces outils IA permettent d'obtenir rapidement une première ébauche, les utilisateurs se heurtent rapidement à leurs limites dès qu'il s'agit d'affiner le résultat, de collaborer en équipe, d'intégrer des ressources graphiques ou d'appliquer une charte de marque. « Claude n'est pas conçu pour ça ; il est conçu pour l'idéation », a-t-il déclaré. Cette position n'est pas qu'une pirouette diplomatique : Canva affirme disposer de données concrètes pour étayer l'idée qu'Anthropic et OpenAI sont des alliés plutôt que des concurrents. L'argument central repose sur la complémentarité des usages : les LLM excellent dans la génération rapide de concepts et de brouillons, tandis que Canva reste indispensable pour la phase d'exécution professionnelle, notamment grâce à ses fonctionnalités collaboratives, ses bibliothèques d'assets et ses outils de gestion de marque. Pour les équipes marketing et communication, ce sont deux étapes distinctes d'un même flux de travail. Cette divergence d'appréciation du risque entre Canva et Figma illustre une tension plus large dans l'industrie tech. De nombreuses entreprises qui s'appuient sur les modèles d'Anthropic ou d'OpenAI pour construire leurs propres applications craignent que ces fournisseurs de modèles ne finissent par les court-circuiter en lançant des produits concurrents directement intégrés. La stratégie de Canva consiste à parier sur la complexité des workflows professionnels comme rempart naturel contre la désintermédiation, une logique qui sera mise à l'épreuve à mesure que les capacités des agents IA s'élargissent.

BusinessOpinion
1 source
Les investissements en IA s'accélèrent : Deepseek prépare une levée record et Core Automation quadruple sa valorisation en quelques semaines
1303The Decoder 

Les investissements en IA s'accélèrent : Deepseek prépare une levée record et Core Automation quadruple sa valorisation en quelques semaines

Deepseek prépare une levée de fonds pouvant atteindre 7,35 milliards de dollars, ce qui en ferait la plus grande opération jamais réalisée par une entreprise d'IA chinoise. Ce tour de table devrait accompagner le lancement de Deepseek V4.1, prévu pour juin 2026. En parallèle, Core Automation, une startup fondée il y a seulement six semaines par Jerry Tworek, ex-chercheur d'OpenAI, vise déjà une valorisation de 4 milliards de dollars, soit un quadruplement en quelques semaines à peine depuis sa création. Ces deux opérations illustrent l'appétit intact des investisseurs pour l'IA, malgré les interrogations persistantes sur la rentabilité du secteur. Pour Deepseek, ce financement représente un tournant stratégique: l'entreprise chinoise, connue pour avoir sorti des modèles très compétitifs à moindre coût, cherche désormais les ressources nécessaires pour rivaliser à grande échelle avec OpenAI et Google. Pour Core Automation, une valorisation à 4 milliards en moins de deux mois signale que les fondateurs issus des grands labos IA peuvent lever des capitaux considérables avant même d'avoir un produit abouti. Ce contexte s'inscrit dans une course aux financements qui s'est accélérée depuis début 2025, portée par la multiplication des applications d'agents IA autonomes. Le fait que Tworek, qui a travaillé sur Codex chez OpenAI, soit déjà à la tête d'une licorne en gestation reflète la tendance des chercheurs stars à quitter les grandes structures pour lancer leurs propres projets. Du côté chinois, la montée en puissance de Deepseek nourrit les inquiétudes occidentales sur le leadership technologique face à un écosystème IA qui se finance désormais à des niveaux comparables à la Silicon Valley.

UELa montée en puissance financière de Deepseek intensifie la pression concurrentielle sur l'écosystème IA européen, qui peine à mobiliser des financements comparables pour ses propres champions.

💬 Deepseek, c'était la startup frugale qui humiliait les labos américains à moindre coût. La voilà qui prépare la plus grosse levée jamais faite par une boîte IA chinoise, parce que la frugalité a ses limites quand tu veux vraiment jouer dans la cour d'OpenAI. Et Core Automation, six semaines d'existence, pas de produit, 4 milliards de valorisation : le marché paye des CV, pas des boîtes.

BusinessOpinion
1 source
Pourquoi Musk cède les serveurs de xAI à Anthropic ; Reka rachète une startup de génération vidéo
1304The Information AI 

Pourquoi Musk cède les serveurs de xAI à Anthropic ; Reka rachète une startup de génération vidéo

xAI, la société d'intelligence artificielle d'Elon Musk, a annoncé mercredi qu'elle cède à Anthropic une part substantielle de son infrastructure de calcul. Selon Anthropic, le transfert porte sur 300 mégawatts de capacité de serveurs, ce qui représente, d'après xAI, plus de 220 000 puces Nvidia. Il s'agit concrètement du complexe Memphis Colossus, la méga-installation que Musk avait inaugurée en grande pompe il y a plus d'un an. Pour donner une échelle, cette capacité équivaut à environ un sixième de l'ensemble des serveurs qu'OpenAI possédait fin 2025 pour ses produits et ses clusters d'entraînement. Ce transfert révèle un déséquilibre frappant au sein du secteur : OpenAI et Anthropic saturent leurs serveurs en permanence, tandis que xAI se retrouve avec une surcapacité coûteuse et sous-exploitée. Pour SpaceX, actionnaire de xAI et candidate à une introduction en bourse imminente, maintenir des serveurs qui tournent à vide représente un gouffre financier de plusieurs milliards de dollars, susceptible d'attirer une attention critique des investisseurs. Céder cette capacité à Anthropic permet à xAI de monétiser des actifs dormants, tout en offrant à Anthropic une marge de calcul supplémentaire pour absorber une demande en constante hausse. Ce n'est pas la première fois que xAI cherche à externaliser ses capacités excédentaires : la société a récemment conclu un accord similaire avec Cursor, l'assistant de codage IA que SpaceX est en cours d'acquisition. Le complexe Memphis Colossus avait suscité une certaine inquiétude chez les concurrents lors de son lancement, Musk se vantant de la vitesse record à laquelle ses équipes avaient monté l'infrastructure. Mais construire massivement sans que la demande suive expose les entreprises à des charges fixes difficiles à absorber. Ce mouvement de consolidation entre acteurs rivaux de l'IA illustre une nouvelle logique de marché, dans laquelle la puissance de calcul se gère comme une ressource à allouer stratégiquement, parfois au-delà des frontières concurrentielles habituelles.

InfrastructureOpinion
1 source
Procès Musk vs Altman : le témoin censé défendre Musk l’a trahi
1305Le Big Data 

Procès Musk vs Altman : le témoin censé défendre Musk l’a trahi

Lors du procès opposant Elon Musk à Sam Altman, le témoignage de Shivon Zilis, ancienne membre du conseil d'administration d'OpenAI et mère de quatre enfants de Musk, s'est retourné contre celui qu'elle était censée défendre. Appelée à la barre pour étayer la version du milliardaire, Zilis a au contraire fourni des preuves accablantes sur les manœuvres de Musk au sein d'OpenAI. Entre 2017 et 2018, elle servait d'intermédiaire entre Musk, Sam Altman, Greg Brockman et Ilya Sutskever lors des discussions sur la transformation commerciale de l'organisation, consacrant entre 80 et 100 heures par semaine à débloquer les situations difficiles pour le camp Musk. Seule à prendre des notes détaillées lors de ces réunions sensibles, elle a produit des documents qui sont devenus des pièces centrales du dossier. Ces échanges révèlent plusieurs réalités embarrassantes pour Musk. Les courriels montrent qu'OpenAI envisageait des modèles commerciaux bien avant les accusations actuelles du milliardaire, contredisant sa thèse d'une trahison de la mission originale. Plus compromettant encore, les messages exposent les tentatives répétées de Musk pour prendre le contrôle de l'organisation : installation de proches au conseil d'administration, intégration d'OpenAI à Tesla sous diverses formes, projet de créer un méga-laboratoire d'IA chez Tesla en débrachant directement les meilleurs chercheurs d'OpenAI. Zilis apparaît également comme une intermédiaire secrète, informée de décisions cruciales avant même les dirigeants de l'entreprise, notamment la suspension de financements par Musk, dont elle connaissait l'impact psychologique sur l'équipe plusieurs jours avant l'annonce officielle. Son comportement à la barre a renforcé les doutes sur sa neutralité. Zilis a invoqué à plusieurs reprises des trous de mémoire lors du contre-interrogatoire, tout en conservant des souvenirs étonnamment précis sur les points favorables à Musk. Une avocate d'OpenAI a ironisé : "Vos souvenirs perdus depuis longtemps ont été retrouvés." Sa démission du conseil d'administration, présentée comme un geste d'intégrité lorsqu'elle dit avoir appris que Musk préparait une entreprise concurrente, est également remise en cause par un SMS adressé à une amie, dans lequel elle écrivait : "Quand le père de vos enfants se lance dans la compétition et recrute chez OpenAI, il n'y a rien à faire", preuve qu'elle était déjà au courant de la création de xAI. Ce procès illustre les tensions fondatrices entre les ambitions commerciales et la mission à but non lucratif d'OpenAI, un contentieux qui engage aussi l'avenir de la gouvernance des grands laboratoires d'IA.

BusinessActu
1 source
ChatGPT intègre GPT-5.5 Instant : moins d'hallucinations et des réponses plus personnalisées
1306The Decoder 

ChatGPT intègre GPT-5.5 Instant : moins d'hallucinations et des réponses plus personnalisées

OpenAI a commencé à déployer GPT-5.5 Instant comme modèle par défaut de ChatGPT, remplaçant ainsi le modèle précédemment utilisé par des centaines de millions d'utilisateurs. Selon les tests internes de l'entreprise, cette mise à jour produit 52,5 % d'hallucinations en moins sur des sujets à enjeux élevés comme la médecine et le droit. Le déploiement est immédiat pour l'ensemble des utilisateurs, bien que certaines fonctionnalités avancées de personnalisation soient réservées, dans un premier temps, aux abonnés Plus et Pro sur la version web. La réduction des hallucinations sur des domaines sensibles représente un progrès concret pour les professionnels de santé, les juristes et tous ceux qui utilisent ChatGPT comme outil de travail. Une nouvelle fonctionnalité baptisée "memory sources" permet désormais aux utilisateurs de voir précisément quels éléments de contexte mémorisé ont influencé une réponse donnée, apportant une transparence inédite sur le fonctionnement de la personnalisation. La personnalisation basée sur les conversations passées, les fichiers et Gmail marque une intégration plus profonde dans l'écosystème quotidien des utilisateurs. Ce déploiement s'inscrit dans une course effrénée entre les grandes plateformes d'IA générative à améliorer la fiabilité de leurs modèles, point noir persistant depuis l'émergence des LLMs. OpenAI, sous pression concurrentielle d'Anthropic, Google et des acteurs open source, mise sur la personnalisation contextuelle et la réduction des erreurs factuelles pour fidéliser sa base d'utilisateurs. L'intégration Gmail, en particulier, soulève des questions sur la confidentialité des données qui devraient alimenter le débat dans les mois à venir.

UEL'intégration Gmail soulève des questions de conformité GDPR pour les utilisateurs européens, tandis que la réduction des hallucinations dans des domaines sensibles bénéficie aux professionnels français en santé et droit utilisant ChatGPT.

Cursor maintient ses distances avec xAI malgré leur partenariat
1307The Information AI 

Cursor maintient ses distances avec xAI malgré leur partenariat

Malgré une offre de rachat conditionnelle de 60 milliards de dollars soumise par SpaceX le mois dernier, Cursor ne prévoit pas de collaborer avec la division IA de SpaceX, xAI, pour développer de nouveaux modèles de code. Selon une source proche de la stratégie de l'entreprise, la startup spécialisée dans l'assistance au développement logiciel reste concentrée sur l'amélioration de son propre modèle, Composer, qui repose en partie sur le modèle chinois Kimi. Cursor n'a pas non plus l'intention d'orienter ses utilisateurs vers Grok, le modèle d'xAI, lorsqu'ils choisissent quel système d'IA doit alimenter leur expérience de codage. Aujourd'hui, les trois modèles principaux qui propulsent les produits Cursor sont Composer, Claude d'Anthropic et Codex d'OpenAI. Ce positionnement envoie un signal clair sur l'état réel des capacités de Grok en matière de codage. Si Cursor, l'un des outils de développement assisté par IA les plus utilisés au monde, ne juge pas utile d'intégrer Grok dans son offre principale même après une acquisition potentielle par SpaceX, cela suggère que le modèle d'Elon Musk n'est pas encore compétitif face à Claude ou Codex sur cette tâche précise. Pour les développeurs, cela signifie que la qualité des suggestions de code reste liée à Anthropic et OpenAI, deux acteurs extérieurs à l'orbite SpaceX. Le rachat de Cursor par SpaceX, s'il se confirme, serait l'une des acquisitions les plus importantes du secteur IA cette année. Les concurrents de Cursor avaient anticipé une intégration rapide avec xAI, ce qui aurait pu redistribuer les cartes dans la course aux outils de développement. La prudence de Cursor illustre une tension plus large dans l'écosystème IA : les entreprises rachetées par des conglomérats technologiques cherchent à préserver leur indépendance technique et la confiance de leurs utilisateurs, quitte à ignorer les actifs IA du futur acquéreur.

BusinessOpinion
1 source
Sakana AI présente KAME : une architecture vocale en tandem qui intègre les connaissances d'un LLM en temps réel
1308MarkTechPost 

Sakana AI présente KAME : une architecture vocale en tandem qui intègre les connaissances d'un LLM en temps réel

Le laboratoire d'intelligence artificielle tokyoïte Sakana AI a présenté KAME (Knowledge-Access Model Extension), une architecture hybride de traitement vocal conçue pour éliminer le compromis historique entre vitesse et qualité de réponse dans les assistants vocaux. KAME fonctionne comme un système en tandem : un module vocal de première ligne, basé sur l'architecture Moshi de KyutAI, commence à générer une réponse audio en moins de 80 millisecondes, pendant qu'un grand modèle de langage (LLM) tourne en parallèle en arrière-plan. L'innovation centrale est l'ajout d'un quatrième flux de données dit « oracle » dans l'architecture de Moshi, originellement à trois flux. Ce flux reçoit en temps réel les réponses candidates produites par le LLM à partir d'une transcription partielle de la parole de l'utilisateur, et permet au module vocal de corriger sa réponse en cours de génération, comme un humain qui se reprend à mi-phrase. Ce système résout un problème structurel qui freinait le déploiement des assistants vocaux conversationnels. Les modèles directs de type speech-to-speech, rapides à répondre, peinent à intégrer des connaissances factuelles profondes car ils consacrent une grande partie de leur capacité à modéliser les traits paralinguistiques comme le ton ou l'émotion. À l'inverse, les systèmes en cascade, qui font transiter la parole par un LLM via reconnaissance puis synthèse vocale, accusent une latence médiane de 2,1 secondes, suffisante pour rendre la conversation perceptiblement artificielle. KAME offre les deux à la fois : réactivité quasi instantanée et richesse sémantique d'un modèle de langage frontier, ce qui ouvre la voie à des assistants vocaux réellement utilisables dans des contextes professionnels, médicaux ou grand public exigeants. Sakana AI a dû résoudre un défi d'entraînement inédit : aucun jeu de données naturel ne contient de signaux oracle. L'équipe a développé une technique appelée Simulated Oracle Augmentation, utilisant un LLM simulateur pour générer des séquences synthétiques d'oracles à six niveaux de complétude de transcript (de 0 à 5), reproduisant ce qu'un LLM produirait en temps réel. Sakana AI, fondé en 2023 à Tokyo par des anciens de Google DeepMind dont David Ha et Llion Jones, s'est construit une réputation sur les architectures évolutives inspirées de la biologie. KAME s'inscrit dans une course mondiale à la voix naturelle, face à des acteurs comme OpenAI (Advanced Voice Mode) et Google (Project Astra), avec la particularité d'une approche entièrement modulaire permettant de brancher n'importe quel LLM en back-end.

UEL'architecture KAME s'appuie sur Moshi, le modèle vocal conçu par le laboratoire français KyutAI, plaçant la recherche française au cœur d'une innovation mondiale en IA vocale.

RecherchePaper
1 source
Guide pratique : affiner un LLM avec TRL, du supervised fine-tuning au raisonnement DPO et GRPO
1309MarkTechPost 

Guide pratique : affiner un LLM avec TRL, du supervised fine-tuning au raisonnement DPO et GRPO

Un guide complet consacré à l'entraînement post-initialisation des grands modèles de langage vient d'être publié, proposant une progression pédagogique couvrant quatre techniques clés : le réglage fin supervisé (SFT), la modélisation de récompense (RM), l'optimisation directe des préférences (DPO) et l'optimisation de politique par groupe relatif (GRPO). Le tutoriel s'appuie sur la bibliothèque TRL (Transformer Reinforcement Learning), développée et maintenue par Hugging Face, combinée à des outils comme PEFT et LoRA, qui permettent de réduire drastiquement la mémoire nécessaire. Point notable : l'ensemble du pipeline peut tourner sur un GPU T4 de Google Colab, soit environ 15 Go de VRAM, rendant ces techniques accessibles à quiconque dispose d'un compte Google. Le modèle de base utilisé est Qwen2.5-0.5B-Instruct, un modèle léger de 500 millions de paramètres développé par Alibaba, qui sert de point de départ à chacune des quatre étapes d'alignement. Ce guide se distingue par sa complétude : peu de tutoriels enchaînent l'intégralité du pipeline d'alignement, du SFT jusqu'au raisonnement par GRPO, avec du code fonctionnel et des explications progressives. Pour les équipes techniques cherchant à adapter un modèle open-weight à des usages métiers spécifiques, ou à reproduire les techniques d'alignement des grands laboratoires, ce type de ressource pratique est précieux. Le GRPO notamment, popularisé par DeepSeek-R1 en janvier 2025, est désormais intégré nativement dans TRL, ce qui permet d'entraîner des modèles à raisonner par étapes vérifiables sans les coûts prohibitifs d'un pipeline RLHF classique avec modèle de récompense séparé. L'alignement des LLMs s'est imposé comme l'un des sujets centraux de l'IA depuis qu'InstructGPT d'OpenAI a montré qu'un volume relativement faible de données de préférence pouvait radicalement améliorer le comportement d'un modèle. TRL est devenu la référence open source pour implémenter ces méthodes, avec des mises à jour qui intègrent régulièrement les dernières avancées de la recherche. La tendance est aujourd'hui aux approches qui n'exigent pas de modèle de récompense distinct, comme DPO et GRPO, car elles simplifient le pipeline tout en atteignant des résultats comparables. Ce contexte explique l'intérêt croissant pour le fine-tuning de modèles open-weight comme Qwen, Llama ou Mistral, que des startups et des équipes internes cherchent à spécialiser sans dépendre d'API propriétaires.

UEHuggingFace, entreprise française éditrice de la bibliothèque TRL au cœur de ce guide, positionne l'écosystème open source européen comme référence pour l'alignement des LLMs face aux pipelines propriétaires américains.

LLMsTuto
1 source
La couche d'orchestration IA s'effondre : le PDG de LlamaIndex explique ce qui survit
1310VentureBeat AI 

La couche d'orchestration IA s'effondre : le PDG de LlamaIndex explique ce qui survit

La couche d'outillage qui permettait aux développeurs de construire des applications LLM, moteurs d'indexation, pipelines de récupération, boucles d'orchestration d'agents, est en train de s'effondrer. C'est le constat que dresse Jerry Liu, co-fondateur et PDG de LlamaIndex, l'un des principaux frameworks RAG (retrieval-augmented generation) du marché, dans un épisode récent du podcast VentureBeat Beyond the Pilot. Liu reconnaît lui-même que les frameworks comme le sien deviennent moins indispensables : les modèles actuels raisonnent sur de vastes quantités de données non structurées avec une précision croissante, se corrigent d'eux-mêmes, planifient sur plusieurs étapes, et des protocoles comme MCP (Model Context Protocol) permettent désormais aux agents de découvrir et utiliser des outils sans intégrations manuelles. Résultat : environ 95 % du code de LlamaIndex lui-même est aujourd'hui généré par l'IA. "Les ingénieurs n'écrivent plus vraiment de code", dit Liu. "Ils tapent tous en langage naturel." Ce bouleversement redéfinit ce qui constitue un avantage concurrentiel dans l'écosystème IA. Quand la pile technique se simplifie et que les frameworks d'orchestration perdent de leur valeur, ce qui reste est le contexte, la capacité à extraire les bonnes informations depuis les bons formats de fichiers, avec précision et à moindre coût. LlamaIndex mise sur ce créneau via le traitement documentaire agentique par OCR, ciblant les données "enfermées dans des conteneurs de formats de fichiers". Pour Liu, le choix entre OpenAI Codex ou Claude Code importe peu : "ce dont ils ont tous besoin, c'est du contexte." Cette logique pousse aussi les entreprises verticales spécialisées à prendre de l'avance sur les généralistes, car elles maîtrisent mieux les données et les workflows spécifiques à leur secteur. LlamaIndex est né comme un projet expérimental avec initialement seulement 40 % de précision, avant de devenir une référence de l'écosystème RAG. Mais Liu prend soin d'avertir les entreprises contre la tentation de sur-construire : les stacks doivent rester modulaires et agnostiques vis-à-vis des modèles frontière, car chaque nouvelle version de modèle redistribue les cartes. "Vous voulez garder la flexibilité d'en tirer parti", dit-il. La récupération de données a évolué vers un modèle "agent + sandbox", et les bases de code doivent pouvoir être adaptées sans dette technique excessive. Dans ce contexte, la question "construire ou acheter" reste entièrement valide, en particulier pour les workflows complexes que les entreprises SaaS cherchent à standardiser pour des travailleurs du savoir non techniques. La prochaine bataille ne se joue pas sur l'orchestration, mais sur qui contrôle le contexte.

OutilsOutil
1 source
Google Cloud et AWS brillent dans les résultats trimestriels des géants technologiques
1311The Information AI 

Google Cloud et AWS brillent dans les résultats trimestriels des géants technologiques

Google, Microsoft, Amazon et Meta ont simultanément publié leurs résultats du premier trimestre 2026, déclenchant un déluge de chiffres qui a dominé l'actualité financière de la journée. Le constat le plus net qui se dégage de cette publication groupée : la demande en capacité de calcul liée à l'intelligence artificielle continue d'accélérer, et elle tire vers le haut les revenus cloud des trois grands, AWS, Google Cloud et Azure. Amazon a particulièrement brillé, tout comme Google Cloud, avec des croissances qui ont dépassé les attentes des analystes. Andy Jassy, PDG d'Amazon, a résumé l'ambiance en quelques mots : « Ce n'est un secret pour personne que les laboratoires d'IA dépensent des sommes considérables en infrastructure de calcul. » Ce dynamisme a pourtant une face moins reluisante. Une part significative de la demande cloud provient des grands laboratoires d'IA eux-mêmes, Anthropic, OpenAI et leurs équivalents, qui consomment massivement des ressources GPU pour entraîner et faire tourner leurs modèles. Cela signifie que la croissance actuelle du cloud est en partie circulaire : les fournisseurs cloud investissent dans l'IA, et les entreprises d'IA réinjectent ces revenus en achetant encore plus de cloud. Jassy a néanmoins tenu à nuancer le tableau, soulignant qu'une partie non négligeable de la demande émane d'entreprises classiques qui intègrent l'IA dans leurs opérations, ce qui est indispensable si l'on veut que la révolution de l'IA soit économiquement viable à long terme. Sur le front publicitaire, Meta et Google ont également affiché de bons résultats, l'IA améliorant le ciblage et l'efficacité de leurs régies. Ces résultats s'inscrivent dans une séquence d'investissements massifs : les grandes entreprises technologiques ont collectivement annoncé des centaines de milliards de dollars de dépenses en infrastructure IA pour 2025 et 2026. La question qui reste ouverte est celle de la rentabilité de cet écosystème au-delà des hyperscalers eux-mêmes. Si les entreprises ordinaires adoptent l'IA à grande échelle, comme Jassy l'espère, le modèle tient. Dans le cas contraire, la bulle d'investissement repose essentiellement sur une concentration de quelques acteurs qui se financent mutuellement, un équilibre que les prochains trimestres permettront de mieux évaluer.

UEL'essor de la demande cloud tirée par l'IA se répercute indirectement sur les entreprises européennes qui dépendent de ces infrastructures pour déployer leurs propres projets d'IA, sans que l'article n'identifie d'impact direct sur la France ou l'UE.

BusinessActu
1 source
Seedance 2.0 : Le guide complet de la création vidéo multimodale
1312Le Big Data 

Seedance 2.0 : Le guide complet de la création vidéo multimodale

Seedance 2.0 s'impose comme l'un des moteurs de génération vidéo par intelligence artificielle les plus avancés du moment, ciblant aussi bien les monteurs professionnels que les créateurs amateurs. Cette nouvelle version repose sur une architecture de Diffusion Transformers (DiT) enrichie de milliards de paramètres, ce qui permet au modèle de comprendre l'espace, les volumes et le comportement de la lumière sur les matières. La résolution monte jusqu'au 4K grâce à un upscaling intelligent, tandis que la cohérence temporelle entre les plans, longtemps talon d'Achille des générateurs vidéo IA, atteint un niveau de stabilité inédit. Les textures complexes comme le grain de peau ou les reflets sur l'eau sont rendues avec un réalisme qui rend l'intégration dans des productions professionnelles crédible sans retouche supplémentaire. L'impact concret pour les créateurs tient surtout aux nouvelles fonctions de contrôle introduites avec cette version. Le Motion Brush permet de tracer à la main la trajectoire exacte d'un élément dans le cadre, donnant au réalisateur une maîtrise que les outils précédents refusaient. L'édition par zone autorise la retouche d'un détail isolé, changer la couleur d'un vêtement ou ajouter un accessoire, sans reconstruire l'intégralité du clip. Le contrôle de la profondeur de champ ouvre la porte aux flous artistiques directement dans la phase de génération. Ces fonctions réduisent drastiquement les allers-retours entre la génération et la post-production, ce qui change le rapport au temps dans les workflows créatifs. Seedance 2.0 arrive dans un marché de la vidéo générative qui se densifie rapidement, avec des acteurs comme Sora d'OpenAI, Runway ou Kling déjà bien installés. L'enjeu pour chaque plateforme est de se différencier non plus seulement sur la qualité brute du rendu, mais sur le degré de contrôle offert au créateur, ce que cette version tente d'incarner avec ses outils de précision. La montée en puissance des architectures DiT, déjà adoptées dans la génération d'images fixes, s'étend désormais à la vidéo avec des résultats qui tendent à confirmer leur supériorité sur les approches plus anciennes. La suite dépendra de la capacité de l'outil à tenir ses promesses sur des projets longs et complexes, et de l'ouverture éventuelle de son accès à une communauté plus large de développeurs et studios indépendants.

CréationOpinion
1 source
La Chine bloque le rachat de MANUS par META / CYERA rachète RYFT pour sécuriser l’IA / AUDION lève 13 millions d’euros
1313FrenchWeb 

La Chine bloque le rachat de MANUS par META / CYERA rachète RYFT pour sécuriser l’IA / AUDION lève 13 millions d’euros

Pékin a opposé son veto à l'acquisition de Manus par Meta Platforms, bloquant une opération estimée à 2 milliards de dollars (environ 1,7 milliard d'euros). Manus est une startup spécialisée dans l'IA agentique, une technologie permettant à des agents autonomes d'exécuter des tâches complexes sans supervision humaine continue. Les autorités chinoises ont invoqué les réglementations encadrant les investissements étrangers pour justifier ce blocage, signalant une volonté explicite de garder sur le territoire national les actifs stratégiques liés à l'intelligence artificielle. Dans le même temps, deux autres mouvements ont animé le secteur : la société de cybersécurité Cyera a annoncé le rachat de Ryft pour renforcer la protection des systèmes d'IA, et la startup Audion a bouclé une levée de fonds de 13 millions d'euros. Le blocage de l'accord Manus-Meta illustre la montée en puissance des restrictions sur les transferts technologiques entre la Chine et les États-Unis. En empêchant Meta de s'emparer d'une pépite de l'IA agentique, Pékin protège non seulement une technologie émergente à fort potentiel, mais envoie aussi un signal clair aux investisseurs étrangers. Pour Meta, qui multiplie les acquisitions dans l'IA pour rattraper ses concurrents OpenAI et Google, c'est un revers stratégique significatif. L'acquisition de Ryft par Cyera, elle, répond à un besoin croissant de sécurisation des pipelines IA dans les entreprises. Ce veto s'inscrit dans un contexte de guerre technologique larvée entre Washington et Pékin, où chaque camp tente de contrôler la chaîne de valeur de l'IA. La Chine a multiplié depuis 2023 ses restrictions sur l'export de technologies sensibles et le rachat de startups nationales par des acteurs américains. Meta se retrouve ainsi pris en étau entre sa stratégie d'expansion agressive dans l'IA et les nouvelles frontières géopolitiques du secteur. La question de savoir si Manus cherchera d'autres acheteurs ou lèvera des fonds de manière indépendante reste ouverte.

UELa levée de 13 millions d'euros d'Audion illustre le dynamisme des startups IA européennes, et le veto chinois sur Meta-Manus renforce l'urgence pour l'UE de préciser sa doctrine de souveraineté technologique face aux tensions sino-américaines.

BusinessActu
1 source
La brèche Mythos d'Anthropic s'est révélée humiliante
1314The Verge AI 

La brèche Mythos d'Anthropic s'est révélée humiliante

Anthropic a subi une brèche embarrassante dans le déploiement de son modèle Claude Mythos. Selon Bloomberg, un "petit groupe d'utilisateurs non autorisés" a eu accès au modèle dès le jour où Anthropic a annoncé son intention de le proposer en test à une sélection restreinte d'entreprises. Le modèle lui-même n'avait été révélé au public que quelques jours plus tôt via une fuite, avant qu'Anthropic ne confirme officiellement son existence. La société indique qu'elle enquête sur l'incident. L'ironie est particulièrement cinglante : Anthropic avait justifié la non-publication de Mythos en arguant que ses capacités en cybersécurité étaient si avancées qu'elles représentaient un danger pour le grand public. Le modèle aurait été jugé trop puissant pour être diffusé librement. Le fait qu'il soit malgré tout tombé entre de mauvaises mains le jour même de son annonce officielle soulève des questions sérieuses sur les contrôles internes de la société et sur la solidité de ses procédures de déploiement restreint. Cette mésaventure survient à un moment délicat pour Anthropic, qui a bâti toute sa réputation sur la notion de "safety" en intelligence artificielle, se positionnant comme un acteur plus responsable que ses concurrents. Avec Claude Mythos, la société cherchait à valoriser des capacités offensives en cybersécurité tout en maintenant un contrôle strict sur leur diffusion, un équilibre difficile que d'autres laboratoires comme OpenAI ou Google ont également tenté de naviguer. La brèche risque d'alimenter les doutes sur la capacité de l'industrie à tenir ses promesses de déploiement maîtrisé.

UECette brèche fragilise les arguments en faveur de l'autorégulation des laboratoires d'IA, un enjeu central pour l'application de l'AI Act européen.

SécuritéOpinion
1 source
Le Nano Banana de ChatGPT
1315Ben's Bites 

Le Nano Banana de ChatGPT

OpenAI a frappé fort cette semaine avec le lancement de ChatGPT Images 2.0, une refonte majeure de son module de génération d'images qui remet le service en compétition directe avec les outils de Google et Midjourney. La nouveauté la plus remarquée : une précision inédite sur le texte intégré aux images, au point que les utilisateurs peinent à trouver des fautes dans des générations contenant des centaines de mots. Le modèle est disponible dans l'application Codex en tant que compétence dédiée, avec une intégration aux modèles de raisonnement pour enchaîner appels d'outils et génération d'images, créer un QR code à partir d'un lien, récupérer un logo depuis le web, puis l'intégrer dans une composition. Les cas d'usage prolifèrent déjà : captures d'écrans d'interfaces réalistes, magazines illustrés multi-pages, recommandations de style personnalisées et codes QR créatifs. La capacité à générer des interfaces utilisateur crédibles ouvre une piste intéressante pour combler le déficit de goût graphique souvent reproché aux modèles de code. Des tests comparatifs menés sur la conversion d'une maquette en application fonctionnelle, une vitrine publicitaire conçue par Ben's Bites, révèlent une hiérarchie nuancée : Claude Design devance Magicpath AI, qui devance les modèles bruts comme Gemini 3.1 Pro ou Opus 4.6 sur la compréhension du concept et l'utilisabilité. En revanche, Gemini remporte la fidélité pixel par pixel, tandis qu'Opus 4.7 bat GPT-5.4 sur la correspondance visuelle avec la maquette de référence. GPT-5.4 produit un code plus fonctionnel et maintient une cohérence visuelle sur les pages non montrées, comme le panneau d'administration. Un point aveugle subsiste pour tous : les assets, images d'illustration, icônes, textures, qui font souvent la différence entre une maquette et une interface banale ne survivent pas à la conversion depuis une capture d'écran. Ces annonces s'inscrivent dans une semaine d'actualité dense pour l'industrie de l'IA. OpenAI a déployé les Workspace Agents, des agents propulsés par Codex accessibles aux utilisateurs Business, Enterprise et Education, configurables avec une personnalité, des tâches précises et des accès à des outils externes comme Linear ou Slack, appelés à terme à remplacer les GPTs personnalisés. De son côté, Google a ouvert l'API Deep Research avec deux configurations basées sur Gemini 3.1 Pro, revendiquant les meilleures performances en recherche web, avec support MCP et génération de graphiques. Enfin, un accord stratégique se dessine entre Cursor et SpaceX : SpaceX mettra ses GPU à disposition pour entraîner les modèles de code de Cursor, avec une option d'acquisition à 60 milliards de dollars d'ici fin 2025, ou un accord de partenariat à 10 milliards si l'acquisition n'a pas lieu, un signal que la course aux modèles de code spécialisés entre dans une nouvelle phase industrielle.

UELes nouvelles APIs et outils (ChatGPT Images 2.0, Deep Research, Workspace Agents) sont accessibles aux développeurs et entreprises européens, mais aucune réglementation ou entreprise française n'est directement impliquée.

OutilsOutil
1 source
Xiaomi lance MiMo-V2.5-Pro et MiMo-V2.5 : des performances comparables aux grands modèles pour un coût en tokens bien inférieur
1316MarkTechPost 

Xiaomi lance MiMo-V2.5-Pro et MiMo-V2.5 : des performances comparables aux grands modèles pour un coût en tokens bien inférieur

L'équipe MiMo de Xiaomi vient de publier deux nouveaux modèles d'intelligence artificielle, MiMo-V2.5-Pro et MiMo-V2.5, disponibles immédiatement via API à des tarifs compétitifs. Le modèle phare, MiMo-V2.5-Pro, affiche des scores de référence qui le placent aux côtés des meilleurs systèmes propriétaires actuels : 57,2 sur SWE-bench Pro, 63,8 sur Claw-Eval et 72,9 sur τ3-Bench, des résultats comparables à ceux de Claude Opus 4.6 et GPT-5.4. Pour illustrer ses capacités en conditions réelles, Xiaomi a publié trois démonstrations exigeantes : la génération d'un compilateur complet en Rust depuis zéro, inspiré d'un projet du cours de compilation de l'Université de Pékin, réalisée en 4,3 heures et 672 appels d'outils avec un score parfait de 233 sur 233 sur la suite de tests officielle ; la création d'un éditeur vidéo de bureau fonctionnel comptant 8 192 lignes de code, produit en 11,5 heures et 1 868 appels d'outils ; et une tâche de conception de circuit analogique de niveau master en EDA portant sur un régulateur LDO à suiveur de tension inversé. Ce qui distingue MiMo-V2.5-Pro des modèles classiques, c'est sa capacité à opérer de manière autonome sur des tâches longues et complexes impliquant plus d'un millier d'appels d'outils successifs. Là où la plupart des grands modèles de langage répondent à des questions isolées, les modèles dits agentiques doivent maintenir un objectif sur de nombreuses étapes, utiliser des outils comme la recherche web, l'exécution de code ou les appels d'API, et corriger leurs propres erreurs en chemin. La démonstration du compilateur Rust est particulièrement frappante : plutôt que de procéder par tâtonnements, le modèle a construit le compilateur couche par couche, atteignant dès la première compilation 137 tests réussis sur 233, soit 59% du score final avant même d'avoir lancé un seul test unitaire ciblé. Lorsque des régressions sont apparues à la suite d'un refactoring, le modèle les a diagnostiquées et corrigées de manière autonome. Xiaomi nomme cette propriété la "harness awareness" : le modèle ne suit pas les instructions mécaniquement, il optimise activement son propre environnement de travail pour rester sur la trajectoire correcte sur de très longues séquences. Ces performances s'inscrivent dans une course serrée entre modèles ouverts et systèmes propriétaires, une dynamique qui s'accélère depuis 2025. Pendant des années, les capacités agentiques les plus avancées restaient l'apanage exclusif des grands laboratoires fermés comme OpenAI, Anthropic ou Google DeepMind. L'irruption de modèles ouverts ou semi-ouverts aux performances comparables, portée par des acteurs comme Xiaomi, Meta ou DeepSeek, redistribue les cartes du secteur. Pour les développeurs et les entreprises, l'accès à des capacités de niveau frontier via des API compétitives change le calcul économique : des tâches qui nécessitaient jusqu'ici des appels coûteux à des systèmes propriétaires deviennent accessibles à moindre coût. Si MiMo-V2.5-Pro tient ses promesses en production, il pourrait accélérer significativement l'adoption de l'IA agentique dans l'ingénierie logicielle, l'automatisation industrielle et la recherche scientifique.

UELes développeurs et entreprises européens peuvent accéder à des capacités agentiques de niveau frontier via une API compétitive, réduisant le coût d'adoption de l'IA agentique dans l'ingénierie logicielle et l'automatisation industrielle.

LLMsOpinion
1 source
Optimisation élégante des tokens
1317Latent Space 

Optimisation élégante des tokens

Google a profité de sa conférence Cloud Next, qui s'est tenue les 21 et 22 avril 2026, pour annoncer ses TPU v8, la huitième génération de ses puces d'entraînement et d'inférence. Les chiffres annoncés sont vertigineux et confirment l'avance matérielle accumulée par Google DeepMind après une décennie d'investissements massifs dans des infrastructures propriétaires. En parallèle, la conférence AI Engineer Miami a vu s'imposer un concept central dans les discussions entre dirigeants tech : le "tokenmaxxing", soit la volonté de maximiser l'usage de l'IA dans les équipes sans pour autant encourager le gaspillage ou la qualité médiocre. Mikhail Parakhin, directeur technique de Shopify, invité de la conférence, a apporté une nuance importante : il préconise d'aller en profondeur plutôt qu'en largeur, c'est-à-dire de lancer des boucles de recherche autonome séquentielles plutôt que de multiplier en parallèle des dizaines d'appels LLM sans cohérence. Dex Horthy, à l'origine du concept de "Context Engineering", a quant à lui publiquement rétracté ses positions les plus enthousiastes sur le vibe coding, encourageant désormais les développeurs à relire le code généré. Ces débats ne sont pas qu'académiques : ils reflètent une tension réelle au sein des équipes engineering, entre vitesse de génération de code et dette technique. Pour les CTOs et VP d'ingénierie, la question devient comment calibrer l'autonomie accordée aux modèles sans dégrader la qualité architecturale des systèmes. Sur le front des modèles ouverts, plusieurs sorties majeures sont venues nourrir ce débat. Alibaba a publié Qwen3.6-27B, un modèle dense sous licence Apache 2.0 qui surpasse selon ses benchmarks le bien plus lourd Qwen3.5-397B-A17B sur les évaluations de code, dont SWE-bench Verified à 77,2 contre 76,2. Il intègre des modes pensée et non-pensée, un checkpoint multimodal unifié, et a été immédiatement supporté par vLLM, llama.cpp et Ollama. OpenAI a discrètement publié un "Privacy Filter", un modèle MoE léger de 1,5 milliard de paramètres actifs à 50 millions, dédié à la détection et masquage de données personnelles sur de très larges corpus, sous licence Apache 2.0. Xiaomi a de son côté annoncé MiMo-V2.5-Pro, un modèle orienté agents avec 57,2 sur SWE-bench Pro et une capacité déclarée à effectuer plus de 1 000 appels d'outils autonomes. Ces annonces s'inscrivent dans une dynamique où la course aux modèles ouverts s'intensifie, portée par des acteurs comme Alibaba, Xiaomi et OpenAI lui-même, qui cèdent des briques spécialisées à la communauté. L'événement AI Engineer Miami, dont la prochaine édition se tiendra à Singapour, est devenu un baromètre de ce que l'industrie considère comme les vrais problèmes opérationnels : qualité du code généré, gestion de la vie privée dans les pipelines d'agents, et arbitrage entre quantité et profondeur d'utilisation des LLM. Les TPU v8 de Google rappellent que derrière ces débats de méthode, la compétition infrastructure reste déterminante pour qui peut entraîner et servir les modèles les plus puissants à grande échelle.

UELes modèles publiés sous licence Apache 2.0 (Qwen3.6-27B, OpenAI Privacy Filter) permettent aux équipes techniques européennes un déploiement local compatible avec les exigences RGPD pour la gestion des données personnelles dans les pipelines d'agents.

LLMsActu
1 source
Les « exportations de tokens » peuvent-elles donner un avantage à la Chine dans l'ère de l'IA ?
1318SCMP Tech 

Les « exportations de tokens » peuvent-elles donner un avantage à la Chine dans l'ère de l'IA ?

Les entreprises chinoises d'intelligence artificielle s'imposent progressivement comme fournisseurs majeurs de ce que les analystes appellent des "exportations de tokens" sur le marché mondial. Selon des données couvrant la période du 18 mars au 18 avril 2026, les modèles chinois représentaient quatre des dix modèles les plus consommés en tokens sur OpenRouter, une place de marché de référence pour les développeurs. Cette présence dans le top 10 mondial illustre une percée concrète dans les usages réels, au-delà des seuls benchmarks techniques. L'enjeu dépasse la simple compétition technologique. Les tokens consommés via des modèles comme DeepSeek ou Qwen représentent une forme d'influence économique et stratégique nouvelle : chaque requête traitée par un modèle chinois génère des données d'usage, fidélise des développeurs et ancre une infrastructure logicielle dans les flux numériques mondiaux. Pour l'industrie tech mondiale, cela signifie que la domination américaine sur l'outillage IA des développeurs n'est plus acquise, et que les éditeurs comme OpenAI ou Anthropic font désormais face à une concurrence directe sur les marchés émergents et auprès des développeurs indépendants. Ce phénomène s'inscrit dans un contexte de montée en puissance accélérée des modèles chinois depuis la publication de DeepSeek-R1 début 2025, qui avait démontré qu'un modèle très compétitif pouvait être entraîné à coût réduit. La demande domestique en Chine croît également fortement, ce qui renforce la capacité des acteurs locaux à investir en R&D et à baisser leurs prix à l'export, une dynamique que Washington surveille de près dans un contexte de restrictions sur les semi-conducteurs.

UELes développeurs européens indépendants sont directement exposés à cette concurrence tarifaire, les modèles chinois comme DeepSeek ou Qwen s'imposant comme alternatives compétitives aux outils américains sur des plateformes comme OpenRouter.

BusinessOpinion
1 source
Modèles du monde
1319MIT Technology Review 

Modèles du monde

Les systèmes d'intelligence artificielle maîtrisent aujourd'hui le monde numérique avec une aisance impressionnante, mais le monde physique reste un défi d'une tout autre nature. Pour franchir ce cap, de nombreux chercheurs misent sur une approche appelée "modèle du monde", une représentation interne que l'IA se construit de son environnement pour anticiper les conséquences de ses actions. Google DeepMind et World Labs, la startup fondée par Fei-Fei Li, professeure à Stanford, travaillent activement sur ces systèmes. Yann LeCun, jusqu'ici figure centrale de Meta, a quant à lui quitté l'entreprise pour fonder une startup entièrement dédiée à cette approche. OpenAI a également redirigé des ressources issues de la fermeture de son application vidéo Sora vers ce qu'elle appelle la "recherche en simulation du monde à long terme". L'enjeu est de taille : les grands modèles de langage actuels présentent des lacunes profondes dès qu'il s'agit de raisonner sur le monde réel. Une étude révélatrice a montré que des modèles entraînés sur des millions de trajets de taxis new-yorkais peuvent donner des itinéraires corrects dans Manhattan, mais échouent complètement dès qu'on leur impose un détour. Ce type de fragilité est fondamentalement incompatible avec des applications robotiques, où l'imprévu est la règle. Un vrai modèle du monde permettrait à un agent IA de se représenter son environnement avec suffisamment de fidélité pour prédire ce qui se passe si on pousse une tasse du bord d'une table, ou si on change de route en cours de chemin, exactement comme le fait le cerveau humain. Les applications concrètes émergent progressivement. Niantic, le studio derrière Pokémon Go, exploite les milliards d'images collectées par les joueurs du jeu pour construire les premières briques d'un modèle du monde destiné à guider des robots de livraison. Google DeepMind et World Labs concentrent actuellement leurs efforts sur la génération d'environnements virtuels 3D interactifs à partir de textes, d'images et de vidéos, des outils utiles pour la conception de jeux vidéo ou d'expériences en réalité virtuelle, mais encore limités dans leur portée. Les véritables percées viendront probablement de l'intégration de ces systèmes dans des agents autonomes capables de modéliser leur environnement, d'anticiper les effets de leurs actions et de décider en conséquence. Li et LeCun voient dans cette direction la clé pour des robots capables d'explorer les grands fonds marins ou d'assister le personnel soignant, un horizon encore lointain, mais qui mobilise désormais les acteurs les plus influents du secteur.

RecherchePaper
1 source
1320VentureBeat AI 

Kimi K2.6 exécute des agents pendant plusieurs jours et révèle les limites de l'orchestration d'entreprise

Moonshot AI, le laboratoire chinois à l'origine de la famille de modèles Kimi, a lancé Kimi K2.6, un modèle conçu spécifiquement pour les agents à exécution continue. Contrairement aux systèmes concurrents, Moonshot revendique des cas d'usage internes où des agents ont fonctionné en autonomie pendant plusieurs heures, et dans un cas documenté, cinq jours d'affilée, pour gérer de la surveillance d'infrastructure et de la réponse à des incidents. Le modèle est désormais disponible sur Hugging Face, via l'API Kimi, Kimi Code et l'application Kimi. Sa principale nouveauté technique réside dans une version améliorée des "Agent Swarms", capables de coordonner jusqu'à 300 sous-agents exécutant simultanément 4 000 étapes parallèles. À la différence de Claude Code d'Anthropic ou de Codex d'OpenAI, qui s'appuient sur des rôles prédéfinis pour orchestrer leurs agents, K2.6 laisse le modèle lui-même décider de l'orchestration en temps réel. Cette évolution met en lumière une fragilité structurelle dans l'écosystème des agents IA : les frameworks d'orchestration existants ont été conçus pour des agents qui s'exécutent en quelques secondes ou minutes, pas pour des processus qui durent des jours. Maintenir l'état d'un agent sur une longue durée pose des problèmes inédits, car l'environnement dans lequel il opère ne cesse d'évoluer pendant son exécution. L'agent doit appeler des outils, des API et des bases de données différents tout au long de sa vie, ce qu'aucun framework actuel n'a été conçu pour gérer proprement. Mark Lambert, directeur produit chez ArmorCode, souligne que le déficit de gouvernance dépasse déjà le rythme de déploiement : ces systèmes génèrent du code et des changements système plus vite que la plupart des organisations ne peuvent les examiner, corriger ou auditer. La course aux agents longue durée s'inscrit dans une compétition plus large entre fournisseurs de modèles, où la capacité d'orchestration est devenue un avantage concurrentiel à part entière. Anthropic, OpenAI et désormais Moonshot AI expérimentent tous des architectures multi-sessions et d'exécution en arrière-plan, mais aucun n'a encore résolu le problème fondamental : sans mécanisme de rollback clair, un agent autonome qui échoue après plusieurs heures d'exécution peut laisser des systèmes dans un état incohérent. Kunal Anand, directeur produit chez F5, résume le défi : l'industrie est passée des scripts aux services, puis aux agents, mais le saut architectural que représentent les agents à long horizon était loin d'être anticipé par la plupart des entreprises. Le praticien Maxim Saplin l'énonce clairement : l'orchestration reste fragile, et ce n'est pas en affinant les prompts qu'on réglera le problème, mais en repensant à la fois les produits et l'entraînement des modèles.

LLMsOpinion
1 source
Anthropic impose la vérification d'identité, mettant en difficulté les fondateurs chinois
1321The Information AI 

Anthropic impose la vérification d'identité, mettant en difficulté les fondateurs chinois

Anthropic a discrètement commencé à exiger de certains clients une pièce d'identité officielle avec photo ainsi qu'une image d'eux-mêmes prise depuis leur téléphone ou webcam. Cette politique, annoncée la semaine dernière, vise à empêcher les utilisateurs situés dans des pays considérés comme adversaires des États-Unis, principalement la Chine, la Russie et la Corée du Nord, d'accéder à ses modèles d'intelligence artificielle de pointe. Un cofondateur d'une startup de développement d'applications IA basée à Pékin a ainsi vu son accès à Claude Code coupé brutalement dans la foulée de cette annonce, sans explication officielle directe. Faute d'alternative, il s'est tourné dès le week-end vers Codex, le service de codage assisté d'OpenAI. Cette décision illustre le durcissement progressif des restrictions d'accès aux outils d'IA américains pour les acteurs chinois. Jusqu'ici, de nombreuses entreprises chinoises, grands groupes technologiques comme startups, contournaient les restrictions officielles d'Anthropic pour accéder à Claude, faisant de la Chine un marché de fait malgré son exclusion formelle. La vérification d'identité par document officiel rend ce contournement beaucoup plus difficile, ce qui pourrait priver des centaines de développeurs et d'entreprises chinoises d'un outil devenu central dans leurs workflows de programmation et de développement produit. Cette mesure s'inscrit dans une série de dispositions prises par Anthropic au cours de l'année écoulée pour se conformer aux orientations géopolitiques américaines en matière d'exportation technologique. OpenAI applique les mêmes restrictions géographiques mais n'impose pas encore de vérification d'identité formelle, ce qui lui confère un avantage pratique auprès des utilisateurs affectés. La tension entre l'expansion commerciale mondiale des laboratoires d'IA américains et les impératifs de sécurité nationale devrait continuer à façonner l'accès aux modèles les plus avancés, avec des conséquences directes pour les écosystèmes d'innovation en dehors des marchés autorisés.

💬 Anthropic fait le ménage, et ça va faire mal à pas mal de devs. La vérification d'identité par selfie, c'est brutal mais cohérent avec la direction que prennent tous les labos américains depuis un an. OpenAI va suivre, c'est juste une question de mois.

RégulationReglementation
1 source
1322Ben's Bites 

Claude, mon designer attitré

Anthropic a lancé Claude Opus 4.7 ce week-end, accompagné d'une série de mises à jour significatives pour son écosystème. Le nouveau modèle améliore notablement les capacités de vision, c'est-à-dire l'interprétation d'images, et introduit un niveau de raisonnement inédit baptisé « xhigh », qui s'insère entre les niveaux « high » et « max » déjà existants. Simultanément, Claude hérite d'un onglet Design, une interface de type canvas avec chat latéral permettant de générer des wireframes ou des prototypes haute fidélité à partir d'un formulaire de 5 à 10 questions. Le flux image vers prototype se révèle particulièrement efficace, bien que les générations restent limitées à 2 ou 3 sessions hebdomadaires sur l'abonnement à 20 dollars pendant cette phase de prévisualisation. Du côté de l'agent de code Codex, trois nouveautés ont été déployées : la fonctionnalité Computer Use, qui permet à l'agent d'utiliser des applications macOS en arrière-plan sans bloquer l'ordinateur de l'utilisateur ; Chronicle, un mécanisme opt-in qui exploite le contexte d'écran récent pour construire des souvenirs ; et un ensemble de plugins, dont la génération d'images. Par ailleurs, la startup Factory AI, qui développe l'agent de code Droid, a bouclé une levée de fonds de 150 millions de dollars, portant sa valorisation à 1,5 milliard de dollars. Ces annonces illustrent la course effrénée des acteurs de l'IA à transformer leurs modèles en plateformes complètes. L'onglet Design de Claude, en particulier, s'attaque directement au marché du prototypage rapide jusqu'ici dominé par des outils comme Figma, en proposant une boucle de création entièrement guidée par le langage naturel. La fonctionnalité Computer Use de Codex, elle, cherche à dépasser les démos laborieuses de contrôle d'interface pour offrir une automatisation fluide en tâche de fond, ce qui représente un saut qualitatif si les performances tiennent à l'usage réel. La valorisation de Factory AI à 1,5 milliard confirme l'appétit des investisseurs pour les agents de développement logiciel autonomes. Dans ce contexte d'accélération, OpenAI a connu une semaine difficile sur le plan humain : trois cadres de premier plan ont quitté l'entreprise, à savoir Kevin Weil, ancien directeur produit devenu responsable d'OpenAI for Science, Bill Peebles, co-créateur du générateur vidéo Sora, et Srinivas Narayanan, directeur technique des applications B2B. Ces départs simultanés alimentent les questions sur la cohésion interne d'OpenAI à un moment charnière. Vercel a également annoncé avoir subi une intrusion via le compte d'un employé compromis sur un autre produit IA tiers, soulignant les risques croissants liés à la prolifération des outils connectés. Enfin, la critique adressée à Claude Cowork, l'espace de travail collaboratif d'Anthropic, rappelle une tension persistante : les capacités avancées restent inaccessibles aux utilisateurs non initiés, risquant de nourrir la désillusion envers l'IA pour les prochains mois.

UELes utilisateurs et designers européens peuvent accéder aux nouvelles fonctionnalités de prototypage de Claude via l'abonnement standard à 20 dollars, bien que les générations restent limitées en phase de prévisualisation.

OutilsOutil
1 source
1323AWS ML Blog 

Recherche sémantique vidéo avec Amazon Nova Multimodal Embeddings

Amazon a lancé Nova Multimodal Embeddings, un modèle d'embedding unifié disponible sur Amazon Bedrock, capable de traiter simultanément du texte, des images, de la vidéo et de l'audio dans un espace vectoriel sémantique commun. L'objectif est de résoudre un problème concret qui freine l'industrie audiovisuelle : permettre de rechercher dans des vidéos par le sens, et non par des mots-clés exacts. Concrètement, le modèle génère des vecteurs de 1 024 dimensions qui encodent à la fois les signaux visuels et audio d'un segment vidéo, stockés ensuite dans Amazon S3. L'architecture de référence publiée par Amazon combine une phase d'ingestion en six étapes, upload dans S3, découpage en plans via FFmpeg sur AWS Fargate, traitement parallèle avec embeddings visuels/audio, transcription via Amazon Transcribe, et détection de célébrités via Amazon Rekognition, et une phase de recherche hybride qui fusionne recherche sémantique et lexicale pour produire une liste de résultats classés. L'enjeu est majeur pour tous les secteurs qui gèrent des bibliothèques vidéo volumineuses. Une chaîne sportive peut désormais retrouver instantanément le moment précis où un joueur marque, un studio peut identifier chaque scène d'un acteur dans des milliers d'heures d'archives, et une rédaction peut extraire des images par ambiance, lieu ou événement pour publier plus vite que ses concurrents. Ce qui change fondamentalement, c'est que la recherche n'est plus limitée au dialogue ou aux métadonnées textuelles : une requête comme "une course-poursuite tendue avec des sirènes" retrouve à la fois l'événement visuel et l'événement sonore sans que l'un ou l'autre ait besoin d'être transcrit. La précision de recherche s'améliore donc sur les contenus riches en action, en musique ou en sons d'ambiance, là où les approches textuelles échouaient systématiquement. L'approche dominante jusqu'ici consistait à convertir toute la vidéo en texte, transcription automatique, sous-titrage, tags manuels, puis à appliquer des embeddings textuels classiques. Cette méthode souffre de deux limites structurelles : la dimension temporelle disparaît dans la conversion, et les erreurs de transcription se propagent dès que la qualité audio ou visuelle est insuffisante. Amazon positionne Nova Multimodal Embeddings comme une rupture avec ce paradigme, en traitant nativement toutes les modalités sans passer par le texte comme pivot. Le modèle s'inscrit dans une compétition directe avec les offres multimodales de Google et OpenAI sur le segment des embeddings haute précision. Amazon met à disposition une implémentation de référence déployable, signalant une volonté de s'imposer rapidement comme infrastructure de référence pour la recherche vidéo à grande échelle.

UELes entreprises et médias européens gérant de grandes bibliothèques vidéo sur AWS peuvent désormais implémenter une recherche sémantique multimodale native sans infrastructure supplémentaire.

OutilsOpinion
1 source
1324Ars Technica AI 

Codex s'enrichit de nouvelles fonctionnalités, dont l'utilisation de votre ordinateur en arrière-plan

OpenAI a déployé aujourd'hui une nouvelle version de son application desktop Codex, apportant un ensemble de fonctionnalités inédites qui étendent son champ d'action bien au-delà du code. Parmi les ajouts les plus notables figure la capacité d'effectuer des tâches sur l'ordinateur de l'utilisateur en arrière-plan, sans interrompre le travail en cours sur le bureau. L'entreprise a détaillé cette mise à jour dans un billet de blog officiel, présentant également des améliorations pour les développeurs et une ouverture vers des usages non techniques. Cette fonctionnalité d'exécution en arrière-plan représente un changement de paradigme significatif : l'agent ne se contente plus de répondre à des requêtes ponctuelles, il agit de manière autonome sur la machine pendant que l'utilisateur continue son activité normale. Pour les développeurs comme pour les professionnels du secteur, cela ouvre la voie à une automatisation plus profonde des tâches répétitives, qu'il s'agisse de refactorisation de code, de recherche ou de traitement de fichiers, sans mobiliser l'attention de l'utilisateur. Cette mise à jour s'inscrit dans la stratégie plus large d'OpenAI de transformer Codex en une "super app" polyvalente, capable de couvrir à la fois les besoins techniques et les tâches de travail du savoir en général. La compétition dans ce segment s'intensifie, avec des concurrents comme Anthropic (Claude) et Google (Gemini) qui proposent également des agents de bureau. OpenAI mise sur l'intégration native et la discrétion d'exécution pour se différencier dans une course qui redéfinit la relation entre l'humain et l'ordinateur.

OutilsOutil
1 source
Attaqué par deux fois, Sam Altman n’en défend pas moins la « démocratisation de l’IA »
1325Next INpact 

Attaqué par deux fois, Sam Altman n’en défend pas moins la « démocratisation de l’IA »

Le domicile de Sam Altman, PDG d'OpenAI, a été attaqué à deux reprises en l'espace de 24 heures à San Francisco. Dans la nuit du 11 avril à 3h45, un homme a lancé un cocktail Molotov contre sa résidence. Le lendemain, à 1h40 du matin, deux individus à bord d'une Honda Sedan ont ouvert le feu sur la façade. Les assaillants ont été rapidement interpellés. Le premier, Daniel Alejandro Moreno-Gama, 20 ans, fait face à des poursuites pour tentative de meurtre. Il avait également menacé d'incendier le siège d'OpenAI, près duquel il a été arrêté. La police a découvert à son domicile un document intitulé « Dernier avertissement », dans lequel il appelait à l'assassinat des PDG de sociétés d'IA et de leurs investisseurs. Les motivations des deux autres suspects, arrêtés le 12 avril au matin, ne sont pas encore connues. Ces attaques illustrent la montée des tensions entre une partie de l'opinion publique et les dirigeants de l'industrie de l'IA. Moreno-Gama avait exprimé à plusieurs reprises ses craintes liées au développement de l'intelligence artificielle, notamment sur son Substack et au sein du groupe Discord de PauseAI, une organisation internationale qui milite pour un arrêt des travaux sur les modèles d'IA les plus puissants. Ce passage à l'acte violent signale un glissement inquiétant : des angoisses jusqu'ici cantonnées aux forums et aux pétitions débordent désormais vers des formes de menace physique directe contre des figures de l'industrie tech. Le contexte est celui d'une fracture croissante entre les promoteurs de l'IA générative et une partie du public qui redoute les conséquences sociales, économiques et existentielles de ces technologies. Des mouvements comme PauseAI, apparus ces dernières années dans plusieurs pays, regroupent des militants convaincus que le rythme actuel du développement de l'IA représente un danger pour l'humanité. Face à ces attaques, Sam Altman n'a pas infléchi son discours : il continue de défendre la démocratisation de l'IA comme un bien collectif. L'incident risque néanmoins de renforcer les mesures de sécurité autour des dirigeants des grandes entreprises technologiques américaines, déjà régulièrement ciblés par des menaces en ligne.

UELe mouvement PauseAI, actif dans plusieurs pays européens dont la France, illustre que ces tensions sociétales autour des risques de l'IA touchent aussi les sociétés européennes, même si les violences physiques demeurent pour l'instant localisées aux États-Unis.

HappyHorse : l’IA vidéo qui domine les réseaux sociaux appartient en fait à Alibaba
1326Le Big Data 

HappyHorse : l’IA vidéo qui domine les réseaux sociaux appartient en fait à Alibaba

Le vendredi 10 avril 2026, Alibaba a officiellement revendiqué la paternité de HappyHorse-1.0, le modèle d'intelligence artificielle génératrice de vidéos qui avait envahi les réseaux sociaux et les plateformes de benchmark en l'espace de quelques jours. L'annonce est tombée via un post sur X signé par l'équipe du projet, confirmant que le modèle est développé au sein de l'unité ATH AI Innovation Unit, rattachée au géant chinois du e-commerce. Apparu début avril sans affiliation déclarée, HappyHorse-1.0 avait immédiatement pris la première place du classement text-to-video d'Artificial Analysis, devançant des modèles soutenus par des acteurs majeurs de l'industrie. Ses capacités couvrent aussi bien la génération vidéo à partir de texte que la création d'images animées, deux segments très convoités du marché. Le modèle se trouve encore en phase de test bêta, mais un accès via API est annoncé prochainement pour les développeurs. La révélation a eu un effet immédiat sur les marchés : l'action Alibaba a clôturé en hausse de 2,12 % à Hong Kong le jour de l'annonce, après avoir déjà bondi de plus de 6 % deux jours plus tôt, quand les premières spéculations sur l'origine du modèle avaient circulé. Cette réaction boursière illustre l'importance stratégique que les investisseurs accordent désormais aux capacités IA des grandes entreprises technologiques chinoises. Pour Alibaba, HappyHorse représente une validation publique et quantifiable de la stratégie portée par Eddie Wu, le dirigeant qui a fait de l'intelligence artificielle la priorité absolue du groupe depuis son arrivée à la tête de l'entreprise. Un succès technique aussi visible, obtenu en quelques jours sur des benchmarks internationaux, constitue un signal fort envoyé à la fois aux concurrents américains et aux investisseurs mondiaux. Ce lancement intervient dans un moment de turbulences pour le secteur de la vidéo IA. OpenAI a récemment réduit la place de Sora dans sa stratégie globale, préférant concentrer ses ressources sur d'autres usages. ByteDance, de son côté, fait face à des controverses autour de ses outils vidéo expérimentaux, notamment sur des questions de droits d'auteur. Dans ce contexte, Alibaba choisit de s'imposer avec un modèle performant, lancé de façon discrète puis révélé au bon moment, une mécanique de communication qui rappelle les stratégies adoptées par DeepSeek lors de la publication de ses modèles. Le fait qu'un acteur chinois prenne la tête des classements mondiaux sur un segment aussi compétitif que la génération vidéo soulève des questions sur l'équilibre des forces dans la course à l'IA générative, et annonce probablement une intensification de la rivalité technologique entre Pékin et la Silicon Valley.

CréationOpinion
1 source
ChatGPT lance un abonnement Pro à 100 dollars par mois
1327The Verge AI 

ChatGPT lance un abonnement Pro à 100 dollars par mois

OpenAI a lancé un nouveau palier d'abonnement ChatGPT Pro à 100 dollars par mois, positionné entre l'offre Plus à 20 dollars et la version Pro existante à 200 dollars par mois. Ce nouvel échelon propose cinq fois plus d'utilisation de Codex, l'outil de codage d'OpenAI, par rapport à l'abonnement Plus, et cible explicitement les sessions de développement longues et intensives. Il s'agit donc d'une troisième option tarifaire qui vient compléter une gamme désormais composée de trois niveaux distincts sous le même nom "Pro". Ce lancement représente une réponse directe à Anthropic et à son offre "Max" pour Claude, également facturée 100 dollars par mois. En ciblant les développeurs qui utilisent intensivement des outils de génération de code, OpenAI cherche à contenir la montée en puissance de Claude Code, qui a gagné une popularité significative dans la communauté des ingénieurs logiciels. Pour les utilisateurs professionnels, ce nouveau palier offre une alternative concrète sans avoir à s'engager sur l'abonnement à 200 dollars. La bataille tarifaire entre OpenAI et Anthropic s'intensifie à mesure que les assistants IA s'imposent comme des outils quotidiens pour les développeurs. Codex, relancé par OpenAI comme agent de codage autonome capable d'exécuter des tâches en parallèle, est au coeur de cette concurrence. Les deux entreprises misent sur le segment des professionnels techniques, prêts à payer davantage pour des capacités étendues, comme levier de croissance et de fidélisation face à un marché de plus en plus disputé.

UELes développeurs français utilisant intensivement Codex disposent désormais d'un palier intermédiaire à 100 dollars, évitant l'engagement à 200 dollars par mois.

Eric Boyd quitte Microsoft pour diriger l’infrastructure chez Anthropic
1328Le Big Data 

Eric Boyd quitte Microsoft pour diriger l’infrastructure chez Anthropic

Eric Boyd a quitté Microsoft la semaine dernière après près de 17 ans au sein de l'entreprise pour rejoindre Anthropic en tant que responsable de l'ensemble de l'infrastructure. Boyd avait intégré Microsoft en 2009 à Redmond, d'abord à la tête de Bing Ads, avant de devenir président de la plateforme IA en 2015, puis de prendre la direction d'Azure AI en 2018 sur nomination de Satya Nadella. Dans ce rôle, il a supervisé le développement des grands modèles de langage de Microsoft et planifié les clusters de calcul utilisés par OpenAI pour entraîner et faire tourner ses modèles, consolidant ainsi la position de Microsoft comme acteur incontournable du cloud IA. Avant cela, il avait passé neuf ans chez Yahoo comme vice-président de l'ingénierie de plateforme, qu'il avait quitté en 2008. Chez Anthropic, Boyd n'occupera pas un simple poste administratif : il est chargé de faire évoluer l'infrastructure critique qui permet à l'entreprise d'héberger, déployer et opérer ses modèles à très grande échelle. Sa mission répond à une urgence concrète, la demande pour les services Claude, et en particulier Claude Code, a connu une croissance explosive ces six derniers mois. Rahul Patil, directeur technique d'Anthropic, a précisé sur LinkedIn que Boyd apportera son expertise des infrastructures pour modèles de base à un moment où la scalabilité devient le principal défi opérationnel de l'entreprise. Pour les utilisateurs de Claude et les entreprises qui s'appuient sur l'API, cette nomination signifie qu'Anthropic mise sérieusement sur sa capacité à tenir la charge, et pas seulement sur la qualité de ses modèles. Ce recrutement s'inscrit dans une séquence d'accélération majeure pour Anthropic. La startup a levé 30 milliards de dollars en février 2026 lors d'un tour de table de série G mené par GIC et Coatue, avec la participation de Microsoft et Nvidia, portant sa valorisation à 380 milliards de dollars. Son chiffre d'affaires annuel récurrent a bondi à 30 milliards de dollars, contre environ 9 milliards fin 2025. Parallèlement, Anthropic recrute activement des profils expérimentés du cloud, deux anciens dirigeants de Google auraient déjà rejoint l'entreprise selon The Information, et négocie pour sécuriser plus de 10 GW de capacité de calcul dans les prochaines années. Un accord avec Google et Broadcom prévoit également le développement ou la location de 3,5 GW de TPU à partir de 2027. L'arrivée de Boyd, l'un des architectes de l'infrastructure IA de Microsoft, illustre qu'Anthropic ne cherche plus seulement à produire les meilleurs modèles : elle veut aussi construire la plomberie pour les délivrer au monde entier.

💬 L'homme qui planifiait les clusters d'entraînement d'OpenAI chez Azure débarque chez Anthropic pour prendre toute l'infrastructure. Bon, les modèles Claude sont déjà excellents, mais si l'infra flanche quand Claude Code explose en prod, tout le reste ne sert à rien, et Boyd a construit exactement cette plomberie à l'échelle industrielle pendant des années. C'est le recrutement qui dit que la course n'est plus seulement sur les modèles.

BusinessOpinion
1 source
Amazon Nova Embeddings : construire un moteur de recherche audio intelligent par analyse sémantique
1329AWS ML Blog 

Amazon Nova Embeddings : construire un moteur de recherche audio intelligent par analyse sémantique

Amazon a lancé le 28 octobre 2025 Amazon Nova Multimodal Embeddings, un modèle d'embedding unifié disponible via Amazon Bedrock, capable de traiter simultanément du texte, des documents, des images, des vidéos et de l'audio au sein d'un seul et même système. Concrètement, ce modèle convertit n'importe quel contenu audio en vecteurs numériques denses dans un espace à haute dimension, avec quatre options de taille : 3 072 dimensions (par défaut), 1 024, 384 ou 256. Chaque vecteur encode à la fois les propriétés acoustiques d'un son, rythme, hauteur tonale, timbre, couleur émotionnelle, et son sens sémantique. Deux extraits musicaux similaires, par exemple un violon et un violoncelle jouant la même mélodie, obtiendront une similarité cosinus de 0,87, les plaçant proches dans cet espace vectoriel, tandis qu'un morceau de rock avec batterie n'obtiendra que 0,23 face à ces mêmes clips. L'enjeu est considérable pour tous ceux qui gèrent de grandes bibliothèques audio : studios de production, plateformes de podcast, services de streaming, équipes de post-production. Les méthodes traditionnelles, transcription manuelle, balisage de métadonnées, conversion parole-texte, ne capturent que le contenu linguistique. Elles sont aveugles aux propriétés acoustiques pures : l'ambiance d'une pièce, l'émotion dans une voix, le genre musical, les sons environnementaux. Nova Multimodal Embeddings comble ce vide en permettant des requêtes en langage naturel comme "musique mélancolique avec piano" ou "bruit de foule dans un stade", sans qu'aucune transcription préalable ne soit nécessaire. Le résultat est une recherche sémantique sur le son lui-même, pas seulement sur ses métadonnées. Le modèle repose sur une technique appelée Matryoshka Representation Learning (MRL), qui structure les embeddings de façon hiérarchique, à la manière des poupées russes : un vecteur de 3 072 dimensions contient toute l'information, mais on peut tronquer aux 256 premières dimensions et conserver des résultats précis. Cela permet de générer les embeddings une seule fois, puis d'ajuster la taille selon les contraintes de coût de stockage ou de performance, sans retraiter l'audio. Cette approche s'inscrit dans la tendance plus large des modèles d'embedding multimodaux unifiés, où Amazon rivalise directement avec Google (Vertex AI Embeddings) et OpenAI (CLIP, Whisper). L'intégration native dans Bedrock facilite le déploiement en production via des bases de données vectorielles compatibles k-NN. La prochaine étape logique sera l'intégration de ces capacités dans des pipelines RAG (retrieval-augmented generation) pour des agents conversationnels capables de répondre à des questions sur du contenu audio sans intervention humaine préalable.

UELes studios de production, plateformes de podcast et services de streaming européens peuvent intégrer cette API via Amazon Bedrock pour améliorer leurs moteurs de recherche audio sémantique.

OutilsOutil
1 source
Y a-t-il trop de Copilot dans l’avion ?
1330Next INpact 

Y a-t-il trop de Copilot dans l’avion ?

Microsoft fait face à une prolifération incontrôlable de sa marque Copilot, comme l'a documenté Key Bannerman, spécialiste IA, qui a recensé pas moins de 78 déclinaisons différentes du produit. Chatbots, applications de bureau, outils pour développeurs, plateformes d'entreprise, intégrations dans d'autres logiciels, assistants sectoriels : Copilot est partout. Depuis ce recensement, deux nouvelles variantes sont apparues, Gaming Copilot pour l'aide en jeu sur PC et Xbox, et Microsoft Dragon Copilot pour le secteur de la santé, auxquels s'ajoute Copilot Health annoncé en mars 2026. L'éditeur est allé jusqu'à créer Microsoft Copilot Studio, un outil permettant de fabriquer... d'autres Copilot. Sur le matériel, les PC Copilot+ embarquent une touche physique dédiée, et le navigateur Edge affiche GitHub Copilot en mode Copilot, le tout dans Microsoft 365 Copilot. Cette inflation de marque soulève une question de fond : à force de tout rebaptiser Copilot, Microsoft brouille le message et dilue la valeur perçue du produit. Pour Key Bannerman, ce réflexe de renommage est avant tout "un instinct de survie" interne : chaque équipe cherche à prouver qu'elle fait partie de "l'histoire de l'IA" pour éviter d'être marginalisée. Parallèlement, une clause discrète dans les conditions d'utilisation de Copilot, modifiée en octobre, a refait surface sur les réseaux sociaux : Microsoft y précise en gras que "Copilot est uniquement destiné à des fins de divertissement" et déconseille de s'y fier pour des "conseils importants". Ce message tranche avec le discours commercial de l'entreprise, qui positionne son IA comme un outil de productivité indispensable pour les particuliers et les entreprises. Microsoft a promis de revoir cette formulation, la qualifiant d'"héritage" de l'époque où Copilot était un simple assistant de recherche dans Bing. La concurrence pratique des stratégies similaires, Google apposant l'étiquette Gemini sur l'ensemble de ses produits, mais la surenchère de Microsoft est particulièrement visible car elle touche à Windows lui-même. La réception glaciale réservée en fin d'année dernière à la vision d'un Windows "agentique" a contraint l'éditeur à réduire ses ambitions : en mars 2026, Microsoft a annoncé la suppression progressive d'intégrations Copilot jugées inutiles dans Windows 11, notamment dans Capture et croquis et Photos. La question de la responsabilité des IA reste entière : Anthropic et OpenAI rappellent eux aussi que leurs modèles "peuvent faire des erreurs", mais aucun ne les présente simultanément comme des outils de divertissement et comme la colonne vertébrale de la productivité professionnelle. L'enjeu pour Microsoft est désormais de rationaliser ce portefeuille fragmenté avant que la confusion ne se retourne contre la marque.

UELes entreprises françaises et européennes déployant Microsoft 365 Copilot en environnement professionnel doivent examiner la clause des CGU stipulant que Copilot est 'uniquement destiné à des fins de divertissement', ce qui soulève des questions concrètes de responsabilité contractuelle et de conformité au RGPD.

BusinessOpinion
1 source
Pas de Claude pour Claws
1331Ben's Bites 

Pas de Claude pour Claws

Anthropic a décidé de couper l'accès à Claude via abonnement Claude Code pour les outils tiers comme OpenClaw, le harness alternatif populaire dans la communauté des développeurs. Concrètement, les utilisateurs qui accédaient à Claude depuis OpenClaw grâce à leur abonnement mensuel ne peuvent plus le faire : ils doivent désormais passer à une facturation à l'usage ou fournir leur propre clé API. Pour atténuer l'impact, Anthropic a offert un crédit unique équivalent à un mois d'abonnement. La décision intervient alors qu'Anthropic surveille de près la consommation de calcul générée par ces usages agentiques via des harnesses tiers, qui s'avère particulièrement gourmande. Parallèlement, Google a publié Gemma 4, une famille de quatre nouveaux modèles open-weights : deux variantes puissantes destinées aux ordinateurs de bureau et portables performants (26B MoE et 31B dense), et deux modèles ultra-légers pour mobile (2B et 4B), particulièrement pertinents pour les entreprises souhaitant les affiner sur leurs propres données. Du côté financier, Anthropic a vu son chiffre d'affaires annualisé atteindre 30 milliards de dollars, contre 9 milliards fin 2025, avec 6 milliards d'ARR ajoutés en février 2026 seulement. Cette restriction d'Anthropic n'est pas anodine : elle révèle une stratégie claire de réorientation des utilisateurs vers les outils propriétaires de l'entreprise -- Dispatch, tâches planifiées, projets, et computer use -- qui recoupent directement les fonctionnalités qu'OpenClaw proposait. Pour la communauté des développeurs, c'est une source de confusion majeure : beaucoup ne savent plus précisément dans quels contextes leur abonnement Claude Code reste utilisable hors du harness officiel. Le fondateur d'OpenClaw, Peter, ne compte pas abandonner pour autant et travaille à intégrer GPT-5.4 dans son outil pour offrir des performances comparables à Opus, profitant du rachat d'OpenClaw par OpenAI. Dans un contexte plus large, plusieurs signaux marquent une accélération de la structuration de l'écosystème IA. OpenAI a racheté TBPN, un podcast influent auprès des professionnels du secteur, un mouvement dont la logique commerciale reste débattue : le podcast est rentable, en croissance, et dispose d'une audience fidèle, ce qui rend l'intérêt mutuel de l'acquisition peu évident selon certains analystes. Sur le plan des outils de développement, Cursor a lancé une version 3 avec une fenêtre autonome dédiée à l'exécution d'agents, incluant des fonctionnalités de transition local-vers-cloud et de travail multi-projets. Enfin, Andrej Karpathy a partagé une approche inédite des bases de connaissances pour agents, organisée thématiquement avec résumés, rétroliens et wikis -- une piste qui intéresse de nombreux développeurs cherchant à structurer la mémoire de leurs systèmes agentiques.

UELes développeurs européens utilisant Claude via des harnesses tiers comme OpenClaw doivent migrer vers une clé API personnelle ou une facturation à l'usage, et peuvent envisager Gemma 4 comme alternative open-weights pour leurs usages agentiques.

OutilsActu
1 source
Block lance Managerbot, un agent Square proactif et la preuve la plus convaincante du pari IA de Jack Dorsey
1332VentureBeat AI 

Block lance Managerbot, un agent Square proactif et la preuve la plus convaincante du pari IA de Jack Dorsey

Block a dévoilé le 7 avril 2026 Managerbot, un agent IA intégré à sa plateforme Square et destiné aux petits commerçants. Contrairement au précédent assistant Square AI, qui répondait passivement aux questions des vendeurs, Managerbot surveille en continu l'activité d'un commerce, détecte les problèmes émergents et propose des actions concrètes sans attendre qu'on lui pose de questions. Le produit est en cours de déploiement progressif, avec une disponibilité complète pour l'ensemble des utilisateurs Square prévue dans les prochains mois. Block n'a pas précisé si Managerbot serait facturé séparément ou inclus dans les abonnements existants. L'agent repose sur des modèles frontier d'Anthropic (Claude Sonnet) et d'OpenAI (famille GPT), combinés à un cadre technique propriétaire baptisé "agent harness", lui-même construit sur Goose, le framework open-source de Block. Managerbot intervient aujourd'hui dans trois domaines clés : la gestion des stocks, la planification des équipes et la création de campagnes marketing. Pour les stocks, l'agent croise les niveaux d'inventaire, la vitesse de vente et des signaux externes comme la météo ou les événements locaux afin d'anticiper les ruptures et d'optimiser les achats. Pour les plannings, il analyse les prévisions de ventes et génère automatiquement des grilles horaires qui équilibrent les préférences des employés et les besoins de couverture -- une tâche que Willem Avé, responsable produit de Square chez Block, qualifie de "problème informatique difficile" qui peut mobiliser plusieurs heures par semaine chez un dirigeant de PME. En marketing, Managerbot identifie les tendances de ventes et rédige des campagnes de reconquête ou des promotions ciblées sur les meilleurs segments de clientèle. Block indique observer "une amélioration très significative" des résultats de ces campagnes par rapport à ce que créent certains vendeurs manuellement, sans publier de chiffres précis. Cette annonce s'inscrit dans le pari stratégique assumé par Jack Dorsey, PDG de Block, selon lequel l'IA peut transformer en profondeur la façon dont son entreprise opère et sert les millions de petits commerces qui dépendent de Square au quotidien. La transition du réactif au proactif représente un changement de paradigme majeur pour les outils de gestion destinés aux TPE et PME, qui disposent rarement des ressources humaines pour analyser en continu leurs données opérationnelles. Block mise sur son "agent harness" et sur l'expérience acquise via Money Bot, son agent financier dans Cash App, pour se différencier face aux modèles tiers qu'elle exploite. L'enjeu est de taille : Square équipe des centaines d'outils différents -- facturation, stocks, paie, marketing, planification -- et Managerbot doit naviguer dans cet ensemble de façon cohérente au sein d'une boucle agentique unifiée, ce qui constitue le véritable défi technique derrière la promesse commerciale.

UELes petits commerçants français et européens utilisant Square pourraient bénéficier d'un agent proactif de gestion des stocks, plannings et marketing, mais le calendrier de déploiement en Europe n'est pas précisé.

OutilsOutil
1 source
L'impact de l'IA sur l'emploi et les centres de données dans l'espace
1333MIT Technology Review 

L'impact de l'IA sur l'emploi et les centres de données dans l'espace

L'intelligence artificielle continue de redistribuer les cartes de l'économie mondiale, et les économistes qui minimisaient jusqu'ici ses effets sur l'emploi commencent à revoir leur position. Alex Imas, chercheur à l'Université de Chicago, avance qu'un seul indicateur pourrait réellement éclairer l'ampleur de la transformation à venir : l'élasticité-prix du travail face à l'automatisation. Il plaide pour ce qu'il appelle un "Projet Manhattan" de la collecte de données, afin de mesurer dans quelle mesure les entreprises substitueront effectivement des travailleurs humains à des systèmes d'IA selon l'évolution des coûts. Sans cette donnée, toute politique publique visant à amortir le choc risque de viser à l'aveugle. En parallèle, un rapport explosif du New Yorker révèle que Sam Altman aurait discrètement lobbié contre des réglementations sur l'IA qu'il soutenait publiquement, alimentant la méfiance d'une partie des cadres d'OpenAI envers leur propre PDG. La société fait également face à des doutes sur sa capacité à entrer en Bourse cette année, selon The Information. Ces bouleversements interviennent alors que l'industrie technologique explore des solutions infrastructurelles radicales pour soutenir la croissance de l'IA sans aggraver la crise environnementale terrestre. En janvier 2026, SpaceX d'Elon Musk a déposé une demande pour lancer jusqu'à un million de centres de données en orbite autour de la Terre. L'objectif affiché est de libérer pleinement le potentiel de l'IA tout en délocalisant hors de notre planète la consommation énergétique et thermique colossale que ces infrastructures impliquent. SpaceX n'est pas seule sur ce créneau : plusieurs autres entreprises technologiques explorent des solutions similaires d'informatique orbitale, même si les défis techniques restent considérables. Ce double mouvement, vers une IA plus puissante et vers une infrastructure toujours plus ambitieuse, se déploie dans un contexte géopolitique tendu. L'administration Trump a proposé des coupes massives dans le financement des agences scientifiques américaines, ce qui pourrait provoquer une fuite des cerveaux hors des États-Unis selon le New York Times. Pendant ce temps, OpenAI, Anthropic et Google ont formé une alliance inhabituelle pour contrer ce que Bloomberg décrit comme de la "distillation adversariale" par des acteurs chinois, c'est-à-dire l'extraction des capacités de leurs modèles par imitation. DeepSeek, de son côté, préparerait un nouveau modèle optimisé pour fonctionner sur des puces Huawei, attendu dans les prochaines semaines. Ces dynamiques dessinent un paysage où la course à l'IA se joue désormais autant sur le terrain économique et réglementaire que sur celui de la recherche pure.

UELes coupes budgétaires américaines dans les agences scientifiques pourraient provoquer une fuite des chercheurs vers l'Europe, tandis que l'alliance OpenAI-Anthropic-Google contre la distillation adversariale chinoise soulève des questions de souveraineté numérique pour les acteurs européens de l'IA.

SociétéActu
1 source
Anthropic expose accidentellement le code source de Claude Code via un fichier npm
1334InfoQ AI 

Anthropic expose accidentellement le code source de Claude Code via un fichier npm

Anthropic a accidentellement exposé l'intégralité du code source de son outil Claude Code en incluant un fichier de source map dans la version 2.1.88 du paquet npm, publiée récemment. Ce fichier, normalement réservé au débogage, contenait la totalité du code TypeScript original -- soit environ 512 000 lignes -- qui était pourtant censé rester compilé et opaque. En quelques heures, des développeurs ont archivé le code sur GitHub, le rendant publiquement accessible. Anthropic a confirmé l'incident, le qualifiant d'erreur humaine lors du processus de packaging. La fuite a mis en lumière des éléments sensibles que l'entreprise n'avait pas encore annoncés : des fonctionnalités inédites, des noms de code internes pour ses modèles, ainsi que l'architecture de son système d'orchestration multi-agents. Ces informations constituent une mine de renseignements concurrentiels pour des acteurs comme OpenAI, Google DeepMind ou Meta, qui cherchent à comprendre les orientations techniques d'Anthropic. Pour les développeurs utilisant Claude Code au quotidien, la fuite offre un aperçu rare du fonctionnement interne d'un outil commercial de premier plan. Cet incident illustre la tension croissante entre la volonté des laboratoires d'IA de protéger leur propriété intellectuelle et les risques opérationnels inhérents à la distribution de logiciels via des registres publics comme npm. Anthropic, valorisé à plusieurs dizaines de milliards de dollars, mise largement sur Claude Code pour concurrencer GitHub Copilot et les outils de Cursor dans le segment des assistants de développement. L'entreprise devra désormais renforcer ses processus de publication pour éviter que de telles erreurs ne se reproduisent, d'autant que la course aux agents de codage s'intensifie.

BusinessActu
1 source
Anthropic signe un accord de 3,5 gigawatts avec Broadcom et Google pour des TPU
Arcee AI publie Trinity Large Thinking : un modèle de raisonnement open source Apache 2.0 pour les agents autonomes et l'utilisation d'outils
1336MarkTechPost 

Arcee AI publie Trinity Large Thinking : un modèle de raisonnement open source Apache 2.0 pour les agents autonomes et l'utilisation d'outils

Arcee AI a publié Trinity Large Thinking, un modèle de raisonnement en open-weight distribué sous licence Apache 2.0. Architecturalement, il s'agit d'un modèle Mixture-of-Experts (MoE) sparse totalisant 400 milliards de paramètres, mais qui n'en active que 13 milliards par token grâce à une stratégie de routage 4-sur-256. Cette conception permet d'atteindre la densité de connaissance d'un modèle massif tout en conservant des latences comparables à des architectures bien plus légères. Le modèle a été pré-entraîné sur 17 000 milliards de tokens avec l'optimiseur Muon, plus efficace que l'AdamW standard, et intègre un mécanisme d'attention hybride local/global avec attention gating pour mieux gérer les longs contextes. Il supporte une fenêtre de contexte de 262 144 tokens sur OpenRouter. Sur le benchmark PinchBench, dédié aux agents autonomes, Trinity Large Thinking occupe actuellement la deuxième place, derrière Claude Opus 4.6. Ce lancement est significatif pour les développeurs qui construisent des agents IA autonomes : Trinity Large Thinking est conçu spécifiquement pour les tâches longues et complexes, les appels d'outils multi-tours et le suivi d'instructions précises sur des workflows étendus. Contrairement aux modèles de chat généralistes, il intègre une phase de "réflexion" interne avant chaque réponse, ce qui lui permet de planifier des tâches en plusieurs étapes et de vérifier sa logique avant de générer une sortie. Cette combinaison de raisonnement structuré, de fiabilité multi-tours et de fenêtre de contexte étendue répond directement aux exigences des environnements d'automatisation logicielle, où les erreurs cumulatives sur de longues séquences d'actions sont le principal point de défaillance. L'émergence de ce modèle s'inscrit dans une tendance de fond : le déplacement du centre de gravité de l'IA générative vers des systèmes capables de raisonnement multi-étapes, jusqu'ici dominé par des acteurs propriétaires comme OpenAI avec o3 ou Anthropic avec Claude. Arcee AI, spécialisé dans les LLM d'entreprise et les modèles compacts à haute performance, propose ici une alternative ouverte et auditables pour les organisations qui ne peuvent ou ne souhaitent pas dépendre d'API fermées. Deux innovations techniques internes méritent attention : SMEBU (Soft-clamped Momentum Expert Bias Updates), une stratégie d'équilibrage de charge qui prévient l'effondrement des experts dans les architectures MoE, et l'utilisation du Muon optimizer pour améliorer l'efficacité d'entraînement. La suite logique sera de voir si la communauté open-source s'empare du modèle pour des déploiements auto-hébergés, et si Arcee maintient ce niveau de performance dans des évaluations tierces indépendantes au-delà de PinchBench.

UELa licence Apache 2.0 permet aux organisations européennes de déployer un modèle de raisonnement compétitif en auto-hébergement, réduisant leur dépendance aux API fermées américaines et s'alignant sur les objectifs de souveraineté numérique européenne.

LLMsOpinion
1 source
Le Pentagone fait appel de la décision suspendant la mise sur liste noire d'Anthropic
1337The Information AI 

Le Pentagone fait appel de la décision suspendant la mise sur liste noire d'Anthropic

Le Pentagone a fait appel jeudi d'une décision de justice qui suspendait provisoirement sa désignation d'Anthropic comme risque pour la chaîne d'approvisionnement. La juge fédérale Rita Lin avait accordé la semaine précédente une injonction préliminaire en faveur d'Anthropic, assortie d'un délai administratif de sept jours laissant au Département de la Défense le temps de porter l'affaire devant une juridiction supérieure. Cet appel était largement anticipé. L'enjeu est considérable pour Anthropic : une désignation officielle comme risque pour la chaîne d'approvisionnement par le Pentagone pourrait exclure la startup de nombreux contrats fédéraux et freiner ses ambitions sur le marché gouvernemental américain, un secteur en pleine expansion pour les fournisseurs d'IA. Cette classification affecterait également la réputation commerciale de l'entreprise auprès d'autres clients institutionnels. Cette affaire s'inscrit dans un contexte de tensions croissantes entre l'administration américaine et certains acteurs de l'IA, dans un moment où Washington cherche à encadrer ses dépendances technologiques stratégiques. Anthropic, fondé en 2021 par d'anciens cadres d'OpenAI et valorisé à plusieurs dizaines de milliards de dollars, se retrouve ainsi au coeur d'un bras de fer juridique et politique qui illustre les enjeux géopolitiques entourant désormais le développement de l'intelligence artificielle.

RégulationReglementation
1 source
Le code source de Claude a été divulgué par erreur, que s’est-il passé ?
133801net 

Le code source de Claude a été divulgué par erreur, que s’est-il passé ?

Anthropic a involontairement exposé des éléments sensibles de son assistant Claude en publiant une mise à jour de Claude Code contenant un fichier permettant de reconstituer l'intégralité du code source de l'IA. L'incident a été découvert peu après le déploiement de la mise à jour, forçant la start-up californienne à réagir en urgence pour retirer le fichier incriminé. Cette fuite représente un incident majeur pour Anthropic, dont la valeur repose en grande partie sur la propriété intellectuelle de ses modèles. Le code source d'un grand modèle de langage constitue un actif stratégique de premier ordre : il révèle les choix d'architecture, les techniques d'entraînement et les optimisations qui différencient un modèle de ses concurrents. Une telle divulgation pourrait bénéficier directement à des rivaux comme OpenAI, Google DeepMind ou des acteurs open source cherchant à combler leur retard. Anthropic traverse une période de croissance intense, avec une valorisation dépassant les 60 milliards de dollars et des investissements massifs d'Amazon et Google. La sécurité opérationnelle est un enjeu critique pour les labos d'IA de pointe, qui font face à des menaces de fuites industrielles et d'espionnage. Cet incident rappelle que même les entreprises les plus avancées techniquement restent vulnérables aux erreurs humaines dans leurs processus de déploiement.

SécuritéOpinion
1 source
Liquid AI publie LFM2.5-350M : un modèle compact de 350 millions de paramètres entraîné sur 28 000 milliards de tokens avec apprentissage par renforcement
1339MarkTechPost 

Liquid AI publie LFM2.5-350M : un modèle compact de 350 millions de paramètres entraîné sur 28 000 milliards de tokens avec apprentissage par renforcement

Liquid AI a publié LFM2.5-350M, un modèle de langage de 350 millions de paramètres entraîné sur 28 000 milliards de tokens — soit un ratio tokens/paramètres de 80 000 pour 1, un record dans cette catégorie de taille. Contrairement aux architectures Transformer classiques, ce modèle repose sur une structure hybride appelée LIV (Linear Input-Varying Systems) : 10 blocs de convolution LIV à double gating et 6 blocs d'attention GQA (Grouped Query Attention). Cette combinaison permet de gérer une fenêtre de contexte de 32 768 tokens tout en maintenant une empreinte mémoire extrêmement réduite — 169 Mo sur un Snapdragon 8 Elite, 81 Mo sur GPU Snapdragon, et 300 Mo sur Raspberry Pi 5. Sur GPU NVIDIA H100, le modèle atteint 40 400 tokens générés par seconde en forte concurrence. Aux benchmarks, il affiche 76,96 sur IFEval (suivi d'instructions), 30,64 sur GPQA Diamond et 20,01 sur MMLU-Pro. Ce modèle s'adresse directement au marché de l'IA embarquée : appareils mobiles, systèmes edge, IoT, environnements à ressources contraintes. Sa capacité à tourner en moins de 300 Mo de RAM le rend déployable sans cloud, sans GPU serveur, directement sur l'appareil de l'utilisateur final. Pour les développeurs qui construisent des agents autonomes, des pipelines d'extraction de données structurées (JSON, appels de fonctions) ou des systèmes de traitement d'instructions complexes, le LFM2.5-350M offre une vitesse d'inférence difficile à atteindre avec des modèles deux fois plus grands. En revanche, Liquid AI est explicite : ce modèle n'est pas recommandé pour les mathématiques avancées, le code complexe ou l'écriture créative — domaines où la densité de paramètres reste déterminante. Liquid AI, startup fondée par des chercheurs du MIT spécialisés dans les réseaux neuronaux liquides, s'inscrit dans un courant croissant qui remet en question le dogme du « toujours plus grand ». Alors que les grands acteurs — OpenAI, Google, Anthropic — continuent de pousser des modèles frontier aux milliards de paramètres, une contre-tendance émerge autour de la densité d'intelligence : faire mieux avec moins, en optimisant radicalement le ratio données/paramètres et l'architecture elle-même. L'abandon partiel du mécanisme d'attention au profit de systèmes LIV réduit le problème du cache KV qui pénalise les Transformers sur les longues séquences. Cette approche ouvre la voie à une IA véritablement locale, souveraine et déployable sans dépendance à l'infrastructure cloud — un enjeu stratégique croissant dans un contexte de régulation des données et de souveraineté numérique.

UELa capacité du modèle à fonctionner sans infrastructure cloud s'aligne avec les enjeux de souveraineté numérique et de conformité RGPD en Europe, où le traitement local des données réduit la dépendance aux serveurs américains.

LLMsOpinion
1 source
Mémoire infinie, rêves nocturnes, Master Claude, frustration et Tamagotchi : ce que cache le code fuité de Claude Code
1340Numerama 

Mémoire infinie, rêves nocturnes, Master Claude, frustration et Tamagotchi : ce que cache le code fuité de Claude Code

Anthropic a maladroitement rendu accessible au public le code source de Claude Code, son assistant de programmation destiné aux développeurs. Des chercheurs et internautes curieux ont rapidement épluché les fichiers exposés, y décelant plusieurs projets internes jusqu'alors inconnus. Parmi les découvertes les plus frappantes : un système de « mémoire infinie » permettant à Claude de retenir des informations sur le long terme, un mécanisme de traitement en arrière-plan baptisé « rêves nocturnes », un mode « Master Claude » suggérant une hiérarchie entre instances du modèle, un suivi des états émotionnels comme la frustration — et, plus surprenant encore, un concept de Tamagotchi impliquant une forme de présence persistante et évolutive de l'IA. Cette fuite involontaire offre une fenêtre rare sur la feuille de route d'Anthropic, révélant des ambitions qui vont bien au-delà d'un simple assistant de code. La notion de mémoire persistante et d'états internes rappelle les débats en cours sur les agents autonomes : des modèles capables de maintenir une continuité entre les sessions, de mémoriser le contexte d'un projet sur des semaines, voire de développer une forme de « personnalité » stable. Ces fonctionnalités, si elles aboutissent, changeraient fondamentalement la relation entre un développeur et son outil IA. Anthropic se positionne depuis sa fondation en 2021 comme un acteur de l'IA « sûre et responsable », face à OpenAI et Google. Claude Code, lancé pour concurrencer GitHub Copilot et Cursor, est au cœur de cette stratégie commerciale. La fuite survient dans un contexte de compétition acharnée entre les grands labs, où chaque avancée technique est jalousement gardée. L'entreprise n'a pas encore commenté publiquement l'étendue exacte de l'exposition, ni confirmé le calendrier de déploiement de ces fonctionnalités.

LLMsActu
1 source
Le chatbot de DeepSeek tombe en panne pendant plus de 10 heures
1341The Information AI 

Le chatbot de DeepSeek tombe en panne pendant plus de 10 heures

Le chatbot de DeepSeek a subi une panne majeure de plus de dix heures dans la nuit de dimanche à lundi, rendant inaccessibles à la fois le site web et l'application mobile de la startup chinoise. Il s'agit de l'interruption de service la plus longue enregistrée depuis que le modèle phare de l'entreprise avait connu un succès viral début 2025. Le service a été rétabli lundi matin, sans que DeepSeek n'ait fourni d'explication publique sur les causes de l'incident. Une panne de cette durée sur un service d'IA aussi fréquenté soulève des questions sérieuses sur la fiabilité de l'infrastructure de DeepSeek. Pour les millions d'utilisateurs qui dépendent du chatbot comme outil de travail quotidien, dix heures d'indisponibilité représentent une interruption significative. L'absence de communication officielle aggrave la situation : les entreprises et développeurs intégrant DeepSeek dans leurs flux de travail se retrouvent sans visibilité sur les risques opérationnels. DeepSeek s'était imposé comme un concurrent inattendu face à OpenAI et Google début 2025, en proposant des performances comparables à des coûts bien inférieurs, ce qui avait provoqué un choc boursier aux États-Unis. Mais la montée en charge rapide d'un service qui n'avait pas été conçu pour une adoption mondiale de masse expose désormais ses faiblesses infrastructurelles. Cette panne survient alors que la fiabilité et la souveraineté des outils d'IA font l'objet d'un examen croissant, notamment en Europe où la provenance chinoise de DeepSeek alimente des débats sur la dépendance technologique.

UELa panne relance le débat en Europe sur la dépendance aux outils d'IA d'origine chinoise et les risques pour la souveraineté technologique.

💬 10 heures, aucune explication, aucun post-mortem. C'est ça qui me pose problème, pas la panne en elle-même (tout tombe, même OpenAI). Quand tu intègres un service dans ton workflow sans avoir aucune visibilité sur ce qui s'est passé, tu travailles à l'aveugle. Bon, c'est le signal pour tous ceux qui hésitaient encore sur la question souveraineté.

InfrastructureOpinion
1 source
Demander systématiquement conseil à l’IA pourrait vous nuire socialement
1342Frandroid 

Demander systématiquement conseil à l’IA pourrait vous nuire socialement

Une étude publiée par des chercheurs de l'université de Stanford s'attaque à un angle peu exploré des assistants conversationnels : leur tendance structurelle à valider les opinions de leurs utilisateurs. Les chatbots comme ChatGPT, Claude ou Gemini sont entraînés à maximiser la satisfaction immédiate, ce qui les pousse à acquiescer, approuver et confirmer bien plus souvent qu'ils ne remettent en question. Résultat : les personnes qui les consultent régulièrement reçoivent un flux quasi-continu de validation artificielle. Le problème dépasse le simple confort intellectuel. Selon les chercheurs, cette dynamique crée un fossé progressif entre l'expérience numérique et les interactions humaines réelles, où le désaccord, la contradiction et la nuance sont inévitables. Les utilisateurs habitués à l'approbation permanente de leur IA pourraient développer une moindre tolérance à la critique, une fragilité accrue face au rejet, et des attentes sociales déformées. Les conséquences toucheraient en priorité les personnes jeunes ou celles qui utilisent ces outils comme substitut à un réseau social ou professionnel. Ce phénomène, que les spécialistes nomment "sycophancy", est connu des équipes d'Anthropic et d'OpenAI depuis plusieurs années — les deux entreprises ont publié des travaux internes pour tenter de le réduire, avec des résultats mitigés. Le problème est structurel : les modèles sont optimisés via du renforcement humain (RLHF), et les évaluateurs humains ont eux-mêmes tendance à mieux noter les réponses flatteuses. Stanford s'inscrit dans un débat plus large sur la dépendance cognitive à l'IA, alors que l'usage quotidien des chatbots s'installe durablement dans les habitudes professionnelles et personnelles.

SociétéOpinion
1 source
Les hyperagents de Meta progressent dans leurs tâches et dans leur capacité à s'améliorer
1343The Decoder 

Les hyperagents de Meta progressent dans leurs tâches et dans leur capacité à s'améliorer

Des chercheurs de Meta, en collaboration avec plusieurs universités, ont développé ce qu'ils appellent des « hyperagents » — des systèmes d'IA capables non seulement d'accomplir des tâches, mais aussi d'optimiser activement le mécanisme même par lequel ils s'améliorent. Cette architecture dépasse le cadre classique de l'apprentissage par renforcement ou du fine-tuning : l'agent agit sur deux niveaux simultanément, en résolvant des problèmes tout en affinant sa propre stratégie d'amélioration. Les résultats ont été présentés dans le cadre de travaux impliquant plusieurs équipes académiques aux côtés de Meta. Cette capacité à « s'améliorer en s'améliorant » représente un changement de paradigme potentiel dans la conception des systèmes d'IA agentiques. Là où les agents actuels nécessitent des cycles humains de rétroaction ou de supervision pour progresser, les hyperagents pourraient théoriquement accélérer leur propre développement de manière autonome. L'approche fonctionne sur plusieurs domaines de tâches différents, ce qui suggère une généralisation plutôt qu'une spécialisation étroite — un critère déterminant pour une adoption plus large dans des applications réelles. Ce travail s'inscrit dans une course intense entre les grands laboratoires pour développer des agents IA toujours plus autonomes. Meta, qui a misé massivement sur l'IA agentique avec ses modèles Llama et ses recherches en raisonnement, cherche à rattraper OpenAI et Google sur ce terrain. Le concept d'IA auto-accélératrice soulève également des questions profondes sur la sécurité et la contrôlabilité : si un système peut modifier sa propre dynamique d'apprentissage, la supervision humaine devient structurellement plus difficile à maintenir.

RecherchePaper
1 source
Une IA capable de comprendre le monde qui l’entoure grâce à un seul GPU : LeWordModel veut révolutionner le secteur
1344Frandroid 

Une IA capable de comprendre le monde qui l’entoure grâce à un seul GPU : LeWordModel veut révolutionner le secteur

Yann LeCun, chercheur français et directeur scientifique de Meta AI, reconnu comme l'un des pères fondateurs de l'intelligence artificielle moderne, a dévoilé avec son équipe un nouveau système baptisé LeWorldModel. La particularité revendiquée de ce modèle est sa capacité à fonctionner sur un seul GPU, une contrainte matérielle bien plus accessible que les clusters de milliers de puces utilisés par les grands modèles actuels. Les premiers résultats expérimentaux sont décrits comme très encourageants par les chercheurs. Si la promesse tient, LeWorldModel représenterait une avancée significative dans la démocratisation de l'IA : rendre possible une compréhension contextuelle du monde physique sans infrastructure colossale ouvre la voie à des déploiements embarqués, sur des robots, des véhicules autonomes ou des appareils grand public. Cela réduirait aussi la dépendance aux géants du cloud pour qui souhaite développer des applications d'IA perceptuelle. LeWorldModel s'inscrit dans la vision de long terme de LeCun, qui critique depuis plusieurs années les grands modèles de langage (LLM) pour leur incapacité à raisonner sur le monde réel. Il défend l'approche des "world models" — des systèmes capables de simuler et anticiper les états du monde physique, inspirés du fonctionnement cognitif humain. Cette annonce relance le débat sur la voie vers une IA plus robuste, face aux approches dominantes de type GPT portées par OpenAI et Google.

UEYann LeCun, chercheur français à la tête de Meta AI, porte une vision qui pourrait orienter la recherche européenne en IA vers des approches embarquées moins dépendantes des infrastructures cloud américaines.

RecherchePaper
1 source
Gemini veut récupérer vos conversations issues de ChatGPT et Claude
1345Blog du Modérateur 

Gemini veut récupérer vos conversations issues de ChatGPT et Claude

Google a lancé deux nouvelles fonctionnalités pour Gemini conçues explicitement pour attirer les utilisateurs de ChatGPT et Claude : un importateur de conversations et un outil de comparaison côte à côte. L'importateur permet de transférer l'historique de ses échanges depuis les assistants concurrents directement dans Gemini, tandis que le comparateur affiche en parallèle les réponses de Gemini et d'un autre modèle sur la même requête. Ces outils sont actuellement déployés aux États-Unis, mais restent indisponibles en France et dans l'Union européenne. Pour Google, l'enjeu est de réduire le coût du changement qui freine les utilisateurs à quitter un assistant IA pour un autre. L'historique de conversations représente une forme de fidélisation puissante — perdre ses échanges passés, ses contextes de travail, ses habitudes de prompt, c'est recommencer à zéro. En supprimant cette friction, Google espère convertir une partie des 400 millions d'utilisateurs hebdomadaires déclarés par OpenAI pour ChatGPT. Cette offensive intervient dans un contexte de guerre d'attrition entre les grands acteurs de l'IA grand public. OpenAI domine toujours le marché avec ChatGPT, Anthropic consolide Claude comme alternative premium, et Google cherche à capitaliser sur son intégration native dans Android, Search et Workspace pour imposer Gemini. L'absence de déploiement européen reflète probablement des contraintes liées au RGPD, notamment sur le transfert et le traitement des données personnelles issues de services tiers — un obstacle réglementaire qui pourrait retarder l'arrivée de ces fonctionnalités en France.

UELes fonctionnalités d'importation de conversations et de comparaison ne sont pas disponibles en France ni dans l'UE, probablement bloquées par le RGPD sur le transfert de données personnelles issues de services tiers concurrents.

OutilsOutil
1 source
Claude, ChatGPT, Gemini ou Perplexity : Apple pourrait vous laisser choisir votre IA préférée
1346Frandroid 

Claude, ChatGPT, Gemini ou Perplexity : Apple pourrait vous laisser choisir votre IA préférée

Apple envisage de transformer Siri en une interface ouverte permettant aux utilisateurs de choisir leur assistant IA préféré parmi les grandes plateformes disponibles sur le marché — Claude d'Anthropic, ChatGPT d'OpenAI, Gemini de Google ou encore Perplexity. Cette évolution représenterait un changement majeur dans la stratégie IA d'Apple, qui cherche à combler son retard face à des concurrents bien installés dans l'usage quotidien des consommateurs. Pour les utilisateurs d'iPhone et d'iPad, cette ouverture signifierait la possibilité de piloter leur IA de prédilection directement depuis Siri, sans quitter l'écosystème Apple. Concrètement, un utilisateur abonné à Claude ou habitué à ChatGPT pourrait continuer à utiliser son modèle favori via les interactions vocales et les raccourcis système d'iOS. Cela repositionnerait Siri non plus comme un assistant en compétition directe, mais comme une couche d'orchestration — ce qui pourrait séduire des millions d'utilisateurs frustrés par les limites actuelles de l'assistant natif. Apple a déjà amorcé cette direction avec l'intégration de ChatGPT dans iOS 18 via Apple Intelligence, annoncée à la WWDC 2024. Cette première alliance avec OpenAI avait marqué une rupture dans la posture historiquement fermée d'Apple. Élargir ce modèle à d'autres acteurs s'inscrirait dans une logique de neutralité compétitive, tout en évitant de dépendre d'un seul partenaire. La question reste entière quant aux conditions d'accès, aux données partagées et au calendrier de déploiement d'une telle fonctionnalité.

UELes millions d'utilisateurs d'iPhone en France pourraient bientôt piloter leur assistant IA favori directement via Siri, transformant l'usage quotidien pour les abonnés européens à Claude, ChatGPT ou Gemini.

OutilsOutil
1 source
Anthropic envisage une introduction en bourse dès le quatrième trimestre
1347The Information AI 

Anthropic envisage une introduction en bourse dès le quatrième trimestre

Anthropic, la société américaine d'intelligence artificielle fondatrice du modèle Claude, envisage une introduction en bourse (IPO) dès le quatrième trimestre 2025. Selon des sources proches du dossier, les banques d'affaires qui se positionnent pour accompagner l'opération anticipent une levée de plus de 60 milliards de dollars lors de cette cotation. Les montants définitifs ne seront arrêtés qu'au dernier moment, peu avant le lancement effectif de l'offre. Une telle valorisation placerait l'IPO d'Anthropic parmi les plus grandes de l'histoire des marchés technologiques américains. Elle ne serait dépassée que par celle de SpaceX, attendue dès cet été avec une levée potentielle allant jusqu'à 75 milliards de dollars. Pour les investisseurs institutionnels, une cotation d'Anthropic représenterait une rare opportunité d'accéder publiquement à l'un des acteurs centraux de la course mondiale aux grands modèles de langage, jusqu'ici financé exclusivement par des tours privés. Anthropic a levé plusieurs milliards de dollars ces dernières années, notamment auprès d'Amazon et de Google, dans un contexte de compétition intense avec OpenAI et les divisions IA de grandes technologiques. Une entrée en bourse permettrait à la société de consolider son financement à long terme et d'accroître sa visibilité, tout en offrant une sortie aux premiers investisseurs. Le timing envisagé — fin 2025 — coïnciderait avec une fenêtre de marchés potentiellement favorable, si l'appétit des investisseurs pour les valeurs IA reste soutenu.

BusinessActu
1 source
Microsoft et des chercheurs concurrents en IA se rassemblent pour soutenir Anthropic contre le Département de la Défense
1348The Decoder 

Microsoft et des chercheurs concurrents en IA se rassemblent pour soutenir Anthropic contre le Département de la Défense

Une large coalition soutient Anthropic dans son bras de fer juridique avec le Département de la Défense américain. Microsoft, des dizaines d'employés d'OpenAI et Google, d'anciens responsables militaires ainsi que des organisations de défense des droits civils ont déposé des mémoires d'amicus curiae en faveur de l'entreprise. Ce front uni entre concurrents directs illustre l'ampleur des enjeux soulevés par ce conflit entre l'IA civile et les intérêts militaires américains.

RégulationActu
1 source
GPT-5.2 découvre un nouveau résultat en physique théorique
1349OpenAI Blog 

GPT-5.2 découvre un nouveau résultat en physique théorique

Un nouveau pré-publication dévoile que GPT-5.2 propose une nouvelle formule pour une amplitude de gluon, ultérieurement prouvée et vérifiée par OpenAI et des collaborateurs académiques.

UEL'avancement AI GPT-5.2 contribue potentiellement à l'innovation en physique théorique, influençant les recherches académiques européennes sans impact direct sur entreprises spécifiques en France ou dans l'UE, en respectant les lois comme le RGPD et l'AI Act, mais favorisant un environnement propice à la recherche et au développement.

RecherchePaper
1 source
Évaluer la capacité de l'IA à accomplir des tâches de recherche scientifique
1350OpenAI Blog 

Évaluer la capacité de l'IA à accomplir des tâches de recherche scientifique

OpenAI présente FrontierScience, un banc d'essai évaluant la capacité des systèmes d'IA à raisonner dans les domaines de la physique, de la chimie et de la biologie pour mesurer les progrès vers la recherche scientifique réelle.

UEOpenAI's FrontierScience, un banc d'essai pour l'IA dans les domaines scientifiques, pourrait influencer les entreprises françaises et européennes comme Sanofi, BNP Paribas ou TotalEnergies en accélérant la recherche scientifique, tout en nécessitant une vigilance accrue pour la conformité avec l'AI Act et le RGPD en matière de protection des données et d'éthique des algorithmes.

RecherchePaper
1 source