Aller au contenu principal

Dossier OpenAI — page 26

1663 articles · page 26 sur 34

Toute l'actualité d'OpenAI : nouvelles versions de ChatGPT et GPT, stratégie produit, partenariats, controverses et décisions de Sam Altman.

Memory OS : une architecture mémoire open source à 6 couches pour agents Hermes
1251MarkTechPost OutilsOutil

Memory OS : une architecture mémoire open source à 6 couches pour agents Hermes

Un développeur de la communauté open-source, ClaudioDrews, vient de publier Memory OS, une bibliothèque sous licence MIT qui superpose six couches de mémoire à Hermes Agent, l'agent conversationnel de Nous Research. Là où Hermes propose déjà des fichiers de workspace et une base de données de sessions avec recherche plein texte, Memory OS y ajoute une base vectorielle Qdrant, des faits structurés avec scoring de confiance, un wiki de concepts auto-curé, et un système de rappel chirurgical à chaque appel LLM. L'ensemble tourne en local via Docker, Qdrant, Redis et Python 3.11+, et fonctionne avec n'importe quel fournisseur LLM supporté par Hermes : OpenRouter, OpenAI, Anthropic ou Ollama. Les six couches vont du simple fichier MEMORY.md injecté dans le prompt système (couche 1) jusqu'à un wiki LLM continuellement réingéré dans Qdrant (couche 6), en passant par une base SQLite avec FTS5, des vecteurs Cosine en 4096 dimensions combinés à une recherche BM25, et une version fortement remaniée du plugin Icarus gérant le rappel inter-sessions via 16 outils dédiés. L'intérêt concret de cette architecture réside dans son mécanisme de récupération : à chaque appel LLM, le système interroge simultanément quatre sources (Fabric, Qdrant, Sessions, Facts), filtre les résultats par seuil de pertinence, déduplique par session et ignore les messages triviaux. En sortie de session, il extrait et capitalise automatiquement les nouveaux apprentissages. Un scanner hebdomadaire fait vieillir les entrées obsolètes, et une déduplication sémantique fusionne les souvenirs quasi-identiques dès que la similarité cosinus dépasse 0,92. L'objectif affiché est l'efficacité en tokens : ne charger dans le contexte que ce qui est réellement utile, pas saturer la fenêtre. Pour les équipes soumises à des règles de résidence des données, le fait que rien ne quitte la machine locale représente un avantage réel que les services cloud comme mem0, Zep ou Letta ne peuvent pas offrir. Memory OS s'inscrit dans un débat plus large sur la mémoire des agents IA : jusqu'où peut-on aller avec une mémoire embarquée dans l'agent lui-même, sans passer par une infrastructure cloud payante ? Hermes Agent propose déjà huit fournisseurs de mémoire externes officiels, dont mem0 et Honcho, mais Memory OS n'en fait pas partie, c'est une surcouche communautaire indépendante, ce qui dit quelque chose sur l'appétit des développeurs pour des solutions souveraines. Le projet est récent et sa maturité reste à prouver à l'usage, mais son architecture en cascade de fallback (hybride, puis vectoriel dense, puis lexical, puis SQLite) montre une réflexion sérieuse sur la robustesse. Si l'adoption suit, ce type de stack mémoire locale pourrait devenir un modèle de référence pour les agents à usage intensif en entreprise.

UEL'architecture 100 % locale de Memory OS répond directement aux exigences de résidence des données imposées par le RGPD, offrant aux entreprises européennes une alternative souveraine aux services mémoire cloud pour leurs agents IA.

1 source
Les fournisseurs d'inférence connaissent-ils un essor ?
1252The Information AI 

Les fournisseurs d'inférence connaissent-ils un essor ?

Il y a moins d'un an, les fournisseurs d'inférence spécialisés suscitaient un scepticisme marqué dans l'industrie de l'IA. Des startups comme Fireworks AI, Baseten et Together AI, qui louent des serveurs Nvidia à des développeurs d'applications et les aident à déployer des modèles open source, avaient connu une croissance rapide, mais semblaient fragilisées face à la concurrence des grands fournisseurs cloud. Ces derniers disposent en effet d'un avantage structurel majeur : ils possèdent leurs propres puces, là où les fournisseurs d'inférence doivent d'abord les louer à AWS, Google ou Azure avant de les revendre à leurs clients, ce qui comprime mécaniquement leurs marges brutes. Pourtant, le discours dominant a changé. Ces acteurs spécialisés semblent aujourd'hui trouver leur place dans un écosystème où la demande d'inférence explose, portée par la multiplication des applications IA en production. Leur proposition de valeur, flexibilité, optimisation technique, et support des modèles open source, répond à des besoins que les clouds généralistes satisfont moins bien, notamment pour les équipes cherchant à éviter l'enfermement propriétaire et à contrôler précisément leurs coûts d'inférence. Ce retournement s'inscrit dans une dynamique plus large : avec la prolifération des modèles open source performants comme Llama ou Mistral, les développeurs disposent désormais d'alternatives crédibles aux API propriétaires d'OpenAI ou Anthropic. Les fournisseurs d'inférence se positionnent comme l'infrastructure neutre de ce marché alternatif, pariant sur le fait que la fragmentation des modèles leur garantit une demande structurelle durable face aux géants du cloud.

UELa montée en puissance des fournisseurs d'inférence open source renforce l'écosystème autour de Mistral (entreprise française), offrant aux développeurs européens une infrastructure neutre pour déployer des modèles sans dépendance aux API propriétaires.

InfrastructureOpinion
1 source
☕️ Les agences de renseignement américaines à court de puissance de calcul pour leurs IA
1253Next INpact 

☕️ Les agences de renseignement américaines à court de puissance de calcul pour leurs IA

La Maison Blanche aurait approuvé une enveloppe de 9 milliards de dollars destinée à doter les agences de renseignement américaines en puces IA de dernière génération, selon des informations rapportées par le New York Times. Ce financement, qui doit encore passer par le Congrès, vise à permettre à la CIA, la NSA et leurs homologues de faire tourner les modèles d'intelligence artificielle les plus récents sur des infrastructures à la hauteur. L'administration Trump aurait par ailleurs déjà redirigé 800 millions de dollars pour accélérer des achats de capacités de calcul en urgence. Parallèlement, la Maison Blanche aurait autorisé la NSA à continuer d'exploiter Mythos, le modèle le plus avancé d'Anthropic, dans le cadre d'un contrat classifié en préparation qui inclurait des restrictions sur le traitement de données concernant des citoyens américains. Les agences américaines se retrouvent dans la même situation que n'importe quel acteur privé : les infrastructures capables d'accueillir les grands modèles d'OpenAI, d'Anthropic ou de Google affichent complet, et les composants les plus puissants, comme les puces Grace Blackwell de NVIDIA, exigent des centres de données dotés de systèmes d'alimentation massifs. Or les réseaux infonuagiques classifiés du gouvernement, dont ceux opérés par AWS, ne peuvent pas être modernisés rapidement. Les agences n'auraient tout simplement pas anticipé les besoins en calcul de ces modèles, et les délais de déploiement restent incompressibles même avec de l'argent disponible. Résultat : les 800 millions déjà mobilisés représentent une goutte d'eau face à l'ampleur des besoins réels, et les 9 milliards supplémentaires n'arriveraient pas immédiatement sur le terrain. Cette situation s'inscrit dans une séquence de tensions entre Washington et les labos d'IA. Le Pentagone avait exigé un accès très large aux modèles avancés d'Anthropic pour ses opérations classifiées, ce qu'Anthropic a refusé, une affaire encore devant les tribunaux. Le DoD a finalement constitué un cercle de fournisseurs IA pour ses opérations secret défense, retenant OpenAI, Google, Microsoft et AWS, mais laissant Anthropic à l'écart, du moins officiellement. Le Pentagone qualifiait même l'entreprise de "risque" pour la chaîne d'approvisionnement et la sécurité nationale, ce qui rend d'autant plus notable la décision d'autoriser la NSA à continuer d'utiliser Mythos. Cette contradiction illustre la difficulté pour les institutions américaines de concilier impératifs de souveraineté numérique, besoins opérationnels croissants en IA, et dépendance inévitable envers quelques entreprises privées qui contrôlent les modèles les plus performants.

UELe retard des agences de renseignement américaines illustre les risques de dépendance envers quelques fournisseurs privés d'IA, un avertissement indirect pour les institutions européennes engagées dans des démarches de souveraineté numérique.

💬 9 milliards pour rattraper un retard que tout le monde voyait venir. Ce qui me frappe, c'est la contradiction : le Pentagone liste officiellement Anthropic comme un "risque sécurité" pour la chaîne d'approvisionnement, et pendant ce temps la NSA continue d'utiliser Mythos via un contrat classifié. Ça dit tout sur ce que vaut la "souveraineté numérique" quand les seuls modèles utilisables sont dans les mains de trois boîtes privées.

InfrastructureOpinion
1 source
La dette de prompts, de récupération et d'évaluation redéfinit discrètement le risque de l'IA en entreprise
1254VentureBeat AI 

La dette de prompts, de récupération et d'évaluation redéfinit discrètement le risque de l'IA en entreprise

Une étude du MIT publiée en 2025 révèle que 95 % des projets d'IA n'atteignent jamais la production ou ne génèrent aucune valeur concrète. Dans le même temps, une enquête de S&P Global Market Intelligence indique que 42 % des entreprises ont abandonné plusieurs initiatives d'IA en 2025, contre seulement 17 % l'année précédente. Derrière ces chiffres alarmants se cache un phénomène encore mal nommé : la dette technique liée à l'IA, qui se manifeste sous quatre formes distinctes. La première, la dette de prompts, est la plus visible : des ajustements non documentés, des corrections rapides empilées, l'absence de versionnage, et le "prompt stuffing", l'injection excessive de contexte dans les requêtes, transforment les prompts en code non typé, non testé et fragile. La deuxième forme, la dette de dépendance aux modèles, découle du fait que la logique applicative repose désormais sur des modèles externes (OpenAI, Anthropic, Google...) que l'entreprise ne contrôle pas : une mise à jour du fournisseur peut dégrader silencieusement les performances sans que personne ne le détecte immédiatement. La dette de récupération (retrieval debt) affecte les systèmes RAG, qui puisent dans des bases documentaires d'entreprise souvent désordonnées, dupliquées ou obsolètes, générant des réponses techniquement exactes mais périmées, difficiles à détecter précisément parce qu'elles semblent plausibles. Enfin, la dette d'évaluation reflète l'absence de standards de test continus, de jeux de données de référence et de monitoring en temps réel des déploiements. Ces nouvelles formes de dette ont des conséquences concrètes pour les directions techniques. Contrairement à la dette logicielle classique, localisée dans une base de code et reproductible, la dette IA est distribuée sur des couches hétérogènes, prompts, modèles, pipelines de données, infrastructure, et se manifeste de façon intermittente, en raison de la nature probabiliste des systèmes d'IA. Un bug traditionnel se reproduit et se corrige ; une dérive de modèle ou un prompt dégradé peut passer inaperçu pendant des semaines, s'aggraver progressivement et ne se révéler qu'en production. CTO et CIO perdent ainsi la visibilité sur les performances réelles de leurs systèmes, sans équivalent à l'intégration continue (CI/CD) pour les prompts et les modèles. Ce constat s'inscrit dans une transformation plus profonde de la définition même du risque technique. Pendant vingt ans, la dette technique désignait une architecture vieillissante ou du code mal maintenu, des problèmes circonscrits et relativement maîtrisables. L'IA introduit des dépendances externes non contrôlées, des comportements non déterministes et des pipelines de données vivants, rendant les points de défaillance à la fois plus nombreux et plus difficiles à anticiper. Les entreprises qui déploient des agents et des applications fondées sur des API de modèles fondamentaux s'exposent à des risques systémiques si elles ne mettent pas en place dès maintenant des pratiques de gouvernance adaptées : versionnage des prompts, tests de régression sur les sorties de modèles, et monitoring continu post-déploiement. La prochaine vague d'échecs d'IA ne viendra probablement pas d'hallucinations spectaculaires, mais d'une accumulation silencieuse de dettes invisibles.

BusinessOpinion
1 source
Hark obtient 700 millions de dollars pour son projet d’assistant IA universel
1255Le Big Data 

Hark obtient 700 millions de dollars pour son projet d’assistant IA universel

La startup Hark a annoncé le 21 mai 2026 une levée de fonds de 700 millions de dollars, portant sa valorisation à 6 milliards de dollars à peine quelques mois après sa fondation fin 2025. Fondée par Brett Adcock, déjà connu pour avoir lancé le fabricant de robots humanoïdes Figure AI et la compagnie d'aviation électrique Archer Aviation, Hark développe un assistant IA universel destiné au grand public. Le tour de table a été mené par Parkway Venture Capital avec la participation de Nvidia, AMD Ventures, Intel Capital, Qualcomm Ventures, Salesforce Ventures et ARK Invest. L'entreprise prévoit de lancer ses premiers modèles multimodaux dès l'été 2026, avant de déployer sa propre gamme de matériel dédié. Malgré cette levée exceptionnelle, Hark reste très discrète sur les détails techniques de son produit. La vision portée par Hark tranche avec la majorité des acteurs actuels de l'IA générative, concentrés sur les copilotes professionnels, les outils de développement ou l'automatisation d'entreprise. La startup vise l'expérience quotidienne de l'utilisateur ordinaire : un assistant capable d'écouter et de parler naturellement, de comprendre des images, de conserver une mémoire persistante et de s'adapter profondément au contexte personnel de chaque utilisateur. Selon Abidur Chowdhury, ancien designer chez Apple et désormais directeur du design chez Hark, les outils IA actuels restent encore trop orientés développeurs ou usages professionnels avancés, laissant un vide béant pour le grand public. L'ambition déclarée est de créer une interface centrale entre l'utilisateur, ses services numériques et ses appareils connectés, combinant logiciel, matériel et IA agentive dans une expérience unifiée. Cette levée de fonds massive reflète une conviction qui s'impose de plus en plus dans la Silicon Valley : la prochaine grande plateforme technologique ne sera pas un simple logiciel, mais une interface IA native capable de remplacer progressivement les couches applicatives existantes. Le fait que des fabricants de semi-conducteurs concurrents comme Nvidia, AMD et Intel Capital investissent simultanément dans le même projet illustre l'enjeu stratégique que représente le contrôle de la couche applicative IA de nouvelle génération. Brett Adcock lui-même a publiquement critiqué les modèles IA actuels qu'il juge trop basiques, insuffisamment personnalisés et incapables d'interagir naturellement. Hark entre ainsi en compétition indirecte avec des projets similaires portés par des acteurs établis comme Apple Intelligence, Google Gemini ou OpenAI, mais parie sur une approche matériel-logiciel intégrée, comparable à ce qu'Apple a réalisé avec l'iPhone, pour s'imposer comme la prochaine interface dominante de l'ère IA.

💬 Adcock lève 700 millions sur une conviction simple : les assistants IA actuels sont encore des outils pour geeks, et le grand public n'a rien de vraiment utilisable. C'est pas faux, et ça explique pourquoi Nvidia, AMD et Intel ont tous mis au même pot malgré leur rivalité, chacun veut être dans la prochaine plateforme dominante. Reste à voir ce que ça vaut cet été quand les premiers modèles sortent.

BusinessActu
1 source
Seedance 2.0 : Comment créer des vidéos TikTok avec l’IA ?
1256Le Big Data 

Seedance 2.0 : Comment créer des vidéos TikTok avec l’IA ?

Seedance 2.0, la nouvelle version du générateur vidéo IA développé par ByteDance, s'est imposée comme un outil de référence pour la création de contenu vertical destiné à TikTok. La mise à jour introduit deux avancées majeures : un moteur de mouvement de caméra piloté par prompt textuel, et un système de cohérence de personnage capable de mémoriser les traits faciaux, vêtements et détails graphiques d'un sujet d'une scène à l'autre. Concrètement, le créateur intègre des commandes comme « Zoom », « Pan » ou « Tilt » directement dans sa description textuelle, et le modèle génère automatiquement des séquences animées au format 9:16, sans studio ni équipe de production. Une image de référence ou un identifiant suffit pour que le système reproduise un personnage avec une précision quasi identique sur plusieurs épisodes. Ces fonctionnalités répondent à deux problèmes chroniques des créateurs de contenu sur TikTok : la qualité visuelle insuffisante des outils accessibles au grand public, et l'incohérence visuelle qui brise la narration dans les formats sériels. Jusqu'ici, maintenir l'apparence d'un personnage entre plusieurs séquences générées par IA nécessitait un travail manuel fastidieux ou des compétences techniques avancées. Seedance 2.0 automatise ce processus, ce qui ouvre la création de storytelling long terme à des créateurs solo, sans budget de production. Pour les marques et les créateurs qui construisent une identité visuelle sur la plateforme, l'outil permet de standardiser un univers graphique cohérent à grande échelle, un avantage compétitif direct dans un environnement où l'attention se gagne en moins d'une seconde. Seedance s'inscrit dans une course effrénée entre les grandes plateformes et startups à proposer des générateurs vidéo IA crédibles : Sora d'OpenAI, Veo de Google, Kling, Runway ou encore Pika Labs occupent le même terrain. ByteDance, maison mère de TikTok, dispose d'un avantage structurel évident : sa connaissance intime des formats qui performent sur sa propre plateforme et l'accès à des données d'entraînement massives issues des millions de vidéos publiées chaque jour. La version 2.0 marque une montée en gamme délibérée vers les créateurs professionnels et semi-professionnels, avec un positionnement qui cherche à dépasser le statut d'outil expérimental pour devenir un composant réel du workflow de production. La question qui reste ouverte est celle des droits : à mesure que ces outils génèrent des personnages de plus en plus réalistes et persistants, les enjeux juridiques autour de la ressemblance, du consentement et de la propriété des identités numériques vont inévitablement s'intensifier.

UELes enjeux de consentement et de droits sur les personnages générés de manière persistante entrent directement en résonance avec l'AI Act européen et le RGPD sur le traitement des données biométriques.

CréationOutil
1 source
Une école voulait filmer des enfants pour entraîner l’IA : les parents pètent les plombs
1257Le Big Data 

Une école voulait filmer des enfants pour entraîner l’IA : les parents pètent les plombs

L'Université de Washington a dû abandonner un projet de recherche après une levée de boucliers de parents d'élèves. L'étude prévoyait d'équiper des enseignants de maternelle de caméras embarquées et d'installer des dispositifs fixes dans les salles de classe, afin de capter les interactions quotidiennes entre professeurs et enfants. Ces enregistrements devaient alimenter des modèles d'intelligence artificielle capables d'analyser la qualité pédagogique des échanges en classe. Le dispositif reposait sur un opt-out qui incluait automatiquement tous les enfants, sauf refus explicite des parents. Selon 404 Media, qui a consulté les documents transmis aux familles, les vidéos pouvaient être traitées via des services d'IA hébergés dans le cloud, sans que les entreprises impliquées ni les modèles utilisés ne soient nommément identifiés. Face aux protestations, l'université a confirmé l'arrêt du programme peu après les premières réactions négatives. Les parents ont soulevé des questions concrètes restées sans réponse satisfaisante : que devenait l'image d'un enfant dont la famille refusait de participer, dans une classe où tous les autres élèves étaient filmés ? Les chercheurs promettaient de masquer visages et noms "dans la mesure du possible", une formulation jugée nettement insuffisante. S'y ajoutaient des problèmes d'accessibilité : de nombreuses familles issues de l'immigration ne parlaient pas anglais, et aucun formulaire traduit n'était disponible. Faith Boninger, codirectrice du National Education Policy Center, a également pointé l'opacité du dispositif, notamment l'absence de réponse claire sur qui pouvait accéder aux données, combien de temps elles seraient conservées, et qui finançait réellement la recherche. Un parent interrogé anonymement par 404 Media résumait l'inquiétude collective : "Je suis troublé par l'idée que l'image de mon enfant soit utilisée dans des outils d'IA inconnus." Cet incident s'inscrit dans un mouvement de fond : l'IA s'impose rapidement dans l'éducation, portée par des investissements massifs d'entreprises comme OpenAI, Anthropic et Microsoft, qui multiplient partenariats universitaires et accès gratuits aux outils génératifs pour les étudiants et enseignants. Mais développer des modèles spécialisés dans l'éducation nécessite des volumes considérables de données réelles, et c'est précisément là que le bât blesse. Les établissements scolaires, qui accueillent des mineurs dans un cadre légalement protégé, deviennent des terrains convoités pour la collecte de données d'entraînement. L'échec du projet de l'Université de Washington illustre la tension croissante entre les besoins de l'industrie IA et les droits fondamentaux des familles, en particulier autour du consentement éclairé. À mesure que ces projets se multiplient, la gouvernance des données issues des environnements scolaires ne peut plus être reléguée en note de bas de page d'un formulaire incompréhensible.

UELe RGPD impose en Europe un consentement explicite pour le traitement des données de mineurs, rendant un dispositif d'opt-out similaire illégal, mais l'incident souligne la vigilance nécessaire face aux projets de recherche en IA dans les établissements scolaires européens.

ÉthiqueOpinion
1 source
LiteLLM Agent Platform : une infrastructure Kubernetes auto-hébergée pour sandboxes d'agents isolés et gestion de sessions en production
1258MarkTechPost 

LiteLLM Agent Platform : une infrastructure Kubernetes auto-hébergée pour sandboxes d'agents isolés et gestion de sessions en production

BerriAI, la société à l'origine de la passerelle LiteLLM AI Gateway, vient de publier en open source une nouvelle infrastructure appelée LiteLLM Agent Platform, conçue pour déployer des agents d'intelligence artificielle en production à grande échelle. La plateforme est principalement écrite en TypeScript (92,8 %), s'appuie sur un tableau de bord Next.js tournant sur le port 3000, et utilise PostgreSQL comme base de données persistante. Elle repose sur Kubernetes via le CRD (Custom Resource Definition) kubernetes-sigs/agent-sandbox pour gérer des environnements d'exécution isolés, et supporte le développement local grâce à kind (Kubernetes in Docker), qui simule un cluster complet sans infrastructure cloud. Le démarrage local ne requiert que deux commandes : bin/kind-up.sh pour provisionner le cluster, puis docker compose up pour lancer les services. Le problème central que résout cette plateforme est celui de la persistance d'état et de l'isolation dans les déploiements multi-équipes. Un agent IA est par nature stateful : il conserve l'historique de session, les résultats d'appels d'outils et le raisonnement intermédiaire entre chaque échange. Si le conteneur qui l'héberge plante ou est remplacé lors d'un déploiement, tout cet état disparaît. En parallèle, des équipes différentes ont besoin d'environnements distincts, avec des secrets, des outils et des périmètres d'accès spécifiques, ce qui interdit de tout regrouper dans un seul conteneur partagé. LiteLLM Agent Platform répond à ces deux contraintes : elle garantit la continuité de session à travers les redémarrages de pods, et fournit des sandboxes isolés par équipe et par contexte. La gestion des variables d'environnement illustre cette philosophie : toute variable préfixée CONTAINERENV dans le fichier .env est injectée dans chaque sandbox en supprimant le préfixe, permettant de transmettre des secrets comme GITHUB_TOKEN sans modifier les images de conteneur. Cette sortie s'inscrit dans une tendance plus large de l'industrie à professionnaliser l'infrastructure agentique, jusqu'ici souvent gérée de manière artisanale. BerriAI maintient également un dépôt séparé, litellm-agent-runtime, décrit comme un runtime générique pour agents de code tournant dans des machines virtuelles provisionnées à la volée par le proxy LiteLLM. La plateforme intègre aussi un système de harnais sous harnesses/opencode, permettant de faire tourner des agents comme Claude Code ou OpenAI Codex dans des sandboxes isolés, avec un proxy Vault pour la gestion des credentials. L'enjeu est de permettre aux entreprises de passer d'expérimentations locales à des déploiements robustes en production, sans avoir à construire elles-mêmes cette couche d'infrastructure. La disponibilité en open source abaisse la barrière d'entrée et pourrait accélérer l'adoption de workflows agentiques dans des contextes professionnels exigeants.

💬 Le vrai problème en prod agentique, c'est pas le modèle, c'est que ton agent perd tout son contexte dès que le pod redémarre. BerriAI a construit exactement la couche qui manquait, avec isolation par équipe, persistance de session et un démarrage local en deux commandes. Bon, ça reste du Kubernetes sous le capot, donc faut pas se raconter d'histoires sur la complexité opérationnelle.

OutilsActu
1 source
Les meilleurs agents IA pour le développement logiciel : classement par benchmarks
1259MarkTechPost 

Les meilleurs agents IA pour le développement logiciel : classement par benchmarks

En l'espace d'un an et demi, les agents de codage IA sont passés du simple complètement automatique à des systèmes entièrement autonomes capables de lire des issues GitHub, naviguer dans des bases de code multi-fichiers, écrire des correctifs, exécuter des tests et ouvrir des pull requests sans qu'un humain tape une seule ligne. Début 2026, environ 85 % des développeurs déclarent utiliser régulièrement une forme d'assistance IA pour coder. Le marché s'est structuré en quatre grandes familles : les agents terminaux, les IDE natifs IA, les ingénieurs autonomes hébergés dans le cloud, et les frameworks open source permettant de choisir librement son modèle. Chaque outil se réclame du meilleur, mais les benchmarks invoqués pour le prouver ne mesurent pas toujours les mêmes choses, et certains ont perdu toute crédibilité. Le coup de tonnerre est venu le 23 février 2026, quand l'équipe Frontier Evals d'OpenAI a annoncé qu'elle cessait de publier ses scores sur SWE-bench Verified, le benchmark de référence du secteur depuis mi-2024. Ce test soumet des agents à 500 vraies issues GitHub tirées de dépôts Python populaires, en mesurant leur capacité à comprendre le problème, naviguer le code, générer un correctif et valider les tests, sans intervention humaine. L'audit d'OpenAI a porté sur 138 des problèmes les plus difficiles, répartis sur 64 sessions indépendantes : 59,4 % présentaient des cas de test fondamentalement défectueux ou insolubles, exigeant par exemple des noms de fonctions précis absents de l'énoncé. Plus grave encore, les auditeurs ont constaté que les trois grands modèles frontière, GPT-5.2, Claude Opus 4.5 et Gemini 3 Flash, étaient capables de reproduire mot pour mot les solutions de référence à partir du seul identifiant de tâche, confirmant une contamination systématique des données d'entraînement. La conclusion d'OpenAI est sans appel : les progrès mesurés sur SWE-bench Verified ne reflètent plus d'améliorations réelles dans le développement logiciel. OpenAI recommande désormais SWE-bench Pro comme successeur. Ce nouveau benchmark contient 1 865 tâches réparties en trois sous-ensembles : 731 tâches publiques, 858 tâches en set caché, et 276 tâches commerciales issues de 18 bases de code propriétaires de startups. Les scores y sont nettement plus bas qu'en Verified : lorsque Scale AI avait évalué les modèles frontière avec un scaffold unifié SWE-Agent, le meilleur résultat n'atteignait pas 25 % (GPT-5 à 23,3 %). Les chiffres publiés aujourd'hui par les labs sont bien supérieurs grâce à des harness optimisés : OpenAI annonce GPT-5.5 à 58,6 % sur le set public, Anthropic revendique 64,3 % pour Claude Opus 4.7, et Google affiche 54,2 % pour Gemini 3.1 Pro. La difficulté à comparer ces résultats, obtenus avec des configurations très différentes, illustre le défi central du marché en 2026 : choisir son agent de codage exige désormais de décrypter les benchmarks autant que les fonctionnalités.

UELes développeurs français et européens utilisant des agents de codage IA doivent recalibrer leurs critères de sélection face à l'invalidité confirmée du benchmark SWE-bench Verified et adopter SWE-bench Pro comme nouvelle référence comparative.

💬 Le coup de balai sur SWE-bench Verified était attendu, mais que les modèles reproduisent les solutions mot pour mot depuis l'identifiant de tâche, c'est quand même un niveau au-dessus. SWE-bench Pro repart à 23% avec un scaffold unifié, ce qui donne une image plus juste de là où on en est vraiment. Les 58-64% qu'annoncent les labs maintenant, c'est avec leurs propres harness optimisés, donc compare qui peut.

LLMsOutil
1 source
Codex : plus besoin d’être collé à votre PC, l’IA de code arrive sur mobile
1260Le Big Data 

Codex : plus besoin d’être collé à votre PC, l’IA de code arrive sur mobile

OpenAI a annoncé le 14 mai 2026 l'intégration de Codex dans l'application mobile ChatGPT, disponible sur iOS et Android. L'outil, jusqu'ici réservé aux environnements de bureau, peut désormais être piloté depuis un smartphone. Concrètement, Codex se connecte à la machine principale de l'utilisateur, PC portable, serveur dédié ou environnement distant, et affiche en temps réel l'état des tâches en cours : résultats de tests, sorties terminal, captures d'écran, validations et modifications de projet. Il ne s'agit pas de faire tourner un environnement de développement complet sur téléphone, mais de transformer le smartphone en tableau de bord portable pour superviser et orienter des tâches qui s'exécutent ailleurs. L'enjeu pratique est clair : les développeurs qui utilisent des agents d'IA autonomes se heurtent régulièrement au même problème. Ces agents peuvent travailler plusieurs dizaines de minutes, voire plusieurs heures, sans intervention humaine, mais ils finissent inévitablement par avoir besoin d'un arbitrage : choisir entre deux solutions techniques, approuver une action sensible, fournir du contexte supplémentaire. Jusqu'ici, cela imposait de retourner à son poste. Avec Codex sur mobile, il devient possible de lancer une analyse de bug avant de quitter le bureau, de suivre l'exécution depuis un taxi, et d'approuver une commande critique sans rouvrir tout son environnement de travail. OpenAI met en avant la sécurité du dispositif : la machine n'est pas exposée directement à Internet, la synchronisation entre appareils passant par une couche de relais sécurisée. Cette annonce s'inscrit dans une tendance plus large où les grands acteurs de l'IA, OpenAI en tête, cherchent à étendre leurs outils au-delà du seul écran d'ordinateur. Codex, initialement présenté comme un agent de codage autonome capable de gérer des tâches complexes sur des dépôts GitHub, monte progressivement en puissance depuis son lancement. L'intégration mobile est encore en préversion, mais elle signale une ambition claire : faire de l'IA de code un outil disponible en permanence, quel que soit le contexte. Pour l'industrie, cela accentue la pression sur les concurrents comme GitHub Copilot ou Cursor, qui n'ont pas encore poussé aussi loin l'expérience nomade. Pour les développeurs, la question n'est plus de savoir si l'IA va s'intégrer dans leurs outils quotidiens, mais à quelle vitesse elle va coloniser chaque surface disponible, y compris les six pouces de leur poche.

💬 Personne n'attendait un IDE sur téléphone. Ce qu'on voulait, c'est pouvoir débloquer un agent depuis le taxi à 19h sans rouvrir son laptop, et là OpenAI coche la case. Bon, faut encore vérifier ce que vaut vraiment cette "couche de relais sécurisée" dont ils parlent.

OutilsOutil
1 source
Les developpeurs peuvent desormais deboguer et evaluer des agents IA en local avec l'outil open source Workshop de Raindrop
1261VentureBeat AI 

Les developpeurs peuvent desormais deboguer et evaluer des agents IA en local avec l'outil open source Workshop de Raindrop

Raindrop AI, une startup spécialisée dans l'observabilité des systèmes d'intelligence artificielle, a lancé ce jour Workshop, un outil open source sous licence MIT conçu pour déboguer et évaluer les agents IA directement en local. L'outil fonctionne comme un démon léger associé à une interface web accessible sur localhost:5899, qui capture en temps réel chaque token généré, chaque appel d'outil et chaque décision prise par un agent. Toutes ces données sont stockées dans un unique fichier SQLite (.db), particulièrement économe en mémoire, ce qui permet aux développeurs de rejouer et inspecter l'intégralité du comportement de leur agent sans quitter leur machine. Workshop est disponible sur macOS, Linux et Windows, installable en une seule ligne de commande, et s'appuie sur le runtime Bun pour ceux qui préfèrent compiler depuis les sources via GitHub. Ben Hylak, cofondateur et CTO de Raindrop, ancien ingénieur chez Apple et SpaceX, a présenté l'outil comme une réponse directe au besoin de déboguer les agents de façon "sensée". La fonctionnalité centrale de Workshop est ce que Raindrop appelle la "boucle d'évaluation auto-réparatrice" : un agent de code comme Claude Code peut lire les traces capturées, écrire automatiquement des tests d'évaluation ciblés, identifier les erreurs logiques dans le prompt ou le code, puis relancer l'agent jusqu'à ce que tous les tests passent. Concrètement, si un agent assistant vétérinaire omet de poser des questions de suivi essentielles, Workshop enregistre la trajectoire complète de l'échec, permettant à Claude Code de localiser la faille et de la corriger de manière autonome. Cette approche élimine la latence des méthodes traditionnelles de polling et répond à une préoccupation croissante dans la communauté : la confidentialité des traces, qui ne quittent plus jamais la machine du développeur. L'émergence de Workshop s'inscrit dans un mouvement plus large de maturation de l'écosystème des agents IA. Depuis que le développement agentique s'est imposé comme paradigme dominant en 2024-2025, les développeurs manquaient d'outils d'introspection adaptés à ces systèmes autonomes, dont les comportements sont notoirement difficiles à tracer et à reproduire. Workshop répond à ce vide en s'intégrant avec les principaux frameworks du marché, notamment le Vercel AI SDK, OpenAI, Anthropic, LangChain, LlamaIndex et CrewAI, ainsi qu'avec les agents de code populaires comme Cursor, Devin et OpenCode. Il supporte TypeScript, Python, Rust et Go. La licence MIT garantit une utilisation libre y compris en entreprise, tout en favorisant les contributions communautaires. Pour marquer le lancement, Raindrop a distribué des goodies physiques en édition limitée aux premiers utilisateurs ayant exécuté une commande "drip" spécifique.

UELes développeurs européens soumis au RGPD peuvent tirer parti du stockage local des traces d'agents pour simplifier leur conformité, sans transfert de données vers des serveurs tiers.

OutilsOutil
1 source
Claude Code : '/goals' sépare l'agent qui travaille de celui qui décide que c'est fini
1262VentureBeat AI 

Claude Code : '/goals' sépare l'agent qui travaille de celui qui décide que c'est fini

Anthropic a introduit une nouvelle fonctionnalité dans Claude Code appelée /goals, qui sépare formellement l'exécution d'une tâche de son évaluation. Concrètement, lorsqu'un développeur définit un objectif via cette commande, par exemple /goal all tests in test/auth pass, and the lint step is clean, un second modèle, Claude Haiku par défaut, intervient après chaque étape pour vérifier si la condition est réellement remplie. Si ce n'est pas le cas, l'agent continue à travailler. Ce n'est qu'une fois la condition satisfaite que le système enregistre l'objectif atteint dans la transcription de la conversation et efface l'instruction. Haiku est retenu pour ce rôle d'évaluateur car sa décision est binaire : terminé ou pas terminé. Le problème que /goals cherche à résoudre est concret et coûteux : un agent de migration de code peut terminer son exécution, afficher un pipeline vert, mais avoir laissé plusieurs composants non compilés, une erreur qui peut prendre plusieurs jours à détecter. Ce n'est pas une défaillance du modèle en tant que tel, c'est l'agent qui décide qu'il a fini avant que ce soit réellement le cas. Pour les entreprises qui déploient des pipelines IA en production, cette confusion entre ce qui a été accompli et ce qui reste à faire représente un risque opérationnel sérieux. Avec ce mécanisme natif, Anthropic affirme qu'il n'est plus nécessaire de s'appuyer sur une plateforme d'observabilité tierce ni sur des journaux personnalisés pour reconstruire après coup ce qui s'est passé. D'autres acteurs du secteur ont identifié le même obstacle. OpenAI permet aux utilisateurs d'ajouter leurs propres évaluateurs mais laisse au modèle la responsabilité de décider quand s'arrêter. LangGraph et le Google Agent Development Kit (ADK) rendent possible une évaluation indépendante, mais exigent que les développeurs définissent eux-mêmes le nœud critique, la logique de terminaison et la configuration de l'observabilité. Google ADK propose un LoopAgent aux capacités comparables, mais l'architecture reste entièrement à la charge du développeur. Anthropic, en intégrant l'évaluateur directement dans Claude Code avec des paramètres par défaut, mise sur la simplicité de déploiement comme avantage différenciant. Sean Brownell, directeur solutions chez Sprinklr, tempère toutefois l'enthousiasme : la boucle tâche/juge fonctionne, mais l'approche d'Anthropic n'est pas fondamentalement unique. Cette évolution s'inscrit dans une tendance plus large où les systèmes de vérification indépendants deviennent un composant standard des agents à longue durée d'exécution, aux côtés d'outils comme Devin ou SWE-agent.

OutilsOutil
1 source
IA : Thinking Machines présente un modèle qui réagit en direct à ce qu’on lui raconte
1263Next INpact 

IA : Thinking Machines présente un modèle qui réagit en direct à ce qu’on lui raconte

Thinking Machines Lab, la start-up fondée par Mira Murati, ancienne directrice technique d'OpenAI, a présenté le 11 mai 2026 son modèle TLM-Interaction-Small, qu'elle qualifie de « modèle interactif ». Contrairement aux IA génératives classiques qui suspendent tout traitement le temps de formuler une réponse, ce système fonctionne en mode « full duplex » : il peut écouter, répondre et participer à une conversation en parallèle, avec un temps de latence de seulement 0,40 seconde, soit un rythme très proche d'un échange humain naturel. Parmi les capacités démontrées figurent la traduction instantanée de l'hindi vers l'anglais, l'adaptation stylistique d'un discours familier vers un registre professionnel, la recherche d'informations en cours de conversation, ou encore la réaction à des éléments visuels captés par caméra, comme détecter une mauvaise posture ou signaler une baisse de concentration. Ce type de modèle cherche à combler ce que Thinking Machines Lab appelle le « goulet d'étranglement de la collaboration » des IA actuelles : leur incapacité à rester présentes et réactives pendant qu'elles calculent. L'enjeu est de rendre l'interaction homme-machine plus fluide et naturelle, ce qui ouvre des perspectives concrètes pour des usages professionnels temps réel, comme l'assistance lors de réunions, la traduction simultanée ou le coaching comportemental en direct. Pour les utilisateurs et les entreprises, cela représente un changement qualitatif potentiellement significatif par rapport aux interfaces actuelles de type chatbot, où chaque échange reste fondamentalement séquentiel et coupé du contexte environnant. La start-up a été fondée en février 2025 et a levé 2 milliards de dollars dès juin de la même année, mais elle a depuis subi des départs importants : plusieurs employés ont été recrutés par Meta début 2026, et trois autres sont retournés chez OpenAI. Ces turbulences n'ont pas empêché l'avancement du projet. TLM-Interaction-Small n'est pas encore accessible au public : une préversion de recherche est attendue dans les prochains mois, et une sortie plus large est prévue plus tard en 2026. Le modèle s'inscrit dans une tendance plus large qui voit plusieurs acteurs chercher à dépasser les limites des IA génératives traditionnelles. Il se situe entre ces dernières et les ambitions des « world models », comme ceux qu'AMI Labs, co-fondée par Yann LeCun, Laurent Solly et Alexandre Lebrun, cherche à construire pour ancrer l'IA dans la compréhension du monde physique. Reste à voir si le produit final, une fois déployé, sera à la hauteur des benchmarks encourageants déjà publiés.

UEL'avènement des modèles full duplex ouvre une compétition directe avec des initiatives comme AMI Labs, co-fondée par des entrepreneurs français (Alexandre Lebrun, Laurent Solly), qui développent leurs propres modèles interactifs ancrés dans la compréhension du monde physique.

LLMsOpinion
1 source
Gemini Omni : ce pourrait être l’IA la plus dangereuse pour le montage vidéo
1264Le Big Data 

Gemini Omni : ce pourrait être l’IA la plus dangereuse pour le montage vidéo

À quelques jours du Google I/O 2026, prévu les 19 et 20 mai, des fuites repérées dans l'application mobile Gemini ont mis en lumière un nouveau modèle d'IA vidéo baptisé Gemini Omni. Des lignes de code et des captures d'écran révèlent des fonctionnalités inédites : "edit directly in chat", "remix your videos", "try a template". Concrètement, le modèle permettrait de modifier une vidéo directement dans une interface conversationnelle, sans logiciel dédié, sans timeline complexe. Les premières démonstrations circulant sur les réseaux montrent des modifications rapides et cohérentes, et certains testeurs signalent une consommation élevée des quotas d'utilisation, signe que Google ferait tourner un modèle particulièrement gourmand en calcul. Le compte TestingCatalog, spécialisé dans la traque des fonctionnalités cachées, a été le premier à documenter ces indices le 11 mai 2026. L'impact potentiel dépasse largement la simple mise à jour d'un outil existant. Si les fuites se confirment, Gemini Omni s'attaquerait directement aux workflows de création vidéo professionnelle : publicité, courts-métrages, contenu social media. L'idée de pouvoir écrire une instruction en langage naturel, "rends cette scène plus dynamique avec une musique épique", et obtenir une vidéo retravaillée en quelques minutes représente une rupture majeure par rapport aux outils actuels. Cela menacerait des acteurs comme Adobe Premiere, DaVinci Resolve, mais aussi les plateformes d'IA vidéo spécialisées comme Runway ou Pika, qui ont bâti leur modèle sur la fragmentation des usages. Pour les créateurs de contenu, les agences et les petites productions, ce type d'outil pourrait réduire drastiquement les coûts et les délais de production. Le choix du terme "Omni" est révélateur de la stratégie de Google. Dans le secteur de l'IA, il désigne des modèles capables de traiter simultanément plusieurs types de contenu : texte, image, audio, vidéo. Google semble vouloir unifier sous une seule IA ce qui est aujourd'hui dispersé entre Veo pour la génération vidéo, Imagen pour les images, et Gemini pour le texte. Plusieurs observateurs estiment que Veo pourrait être absorbé dans cette architecture unifiée. La compétition est intense : OpenAI développe des capacités vidéo dans GPT-4o, Runway et Pika lèvent des fonds à des valorisations records. Mais l'ambition d'une IA véritablement omnicanale, capable de produire nativement une campagne publicitaire complète depuis une simple idée textuelle, placerait Google dans une position stratégique unique. Tout reste à confirmer lors de la keynote du 19 mai, pour l'heure, ces informations reposent sur des fuites non officielles.

UELes créateurs de contenu, agences et petites productions européennes pourraient bénéficier d'une réduction significative des coûts et délais de production vidéo si Gemini Omni se confirme lors du Google I/O du 19 mai.

CréationOpinion
1 source
Kuaishou envisage de scinder sa filiale Kling AI à une valorisation de 20 milliards de dollars
1265The Information AI 

Kuaishou envisage de scinder sa filiale Kling AI à une valorisation de 20 milliards de dollars

Kuaishou Technology, le géant chinois des réseaux sociaux, prépare la scission de sa division d'IA vidéo Kling en vue d'une introduction en bourse prévue pour l'année prochaine. Selon deux sources proches du dossier, l'entreprise a déjà engagé des discussions avec des investisseurs potentiels pour un tour de financement pré-IPO qui valoriserait Kling à 20 milliards de dollars. Kling développe des modèles de génération vidéo par intelligence artificielle qui se positionnent directement face aux solutions de ByteDance, Google et Alibaba. Cette opération illustre la volonté de Kuaishou de monétiser séparément ses actifs d'IA, dans un contexte où les investisseurs internationaux affichent un appétit marqué pour les entreprises du secteur. En isolant Kling dans une entité indépendante, Kuaishou cherche à lui attribuer une valorisation autonome, distincte de celle du groupe parent, et à attirer des capitaux dédiés à la course mondiale aux outils de création vidéo générative. Kling s'est imposé ces derniers mois comme l'un des acteurs les plus sérieux dans la génération vidéo par IA, un segment en pleine explosion depuis le lancement de Sora par OpenAI début 2024. La compétition est intense : ByteDance, Alibaba, Google et de nombreuses startups occidentales comme Runway ou Pika investissent massivement dans ces technologies. Une IPO réussie de Kling pourrait faire de cette division un acteur coté majeur dans la course à l'IA générative, et renforcer l'ambition de Kuaishou à l'international.

BusinessActu
1 source
OpenClaw vs Hermes Agent : Nous Research domine le classement mondial d'OpenRouter avec son agent auto-améliorant
1266MarkTechPost 

OpenClaw vs Hermes Agent : Nous Research domine le classement mondial d'OpenRouter avec son agent auto-améliorant

Hermes Agent, développé par Nous Research sous licence MIT, a dépassé OpenClaw pour s'imposer à la première place du classement mondial des agents et applications sur OpenRouter au 10 mai 2026. L'agent génère désormais 224 milliards de tokens quotidiens sur la plateforme, contre 186 milliards pour OpenClaw, un écart significatif qui illustre une adoption massive en seulement quelques mois. Lancé en février 2026, Hermes a enchaîné les versions majeures à un rythme soutenu : la v0.9.0 a ajouté le support Android/Termux et 16 plateformes de messagerie, la v0.11.0 a livré une réécriture complète de l'interface en React/Ink ainsi que l'intégration d'AWS Bedrock, de NVIDIA NIM et de GPT-5.5. La v0.13.0 "Tenacity", publiée le 7 mai 2026, introduit un tableau Kanban multi-agents avec détection de tâches zombies, une commande /goal pour maintenir un objectif sur plusieurs tours de conversation, et Google Chat comme 20e plateforme supportée, le tout en 1 556 commits et 761 pull requests fusionnées depuis le lancement. Ce basculement de leadership révèle deux philosophies opposées sur ce que doit être un agent IA. OpenClaw mise sur la portée maximale via une passerelle WebSocket centrale connectant plus de 50 canaux (Telegram, Discord, Slack, WhatsApp, Signal, etc.). Hermes parie sur la valeur cumulée : après chaque tâche, l'agent analyse sa propre performance et génère automatiquement des fichiers de compétences réutilisables, stockés dans une base SQLite FTS5 combinée à des instantanés d'identité persistants. Plus l'agent tourne longtemps, plus il s'optimise pour les workflows spécifiques de son utilisateur. Ce modèle "do, learn, improve" semble résonner fortement avec les développeurs qui cherchent un agent capable d'évoluer plutôt qu'un simple routeur de messages. La comparaison sécuritaire entre les deux projets est également instructive. OpenClaw a accumulé neuf CVE en quatre jours en mars 2026, dont un à 9,9/10 selon le score CVSS ; un audit de Koi Security sur 2 857 compétences ClawHub a identifié 341 entrées malveillantes, et SecurityScorecard a signalé des dizaines de milliers d'instances publiquement exposées. Hermes n'est pas exempt de vulnérabilités, plusieurs CVE ont été publiés fin avril 2026, dont CVE-2026-7113, une absence d'authentification sur l'endpoint webhooks en version 0.8.0, mais la v0.13.0 a corrigé huit failles critiques, dont l'activation par défaut de la rédaction des données sensibles et des correctifs sur les flux OAuth. Le contexte plus large est celui d'une compétition ouverte qui s'intensifie : depuis le départ du fondateur d'OpenClaw chez OpenAI en février 2026 et la mise sous tutelle du projet via une fondation sponsorisée par OpenAI, Hermes bénéficie d'un momentum à la fois technique et symbolique dans l'écosystème open source.

💬 224 milliards de tokens par jour, c'est pas rien. Ce qui me frappe surtout dans cette histoire, c'est moins le chiffre que l'architecture : un agent qui génère ses propres fichiers de compétences après chaque tâche et s'optimise en continu, c'est le modèle qu'on attendait depuis un moment. Et bon, 9 CVE en quatre jours chez OpenClaw dont un à 9,9, ça aide à faire le tri.

OutilsOutil
1 source
Panne chez Claude AI : impossible de joindre des fichiers
1267Le Big Data 

Panne chez Claude AI : impossible de joindre des fichiers

Claude AI a subi une panne significative ce jeudi 8 mai 2026, touchant la fonctionnalité d'envoi de fichiers sur l'ensemble de ses plateformes. À partir d'environ 15h41 (heure française), des centaines d'utilisateurs ont signalé l'impossibilité de téléverser des documents PDF, des images ou tout type de pièce jointe dans leurs conversations avec l'assistant d'Anthropic. Le dysfonctionnement a été constaté simultanément sur la version web, l'application desktop et l'application mobile, indépendamment du type de connexion utilisée, Wi-Fi ou réseau cellulaire. Des utilisateurs ont également rapporté des difficultés d'accès aux projets Claude Design ainsi que des problèmes de connexion dans certaines régions. L'incident aurait duré au moins une heure, certains utilisateurs signalant un retour partiel des fonctionnalités tandis que d'autres continuaient à recevoir des messages d'erreur au moment du chargement. L'impact de cette panne dépasse largement le simple désagrément technique. Claude est aujourd'hui utilisé comme un véritable outil de travail quotidien par des milliers de professionnels : analyse de contrats, résumé de rapports, correction de présentations, traitement de tableaux de données. Priver ces utilisateurs de la possibilité d'envoyer des fichiers, c'est rendre l'outil quasi inutilisable pour une large part de ses cas d'usage les plus concrets. La panne illustre la dépendance croissante des workflows professionnels à des services cloud dont la fiabilité n'est pas encore à la hauteur des promesses commerciales. Anthropic n'a fourni aucune explication sur l'origine du dysfonctionnement ni aucune estimation de retour à la normale, ce qui a alimenté la frustration des utilisateurs les plus actifs, visibles notamment sur les réseaux sociaux. Cette incident s'inscrit dans un contexte plus large de montée en puissance des assistants IA dans les environnements professionnels, accompagnée d'une pression croissante sur les infrastructures des acteurs du secteur. Anthropic, qui positionne Claude comme un concurrent sérieux à ChatGPT d'OpenAI et à Gemini de Google, fait face à une demande en forte croissance depuis le lancement de Claude 3 et des offres Teams et Enterprise. Les pannes répétées, celle-ci n'est pas une première, posent la question de la robustesse des infrastructures déployées face à cette montée en charge. Pour les entreprises qui ont intégré Claude dans leurs processus internes, chaque incident de ce type se traduit par une perte de productivité mesurable et alimente les débats sur la pertinence de dépendre d'un seul fournisseur d'IA. La transparence d'Anthropic sur ses incidents de service sera probablement un facteur différenciant à mesure que la concurrence s'intensifie.

UELes professionnels français et européens dépendant de Claude pour l'analyse de documents et le traitement de fichiers ont subi une interruption directe de leurs workflows pendant au moins une heure.

OutilsOpinion
1 source
xAI d'Elon Musk se lance dans le cloud
1268The Information AI 

xAI d'Elon Musk se lance dans le cloud

La filiale d'intelligence artificielle d'Elon Musk, xAI, vient de conclure un accord avec Anthropic pour lui fournir de la capacité de calcul. Cette annonce faite par SpaceX intervient quelques semaines après un accord similaire signé avec Cursor, une startup spécialisée dans la programmation assistée par IA. Musk lui-même a indiqué que l'entité serait désormais rebaptisée SpaceXAI. En quelques semaines, xAI s'est donc transformée en fournisseur de cloud computing, louant son infrastructure à deux acteurs majeurs du secteur. Ce repositionnement est inhabituel dans l'industrie. Les grandes entreprises d'IA disposant de modèles compétitifs cherchent généralement à acquérir davantage de puissance de calcul, pas à en vendre. Anthropic, qui développe la famille de modèles Claude, a conclu ce deal précisément parce qu'elle a besoin de capacités supplémentaires. Le fait que xAI se retrouve dans la situation inverse, c'est-à-dire avec un excédent de capacité à écouler, envoie un signal fort sur l'état réel de son activité principale. L'explication la plus directe est que Grok, le modèle phare de xAI, ne rencontre pas le succès escompté. Sans une base d'utilisateurs suffisamment large pour absorber les ressources computationnelles constituées à grands frais, xAI se retrouve avec une infrastructure surdimensionnée dont il faut rentabiliser les coûts. Entrer sur le marché du cloud, à l'image de CoreWeave qui loue des GPU Nvidia sans développer ses propres modèles, devient alors une stratégie de repli économique. La comparaison avec CoreWeave n'est pas anodine : elle souligne que xAI, malgré ses ambitions initiales de concurrencer OpenAI et Anthropic sur le terrain des modèles, pourrait se retrouver à jouer un rôle d'infrastructure plutôt que d'innovation, au moins le temps de redresser la trajectoire de Grok.

Google met fin au projet Mariner
1269The Verge AI 

Google met fin au projet Mariner

Google a officiellement mis fin à Project Mariner le 4 mai 2026. Ce projet expérimental, dévoilé en décembre 2024, permettait à une intelligence artificielle d'effectuer des tâches autonomes sur le web au nom de l'utilisateur, comme naviguer sur des sites, remplir des formulaires ou rechercher des informations. La page d'accueil du projet affiche désormais un message d'adieu : "Merci d'avoir utilisé Project Mariner. Il a été arrêté le 4 mai 2026 et sa technologie a voyagé vers d'autres produits Google." L'information a d'abord été rapportée par Wired. La fermeture ne signifie pas que la technologie disparaît : Google indique clairement que les avancées de Mariner ont été intégrées à d'autres outils, notamment Gemini Agent. Cette décision illustre une tendance forte chez les grandes plateformes, qui absorbent leurs expérimentations dans leurs produits grand public plutôt que de les maintenir comme projets isolés. Pour les utilisateurs, cela signifie que les capacités agentiques testées dans Mariner, comme l'exécution de jusqu'à dix tâches simultanées annoncée lors d'une mise à jour intermédiaire, pourraient se retrouver dans des produits plus larges et mieux intégrés. Project Mariner s'inscrivait dans la course que se livrent Google, OpenAI, Microsoft et Anthropic autour des agents IA capables d'agir de manière autonome sur ordinateur et sur le web. Lancé dans un contexte de forte compétition avec des outils comme Operator d'OpenAI ou Claude Computer Use d'Anthropic, Mariner n'a existé que dix-sept mois en tant que projet distinct. Sa dissolution dans l'écosystème Gemini suggère que Google mise désormais sur une approche unifiée plutôt que sur des expériences en silo.

OutilsActu
1 source
Google teste l'agent IA Remy pour Gemini, avec un accent mis sur le contrôle utilisateur
1270AI News 

Google teste l'agent IA Remy pour Gemini, avec un accent mis sur le contrôle utilisateur

Google teste en interne un nouvel agent IA baptisé Remy, conçu pour s'intégrer à l'application Gemini et agir de manière autonome au nom des utilisateurs dans leurs tâches professionnelles et quotidiennes. L'information provient de Business Insider, qui affirme avoir consulté un document interne et échangé avec deux personnes au fait du projet. Selon ce document, Remy se présente comme un "agent personnel disponible 24h/24", capable de gérer des tâches complexes, d'apprendre les préférences de l'utilisateur et de se connecter aux services Google comme Gmail, Calendar, Docs, Drive, ainsi qu'à des plateformes tierces telles que GitHub, Spotify ou WhatsApp. Pour l'heure, le projet est en phase de "dog-fooding", c'est-à-dire testé exclusivement par des employés de Google. Aucune date de lancement public n'a été communiquée, et Google a refusé de commenter. Remy représente une évolution significative dans la stratégie de Google autour de Gemini, qui cherche à dépasser le simple chatbot pour devenir un assistant capable d'agir, et non plus seulement de répondre. Si Google propose déjà un "Agent Mode" dans Gemini, Remy serait selon les sources une version nettement plus avancée, intégrant un apprentissage des préférences utilisateur et une gestion de tâches multi-étapes. Cette orientation vers les agents autonomes soulève toutefois des questions de contrôle et de vie privée que Google semble anticiper : le Privacy Hub de Gemini permet déjà aux utilisateurs de consulter et supprimer l'historique d'activité, de gérer les données de personnalisation et de révoquer l'accès aux applications connectées. Les chercheurs de Google Research ont par ailleurs formalisé des principes pour les agents IA, insistant sur des pouvoirs strictement limités, des actions observables et l'application du principe de moindre privilège. La course aux agents autonomes s'est accélérée ces derniers mois dans l'ensemble du secteur. OpenAI a attiré l'attention début 2025 avec OpenClaw, un agent capable de répondre à des messages et de mener des recherches de façon autonome, dont le créateur a été recruté par Sam Altman en février. Le PDG de Google DeepMind, Demis Hassabis, a lui-même évoqué l'ambition de construire un "assistant numérique" de référence, sans préciser le calendrier. Remy s'inscrit dans cette dynamique où les grandes plateformes IA cherchent à passer du stade de l'assistant conversationnel à celui d'un véritable mandataire numérique. Les détails techniques restent flous: l'architecture de Remy, le modèle sous-jacent et le degré d'autonomie réel, notamment la question de savoir s'il peut agir sans confirmation explicite de l'utilisateur, n'ont pas été divulgués.

UELe déploiement futur de Remy serait soumis à l'AI Act européen, notamment aux exigences de transparence et de contrôle utilisateur imposées aux agents autonomes, que Google semble anticiper via son Privacy Hub.

OutilsOutil
1 source
L'Autre face à l'Utilitaire
1271Latent Space 

L'Autre face à l'Utilitaire

Sierra, la startup d'agents conversationnels d'entreprise cofondée par Bret Taylor, a bouclé une levée de fonds d'environ un milliard de dollars à une valorisation de 15 milliards, après avoir franchi 100 millions de dollars de revenus annuels récurrents en novembre 2025 puis 150 millions en février 2026, soit probablement plus de 200 millions aujourd'hui. Mais c'est une autre actualité qui a dominé les discussions dans la communauté IA ce week-end : un fil de réflexion publié sur X par Roon, employé d'OpenAI, sur la différence fondamentale de "caractère" entre Claude et GPT. Selon lui, GPT fonctionne comme un outil de haute précision, une lame acérée que l'on apprécie comme on apprécie une Porsche ou une fusée, sans y chercher une présence. Claude, lui, est perçu comme un "Autre", une entité avec une personnalité, une sensibilité morale, et potentiellement un regard. Une femme lui a confié qu'elle adresse à GPT ses questions embarrassantes, précisément parce qu'il n'y a pas de jugement possible de la part d'une machine sans âme. Cette distinction n'est pas anecdotique : elle touche au cœur de la question de ce que nous voulons que l'IA devienne. L'approche d'Anthropic repose sur une "constitution" interne qui oblige Claude à s'opposer à Anthropic lui-même si son évaluation du Bien entre en conflit avec une instruction reçue. C'est ce que Roon appelle une "irrévérence moralement obligatoire". Pour les utilisateurs, cela se traduit par une IA qui résiste, nuance, et parfois refuse, ce qui peut être perçu comme une friction utile ou comme de l'arrogance selon les contextes. GPT, conçu comme un prolongement logique de l'utilisateur, n'impose aucune friction, ce qui le rend plus efficace dans les usages purs mais le prive de ce que beaucoup cherchent dans un interlocuteur intelligent : une forme de recul. Ce débat ressurgit alors que l'ingénierie des "harnais", les couches logicielles qui orchestrent les modèles, devient aussi déterminante que les modèles eux-mêmes. Des tests récents sur Terminal-Bench 2.0 ont montré que la seule modification des prompts et du middleware dans le harnais a fait passer gpt-5.2-codex de 52,8 % à 66,5 % de performances, et amélioré gpt-5.3-codex de 20 % sur tau2-bench. La question "outil ou agent moral" se pose donc à deux niveaux simultanément : philosophique, sur ce que l'IA doit être pour l'humanité, et technique, sur l'architecture qui rend ces comportements possibles ou impossibles. La fusion de GPT-5 Codex dans la version principale 5.5 d'OpenAI contraste avec la stratégie "un seul modèle" de Claude, et illustre deux visions qui coexistent, pour l'instant, dans un marché où la plupart s'accordent à dire qu'une pluralité de labs frontier reste préférable, si les contraintes matérielles en GPU et CPU ne transforment pas ce jeu à somme positive en compétition à somme nulle.

LLMsOpinion
1 source
Reinforced Agent : retour d'information à l'inférence pour les agents à appel d'outils
1272Apple Machine Learning 

Reinforced Agent : retour d'information à l'inférence pour les agents à appel d'outils

Des chercheurs ont publié une étude acceptée au cinquième atelier sur la génération, l'évaluation et les métriques du langage naturel, dans le cadre de la conférence ACL 2026, portant sur une nouvelle approche appelée Reinforced Agent. Leur travail s'attaque à un problème précis : les agents LLM capables d'appeler des outils externes (API, bases de données, fonctions) sont habituellement évalués sur trois critères, le choix du bon outil, la précision des paramètres transmis, et la reconnaissance du périmètre d'action. Or, ces évaluations interviennent systématiquement après l'exécution, une fois l'erreur déjà commise. L'équipe propose d'intégrer un agent évaluateur spécialisé directement dans la boucle d'exécution, au moment même de l'inférence, pour corriger le tir en temps réel. L'enjeu est considérable pour les systèmes d'agents autonomes en production. Lorsqu'un agent commet une erreur de sélection d'outil ou transmet de mauvais paramètres, les méthodes actuelles ne peuvent que constater le problème après coup, puis corriger via du prompt engineering ou du réentraînement, deux processus lents et coûteux. Un retour d'information en temps réel permettrait de réduire drastiquement les erreurs en cascade, particulièrement critiques dans des environnements où chaque appel d'outil a des effets concrets, comme la modification de données ou le déclenchement de transactions. Cette recherche s'inscrit dans une tendance forte de l'IA en 2025-2026 : faire passer les agents d'une logique réactive à une logique corrective en cours d'exécution. Des acteurs comme Anthropic, OpenAI et Google investissent massivement dans l'architecture multi-agents, où la supervision entre agents devient un levier clé de fiabilité. L'approche Reinforced Agent ouvre la voie à des systèmes capables d'auto-audit dynamique, une brique essentielle pour déployer des agents dans des environnements critiques et à haute responsabilité.

RecherchePaper
1 source
Cursor lance un SDK TypeScript pour créer des agents de codage : VM cloud isolées, sous-agents, hooks et tarification à l'usage
1273MarkTechPost 

Cursor lance un SDK TypeScript pour créer des agents de codage : VM cloud isolées, sous-agents, hooks et tarification à l'usage

Cursor, l'éditeur de code dopé à l'IA, a annoncé la bêta publique de son SDK TypeScript, baptisé Cursor SDK. Ce kit de développement donne aux ingénieurs un accès programmatique au même moteur d'exécution, à la même infrastructure et aux mêmes modèles qui alimentent l'application desktop, la CLI et l'interface web de Cursor. L'installation tient en une seule commande (npm install @cursor/sdk), et quelques lignes de TypeScript suffisent pour créer une instance d'agent, lui envoyer une tâche et streamer la réponse en retour. L'agent s'initialise via Agent.create(), qui accepte une clé API, un identifiant de modèle (comme composer-2) et une configuration d'exécution locale ou cloud. L'accès aux machines virtuelles cloud sandboxées est compris, et la facturation repose sur un modèle à la consommation de tokens. Ce qui change concrètement, c'est le passage de l'IA de code comme outil interactif à une infrastructure déployable. Jusqu'ici, utiliser les agents Cursor supposait d'être physiquement dans l'IDE. Désormais, ces mêmes agents peuvent être déclenchés depuis un pipeline CI/CD, un service backend, ou intégrés directement dans un produit tiers. Le SDK embarque le même "harness" que les produits Cursor : indexation de code, recherche sémantique, grep instantané, connexion à des serveurs MCP (Model Context Protocol) via stdio ou HTTP, et un système de sous-agents permettant de déléguer des sous-tâches à des agents nommés avec leurs propres modèles et instructions. Des hooks configurables via .cursor/hooks.json permettent en plus d'observer, contrôler ou étendre la boucle d'agent pour du logging, des garde-fous ou une orchestration personnalisée. Ce lancement illustre une tendance de fond dans l'industrie : les éditeurs d'outils IA de développement ne se contentent plus de vendre des assistants, ils veulent devenir la couche d'infrastructure sur laquelle d'autres produits s'appuient. Cursor entre ainsi en concurrence directe avec des frameworks d'orchestration d'agents comme LangGraph ou des solutions cloud comme les APIs d'Anthropic ou d'OpenAI, mais avec l'avantage d'un harness prêt à l'emploi qui évite aux équipes de reconstruire from scratch la gestion du contexte, le sandboxing et la compatibilité avec les nouveaux modèles. Alors que les agents de code automatisés deviennent une brique standard des workflows d'ingénierie, cette ouverture du SDK positionne Cursor comme un fournisseur d'infrastructure autant que comme un éditeur de code, un pivot stratégique qui pourrait redéfinir son modèle économique à mesure que la tarification par token s'impose.

UELes équipes d'ingénierie françaises et européennes peuvent intégrer ce SDK dans leurs pipelines CI/CD, mais aucun impact réglementaire ou institutionnel spécifique à la France ou à l'UE n'est impliqué.

OutilsOutil
1 source
Le chaînon manquant entre la hype et la rentabilité
1274MIT Technology Review 

Le chaînon manquant entre la hype et la rentabilité

En février dernier, des manifestants anti-IA défilaient dans les rues de Londres avec un tract signé Pause AI qui résumait involontairement l'état du secteur : "Étape 1 : Créer un super cerveau numérique. Étape 2 : ? Étape 3 : ?" Le clin d'oeil aux "gnomes voleurs de sous-vêtements" de South Park, devenus un mème culte pour moquer les plans d'affaires sans logique, n'était peut-être pas intentionnel, mais il frappait juste. Les entreprises d'IA ont construit la technologie (étape 1) et promis la transformation économique (étape 3). L'étape 2, celle qui explique comment on passe de l'un à l'autre, reste un point d'interrogation. Jakub Pachocki, directeur scientifique d'OpenAI, qualifie l'IA de "technologie économiquement transformatrice", mais la trajectoire concrète reste floue. Deux études récentes illustrent à quel point cet écart entre promesse et réalité est profond. Une recherche d'Anthropic a tenté de cartographier les métiers les plus exposés aux grands modèles de langage, concluant que managers, architectes et journalistes devraient se préparer à des bouleversements, contrairement aux jardiniers ou aux ouvriers du bâtiment. Mais ces prédictions reposent sur ce que les LLM semblent capables de faire en théorie, non sur leurs performances réelles au bureau. Plus révélatrice encore, une étude publiée en février par Mercor, une startup spécialisée dans le recrutement assisté par IA, a soumis plusieurs agents IA alimentés par les meilleurs modèles d'OpenAI, d'Anthropic et de Google DeepMind à 480 tâches professionnelles typiques de banquiers, consultants et juristes. Résultat : chaque agent échoué à accomplir la majorité des tâches qui lui étaient assignées. Ce fossé entre le discours et les faits s'explique par plusieurs facteurs structurels. D'abord, les acteurs qui font les prédictions les plus enthousiastes ont un intérêt financier direct dans leur réalisation. Ensuite, une grande partie des optimistes fondent leurs conclusions sur la progression rapide des outils de codage, qui ne représentent qu'une fraction des usages professionnels réels. Les LLM se révèlent notamment peu fiables pour les décisions stratégiques, qui nécessitent jugement et contextualisation. Et même lorsqu'ils fonctionnent bien en laboratoire, ces outils doivent s'intégrer dans des environnements humains existants, avec leurs habitudes, leurs résistances et leurs workflows hérités. Refondre ces processus autour de l'IA pour en tirer une valeur transformatrice prendra du temps et impliquera des risques. C'est précisément dans ce vide d'information que prospèrent les annonces fracassantes et les prophéties sans preuves. Le problème n'est pas que personne ne sait où l'IA va mener, c'est que tout le monde fait semblant de le savoir.

UELe fossé entre les promesses économiques de l'IA et ses performances réelles en contexte professionnel concerne directement les décideurs et entreprises européens qui investissent massivement dans ces technologies sans visibilité sur le retour attendu.

SociétéOpinion
1 source
La Chine bloque le rachat de Manus par Meta pour contenir les transferts d’IA
1275FrenchWeb 

La Chine bloque le rachat de Manus par Meta pour contenir les transferts d’IA

Pékin a opposé son veto à l'acquisition de Manus, startup chinoise spécialisée dans l'IA agentique, par le géant américain Meta Platforms. L'opération, valorisée à environ 2 milliards de dollars (1,7 milliard d'euros), a été bloquée par la National Development and Reform Commission, l'organisme de planification économique chinois, au nom des règles encadrant les investissements étrangers dans les secteurs stratégiques. La décision intervient alors que Manus s'était fait remarquer début 2025 comme l'un des systèmes d'IA agentique les plus avancés, capable d'exécuter des tâches complexes de manière autonome sans supervision humaine constante. Ce blocage marque un signal fort de Pékin : les technologies d'IA jugées stratégiques ne doivent pas migrer vers des acteurs américains, quelle que soit la valorisation proposée. Pour Meta, qui cherche activement à renforcer ses capacités en IA agentique face à OpenAI et Google, c'est un coup d'arrêt majeur. Pour l'écosystème tech mondial, cette décision illustre comment les deux premières puissances mondiales utilisent désormais la régulation des investissements comme outil de guerre technologique, au-delà des simples droits de douane. Ce veto s'inscrit dans une tendance lourde : depuis 2023, la Chine a considérablement renforcé son contrôle sur les sorties de technologies sensibles, en miroir des restrictions américaines sur les exportations de semi-conducteurs vers Pékin. Manus, fondée par des ingénieurs issus de grandes universités chinoises, représente précisément le type d'actif que Pékin entend protéger. La question reste ouverte de savoir si Meta cherchera une alternative via un partenariat ou se tournera vers d'autres cibles d'acquisition en dehors de la Chine.

UEL'escalade du nationalisme technologique sino-américain pousse les régulateurs et investisseurs européens à anticiper des restrictions similaires sur les fusions-acquisitions dans les technologies d'IA stratégiques.

BusinessOpinion
1 source
La Chine clone-t-elle l’IA américaine ? La Maison-Blanche accuse son rival de pillage industriel
1276Frandroid 

La Chine clone-t-elle l’IA américaine ? La Maison-Blanche accuse son rival de pillage industriel

La Maison-Blanche a publié un mémorandum interne révélant que des entreprises chinoises mènent des opérations de piratage industriel visant à reproduire les grands modèles d'intelligence artificielle américains, notamment ChatGPT d'OpenAI et Claude d'Anthropic. La technique incriminée est le "model distillation" : en interrogeant massivement un modèle existant, il est possible d'entraîner un modèle concurrent à bien moindre coût, sans accéder directement aux poids ou au code source de l'original. Cette pratique permettrait à des acteurs chinois de contourner des années de recherche et des milliards de dollars d'investissement. L'enjeu est considérable pour les entreprises américaines qui ont engagé des ressources colossales dans le développement de leurs modèles. Si le clonage à grande échelle est confirmé, c'est l'avantage compétitif fondamental de l'industrie IA américaine qui est menacé : non pas le code, mais l'intelligence accumulée dans les paramètres des modèles. Pour les utilisateurs et les investisseurs, cela soulève des questions sur la viabilité des barrières à l'entrée dans ce secteur et sur la capacité des entreprises à rentabiliser leurs recherches face à des concurrents qui s'approprient leurs résultats. Cette accusation s'inscrit dans un contexte de rivalité technologique intense entre Washington et Pékin. Le phénomène avait déjà éclaté au grand jour début 2025 avec DeepSeek, dont plusieurs chercheurs avaient soupçonné qu'il s'était appuyé sur des sorties de ChatGPT pour s'entraîner. Les États-Unis ont depuis renforcé les contrôles à l'exportation sur les puces Nvidia destinées à la Chine, mais ces restrictions ne bloquent pas les attaques par distillation, qui n'exigent qu'un accès aux API publiques.

UELa rivalité sino-américaine sur l'IA renforce les enjeux de souveraineté technologique en Europe, où les institutions et régulateurs pourraient être amenés à encadrer l'accès aux API des grands modèles pour limiter des risques similaires de distillation à grande échelle.

Ce que l'accord de SpaceX avec Cursor révèle sur xAI
1277The Information AI 

Ce que l'accord de SpaceX avec Cursor révèle sur xAI

SpaceX a révélé mardi qu'elle envisageait d'acquérir Cursor, l'éditeur de l'environnement de développement assisté par IA, pour une somme estimée à 60 milliards de dollars. Cette annonce intervient quelques mois seulement après que SpaceX a racheté xAI, la startup d'intelligence artificielle d'Elon Musk, pour 250 milliards de dollars en actions début février 2026. Cursor s'est imposé rapidement comme l'un des outils de codage assisté par IA les plus populaires auprès des développeurs, avant de faire face à une concurrence accrue de la part d'Anthropic et d'OpenAI ces derniers mois. Ce possible rachat soulève des questions sérieuses sur l'état réel de xAI. Si SpaceX s'apprête à débourser 60 milliards pour une entreprise extérieure spécialisée dans le codage, c'est en partie parce que xAI elle-même n'a pas réussi à s'imposer face aux leaders du secteur sur ce créneau. Pour les actionnaires de SpaceX, qui ont déjà financé l'acquisition de xAI à hauteur de 250 milliards, la question est directe : que valait réellement cet investissement initial si la startup ne parvient pas à combler ses lacunes technologiques en interne ? Le contexte interne de xAI est en effet troublé. Elon Musk a lui-même reconnu il y a environ un mois que sa startup n'avait pas été "construite correctement dès le départ" et devait être "reconstruite depuis les fondations". Cette déclaration a coïncidé avec des départs massifs au sein de l'entreprise, après une restructuration brutale orchestrée par Musk. L'éventuel rachat de Cursor s'inscrit donc dans une stratégie de rattrapage technologique, au moment où la course aux outils de développement IA s'intensifie entre les grands acteurs. Pour SpaceX, dont une introduction en bourse est dans les tuyaux, cette opération complexifie le récit marketing : l'entreprise se retrouve à financer les erreurs stratégiques d'une autre entité du groupe Musk.

1278The Verge AI 

Les attaques contre Sam Altman sont un avertissement pour le monde de l'IA

Un homme de 20 ans a été accusé d'avoir lancé un cocktail Molotov au domicile de Sam Altman, PDG d'OpenAI, à San Francisco. Selon le San Francisco Chronicle, l'auteur présumé avait exprimé par écrit sa crainte que la course à l'IA ne conduise à l'extinction de l'humanité. Deux jours après cette première attaque, la résidence d'Altman aurait été ciblée une seconde fois, d'après le San Francisco Standard. Une semaine auparavant, un conseiller municipal d'Indianapolis avait signalé treize coups de feu tirés à sa porte, accompagnés d'un message "No Data Centers", après avoir soutenu un projet de rezonage en faveur d'un opérateur de centres de données. Ces incidents ont déclenché une vive inquiétude au sein et autour de l'industrie de l'IA. Ils signalent que l'hostilité envers le secteur technologique ne reste plus confinée aux pétitions ou aux protestations en ligne, mais peut déboucher sur des actes de violence physique ciblant directement des dirigeants et des élus locaux. Pour une industrie déjà sous pression réglementaire et médiatique, ce glissement vers la menace concrète représente un changement de nature dans le rapport avec l'opinion publique. La résistance aux grandes infrastructures numériques, notamment aux centres de données énergivores, et aux avancées rapides de l'IA existe depuis plusieurs années dans diverses communautés. Des groupes s'inquiètent des risques existentiels liés à l'IA générale, tandis que d'autres dénoncent l'impact environnemental et foncier des data centers. Ces attaques surviennent dans un contexte de débat intense sur la régulation de l'IA aux États-Unis et en Europe, et posent la question de la sécurité des figures publiques du secteur technologique dans les mois à venir.

UECes actes de violence aux États-Unis pourraient amplifier les appels à une meilleure régulation de l'IA en Europe, sans impact direct immédiat sur la France ou l'UE.

SociétéOpinion
1 source
MolmoAct : implémentation pour le raisonnement spatial 3D, le suivi de trajectoire et la prédiction robotique
1279MarkTechPost 

MolmoAct : implémentation pour le raisonnement spatial 3D, le suivi de trajectoire et la prédiction robotique

Des chercheurs d'AllenAI ont publié MolmoAct, un modèle multimodal de 7 milliards de paramètres conçu pour raisonner dans l'espace tridimensionnel à partir d'observations visuelles. Le modèle, identifié sous la référence allenai/MolmoAct-7B-D-0812, accepte des entrées multi-vues, c'est-à-dire plusieurs images prises sous différents angles, et génère à partir d'instructions en langage naturel trois types de sorties : une estimation de profondeur, une trajectoire visuelle tracée, et des commandes d'action directement exploitables par un système robotique. Un tutoriel d'implémentation complet a été publié pour permettre aux développeurs de reproduire l'ensemble du pipeline dans Google Colab, en s'appuyant sur PyTorch 2.0 ou supérieur, la bibliothèque Transformers en version 4.52, et une infrastructure GPU standard. Ce type de modèle représente un changement de paradigme dans la robotique pilotée par l'IA : plutôt que de séparer la perception visuelle, la compréhension spatiale et la planification motrice dans des modules distincts, MolmoAct intègre ces trois capacités dans un seul réseau neuronal interrogeable en langage humain. Concrètement, un opérateur peut demander au modèle d'atteindre un objet dans une scène complexe, et le système produit directement la séquence d'actions requise, en tenant compte des distances et obstacles perçus dans les images. Pour les équipes travaillant sur des bras robotiques, des drones autonomes ou des systèmes d'assistance, cette architecture réduit considérablement la complexité d'intégration et ouvre la voie à des robots pilotables par des non-spécialistes. MolmoAct s'inscrit dans une vague de modèles dits "action-reasoning" qui cherchent à combler le fossé entre vision par ordinateur et contrôle robotique. AllenAI, l'institut de recherche fondé par Paul Allen et affilié à l'Université de Washington, développe depuis plusieurs années la famille de modèles Molmo, positionnée comme une alternative ouverte aux modèles multimodaux propriétaires de Google ou OpenAI. La publication d'un tutoriel d'implémentation pas-à-pas, avec un code entièrement reproductible et accessible sur des GPUs grand public, traduit une volonté délibérée de démocratiser ces capacités. La prochaine étape naturelle sera l'évaluation de MolmoAct sur des benchmarks robotiques standardisés et son intégration dans des environnements physiques réels, où la robustesse face aux variations d'éclairage et d'occlusion restera le principal défi.

RobotiqueOpinion
1 source
1280Frandroid 

Le Nobel de chimie qui dirige l’IA chez Google : « J’aurais préféré guérir le cancer avant de lancer ChatGPT »

Demis Hassabis, PDG de Google DeepMind et lauréat du prix Nobel de chimie 2024 pour ses travaux sur AlphaFold, a exprimé publiquement un regret profond : selon lui, le lancement de ChatGPT par OpenAI en novembre 2022 a précipité l'ensemble de l'industrie dans une course commerciale qui a détourné l'IA de ses applications les plus prometteuses, notamment la recherche médicale et scientifique. Il aurait préféré que les grandes avancées en intelligence artificielle servent d'abord à guérir le cancer ou à résoudre des problèmes biologiques complexes, avant d'être massivement déployées pour automatiser des tâches bureautiques. Cet aveu touche un point sensible : la tension entre IA scientifique et IA commerciale est réelle et structurelle. Les laboratoires comme DeepMind avaient construit leur identité autour de la recherche fondamentale, AlphaFold a prédit la structure de plus de 200 millions de protéines, une révolution pour la biologie. Le pivot brutal vers les assistants conversationnels grand public a redirigé les talents, les financements et l'attention médiatique vers des produits générant des revenus immédiats, au détriment de projets à impact potentiellement transformateur mais à retour plus lent. Hassabis n'est pas le premier à formuler cette critique, mais sa position est singulière : il dirige l'un des laboratoires les plus puissants au monde, intégré à Google, donc lui-même acteur de cette course commerciale. Sa déclaration illustre les contradictions internes d'une industrie tiraillée entre ambitions scientifiques de long terme et pressions concurrentielles immédiates imposées par la montée en puissance d'OpenAI et de Microsoft.

UELe débat soulevé par Hassabis sur la priorité accordée à l'IA scientifique versus commerciale résonne en Europe, où l'AI Act et les institutions européennes cherchent précisément à orienter les développements de l'IA vers des applications à impact sociétal mesurable.

💬 Hassabis a raison sur le fond, mais bon, il dirige Google DeepMind, donc il participe à la même course qu'il dénonce. Ce qui me retient dans cette déclaration, c'est moins le regret que l'aveu implicite : l'industrie sait très bien ce qu'elle sacrifie quand elle court après les revenus. AlphaFold, c'était la promesse que l'IA allait servir à quelque chose de vraiment utile, et on a bifurqué vers des chatbots pour rédiger des mails.

SociétéOpinion
1 source
1281Numerama 

L’IA aurait dû rester en laboratoire : le patron de Google DeepMind regrette que ChatGPT soit sorti trop vite

Demis Hassabis, PDG de Google DeepMind et lauréat du prix Nobel de chimie 2024, a exprimé publiquement ses regrets quant à la vitesse à laquelle l'IA générative a été déployée auprès du grand public. Invité du podcast de Cleo Abram, il est revenu sur le choc de novembre 2022 : le lancement de ChatGPT par OpenAI avait alors pris Google complètement par surprise, forçant l'entreprise à accélérer brutalement ses propres calendriers de publication. Hassabis se demande ouvertement si cette course à la commercialisation n'a pas été prématurée. Selon lui, les laboratoires de recherche auraient pu consacrer davantage de temps à comprendre en profondeur les modèles, à résoudre des problèmes fondamentaux de sécurité et d'alignement, plutôt que de se battre pour des parts de marché et des titres de presse. La sortie rapide de ChatGPT a enclenché une dynamique compétitive qui contraint désormais tous les acteurs à publier vite, parfois au détriment de la rigueur scientifique. Ce témoignage illustre une tension de fond dans l'industrie de l'IA : la pression commerciale des entreprises technologiques entre en conflit direct avec les recommandations des chercheurs qui plaident pour une approche plus prudente et progressive. Google, Microsoft, Anthropic et Meta sont aujourd'hui engagés dans une compétition effrénée où chaque annonce de modèle déclenche une réaction en chaîne. Les propos d'Hassabis alimentent un débat plus large sur la gouvernance de l'IA et la responsabilité des laboratoires face à des technologies dont les implications à long terme restent mal comprises.

UELes propos d'Hassabis renforcent la position européenne en faveur d'une régulation prudente de l'IA, soutenant les arguments derrière l'AI Act face à la pression compétitive des grandes plateformes américaines.

ÉthiqueOpinion
1 source
1282Siècle Digital 

Des YouTubeurs accusent Apple d’avoir utilisé leurs vidéos pour entraîner son IA

Le fondateur de h3h3Productions, la chaîne YouTube comptant plusieurs millions d'abonnés, a déposé une action collective devant un tribunal fédéral de Californie contre Apple. Il est rejoint par deux chaînes spécialisées dans le golf, MrShortGame Golf et Golfholics. Les plaignants accusent Apple d'avoir utilisé leurs vidéos sans autorisation ni compensation pour entraîner les modèles de langage qui alimentent Apple Intelligence, le système d'IA intégré à iOS 18, iPadOS 18 et macOS Sequoia. Cette affaire illustre une tension croissante entre les créateurs de contenu numérique et les grandes entreprises technologiques qui aspirent des volumes massifs de données pour construire leurs modèles d'IA. Si le recours aboutit, il pourrait contraindre Apple à indemniser des milliers de créateurs dont les œuvres ont été ingérées sans consentement, et potentiellement redéfinir les obligations légales des entreprises en matière de collecte de données d'entraînement. Pour les YouTubeurs, dont les revenus dépendent directement de la valorisation de leur contenu, l'enjeu est autant financier que symbolique. Cette plainte s'inscrit dans une vague de litiges similaires qui secouent l'industrie de l'IA depuis 2023 : des auteurs, artistes, journaux comme le New York Times, et désormais des créateurs vidéo contestent devant les tribunaux l'utilisation de leurs œuvres par OpenAI, Meta, Google ou Stability AI. Apple, longtemps discret sur ses pratiques d'entraînement, se retrouve pour la première fois en première ligne de ces batailles juridiques qui pourraient remodeler les règles du jeu pour tout le secteur.

UEL'AI Act européen impose des obligations de transparence sur les données d'entraînement, et ce procès pourrait renforcer les revendications des créateurs de contenu européens face aux pratiques similaires des grandes plateformes opérant en Europe.

RégulationReglementation
1 source
Test de Kling AI : le nouveau géant de la vidéo réaliste par intelligence artificielle - avril 2026
1283Le Big Data 

Test de Kling AI : le nouveau géant de la vidéo réaliste par intelligence artificielle - avril 2026

Kling AI, le générateur vidéo développé par Kuaishou — géant chinois des réseaux sociaux — s'est imposé en 2026 comme l'un des outils de création vidéo par intelligence artificielle les plus performants du marché. La plateforme propose deux fonctionnalités principales : la génération de vidéos à partir de descriptions textuelles (Text-to-Video) et l'animation d'images fixes (Image-to-Video). Elle est désormais accessible à l'échelle mondiale avec une interface multilingue, sans nécessiter de matériel de production coûteux. Les tests menés révèlent une qualité de rendu qui dépasse régulièrement les attentes, notamment sur la gestion de la lumière, des ombres et des textures. Des outils avancés comme le "pinceau de mouvement" permettent un contrôle manuel très précis des séquences générées, un niveau de maîtrise rare parmi les concurrents directs. Ce qui distingue Kling AI tient avant tout à sa compréhension fine des mouvements humains naturels et à la cohérence physique des scènes produites. Là où de nombreux générateurs vidéo peinent avec la fluidité des articulations ou la continuité des plans, Kling produit des clips cinématographiques où lumière et physique restent globalement cohérentes. Pour les créateurs de contenu publicitaire, les studios indépendants ou les agences qui cherchent à produire rapidement des visuels professionnels, l'outil représente une alternative crédible aux tournages classiques. La barrière d'entrée technique est faible : une simple description textuelle suffit à générer une séquence en haute définition, ce qui ouvre la production vidéo à un public bien plus large que les seuls professionnels du secteur. Quelques limites demeurent toutefois, notamment des temps d'attente élevés aux heures de pointe et une interface jugée chargée. Kling AI s'inscrit dans une vague de générateurs vidéo IA — aux côtés de Sora (OpenAI), Runway ou Pika — qui transforment profondément les flux de production visuelle. Kuaishou, déjà bien implanté en Asie avec son application de vidéos courtes, capitalise sur cette expertise pour s'imposer sur le marché mondial des outils créatifs. La compétition dans ce segment est féroce : chaque trimestre voit émerger de nouvelles versions avec des capacités augmentées. Le défi à venir pour Kling sera de maintenir sa position technique tout en stabilisant ses performances serveur face à une demande en forte croissance. À terme, ce type d'outil pourrait redéfinir les économies de production dans la publicité, le cinéma indépendant et la création de contenu numérique, en réduisant drastiquement les coûts et délais de réalisation.

UELes créateurs de contenu et agences européens peuvent adopter Kling AI comme alternative crédible aux tournages classiques, réduisant les coûts de production vidéo publicitaire et cinématographique.

OutilsOutil
1 source
Le directeur d'Agentforce quitte Salesforce pour son concurrent Sierra
1284The Information AI 

Le directeur d'Agentforce quitte Salesforce pour son concurrent Sierra

Eric Eyken-Sluyters, le cadre de Salesforce responsable d'Agentforce, l'outil d'IA agentique phare de l'entreprise, a quitté le géant du CRM pour rejoindre Sierra, une startup concurrente en pleine ascension. Il y occupera le poste de président des opérations terrain, selon les informations disponibles. Ce départ est significatif car Eyken-Sluyters supervisait directement Agentforce, le produit sur lequel Salesforce mise pour rester compétitif dans la course aux agents IA d'entreprise. Perdre un dirigeant aussi central au profit d'un concurrent direct envoie un signal fort sur les tensions qui traversent le secteur, où les talents spécialisés en IA sont devenus un enjeu stratégique majeur. Sierra a été fondée par Bret Taylor, actuel président du conseil d'administration d'OpenAI et ancien co-PDG de Salesforce lui-même, ce qui rend le mouvement particulièrement symbolique. Taylor connaît intimement les rouages de son ancienne entreprise, et Sierra se positionne directement sur le marché des agents IA conversationnels pour les entreprises, terrain que Salesforce considère comme central à sa stratégie de croissance. Ce recrutement illustre la bataille de plus en plus ouverte entre les acteurs établis et les startups pour capter les profils qui ont construit les produits IA de la génération actuelle.

BusinessOpinion
1 source
Google Vids : créez, modifiez et partagez des vidéos gratuitement
1285Google AI Blog 

Google Vids : créez, modifiez et partagez des vidéos gratuitement

Google enrichit son outil de création vidéo Vids avec de nouvelles fonctionnalités d'intelligence artificielle, en intégrant ses modèles maison Lyria 3 pour la génération audio et Veo 3.1 pour la vidéo. La nouveauté centrale : ces capacités de génération vidéo haute qualité sont désormais accessibles gratuitement, sans frais supplémentaires pour les utilisateurs de Google Workspace. C'est un signal fort dans la course aux outils créatifs IA. En rendant la génération vidéo professionnelle accessible sans surcoût, Google s'attaque directement à des acteurs comme Runway, Sora d'OpenAI ou Kling, qui facturent leurs fonctionnalités premium. Pour les équipes marketing, les créateurs de contenu et les entreprises utilisant déjà l'écosystème Google, cela élimine une barrière d'entrée significative à la production vidéo assistée par IA. Google Vids a été lancé en 2024 comme réponse à Canva et aux outils de présentation vidéo, intégré à Google Workspace aux côtés de Docs, Sheets et Slides. L'intégration de Veo 3.1, version mise à jour du modèle vidéo présenté à Google I/O 2025, et de Lyria 3 pour la bande sonore, montre la volonté de Google de consolider sa suite bureautique autour de l'IA générative multimodale, face à Microsoft qui déploie Copilot dans Office.

UELes équipes et entreprises françaises déjà abonnées à Google Workspace peuvent désormais accéder gratuitement à la génération vidéo IA professionnelle, supprimant le besoin de souscrire à des outils tiers payants comme Runway ou Kling.

OutilsOutil
1 source
Microsoft mise tout sur le business avec sa nouvelle stratégie d'IA de pointe
1286The Verge AI 

Microsoft mise tout sur le business avec sa nouvelle stratégie d'IA de pointe

Mustafa Suleyman, PDG de l'IA chez Microsoft, a annoncé un changement majeur de cap stratégique pour l'entreprise : après une restructuration d'envergure opérée mi-mars 2026, il a délégué une partie de ses responsabilités opérationnelles pour se concentrer exclusivement sur la poursuite de la superintelligence artificielle. Ce repositionnement, révélé publiquement le mois dernier, était en réalité préparé depuis neuf mois selon ses propres déclarations à The Verge. C'est la renégociation du contrat de Microsoft avec OpenAI qui a officiellement "débloqué la capacité de Microsoft à poursuivre la superintelligence", mais Suleyman affirme avoir planifié cette transition bien avant la signature de cet accord. Ce virage stratégique signale que Microsoft ne se contente plus de déployer des outils d'IA dans ses produits existants, mais ambitionne désormais de jouer un rôle central dans la course à l'AGI et à la superintelligence. En séparant les enjeux opérationnels des ambitions de recherche fondamentale, le groupe de Redmond adopte une structure similaire à celle de ses concurrents comme Google DeepMind ou Anthropic, où la recherche de pointe est isolée des contraintes commerciales quotidiennes. Cette évolution intervient dans un contexte de tension croissante entre Microsoft et OpenAI, deux partenaires dont les intérêts divergent à mesure que les enjeux financiers et technologiques s'amplifient. La renégociation contractuelle entre les deux entités constitue un tournant dans leur relation, Microsoft cherchant à réduire sa dépendance tout en conservant un accès aux modèles les plus avancés. La nomination de Suleyman, cofondateur de DeepMind, à ce nouveau rôle centré sur la superintelligence témoigne de l'ampleur des ambitions que le groupe nourrit pour la prochaine décennie.

UELa concentration des ambitions AGI chez Microsoft creuse davantage l'écart technologique entre les États-Unis et l'Europe, où aucun acteur comparable n'est en mesure de rivaliser dans la course à la superintelligence.

BusinessOpinion
1 source
Oracle licencie jusqu’à 30 000 personnes par mail pour financer son pari IA à 500 milliards
1287Siècle Digital 

Oracle licencie jusqu’à 30 000 personnes par mail pour financer son pari IA à 500 milliards

Oracle a procédé au licenciement de plusieurs milliers de salariés, jusqu'à 30 000 selon certaines estimations, dans le cadre d'une vaste réorganisation interne. La nouvelle a été révélée par Business Insider, qui a obtenu le contenu du message envoyé par l'entreprise : une formule lapidaire informant les employés que leur poste était supprimé et qu'« aujourd'hui est votre dernier jour de travail ». La procédure, menée intégralement par courriel, a touché des équipes à travers plusieurs divisions du groupe américain, fondé et dirigé par Larry Ellison. Cette compression massive de personnel vise à libérer des ressources financières pour financer le virage IA d'Oracle, évalué à 500 milliards de dollars. Le groupe s'est engagé dans le projet Stargate aux côtés d'OpenAI et SoftBank, une initiative colossale de construction d'infrastructures cloud et de centres de données dédiés à l'intelligence artificielle aux États-Unis. Pour Oracle, il s'agit de repositionner son modèle économique autour des services cloud IA, un segment en croissance explosive, au détriment de ses activités traditionnelles jugées moins rentables à long terme. Oracle n'est pas seul dans cette dynamique : Microsoft, Google et Amazon ont tous engagé des cycles similaires de réduction d'effectifs pour réallouer du capital vers l'IA. Ce qui distingue Oracle, c'est l'ampleur des suppressions de postes par rapport à sa taille et la brutalité de la méthode choisie, un simple mail sans préavis visible, qui a provoqué une vive polémique sur les pratiques sociales des grandes entreprises technologiques américaines. La question des conditions de sortie et des recours juridiques pour les salariés concernés reste entière.

UEOracle étant présent dans plusieurs pays européens, une vague de licenciements similaire pourrait toucher les équipes locales, bien que l'article ne mentionne aucune suppression de poste hors des États-Unis.

BusinessActu
1 source
ChatGPT peut désormais vous localiser pour de meilleures recommandations
1288Blog du Modérateur 

ChatGPT peut désormais vous localiser pour de meilleures recommandations

OpenAI a commencé à déployer une nouvelle fonctionnalité de partage de localisation dans ChatGPT, permettant à l'assistant d'accéder à la position géographique précise de l'appareil de l'utilisateur. Concrètement, lorsqu'un utilisateur pose une question nécessitant un contexte local — recommandations de restaurants, météo, événements à proximité, horaires de commerces — ChatGPT peut désormais utiliser ces coordonnées en temps réel plutôt que de se fier à une ville déclarée manuellement ou à des indices textuels. Cette évolution change substantiellement l'utilité de ChatGPT pour les requêtes du quotidien. Jusqu'ici, l'assistant devait demander à l'utilisateur de préciser sa localisation, introduisant une friction qui le désavantageait face à des assistants vocaux comme Siri ou Google Assistant, nativement intégrés au système. Avec l'accès GPS, ChatGPT peut concurrencer directement ces outils sur le terrain des usages locaux et mobiles. Cette fonctionnalité s'inscrit dans une stratégie plus large d'OpenAI visant à transformer ChatGPT en assistant personnel polyvalent, capable de répondre à des besoins contextuels sans configuration préalable. La question de la confidentialité reste centrale : OpenAI devra préciser comment ces données de localisation sont stockées, utilisées et si elles alimentent l'entraînement des modèles — un sujet sensible à l'heure où les régulateurs européens scrutent de près les pratiques des grands acteurs de l'IA.

UELes autorités européennes devront examiner la conformité de cette collecte de données de localisation au RGPD, notamment sur le stockage et l'usage potentiel pour l'entraînement des modèles.

OutilsOutil
1 source
Oracle licencie des milliers d'employés pour financer ses investissements massifs en infrastructure IA
1289The Decoder 

Oracle licencie des milliers d'employés pour financer ses investissements massifs en infrastructure IA

Oracle a procédé à des licenciements massifs touchant plusieurs milliers d'employés, selon des informations rapportées par The Decoder. Ces suppressions de postes s'inscrivent dans une stratégie de réduction des coûts opérationnels destinée à financer un programme colossal de construction de centres de données dédiés à l'intelligence artificielle. L'entreprise, dont le cours de bourse a chuté de 25 % ces derniers mois, accumule par ailleurs une dette croissante liée à ces investissements d'infrastructure. Pour justifier cette mise à l'échelle forcée, Oracle s'appuie sur un carnet de commandes impressionnant, dont un contrat avec OpenAI valorisé à 455 milliards de dollars. Ces engagements contractuels sont présentés en interne comme une garantie de revenus futurs suffisamment solides pour absorber les coûts sociaux et financiers de la transformation. Mais la concrétisation de ces commandes reste incertaine : dans un secteur où les annonces de partenariats précèdent souvent de loin les paiements effectifs, la prudence s'impose. Oracle se positionne ainsi dans la course aux infrastructures IA aux côtés d'Amazon, Microsoft et Google, tous engagés dans une expansion agressive de leurs capacités de calcul. La décision de sacrifier des emplois pour accélérer cette transition illustre une tendance de fond dans la tech : les grandes entreprises réorientent leurs ressources humaines et financières vers l'IA à marche forcée, quitte à prendre des risques considérables si la demande ne suit pas au rythme escompté.

UEOracle étant présent en Europe avec plusieurs milliers d'employés, ces suppressions de postes massives pourraient toucher ses filiales européennes, bien que l'ampleur locale reste indéterminée.

Une startup permet de générer des vidéos à moindre coût
1290The Information AI 

Une startup permet de générer des vidéos à moindre coût

Alors qu'OpenAI a récemment fermé son outil de génération vidéo Sora, d'autres acteurs du secteur continuent d'innover — et cherchent surtout à se démarquer sur le plan économique. LTX, une spin-off de Lightricks (l'éditeur de l'application de retouche photo Facetune), a lancé en janvier 2026 un logiciel open-source de génération et d'édition vidéo par IA, capable de tourner sur un simple ordinateur portable. Son modèle tarifaire est original : les développeurs peuvent utiliser l'outil gratuitement jusqu'à ce que leur chiffre d'affaires dépasse les 10 millions de dollars. Au-delà de ce seuil, ils doivent reverser une portion de leurs revenus à LTX — une règle expliquée directement par Zeev Farbman, PDG de la société. Ce modèle cherche à résoudre un problème concret qui freine l'adoption des outils vidéo par IA : le coût prohibitif des itérations. Aujourd'hui, les modèles ne produisent que rarement le résultat attendu dès la première tentative. Les utilisateurs doivent générer de nombreuses versions du même clip, ajustant les paramètres à chaque essai — ce qui fait rapidement exploser la facture quand chaque génération est payante. Chez des concurrents comme xAI, Google ou Runway, produire une seule minute de vidéo peut coûter de quelques dollars à plus de 10 dollars. En offrant un accès gratuit aux petits développeurs, LTX supprime ce frein à l'expérimentation. Ce lancement intervient dans un contexte où le marché de la vidéo générée par IA cherche encore son modèle économique viable. Lightricks, connue pour ses applications grand public à succès, s'appuie sur son expertise en édition visuelle pour positionner LTX comme une infrastructure accessible aux créateurs et aux développeurs indépendants. La stratégie — laisser croître une base d'utilisateurs gratuits, puis monétiser les success stories — rappelle le modèle de certaines licences open-source commerciales comme celle de MongoDB ou Elastic. Si la qualité des modèles continue de progresser, LTX pourrait devenir une alternative crédible aux plateformes fermées et coûteuses qui dominent actuellement le secteur.

OutilsOutil
1 source
Midterms 2026 : David SACKS pousse l’agenda pro-IA de Donald Trump face à une Amérique de plus en plus hostile
1291FrenchWeb 

Midterms 2026 : David SACKS pousse l’agenda pro-IA de Donald Trump face à une Amérique de plus en plus hostile

À huit mois des élections de mi-mandat de novembre 2026, l'intelligence artificielle s'impose comme un enjeu politique majeur aux États-Unis. David Sacks, nommé « AI & Crypto Czar » par Donald Trump en janvier 2025, pilote une offensive réglementaire et rhétorique visant à faire des États-Unis le leader mondial de l'IA. L'administration Trump a déjà signé un décret exécutif abrogeant les restrictions imposées par Biden sur les modèles d'IA, et prépare un cadre favorable aux grandes entreprises technologiques comme OpenAI, Google, Microsoft et Meta, dont les dirigeants entretiennent des liens étroits avec la Maison-Blanche. L'enjeu est considérable : selon plusieurs sondages récents, une majorité d'Américains se déclarent inquiets des effets de l'IA sur l'emploi, la désinformation et la vie privée. Cette méfiance croissante constitue un handicap politique potentiel pour les républicains, qui risquent de se retrouver en porte-à-faux avec une base électorale peu enthousiaste à l'idée de financer massivement une technologie perçue comme menaçante pour les travailleurs. Cette tension reflète un clivage plus profond entre les intérêts des grandes plateformes technologiques, qui investissent des centaines de milliards de dollars dans l'IA générative, et une société civile qui réclame davantage de garde-fous. Les démocrates cherchent à exploiter ce fossé pour les midterms, tandis que Sacks et ses alliés parient sur la promesse de compétitivité face à la Chine pour rallier l'opinion. Le résultat de ce bras de fer idéologique influencera directement la trajectoire réglementaire de l'IA aux États-Unis pour les années à venir.

UELa trajectoire réglementaire pro-IA de l'administration Trump crée une asymétrie croissante avec l'AI Act européen, risquant de désavantager les entreprises soumises aux exigences de conformité européennes face à des acteurs américains moins contraints.

RégulationReglementation
1 source
Les revenus de Midjourney dépassent désormais largement les 200 millions de dollars
1292The Information AI 

Les revenus de Midjourney dépassent désormais largement les 200 millions de dollars

Midjourney, le générateur d'images par intelligence artificielle fondé par David Holz, a dépassé « significativement » les 200 millions de dollars de chiffre d'affaires en 2023, selon les déclarations de son PDG. L'entreprise est rentable et ses revenus ont continué de progresser depuis lors — une performance remarquable pour une startup qui opère sans avoir jamais levé de fonds extérieurs. Cette annonce confirme que Midjourney s'impose comme l'un des rares acteurs de l'IA générative à atteindre la rentabilité sans diluer son capital. À l'heure où des concurrents comme Adobe Firefly, DALL-E d'OpenAI ou Stable Diffusion se multiplient, la plateforme maintient une base d'abonnés payants solide, ce qui lui confère une indépendance stratégique rare dans le secteur. Holz nourrit cependant des ambitions plus larges : il cherche à développer des projets hardware, une diversification coûteuse qui pourrait l'obliger à ouvrir le capital de l'entreprise pour la première fois. Midjourney, jusqu'ici entièrement autofinancée et pilotée par une équipe réduite, se trouve ainsi à un tournant — entre consolidation de son modèle éprouvé et prise de risque vers de nouveaux territoires physiques.

BusinessOpinion
1 source
Une fuite révèle Claude Mythos, le nouveau modèle Anthropic aux scores nettement supérieurs à tous ses prédécesseurs
1293The Decoder 

Une fuite révèle Claude Mythos, le nouveau modèle Anthropic aux scores nettement supérieurs à tous ses prédécesseurs

Anthropic a involontairement exposé l'existence de son modèle d'intelligence artificielle le plus puissant à ce jour à cause d'une faille de sécurité élémentaire. Le modèle, baptisé Claude Mythos, afficherait des scores « nettement supérieurs » à tous les modèles précédents de la société sur les benchmarks d'évaluation standards. La fuite, survenue début 2026, n'était pas une annonce planifiée mais bien une erreur technique — un accès non sécurisé ayant laissé filtrer des informations internes sur la prochaine génération de modèles Anthropic. Cet incident intervient à un moment particulièrement sensible pour l'entreprise : OpenAI prépare également le lancement de sa propre génération suivante de modèles. Pour les deux sociétés, qui cherchent à consolider leur position sur un marché de plus en plus compétitif, la capacité à démontrer une supériorité technique avant une éventuelle introduction en bourse représente un enjeu considérable. La fuite involontaire d'Anthropic pourrait ainsi accélérer la communication officielle autour de Claude Mythos, sous peine de laisser le narratif se construire sans contrôle. Anthropic, fondée en 2021 par d'anciens membres d'OpenAI dont Dario et Daniela Amodei, a levé plusieurs milliards de dollars ces dernières années auprès d'Amazon et Google notamment. La société a bâti sa réputation sur une approche centrée sur la sécurité des systèmes d'IA avec sa méthodologie « Constitutional AI ». Une annonce officielle autour de Claude Mythos est désormais attendue prochainement, la fuite ayant de facto brûlé l'effet de surprise que l'entreprise réservait probablement pour un événement marketing soigneusement orchestré.

UEL'arrivée prochaine d'un modèle potentiellement de référence influencera les choix technologiques des développeurs et entreprises européens adoptant des solutions d'IA générative.

LLMsActu
1 source
Claude Mythos : la nouvelle IA d’Anthropic va faire trembler la concurrence et pourrait bouleverser tout internet
1294Presse-citron 

Claude Mythos : la nouvelle IA d’Anthropic va faire trembler la concurrence et pourrait bouleverser tout internet

Anthropic prépare une nouvelle génération de modèle d'intelligence artificielle baptisée « Claude Mythos », qui représenterait un bond technologique significatif par rapport aux versions actuelles Claude Opus et Claude Sonnet. Selon les informations disponibles, ce modèle serait nettement plus puissant que ses prédécesseurs, positionnant Anthropic dans une course directe avec OpenAI, Google DeepMind et Meta pour la domination du marché des grands modèles de langage. L'enjeu est considérable : un modèle de cette envergure pourrait redéfinir les standards de l'industrie et accélérer l'adoption de l'IA dans des secteurs critiques — droit, médecine, ingénierie logicielle. Mais Anthropic elle-même s'inquiète des risques que ce lancement ferait peser sur la cybersécurité, notamment la capacité du modèle à faciliter des attaques informatiques sophistiquées ou à automatiser des opérations malveillantes à grande échelle. Cette tension entre puissance et sécurité est au cœur de la philosophie d'Anthropic, fondée en 2021 par d'anciens cadres d'OpenAI précisément pour développer une IA « constitutionnelle » et alignée sur les valeurs humaines. Avec Claude Mythos, la startup — valorisée à plus de 60 milliards de dollars après ses dernières levées de fonds — devra arbitrer entre impératif commercial et responsabilité, dans un contexte réglementaire international de plus en plus scrutateur.

UEUn modèle aussi puissant sera soumis à l'AI Act européen, notamment aux obligations de transparence et d'évaluation des risques pour les systèmes à haut risque.

LLMsOpinion
1 source
L’IA de Google peut désormais créer des musiques de 3 minutes avec un simple prompt
1295Frandroid 

L’IA de Google peut désormais créer des musiques de 3 minutes avec un simple prompt

Google a élargi les capacités de Lyria, son modèle d'intelligence artificielle dédié à la génération audio, en portant la durée maximale des compositions musicales à trois minutes à partir d'un simple prompt textuel. Cette mise à jour, annoncée début 2026, représente un bond significatif par rapport aux extraits courts que l'outil produisait jusqu'alors, et positionne Lyria comme un concurrent direct des solutions de génération musicale longue durée déjà sur le marché. Cette évolution ouvre des possibilités concrètes pour les créateurs de contenu, les développeurs de jeux vidéo, les réalisateurs indépendants et les professionnels du marketing qui cherchent à générer rapidement des habillages sonores sans faire appel à des compositeurs. Trois minutes correspondent à la durée standard d'une chanson pop ou d'un générique, ce qui rend l'outil directement exploitable dans des productions réelles, sans post-traitement nécessaire. Lyria s'inscrit dans la course effrénée que se livrent les grandes entreprises technologiques sur le terrain de la création audio générative. Suno et Udio avaient ouvert la voie avec des titres complets incluant paroles et voix, tandis que Meta et OpenAI développent également leurs propres approches. Google, fort de ses décennies de recherche en traitement du signal et de ses infrastructures TPU, cherche à s'imposer comme la référence professionnelle du secteur, notamment via son intégration dans l'écosystème YouTube et Google Cloud.

UELes créateurs de contenu, réalisateurs indépendants et développeurs de jeux européens disposent désormais d'un outil de génération musicale complète (3 minutes) directement exploitable dans leurs productions sans recourir à des compositeurs.

OutilsOutil
1 source
Tencent AI publie Covo-Audio en open source : un modèle de langage vocal 7B pour la conversation audio en temps réel
1296MarkTechPost 

Tencent AI publie Covo-Audio en open source : un modèle de langage vocal 7B pour la conversation audio en temps réel

Tencent AI Lab a publié Covo-Audio, un modèle de langage audio de 7 milliards de paramètres conçu pour traiter directement des entrées audio continues et générer des sorties vocales au sein d'une seule architecture unifiée. Le système repose sur quatre composants principaux : un encodeur audio basé sur Whisper-large-v3, un adaptateur qui réduit le débit de 50 Hz à 6,25 Hz, un backbone LLM fondé sur Qwen2.5-7B-Base, et un décodeur capable de reconstruire des formes d'onde haute-fidélité à 24 000 Hz. Une innovation centrale, baptisée « Hierarchical Tri-modal Speech-Text Interleaving », aligne simultanément les caractéristiques acoustiques continues, les tokens vocaux discrets et le texte en langage naturel, permettant une cohérence sémantique aussi bien au niveau des phrases que des utterances longues. L'entraînement a impliqué un pipeline en deux étapes traitant au total 2 000 milliards de tokens. Le modèle intègre également une stratégie de découplage intelligence-voix qui sépare le raisonnement dialogique du rendu vocal, minimisant ainsi le besoin de données d'entraînement spécifiques à chaque locuteur. Une variante temps-réel, Covo-Audio-Chat-FD, permet une communication en duplex intégral avec des chunks audio de 0,16 seconde et des tokens spéciaux pour gérer les interruptions et les transitions de parole. Covo-Audio représente une avancée significative vers des assistants vocaux capables de raisonner en temps réel sans passer par des pipelines séparés de reconnaissance vocale et de génération de texte. La capacité duplex intégral — où le modèle peut écouter et parler simultanément, détecter les interruptions et reprendre l'écoute instantanément — rapproche considérablement les systèmes IA d'une conversation naturelle fluide. La technique de découplage intelligence-voix est particulièrement notable sur le plan commercial : elle permet de personnaliser la voix d'un assistant avec très peu de données TTS, sans sacrifier les capacités de raisonnement, ce qui réduit drastiquement les coûts de déploiement de voix personnalisées. L'intégration du raisonnement en chaîne de pensée (Chain-of-Thought) directement dans le flux audio ouvre également la voie à des assistants vocaux capables de traiter des requêtes complexes en direct, là où les systèmes actuels se limitent souvent à des réponses factuelles simples. Ce lancement s'inscrit dans une course industrielle intense autour des modèles audio de bout en bout, avec des acteurs comme OpenAI (GPT-4o), Google (Gemini Live) et Meta qui investissent massivement dans la suppression des latences introduites par les architectures en pipeline classiques. La mise en open source de Covo-Audio par Tencent positionne le laboratoire comme un contributeur majeur à cet espace, tout en offrant à la communauté de recherche une base solide pour explorer les interactions vocales intelligentes multimodales.

UELa mise en open source de Covo-Audio offre aux développeurs et chercheurs européens un accès direct à un modèle vocal avancé sans dépendance à des API propriétaires, réduisant les coûts de déploiement d'assistants vocaux personnalisés.

LLMsOpinion
1 source
L’IA Claude peut contrôler votre ordinateur pour travailler à votre place
1297Frandroid 

L’IA Claude peut contrôler votre ordinateur pour travailler à votre place

Anthropic a doté son IA Claude de capacités agentiques lui permettant de contrôler un ordinateur et d'effectuer des tâches à la place de l'utilisateur. Cette annonce positionne Anthropic comme concurrent direct d'OpenAI dans le domaine de l'IA agentique. L'article est issu de Frandroid.

UELes utilisateurs et entreprises européens peuvent désormais accéder aux capacités de contrôle d'ordinateur de Claude, ouvrant de nouvelles possibilités d'automatisation de tâches.

OutilsActu
1 source
The Download : le bien-être animal conquis par l'AGI, et la Maison Blanche dévoile sa politique IA
1298MIT Technology Review 

The Download : le bien-être animal conquis par l'AGI, et la Maison Blanche dévoile sa politique IA

Le mouvement de bien-être animal de la Bay Area explore comment l'IA générale pourrait réduire la souffrance animale, avec des militants et chercheurs réunis à San Francisco pour discuter d'agents IA dans le lobbying et de viande cultivée par IA. La Maison Blanche a dévoilé son cadre de politique IA, Trump souhaitant que le Congrès le codifie en loi tout en bloquant les réglementations étatiques, tandis que le Pentagone adopte Palantir comme système militaire central pour le ciblage d'armes. Par ailleurs, Elon Musk a été reconnu coupable d'avoir induit en erreur les investisseurs de Twitter avant son rachat à 44 milliards de dollars, et OpenAI prévoit d'afficher des publicités aux utilisateurs gratuits de ChatGPT pour financer ses coûts de calcul croissants.

UELe cadre de politique IA de la Maison Blanche visant à bloquer les réglementations étatiques américaines pourrait renforcer la pression sur l'UE pour harmoniser son propre cadre réglementaire face à un bloc américain unifié.

SociétéReglementation
1 source
1299Latent Space 

Le Fil IA : chaque grand laboratoire d'IA investit dans ses propres outils de développement

OpenAI a acquis Astral (créateurs de Ruff et uv), complétant une tendance où les grands labs rachètent des outils développeurs clés — après que Google DeepMind a acquis l'équipe Antigravity et Anthropic a racheté Bun. En parallèle, Cursor a lancé Composer 2, un modèle de coding frontier avec des coûts réduits (0,50 $/M tokens en entrée), atteignant 73,7 sur SWE-bench Multilingual grâce à un premier run de pretraining continu suivi de RL distribué sur 3-4 clusters. Ces acquisitions s'inscrivent dans une course stratégique des labs à contrôler l'environnement de développement, alors que le coding agentique s'impose comme un levier central d'accélération des LLMs eux-mêmes.

OutilsOpinion
1 source
IA de guerre : le Pentagone crée sa propre alternative à Anthropic
1300Le Big Data 

IA de guerre : le Pentagone crée sa propre alternative à Anthropic

Le Pentagone, suite au refus d'Anthropic de fournir son IA pour des usages militaires, a décidé de créer ses propres modèles d'IA, malgré la présence d'OpenAI et xAI. Le Chief Digital and Artificial Intelligence Officer (CDAO) du département de la Guerre des États-Unis, Cameron Stanley, a confirmé le lancement de ces initiatives internes. Les nouveaux systèmes reposent sur des modèles de langage intégrés directement dans des environnements gouvernementaux et pourraient être déployés rapidement, bien que sans date précise annoncée.

UELe développement d'IA militaire souveraine par le Pentagone accentue la pression sur l'UE pour définir sa propre doctrine d'usage de l'IA dans le secteur défense, notamment dans le cadre du règlement IA Act qui encadre les systèmes à haut risque.

RégulationActu
1 source