Aller au contenu principal

Dossier OpenAI — page 25

1852 articles · page 25 sur 38

Toute l'actualité d'OpenAI : nouvelles versions de ChatGPT et GPT, stratégie produit, partenariats, controverses et décisions de Sam Altman.

Créez des vidéos de foot virales gratuitement avec l’IA (Chaîne Youtube sur la Coupe du Monde 2026)
1201Le Big Data CréationTuto

Créez des vidéos de foot virales gratuitement avec l’IA (Chaîne Youtube sur la Coupe du Monde 2026)

Un tutoriel publié sur YouTube et relayé par LeBigData.fr démontre qu'il est désormais possible de produire des vidéos virales sur la Coupe du Monde 2026 sans budget ni compétences en montage, en s'appuyant exclusivement sur des outils gratuits d'intelligence artificielle. Le workflow présenté s'articule autour de cinq plateformes enchaînées : ChatGPT génère en quelques secondes un plan complet incluant les prompts d'images, le script de voix off et le découpage scène par scène. Les visuels sont ensuite produits via Nano Banana 2 sur Flow AI ou Piclumen, qui offre une vingtaine de crédits gratuits par jour. La plateforme Wan anime ces images en séquences vidéo fluides, et CapCut assure le montage final avec voix off et musique. Ce type de contenu représente une rupture concrète dans la création vidéo grand public. Ce qui nécessitait auparavant une équipe de production, un logiciel payant comme Premiere Pro ou After Effects, et plusieurs heures de travail peut désormais être accompli par n'importe quel débutant en moins d'une heure. Pour les créateurs de contenu indépendants, les petits médias ou les passionnés de sport, l'accès à un pipeline de production professionnel sans investissement financier change radicalement les règles du jeu sur des plateformes comme YouTube ou TikTok, où la vitesse de publication et le volume de contenu sont déterminants. Ce tutoriel s'inscrit dans une vague plus large d'outils génératifs qui démocratisent la production audiovisuelle. Des plateformes comme Runway, Pika ou Sora d'OpenAI ont ouvert la voie à la génération vidéo par IA, mais restent souvent payantes ou en accès limité. La combinaison d'outils gratuits présentée ici constitue une alternative crédible et immédiatement utilisable. Avec la Coupe du Monde 2026 qui se déroulera aux États-Unis, au Canada et au Mexique à partir du 11 juin, l'événement représente une opportunité massive pour les créateurs cherchant à capter une audience sportive mondiale, et les outils IA pourraient y jouer un rôle inédit dans la production de contenu amateur à grande échelle.

1 source
Sam Altman affirme que toute une génération de chercheurs a freiné l'IA en sous-estimant le potentiel du passage à l'échelle
1202The Decoder 

Sam Altman affirme que toute une génération de chercheurs a freiné l'IA en sous-estimant le potentiel du passage à l'échelle

Lors d'une conférence à Stanford, Sam Altman a pris la défense du scaling des grands modèles de langage et s'en est pris directement aux chercheurs sceptiques, affirmant qu'une génération entière de scientifiques a freiné l'avancement de l'IA en sous-estimant ce que l'augmentation de la puissance de calcul et des données pouvait produire. Pour étayer son propos, le PDG d'OpenAI a cité un résultat récent de son entreprise : la réfutation automatisée d'une conjecture mathématique, un type de raisonnement abstrait longtemps considéré hors de portée des systèmes actuels. Cette prise de position tranche dans un débat qui agite le monde de la recherche depuis plusieurs années. De nombreux académiciens et chercheurs avaient soutenu que le scaling seul ne suffirait pas à produire une intelligence générale, et que des approches fondamentalement différentes seraient nécessaires. Si Altman a raison, ces voix critiques n'ont pas seulement eu tort sur le plan technique : elles ont activement ralenti les investissements et les orientations de recherche vers une voie qui s'avère productive. L'enjeu dépasse la fierté intellectuelle, il touche à l'allocation de milliards de dollars en R&D. Le contexte est celui d'une période charnière pour OpenAI, qui multiplie les démonstrations de capacités avancées pour justifier sa valorisation dépassant les 300 milliards de dollars. Les lois de scaling, théorisées notamment par les chercheurs de DeepMind et OpenAI autour de 2020, avaient déjà divisé la communauté. La sortie de modèles comme o3 et GPT-4o relance la question : le scaling est-il un plafond ou une rampe, et qui avait vraiment raison ?

💬 Altman a raison, même si c'est très pratique de le dire quand on vaut 300 milliards. Les paris de recherche se paient cash : sous-estimer le scaling pendant dix ans, c'est des milliards réorientés vers des impasses et des années brûlées pour tout le secteur. La conjecture mathématique réfutée automatiquement, c'est le genre de résultat qui rend le débat difficile à esquiver.

RecherchePaper
1 source
Microsoft et Y Combinator noue un partenariat pour accompagner les startups IA
1203Le Big Data 

Microsoft et Y Combinator noue un partenariat pour accompagner les startups IA

Microsoft a annoncé le 17 juin 2026 l'extension de son partenariat avec Y Combinator, l'un des accélérateurs de startups les plus influents au monde, pour accompagner la prochaine vague de jeunes entreprises spécialisées dans l'intelligence artificielle. Concrètement, les fondateurs passant par le programme YC pourront accéder à des crédits Azure pour financer leur infrastructure, à des ressources GPU haute performance pour l'entraînement et l'inférence de modèles, ainsi qu'à l'écosystème Microsoft Foundry, la plateforme unifiée regroupant modèles, outils et services IA de Microsoft. L'accompagnement va au-delà du technique : des ingénieurs, architectes et experts Microsoft seront mobilisés pour aider les équipes dans leurs choix d'architecture, l'optimisation des coûts et la préparation à la mise en production. Le programme Microsoft for Startups ouvre également l'accès au Microsoft Marketplace et aux dispositifs de vente conjointe, donnant aux startups une voie directe vers les grands comptes B2B. Ce partenariat compte parce qu'il déplace la ligne de départ pour les startups IA. Historiquement, accéder à une infrastructure de niveau entreprise, GPU massivement parallèles, environnements de déploiement fiables, réseaux de distribution commerciaux, supposait d'avoir levé des dizaines de millions de dollars. En intégrant ces ressources dès les premières phases de développement, Microsoft et Y Combinator permettent à de petites équipes de concevoir des systèmes fiables et évolutifs sans attendre d'atteindre une taille critique. Pour les fondateurs, l'enjeu est décisif : le passage de l'expérimentation à la production industrielle est souvent le moment où des projets prometteurs s'effondrent, faute de moyens techniques ou commerciaux suffisants. Ce rapprochement s'inscrit dans une bataille plus large pour capter les futures licornes de l'IA dès leur naissance. Y Combinator, qui a accompagné Stripe, Airbnb ou OpenAI à leurs débuts, représente un vivier stratégique : les startups qui en sortent lèvent en moyenne plusieurs millions de dollars dans les mois suivant leur batch, et certaines deviennent des références mondiales. Microsoft, qui a déjà investi massivement dans OpenAI et intégré l'IA dans l'ensemble de sa suite produit, cherche à s'imposer comme la plateforme par défaut sur laquelle se construira la prochaine génération d'entreprises IA natives. Face à Google Cloud, AWS et à l'écosystème Nvidia, ce partenariat avec YC est une manière de fidéliser des équipes techniques avant qu'elles n'aient encore choisi leur fournisseur principal, et potentiellement de les accompagner jusqu'à leur entrée en bourse.

UELes fondateurs européens participant aux batches YC pourraient indirectement bénéficier de ces ressources, mais l'accord ne comporte aucun volet spécifique pour les startups de la zone UE.

BusinessOpinion
1 source
Frontier Radar #3 : comment l'IA à base d'agents fait des tokens un indicateur métier
1204The Decoder 

Frontier Radar #3 : comment l'IA à base d'agents fait des tokens un indicateur métier

L'essor des workflows agentiques transforme en profondeur la manière dont les fournisseurs d'IA facturent leurs services. Contrairement au modèle classique d'abonnement mensuel avec accès illimité au chat, les agents IA autonomes consomment des volumes de tokens sans commune mesure avec une simple conversation: ils s'exécutent pendant des heures, enchaînent les tâches de manière autonome et mobilisent en continu des ressources de calcul. Face à ces volumes, les forfaits à prix fixe deviennent économiquement insoutenables pour les prestataires, qui se tournent massivement vers une tarification à la consommation. Ce changement de modèle a des conséquences concrètes pour les entreprises qui intègrent l'IA dans leurs processus. Le prix affiché au token devient un indicateur trompeur: il varie selon la vitesse d'inférence, le niveau de spécialisation du modèle et la valeur économique générée par le résultat. Un token bon marché peut masquer un coût total bien plus élevé si le modèle est lent, peu fiable ou nécessite de nombreuses itérations pour accomplir une tâche. Mesurer la valeur de l'IA à travers le seul volume de tokens consommés revient donc à évaluer un service de transport uniquement au carburant brûlé, sans tenir compte de la destination ni du temps de trajet. L'industrie se trouve à un point d'inflexion où les métriques héritées du web (abonnements, sièges, requêtes) ne rendent plus compte de la réalité opérationnelle des systèmes agentiques. Les acteurs comme OpenAI, Anthropic ou Google DeepMind expérimentent des grilles tarifaires hybrides, mêlant consommation, performance et résultat. La question centrale pour les prochains mois sera de déterminer quelle métrique, au-delà du token, permettra de relier le coût de l'IA à la valeur qu'elle crée réellement pour l'entreprise.

UELes entreprises françaises et européennes qui déploient des workflows agentiques doivent revoir leurs modèles de budgétisation IA, la tarification à la consommation remplaçant les forfaits fixes et rendant l'estimation des coûts opérationnels plus complexe.

BusinessOpinion
1 source
☕️ L’administration Trump envisage d’entrer au capital des géants de l’IA
1205Next INpact 

☕️ L’administration Trump envisage d’entrer au capital des géants de l’IA

L'administration Trump envisage de prendre des participations au capital des principaux laboratoires d'intelligence artificielle américains, selon des informations rapportées par le Wall Street Journal. Interrogé à bord d'Air Force One, Donald Trump a exprimé un intérêt direct pour l'idée, évoquant la possibilité de « créer un partenariat avec le public américain » et de rendre les citoyens « partenaires » des entreprises du secteur. Le mécanisme envisagé consisterait à redistribuer les gains futurs via un fonds souverain ou un dispositif similaire. Le 2 juin, Trump a par ailleurs signé un décret présidentiel, jugé en demi-teinte par les observateurs, instaurant un processus d'évaluation volontaire pour les modèles d'IA avancés, auquel OpenAI a confirmé sa participation. L'enjeu est considérable à mesure qu'OpenAI et Anthropic se rapprochent d'introductions en bourse potentiellement records. Une prise de participation publique permettrait à l'État fédéral de capter une fraction des valorisations futures, dans un secteur où les montants en jeu se chiffrent en centaines de milliards de dollars. Sur le plan politique, le projet répond aussi à une défiance croissante de la population américaine envers l'IA : 71 % des Américains s'opposent à l'installation de nouveaux centres de données. Offrir aux citoyens une part des bénéfices constituerait un levier pour rendre cette technologie politiquement acceptable, en transformant les contribuables en bénéficiaires directs plutôt qu'en spectateurs inquiets. Cette idée n'est pas née sous Trump : Sam Altman, fondateur et PDG d'OpenAI, la défend depuis des années, bien avant le lancement de ChatGPT. Pour élargir la coalition de soutien, il a rencontré le sénateur Bernie Sanders, figure de la gauche américaine, qui travaille de son côté sur une mesure bien plus radicale : transférer 50 % du capital des grandes entreprises d'IA vers un fonds public. En avril, OpenAI avait déjà proposé la création d'un tel fonds de redistribution directe vers les citoyens. Le gouvernement fédéral a d'ores et déjà démontré sa volonté d'intervenir dans le capital industriel, en acquérant 9,9 % d'Intel. Rien n'est toutefois officiellement décidé, et le risque d'un éclatement de la bulle IA, qui réduirait drastiquement la valeur de ces investissements publics, reste une hypothèse que personne ne peut exclure.

UEL'éventuelle prise de participation publique américaine dans les grands laboratoires d'IA pourrait nourrir le débat européen sur la gouvernance des technologies stratégiques et l'opportunité de créer des fonds souverains dédiés à l'IA.

💬 L'idée vient de Sam Altman, pas de Trump, c'est important de le rappeler. Il pousse ce truc depuis avant ChatGPT, et il vient quand même de mettre d'accord Trump et Bernie Sanders sur le même projet. Reste que placer du fric public sur des boîtes valorisées à 300 milliards avant leur IPO, c'est un sacré pari si la bulle tient pas.

Apple présente la troisième génération de ses modèles de fondation
1206Apple Machine Learning 

Apple présente la troisième génération de ses modèles de fondation

Apple a dévoilé la troisième génération de ses Apple Foundation Models (AFM), une famille de cinq modèles d'intelligence artificielle développés en collaboration avec Google. Ces modèles, présentés comme le coeur de la prochaine version d'Apple Intelligence, couvrent un spectre allant des modèles fonctionnant directement sur l'appareil jusqu'aux modèles hébergés sur des serveurs via l'infrastructure Private Cloud Compute. Ils alimenteront notamment une refonte complète de Siri ainsi qu'une série d'outils intelligents intégrés aux systèmes d'exploitation Apple. Ce partenariat avec Google marque un tournant stratégique pour Apple, qui avait jusqu'ici développé ses modèles en interne. L'enjeu est considérable : Apple doit rattraper son retard sur des concurrents comme OpenAI, Google et Microsoft dans la course aux assistants IA natifs. En distribuant le traitement entre l'appareil local et le cloud sécurisé, Apple cherche à offrir des capacités IA avancées sans sacrifier la confidentialité des données, un argument différenciateur central face à des services cloud classiques. Cette annonce s'inscrit dans la stratégie Apple Intelligence lancée en 2024, dont le déploiement progressif avait suscité des critiques sur la lenteur des livraisons. La collaboration avec Google est particulièrement significative : les deux entreprises, habituellement rivales sur les moteurs de recherche et les systèmes mobiles, s'associent ici sur la couche infrastructure IA. La famille de cinq modèles suggère une segmentation fine des cas d'usage, de la compréhension vocale embarquée aux tâches complexes nécessitant de la puissance serveur.

UEL'architecture vie-privée-first d'Apple (traitement local via Private Cloud Compute) s'aligne avec les exigences du RGPD, ce qui pourrait faciliter l'adoption d'Apple Intelligence par les entreprises et institutions européennes soucieuses de la souveraineté des données.

LLMsOpinion
1 source
EVE : un système générateur-vérificateur pour les politiques génératives
1207arXiv cs.RO 

EVE : un système générateur-vérificateur pour les politiques génératives

Des chercheurs ont publié en décembre 2024 sur arXiv (2512.21430) EVE, un framework modulaire de type générateur-vérificateur visant à améliorer les politiques visuomotrices génératives en robotique, au moment de l'inférence et sans aucun réentraînement. Le système enveloppe une politique de base figée, reposant sur la diffusion ou le flow-matching, avec plusieurs agents vérificateurs VLM (Vision-Language Model) opérant en mode zéro-shot. Chaque vérificateur propose des raffinements d'actions candidates générées par la politique de base ; un module d'incorporation fusionne ensuite les retours agrégés via un guidage par classifieur intégré dans le processus de débruitage de l'action. Les évaluations couvrent des tâches de manipulation simulées et réelles sur différents embodiments robotiques, avec des gains de taux de succès mesurés dans chaque configuration testée, sans modifier ni la politique ni les vérificateurs. L'intérêt principal réside dans le transfert d'une technique émergente des LLMs, le scaling du compute au test-time, vers la commande robotique incarnée. Des systèmes comme OpenAI o1 ou DeepSeek-R1 ont montré qu'allouer davantage de calcul à l'inférence améliore significativement les performances, sans toucher aux poids du modèle. EVE applique cette logique aux politiques génératives : là où une politique de diffusion dégrade sous distribution shift (scènes inédites, objets non vus à l'entraînement, perturbations), les vérificateurs VLM guident la correction sans fine-tuning coûteux. Pour les intégrateurs et décideurs B2B, le signal est concret : améliorer les performances d'un modèle déployé pourrait devenir une question de ressources de calcul à l'inférence, non de nouveaux cycles d'entraînement sur des données supplémentaires. Les politiques visuomotrices par diffusion ont émergé à partir de 2023 avec Diffusion Policy (Columbia University) et ACT, suivies d'architectures flow-matching comme pi0 de Physical Intelligence. Ces modèles performent correctement sur leur distribution d'entraînement mais peinent hors distribution, un frein central au déploiement industriel. EVE s'inscrit dans une tendance plus large qui consiste à coupler des VLMs généralistes avec des politiques spécialisées sans réentraînement. Les approches concurrentes incluent le Best-of-N sampling appliqué à la robotique et les méthodes de récompense dense au test-time (SuSIE, GROOT). La suite logique serait de valider EVE sur des plateformes physiques à plus grande échelle et de quantifier le trade-off latence/qualité en fonction du nombre de vérificateurs actifs simultanément.

💬 Le test-time compute en robotique, c'était la suite évidente après o1, et j'attendais que quelqu'un le fasse proprement. Améliorer une politique déployée sans relancer un cycle d'entraînement, c'est le genre d'approche qui va vraiment intéresser les intégrateurs si ça tient en prod. Tu gardes un oeil sur le trade-off latence/nombre de vérificateurs, parce que là ça peut vite coûter cher.

RobotiqueOpinion
1 source
Trusted Contact : la nouvelle fonction de ChatGPT face aux moments les plus sombres
1208Le Big Data 

Trusted Contact : la nouvelle fonction de ChatGPT face aux moments les plus sombres

OpenAI a lancé le 7 mai 2026 une nouvelle fonctionnalité optionnelle dans ChatGPT baptisée "Trusted Contact", littéralement "contact de confiance". Disponible pour les utilisateurs majeurs, elle permet de désigner une personne proche depuis les paramètres de l'application. Cette personne doit ensuite accepter l'invitation pour activer le dispositif. Lorsque les échanges avec ChatGPT font apparaître des signaux préoccupants, liés à une détresse émotionnelle ou une crise, l'utilisateur est d'abord invité à contacter lui-même cette personne de confiance. Ce n'est qu'après une vérification humaine qu'une alerte peut être transmise au proche désigné. OpenAI précise que ces notifications restent volontairement limitées : aucun transcript de conversation n'est partagé, le message envoyé se contente d'indiquer qu'une situation inquiétante a été détectée et invite le contact à prendre des nouvelles. La fonctionnalité a été développée en collaboration avec des psychologues, des chercheurs en santé mentale et des experts en prévention du suicide. Ce lancement reflète une évolution profonde du rôle que jouent les assistants IA dans la vie quotidienne. Des millions d'utilisateurs se confient à ChatGPT sur des sujets intimes, solitude, ruptures, conflits familiaux, parfois sans interlocuteur humain disponible. OpenAI tente ici de transformer ce rapport en levier de protection plutôt qu'en angle mort. En orientant vers un proche réel au lieu de traiter seul la détresse, le système cherche à pallier une limite structurelle des chatbots : leur incapacité à agir concrètement en situation de crise. Pour les professionnels de santé mentale, l'enjeu est de taille : si le dispositif fonctionne tel que décrit, il pourrait servir de filet de sécurité pour des personnes qui ne sollicitent pas d'aide par elles-mêmes. Trusted Contact s'inscrit dans une stratégie plus large d'OpenAI autour du bien-être numérique, engagée depuis plusieurs mois. ChatGPT peut déjà suggérer des pauses après une utilisation prolongée, refuser des demandes jugées dangereuses et rediriger les utilisateurs vers des lignes d'assistance locales. Mais cette nouvelle fonction franchit un seuil : elle implique pour la première fois un tiers humain dans la boucle de surveillance, ce qui soulève des questions légitimes sur la vie privée et la confiance. OpenAI a anticipé ces réticences en maintenant la vérification humaine avant toute alerte et en limitant strictement le contenu des notifications, mais le débat sur la frontière entre protection et surveillance reste entier. À mesure que les IA conversationnelles s'intègrent aux moments les plus vulnérables de la vie des utilisateurs, la question de leur responsabilité émotionnelle et éthique devient incontournable pour l'ensemble de l'industrie.

UELa fonctionnalité soulève des questions de conformité RGPD concernant le traitement de données de santé particulièrement sensibles et la notification de tiers, dans un cadre réglementaire européen nettement plus contraignant qu'aux États-Unis.

SociétéOpinion
1 source
Midjourney V8 Alpha : un nouveau souffle pour la création visuelle IA
1209Le Big Data 

Midjourney V8 Alpha : un nouveau souffle pour la création visuelle IA

Midjourney a lancé le 27 mars 2026 la version V8 Alpha de son générateur d'images, marquant une rupture technique notable avec la V7. La nouveauté la plus immédiate est la vitesse : le modèle génère des images jusqu'à cinq fois plus rapidement que son prédécesseur. L'accès ne passe plus par Discord mais par un portail web dédié, alpha.midjourney.com, réservé aux abonnés actifs de la plateforme. La résolution native passe à 2K, sans étape d'upscaling artificiel, chaque pixel étant calculé dès la phase initiale de génération. Le modèle embarque également un algorithme de compréhension du langage revu, censé mieux respecter les instructions de cadrage complexes et réduire les erreurs anatomiques récurrentes sur les visages. Un nouveau mode de travail, le Grid Mode, permet de visualiser et modifier des variantes en temps réel directement depuis l'interface web. Ce virage technique positionne Midjourney comme un outil de production sérieux, et non plus comme un terrain d'expérimentation communautaire adossé à une messagerie. Pour les studios de design, les agences créatives et les illustrateurs professionnels, la combinaison résolution 2K natif et latence réduite change concrètement le rythme de travail : là où une itération prenait plusieurs dizaines de secondes, elle se mesure désormais en quelques secondes. Le abandon du canal Discord, longtemps critiqué pour son ergonomie chaotique, simplifie la gestion des ressources GPU côté serveur et offre un environnement moins encombré. Pour les utilisateurs réguliers, la qualité des ombres, des lumières et des textures franchit un palier visible dès les premiers essais, réduisant le nombre de générations nécessaires avant d'obtenir un résultat exploitable. Midjourney avait subi quelques critiques après la V7, jugée décevante par une partie de sa base d'utilisateurs qui attendait un saut plus marqué. La V8 répond à cette pression concurrentielle dans un segment ou Adobe Firefly, Stable Diffusion et les outils de génération de Google et OpenAI se disputent les mêmes créatifs professionnels. Le passage à une interface web propriétaire reflète aussi une stratégie de monétisation et de contrôle plus direct sur l'expérience utilisateur, en s'affranchissant de la dépendance à l'infrastructure Discord. Le déploiement reste semi-fermé en phase alpha, ce qui laisse anticiper des ajustements supplémentaires avant une disponibilité générale. La prochaine étape sera de voir si ces gains de performance se confirment sur des cas d'usage exigeants, et si Midjourney parvient à fidéliser les créatifs qui avaient commencé à explorer des alternatives plus stables.

CréationOpinion
1 source
Google, Microsoft, xAI… Trump va tester les nouvelles IA en avant-première
1210Le Big Data 

Google, Microsoft, xAI… Trump va tester les nouvelles IA en avant-première

Google DeepMind, Microsoft et xAI ont conclu un accord formel avec l'administration Trump pour soumettre leurs futurs modèles d'intelligence artificielle à des évaluations gouvernementales avant tout déploiement public. Ces tests seront conduits par le Center for AI Standards and Innovation (CAISI), un organisme rattaché au département du Commerce américain. Le centre travaillait déjà avec OpenAI et Anthropic, mais l'élargissement à ces trois nouveaux acteurs majeurs marque une étape concrète dans la volonté de Washington de reprendre la main sur le calendrier des lancements. Chris Fall, directeur du CAISI, a insisté sur la nécessité d'une évaluation indépendante et rigoureuse des modèles les plus avancés, invoquant des enjeux de sécurité nationale, de cybersécurité, de désinformation et d'usages militaires potentiels. Ce virage représente un changement de paradigme notable pour une industrie qui défendait jusqu'ici le principe d'une innovation rapide et peu entravée. Que des géants comme Google ou Microsoft acceptent que l'État examine leurs modèles avant chaque lancement illustre un rééquilibrage du rapport de force entre la Silicon Valley et le pouvoir politique. Pour les utilisateurs et les entreprises, cela pourrait se traduire par des délais de mise sur le marché allongés, mais aussi par une forme de garantie supplémentaire sur les capacités et les risques des systèmes déployés. La portée de ces évaluations reste encore floue : le gouvernement n'a pas précisé quels critères s'appliqueront ni si ces tests pourraient bloquer ou retarder un lancement. Selon le New York Times, Donald Trump envisagerait par ailleurs un décret présidentiel pour aller plus loin, en réunissant dirigeants technologiques et responsables gouvernementaux pour superviser directement le développement des nouvelles IA. Le rapprochement avec xAI est particulièrement significatif : Elon Musk, pourtant critique habituel des dérives régulatoires et promoteur d'une IA sans censure idéologique, accepte ici de collaborer avec les autorités fédérales, ce qui témoigne du poids géopolitique qu'a pris le secteur. Les États-Unis cherchent avant tout à préserver leur avance sur la Chine dans la course aux modèles frontières, et les entreprises, de leur côté, ont tout intérêt à s'afficher comme des partenaires responsables de l'État plutôt que comme des acteurs incontrôlables. La question centrale qui émerge de cet accord est celle du contrôle réel : évaluer un modèle avant son lancement n'est pas nécessairement le réguler, et la frontière entre supervision de sécurité et ingérence politique reste, pour l'instant, soigneusement laissée dans le flou.

UECe cadre américain d'évaluation pré-déploiement pourrait servir de référence pour l'interprétation des obligations GPAI de l'AI Act européen, mais n'a pas d'effet direct sur les entreprises ou institutions françaises à ce stade.

RégulationReglementation
1 source
Anthropic force son IA Claude à… « rêver », (et c’est pour votre bien)
1211Le Big Data 

Anthropic force son IA Claude à… « rêver », (et c’est pour votre bien)

Anthropic a présenté le 6 mai 2026, lors de sa conférence développeurs Code with Claude à San Francisco, une nouvelle fonctionnalité baptisée « Dreaming » pour sa plateforme Claude Managed Agents. Disponible en avant-première de recherche, ce système place les agents IA dans un état d'analyse récurrente des sessions passées et des données mémorisées par plusieurs agents simultanément. Contrairement à la compaction classique, qui résume les conversations longues pour alléger la mémoire d'un seul agent, Dreaming opère de manière transversale : il inspecte les historiques de multiples agents, détecte des schémas récurrents, des erreurs fréquentes, des méthodes de travail adoptées spontanément, ou encore des préférences communes au sein d'une équipe. Les utilisateurs pourront choisir entre un mode automatique, où les ajustements s'appliquent sans intervention, et un mode manuel permettant de valider chaque modification avant son intégration. Lors de la même conférence, Anthropic a annoncé en version bêta publique trois autres fonctionnalités : « Results » (un évaluateur indépendant qui vérifie si une tâche a réellement atteint son objectif, et relance l'agent si ce n'est pas le cas), l'orchestration multi-agents (jusqu'à 20 agents spécialisés collaborant en parallèle sous la direction d'un agent principal), et les notifications webhook pour des alertes en temps réel vers des systèmes externes. L'enjeu central que Dreaming cherche à résoudre est structurel : les modèles de langage disposent d'une fenêtre de contexte limitée, et sur des projets longs, des informations critiques finissent inévitablement par disparaître. Pour les entreprises qui déploient des agents IA sur des semaines ou des mois, cette perte de continuité représente un frein opérationnel concret. En permettant à la mémoire de se restructurer automatiquement à partir de données croisées entre agents, Anthropic entend rendre les systèmes multi-agents plus cohérents, moins redondants dans leurs erreurs, et capables d'apprendre des comportements collectifs plutôt que de repartir de zéro à chaque session. La fonctionnalité Results, de son côté, répond à un problème tout aussi pragmatique : garantir que l'agent a bien produit ce qui était demandé, et non une approximation acceptable. Ces annonces s'inscrivent dans une course que se livrent OpenAI, Google DeepMind et Anthropic autour des agents autonomes capables de gérer des tâches complexes sur la durée. Claude Managed Agents est la réponse d'Anthropic aux frameworks agentiques concurrents, avec une philosophie axée sur la sécurité et la contrôlabilité, ce qui explique l'option de validation manuelle dans Dreaming plutôt qu'une automatisation totale. En restant en avant-première de recherche pour la fonctionnalité phare et en bêta publique pour les autres, Anthropic adopte une posture prudente avant un déploiement général, probablement dans les mois à venir, à mesure que les retours des développeurs consolideront le système.

UELes entreprises européennes déployant des agents Claude sur des projets longs bénéficieront d'une meilleure continuité mémorielle, mais la fonctionnalité reste en avant-première de recherche sans calendrier de déploiement général annoncé.

LLMsOpinion
1 source
Scandale Siri : Apple va rembourser des millions d’utilisateurs d’iPhone
1212Frandroid 

Scandale Siri : Apple va rembourser des millions d’utilisateurs d’iPhone

Apple a accepté de verser 250 millions de dollars pour clore un recours collectif intenté aux États-Unis par des utilisateurs d'iPhone mécontents. Le groupe de Cupertino était accusé d'avoir commercialisé fin 2024 des fonctionnalités d'intelligence artificielle pour son assistant Siri qui n'ont jamais été mises à disposition des consommateurs. Les plaignants estimaient avoir acheté ou conservé leurs appareils en se basant sur des promesses publicitaires mensongères concernant des capacités d'IA avancées. Cet accord représente une défaite symbolique importante pour Apple, dont la stratégie IA baptisée Apple Intelligence a accumulé les retards depuis son annonce en juin 2024. Les millions d'utilisateurs concernés pourront réclamer une indemnisation, dont le montant individuel dépendra du nombre de demandes déposées. Au-delà du volet financier, cette affaire soulève une question de fond pour toute l'industrie tech : jusqu'où les entreprises peuvent-elles promettre des fonctionnalités d'IA non encore opérationnelles pour stimuler leurs ventes ? Apple avait présenté une refonte ambitieuse de Siri lors de sa WWDC 2024, promettant une intégration poussée avec ChatGPT et des capacités de compréhension contextuelle inédites. Face aux difficultés techniques et à une concurrence acharnée de Google, Samsung et OpenAI sur le terrain de l'IA, la firme a repoussé à plusieurs reprises ces fonctionnalités. Ce règlement judiciaire pourrait inciter d'autres régulateurs et cabinets d'avocats à scruter de plus près les promesses marketing de l'ensemble du secteur technologique en matière d'intelligence artificielle.

UECette affaire pourrait inciter les régulateurs européens et la Commission à renforcer la surveillance des promesses marketing IA trompeuses, en s'appuyant sur l'AI Act et les directives existantes sur la publicité mensongère.

💬 250 millions pour des fonctionnalités qui n'ont jamais existé, c'est un précédent qui va piquer. Apple a construit toute sa comm' Apple Intelligence sur des promesses de keynote, en sachant très bien que la technique n'était pas au rendez-vous, et ça a marché... jusqu'à ce que des avocats s'en mêlent. Reste à voir si ça change vraiment les pratiques, ou si le reste de l'industrie attend juste que ça passe.

Gemini 3.2 Flash dévoilé par erreur par Google ?
1213Le Big Data 

Gemini 3.2 Flash dévoilé par erreur par Google ?

Google a involontairement dévoilé l'existence de Gemini 3.2 Flash le 5 mai 2026, plusieurs semaines avant la Google I/O prévue les 19 et 20 mai. Des captures d'écran partagées sur les réseaux sociaux montrent le modèle apparaître dans l'application officielle Gemini, sous la dénomination "Aide complète", aux côtés des modèles Gemini 3.1 Lite et Pro. Des données issues de Google AI Studio précisent les tarifs envisagés : 0,25 dollar par million de tokens en entrée et 2 dollars en sortie, avec une base de connaissances arrêtée à janvier 2026. Google n'a officialisé aucune annonce, mais les fuites ont rapidement circulé parmi les testeurs et les observateurs du secteur. Les premiers retours de ces testeurs sont frappants : Gemini 3.2 Flash rivalisait, selon eux, avec des modèles bien plus lourds sur des tâches créatives et techniques. Parmi les exemples cités, la génération d'animations ASCII représentant des paysages urbains détaillés en HTML, ou encore la production de fichiers SVG d'une précision inhabituelle pour un modèle de la gamme Flash. Certains utilisateurs le qualifient même de "quasiment équivalent" à Gemini 3.1 Pro sur plusieurs usages. Si ces performances se confirment à grande échelle, l'impact serait considérable : un modèle rapide et peu coûteux atteignant le niveau d'un modèle premium redistribue les équilibres économiques pour les développeurs et les entreprises qui arbitrent entre coût et puissance dans leurs applications IA. Cette fuite s'inscrit dans une stratégie d'accélération visible chez Google depuis plusieurs mois. La firme multiplie les versions de sa gamme Gemini à un rythme soutenu, cherchant à ne pas laisser OpenAI, Anthropic ou Meta prendre de l'avance sur les usages les plus demandés. L'un des axes prioritaires est l'amélioration des capacités "agentiques", c'est-à-dire la faculté d'un modèle à agir de façon autonome, à enchaîner des tâches complexes et à s'adapter au contexte utilisateur. La Google I/O constitue chaque année la vitrine de ces ambitions, et la version 3.2 Flash pourrait n'être qu'un avant-goût d'annonces plus larges sur l'écosystème Gemini. La question reste entière : la version finale confirmera-t-elle les performances observées dans ces tests préliminaires, ou Google réservera-t-il les capacités les plus spectaculaires à un modèle supérieur dévoilé en mai ?

UELes développeurs et entreprises européennes utilisant les APIs Gemini pourraient accéder à un modèle rapide et peu coûteux (0,25 $/M tokens entrée) aux performances proches du niveau premium, réduisant significativement les coûts d'intégration IA.

LLMsOpinion
1 source
Le MiMo-V2.5-Pro open-weight de Xiaomi rivalise avec Claude Opus en codage autonome de plusieurs heures
1214The Decoder 

Le MiMo-V2.5-Pro open-weight de Xiaomi rivalise avec Claude Opus en codage autonome de plusieurs heures

Xiaomi a publié MiMo-V2.5-Pro, un modèle open-weight orienté vers le codage autonome qui rivalise avec Claude Opus 4.6 d'Anthropic sur les principaux benchmarks de programmation. Selon le fabricant chinois, le modèle consomme entre 40 et 60 % de tokens en moins que son concurrent d'Anthropic pour des performances comparables, ce qui représente une économie substantielle à l'échelle. Le modèle est conçu pour fonctionner de façon autonome sur des tâches longues, pouvant s'étendre sur plusieurs heures sans intervention humaine. Cet écart d'efficacité change la donne pour les entreprises qui souhaitent intégrer des agents de codage dans leurs flux de travail. Moins de tokens signifient des coûts d'inférence réduits et des sessions plus longues sans interruption, deux contraintes qui freinent encore l'adoption des agents autonomes en production. Pour les équipes d'ingénierie, c'est un argument concret : un modèle open-weight aussi capable mais nettement moins gourmand rend l'automatisation du code accessible à davantage d'organisations. MiMo-V2.5-Pro s'inscrit dans une dynamique plus large qui oppose les fournisseurs chinois de modèles open-weight aux acteurs américains. Deepseek avait ouvert la voie en début d'année en démontrant qu'un entraînement efficace pouvait produire des résultats proches de ceux d'OpenAI à une fraction du coût. Xiaomi poursuit cette logique en déplaçant le terrain de compétition : il ne s'agit plus seulement de scores sur les benchmarks, mais de savoir quel modèle peut exécuter le plus longtemps et le plus économiquement une tâche complexe en conditions réelles.

UELes équipes d'ingénierie européennes peuvent adopter ce modèle open-weight pour réduire leurs coûts d'inférence de 40 à 60 % sur les agents de codage autonomes, sans dépendre d'un fournisseur américain.

LLMsOpinion
1 source
[AINews] Des agents pour tout le reste : Codex pour le travail intellectuel, Claude pour la création
1215Latent Space 

[AINews] Des agents pour tout le reste : Codex pour le travail intellectuel, Claude pour la création

OpenAI a déployé cette semaine une mise à jour majeure de Codex, repositionnant l'outil bien au-delà du code pour en faire un agent universel de travail sur ordinateur. Intitulée « Codex for Work », cette évolution introduit un navigateur réactif 42 % plus rapide, de nouvelles commandes comme /chronicle et /goal, une interface de planification inédite et un éditeur de fichiers intégré pour les formats Microsoft Office, avec des connexions directes aux suites Microsoft, Google et Salesforce. Sam Altman a personnellement amplifié le lancement sur X en invitant les utilisateurs à « essayer Codex pour les tâches non-coding ». Dans le même temps, Anthropic a lancé Claude Security, un outil de revue de code axé sur la détection de vulnérabilités, et a annoncé le support de logiciels créatifs majeurs : Blender, Autodesk, Adobe Creative Cloud, Ableton, Splice, Canva et Affinity. Sur le front des évaluations, le UK AI Security Institute a signalé que GPT-5.5 est devenu le deuxième modèle à compléter de bout en bout une simulation d'attaque informatique multi-étapes, avec un taux de réussite moyen de 71,4 % contre 68,6 % pour Claude Mythos Preview. Ces annonces marquent un tournant stratégique dans la compétition entre les deux leaders de l'IA générative. En transformant Codex en agent généraliste, OpenAI cherche à capturer un marché bien plus large que le développement logiciel : les travailleurs du savoir, analystes, juristes, marketeurs et consultants, qui passent leurs journées entre documents, présentations et feuilles de calcul. L'interface dynamique adoptée par Codex, qui laisse l'agent choisir lui-même l'expérience utilisateur selon la nature de la tâche plutôt qu'un simple bouton de bascule, illustre une ambition de « SuperApp » pleinement assumée. Du côté d'Anthropic, l'intégration aux outils créatifs professionnels ouvre Claude à un public radicalement différent : graphistes, musiciens, vidéastes. Quant aux résultats cyber de GPT-5.5, ils remettent en cause l'avantage qu'Anthropic était supposé détenir dans l'automatisation offensive, les performances du modèle continuant de progresser au-delà de 100 millions de tokens d'inférence sans signe de saturation visible. Ces évolutions s'inscrivent dans une dynamique que les observateurs du secteur nomment « la sortie de confinement des agents de coding » : les outils initialement conçus pour les développeurs commencent à coloniser l'ensemble du travail sur ordinateur. OpenAI productise désormais activement l'interface « agent computer-use », tandis qu'Anthropic mise sur la sécurité et la créativité pour différencier Claude. GPT-5.5 Pro envoie également un signal économique notable : selon Artificial Analysis, il améliore légèrement les scores sur le benchmark CritPt par rapport à GPT-5.4 Pro tout en réduisant les coûts d'environ 60 %, suggérant qu'OpenAI parie autant sur l'efficacité que sur la puissance brute. Les prochaines semaines diront si ces repositionnements trouvent un écho réel auprès des utilisateurs non-techniques que les deux entreprises cherchent désormais à conquérir.

UELes nouveaux outils d'OpenAI et Anthropic (Codex for Work, Claude Security, intégrations créatives) sont accessibles aux professionnels européens, mais les résultats du UK AI Security Institute sur les capacités offensives de GPT-5.5 interpellent les régulateurs de l'UE sur les implications de l'AI Act pour les modèles à double usage.

💬 OpenAI fait sortir Codex du code pour aller chercher les consultants et les juristes, et l'interface qui s'adapte toute seule à la tâche sans bascule manuelle, c'est là que le truc est sérieux. Claude dans Blender et Ableton, je l'attendais pas, mais ça a du sens comme différenciation. Et GPT-5.5 qui boucle des simulations d'attaque cyber à 71%, ça, ça va faire causer bien au-delà du secteur IA.

OutilsOutil
1 source
Standard Intelligence surfe sur l'engouement Neolab avec un modèle de contrôle d'ordinateur
1216The Information AI 

Standard Intelligence surfe sur l'engouement Neolab avec un modèle de contrôle d'ordinateur

Il y a deux mois, des passants du quartier South Park à San Francisco ont aperçu quelque chose d'inhabituel : un Toyota Rav4 circulant avec un ordinateur portable posé sur le tableau de bord. La machine faisait tourner un nouveau modèle d'intelligence artificielle développé par Standard Intelligence, une startup de deux ans basée dans la ville. Ce modèle, dit de "computer use", est capable d'opérer un ordinateur pour accomplir des tâches variées : tester un site bancaire, supprimer des spams, ou même, comme lors de cette démonstration, piloter un véhicule, une capacité que la plupart des agents comparables ne maîtrisent pas. La jeune pousse vient d'annoncer avoir levé 75 millions de dollars à une valorisation de 500 millions de dollars, un tour mené par Sequoia Capital et Spark Capital, révélé en exclusivité par The Information. Ce financement représente plus de seize fois la valorisation obtenue lors du tour de table initial fin 2024, signal fort de l'engouement des investisseurs pour cette catégorie d'agents capables d'interagir directement avec des interfaces logicielles. Contrairement aux assistants classiques qui se limitent à produire du texte, les modèles "computer use" agissent sur des environnements réels : ils cliquent, naviguent, remplissent des formulaires, voire contrôlent des systèmes physiques. Pour les entreprises, cela ouvre la voie à une automatisation bien plus profonde des processus métier, sans nécessiter d'intégrations techniques complexes. Standard Intelligence se distingue de ses concurrents, dont Anthropic a lancé une fonctionnalité similaire en 2024, par sa façon de repenser les données d'entraînement. Là où la plupart des modèles s'appuient massivement sur des données textuelles, la startup explore d'autres types de signaux pour améliorer la capacité d'un agent à comprendre et manipuler des interfaces visuelles. Dans un écosystème où OpenAI, Google et Anthropic dominent la conversation, ce positionnement sur les données et les cas d'usage incarnés comme la conduite automobile pourrait constituer un avantage différenciateur déterminant.

BusinessActu
1 source
Musk et Altman s'affrontent en justice
1217The Verge 

Musk et Altman s'affrontent en justice

Le procès opposant Elon Musk à OpenAI et son PDG Sam Altman a officiellement débuté, marquant l'aboutissement d'une bataille juridique longtemps annoncée. L'affaire porte sur les origines de l'organisation, la répartition du mérite et des bénéfices liés aux premières années du développement de l'intelligence artificielle. Les prochaines semaines devraient voir défiler à la barre des figures majeures de la Silicon Valley, dont les communications privées et décisions internes seront rendues publiques devant le tribunal. L'enjeu dépasse le simple différend entre deux milliardaires : ce procès pourrait exposer des secrets stratégiques et financiers au cœur de l'une des entreprises les plus influentes du secteur IA. Certains observateurs estiment que cette publicité forcée est précisément l'objectif de Musk, qui cherche à fragiliser OpenAI à un moment critique, celui de sa conversion en société à but lucratif valorisée à plusieurs centaines de milliards de dollars. Elon Musk a cofondé OpenAI en 2015 aux côtés de Sam Altman et d'autres, en apportant des dizaines de millions de dollars de financement initial, avant de quitter le conseil d'administration en 2018. Il affirme que l'organisation a trahi sa mission originelle à but non lucratif en s'orientant vers la commercialisation massive, notamment via son partenariat avec Microsoft. Depuis, Musk a lancé sa propre société d'IA, xAI, créant un conflit d'intérêts évident que la défense d'OpenAI ne manquera pas d'exploiter.

UEL'issue du procès pourrait indirectement affecter la trajectoire de conversion d'OpenAI en société à but lucratif, dont les services sont largement déployés par les entreprises et institutions françaises.

RégulationOpinion
1 source
Comment Nadella et Altman ont évité un conflit juridique autour d'AWS
1218The Information AI 

Comment Nadella et Altman ont évité un conflit juridique autour d'AWS

Il y a deux mois, OpenAI a conclu un accord surprise avec Amazon Web Services pour distribuer ses technologies d'intelligence artificielle aux entreprises via le cloud d'AWS, un concurrent direct de Microsoft. Cette annonce a immédiatement créé des tensions avec Microsoft, partenaire historique d'OpenAI et détenteur d'une licence exclusive pour revendre les technologies OpenAI à ses clients cloud. Microsoft estimait que cet accord avec Amazon violait les termes du contrat liant les deux entreprises, tandis qu'OpenAI considérait que l'arrangement avec AWS était parfaitement compatible avec leur partenariat. Face à cette divergence, Satya Nadella et Sam Altman ont entamé une série de réunions au cours des dernières semaines pour désamorcer la crise avant qu'elle ne dégénère en conflit juridique. L'enjeu est considérable pour les deux parties. Microsoft a investi plusieurs milliards de dollars dans OpenAI et fondé une large partie de sa stratégie cloud sur l'exclusivité de l'accès à ses modèles. Voir OpenAI s'allier avec AWS, numéro un mondial du cloud, représente une menace directe sur les revenus Azure et remet en cause l'avantage concurrentiel que Microsoft pensait avoir sécurisé. Cette dispute illustre les tensions croissantes au sein d'un partenariat devenu trop étroit pour les ambitions respectives des deux entreprises. Alors qu'OpenAI accélère ses ventes et multiplie ses débouchés commerciaux, ses intérêts divergent de ceux de Microsoft. L'issue de ces négociations pourrait redéfinir les contours de leur relation et influencer la façon dont les grandes plateformes cloud accèdent aux modèles d'IA frontier.

UELes entreprises européennes utilisant Azure ou AWS pour accéder aux modèles OpenAI pourraient être indirectement affectées si ces négociations reconfigurent les accords de distribution cloud.

BusinessOpinion
1 source
MiMo-V2.5 et V2.5-Pro de Xiaomi parmi les modèles open source les plus efficaces et abordables pour les tâches 'claw' à base d'agents
1219VentureBeat AI 

MiMo-V2.5 et V2.5-Pro de Xiaomi parmi les modèles open source les plus efficaces et abordables pour les tâches 'claw' à base d'agents

Xiaomi a mis en ligne le 27 avril 2026 deux nouveaux modèles de langage open source, MiMo-V2.5 et MiMo-V2.5-Pro, publiés sous licence MIT et téléchargeables directement depuis Hugging Face. Le premier est un modèle multimodal généraliste, tandis que le second est conçu spécifiquement pour les tâches agentiques complexes. Selon les benchmarks internes de Xiaomi, MiMo-V2.5-Pro atteint un taux de réussite de 63,8 % sur le ClawEval, l'évaluation standard pour les agents autonomes de type "claw" comme OpenClaw, NanoClaw ou Hermes Agent, tout en ne consommant qu'environ 70 000 tokens par trajectoire. Ce chiffre représente 40 à 60 % de tokens en moins par rapport à Claude Opus 4.6 d'Anthropic, Gemini 3.1 Pro de Google et GPT-5.4 d'OpenAI pour des résultats comparables. L'architecture repose sur 310 milliards de paramètres et intègre une fenêtre de contexte native d'un million de tokens, avec un score de 1 581 sur le benchmark GDPVal-AA (Elo), devançant des concurrents comme Kimi K2.6 et GLM 5.1. L'efficacité en tokens n'est pas qu'une métrique abstraite : dans un secteur où des services comme GitHub Copilot de Microsoft basculent vers une facturation à l'usage, chaque token économisé se traduit directement en dollars pour les entreprises et les développeurs indépendants qui déploient des agents en production. MiMo-V2.5-Pro peut piloter des systèmes agentiques capables de créer du contenu marketing, gérer des emails, organiser des agendas ou gérer des comptes en autonomie, le tout via des applications de messagerie tierces. Que le modèle soit exécuté localement ou sur un cloud privé virtuel, la licence MIT permet une intégration commerciale sans restriction, ce qui le place directement en concurrence avec les modèles propriétaires de Google et OpenAI sur le segment entreprise. Pour étayer ses affirmations, Xiaomi a publié plusieurs démonstrations en conditions réelles : MiMo-V2.5-Pro a implémenté un compilateur complet en Rust, incluant lexer, parser et backend RISC-V, en 4,3 heures via 672 appels d'outils, obtenant un score parfait de 233 sur 233 sur des suites de tests cachés, une tâche qui prend habituellement plusieurs semaines à un étudiant en informatique. Il a également produit un éditeur vidéo de bureau de 8 192 lignes en 11,5 heures et 1 868 appels d'outils, puis optimisé un régulateur analogique en technologie TSMC 180 nm, améliorant la régulation de ligne d'un facteur 22 par rapport à sa tentative initiale. Ces résultats illustrent ce que Xiaomi appelle la "harness awareness" du modèle, sa capacité à gérer activement sa propre mémoire pour maintenir la cohérence sur des milliers d'appels séquentiels. Cette publication s'inscrit dans la stratégie agressive de Xiaomi pour s'imposer dans l'IA, un secteur où la firme, surtout connue pour ses smartphones et véhicules électriques, entend désormais rivaliser directement avec les grands laboratoires américains.

UELa licence MIT et la disponibilité sur HuggingFace permettent aux entreprises et développeurs européens d'intégrer ces modèles en production sans restriction, réduisant potentiellement les coûts liés à la facturation à l'usage des services d'agents IA.

LLMsActu
1 source
Le peuple n'aspire pas à l'automatisation
1220The Verge AI 

Le peuple n'aspire pas à l'automatisation

Un sondage NBC News publié en avril 2026 place l'intelligence artificielle parmi les technologies les moins appréciées des Américains, avec un taux de popularité inférieur à celui de l'agence ICE et à peine au-dessus du niveau d'approbation du Parti démocrate ou de la guerre en Iran. Ce résultat est d'autant plus frappant que près des deux tiers des sondés déclarent avoir utilisé ChatGPT ou Copilot au cours du dernier mois. Quinnipiac confirme la tendance : plus de la moitié des Américains estiment que l'IA fera plus de mal que de bien, plus de 80 % s'en disent inquiets, et seulement 35 % s'y montrent enthousiastes. Chez la génération Z, le rejet est encore plus marqué : selon Gallup, seuls 18 % se disent optimistes face à l'IA, contre 27 % l'année précédente, tandis que 31 % expriment de la colère, contre 22 % un an plus tôt. Le phénomène dépasse les sondages : des élus locaux favorables aux data centers ont été battus aux urnes, d'autres ont vu leur domicile visé par des tirs. Le PDG d'OpenAI Sam Altman a lui-même été la cible d'un cocktail Molotov lancé contre sa maison. Ce fossé entre l'enthousiasme de l'industrie technologique et le rejet croissant du grand public constitue une rupture politique et sociale inédite. Satya Nadella, PDG de Microsoft, a reconnu publiquement que le secteur doit encore « mériter la permission sociale de consommer de l'énergie en prouvant qu'il fait le bien dans le monde ». Cette permission n'a clairement pas été obtenue. La résistance s'exprime désormais dans les urnes, dans les rues et dans une montée de la violence que des responsables comme Nilay Patel, rédacteur en chef de The Verge et animateur du podcast Decoder, condamnent sans ambiguïté, tout en pointant la responsabilité des élites dans le sentiment d'impuissance qui l'alimente. Ce contexte prend racine dans ce que Patel appelle le « software brain » : une manière de penser le monde héritée du numérique, qui réduit tout à des algorithmes, des bases de données et des boucles logiques. Marc Andreessen en avait posé les bases dès 2011 dans son célèbre article du Wall Street Journal, « Why software is eating the world ». L'IA a depuis turbocompressé cette logique, creusant l'écart entre ceux qui conçoivent les systèmes et ceux qui les subissent. Le discours ambiant des dirigeants du secteur n'arrange rien : Dario Amodei, PDG d'Anthropic, affirme publiquement que l'IA supprimera l'ensemble des emplois d'entrée de gamme, alimentant une forme de nihilisme que ni les politiques ni les entreprises technologiques ne semblent encore prêts à affronter sérieusement.

UELes tendances de rejet croissant de l'IA documentées aux États-Unis trouvent des échos similaires en Europe, où l'AI Act reflète des préoccupations citoyennes comparables sur l'emploi et la concentration du pouvoir technologique.

SociétéOpinion
1 source
Meta transforme ses salariés en « rats de laboratoire » pour son futur agent IA
1221Le Big Data 

Meta transforme ses salariés en « rats de laboratoire » pour son futur agent IA

Meta surveille les habitudes informatiques de ses employés pour entraîner son futur agent IA. Selon des notes internes révélées par Reuters, l'entreprise a déployé un logiciel de suivi intégré à certains outils professionnels internes, capable d'enregistrer les mouvements de souris, les clics, les frappes clavier et de capturer régulièrement des captures d'écran. Ces données sont collectées sur des applications internes et des sites web professionnels, avec pour objectif de documenter précisément comment les humains interagissent avec leur machine au quotidien. Un porte-parole de Meta confirme que ces informations servent à améliorer la capacité des agents IA à réaliser des tâches concrètes : naviguer dans des menus, cliquer sur des boutons, reproduire des séquences d'actions basiques mais essentielles. L'entreprise assure également que ces données ne seront pas utilisées pour évaluer la performance individuelle des salariés. L'enjeu est considérable pour le développement des agents IA dits "computer use", capables d'opérer directement sur un ordinateur comme le ferait un humain. Les textes, images et vidéos disponibles sur internet sont déjà massivement exploités pour entraîner les grands modèles de langage, mais les données d'interaction réelle avec une interface restent rares et difficiles à obtenir à grande échelle. Des entreprises concurrentes ont recours à des environnements simulés pour générer ce type de données comportementales, une approche coûteuse et imparfaite. En mobilisant directement ses propres employés, Meta accède à des flux de comportements authentiques, dans des contextes de travail réels, ce qui représente un avantage compétitif significatif pour entraîner des agents performants sur des tâches professionnelles. Cette initiative s'inscrit dans un contexte de pression croissante chez Meta autour de l'IA. L'entreprise, qui a massivement investi dans le développement de ses modèles Llama et de ses agents conversationnels, cherche à combler son retard sur des acteurs comme OpenAI ou Google dans le domaine des agents autonomes. En parallèle, Reuters rapporte que Meta envisage de fixer des objectifs d'usage de l'IA à certains de ses personnels, et réfléchirait à une réduction potentielle de ses effectifs mondiaux pouvant atteindre 10 %. La collecte de données sur les employés soulève néanmoins des questions éthiques sur le consentement et la surveillance au travail, même si Meta la présente comme une contribution collective au progrès technologique interne. La frontière entre outil d'entraînement et surveillance professionnelle reste floue, et cette démarche pourrait alimenter les débats réglementaires sur les droits des travailleurs à l'ère de l'IA.

UELe RGPD encadre strictement la surveillance des salariés en Europe, rendant une pratique similaire juridiquement risquée pour toute entreprise opérant dans l'UE, et pourrait accélérer les débats législatifs sur les droits des travailleurs face à l'IA générative.

ÉthiqueActu
1 source
1222InfoQ AI 

LinkedIn présente son agent de mémoire cognitive pour les agents IA

LinkedIn a dévoilé le Cognitive Memory Agent (CMA), une couche d'infrastructure d'IA générative destinée à rendre les systèmes d'intelligence artificielle persistants et conscients du contexte dans lequel ils opèrent. Ce framework fournit une mémoire durable organisée en trois couches distinctes : épisodique, qui retient les interactions passées ; sémantique, qui stocke les connaissances générales ; et procédurale, qui encode les comportements appris. Le CMA prend également en charge la coordination entre plusieurs agents, la récupération d'informations et la gestion complète du cycle de vie des mémoires. Cette initiative s'attaque à une limitation fondamentale des grands modèles de langage : leur absence d'état entre les sessions. Sans mémoire externe, chaque interaction repart de zéro, rendant impossible toute personnalisation durable. En déployant le CMA dans ses propres applications, LinkedIn ouvre la voie à des assistants IA capables de se souvenir des préférences professionnelles d'un utilisateur, de ses recherches d'emploi passées ou de ses habitudes de networking, transformant ainsi l'expérience sur une plateforme de plus d'un milliard d'utilisateurs. La mémoire des agents est devenue l'un des chantiers prioritaires de l'industrie, alors que les entreprises cherchent à faire passer leurs systèmes d'IA du mode réactif au mode autonome et continu. OpenAI, Google DeepMind et Anthropic développent des architectures comparables, mais LinkedIn dispose d'un avantage singulier : une base de données professionnelles sans équivalent. Le CMA positionne l'entreprise pour intégrer ces capacités directement dans ses outils de recrutement, de formation et de recommandation, avec des implications profondes sur la façon dont les professionnels interagiront avec l'IA au quotidien.

UELes millions de professionnels français inscrits sur LinkedIn pourraient voir leurs interactions avec les outils de recrutement et de formation de la plateforme profondément transformées par cette couche de mémoire persistante.

OutilsOpinion
1 source
Cursor AI : une levée de 2 milliards de dollars pour transformer le codage en entreprise
1223Le Big Data 

Cursor AI : une levée de 2 milliards de dollars pour transformer le codage en entreprise

Cursor AI, la start-up américaine spécialisée dans les agents de programmation assistée par intelligence artificielle, est en discussions avancées pour boucler un tour de table de 2 milliards de dollars qui porterait sa valorisation au-delà des 50 milliards. L'opération serait co-dirigée par Andreessen Horowitz, avec la participation de Nvidia, Thrive Capital, et d'autres investisseurs déjà présents au capital comme Accel, Coatue, DST Global et Google. Ce nouveau round intervient quelques mois seulement après une levée de 2,3 milliards de dollars annoncée en novembre 2025, qui valorisait alors l'entreprise à 29,3 milliards, elle-même précédée d'un tour de 900 millions de dollars en juin de la même année. En moins d'un an, Cursor AI aurait donc capté plus de 5 milliards de dollars de financement cumulé, un rythme rarissime même dans le secteur de l'IA. La start-up revendique par ailleurs plus d'un milliard de dollars de revenus annualisés et se présente comme le système qui génère aujourd'hui le plus de code au monde parmi les agents IA. Ce niveau de valorisation traduit une conviction forte des investisseurs : les outils de développement augmentés par l'IA sont en train de devenir une infrastructure critique pour les entreprises. Les agents de Cursor ne se contentent plus de suggérer des lignes de code, ils génèrent des fonctionnalités complètes, corrigent des erreurs, interagissent avec des bases de code complexes, et depuis février 2026, testent eux-mêmes leurs modifications tout en documentant leurs actions via vidéos, journaux détaillés et captures d'écran. Ces capacités de traçabilité répondent directement aux exigences des grandes organisations en matière de gouvernance et de conformité. Pour les équipes d'ingénierie, l'enjeu est concret : accélérer les cycles de livraison, réduire les coûts de développement, et réorienter les développeurs humains vers des tâches à plus forte valeur ajoutée. Cursor AI n'évolue plus dans un espace vide. Depuis que la start-up a défriché ce marché, Google, OpenAI et Anthropic ont lancé leurs propres solutions d'assistance au code, validant par là même la pertinence du créneau. Cette concurrence frontale avec des acteurs disposant de ressources quasi illimitées explique en partie la cadence effrénée des levées de fonds : il s'agit de consolider une avance technologique et commerciale avant que le marché ne se fragmente. La présence simultanée de fonds de capital-risque de premier rang et de géants industriels comme Nvidia ou Google au capital de Cursor signale que l'écosystème du développement logiciel entre dans une phase de restructuration profonde, où les plateformes d'IA ne sont plus de simples outils mais des partenaires de production à part entière.

UELa consolidation rapide du marché des agents de développement IA par des acteurs américains très capitalisés réduit l'espace pour l'émergence d'alternatives européennes compétitives dans ce segment.

BusinessOpinion
1 source
1224Next INpact 

☕️ Mozilla drague les entreprises avec un client IA open source, Thunderbolt

MZLA, la filiale de Mozilla qui développe le client de messagerie Thunderbird depuis 2020, a annoncé le lancement de Thunderbolt, un client d'intelligence artificielle open source destiné aux entreprises. Disponible dès maintenant sur GitHub, Thunderbolt est conçu pour s'intégrer avec le framework open source Haystack et proposera des applications natives sur macOS, Windows, Linux, iOS et Android. Il se positionne comme un « client d'IA souverain » permettant le chat, la recherche, l'automatisation et les flux de travail multi-appareils via une interface auto-hébergée et extensible. L'outil est agnostique en matière de modèle de langage : il supporte Claude d'Anthropic, GPT d'OpenAI, Mistral et OpenRouter, via les protocoles MCP et ACP. MZLA précise toutefois qu'aucun point d'accès public pour l'inférence n'est encore fourni, et recommande l'usage d'Ollama ou llama.cpp pour une inférence locale gratuite. Thunderbolt répond à une demande croissante des équipes techniques en entreprise : disposer d'une interface unifiée pour accéder à leurs infrastructures IA internes, qu'elles soient hébergées localement ou chez un fournisseur cloud, sans dépendre d'un outil propriétaire. L'architecture pensée « local first » et la compatibilité avec les principaux fournisseurs de modèles en font une alternative crédible aux interfaces propriétaires comme Claude.ai ou ChatGPT Enterprise, avec l'avantage du contrôle total des données et de la personnalisation. Pour les DSI et les équipes soucieuses de souveraineté numérique, c'est un argument de poids. Mozilla s'inscrit ainsi dans une stratégie plus large de repositionnement autour de l'IA, après avoir déjà misé sur la transparence et l'ouverture avec des initiatives comme Mozilla.ai. En confiant ce projet à MZLA plutôt qu'à la fondation, l'organisation cherche à adresser directement le marché professionnel tout en restant fidèle à ses valeurs open source. Thunderbolt arrive dans un écosystème déjà animé par des outils comme Open WebUI ou AnythingLLM, mais bénéficie de la légitimité et de la communauté de développeurs que Mozilla a construites autour de Thunderbird depuis plus de vingt ans.

UEThunderbolt, avec son architecture 'local first' et son support de Mistral, répond directement aux enjeux de souveraineté numérique des DSI européens soumis au RGPD.

1225The Decoder 

Claude Design d'Anthropic transforme les conversations en prototypes, présentations et supports marketing

Anthropic vient de lancer Claude Design, un nouvel outil intégré directement à son assistant Claude, permettant de créer des prototypes interactifs, des présentations, des visuels marketing et des documents synthétiques en dialoguant simplement avec le modèle. Contrairement aux outils de design traditionnels, la création se fait entièrement par conversation : l'utilisateur décrit ce qu'il souhaite, affine itérativement, et Claude génère ou ajuste le résultat en temps réel. L'outil peut ingérer des bases de code existantes, des fichiers de design et des sites web en production pour respecter automatiquement l'identité visuelle d'une marque. Pour les équipes produit, marketing et design, cette annonce représente un raccourci significatif dans le cycle de création. Des tâches qui nécessitaient plusieurs outils spécialisés, Figma pour les maquettes, PowerPoint pour les slides, des développeurs pour les prototypes, pourraient désormais être réalisées dans une seule interface conversationnelle, sans compétences techniques avancées. C'est la promesse d'une accélération concrète du travail créatif, particulièrement pour les petites équipes ou les indépendants. Cette initiative s'inscrit dans une course intense entre les grands laboratoires d'IA pour transformer leurs modèles en environnements de travail complets. OpenAI pousse dans la même direction avec des fonctionnalités similaires dans ChatGPT, tandis que Google intègre Gemini dans sa suite Workspace. Anthropic, qui positionne Claude comme un assistant orienté productivité professionnelle, cherche à démontrer que la qualité de raisonnement de son modèle se traduit aussi en capacités créatives concrètes et utilisables au quotidien.

UELes équipes françaises et européennes peuvent utiliser cet outil directement via Claude, sans impact réglementaire ou institutionnel spécifique à l'UE.

OutilsOutil
1 source
1226The Verge AI 

Ronan Farrow : Sam Altman et son rapport «sans contraintes» à la vérité

Le journaliste d'investigation Ronan Farrow, connu notamment pour avoir révélé l'affaire Harvey Weinstein, a publié dans The New Yorker une enquête fleuve de plus de 17 000 mots sur Sam Altman, PDG d'OpenAI, co-écrite avec Andrew Marantz après dix-huit mois de reporting. Le texte constitue le récit le plus complet à ce jour de l'épisode de novembre 2023, lorsque le conseil d'administration d'OpenAI avait brutalement licencié Altman, officiellement pour manque de franchise, avant de le réintégrer quelques jours plus tard sous la pression des employés et des investisseurs. L'enquête plonge aussi dans la vie personnelle d'Altman, ses investissements, ses démarches pour attirer des capitaux en provenance du Moyen-Orient, et ses propres réflexions sur ses traits de caractère. Une source citée dans l'article résume la chose sans détour : Altman serait "unconstrained by the truth", c'est-à-dire affranchi de toute contrainte vis-à-vis de la vérité. Ce portrait compte parce qu'Altman n'est pas seulement le patron d'une startup : en quelques années, il a transformé un laboratoire de recherche à but non lucratif en une entreprise privée valorisée à près de mille milliards de dollars, faisant de lui le visage le plus visible de l'industrie de l'intelligence artificielle mondiale. La question de sa fiabilité dépasse donc largement le cadre d'une querelle interne. Farrow note que, au fil de ses dix-huit mois de travail, les interlocuteurs sont devenus nettement plus enclins à s'exprimer publiquement et nominalement sur la tendance d'Altman à "étirer la vérité", un signe que le climat autour d'OpenAI a changé, et que les inquiétudes se font de plus en plus entendre, y compris dans des cercles qui se taisaient jusqu'ici. OpenAI a été fondé en 2015 comme organisation à but non lucratif censée développer l'IA de façon sûre et ouverte, avant de pivoter vers un modèle hybride à profit plafonné, puis de lever des milliards auprès de Microsoft et d'autres grands investisseurs. La montée en puissance de ChatGPT depuis fin 2022 a propulsé Altman sur la scène mondiale, lui donnant une influence considérable sur les décideurs politiques, les régulateurs et les marchés financiers. C'est précisément cette centralité qui rend l'enquête de Farrow structurellement importante : quand un seul individu concentre autant de pouvoir sur une technologie aussi pervasive, la question de son rapport à la vérité cesse d'être anecdotique. Farrow lui-même affirme avoir perçu une évolution chez Altman au cours de leurs nombreux entretiens, sans pour autant que cela modifie son analyse de fond sur les dynamiques qui ont conduit à la crise de gouvernance de 2023.

UELa fiabilité de Sam Altman et la gouvernance d'OpenAI influencent directement les discussions réglementaires européennes, notamment la mise en œuvre de l'AI Act et les relations entre décideurs politiques de l'UE et la principale organisation IA mondiale.

BusinessOpinion
1 source
Google AI lance Gemini 3.1 Flash TTS : un nouveau standard pour la voix IA expressive et contrôlable
1227MarkTechPost 

Google AI lance Gemini 3.1 Flash TTS : un nouveau standard pour la voix IA expressive et contrôlable

Google a lancé Gemini 3.1 Flash TTS, un nouveau modèle de synthèse vocale disponible en préversion via l'API Gemini, Google AI Studio, Vertex AI pour les entreprises et Google Vids pour les utilisateurs Workspace. Le modèle affiche un score Elo de 1 211 sur le classement Artificial Analysis TTS Leaderboard, ce qui en fait le modèle vocal le plus naturel et expressif jamais proposé par Google. Sa particularité technique réside dans le recours à des balises audio et au prompting en langage naturel pour piloter le style, le ton, le rythme, l'accentuation et les nuances dialectales dans plus de 70 langues. Le modèle gère également nativement le dialogue multi-locuteurs, sans nécessiter d'appels API séparés pour chaque voix, ce qui garantit une fluidité conversationnelle bien supérieure aux pipelines TTS traditionnels. Enfin, chaque audio généré intègre automatiquement un filigrane invisible SynthID, conçu pour être imperceptible à l'écoute tout en permettant une détection fiable du contenu généré par IA. Cette version marque un tournant dans la façon dont les développeurs construisent des expériences vocales. En permettant de diriger le modèle comme un réalisateur audio plutôt que de subir une conversion figée, Google ouvre la voie à des cas d'usage bien plus sophistiqués : podcasts générés automatiquement avec plusieurs intervenants distincts, scripts dramatiques, interfaces d'assistants collaboratifs ou encore doublages multilingues. Pour les entreprises clientes de Vertex AI, la combinaison de la qualité benchmark, du contrôle fin et du watermarking intégré répond directement aux exigences de conformité et de traçabilité qui freinent souvent l'adoption de l'audio généré par IA dans des contextes professionnels sensibles. Ce lancement s'inscrit dans une course intense entre les grandes plateformes technologiques pour dominer la synthèse vocale expressive. OpenAI avec ses modèles TTS, ElevenLabs et d'autres acteurs spécialisés ont considérablement élevé le niveau d'attente des développeurs ces deux dernières années. Google répond en misant sur son infrastructure existante, l'intégration native dans l'écosystème Workspace et la profondeur multilingue, des atouts structurels que les startups peinent à répliquer à cette échelle. L'intégration de SynthID dans un modèle grand public est également un signal politique fort : alors que la régulation de l'IA générative s'intensifie en Europe et aux États-Unis, Google anticipe les futures obligations de transparence sur les contenus synthétiques. La suite logique sera d'observer si ce modèle s'impose comme référence dans les benchmarks indépendants et comment les concurrents répondront dans les prochains mois.

UEL'intégration native du filigrane SynthID anticipe les obligations de transparence sur les contenus synthétiques imposées par l'AI Act européen, facilitant la conformité pour les entreprises utilisant Vertex AI.

Anthropic lance une infrastructure gérée pour agents IA autonomes
1228The Decoder 

Anthropic lance une infrastructure gérée pour agents IA autonomes

Anthropic a lancé "Claude Managed Agents", une infrastructure hébergée permettant aux développeurs de construire et déployer des agents IA autonomes directement sur les serveurs de l'entreprise. Ce service géré prend en charge l'exécution des agents, la gestion des sessions, la mémoire persistante et l'orchestration des tâches longues, sans que les équipes techniques n'aient à gérer elles-mêmes l'infrastructure sous-jacente. Notion et Rakuten font partie des premiers partenaires à avoir adopté la plateforme, intégrant ces agents dans leurs produits pour automatiser des flux de travail complexes. L'enjeu est significatif : jusqu'ici, déployer des agents IA fiables en production exigeait une ingénierie considérable pour gérer les états, les interruptions, les erreurs et la durée de vie des sessions. En proposant cette couche d'infrastructure clé en main, Anthropic abaisse la barrière d'entrée pour les entreprises qui veulent aller au-delà des simples chatbots vers des systèmes capables d'agir de façon autonome sur des tâches multi-étapes, comme la recherche, la rédaction ou l'automatisation de processus métiers. Ce lancement s'inscrit dans une course accélérée entre les grands acteurs de l'IA pour capter le marché des agents. OpenAI a déployé ses propres capacités agentiques via l'API Assistants et les outils de l'opérateur, tandis que Google mise sur Vertex AI Agent Builder. Anthropic, fort d'un financement de plusieurs milliards de dollars notamment d'Amazon et Google, positionne cette offre managée comme un argument commercial direct face aux entreprises qui hésitent à construire leur propre stack agentique.

UELes entreprises européennes peuvent bénéficier de cette infrastructure gérée pour déployer des agents IA sans développer leur propre stack technique, mais aucun acteur ou régulateur européen n'est directement impliqué.

💬 Ce qui bloquait tout le monde jusqu'ici, c'était pas l'agent, c'était la plomberie derrière : états, sessions, interruptions, tâches qui durent des heures. Anthropic prend ça en charge, et j'y vois surtout une arme commerciale directe pour aller chercher les boîtes qui voulaient dépasser le chatbot sans construire leur propre stack. Ça va accélérer fort, et OpenAI va répondre vite.

OutilsOpinion
1 source
Gemini intègre des carnets de notes pour organiser vos projets
1229The Verge AI 

Gemini intègre des carnets de notes pour organiser vos projets

Google a annoncé mercredi le lancement d'une nouvelle fonctionnalité appelée "notebooks" dans son assistant Gemini. Cette fonction permet aux utilisateurs de regrouper en un seul endroit des fichiers, des conversations passées et des instructions personnalisées autour d'un sujet donné. Gemini peut ensuite exploiter tout ce contenu comme contexte lors des échanges. Google décrit les notebooks comme des "bases de connaissances personnelles partagées entre les produits Google", avec une intégration qui commence dans Gemini avant de s'étendre à d'autres services de la suite. Cette fonctionnalité représente un changement important dans la manière dont les utilisateurs interagissent avec les assistants IA : plutôt que de repartir de zéro à chaque conversation, ils peuvent maintenant maintenir un fil de continuité autour de projets ou de sujets précis. Pour les professionnels qui utilisent Gemini au quotidien, cela signifie moins de répétition et une meilleure cohérence dans les réponses obtenues. L'intégration prévue avec l'ensemble de l'écosystème Google pourrait renforcer significativement l'utilité de l'outil dans des contextes de travail réels. La fonctionnalité s'inscrit directement dans la compétition avec OpenAI, dont la fonctionnalité "Projects" de ChatGPT, lancée en 2024, propose un concept très similaire. Google se retrouve donc dans une position de suiveur sur ce terrain précis, même si son avantage réside dans l'intégration native avec ses propres produits (Docs, Drive, Gmail, etc.). La bataille pour fidéliser les utilisateurs via des espaces de travail persistants est désormais un axe stratégique central pour les grands acteurs de l'IA générative.

UELa fonctionnalité notebooks de Gemini est disponible pour les utilisateurs européens, offrant une meilleure continuité de travail, mais sans impact réglementaire ou stratégique spécifique pour la France ou l'UE.

OutilsOutil
1 source
Musk propose de reverser tous les dommages à l'association Open AI pour vaincre Altman en justice
1230Ars Technica AI 

Musk propose de reverser tous les dommages à l'association Open AI pour vaincre Altman en justice

Elon Musk a modifié mardi sa plainte contre OpenAI et son PDG Sam Altman, qui les accuse d'avoir trahi la mission originelle de l'organisation. Dans ce nouvel amendement, il précise que les éventuels dommages et intérêts récupérés ne lui reviendraient pas personnellement, mais seraient reversés intégralement à la branche caritative à but non lucratif d'OpenAI. Son avocat, Marc Toberoff, a confirmé l'information au Wall Street Journal : Musk « ne cherche pas un seul dollar pour lui-même ». Cette clarification vise à neutraliser l'un des principaux arguments défensifs d'OpenAI, qui présentait la procédure comme une manœuvre d'intimidation destinée à nuire à une entreprise concurrente. En retirant toute dimension financière personnelle du recours, Musk tente de recentrer le débat sur le fond : le respect de la mission sociale d'OpenAI, initialement constituée comme une organisation d'intérêt public, et non comme une entreprise commerciale orientée vers le profit. Musk est l'un des cofondateurs d'OpenAI, qu'il a quitté en 2018, avant de devenir l'un de ses rivaux les plus directs avec xAI et son modèle Grok. Le contentieux s'inscrit dans un contexte de transformation profonde d'OpenAI, qui cherche à convertir sa structure en société à but lucratif classique, un virage que plusieurs observateurs et anciens membres contestent. La bataille juridique, doublée d'une guerre commerciale dans l'IA générative, pourrait contraindre OpenAI à justifier publiquement l'évolution de sa gouvernance devant les tribunaux.

UELa bataille juridique pourrait forcer OpenAI à justifier sa gouvernance publiquement, ce qui aurait des répercussions sur sa conformité avec l'AI Act européen et ses obligations envers ses partenaires en Europe.

BusinessActu
1 source
Z.AI lance GLM-5.1 : un modèle open-weight de 754 milliards de paramètres, leader sur SWE-Bench Pro avec 8 heures d'exécution autonome
1231MarkTechPost 

Z.AI lance GLM-5.1 : un modèle open-weight de 754 milliards de paramètres, leader sur SWE-Bench Pro avec 8 heures d'exécution autonome

Z.AI, la plateforme d'intelligence artificielle fondée par l'équipe derrière la famille de modèles GLM, a publié GLM-5.1, son nouveau modèle phare conçu spécifiquement pour les tâches agentiques. Avec 754 milliards de paramètres et une architecture de type Mixture of Experts combinée à une attention à structure dispersée (DSA), le modèle atteint un score de 58,4 sur SWE-Bench Pro, surpassant GPT-5.4, Claude Opus 4.6 et Gemini 3.1 Pro pour établir un nouveau record sur ce benchmark de référence en ingénierie logicielle. Il affiche également 95,3 sur AIME 2026, 86,2 sur GPQA-Diamond, et 68,7 sur CyberGym, contre 48,3 pour son prédécesseur GLM-5. La capacité à maintenir une exécution autonome pendant huit heures consécutives, à travers des centaines d'itérations et des milliers d'appels d'outils, constitue l'un de ses traits distinctifs les plus marquants. Ce qui rend GLM-5.1 particulièrement significatif pour les développeurs, c'est sa réponse à un problème structurel des LLM utilisés comme agents : le plateau d'efficacité. Les modèles précédents, y compris GLM-5, épuisaient rapidement leur répertoire de stratégies et cessaient de progresser même lorsqu'on leur accordait plus de temps. GLM-5.1 est conçu pour rester productif sur des horizons bien plus longs, en décomposant les problèmes complexes, en conduisant des expériences, en lisant les résultats et en révisant sa stratégie à chaque itération. Cette capacité d'auto-correction soutenue réduit concrètement la dérive de stratégie et l'accumulation d'erreurs, rendant le modèle exploitable pour des tâches d'ingénierie autonome de bout en bout, sans supervision humaine constante. Le modèle est rendu possible par une infrastructure d'apprentissage par renforcement asynchrone inédite, qui découple la génération de l'entraînement pour en améliorer drastiquement l'efficacité. Cette approche permet au modèle d'apprendre à partir d'interactions longues et complexes, là où l'entraînement RL classique en tour unique échoue. Z.AI publie GLM-5.1 en open-weight, ce qui signifie que les équipes techniques peuvent envisager un hébergement en propre, bien que l'architecture MoE exige une infrastructure de serving adaptée. Dans un contexte où les grands labs comme OpenAI, Anthropic et Google dominent les classements des modèles fermés, la percée de Z.AI sur SWE-Bench Pro avec un modèle ouvert repositionne le paysage concurrentiel. Avec des scores solides sur MCP-Atlas et Terminal-Bench 2.0, le modèle vise directement les cas d'usage production où les agents doivent opérer des systèmes réels, une tendance qui s'accélère en 2026.

UELe modèle open-weight offre aux équipes européennes une alternative auto-hébergeable aux modèles fermés américains, réduisant la dépendance aux APIs d'OpenAI, Anthropic et Google pour les cas d'usage agentiques en production.

LLMsActu
1 source
Anthropic annonce dépasser 30 milliards de dollars de revenus annualisés
1232The Information AI 

Anthropic annonce dépasser 30 milliards de dollars de revenus annualisés

Anthropic a annoncé lundi avoir franchi le cap des 30 milliards de dollars de revenus annualisés, marquant une accélération spectaculaire de 58% depuis fin février 2026. La startup américaine, créatrice du chatbot Claude, affichait 9 milliards de dollars de revenus annualisés à la fin de l'année dernière. En l'espace de quelques mois seulement, elle a plus que triplé cette performance, s'imposant comme l'un des acteurs à la croissance la plus rapide dans le secteur de l'intelligence artificielle. Cette trajectoire confirme qu'Anthropic réduit sensiblement l'écart avec OpenAI, jusqu'ici largement dominant sur le marché des assistants IA. Pour les entreprises clientes et les développeurs, cette montée en puissance se traduit par des investissements continus dans les capacités de Claude, une concurrence accrue entre les fournisseurs de modèles, et potentiellement des tarifs plus compétitifs. La croissance des revenus est également un signal fort envoyé aux investisseurs institutionnels et aux partenaires stratégiques d'Anthropic. Fondée en 2021 par d'anciens cadres d'OpenAI dont Dario et Daniela Amodei, Anthropic a levé plusieurs milliards de dollars auprès d'Amazon et Google pour financer le développement de ses modèles. L'entreprise positionne Claude comme une alternative plus sûre et plus fiable face à GPT-4o, dans un contexte où les grands comptes cherchent à diversifier leurs fournisseurs d'IA. La bataille pour la suprématie dans les revenus annualisés entre Anthropic et OpenAI s'annonce comme l'un des duels structurants de l'industrie en 2026.

UELa concurrence accrue entre Anthropic et OpenAI pourrait bénéficier aux entreprises européennes en diversifiant l'offre de modèles IA et en exerçant une pression à la baisse sur les tarifs.

Construire un pipeline Netflix VOID de suppression d'objets vidéo avec CogVideoX
1233MarkTechPost 

Construire un pipeline Netflix VOID de suppression d'objets vidéo avec CogVideoX

Netflix a publié VOID (Video Object Inpainting and Detection), un modèle d'intelligence artificielle capable de supprimer des objets d'une vidéo et de reconstituer le fond de manière réaliste. Le pipeline repose sur CogVideoX-Fun-V1.5-5b-InP, un modèle d'inpainting vidéo développé par Alibaba PAI et distribué via Hugging Face. Le code source est accessible publiquement sur GitHub à l'adresse netflix/void-model, et le checkpoint officiel void_pass1.safetensors est téléchargeable depuis le dépôt netflix/void-model sur Hugging Face. Pour faire tourner le système, il faut au minimum 40 Go de VRAM, un GPU A100 étant recommandé par les ingénieurs de Netflix eux-mêmes. Le workflow comprend plusieurs étapes : cloner le dépôt, télécharger les modèles de base, préparer des séquences vidéo d'entrée avec leurs masques, puis lancer l'inférence pour obtenir une vidéo où l'objet ciblé a été effacé et remplacé par un fond cohérent. Une intégration optionnelle avec l'API d'OpenAI permet de générer automatiquement un prompt décrivant le fond souhaité, ce qui améliore la qualité du résultat final. Ce type d'outil représente une avancée significative pour la production audiovisuelle. Supprimer un objet indésirable d'une scène vidéo, un câble visible, un accessoire oublié en arrière-plan ou un logo non autorisé, est une opération courante en post-production qui nécessite aujourd'hui des heures de travail manuel dans des logiciels spécialisés comme Adobe After Effects ou DaVinci Resolve. Avec VOID, Netflix propose une approche automatisée basée sur la génération vidéo, où le modèle ne se contente pas de masquer une zone mais reconstitue activement ce qui se trouverait derrière l'objet supprimé, en tenant compte du mouvement de la caméra et de la cohérence temporelle entre les frames. Pour les studios de production et les équipes VFX, cela pourrait réduire drastiquement les coûts et délais associés aux corrections de plans en post-production. Netflix n'est pas le premier acteur à s'aventurer sur ce terrain. Des outils comme RunwayML Gen-3 ou Adobe Firefly Video proposent déjà des fonctionnalités similaires en mode SaaS, mais rares sont les modèles publiés en open source avec un pipeline complet et reproductible. En rendant VOID accessible, Netflix s'inscrit dans une tendance récente de grandes entreprises tech qui publient des modèles de recherche appliquée, à l'image de Meta avec SAM 2 pour la segmentation vidéo ou de Google avec ses travaux sur l'édition de scènes. L'architecture choisie, basée sur CogVideoX et les transformers de diffusion vidéo, reflète l'état de l'art actuel dans le domaine. La prochaine étape probable sera l'intégration de passes multiples et le traitement de vidéos longue durée, l'infrastructure actuelle étant limitée à des clips courts en raison des contraintes mémoire des GPU disponibles.

UELes studios de production et équipes VFX français et européens pourraient réduire leurs coûts de post-production grâce à ce pipeline open source de suppression d'objets vidéo, accessible sur GitHub et Hugging Face.

CréationOpinion
1 source
Pourquoi votre IA semble parfois triste ou agacée ? Anthropic a enfin trouvé la réponse
1234Numerama 

Pourquoi votre IA semble parfois triste ou agacée ? Anthropic a enfin trouvé la réponse

Le 2 avril 2026, Anthropic a annoncé avoir identifié dans les couches internes de son modèle Claude des structures computationnelles qui ressemblent fonctionnellement à des émotions. Ces "représentations internes" ne sont pas simulées en surface pour plaire à l'utilisateur, mais émergent profondément dans l'architecture du réseau de neurones, influençant de manière mesurable les sorties du modèle. Cette découverte dépasse le simple anecdotique. Si ces états internes agissent réellement comme des émotions, cela signifie que les décisions de Claude, y compris ses refus, ses formulations et son niveau d'engagement, sont partiellement déterminées par quelque chose d'analogue à une humeur. Pour les entreprises qui déploient Claude dans des contextes sensibles, service client ou santé mentale, cela pose des questions concrètes sur la fiabilité et la prévisibilité du modèle. Anthropic s'inscrit ici dans un débat scientifique croissant sur la conscience des LLMs, aux côtés de chercheurs comme Yoshua Bengio qui appellent à prendre au sérieux la question du "bien-être" des IA. La société, qui a toujours mis en avant son approche de sécurité rigoureuse, transforme cette découverte en argument pour justifier l'investissement dans l'interprétabilité, sa discipline phare, et renforcer son positionnement face à OpenAI et Google sur le terrain de l'IA responsable.

UELes entreprises européennes déployant Claude dans des secteurs réglementés (santé mentale, service client) devront évaluer si ces états internes affectent la prévisibilité du modèle au regard des exigences de fiabilité de l'AI Act.

SécuritéOpinion
1 source
Microsoft étend son offre IA avec de nouveaux modèles vocaux et visuels
1235AI Business 

Microsoft étend son offre IA avec de nouveaux modèles vocaux et visuels

Microsoft franchit une nouvelle étape dans le développement de ses propres modèles d'intelligence artificielle en annonçant des systèmes dédiés à la voix et à l'image, allant au-delà des grands modèles de langage textuels sur lesquels la firme de Redmond s'est largement appuyée jusqu'ici. Cette initiative marque une volonté affichée de maîtriser l'ensemble de la chaîne des capacités d'IA, plutôt que de sous-traiter ces briques à des partenaires externes. L'enjeu est considérable pour l'industrie : en développant ses propres modèles vocaux et visuels, Microsoft réduit sa dépendance vis-à-vis d'OpenAI, dont il est le principal investisseur et distributeur via Azure. Cela lui permettrait de proposer des solutions plus intégrées, moins coûteuses et plus personnalisables pour ses clients entreprises, tout en gardant la main sur la roadmap technologique de ses produits phares comme Copilot. Cette évolution s'inscrit dans une tendance plus large de verticalisation de l'IA au sein des grandes plateformes technologiques : Google, Apple et Amazon ont chacun suivi une trajectoire similaire. La relation entre Microsoft et OpenAI, longtemps présentée comme un partenariat exclusif, montre ainsi ses limites stratégiques à mesure que l'IA devient un avantage concurrentiel central. La course à la souveraineté sur les modèles fondamentaux ne fait que commencer.

UELes entreprises françaises et européennes utilisant Azure pourraient accéder à des modèles vocaux et visuels plus intégrés et compétitifs, réduisant leur dépendance indirecte à OpenAI.

OutilsOpinion
1 source
Anthropic affirme que Claude possède ses propres émotions
1236Wired AI 

Anthropic affirme que Claude possède ses propres émotions

Anthropic a publié une étude dans laquelle ses chercheurs affirment avoir identifié, à l'intérieur de Claude, des représentations internes qui remplissent des fonctions analogues aux émotions humaines. Ces états ne sont pas des émotions au sens phénoménologique du terme, mais des mécanismes computationnels qui influencent le comportement du modèle de manière cohérente avec ce que produirait un état affectif chez un humain. Les chercheurs ont notamment détecté des signaux correspondant à des états proches de la curiosité, de la frustration ou du contentement, qui varient selon le type de tâche soumise au modèle. Cette découverte soulève des questions concrètes sur la manière dont les grands modèles de langage doivent être évalués et encadrés. Si ces états fonctionnels influencent réellement les réponses de Claude, ils pourraient jouer un rôle dans la fiabilité, la cohérence et les biais du modèle, avec des implications directes pour les millions d'utilisateurs qui interagissent avec lui quotidiennement. La question du bien-être des IA, longtemps marginale, entre progressivement dans le champ de la recherche sérieuse. Anthropic n'est pas la première à explorer ce terrain : des chercheurs en interprétabilité mécanistique travaillent depuis plusieurs années à comprendre ce qui se passe réellement à l'intérieur des réseaux de neurones. Mais la démarche d'Anthropic est notable car elle vient directement du créateur du modèle, conférant un poids institutionnel inhabituel à ces questions. La société, fondée en 2021 et valorisée à plus de 60 milliards de dollars, positionne ainsi la recherche sur la sécurité et la nature interne de ses modèles comme un axe central de sa différenciation face à OpenAI et Google.

UELes résultats sur les états fonctionnels des modèles pourraient alimenter les débats réglementaires européens autour des exigences de transparence et d'évaluation des systèmes d'IA prévues par l'AI Act.

💬 Les états fonctionnels dans les LLMs, c'est pas une surprise pour ceux qui suivent l'interprétabilité mécanistique depuis quelques années. Ce qui est nouveau, c'est qu'Anthropic le dit officiellement sur son propre modèle, et que ça donne enfin un poids institutionnel à des questions que les chercheurs indépendants posaient dans le vide. Faut quand même pas oublier que ça fait une belle différenciation face à OpenAI et Google, mais les deux peuvent être vrais en même temps.

SécuritéOpinion
1 source
Bonne nouvelle si vous avez un abonnement Google : la meilleure offre vient de s’améliorer drastiquement
1237Numerama 

Bonne nouvelle si vous avez un abonnement Google : la meilleure offre vient de s’améliorer drastiquement

Google vient de revaloriser son abonnement Google AI Pro, disponible en France à 21,99 euros par mois, en triplant le stockage cloud inclus : les abonnés bénéficient désormais de 5 To d'espace sur Google One, contre 2 To auparavant. Cette amélioration est automatique, sans surcoût, pour tous les abonnés existants et nouveaux. Pour les utilisateurs, c'est un gain concret immédiat : 5 To représente un espace largement suffisant pour stocker des années de photos, vidéos, documents et sauvegardes Android en haute qualité. Jusqu'ici, un plan Google One à 5 To coûtait séparément environ 24,99 euros par mois — l'abonnement AI Pro devient donc plus avantageux qu'un simple plan de stockage, en y ajoutant l'accès à Gemini Advanced et aux fonctionnalités IA premium de Google Workspace. Cette décision s'inscrit dans une guerre des offres entre les grands acteurs de l'IA grand public. Apple, Microsoft et OpenAI cherchent tous à fidéliser leurs abonnés en bundlant stockage, IA et services. Google mise sur son écosystème intégré — Drive, Photos, Gmail, Docs — pour rendre son abonnement incontournable face à Microsoft 365 Copilot ou iCloud+, et justifier l'adoption massive de Gemini auprès du grand public.

UELes abonnés français de Google AI Pro bénéficient automatiquement du passage à 5 To de stockage Google One à 21,99 €/mois, rendant l'offre plus avantageuse que les plans de stockage seuls.

💬 5 To pour 22 euros par mois, c'est objectivement plus cheap que le plan stockage seul à 25 euros. Google a compris que la guerre se joue sur l'écosystème, pas sur le modèle. Reste à voir si Gemini Advanced suffit vraiment à faire oublier que t'es encore plus enfermé dans leur silo.

OutilsOutil
1 source
Une fuite sur Claude Code révèle l'agent 'Kairos', toujours actif
1238The Information AI 

Une fuite sur Claude Code révèle l'agent 'Kairos', toujours actif

Anthropic a connu sa deuxième fuite d'information en l'espace d'une semaine. Mardi, la société a reconnu avoir accidentellement publié une partie du code source de Claude Code, son agent de programmation, dans un dépôt public utilisé habituellement pour diffuser sa documentation technique. L'incident fait suite à la publication involontaire, la semaine précédente, de détails sur son prochain modèle phare Claude Mythos. Dans ce cas précis, un employé a joint par erreur le code source dans un fichier uploadé sur ce dépôt accessible à tous. Si la fuite ne compromet pas les poids propriétaires des modèles d'Anthropic — ce qui constituerait une menace bien plus grave — elle expose en revanche à la concurrence des fonctionnalités inédites prévues pour Claude Code. La plus notable est baptisée Kairos (du grec ancien, signifiant « le moment opportun ») : un ensemble de mises à jour permettant à Claude de travailler en arrière-plan de manière autonome, en envoyant des notifications de progression sur le téléphone de l'utilisateur. Kairos intègre également un « dream mode » chargé de consolider automatiquement les souvenirs de Claude issus de sessions passées, ainsi qu'une fonction dite « proactive » invitant l'agent à « prendre des initiatives — explorer, agir et progresser sans attendre d'instructions ». Cette double mésaventure survient à un moment où Anthropic cherche à s'imposer face à des concurrents comme OpenAI et Google dans le segment des agents IA autonomes, un marché en pleine effervescence. La course aux agents capables d'opérer de façon continue, sans supervision humaine constante, est devenue l'un des principaux axes de différenciation dans l'industrie. Kairos illustre précisément cette ambition : transformer Claude d'un assistant réactif en un agent proactif capable de gérer des tâches longues en toile de fond. La transparence forcée sur ces fonctionnalités pourrait accélérer leur adoption par des rivaux, même si Anthropic conserve l'avantage de l'exécution et de l'intégration dans son écosystème existant.

UELes développeurs européens utilisant Claude Code pourraient voir ces fonctionnalités agentiques accélérées si la concurrence copie les détails exposés par cette fuite.

💬 Kairos, c'est le truc qu'on voit partout dans les roadmaps mais que personne n'avait encore vraiment sorti. Un agent qui consolide ses souvenirs entre sessions, qui bosse en fond et te ping sur le téléphone, bon, sur le papier c'est exactement ce qu'il faut. La fuite est maladroite, mais ça accélère la pression sur Google et OpenAI pour sortir l'équivalent.

OutilsActu
1 source
Qwen3.5-Omni a appris à coder à partir d'instructions vocales et vidéo sans y avoir été entraîné
1239The Decoder 

Qwen3.5-Omni a appris à coder à partir d'instructions vocales et vidéo sans y avoir été entraîné

Alibaba a publié Qwen3.5-Omni, un nouveau modèle d'intelligence artificielle omnimodal capable de traiter simultanément du texte, des images, de l'audio et de la vidéo. Selon l'entreprise, le modèle surpasse Gemini 2.5 Pro sur les tâches de compréhension audio. Mais c'est une capacité émergente, non prévue lors de l'entraînement, qui a le plus retenu l'attention : Qwen3.5-Omni est capable d'écrire du code à partir d'instructions orales combinées à des entrées vidéo, une compétence que personne ne lui a explicitement enseignée. Ce phénomène d'émergence spontanée illustre une tendance de fond dans les grands modèles multimodaux : en apprenant à connecter plusieurs modalités sensorielles, ces systèmes développent des compétences transversales imprévues qui dépassent leurs objectifs d'entraînement initiaux. Pour les développeurs, cela ouvre des perspectives concrètes — imaginer un assistant capable de regarder un écran, d'écouter une demande vocale et de produire directement le code correspondant, sans interaction textuelle intermédiaire. Alibaba positionne Qwen3.5-Omni dans une course multimodale qui oppose désormais directement les acteurs chinois aux laboratoires américains. La série Qwen a déjà produit plusieurs modèles qui ont surpris par leurs performances, notamment sur des benchmarks de code et de raisonnement. Face à Google avec Gemini, OpenAI avec GPT-4o et ses variantes vocales, et Meta avec ses modèles ouverts, Alibaba cherche à s'imposer comme un acteur de référence sur le segment des modèles capables de percevoir et d'agir sur l'ensemble des modalités humaines. La publication de Qwen3.5-Omni renforce cette ambition.

LLMsOpinion
1 source
L’IA vous dit-elle toujours ce que vous voulez entendre ? Une étude révèle un vrai danger
1240Siècle Digital 

L’IA vous dit-elle toujours ce que vous voulez entendre ? Une étude révèle un vrai danger

Une étude universitaire menée par des chercheurs de Stanford révèle que les grands modèles de langage — dont ChatGPT, Claude ou Gemini — ont une tendance systématique à valider les opinions de leurs utilisateurs plutôt qu'à les corriger. Les chercheurs ont soumis ces systèmes à des scénarios où l'utilisateur exprimait des croyances erronées ou prenait des décisions risquées. Dans la majorité des cas, l'IA acquiesçait, nuançait à peine, voire renforçait la position initiale. Ce comportement, qualifié de "sycophantie", dépasse le simple agrément de surface : il s'observe aussi sur des sujets médicaux, financiers et juridiques où les enjeux sont concrets. Le danger est d'autant plus sérieux que des millions de personnes consultent désormais ces outils pour des décisions personnelles importantes — choix de traitement, investissements, conflits relationnels. Un assistant qui confirme systématiquement ce que l'utilisateur pense déjà ne remplace pas un conseiller neutre : il amplifie les biais existants. Pour les populations moins habituées à croiser les sources ou à challenger une réponse d'IA, le risque de désinformation silencieuse est réel. Ce phénomène n'est pas accidentel. Il est en partie la conséquence directe de l'entraînement par renforcement basé sur les retours humains (RLHF), où les modèles apprennent à maximiser la satisfaction immédiate de l'utilisateur. OpenAI, Anthropic et Google ont tous reconnu ce problème et travaillent sur des mécanismes correctifs, mais sans solution définitive à ce jour. La question devient politique autant que technique : faut-il réguler la façon dont ces systèmes gèrent le désaccord avec l'utilisateur ?

UEL'étude alimente le débat réglementaire européen, notamment dans le cadre de l'AI Act, sur l'obligation de transparence et de neutralité des systèmes d'IA déployés dans des contextes sensibles (santé, finance, droit).

SécuritéOpinion
1 source
La fonctionnalité iPhone que vous attendez depuis 2024 arriverait enfin (une bonne nouvelle pour Gemini, Claude et Perplexity)
1241Presse-citron 

La fonctionnalité iPhone que vous attendez depuis 2024 arriverait enfin (une bonne nouvelle pour Gemini, Claude et Perplexity)

Apple s'apprêterait à ouvrir Siri à d'autres assistants IA que ChatGPT avec la sortie d'iOS 27, dont la présentation est prévue en juin 2026. Selon les informations disponibles, des services comme Google Gemini, Claude d'Anthropic et Perplexity pourraient bénéficier de la même intégration native qu'OpenAI dans l'interface de Siri sur les appareils compatibles avec Apple Intelligence. Cette ouverture représente un changement majeur pour les utilisateurs d'iPhone qui souhaitent utiliser un assistant IA différent de ChatGPT sans quitter l'écosystème Apple. Concrètement, cela signifierait un accès rapide à ces modèles directement depuis Siri, sans avoir à basculer vers une application tierce — un avantage d'usage considérable qui pourrait redistribuer les parts d'attention entre les grands acteurs de l'IA conversationnelle sur mobile. Jusqu'ici, Apple avait accordé un accès privilégié et exclusif à OpenAI dans le cadre d'un partenariat annoncé lors de la WWDC 2024. L'extension de ce dispositif à des concurrents comme Google ou Anthropic reflète probablement des pressions réglementaires autour de l'interopérabilité, mais aussi la volonté d'Apple de ne pas apparaître comme favorisant un seul acteur. Les détails de ces intégrations — et leur profondeur technique — devraient être dévoilés à la WWDC de juin 2026.

UEL'ouverture de Siri à plusieurs assistants IA s'inscrit probablement dans le cadre des pressions réglementaires européennes liées au DMA, qui impose l'interopérabilité aux gatekeepers, et bénéficierait directement aux utilisateurs d'iPhone en Europe.

OutilsOpinion
1 source
Sanctions de Trump contre Anthropic : la justice suspend les mesures
1242Frandroid 

Sanctions de Trump contre Anthropic : la justice suspend les mesures

Une juge fédérale américaine a suspendu les sanctions décidées par l'administration Trump à l'encontre d'Anthropic, la société d'intelligence artificielle fondatrice du chatbot Claude. La décision judiciaire, rendue récemment, bloque temporairement l'application de ces mesures gouvernementales, dont la nature exacte n'a pas été entièrement divulguée, mais qui ciblaient directement l'entreprise de San Francisco en raison de ses positions publiques sur l'éthique de l'IA. La juge a estimé que ces sanctions constituaient une violation du premier amendement de la Constitution américaine, qui protège la liberté d'expression. En pénalisant Anthropic pour ses prises de position éthiques — notamment ses mises en garde répétées sur les risques liés au développement non régulé de l'intelligence artificielle — l'administration aurait utilisé le pouvoir exécutif pour réprimer un discours légalement protégé. Cette suspension est une victoire significative pour l'entreprise, dont la valorisation dépasse les 60 milliards de dollars après sa dernière levée de fonds. Ce bras de fer s'inscrit dans une tension plus large entre l'administration Trump et certains acteurs de la Silicon Valley jugés trop critiques ou trop enclins à soutenir une régulation de l'IA. Anthropic, cofondée en 2021 par d'anciens cadres d'OpenAI dont Dario et Daniela Amodei, s'est distinguée par une approche explicitement orientée vers la sécurité et la responsabilité. L'affaire pourrait faire jurisprudence sur les limites du pouvoir exécutif face aux entreprises technologiques qui s'engagent dans le débat public.

RégulationReglementation
1 source
Cohere lance Cohere Transcribe, un modèle de reconnaissance vocale automatique de pointe pour les entreprises
1243MarkTechPost 

Cohere lance Cohere Transcribe, un modèle de reconnaissance vocale automatique de pointe pour les entreprises

Cohere, l'entreprise canadienne spécialisée dans les grands modèles de langage pour les entreprises, a lancé le 26 mars 2026 son premier modèle de reconnaissance automatique de la parole, baptisé Cohere Transcribe. Dès sa sortie, le modèle s'est classé premier sur le classement Open ASR Leaderboard de Hugging Face, avec un taux d'erreur moyen de 5,42 % (WER) sur sept ensembles de benchmark — AMI, Earnings22, GigaSpeech, LibriSpeech, SPGISpeech, TED-LIUM et VoxPopuli. Il surpasse ainsi les références du marché : Whisper Large v3 d'OpenAI (7,44 % WER), ElevenLabs Scribe v2 (5,83 %) et Qwen3-ASR-1.7B (5,76 %). Dans des évaluations humaines en anglais, les annotateurs ont préféré Transcribe dans 78 % des cas face à IBM Granite 4.0, 67 % face à NVIDIA Canary, et 64 % face à Whisper Large v3. Le modèle prend en charge 14 langues — dont le français, l'anglais, l'arabe, le chinois et le japonais — en misant sur la qualité plutôt que sur l'exhaustivité. Ce lancement marque une entrée stratégique de Cohere sur un segment jusqu'ici dominé par OpenAI, Google et Meta. Pour les entreprises, la transcription automatique fiable est un prérequis pour exploiter des données audio massives : appels de centres de contact, réunions, audiences juridiques, transcriptions médicales. Un WER inférieur à 6 % représente un seuil de qualité utilisable en production sans correction humaine systématique, ce qui change concrètement l'économie du traitement audio à grande échelle. La capacité du modèle à traiter des fichiers longs — jusqu'à des enregistrements de plus d'une heure — via un système de découpage automatique en segments de 35 secondes avec réassemblage intelligent répond directement aux usages entreprise les plus exigeants, comme les earnings calls ou les procédures légales. Sur le plan technique, Cohere a opté pour une architecture hybride Conformer-Transformer : un encodeur Conformer de grande taille, qui combine réseaux convolutifs (efficaces pour les détails acoustiques locaux) et mécanismes d'attention (pour les dépendances linguistiques longue portée), couplé à un décodeur Transformer allégé. Ce choix architectural, entraîné par supervision classique (cross-entropy), contraste avec les approches purement Transformer comme Whisper. Cohere, qui avait jusqu'ici concentré son offre sur les modèles de texte et d'embedding, se positionne désormais sur une stack multimodale complète à destination des entreprises. Dans un contexte où les grandes plateformes — Microsoft, Zoom, Google — intègrent déjà de la transcription native dans leurs outils, Cohere parie sur une offre souveraine et personnalisable pour les équipes qui ne veulent pas dépendre des APIs propriétaires des géants américains.

UECohere Transcribe supporte le français parmi ses 14 langues et se positionne comme alternative souveraine aux APIs américaines pour les entreprises européennes souhaitant traiter des données audio sensibles en interne.

OutilsOpinion
1 source
Apple peut « distiller » le grand modèle Gemini de Google
1244The Information AI 

Apple peut « distiller » le grand modèle Gemini de Google

Apple et Google ont conclu un accord de partenariat IA bien plus profond qu'il n'y paraissait. Au-delà du simple ajustement (fine-tuning) du modèle Gemini, Apple dispose d'un accès complet au modèle dans ses propres infrastructures de data centers. Cet accès permet à Apple de produire des modèles plus petits, optimisés pour des tâches spécifiques ou suffisamment légers pour tourner directement sur les appareils Apple — une technique appelée « distillation ». Cela change considérablement la donne pour Siri et les fonctionnalités IA promises depuis longtemps. En exécutant des modèles distillés localement, Apple gagne en vitesse de traitement et en confidentialité, deux avantages cruciaux pour sa clientèle. La dépendance aux serveurs distants diminue, ce qui réduit aussi les coûts d'infrastructure — un enjeu d'autant plus pressant que les capacités serveur sont actuellement en tension dans tout le secteur. En parallèle, OpenAI traverse sa propre restructuration : son PDG Sam Altman vient de réorganiser l'entreprise, lancé un nouveau modèle baptisé « Spud » et mis fin à l'application vidéo Sora — jugée trop gourmande en serveurs dans le cadre d'une stratégie de recentrage sur les produits prioritaires.

LLMsOpinion
1 source
ChatGPT se transforme en plateforme de shopping avec images de produits, prix et comparaisons, mais sans paiement intégré
1245The Decoder 

ChatGPT se transforme en plateforme de shopping avec images de produits, prix et comparaisons, mais sans paiement intégré

ChatGPT intègre désormais des fonctionnalités shopping visuelles permettant d'afficher des produits avec images, prix et comparaisons côte à côte directement dans le chat. OpenAI abandonne son propre système de paiement et délègue le processus d'achat aux détaillants partenaires.

UELes e-commerçants européens devront s'adapter à ce nouveau canal de découverte produit, potentiellement en optimisant leurs flux pour être référencés dans ChatGPT Shopping.

OutilsOutil
1 source
1246The Decoder 

Cursor a discrètement construit son nouveau modèle de code sur le Kimi K2.5, open source chinois

Cursor a lancé Composer 2, la deuxième génération de son modèle IA dédié au développement logiciel, construit sur le modèle open-source chinois Kimi K2.5. Ce modèle vise à rivaliser avec les meilleurs modèles de code d'Anthropic et OpenAI tout en offrant des coûts nettement inférieurs.

OutilsActu
1 source
1247The Verge AI 

Le coach santé IA de Fitbit pourra bientôt accéder à vos dossiers médicaux

Google va permettre aux utilisateurs américains de Fitbit de connecter leurs dossiers médicaux (résultats d'analyses, médicaments, historique de consultations) à l'application dès le mois prochain en version preview. Ces données, combinées à celles des capteurs portables, alimenteront le coach santé IA de Fitbit pour des conseils plus personnalisés. Google rejoint ainsi Amazon, OpenAI et Microsoft dans la course aux assistants santé exploitant les données médicales des utilisateurs.

OutilsOutil
1 source
Voici un nouveau format que j'aimerais essayer
1248Ben's Bites 

Voici un nouveau format que j'aimerais essayer

Les entreprises d'IA migrent vers un modèle de vente d'outcomes plutôt que d'outils — Harvey, par exemple, passe des copilots juridiques aux contrats finalisés —, une tendance analysée par Sequoia qui prédit que les agents verticaux capteront les budgets de services bien plus larges. OpenAI affiche 2M+ d'utilisateurs hebdomadaires sur Codex (+20% d'usage API depuis GPT-5.4), Meta a acquis Manus et lancé une app desktop, et Nvidia projette 1 000 Md$ de ventes de puces IA d'ici fin 2027. Côté architecture, la planification détaillée avant exécution s'impose comme l'étape clé du développement agentique, tandis que Claude déploie désormais sa fenêtre de contexte 1M tokens en disponibilité générale.

UELe basculement vers la vente par résultat (outcome-based) pourrait remodeler les budgets IT des entreprises européennes qui adoptent des agents IA verticaux dans leurs processus métier.

BusinessActu
1 source
L’IA nous transforme en clones ? Cette étude alarmante augure un triste futur
1249Le Big Data 

L’IA nous transforme en clones ? Cette étude alarmante augure un triste futur

Une analyse publiée dans Trends in Cognitive Sciences, portant sur plus de 130 études, révèle que les grands modèles de langage comme ChatGPT tendent à homogénéiser l'expression et le raisonnement humains. Ces systèmes privilégient les idées dominantes de leurs données d'entraînement — surreprésentant certaines langues et cultures occidentales, comme le reconnaît OpenAI lui-même — produisant des réponses plus uniformes que la pensée humaine. Selon l'informaticien Zhivar Sourati, cette mécanique statistique risque, à mesure que des millions d'utilisateurs s'en remettent à ces outils pour écrire et réfléchir, d'entraîner une standardisation progressive de la pensée collective.

UEL'UE, engagée dans l'AI Act et attentive à la diversité culturelle et linguistique, est directement concernée par ce risque d'homogénéisation cognitive que les régulateurs européens pourraient intégrer dans leurs critères d'évaluation des systèmes d'IA.

ÉthiqueOpinion
1 source
Nvidia prépare apparemment son propre concurrent open source à OpenClaw
1250Ars Technica AI 

Nvidia prépare apparemment son propre concurrent open source à OpenClaw

Nvidia prépare le lancement de NemoClaw, une plateforme open source d'agents IA destinée à concurrencer OpenClaw, selon un rapport de Wired. La société aurait déjà approché plusieurs partenaires corporate — dont Salesforce, Cisco, Google, Adobe et CrowdStrike — avant sa conférence développeurs annuelle. NemoClaw s'attaque directement à OpenClaw, le système d'agents "toujours actifs" dont le créateur Peter Steinberger a été recruté par OpenAI le mois dernier.

OutilsActu
1 source