Aller au contenu principal

Dossier Microsoft — page 5

1056 articles · page 5 sur 22

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

Amazon Nova Sonic : évaluer un agent vocal à grande échelle, sans microphone
201AWS ML Blog OutilsOutil

Amazon Nova Sonic : évaluer un agent vocal à grande échelle, sans microphone

Amazon a publié le Nova Sonic Test Harness, un framework open source conçu pour automatiser les tests des agents vocaux construits sur son modèle Amazon Nova Sonic. Jusqu'ici, la seule méthode disponible pour les équipes de développement consistait à faire parler physiquement une personne à l'agent et à écouter les réponses, scénario par scénario. Avec 50 scénarios de conversation testés sur 3 personas utilisateurs distincts, cela représente 150 tests manuels, chacun prenant plusieurs minutes en temps réel. Multiplié par chaque modification de prompt ou de configuration d'outil, le coût en temps devient prohibitif. Le harness résout ce problème en simulant des conversations complètes multi-tours sans microphone, en évaluant les résultats via des techniques de jugement par LLM, et en détectant les cas d'hallucination audio, c'est-à-dire les situations où le texte généré et l'audio produit divergent, par exemple "15h00" à l'écrit contre "15h30" à l'oral. L'enjeu est considérable pour les entreprises qui déploient des agents vocaux dans des flux critiques comme la prise de rendez-vous, la gestion de commandes ou le support client. Sans framework d'évaluation automatisé, l'optimisation des prompts devient un travail à l'aveugle : impossible de savoir si une modification améliore ou dégrade le comportement de l'agent sur l'ensemble des cas d'usage avant un déploiement en production. Le harness permet désormais de lancer une suite de régression complète avant chaque mise à jour, de mesurer si l'agent gère correctement les cas limites sur des centaines de scénarios, et de détecter des régressions subtiles, comme un agent qui cesserait de confirmer une réservation, avant qu'un vrai client ne les rencontre. Les agents vocaux posent des défis techniques fondamentalement différents des chatbots textuels, ce qui explique pourquoi les outils d'évaluation existants ne s'adaptent pas directement. Les modèles speech-to-speech maintiennent une connexion full-duplex persistante avec flux audio et texte bidirectionnels simultanés, incompatible avec les outils HTTP classiques. Leurs réponses sont non-déterministes, le comportement pertinent se manifeste sur plusieurs tours de conversation, et les sessions expirent après environ huit minutes, nécessitant une gestion de la reconnexion et du replay d'historique. Amazon positionne Nova Sonic comme sa réponse aux besoins croissants des entreprises en matière d'interfaces vocales intelligentes, un marché en forte expansion où Google, Microsoft et des acteurs spécialisés comme ElevenLabs se disputent les contrats. La publication en open source du harness vise à abaisser la barrière d'adoption en offrant aux développeurs un outil de test professionnel dès le départ.

1 source
Apple présente la troisième génération de ses modèles de fondation
202Apple Machine Learning 

Apple présente la troisième génération de ses modèles de fondation

Apple a dévoilé la troisième génération de ses Apple Foundation Models (AFM), une famille de cinq modèles d'intelligence artificielle développés en collaboration avec Google. Ces modèles, présentés comme le coeur de la prochaine version d'Apple Intelligence, couvrent un spectre allant des modèles fonctionnant directement sur l'appareil jusqu'aux modèles hébergés sur des serveurs via l'infrastructure Private Cloud Compute. Ils alimenteront notamment une refonte complète de Siri ainsi qu'une série d'outils intelligents intégrés aux systèmes d'exploitation Apple. Ce partenariat avec Google marque un tournant stratégique pour Apple, qui avait jusqu'ici développé ses modèles en interne. L'enjeu est considérable : Apple doit rattraper son retard sur des concurrents comme OpenAI, Google et Microsoft dans la course aux assistants IA natifs. En distribuant le traitement entre l'appareil local et le cloud sécurisé, Apple cherche à offrir des capacités IA avancées sans sacrifier la confidentialité des données, un argument différenciateur central face à des services cloud classiques. Cette annonce s'inscrit dans la stratégie Apple Intelligence lancée en 2024, dont le déploiement progressif avait suscité des critiques sur la lenteur des livraisons. La collaboration avec Google est particulièrement significative : les deux entreprises, habituellement rivales sur les moteurs de recherche et les systèmes mobiles, s'associent ici sur la couche infrastructure IA. La famille de cinq modèles suggère une segmentation fine des cas d'usage, de la compréhension vocale embarquée aux tâches complexes nécessitant de la puissance serveur.

UEL'architecture vie-privée-first d'Apple (traitement local via Private Cloud Compute) s'aligne avec les exigences du RGPD, ce qui pourrait faciliter l'adoption d'Apple Intelligence par les entreprises et institutions européennes soucieuses de la souveraineté des données.

LLMsOpinion
1 source
IBM et Google Cloud veulent accélérer l’adoption de l’IA dans les entreprises
203Le Big Data 

IBM et Google Cloud veulent accélérer l’adoption de l’IA dans les entreprises

IBM et Google Cloud ont annoncé le 4 juin 2026 une expansion significative de leur partenariat stratégique, avec le lancement d'une Google Cloud Practice dédiée au sein d'IBM Consulting. Cette nouvelle entité regroupe des milliers de consultants IBM certifiés Google Cloud ainsi que des équipes d'ingénierie spécialisées, avec pour mission d'accompagner les grandes organisations dans le déploiement d'agents IA à l'échelle industrielle. Concrètement, les deux groupes combinent la plateforme Gemini Enterprise Agent de Google Cloud avec l'expertise sectorielle d'IBM Consulting pour couvrir huit domaines prioritaires : banque, assurance, administrations publiques, télécommunications, énergie, commerce de détail, cybersécurité et sciences de la vie. Les consultants IBM pourront désormais concevoir, déployer et gérer directement des agents IA sur l'infrastructure Google Cloud, en s'appuyant sur des composants préconfigurés et des méthodologies éprouvées. L'enjeu est de résoudre l'un des blocages les plus coûteux de l'industrie : la difficulté à transformer les projets pilotes en déploiements opérationnels rentables. De nombreuses entreprises ont expérimenté l'IA sans parvenir à en extraire une valeur concrète à grande échelle, faute d'intégration avec les systèmes critiques existants et de garanties suffisantes en matière de gouvernance et de conformité réglementaire. En proposant un cadre commun avec des agents sectoriels préconstruits, IBM et Google entendent réduire drastiquement le délai entre la conception et la mise en production, tout en permettant aux organisations d'automatiser des processus métiers complexes sans multiplier les développements sur mesure. Pour les secteurs fortement réglementés comme la finance ou la santé, la promesse est d'intégrer l'IA aux flux de travail existants tout en respectant les contraintes légales et sécuritaires. Cette initiative s'inscrit dans une tendance de fond qui voit les grands acteurs du cloud et du conseil former des alliances de plus en plus intégrées pour capter le marché de l'IA d'entreprise, estimé à plusieurs milliards de dollars. IBM, qui a repositionné une large partie de sa stratégie autour du conseil en transformation numérique depuis la cession de son activité infrastructure à Kyndryl en 2021, cherche à capitaliser sur sa présence dans les grandes entreprises pour distribuer les technologies de ses partenaires cloud. Google Cloud, de son côté, intensifie la mise en marché de Gemini via des alliances avec des intégrateurs disposant d'une relation de confiance établie avec les directions générales et les DSI. La prochaine étape attendue sera la mise sur le marché effective de ces agents sectoriels et les premiers retours de déploiements en production, qui conditionneront la crédibilité commerciale de cette alliance face à des concurrents comme Microsoft et Accenture ou AWS et Deloitte.

UELes secteurs prioritaires visés, banque, assurance et administrations publiques, sont au cœur de l'économie française et européenne, et ce cadre commun d'agents IA devra se conformer à l'AI Act et au RGPD, ce qui en fait un cas d'usage directement pertinent pour les DSI européens.

💬 Le vrai problème des pilotes IA qui restent des pilotes, IBM et Google s'y attaquent enfin avec du concret. Des milliers de consultants certifiés, des agents préconstruits par secteur, un cadre commun qui évite de tout recoder à chaque client, c'est le genre d'approche qui peut débloquer des grands comptes paralysés depuis deux ans sur les mêmes questions de conformité. Reste à voir ce que ça donne en prod, parce que Microsoft et Accenture ne regardent pas ça les bras croisés.

BusinessOpinion
1 source
Les équipes platform chez LinkedIn déploient MCP et outils multi-agents à grande échelle
204InfoQ AI 

Les équipes platform chez LinkedIn déploient MCP et outils multi-agents à grande échelle

Karthik Ramgopal et Prince Valluri, ingénieurs chez LinkedIn, ont présenté leur approche pour déployer l'intelligence artificielle à grande échelle au sein d'une organisation de plusieurs milliers de développeurs. Plutôt que de laisser chaque équipe construire ses propres solutions en silo, ils ont mis en place une couche d'abstraction commune reposant sur le protocole MCP (Model Context Protocol) pour orchestrer des agents, structurer le contexte et sécuriser l'accès aux outils internes. Cette architecture a permis de déployer concrètement trois types d'agents en production : des agents de génération de code, des agents d'observation système et des agents de test d'interface utilisateur. L'enjeu est considérable pour les grandes entreprises technologiques : sans infrastructure partagée, chaque équipe réinvente la roue et les agents IA restent des expérimentations isolées sans impact à l'échelle. En centralisant l'orchestration et la gestion du contexte via une plateforme commune, LinkedIn parvient à transformer l'IA en véritable moteur d'exécution engineering, capable d'automatiser des tâches complexes comme les tests UI ou la surveillance de systèmes distribués, avec des garanties de sécurité homogènes. Cette initiative s'inscrit dans une tendance de fond : les grandes entreprises tech passent du stade des prototypes d'agents IA à celui des déploiements industriels, ce qui exige des équipes plateformes dédiées. Le protocole MCP, porté initialement par Anthropic et rapidement adopté par l'industrie, s'impose comme standard d'interopérabilité entre agents et outils. LinkedIn, filiale de Microsoft, bénéficie par ailleurs d'un accès privilégié aux modèles GPT-4o via Azure, ce qui accélère ces expérimentations à une échelle que peu d'entreprises peuvent atteindre.

UELes équipes d'ingénierie européennes peuvent s'inspirer de cette architecture MCP pour structurer leurs propres déploiements d'agents IA à l'échelle, le protocole MCP s'imposant comme standard industriel d'interopérabilité.

💬 MCP en prod chez LinkedIn sur des milliers de devs, c'est le signal qu'on attendait pour que le protocole bascule vraiment en standard industriel. Ce qui est intéressant là-dedans, c'est pas la tech en elle-même (Anthropic a bien bossé le design), c'est l'architecture plateforme : une couche commune au lieu que chaque équipe réinvente ses propres outils d'orchestration dans son coin. Reste à voir ce que ça donne pour les boîtes qui n'ont pas Azure et GPT-4o derrière.

InfrastructureOpinion
1 source
Les 15 meilleurs outils de vibe coding en 2026 : prix, fonctionnalités et cas d'usage
205MarkTechPost 

Les 15 meilleurs outils de vibe coding en 2026 : prix, fonctionnalités et cas d'usage

En 2026, le "vibe coding" s'est imposé comme l'approche dominante du développement logiciel assisté par IA. Le principe, popularisé par Andrej Karpathy, ancien directeur de l'IA chez Tesla et OpenAI, consiste à décrire en langage naturel ce que l'on veut construire, puis à laisser un agent IA générer le code correspondant. Le développeur fixe la direction et valide le résultat, l'agent prend en charge l'essentiel de l'implémentation. Une comparaison récente de quinze outils phares illustre la diversité des approches disponibles : des plateformes agents complètes comme Atoms, qui mobilise une équipe d'agents spécialisés couvrant architecture, SEO et intégration Stripe pour livrer une application prête à déployer, jusqu'aux IDE natifs IA comme Cursor, qui conserve le développeur au coeur du code tout en automatisant les modifications multi-fichiers via son "Agent Mode". D'autres acteurs majeurs figurent dans ce panorama : Replit, environnement entièrement navigateur sans installation locale, idéal pour le prototypage rapide ; Claude Code d'Anthropic, interface en ligne de commande avec mémoire de projet persistante ; GitHub Copilot, désormais capable d'exécuter des tâches complètes depuis une invite en langage naturel ; et Windsurf avec son agent Cascade orienté collaboration en temps réel. Cette évolution réduit concrètement le coût du passage de l'idée au prototype. Un fondateur peut désormais tester un concept sans recruter une équipe d'ingénieurs. Un développeur expérimenté peut déléguer le code répétitif pour se concentrer sur l'architecture. Les cycles d'itération raccourcissent, les boucles de feedback se resserrent. Pour l'industrie, cela signifie que la barrière technique à la création de logiciels s'abaisse significativement, ce qui ouvre le développement à des profils non-ingénieurs tout en augmentant la productivité des développeurs chevronnés. Le choix entre ces outils repose sur un arbitrage central : jusqu'où déléguer à l'agent et combien garder de contrôle sur le code produit. Le vibe coding s'inscrit dans une tendance plus large portée par la montée en puissance des grands modèles de langage, notamment ceux d'Anthropic, OpenAI et Google, qui alimentent la plupart de ces outils. La capacité d'un outil à comprendre une base de code existante, à gérer des projets de grande taille, et à s'intégrer dans des workflows de revue via des pull requests devient un critère de sélection clé, en particulier pour les équipes d'entreprise soumises à des règles strictes en matière de confidentialité des données. La prochaine étape probable est l'automatisation complète de bout en bout, de la spécification produit au déploiement en production, un territoire où Atoms se positionne déjà, mais que Cursor, Copilot et Replit approchent chacun par des voies différentes. Le développeur de 2026 choisit moins son langage que son niveau d'autonomie accordé à la machine.

OutilsOutil
1 source
Les tribunaux face à une vague de plaintes générées par l'IA
206MIT Technology Review 

Les tribunaux face à une vague de plaintes générées par l'IA

Depuis 2022, les tribunaux fédéraux américains sont confrontés à une hausse spectaculaire des procédures engagées sans avocat. Une étude portant sur 4,5 millions de dossiers civils fédéraux entre 2005 et 2026, menée par Anand Shah du MIT et Joshua Levy de l'Université de Californie du Sud, révèle que la part de ces affaires est passée de 11 % en 2022 à 16,8 % en 2025, avec un nombre de dépôts plus que doublé par rapport aux niveaux d'avant 2023. Les chercheurs ont soumis 1 600 documents judiciaires tirés au hasard au détecteur de texte IA Pangram : la proportion identifiée comme contenant de l'écriture générée par IA est passée de 1 % en 2023 à 18 % en 2026. Dans le Vermont, les affaires déposées sans avocat sont passées d'environ 45 par an avant 2022 à plus de 1 100 en 2024, en partie grâce à un post viral Reddit de décembre 2024 expliquant comment rédiger un recours en mandamus via Microsoft Copilot, le faire polir par un juriste pour 150 dollars, puis le déposer dans ce district réputé rapide. Ce phénomène soulève une question centrale : l'IA améliore-t-elle réellement l'accès à la justice ? La juge fédérale Maritza Braswell, magistrate au Colorado et utilisatrice d'IA pour vérifier les documents judiciaires, reconnaît que les plaidoiries rédigées avec assistance IA sont souvent mieux articulées, ce qui lui permet de mieux comprendre les arguments et de traiter ces dossiers plus rapidement. Mais la médaille a son revers : les documents contiennent parfois des jurisprudences hallucinées et des citations fabriquées. Surtout, l'IA n'améliore pas les chances de succès des plaignants sans avocat, qui restent bien plus susceptibles de perdre que ceux représentés par un professionnel. Selon Joshua Levy, « engager un procès est une tâche complexe et multidimensionnelle, rédiger un texte n'en constitue qu'une partie ». Ces évolutions forcent le système judiciaire et les législateurs à affronter des questions inédites. Si un chatbot joue un rôle d'avocat de facto, a-t-il un devoir de conseil comme un juriste humain ? Qui est responsable quand il délivre de mauvais conseils juridiques ? Un nombre croissant d'États américains commencent à légiférer sur cette responsabilité. Le juge William Garfinkel du Connecticut, trente ans de carrière à la bénédiction, planche désormais sur des concepts comme le « privilège client-chatbot », analogue du secret professionnel de l'avocat. En parallèle, des communautés en ligne prolifèrent pour échanger des guides pratiques d'auto-représentation assistée par IA. L'intelligence artificielle ne remplace pas encore un avocat compétent, mais elle redessine profondément qui peut se permettre de pousser la porte d'un tribunal.

UECe phénomène américain préfigure des questions similaires en France et dans l'UE sur la responsabilité juridique des chatbots et leur rôle dans l'accès à la justice, notamment dans le cadre de l'AI Act.

SociétéReglementation
1 source
[AINews] Reve 2 et Ideogram 4 : mises en page dans la génération d'images
207Latent Space 

[AINews] Reve 2 et Ideogram 4 : mises en page dans la génération d'images

Le 2 et 3 juin 2026, l'industrie de l'intelligence artificielle a connu une journée particulièrement dense. Microsoft a dévoilé MAI-Thinking-1, un modèle de raisonnement généraliste entraîné sans distillation de modèles tiers, qui atteint 97 % sur le benchmark AIME 2025 et 53 % sur SWE-Bench Pro, tout en surpassant Claude Sonnet 4.6 dans des comparaisons en aveugle selon les préférences humaines. Le rapport technique de 109 pages qui accompagne le lancement a été largement salué pour sa transparence inhabituelle : aucune donnée synthétique, aucun modèle préexistant utilisé comme point de départ, et les capacités de raisonnement et d'utilisation d'outils acquises uniquement en post-entraînement. Le même jour, les plateformes de génération d'images Reve 2 et Ideogram 4.0 lançaient simultanément des avancées majeures dans la composition et la mise en page visuelle, pendant que Google publiait Gemma 4 12B, un modèle multimodal open source sous licence Apache 2.0, conçu pour fonctionner en local avec environ 16 Go de VRAM. Le rapport MAI-Thinking-1 a particulièrement retenu l'attention des chercheurs pour ses détails techniques inhabituels : Microsoft y révèle sa composition d'entraînement exacte (50 % de code, 17,5 % de STEM, 17,5 % de mathématiques, 10 % de culture générale, 5 % de multilinguisme), sa recette de montée en puissance progressive et ses ratios de calcul précis. Au-delà du modèle lui-même, la firme pousse une stratégie d'appropriation par les entreprises via le "Frontier Tuning", un système de personnalisation par renforcement qui permettrait à des modèles MAI adaptés à des tâches spécifiques d'atteindre des performances comparables à GPT-5.4 avec une efficacité dix fois supérieure. Gemma 4 12B, de son côté, introduit une architecture sans encodeur séparé pour la vision ou l'audio, toutes les modalités étant intégrées directement dans le backbone du LLM, avec un support immédiat sous vLLM, Ollama et llama.cpp, et des versions quantifiées fonctionnant sur seulement 8 Go de RAM. Ces sorties s'inscrivent dans une compétition accélérée entre laboratoires pour la maîtrise du raisonnement et du multimodal. Microsoft tente un positionnement inédit : combiner la transparence académique d'un rapport de recherche frontalier avec une infrastructure de personnalisation d'entreprise clé en main, une approche que ni OpenAI ni Google n'ont encore formalisée à cette échelle. Sur le front de l'image, le fait que Reve et Ideogram lancent le même jour des progrès sur la composition visuelle signale que ce verrou technique, longtemps considéré comme partiellement insolvable par les IA, a été levé collectivement en 2026. Ideogram 4.0 se positionne désormais comme le meilleur modèle d'image en accès ouvert, même si les classements Arena placent GPT-Image-2 encore nettement au-dessus. La convergence de ces annonces en une seule journée illustre la cadence désormais hebdomadaire des percées en IA générative.

UEGemma 4 12B, disponible sous licence Apache 2.0 et compatible Ollama, offre aux développeurs et chercheurs européens un modèle multimodal performant utilisable en local sans dépendance à un cloud américain.

💬 Composer du texte, superposer des éléments, gérer les proportions, c'était le talon d'Achille de tous les générateurs d'image. Que Reve et Ideogram sortent ça le même jour, c'est le genre de synchronisation qui signale que quelque chose s'est débloqué en profondeur. Reste à voir si Ideogram 4 tient son rang face à GPT-Image-2 dans la durée, parce que les classements Arena ont leurs angles morts.

LLMsActu
1 source
Gemma 4 12B : Google apporte l’IA multimodale sur les PC grand public
208Le Big Data 

Gemma 4 12B : Google apporte l’IA multimodale sur les PC grand public

Google a lancé le 3 juin 2026 Gemma 4 12B, un modèle d'intelligence artificielle multimodal conçu pour fonctionner sur des ordinateurs grand public disposant de seulement 16 Go de mémoire vive. Contrairement aux grands modèles qui nécessitent des infrastructures cloud coûteuses, ce modèle intermédiaire de la famille Gemma est capable de traiter simultanément du texte, des images et de l'audio directement en local. Selon Google, ses performances sur plusieurs benchmarks se rapprochent de celles du modèle Gemma 26B, pourtant bien plus imposant. Le modèle est d'ores et déjà accessible via des outils populaires comme LM Studio, Ollama, les applications Google AI Edge Gallery et AI Edge Eloquent, ainsi qu'une interface en ligne de commande nommée LiteRT-LM. Les poids préentraînés sont disponibles sur Hugging Face et Kaggle. L'enjeu principal est la souveraineté des données et l'accessibilité de l'IA avancée. En permettant l'exécution locale d'un modèle multimodal capable de transcrire, reformater ou traduire du contenu vocal sans connexion internet, Google ouvre la voie à des cas d'usage concrets pour les professionnels et particuliers soucieux de ne pas envoyer leurs données vers des serveurs distants. L'analyse de documents, les assistants personnels et l'automatisation de tâches deviennent envisageables sur une machine ordinaire, sans abonnement cloud. C'est un changement de paradigme potentiellement significatif pour les entreprises de taille moyenne, les développeurs indépendants et les utilisateurs dans des environnements à connectivité limitée. Cette annonce s'inscrit dans une tendance de fond qui voit les grands acteurs de l'IA rivaliser sur le segment des modèles compacts et open, face à la montée de concurrents comme Meta avec Llama, Mistral ou encore Microsoft. La véritable originalité architecturale de Gemma 4 12B réside dans l'abandon des encodeurs séparés pour le traitement visuel et audio : au lieu d'assembler plusieurs briques spécialisées, le modèle intègre nativement ces modalités dans son réseau principal, réduisant les calculs intermédiaires et la consommation mémoire. Cette approche, techniquement délicate à mettre en oeuvre sans sacrifier les performances, représente aussi la première fois qu'un modèle intermédiaire de la gamme Gemma gère nativement l'audio. Google positionne ainsi Gemma 4 12B comme une brique de base pour des applications dites agentiques, capables d'agir de manière autonome sur l'appareil de l'utilisateur, un segment sur lequel la compétition entre laboratoires devrait s'intensifier dans les prochains mois.

UELes entreprises et développeurs européens peuvent désormais exécuter un modèle multimodal en local sans transférer leurs données vers des serveurs américains, une avancée directement pertinente pour la conformité RGPD.

💬 C'est le genre de modèle qu'on attendait : multimodal, 16 Go de RAM, dispo sur Ollama maintenant. L'audio natif sans encodeur séparé, c'est la vraie nouveauté technique, et ça change quelque chose pour qui veut traiter de la voix en local sans envoyer ses données quelque part. Reste à voir si les perfs tiennent dans les vrais usages, mais j'ai déjà lancé le pull.

LLMsOpinion
1 source
OpenAI transforme Codex en assistant IA pour les employés de bureau
209Le Big Data 

OpenAI transforme Codex en assistant IA pour les employés de bureau

OpenAI a annoncé le 2 juin 2026 une refonte majeure de Codex, son assistant IA jusqu'ici centré sur le développement logiciel, pour l'étendre aux métiers de bureau. La plateforme comptabilise désormais plus de 5 millions d'utilisateurs actifs hebdomadaires, soit six fois plus qu'en février lors du lancement de son application desktop. Si les développeurs restent majoritaires, les travailleurs du savoir représentent déjà près de 20 % de la base d'utilisateurs et affichent une croissance trois fois plus rapide. OpenAI introduit six modules métier spécialisés couvrant l'analyse de données, la création de contenu, la vente, le design produit, l'investissement en actions et la banque d'investissement. Une fonctionnalité baptisée Sites permet désormais de publier les résultats générés sous forme de sites web interactifs hébergés dans le cloud, en s'appuyant sur des partenaires comme Wix, Replit, Figma et Lovable. Des annotations contextuelles permettent aussi aux utilisateurs de cibler précisément une zone d'un document pour des commandes plus précises. Ces évolutions traduisent une bascule stratégique pour OpenAI : ne plus se limiter à l'outillage des développeurs, mais s'imposer comme fournisseur d'infrastructure IA pour l'ensemble des fonctions d'une entreprise. En intégrant directement des logiques opérationnelles métier dans Codex, OpenAI cherche à réduire la friction d'adoption pour des profils non techniques, rendant l'outil exploitable sans configuration avancée. L'enjeu est considérable : si les travailleurs du savoir maintiennent leur rythme de croissance, ils pourraient représenter la majorité des utilisateurs dans moins d'un an, transformant Codex en plateforme de productivité de masse plutôt qu'en simple assistant de programmation. Cette offensive sur le marché entreprise s'inscrit dans un contexte de compétition accrue. Anthropic multiplie depuis plusieurs mois les agents IA spécialisés pour les organisations, tandis que Microsoft intègre Copilot dans toute sa suite Office. OpenAI capitalise ici sur sa base grand public pour accélérer l'adoption professionnelle, une approche bottom-up qui contraste avec les déploiements top-down habituels du secteur B2B. Trois semaines avant cette annonce, la société avait lancé OpenAI Deployment Company, une coentreprise dédiée aux clients entreprises adossée à plus de 4 milliards de dollars. La convergence de ces deux initiatives dessine une ambition claire : faire de Codex le système d'exploitation IA des entreprises, en rivalisant directement avec Salesforce, ServiceNow et les suites Microsoft 365 sur leur propre terrain.

UEL'expansion de Codex aux métiers de bureau intensifie la concurrence sur le marché européen des outils de productivité IA, où les entreprises françaises devront arbitrer entre cette plateforme et les suites déjà déployées comme Microsoft 365 Copilot.

💬 Codex qui lâche les développeurs pour aller chercher les commerciaux et les banquiers d'investissement, c'est un pivot net. La vraie lecture c'est qu'OpenAI veut rejouer le coup de Salesforce sur son propre terrain, avec une base de 5 millions d'utilisateurs déjà acquis et une approche bottom-up qui court-circuite les cycles de vente à 18 mois. Reste à voir si les modules métier tiennent en prod.

OutilsOutil
1 source
Les workflows IA de Walmart face aux réalités du bilan financier
210AI News 

Les workflows IA de Walmart face aux réalités du bilan financier

Walmart a discrètement mis fin à l'accès illimité de ses 2,1 millions d'employés à Code Puppy, son assistant interne propulsé par un grand modèle de langage. Jusqu'ici encouragés à utiliser l'outil sans restriction pour des tâches comme l'analyse de feuilles de calcul, la création de présentations ou d'autres activités bureautiques automatisables, les salariés se voient désormais attribuer un quota fixe de tokens, l'unité de mesure qui détermine combien ils peuvent solliciter le modèle. Ce changement de politique, intervenu courant 2026, est une mesure de contrôle des coûts directement liée à la transition du secteur vers une facturation à l'usage, abandonnant le modèle d'abonnement à prix fixe qui offrait un accès quasi illimité à l'inférence LLM. Ce virage illustre une tension croissante au sein des grandes entreprises entre les gains de productivité annoncés et le coût réel pour les obtenir. À l'échelle de Walmart, même une utilisation modeste par employé génère des dépenses considérables, d'autant que certains comportements amplifient la facture : le phénomène dit du "token maxxing", encouragé jusqu'en avril dernier par un associé de Sequoia Capital dans le Wall Street Journal, a poussé des salariés à multiplier les requêtes complexes pour performer sur des tableaux de bord internes célébrant les meilleurs utilisateurs d'IA. Les modèles de raisonnement récursif ("thinking models"), plus coûteux car ils consomment davantage de tokens pour traiter les entrées de manière introspective, aggravent encore la note. Les workflows multi-agents, où des boucles itératives entre plusieurs agents sont relancées pour affiner un résultat, deviennent eux aussi mesurables en argent sonnant et trébuchant. Walmart n'est pas seul dans cette situation. Uber a révélé avoir consommé en quatre mois son budget IA prévu pour toute l'année 2026, signe que la nouvelle structure tarifaire des fournisseurs bouleverse les prévisions des entreprises utilisatrices. Anthropic et OpenAI ont déjà basculé leurs plans entreprise haut de gamme vers une facturation à l'usage, et Microsoft a commencé à facturer GitHub Copilot au 1er juin. En imposant des limites de tokens par employé, en publiant des guides sur le choix du bon outil selon la tâche, et en réservant les modèles frontière aux cas d'usage qui le justifient vraiment, Walmart cherche à poser les bases d'un vrai calcul de retour sur investissement, une étape que beaucoup d'entreprises ayant déployé l'IA à grande échelle n'ont pas encore franchie.

UELa bascule vers la facturation à l'usage d'Anthropic, OpenAI et Microsoft/GitHub Copilot (au 1er juin) s'applique également aux entreprises européennes, qui devront revoir leurs budgets IA et instaurer des politiques de gouvernance des tokens sous peine de dépassements comparables à ceux de Walmart et Uber.

💬 Le modèle "abonnement flat, ROI on verra plus tard" est mort. Walmart rationne ses 2 millions d'employés au token, Uber a cramé son budget annuel en quatre mois, et Microsoft facture Copilot au 1er juin, le tout en l'espace de quelques semaines. Les boîtes qui ont déployé large sans jamais faire le calcul vont avoir une conversation difficile cet été.

BusinessOpinion
1 source
Trump veut (enfin) réguler l’IA… mais seulement si les géants de la tech veulent bien
211Le Big Data 

Trump veut (enfin) réguler l’IA… mais seulement si les géants de la tech veulent bien

Donald Trump a signé mardi un décret autorisant les entreprises d'intelligence artificielle à partager leurs modèles les plus avancés avec le gouvernement fédéral avant leur lancement public. La mesure phare du texte fixe une fenêtre maximale de 30 jours de partage volontaire avant mise à disposition du public, une version allégée par rapport au projet initial, qui prévoyait entre 14 et 90 jours. Plusieurs agences fédérales devront en parallèle développer un système d'évaluation des capacités cybernétiques avancées de ces modèles. Les entreprises participantes bénéficieront de certaines protections en matière de confidentialité, mais leur participation reste entièrement facultative. Le décret prévoit également un renforcement des défenses fédérales face aux menaces liées à l'IA, notamment pour les infrastructures critiques. Ce texte marque un tournant notable dans la posture de l'administration Trump, jusqu'ici farouchement opposée à toute forme de régulation de l'IA au nom de la compétitivité américaine face à la Chine. Trump avait d'ailleurs repoussé la signature d'une première version du décret, craignant qu'elle ne bride l'innovation nationale. La version adoptée reçoit le soutien d'organisations spécialisées dans la sécurité de l'IA : Brad Carson, président d'Americans for Responsible Innovation, y voit la preuve que la Maison-Blanche prend désormais ces risques au sérieux, tandis que Brendan Steinhauser, dirigeant d'Alliance for Secure AI, appelle le Congrès à transformer ces mesures volontaires en obligations légales, ce que le décret lui-même exclut explicitement. Ce changement de cap s'inscrit dans un contexte de prise de conscience progressive des risques que font peser les modèles de frontier sur la sécurité nationale. Un élément concret a pu peser dans la balance : en avril, Anthropic a déployé de manière limitée son modèle Mythos, qui aurait permis d'identifier des milliers de vulnérabilités critiques dans les principaux systèmes d'exploitation et navigateurs web. Par ailleurs, Google, Microsoft et xAI ont déjà accepté le mois dernier de soumettre leurs modèles à l'examen du Centre pour les normes et l'innovation en IA (CAISI), rattaché au département du Commerce. OpenAI et Anthropic avaient pris un engagement similaire dès 2024, sous l'administration Biden. Le vrai test de ce décret sera donc la prochaine saison de lancements majeurs : sans obligation légale, tout repose sur la bonne volonté d'acteurs dont les intérêts commerciaux restent la priorité.

UELe décret américain, entièrement fondé sur le volontariat, contraste avec l'approche contraignante de l'AI Act européen et pourrait peser sur les discussions de convergence réglementaire transatlantique.

RégulationReglementation
1 source
Alphabet prépare un financement géant de 80 milliards de dollars pour l’IA
212Le Big Data 

Alphabet prépare un financement géant de 80 milliards de dollars pour l’IA

Alphabet, la maison mère de Google, a annoncé son intention de lever jusqu'à 80 milliards de dollars pour financer l'expansion de ses infrastructures d'intelligence artificielle. L'opération passe notamment par une émission d'actions en bourse, ainsi qu'une vente privée de 10 milliards de dollars d'actions à Berkshire Hathaway, le conglomérat de Warren Buffett. Cette levée vise à financer la construction et l'extension de centres de données, l'acquisition de processeurs spécialisés et le renforcement des réseaux cloud à l'échelle mondiale. Sundar Pichai, PDG d'Alphabet, avait déjà signalé lors de la conférence Google I/O 2026 que le groupe prévoyait d'investir entre 180 et 190 milliards de dollars d'ici la fin de l'année pour soutenir l'ensemble de ses infrastructures technologiques et ses services IA. L'entreprise justifie cette opération par une demande qui dépasse ses capacités actuelles, aussi bien auprès des entreprises que du grand public. L'entrée de Berkshire Hathaway dans ce tour de table n'est pas anodine : elle signale que des investisseurs historiquement très prudents considèrent désormais les infrastructures IA comme un placement stratégique de premier ordre. Pour les entreprises clientes, les conséquences sont directes : les fournisseurs cloud capables de financer ces infrastructures massives disposeront d'un avantage concurrentiel déterminant sur les prix, les performances et la disponibilité des services. Alphabet doit à la fois soutenir l'intégration de l'IA dans ses produits existants, Search, Workspace, Android, Gemini, et répondre à la montée en puissance de concurrents comme OpenAI, Microsoft et Amazon, qui investissent eux aussi à des niveaux sans précédent dans la puissance de calcul. Cette opération s'inscrit dans une course industrielle mondiale dont l'ampleur était encore impensable il y a trois ans. Selon Bloomberg, les grands groupes technologiques pourraient investir collectivement jusqu'à 700 milliards de dollars cette année dans l'IA. L'entraînement et l'inférence des grands modèles de langage exigent des infrastructures toujours plus coûteuses, transformant la puissance de calcul en principal facteur de différenciation entre acteurs. Pendant des années, les dépenses cloud des hyperscalers se comptaient en dizaines de milliards ; l'IA générative a changé d'échelle. Alphabet présente cette levée comme une approche équilibrée pour financer sa croissance sans fragiliser son bilan, mais le message de fond est clair : dans la bataille pour l'IA, les capacités d'investissement détermineront qui fixe les règles du jeu pour la décennie à venir.

UELes entreprises européennes clientes du cloud Google pourraient bénéficier d'une meilleure disponibilité et de tarifs plus compétitifs, mais cette concentration des investissements accentue la dépendance technologique de l'Europe envers les hyperscalers américains.

💬 Buffett qui entre dans le tour de table, c'est le truc que tu peux montrer à n'importe quel CFO sceptique. Pas de la spéculation, un vrai calcul de rentabilité sur des datacenters à 20 ans, et ça, ça veut dire que l'argent conservateur considère l'infra IA comme de l'immobilier. À 700 milliards d'investissement collectif cette année, la bataille n'est plus sur les modèles, c'est une guerre de silicium et d'électricité.

BusinessOpinion
1 source
Dès le premier jour, la facture à l’usage de GitHub Copilot interroge les devs
213Next INpact 

Dès le premier jour, la facture à l’usage de GitHub Copilot interroge les devs

Le 1er juin 2026, GitHub a basculé son service Copilot vers un système de facturation entièrement basé sur l'usage réel, mettant fin à l'accès illimité aux modèles moins puissants dont bénéficiaient jusqu'alors les abonnés. Désormais, chaque formule est assortie d'une enveloppe de "crédits IA" qui se consomme proportionnellement au modèle choisi et au volume de tokens traités, quelle que soit la puissance du modèle. Les retours des premiers utilisateurs sont sans appel : un développeur abonné à Copilot Pro+ à 39 dollars par mois a épuisé 8 % de ses crédits mensuels en deux heures de travail ; un autre a vu sa première requête du jour engloutir 18 % de son quota, pour une tâche de découpe d'un fichier JavaScript de 1 500 lignes. Un troisième signale avoir dépensé 270 tokens, soit 18 % de sa limite Pro, pour remplacer un simple code de vérification par e-mail par un lien de réinitialisation direct. Ce changement représente un véritable choc psychologique et économique pour une large frange de développeurs professionnels. L'ancien modèle garantissait une prévisibilité budgétaire : l'abonnement mensuel couvrait un usage quotidien intensif sur les modèles standards. La nouvelle mécanique introduit une dimension d'anxiété permanente, chaque interaction devenant une dépense à surveiller. Plusieurs utilisateurs évoquent une dégradation directe de leur productivité : la crainte de "brûler" ses crédits pousse à s'autocensurer sur des requêtes complexes, ce qui contredit l'intérêt même de l'outil. Sur Reddit et sur le forum officiel de GitHub, les témoignages d'abonnés estimant le rythme de consommation "insoutenable" se multiplient, bien que certains nuancent en soulignant que les cas extrêmes correspondent souvent à des sessions particulièrement intensives. Ce pivot tarifaire s'inscrit dans une tendance plus large du secteur, où les éditeurs cherchent à aligner leurs revenus sur la consommation réelle de ressources LLM, dont les coûts d'inférence varient considérablement selon les modèles. Microsoft avait annoncé la transition fin avril, laissant un mois aux utilisateurs pour s'y préparer, mais la réalité du terrain révèle un écart important entre les estimations théoriques et l'usage effectif. La disponibilité de modèles très puissants comme Opus 4.8 ou GPT-5.5 directement dans l'interface amplifie le phénomène : des développeurs optent pour ces modèles par défaut sans mesurer l'impact sur leurs crédits. La pression des utilisateurs pourrait contraindre GitHub à ajuster ses paliers tarifaires ou à introduire des alertes de consommation, mais pour l'instant, le service reste tel quel au lendemain du basculement.

UELes développeurs français et européens abonnés à GitHub Copilot doivent revoir leur usage et leur budget face à ce nouveau modèle de crédits, qui réduit la prévisibilité des coûts pour un outil central dans de nombreuses équipes tech.

💬 Honnêtement, c'est plus intéressant que ça en a l'air. Mais bon, sur le papier... GitHub Copilot, c'est bien beau l'IA qui code pour toi, mais voilà qu'ils passent à une facturation basée sur l'usage réel. Tu fais deux heures de boulot et hop, 8% de ton quota, tu te retrouves à compter les tokens comme un fou. C'est le genre de truc qu'on attendait depuis 2 ans, mais maintenant c'est là, et ça fait mal. La peur de "brûler" ses crédits, ça vous cloue au sol, tu te censures sur les requêtes complexes, c'est pas le but d'un outil comme Copilot. Les utilisateurs sont en train de dire que le rythme de consommation est insoutenable, et je comprends pourquoi. Microsoft a annoncé la transition, mais entre les estimations théoriques et l'usage réel, il y a un fossé énorme. Les développeurs se jettent sur les modèles puissants comme Opus ou GPT sans vraiment se poser la question de l'impact sur leur budget. GitHub va-t-il ajuster ses tarifs ou introduire des alertes ? À voir, mais pour l'instant, c'est un nouveau stress pour les dévs français et européens qui comptent sur Copilot.

☕️ Alphabet veut lever 80 milliards : l’IA se finance à crédit même quand on s’appelle Google
214Next INpact 

☕️ Alphabet veut lever 80 milliards : l’IA se finance à crédit même quand on s’appelle Google

Alphabet, la maison mère de Google, a annoncé lundi 1er juin une levée de fonds de 80 milliards de dollars structurée en trois tranches distinctes. La première porte sur 30 milliards de dollars sous forme d'obligations convertibles en actions, la deuxième sur 40 milliards d'actions émises au prix du marché à partir du troisième trimestre 2026, et la troisième sur un placement privé de 10 milliards de dollars souscrit par Berkshire Hathaway, le conglomérat financier longtemps dirigé par Warren Buffett. Cette opération vise à financer l'expansion des infrastructures d'intelligence artificielle générative du groupe, dont le budget d'investissement est estimé entre 180 et 190 milliards de dollars pour la seule année 2026. Google précise par ailleurs avoir déjà contracté 85 milliards de dollars de dette bancaire en 2025, portant son encours total à plus de 100 milliards de dollars. Ce choix de recourir aux marchés financiers interpelle pour une entreprise valorisée 4 500 milliards de dollars en bourse et ayant généré 174 milliards de dollars de cash flow opérationnel en 2025. Mais la logique est industrielle : déployer un tel volume de capitaux sur ses seuls fonds propres fragiliserait la flexibilité financière du groupe et pèserait sur son bilan. En maintenant un endettement maîtrisé et en diluant légèrement ses actionnaires, Alphabet préserve sa capacité de manœuvre pour d'éventuelles acquisitions ou retournements de conjoncture. L'opération témoigne surtout de l'ampleur des investissements que requiert la course aux datacenters : même les géants les mieux capitalisés du secteur ne peuvent plus financer leur transformation IA sur leurs seules liquidités. Cette levée de fonds s'inscrit dans une dynamique sectorielle qui dépasse largement Google. Microsoft, Amazon et Meta multiplient eux aussi les montages financiers complexes pour accélérer leurs infrastructures, tandis qu'OpenAI, xAI et Anthropic lèvent des dizaines de milliards auprès d'investisseurs institutionnels et souverains. L'entrée de Berkshire Hathaway au capital d'Alphabet, même symbolique, marque une validation forte de la thèse IA par les investisseurs traditionnels les plus conservateurs. Côté fondamentaux, Google affiche une croissance de son chiffre d'affaires de 63 % en glissement annuel au premier trimestre 2026, avec un carnet de commandes ayant quasiment doublé en un trimestre pour dépasser 460 milliards de dollars, dont la moitié devrait être convertie en revenus dans les 24 prochains mois. L'IA est désormais moins un pari qu'une machine à commandes, mais une machine dont le coût d'alimentation oblige même les plus riches à emprunter.

UEL'écart croissant entre les capacités d'investissement dans les infrastructures IA américaines et européennes fragilise durablement la compétitivité du secteur technologique européen.

💬 Quand la boîte la mieux capitalisée du monde doit quand même aller sur les marchés, ça remet les chiffres à l'échelle : même 174 milliards de cash flow annuel ne tiennent plus le rythme des datacenters IA. L'entrée de Berkshire dans la danse, c'est la signature des derniers sceptiques institutionnels. Pour les acteurs européens qui regardent ça de loin, c'est le genre de chiffres qui fait mal à lire.

Les utilisateurs de GitHub Copilot réagissent au nouveau système de tarification à l'usage
215Ars Technica AI 

Les utilisateurs de GitHub Copilot réagissent au nouveau système de tarification à l'usage

GitHub a officiellement basculé ses abonnés Copilot vers un nouveau modèle de facturation à l'usage, après l'annonce faite en avril. Ce changement, entré en vigueur ce mois-ci, remplace l'ancien système de "requêtes" et de "requêtes premium" allouées selon le tier d'abonnement. Résultat : des milliers d'utilisateurs découvrent avec stupeur que leur usage habituel de l'outil IA épuise leur quota mensuel en quelques heures à peine. Sur les réseaux sociaux et les forums, des développeurs partagent leurs statistiques personnelles montrant que quelques heures d'utilisation intensive peuvent suffire à consommer l'essentiel de leur crédit mensuel. Certains rapportent avoir vidé leur quota en moins d'une journée. L'impact est particulièrement brutal pour les développeurs qui utilisaient Copilot de manière intensive, notamment pour les sessions de codage autonome longues durée. GitHub justifie ce changement en expliquant que l'ancien système créait une inégalité flagrante : une simple question en chat et une session de plusieurs heures coûtaient la même chose à l'utilisateur, obligeant GitHub à absorber silencieusement des coûts d'inférence en forte hausse. Des estimations produites par l'outil de calcul officiel de GitHub montrent que l'usage mensuel standard de certains abonnés aurait généré des factures de plusieurs milliers de dollars sous le nouveau régime tarifaire. Ce tournant illustre une tension structurelle qui s'intensifie dans tout le secteur : les éditeurs d'outils IA ont longtemps proposé des tarifs forfaitaires pour attirer les utilisateurs, mais la montée en puissance des modèles et la hausse des coûts de calcul rendent ce modèle économiquement intenable. GitHub, propriété de Microsoft, suit ainsi une tendance observable chez d'autres acteurs comme Cursor ou Windsurf, qui ont également ajusté leurs politiques tarifaires face à l'explosion des coûts d'inférence liés aux agents IA autonomes. La transition vers la facturation à l'usage pourrait redéfinir durablement la façon dont les développeurs calibrent leur utilisation des assistants de code, et forcer un arbitrage plus conscient entre productivité et coût.

UELes développeurs européens utilisant GitHub Copilot sont directement concernés par ce changement tarifaire et doivent réévaluer leurs habitudes d'utilisation ou arbitrer entre productivité et coût mensuel.

OutilsOutil
1 source
Anthropic ouvre Mythos à l’Europe : l’ENISA rejoint un club ultra-select
216Le Big Data 

Anthropic ouvre Mythos à l’Europe : l’ENISA rejoint un club ultra-select

Anthropic est en négociations avec l'Agence de l'Union européenne pour la cybersécurité (ENISA) pour lui accorder un accès à Mythos, son modèle d'intelligence artificielle spécialisé dans la cybersécurité. Selon le Financial Times, des représentants européens se sont récemment déplacés à San Francisco pour rencontrer Anthropic et discuter des modalités d'un éventuel accès au programme. Un porte-parole de l'ENISA a confirmé que des discussions étaient en cours, tout en précisant que rien n'était encore signé. Si elles aboutissent, ce serait la première extension significative de Mythos hors des États-Unis et du Royaume-Uni, seul pays non américain à avoir obtenu un accès officiel à ce jour. La Commission européenne semble également impliquée dans les échanges. Ces discussions s'inscrivent dans le cadre du projet Glasswing, une coalition lancée par Anthropic en avril 2026, regroupant principalement des entreprises américaines comme Microsoft, Apple, JPMorgan et CrowdStrike, qui utilisent Mythos pour détecter des failles de sécurité et renforcer leurs défenses numériques. L'enjeu est considérable pour l'Union européenne. Obtenir un accès à Mythos permettrait à l'ENISA de disposer d'un outil de pointe pour anticiper des menaces cyber émergentes et mieux évaluer les risques posés par les systèmes d'IA les plus avancés, une priorité affichée par les responsables européens. Pour les institutions de l'UE, c'est aussi une question de souveraineté numérique et d'influence technologique : rester en dehors du cercle Mythos signifierait laisser aux seules organisations anglo-saxonnes l'accès à une capacité défensive de premier plan dans un domaine où les cyberattaques gagnent chaque année en sophistication. La prudence d'Anthropic à l'égard de ce modèle s'explique précisément par ses capacités avancées : l'entreprise craint qu'un outil aussi puissant ne puisse être détourné à des fins offensives, ce qui justifie une sélection rigoureuse des partenaires. Depuis son lancement, Mythos est resté l'un des modèles d'IA les plus confidentiels du secteur, réservé à une poignée d'organisations jugées stratégiques et soumis à une évaluation préalable par des agences gouvernementales américaines. Cette rareté calculée reflète une stratégie délibérée d'Anthropic, qui entend peser sur les politiques de cybersécurité tout en contrôlant étroitement la diffusion d'une technologie à double usage. L'ouverture potentielle vers l'Europe intervient dans un contexte de rivalité technologique croissante entre les États-Unis et l'UE, cette dernière cherchant à ne pas dépendre exclusivement d'acteurs américains pour sa sécurité numérique. Si l'accord se concrétise, il pourrait ouvrir la voie à d'autres partenariats institutionnels européens et redéfinir les contours de la coopération transatlantique en matière d'IA appliquée à la cybersécurité.

UEL'ENISA pourrait obtenir un accès au modèle Mythos d'Anthropic, ce qui renforcerait les capacités défensives de l'UE face aux cybermenaces et réduirait sa dépendance envers les seuls acteurs anglo-saxons pour sa sécurité numérique.

SécuritéOpinion
1 source
Comment Nvidia veut s’emparer du « cerveau » de nos ordinateurs personnels
217La Tribune 

Comment Nvidia veut s’emparer du « cerveau » de nos ordinateurs personnels

Au salon Computex de Taipei, fin mai 2026, Nvidia a présenté RTX Spark, sa première gamme de processeurs conçus pour équiper ordinateurs de bureau et ordinateurs portables sous Windows. Il s'agit d'une rupture nette dans la stratégie du fabricant californien, jusqu'ici centré sur les GPU dédiés : avec RTX Spark, Nvidia s'attaque au marché des processeurs centraux, territoire dominé depuis des décennies par Intel et AMD. La gamme intègre directement des capacités de traitement d'IA au cœur des machines grand public, sans nécessiter de carte graphique additionnelle. L'enjeu est considérable pour l'ensemble de l'industrie PC. En embarquant la puissance de calcul IA dans le processeur principal, Nvidia permet aux fabricants de proposer des machines plus compactes, moins gourmandes en énergie et capables d'exécuter des modèles de langage ou des outils d'IA générative en local, sans dépendre du cloud. Pour les professionnels et les utilisateurs exigeants, cela signifie des traitements plus rapides, plus privés et moins coûteux à long terme. Cette offensive s'inscrit dans une tendance de fond : la bataille pour le contrôle de l'IA dite « edge », c'est-à-dire déployée directement sur l'appareil de l'utilisateur plutôt que sur des serveurs distants. Microsoft pousse activement les PC Copilot+, Qualcomm a pris de l'avance avec ses puces ARM dédiées à l'IA, et Apple intègre depuis plusieurs années ses Neural Engine dans ses Mac. Nvidia, fort de sa domination sur les GPU de data centers, cherche désormais à reproduire ce leadership jusqu'au poste de travail individuel, transformant la définition même de ce qu'est un ordinateur personnel.

UEL'intégration de l'IA directement dans les processeurs grand public pourrait permettre aux entreprises et particuliers européens d'exécuter des modèles d'IA en local, réduisant la dépendance aux clouds américains et facilitant la conformité au RGPD.

💬 Nvidia arrive en retard sur l'IA edge, Qualcomm et Apple ont plusieurs longueurs d'avance depuis 2023. Mais intégrer l'IA dans le processeur principal plutôt que dans une carte graphique séparée à 800€, ça change le calcul pour tous les fabricants PC qui hésitaient à embarquer de l'IA locale. Sur le papier c'est solide, reste à voir ce que ça donne face aux puces ARM de Qualcomm en conditions réelles.

InfrastructureOpinion
1 source
L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA
218NVIDIA AI Blog 

L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA

NVIDIA accélère la construction d'une infrastructure mondiale d'« usines à IA », en s'appuyant sur un écosystème croissant de partenaires cloud. Jensen Huang, fondateur et PDG de NVIDIA, a annoncé lors d'une communication officielle que cet écosystème couvre désormais six continents, avec l'arrivée de deux nouveaux partenaires : Cassava en Afrique et Claro en Amérique du Sud. Des acteurs comme CoreWeave, Firmus, IREN et Nscale élargissent leurs capacités pour répondre à la demande des laboratoires d'IA, des entreprises et des gouvernements. En Australie, Firmus Technologies déploie son « Project Southgate », un programme de data centers en Tasmanie, Melbourne, Australie-du-Sud et Nouvelle-Galles du Sud, en privilégiant les énergies renouvelables et les infrastructures modulaires. La société a également ouvert des installations à Singapour en partenariat avec ST Telemedia Global Data Centres. Cet élargissement répond à une explosion de la demande en tokens, l'unité de traitement des modèles de langage, portée par les applications d'IA agentique, les copilotes d'entreprise et les modèles frontières. Pour les nations et industries réglementées, ces clouds régionaux permettent de respecter des exigences de souveraineté numérique et de conformité locale, sans dépendre d'infrastructures centralisées aux États-Unis. Pour les développeurs et startups, ils réduisent la latence et simplifient l'accès aux GPU NVIDIA, combinés aux logiciels d'IA et aux réseaux haute performance de la marque. L'argument économique mis en avant par NVIDIA est le coût par token et le débit par watt, deux métriques déterminantes pour qui exploite des modèles d'IA en production à grande échelle. Cette expansion s'inscrit dans une stratégie plus large de NVIDIA pour s'imposer non plus seulement comme fabricant de puces, mais comme architecte de l'ensemble de la chaîne d'infrastructure IA, du silicium aux logiciels en passant par le cloud. Face à la montée en puissance de concurrents comme AMD et aux investissements massifs des hyperscalers (Google, Microsoft, Amazon) dans leurs propres puces, NVIDIA cherche à verrouiller l'écosystème via des partenariats cloud qui intègrent sa pile technologique complète. Des partenaires comme GMI Cloud, Naver Cloud, Indosat Ooredoo Hutchison ou YTL ancrent cette stratégie dans des marchés à forte croissance : Asie du Sud-Est, Moyen-Orient, Afrique. La prochaine étape sera d'observer si ces capacités régionales parviennent à absorber la demande des grands modèles frontières, dont les coûts d'entraînement continuent de croître exponentiellement.

UELes clouds régionaux NVIDIA permettent aux entreprises et industries réglementées européennes de répondre aux exigences de souveraineté numérique sans dépendre d'infrastructures centralisées aux États-Unis.

InfrastructureActu
1 source
NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark
219NVIDIA AI Blog 

NVIDIA améliore les agents IA locaux sur ses PC RTX et DGX Spark

NVIDIA a profité du salon Computex Taipei, lors de sa conférence GTC dédiée, pour annoncer une nouvelle gamme de PC Windows baptisée RTX Spark, spécialement conçue pour faire tourner des agents d'intelligence artificielle en local. Ces machines embarquent 1 pétaflop de puissance de calcul IA et 128 Go de mémoire unifiée, ce qui leur permet de gérer des agents autonomes directement sur l'appareil, sans passer par le cloud. NVIDIA a également présenté la DGX Station pour Windows, un supercalculateur de bureau destiné aux professionnels, intégrant un GPU et un CPU de niveau datacenter dans un format compact. S'ajoutent à ces annonces : le runtime NVIDIA OpenShell pour Windows, le blueprint NemoClaw étendu à toute la gamme RTX et DGX, des gains de performance d'inférence multipliés par deux sur les modèles agentiques via la prédiction multi-token dans llama.cpp et vLLM, ainsi que des outils d'utilisation informatique développés par H Company pour les PC RTX et DGX. Des partenaires comme Adobe, Blender et ComfyUI intègrent également de nouvelles capacités graphiques propulsées par NVIDIA. L'ensemble de ces mises à jour est prévu pour l'automne 2025. Ces annonces marquent un tournant dans la démocratisation des agents IA personnels, jusqu'ici freinée par l'impossibilité de les exécuter de façon sécurisée et privée sur des machines grand public. Avec RTX Spark, NVIDIA veut transformer le PC de l'utilisateur en un véritable assistant autonome capable d'automatiser des tâches complexes, de raisonner sur des flux de travail multi-applications, de générer des contenus visuels et de rechercher sémantiquement dans des fichiers locaux, le tout sans envoyer de données sensibles vers des serveurs distants. Le runtime OpenShell, développé en partenariat avec Microsoft, introduit une couche de sécurité permettant à l'utilisateur de définir précisément ce que les agents peuvent ou ne peuvent pas faire, et de masquer les informations personnelles dans les requêtes envoyées vers des modèles cloud. Ce niveau de contrôle répond à une demande forte des utilisateurs professionnels et des développeurs qui hésitaient à déployer ces technologies faute de garanties suffisantes. L'engouement pour les agents IA en local s'est surtout manifesté jusqu'ici dans les communautés open source : des projets comme OpenClaw et Hermes Agent connaissent une adoption rapide sur GitHub, preuve d'un intérêt technique réel mais encore circonscrit aux initiés. NVIDIA s'appuie sur ce momentum pour structurer un écosystème plus large, en intégrant ces outils dans ses nouvelles primitives de sécurité Windows et en les distribuant via des installateurs simplifiés sur toute sa gamme de matériel. La collaboration avec Microsoft est centrale : les nouvelles primitives de sécurité Windows apportent identité, confinement et politique d'accès pour les agents natifs, tandis qu'NVIDIA comble les lacunes côté performance et confidentialité. Face à l'essor des solutions cloud d'OpenAI, Google ou Anthropic, NVIDIA joue clairement la carte de la souveraineté locale comme différenciateur, en pariant que la prochaine vague d'adoption des agents passera par des appareils personnels puissants et de confiance.

UEH Company, startup française spécialisée en agents IA, voit ses outils d'utilisation informatique intégrés nativement dans l'écosystème NVIDIA RTX et DGX, lui offrant une distribution mondiale sur du matériel grand public.

💬 NVIDIA joue la carte de la souveraineté locale contre le cloud, et c'est plus malin qu'il n'y paraît. OpenShell avec ses politiques d'accès par agent, c'est la réponse à la vraie question des pros : pas la performance, le contrôle. Et H Company en intégration native sur toute la gamme RTX, c'est le genre de deal qui change la trajectoire d'une startup.

ANTHROPIC ne lève plus du capital, elle achète désormais des gigawatts
220FrenchWeb 

ANTHROPIC ne lève plus du capital, elle achète désormais des gigawatts

Anthropic a annoncé une levée de fonds de 65 milliards de dollars, portant sa valorisation à 965 milliards de dollars, ce qui en fait l'une des entreprises privées les mieux valorisées au monde. L'opération, bouclée hier, dépasse de loin les précédents tours de table de la startup fondée par Dario et Daniela Amodei en 2021. Les marchés maintiennent donc leur appétit pour les grands acteurs de l'intelligence artificielle générative, malgré des incertitudes persistantes sur les modèles économiques à grande échelle. Mais le vrai message de ce financement record n'est pas financier : il est énergétique. Anthropic signale que le principal goulot d'étranglement pour les modèles frontière n'est plus l'accès aux capitaux, mais l'accès à la puissance électrique. Entraîner et faire tourner des modèles comme Claude exige désormais des gigawatts de capacité, un niveau de consommation qui transforme les datacenters en infrastructures critiques comparables à des usines ou des centrales. Pour les utilisateurs et les entreprises clientes, cela signifie que la disponibilité et le coût des services IA dépendent autant de la politique énergétique que de l'ingénierie logicielle. Cette dynamique s'inscrit dans une course engagée par l'ensemble du secteur : OpenAI, Google et Microsoft investissent massivement dans des infrastructures de calcul propriétaires et des partenariats énergétiques directs avec des producteurs nucléaires ou renouvelables. Anthropic, longtemps positionnée sur la sécurité et la recherche fondamentale, entre désormais dans cette compétition industrielle à part entière, où la puissance disponible en kilowattheures pourrait bientôt déterminer qui domine l'IA autant que la qualité des modèles.

UEL'explosion des besoins en électricité pour les modèles frontier renforce l'urgence pour l'Europe de développer ses propres infrastructures de calcul souveraines, sous peine d'une dépendance accrue envers des acteurs extra-européens pour l'accès à l'IA de pointe.

💬 965 milliards de valorisation, c'est presque anecdotique à côté du vrai sujet : Anthropic te dit que le prochain avantage concurrentiel en IA, c'est l'accès aux mégawatts, pas aux meilleurs ingénieurs. Le modèle économique de l'IA frontier ressemble de plus en plus à celui d'un électricien industriel. Pour l'Europe, ça devrait faire froid dans le dos.

BusinessOpinion
1 source
George Hotz : les agents de codage seront "l'une des erreurs les plus coûteuses" du développement logiciel
221The Decoder 

George Hotz : les agents de codage seront "l'une des erreurs les plus coûteuses" du développement logiciel

George Hotz, programmeur célèbre pour avoir cracké l'iPhone à 17 ans et fondateur de comma.ai, estime que les agents de codage IA seront "l'une des erreurs les plus coûteuses" de l'histoire du développement logiciel. Après six mois de tests intensifs avec différents outils basés sur des LLMs, son verdict est sévère : ces systèmes produisent des prototypes rapidement, mais s'effondrent dès qu'il s'agit de gérer les détails, introduisant des bugs de plus en plus difficiles à détecter et à corriger. Le danger pointé par Hotz est précis : les erreurs générées par les agents IA ne sont pas évidentes à repérer. Contrairement à un bug classique qui plante un programme, les défauts introduits par ces outils peuvent rester dormants, s'accumuler silencieusement et créer une dette technique invisible. Pour les équipes qui font confiance à ces agents sur des bases de code complexes, le coût de correction pourrait dépasser largement les gains de productivité initiaux. Cette mise en garde illustre une fracture profonde au sein de la communauté IA. D'un côté, des entreprises comme GitHub (Copilot), Cursor ou Cognition défendent l'automatisation agressive du code et affichent des métriques de productivité spectaculaires. De l'autre, des ingénieurs expérimentés comme Hotz alertent sur les limites fondamentales des LLMs face à la rigueur que requiert l'ingénierie logicielle à grande échelle. Le débat est loin d'être tranché, et les prochains mois diront si la réalité des projets en production confirme l'optimisme des uns ou les craintes des autres.

OutilsOpinion
1 source
Pourquoi ne pas laisser la sélection du modèle par défaut dans Copilot, Gemini et autres outils IA
222The Decoder 

Pourquoi ne pas laisser la sélection du modèle par défaut dans Copilot, Gemini et autres outils IA

Le mathématicien Adam Kucharski a mis en évidence une faille frappante dans Microsoft Copilot : lorsqu'il a soumis à l'outil des jeux de données strictement identiques en changeant uniquement les étiquettes de pays, Copilot a produit des analyses détaillées faisant état de différences nationales qui n'existaient tout simplement pas. Au lieu de détecter l'absence de variation dans les chiffres, le modèle par défaut a généré des stéréotypes circonstanciés, présentant des résultats fabriqués comme s'ils étaient fondés sur les données réelles. Cette expérience, reproductible avec d'autres plateformes comme Gemini, révèle un angle mort systématique dans les outils d'IA généraliste utilisés au quotidien. Le problème n'est pas anodin : des professionnels s'appuient sur ces outils pour analyser des données économiques, sociales ou médicales, et un modèle qui confond ses propres biais culturels avec une analyse factuelle peut conduire à des décisions erronées sans que l'utilisateur s'en aperçoive. Les modèles dits "de raisonnement" (o3 d'OpenAI, les modes thinking de Gemini, etc.) parviennent à détecter ce type de piège, mais uniquement si l'utilisateur choisit activement de les activer, ce que la grande majorité ne fait pas. Ce constat pointe vers un problème de conception plus large : les interfaces de Copilot, Gemini ou ChatGPT proposent un modèle par défaut qui n'est pas nécessairement adapté à toutes les tâches, sans guider l'utilisateur vers le bon outil. Alors que Microsoft et Google intègrent l'IA dans des environnements professionnels sensibles, la question de la sélection automatique ou assistée du modèle selon le contexte d'usage devient un enjeu de fiabilité critique, que les éditeurs n'ont pas encore pleinement résolu.

UELes professionnels européens utilisant Copilot ou Gemini pour analyser des données économiques, sociales ou médicales s'exposent à des décisions fondées sur des analyses fabriquées, un risque de fiabilité directement dans le viseur de l'AI Act pour les systèmes à usage professionnel sensible.

💬 Le test d'Adam Kucharski est glaçant: données identiques, étiquettes de pays changées, et Copilot invente des différences nationales bien argumentées. Le modèle ne ment pas au sens classique, il comble les vides avec ses biais culturels, et ça passe parce que c'est fluide et ça semble fondé. Utiliser ces outils sur des données pro sans activer les modes raisonnement, c'est signer un rapport avec un outil qui hallucine en silence.

ÉthiqueOpinion
1 source
Hark obtient 700 millions de dollars pour son projet d’assistant IA universel
223Le Big Data 

Hark obtient 700 millions de dollars pour son projet d’assistant IA universel

La startup Hark a annoncé le 21 mai 2026 une levée de fonds de 700 millions de dollars, portant sa valorisation à 6 milliards de dollars à peine quelques mois après sa fondation fin 2025. Fondée par Brett Adcock, déjà connu pour avoir lancé le fabricant de robots humanoïdes Figure AI et la compagnie d'aviation électrique Archer Aviation, Hark développe un assistant IA universel destiné au grand public. Le tour de table a été mené par Parkway Venture Capital avec la participation de Nvidia, AMD Ventures, Intel Capital, Qualcomm Ventures, Salesforce Ventures et ARK Invest. L'entreprise prévoit de lancer ses premiers modèles multimodaux dès l'été 2026, avant de déployer sa propre gamme de matériel dédié. Malgré cette levée exceptionnelle, Hark reste très discrète sur les détails techniques de son produit. La vision portée par Hark tranche avec la majorité des acteurs actuels de l'IA générative, concentrés sur les copilotes professionnels, les outils de développement ou l'automatisation d'entreprise. La startup vise l'expérience quotidienne de l'utilisateur ordinaire : un assistant capable d'écouter et de parler naturellement, de comprendre des images, de conserver une mémoire persistante et de s'adapter profondément au contexte personnel de chaque utilisateur. Selon Abidur Chowdhury, ancien designer chez Apple et désormais directeur du design chez Hark, les outils IA actuels restent encore trop orientés développeurs ou usages professionnels avancés, laissant un vide béant pour le grand public. L'ambition déclarée est de créer une interface centrale entre l'utilisateur, ses services numériques et ses appareils connectés, combinant logiciel, matériel et IA agentive dans une expérience unifiée. Cette levée de fonds massive reflète une conviction qui s'impose de plus en plus dans la Silicon Valley : la prochaine grande plateforme technologique ne sera pas un simple logiciel, mais une interface IA native capable de remplacer progressivement les couches applicatives existantes. Le fait que des fabricants de semi-conducteurs concurrents comme Nvidia, AMD et Intel Capital investissent simultanément dans le même projet illustre l'enjeu stratégique que représente le contrôle de la couche applicative IA de nouvelle génération. Brett Adcock lui-même a publiquement critiqué les modèles IA actuels qu'il juge trop basiques, insuffisamment personnalisés et incapables d'interagir naturellement. Hark entre ainsi en compétition indirecte avec des projets similaires portés par des acteurs établis comme Apple Intelligence, Google Gemini ou OpenAI, mais parie sur une approche matériel-logiciel intégrée, comparable à ce qu'Apple a réalisé avec l'iPhone, pour s'imposer comme la prochaine interface dominante de l'ère IA.

💬 Adcock lève 700 millions sur une conviction simple : les assistants IA actuels sont encore des outils pour geeks, et le grand public n'a rien de vraiment utilisable. C'est pas faux, et ça explique pourquoi Nvidia, AMD et Intel ont tous mis au même pot malgré leur rivalité, chacun veut être dans la prochaine plateforme dominante. Reste à voir ce que ça vaut cet été quand les premiers modèles sortent.

BusinessActu
1 source
Warp : comment le terminal open source réinvente le code à l’ère de l’IA agentique
224Le Big Data 

Warp : comment le terminal open source réinvente le code à l’ère de l’IA agentique

Warp est un terminal de développement conçu en Rust qui ambitionne de remplacer les émulateurs classiques comme iTerm2 ou les consoles natives des systèmes d'exploitation. L'outil, développé pour corriger la lenteur et le manque d'ergonomie des interfaces en ligne de commande existantes, intègre désormais une couche d'intelligence artificielle agentique directement au coeur de l'environnement de travail. Contrairement aux assistants de code classiques qui suggèrent une ligne ou corrigent une erreur à la demande, Warp fonctionne en mode autonome : le développeur formule un objectif en langage naturel, et le système planifie puis exécute les étapes nécessaires sans intervention manuelle à chaque décision. L'outil analyse l'arborescence du projet, indexe les configurations et cartographie les dépendances via une base vectorielle locale, ce qui lui permet d'adapter ses actions à l'architecture réelle de l'application. Une fois une instruction validée, il lance une boucle continue d'action et de vérification, pouvant écrire des scripts, démarrer des serveurs, lire les erreurs et corriger le code source en cas d'échec. L'impact pour les équipes de développement est direct : la plateforme vise à éliminer la fragmentation cognitive qui caractérise le quotidien des ingénieurs, contraints de jongler en permanence entre leur éditeur de code, la documentation en ligne et un outil d'IA générative externe. Ce va-et-vient constant, qui génère une fatigue cognitive réelle et des pertes de temps importantes, devient obsolète lorsque la documentation, l'analyse des pannes et l'exécution sont regroupées dans un même environnement. Le développeur passe du rôle d'exécutant de commandes mémorisées à celui de superviseur de processus automatisés, concentrant son attention sur la conception plutôt que sur les micro-décisions répétitives. Le contexte est celui d'une stagnation de plusieurs décennies du terminal traditionnel, dont l'interface n'a pas fondamentalement évolué depuis quarante ans malgré l'explosion de la complexité des projets logiciels. Warp s'inscrit dans une tendance plus large de l'industrie qui cherche à intégrer l'IA non plus comme un module externe mais comme une couche native des outils de développement, à l'image de ce que GitHub Copilot a fait pour les éditeurs de code. La distinction clé que pose Warp est celle entre l'assistance ponctuelle et l'agentivité réelle, un positionnement qui entre en concurrence directe avec des environnements comme Cursor ou les extensions IA de VS Code, mais sur le terrain du terminal plutôt que de l'éditeur. L'enjeu pour la startup est de convaincre une profession historiquement attachée à ses outils que la ligne de commande peut devenir un centre de pilotage intelligent sans sacrifier la maîtrise que les ingénieurs revendiquent sur leur environnement.

OutilsOutil
1 source
Ne vous faites plus avoir : les images de ChatGPT ont désormais une « marque »
225Le Big Data 

Ne vous faites plus avoir : les images de ChatGPT ont désormais une « marque »

OpenAI a annoncé l'intégration progressive de SynthID, la technologie de tatouage numérique développée par Google DeepMind, dans les images générées via ChatGPT, Codex et son API. Cette initiative s'inscrit dans une stratégie plus large : depuis 2024, l'entreprise appose déjà des "Content Credentials" conformes au standard C2PA (Coalition for Content Provenance and Authenticity) sur les images produites par DALL·E 3, ImageGen et Sora. SynthID ajoute un marquage invisible directement dans les pixels de l'image, indétectable à l'œil nu mais lisible par un outil spécialisé. OpenAI déploie en parallèle un premier outil public de vérification permettant à quiconque de téléverser une image pour savoir si elle provient de ses modèles, en analysant simultanément les métadonnées C2PA et le tatouage SynthID. L'enjeu est direct : à mesure que les images générées par IA inondent les réseaux sociaux, les médias et les campagnes publicitaires, la capacité à distinguer le réel de l'artificiel devient un problème concret pour les journalistes, les plateformes et le grand public. La combinaison des deux technologies répond à une limite bien connue des systèmes basés uniquement sur les métadonnées : une simple capture d'écran suffit à effacer les informations de provenance encodées selon le standard C2PA. SynthID contourne ce problème en inscrivant le marquage dans la structure même de l'image, lui permettant de survivre à certaines modifications ou recompressions. C'est cette complémentarité qui constitue la valeur réelle du dispositif : les métadonnées fournissent un contexte détaillé sur la création, le tatouage assure une trace persistante. La course à la traçabilité des contenus synthétiques s'accélère dans un contexte de pression réglementaire croissante, notamment en Europe avec l'AI Act, qui impose des obligations de transparence sur les contenus générés par IA. OpenAI n'est pas seul sur ce terrain : Adobe, Microsoft et d'autres membres de la C2PA travaillent à des approches similaires, tandis que les grandes plateformes comme YouTube ou LinkedIn ont commencé à afficher les Content Credentials. OpenAI reconnaît cependant les limites de son système : aucune méthode n'est infaillible, et l'absence de signal détecté ne garantit pas qu'une image est authentique. L'outil de vérification public ne couvre pour l'instant que les contenus générés par OpenAI, mais l'entreprise affirme vouloir collaborer avec d'autres acteurs pour étendre le dispositif à l'ensemble de l'industrie.

UEL'AI Act impose des obligations de transparence sur les contenus générés par IA, et ce dispositif de tatouage numérique fournit aux entreprises européennes un mécanisme concret pour démontrer leur conformité.

💬 La vraie bonne idée, c'est la combinaison des deux systèmes. Une capture d'écran efface les métadonnées C2PA en deux secondes, SynthID survit dans les pixels eux-mêmes, et c'est là que ça change quelque chose. Bon, l'outil ne couvre que les images OpenAI pour l'instant, et ils reconnaissent eux-mêmes qu'une absence de signal ne garantit rien.

SécuritéOpinion
1 source
L'IA en entreprise : obstacles, feuilles de route, cybersécurité et IA physique au deuxième jour de TechEx
226AI News 

L'IA en entreprise : obstacles, feuilles de route, cybersécurité et IA physique au deuxième jour de TechEx

La deuxième journée de la conférence TechEx North America, tenue au San Jose McEnery Convention Center, a concentré ses sessions sur les obstacles concrets au déploiement de l'IA en entreprise. Les intervenants ont ouvert le programme AI & Big Data en évoquant le "cimetière de l'IA", ces projets pilotes qui affichent de bons résultats en phase de test mais échouent à passer en production réelle. Les discussions ont couvert un large spectre : financement basé sur les tokens, choix entre construire ou acheter une infrastructure physique dédiée, conception de fondations de données adaptées aux agents autonomes, et méthodes pour générer un retour sur investissement durable malgré la multiplicité des variables en jeu. Le problème central identifié par les experts est ce qu'ils appellent l'"effet copilote personnel" : un outil d'IA fonctionne remarquablement bien sur le poste d'un utilisateur unique, notamment quand il s'agit d'un dirigeant dont les gains de productivité créent un enthousiasme généralisé dans l'entreprise, mais cette réussite individuelle ne se transpose pas automatiquement à l'échelle d'un département, et encore moins d'une organisation entière. En parallèle, les sessions cybersécurité ont mis en lumière un "écart de vélocité" : les équipes métier adoptent les systèmes d'IA agentique bien plus vite que les équipes sécurité ne peuvent les gouverner, créant des angles morts critiques. L'IA amplifie à la fois les capacités offensives des attaquants, via des outils de scan automatisé d'exploits, et les risques internes liés à des agents non bornés ou mal supervisés. Le phénomène du "shadow IT" se réinvente sous la forme du "shadow AI" : des collaborateurs utilisent des outils d'IA non approuvés pour traiter des données sensibles, ou des systèmes autorisés fonctionnent sans périmètre clairement défini, élargissant la surface d'attaque à l'insu des équipes de sécurité. Face à ce contexte, le principe du "zéro confiance", refus par défaut pour tout utilisateur humain ou machine, est apparu comme une réponse structurante, imposant une vérification d'identité et de niveau de privilège non seulement aux personnes, mais aussi aux services et agents automatisés. La convergence entre gouvernance des données, supervision des systèmes et cybersécurité s'impose désormais comme l'enjeu organisationnel majeur pour toute entreprise cherchant à industrialiser l'IA sans exposer ses actifs critiques.

UELes entreprises européennes, soumises à l'AI Act et au RGPD, sont directement concernées par les problématiques de gouvernance du 'shadow AI' et d'encadrement des agents autonomes décrites dans cette conférence.

SécuritéActu
1 source
Google lance un agent IA capable de rédiger vos emails, surveiller votre boîte et gérer vos dépenses
227VentureBeat AI 

Google lance un agent IA capable de rédiger vos emails, surveiller votre boîte et gérer vos dépenses

Google a dévoilé mardi 19 mai 2026, lors de sa conférence annuelle Google I/O, un nouvel agent d'IA personnelle baptisé Gemini Spark. Capable de rédiger des e-mails, assembler des documents, surveiller une boîte de réception et, à terme, effectuer des achats en ligne, Spark fonctionne en continu dans le cloud de Google, même lorsque l'ordinateur est fermé et le téléphone verrouillé. Il repose sur le nouveau modèle Gemini 3.5 Flash et une architecture interne appelée "Antigravity agent harness", la même infrastructure qui alimente les outils de développement internes de Google. Concrètement, un utilisateur peut donner une instruction complexe comme "envoie à mon patron un point de situation en tirant les derniers chiffres depuis notre tablette partagée et le calendrier du projet", Spark exécute l'ensemble sans intervention supplémentaire. Le déploiement commence cette semaine auprès d'un groupe restreint de testeurs, avec une bêta prévue la semaine prochaine pour les abonnés Google AI Ultra aux États-Unis. Sundar Pichai, PDG de Google et Alphabet, a résumé la promesse : "Vous n'avez pas besoin de garder votre ordinateur ouvert pour que ça tourne." Gemini Spark représente un saut qualitatif dans la façon dont les assistants IA s'intègrent au quotidien professionnel et personnel. Contrairement aux chatbots classiques qui ne s'activent que sur sollicitation, Spark opère de manière persistante et autonome, orchestrant des tâches multi-étapes à travers plusieurs applications Google simultanément, Gmail, Docs, Sheets, Slides, Agenda. Pour un indépendant, cela peut signifier une surveillance automatique des demandes clients entrant par e-mail. Pour un étudiant, un guide de révision qui se met à jour au fil des nouvelles consignes d'un professeur. Josh Woodward, vice-président de Google Labs, décrit l'expérience comme "jeter des choses par-dessus son épaule, Spark les attrape et les traite." L'enjeu commercial est massif : si l'agent tient ses promesses, Google ancre ses utilisateurs encore plus profondément dans son écosystème applicatif, tout en ouvrant un modèle économique inédit autour de l'action autonome payante. Ce lancement s'inscrit dans une compétition frontale entre les géants de la tech pour imposer leurs agents d'IA comme couche d'orchestration de la vie numérique. Microsoft, OpenAI, Anthropic et Apple développent tous des systèmes comparables, capables d'agir plutôt que de simplement converser. Google répond avec une architecture cloud-native pensée pour la délégation longue durée, et des ambitions qui vont au-delà des outils maison. D'ici la fin de l'année, Spark sera connecté via le protocole MCP à plus de 30 partenaires tiers dont Canva, OpenTable et Instacart, permettant des actions concrètes comme réserver une table ou passer une commande. Une interface Android baptisée Android Halo offrira une visibilité en temps réel sur les tâches en cours. Mais ces capacités soulèvent aussi des questions urgentes sur la confiance, les garde-fous financiers et les risques d'interprétation erronée des intentions, des défis que Google n'a pas encore résolus publiquement.

UELe déploiement est limité aux États-Unis dans un premier temps, mais l'accès persistant aux emails et documents personnels soulève des questions de conformité RGPD qui conditionneront et retarderont le lancement en Europe.

💬 L'architecture est soignée : faire tourner l'agent dans le cloud même quand le téléphone est verrouillé, c'est la vraie rupture, pas les cas d'usage marketing. Mais bon, si Spark tient ses promesses, Google réussit ce que les autres n'ont fait que promettre depuis deux ans, et ça va encore un peu plus te coincer dans leur écosystème. Le RGPD va freiner le déploiement en Europe, mais surtout, je me demande qui sera responsable quand Spark interprète mal une instruction et envoie n'importe quoi à ton patron.

OutilsOutil
1 source
Google rend la détection des deepfakes plus accessible au grand public
228The Verge AI 

Google rend la détection des deepfakes plus accessible au grand public

Google a annoncé lors de sa conférence Google I/O le déploiement de nouveaux outils de détection des contenus générés ou manipulés par l'intelligence artificielle, directement intégrés à Chrome et à son moteur de recherche. Dès aujourd'hui, la vérification des marqueurs SynthID, la technologie de tatouage numérique invisible développée par Google DeepMind, est disponible dans plusieurs fonctionnalités de Search, notamment Google Lens et le mode IA. La prise en charge des métadonnées C2PA (Coalition for Content Provenance and Authenticity), un standard ouvert de certification des contenus, sera également intégrée à Chrome pour permettre aux utilisateurs de consulter l'historique de création ou de modification d'une image directement depuis leur navigateur. Ces mises à jour visent à rendre la détection des deepfakes accessible au grand public, sans nécessiter d'outils tiers ni de compétences techniques particulières. Pour les journalistes, fact-checkers, et simples internautes, pouvoir vérifier en quelques clics si une image a été produite par un outil IA de Google ou certifiée par des éditeurs de confiance représente un changement significatif dans la lutte contre la désinformation visuelle. SynthID est développé par Google DeepMind depuis 2023 et intègre un filigrane imperceptible à l'oeil nu dans les images générées par les outils IA de Google. Le standard C2PA, soutenu par Adobe, Microsoft, la BBC et d'autres acteurs majeurs, permet d'attacher une chaîne de provenance vérifiable à tout contenu numérique. L'intégration de ces deux systèmes dans des produits utilisés par des milliards de personnes pourrait pousser le reste de l'industrie à adopter des mécanismes de traçabilité similaires.

UEL'intégration native du standard ouvert C2PA dans Chrome et de SynthID dans Google Search pourrait accélérer l'adoption de mécanismes de traçabilité des contenus en Europe, appuyant directement les obligations de lutte contre la désinformation imposées aux grandes plateformes par le Digital Services Act (DSA).

💬 Pas besoin d'être expert pour vérifier si une image sort d'un outil IA Google, à partir de maintenant. Ce qui change vraiment, c'est que Google joue le jeu du standard ouvert C2PA en plus de son SynthID maison : si ça prend, les autres plateformes vont devoir s'aligner, sans que personne n'ait à leur forcer la main officiellement. Pour l'instant ça ne couvre que l'écosystème Google, mais à cette échelle, c'est déjà un sacré levier.

SécuritéActu
1 source
Google I/O : nouveaux modèles, agent cloud permanent et refonte de l'application Gemini
229The Decoder 

Google I/O : nouveaux modèles, agent cloud permanent et refonte de l'application Gemini

Lors de sa conférence développeurs Google I/O, tenue cette semaine, Google a dévoilé plusieurs annonces majeures dans le domaine de l'intelligence artificielle. Au programme : un nouveau modèle de langage baptisé Gemini 3.5 Flash, conçu pour allier rapidité et efficacité, un modèle multimodal nommé Gemini Omni capable de traiter simultanément texte, images, audio et vidéo, ainsi qu'un agent personnel cloud appelé Gemini Spark, pensé pour fonctionner en continu, vingt-quatre heures sur vingt-quatre. L'application Gemini bénéficie par ailleurs d'une refonte visuelle et fonctionnelle complète. L'introduction de Gemini Spark marque un tournant dans la vision de Google pour l'IA personnelle. Contrairement aux assistants classiques qui se contentent de répondre à des requêtes ponctuelles, un agent cloud permanent peut exécuter des tâches de façon autonome, anticiper des besoins, surveiller des données ou déclencher des actions sans intervention humaine. Pour les développeurs comme pour les utilisateurs grand public, cela ouvre la voie à une nouvelle catégorie d'assistants proactifs, toujours disponibles et potentiellement connectés à l'ensemble des services Google. Ces annonces s'inscrivent dans une course effrénée à l'IA agentique que se livrent Google, OpenAI et Microsoft depuis début 2025. Google cherche à reprendre l'initiative après avoir été perçu comme en retrait face aux avancées de GPT-4o et des agents d'OpenAI. Avec cette vague de lancements, l'entreprise signale sa volonté de positionner Gemini non plus comme un simple chatbot, mais comme une infrastructure d'IA omniprésente, ancrée dans le cloud et intégrée à l'ensemble de son écosystème.

UELes nouveaux modèles Gemini et l'agent cloud permanent seront accessibles aux développeurs et entreprises européens, accélérant l'adoption de l'IA agentique dans l'écosystème Google en Europe.

LLMsActu
1 source
Elon Musk perd son procès de 134 milliards de dollars contre OpenAI après deux heures de délibération
230The Decoder 

Elon Musk perd son procès de 134 milliards de dollars contre OpenAI après deux heures de délibération

Elon Musk a perdu sa bataille juridique contre Sam Altman et OpenAI. Un jury d'Oakland a délibéré moins de deux heures avant de rejeter l'intégralité des accusations, alors que le milliardaire réclamait jusqu'à 134 milliards de dollars en dommages et intérêts. La défaite est totale : la juge présidant l'audience a confié qu'elle aurait été prête à classer l'affaire immédiatement, avant même le retrait du jury, et l'avocat de Musk a d'ores et déjà annoncé son intention de faire appel. Ce verdict est une victoire nette pour OpenAI, qui peut désormais poursuivre sa transformation en entreprise à but lucratif sans cette menace juridique pesant sur ses plans de financement. Une condamnation à 134 milliards aurait pu être dévastatrice pour l'organisation et son partenaire Microsoft, compromettant les levées de capitaux en cours. La rapidité du délibéré envoie aussi un message clair sur la fragilité du dossier de Musk. Le procès s'inscrit dans une guerre ouverte entre Musk et ses anciens associés. Cofondateur d'OpenAI en 2015, il avait quitté le conseil d'administration en 2018 avant d'accuser Altman d'avoir trahi la mission originelle à but non lucratif de l'organisation au profit d'intérêts commerciaux, tandis qu'il lançait en parallèle sa propre IA concurrente, xAI, avec le modèle Grok. Un appel reste possible, mais la sévérité du verdict renforce la position d'OpenAI alors que la société finalise sa conversion en entité commerciale.

UELa conversion d'OpenAI en entreprise commerciale, désormais débloquée juridiquement, pourrait modifier les conditions d'accès, de tarification et de partenariat pour les entreprises et développeurs européens utilisant ses services.

💬 Moins de deux heures de délibéré, c'est à peine le temps d'un déjeuner. Le jury n'a pas eu besoin de chercher longtemps, et même la juge voulait classer l'affaire avant ça. Musk a joué le tout pour le tout sur un dossier manifestement creux, et OpenAI peut maintenant boucler sa conversion commerciale sans cette épée de Damoclès au-dessus des négociations.

Vercel Labs lance Zero, un langage système conçu pour que les agents IA puissent lire, corriger et livrer des programmes natifs
231MarkTechPost 

Vercel Labs lance Zero, un langage système conçu pour que les agents IA puissent lire, corriger et livrer des programmes natifs

Vercel Labs, la branche recherche de la société américaine spécialisée dans le déploiement web, a publié Zero, un langage de programmation système expérimental conçu pour que les agents d'intelligence artificielle puissent lire, corriger et compiler du code natif de manière autonome. Zero se positionne dans le même espace que C ou Rust : il compile vers des exécutables natifs, offre un contrôle explicite de la mémoire et cible les environnements bas niveau. La différence fondamentale réside dans la conception du compilateur et de la chaîne d'outils, pensés dès le départ pour être consommés par des agents IA plutôt que par des ingénieurs humains. Le problème central que Zero cherche à résoudre est la manière dont les agents interagissent avec les retours du compilateur. Dans un cycle de développement classique impliquant un agent de codage, celui-ci écrit du code, le compilateur émet une erreur sous forme de texte non structuré, et l'agent doit analyser ce texte pour comprendre ce qui a mal tourné. C'est fragile : les formats de messages changent, ils sont rédigés pour des lecteurs humains, et il n'existe aucun concept natif d'action de réparation. Zero répond à ce problème en émettant par défaut des diagnostics JSON structurés. Chaque diagnostic porte un code stable (par exemple NAM003), un message lisible par l'humain, une référence de ligne et un objet repair contenant un identifiant d'action typé. Les humains lisent le message ; les agents lisent le code et le repair. La chaîne d'outils est unifiée dans un seul binaire : zero check, zero run, zero build, zero fix, zero explain ou encore zero doctor sont tous des sous-commandes d'un même CLI. Deux d'entre elles sont particulièrement utiles dans une boucle de réparation automatisée : zero explain renvoie une explication détaillée d'un code de diagnostic donné, tandis que zero fix --plan --json produit un plan de correction structuré et lisible par machine. La commande zero skills fournit quant à elle des guides d'utilisation directement depuis le CLI, synchronisés avec la version du compilateur installé, évitant aux agents de scraper une documentation externe potentiellement obsolète. Le lancement de Zero s'inscrit dans une tendance plus large : alors que les agents de codage comme GitHub Copilot, Cursor ou Devin s'imposent dans les workflows de développement, l'outillage existant n'a pas été conçu pour eux. Vercel, dont la plateforme accueille des millions de projets web, se positionne ici en amont de la chaîne de valeur, au niveau du langage lui-même. Zero introduit également un système d'effets explicites dans les signatures de fonctions : une fonction ne peut accéder au système de fichiers, au réseau ou à la sortie standard que si elle reçoit un objet de capacité (World), vérifié à la compilation et non à l'exécution. Cette approche rend le comportement du code plus prévisible pour des agents qui doivent raisonner sur ses effets de bord sans l'exécuter. Zero reste pour l'instant expérimental, mais il signale une direction claire : concevoir les langages de programmation pour un monde où les compilateurs parlent autant aux machines qu'aux humains.

💬 L'idée est simple et évidente en rétrospective : nos compilateurs crachent du texte pensé pour des yeux humains, et on s'étonne que les agents galèrent à parser les erreurs. Zero corrige ça à la source, avec des diagnostics JSON structurés, des codes stables par type d'erreur, et une commande `zero fix --plan` qui donne à l'agent un plan de réparation lisible par machine plutôt qu'un blob de prose. Reste à voir si ça passe le cap du labo, mais la direction est la bonne.

OutilsOutil
1 source
Codex : plus besoin d’être collé à votre PC, l’IA de code arrive sur mobile
232Le Big Data 

Codex : plus besoin d’être collé à votre PC, l’IA de code arrive sur mobile

OpenAI a annoncé le 14 mai 2026 l'intégration de Codex dans l'application mobile ChatGPT, disponible sur iOS et Android. L'outil, jusqu'ici réservé aux environnements de bureau, peut désormais être piloté depuis un smartphone. Concrètement, Codex se connecte à la machine principale de l'utilisateur, PC portable, serveur dédié ou environnement distant, et affiche en temps réel l'état des tâches en cours : résultats de tests, sorties terminal, captures d'écran, validations et modifications de projet. Il ne s'agit pas de faire tourner un environnement de développement complet sur téléphone, mais de transformer le smartphone en tableau de bord portable pour superviser et orienter des tâches qui s'exécutent ailleurs. L'enjeu pratique est clair : les développeurs qui utilisent des agents d'IA autonomes se heurtent régulièrement au même problème. Ces agents peuvent travailler plusieurs dizaines de minutes, voire plusieurs heures, sans intervention humaine, mais ils finissent inévitablement par avoir besoin d'un arbitrage : choisir entre deux solutions techniques, approuver une action sensible, fournir du contexte supplémentaire. Jusqu'ici, cela imposait de retourner à son poste. Avec Codex sur mobile, il devient possible de lancer une analyse de bug avant de quitter le bureau, de suivre l'exécution depuis un taxi, et d'approuver une commande critique sans rouvrir tout son environnement de travail. OpenAI met en avant la sécurité du dispositif : la machine n'est pas exposée directement à Internet, la synchronisation entre appareils passant par une couche de relais sécurisée. Cette annonce s'inscrit dans une tendance plus large où les grands acteurs de l'IA, OpenAI en tête, cherchent à étendre leurs outils au-delà du seul écran d'ordinateur. Codex, initialement présenté comme un agent de codage autonome capable de gérer des tâches complexes sur des dépôts GitHub, monte progressivement en puissance depuis son lancement. L'intégration mobile est encore en préversion, mais elle signale une ambition claire : faire de l'IA de code un outil disponible en permanence, quel que soit le contexte. Pour l'industrie, cela accentue la pression sur les concurrents comme GitHub Copilot ou Cursor, qui n'ont pas encore poussé aussi loin l'expérience nomade. Pour les développeurs, la question n'est plus de savoir si l'IA va s'intégrer dans leurs outils quotidiens, mais à quelle vitesse elle va coloniser chaque surface disponible, y compris les six pouces de leur poche.

💬 Personne n'attendait un IDE sur téléphone. Ce qu'on voulait, c'est pouvoir débloquer un agent depuis le taxi à 19h sans rouvrir son laptop, et là OpenAI coche la case. Bon, faut encore vérifier ce que vaut vraiment cette "couche de relais sécurisée" dont ils parlent.

OutilsOutil
1 source
Google affirme avoir stoppé une cyberattaque de grande ampleur après qu'une IA a détecté une faille zero-day
233The Decoder 

Google affirme avoir stoppé une cyberattaque de grande ampleur après qu'une IA a détecté une faille zero-day

Le Threat Intelligence Group de Google a identifié le premier cas documenté d'un attaquant ayant utilisé l'intelligence artificielle pour découvrir et exploiter une vulnérabilité zero-day. Selon Google, le groupe a réussi à détecter et neutraliser cette attaque avant qu'elle ne se propage à grande échelle. C'est une première mondiale : jusqu'ici, l'IA était soupçonnée de pouvoir accélérer la découverte de failles, mais aucun cas concret d'exploitation malveillante n'avait été formellement documenté. L'enjeu est considérable. Une vulnérabilité zero-day est une faille inconnue du fabricant, donc sans correctif disponible au moment de l'attaque. Lorsqu'elle est couplée à la puissance de l'IA pour automatiser sa découverte et son armement, la menace change de nature : ce qui prenait auparavant des semaines de travail à des équipes spécialisées peut désormais être accompli beaucoup plus rapidement et à moindre coût. Les entreprises, infrastructures critiques et gouvernements du monde entier sont potentiellement exposés à une nouvelle génération d'attaques plus rapides et plus difficiles à anticiper. Google signale par ailleurs que des groupes étatiques liés à la Chine, la Corée du Nord et la Russie utilisent déjà activement l'IA pour identifier des failles de sécurité et dissimuler du code malveillant dans leurs opérations d'espionnage ou de sabotage. Cette révélation illustre une course aux armements numériques où l'IA devient un outil central, aussi bien pour les attaquants que pour les défenseurs. Google, Microsoft et d'autres géants de la cybersécurité investissent massivement pour que leurs propres systèmes de détection restent en avance sur ces nouvelles capacités offensives.

UELes infrastructures critiques et gouvernements européens sont directement exposés à cette nouvelle génération d'attaques IA-assistées orchestrées par des groupes étatiques liés à la Russie, la Chine et la Corée du Nord.

💬 C'est documenté pour la première fois, et ça change tout. Des semaines de travail pour trouver une zero-day deviennent quelques heures avec les bons modèles, et des groupes liés à la Russie ou à la Corée du Nord ne vont pas s'en priver longtemps. Google a neutralisé celui-là, reste à voir combien passent sous le radar.

SécuritéOpinion
1 source
Agent View débarque sur Claude Code : votre armée d’agents IA en une vue
234Le Big Data 

Agent View débarque sur Claude Code : votre armée d’agents IA en une vue

Anthropic a lancé une nouvelle fonctionnalité appelée Agent View pour son outil Claude Code, disponible dès la version 2.1.139 de l'application. Accessible via la commande claude agents dans le terminal, cette interface regroupe l'ensemble des sessions d'agents actives dans un tableau de bord unique intégré directement à l'environnement de développement. Elle est disponible pour tous les abonnements Pro, Max, Team et Enterprise, ainsi que via l'API Claude, dans le respect des limites de débit habituelles. Les administrateurs d'organisation disposent par ailleurs de la possibilité de désactiver la fonctionnalité depuis les paramètres centraux. Chaque ligne du tableau de bord représente une session Claude Code avec son état en temps réel : en cours, en attente de réponse humaine, terminée, inactive, arrêtée ou en échec. Pour les équipes de développeurs qui orchestrent plusieurs tâches simultanées, Agent View change concrètement la façon de travailler. Jusqu'ici, gérer plusieurs agents en parallèle signifiait jongler entre de multiples fenêtres de terminal, sans vue d'ensemble claire sur l'état de chaque processus. Désormais, un développeur peut lancer en parallèle des agents chargés de correctifs, de tests, de revues de code ou de mises à jour, passer de l'un à l'autre sans friction, reprendre une session suspendue à tout moment, et surtout identifier immédiatement les agents qui nécessitent une intervention humaine. Ce gain de visibilité est particulièrement précieux dans les environnements d'intégration continue où le temps perdu à chercher quelle tâche est bloquée peut coûter cher. Cette mise à jour s'inscrit dans une stratégie plus large qu'Anthropic mène depuis plusieurs mois pour transformer Claude Code en véritable plateforme de gestion d'agents IA pour les équipes techniques. L'entreprise avait déjà introduit successivement les sous-agents, les équipes d'agents, les compétences personnalisées, les hooks, les commandes à distance, les tâches programmées et une version web de Claude Code. Agent View est en quelque sorte la pièce qui manquait : elle consolide tous ces blocs épars en une interface cohérente. Anthropic cherche clairement à sortir Claude Code du statut d'assistant à l'écriture de code pour en faire un outil d'orchestration de workflows autonomes, en concurrence directe avec des environnements comme GitHub Copilot Workspace ou les solutions agentiques de Google DeepMind. La question qui reste ouverte est celle de la fiabilité à grande échelle : plus les agents sont nombreux et autonomes, plus la capacité à détecter rapidement les échecs devient critique, et c'est précisément ce que vise Agent View.

OutilsOutil
1 source
Amazon Quick : accélérer le chemin des données d'entreprise vers les décisions assistées par IA
235AWS ML Blog 

Amazon Quick : accélérer le chemin des données d'entreprise vers les décisions assistées par IA

Amazon vient d'annoncer cinq nouvelles fonctionnalités pour Amazon Quick, sa plateforme d'analyse de données propulsée par l'IA, pensées pour les grandes entreprises qui gèrent des dizaines de millions de lignes de données réparties sur de multiples domaines métier. La fonctionnalité phare, Dataset Q&A, permet à n'importe quel utilisateur de poser une question en langage naturel directement sur ses datasets et d'obtenir une réponse en quelques secondes, sans passer par un analyste ni attendre la création d'un tableau de bord sur mesure. Le système génère automatiquement du SQL, l'exécute sur l'intégralité des données sans échantillonnage, et renvoie un résultat chiffré accompagné d'une explication complète de la logique utilisée : requête SQL générée, filtres appliqués, hypothèses formulées, et résumé en langage courant pour les non-techniciens. Le programme AWS Technical Field Communities a déjà mis cette approche en pratique : la précision des requêtes a progressé de plus de 48 %, et le temps de résolution est passé de 90 minutes à moins de 5 minutes pour une communauté de plus de 15 000 membres. Ce que change Amazon Quick, c'est l'élimination du goulet d'étranglement humain qui ralentit habituellement la prise de décision en entreprise. Lorsqu'un dirigeant veut savoir comment évolue le taux de désabonnement d'un produit, la réponse nécessite aujourd'hui soit un tableau de bord préexistant, soit une requête manuelle par un analyste, soit l'attente d'un ticket résolu en heures, voire en jours. En rendant l'accès aux données aussi direct que poser une question, Amazon Quick réduit ce délai à quelques secondes tout en préservant la gouvernance : les politiques de sécurité au niveau des lignes et des colonnes déjà configurées s'appliquent automatiquement aux requêtes générées par l'IA, sans configuration supplémentaire. L'utilisateur ne voit que ce qu'il est autorisé à voir, peu importe la formulation de sa question. Amazon Quick s'inscrit dans une tendance de fond qui voit les grands fournisseurs cloud chercher à démocratiser l'accès aux données d'entreprise via des interfaces conversationnelles. Face à des concurrents comme Microsoft Fabric avec Copilot ou Google Looker Studio, Amazon mise sur la fiabilité et l'auditabilité des réponses, deux points critiques pour les grandes organisations soumises à des exigences réglementaires strictes. Le défi technique central n'est pas la génération de SQL, mais la résolution des ambiguïtés sémantiques : quand un utilisateur parle de "croissance", entend-il des transactions, des clients, du revenu ou des unités vendues ? La fonctionnalité d'enrichissement sémantique permet aux équipes data de codifier les définitions métier directement dans les métadonnées des datasets, afin que l'IA réponde selon le vocabulaire réel de l'organisation plutôt qu'une interprétation approximative des noms de colonnes.

OutilsOutil
1 source
9 meilleurs outils IA pour le développement piloté par les specs en 2026 : Kiro, BMAD, GSD et plus encore
236MarkTechPost 

9 meilleurs outils IA pour le développement piloté par les specs en 2026 : Kiro, BMAD, GSD et plus encore

En 2026, le développement piloté par les spécifications (SDD pour spec-driven development) s'impose comme une réponse structurelle à un problème croissant dans les équipes de développement augmentées par l'IA : générer du code rapidement ne sert à rien si ce code ne correspond pas aux besoins réels du système. Un classement des neuf outils les plus utilisés pour mettre en oeuvre cette approche met en lumière trois acteurs majeurs. AWS Kiro (kiro.dev) est un IDE agentique qui guide les développeurs en trois phases formalisées, Exigences, Design et Tâches, et produit trois artefacts structurés. Il utilise la notation EARS pour les user stories et un système de hooks événementiels qui déclenchent automatiquement des vérifications (tests, mises à jour de documentation, scans de sécurité) à chaque sauvegarde de fichier. Côté modèles, Kiro s'appuie sur un routeur automatique combinant Claude Sonnet, Qwen, DeepSeek, GLM et MiniMax. GitHub Spec Kit (93 000 étoiles, version 0.8.7 publiée le 7 mai 2026) est l'option open source la plus adoptée, compatible avec plus de 30 agents dont Claude Code, Copilot et Gemini CLI. BMAD-METHOD, lui, orchestre plus de 12 agents spécialisés couvrant l'ensemble du cycle de développement logiciel ; sa version 6.6.0, sortie le 29 avril 2026, totalise 46 700 étoiles et 5 500 forks sur GitHub. L'enjeu central de ces outils est de renverser la logique de travail habituelle : au lieu de coder d'abord et d'affiner ensuite, le développeur formalise son intention en amont, et le code devient une sortie générée à partir de cette spécification. Pour les équipes professionnelles, cela réduit significativement le risque de divergence entre ce qui est produit et ce qui était réellement attendu, un problème qui coûte cher en retours arrière et en dette technique. Kiro s'adresse aux équipes qui veulent un environnement familier (il est construit sur Code OSS), tandis que Spec Kit convient aux équipes souhaitant conserver leur IDE existant. BMAD-METHOD cible des projets plus complexes nécessitant une coordination entre rôles distincts (product management, architecture, QA, etc.). Ce mouvement vers le SDD reflète une maturité croissante dans l'usage de l'IA en développement logiciel. La première vague d'outils misait sur la vitesse brute de génération de code ; la deuxième, celle que ces neuf outils incarnent, mise sur la cohérence et la traçabilité. GitHub a résumé la philosophie de Spec Kit en une formule : le code est désormais la sortie de dernier kilomètre, l'intention est la source de vérité. BMAD introduit avec sa V6 une équipe d'agents multi-plateformes, permettant à la même configuration de fonctionner indifféremment sur Claude Code, Cursor ou Codex. La convergence de ces approches suggère que la prochaine bataille dans les outils de développement ne se jouera pas sur la qualité du code généré, mais sur la qualité des spécifications qui le précèdent.

💬 La première vague d'outils IA misait sur la vitesse brute, et on a tous couru après. Bon, résultat : du code généré en 10 minutes qu'on passe 3 heures à corriger parce que la spec était dans la tête du dev et nulle part ailleurs. Kiro et Spec Kit ne règlent pas tout, mais l'idée de formaliser l'intention avant le code, c'est le truc qu'on aurait dû faire dès le départ.

OutilsOutil
1 source
Le gouvernement américain diversifie ses fournisseurs d'IA et reconsidère le rôle d'Anthropic
237AI News 

Le gouvernement américain diversifie ses fournisseurs d'IA et reconsidère le rôle d'Anthropic

Le Pentagone a officialisé des partenariats avec quatre nouveaux fournisseurs d'intelligence artificielle le 6 mai 2026 : Microsoft, Amazon, Nvidia, et Reflection AI, une startup qui n'a encore publié aucun modèle accessible au grand public. Ces entreprises rejoignent OpenAI, xAI et Google dans un cercle restreint de prestataires autorisés à déployer leurs technologies pour "tout usage légal" au sein des forces armées américaines, y compris sur des données classifiées aux niveaux les plus sensibles, dits Impact Level 6 (secret) et Impact Level 7 (très secret défense). Ce mouvement intervient quelques semaines après la rupture fracassante entre le Pentagone et Anthropic : le département de la Défense avait annulé un contrat de 200 millions de dollars avec la startup, qualifiant publiquement l'entreprise de "risque pour la chaîne d'approvisionnement", une première pour une société américaine. Anthropic avait aussitôt contesté cette décision en justice, réclamant des millions en revenus perdus, après que son PDG Dario Amodei s'était opposé à la formule "tout usage légal", estimant qu'elle ouvrait la porte à la surveillance de civils américains et au développement d'armes autonomes. L'élargissement du portefeuille de fournisseurs militaires réduit mécaniquement la dépendance du Pentagone à l'égard de n'importe quel acteur individuel. Si un dirigeant comme Amodei pose des conditions éthiques, l'armée peut simplement se tourner vers des concurrents moins regardants. Le Pentagone l'a d'ailleurs formulé sans détour : l'objectif est de "bâtir une architecture qui prévient le verrouillage sur un fournisseur unique." Concrètement, les nouveaux outils doivent permettre aux forces armées de "synthétiser les données", d'"élever la compréhension situationnelle" et d'"augmenter la prise de décision des combattants dans des environnements opérationnels complexes", une formulation qui laisse ouverte la question des déploiements sur le territoire américain. Google et Amazon avaient déjà licencié des employés qui protestaient contre l'usage militaire de leurs technologies, signalant que ces entreprises n'ont pas l'intention de répéter la résistance publique d'Anthropic. Le tableau reste pourtant plus nuancé qu'il n'y paraît. Le modèle Mythos d'Anthropic serait actuellement utilisé par la NSA dans le cadre de capacités de cyberguerre et de cyberdéfense, et est en cours d'évaluation par 40 organisations dans le monde, dont seulement 12 nommées publiquement, le MI5 britannique et la NSA figurant parmi les 28 restantes. Le modèle de codage Claude d'Anthropic serait aussi toujours actif au sein d'agences gouvernementales américaines malgré la crise. Selon Axios, qui cite une source à la Maison-Blanche, l'administration Trump chercherait désormais un moyen de "sauver la face et de les ramener dans le giron." La rupture serait donc davantage tactique que définitive, dans un secteur où la dépendance à l'IA militaire s'accélère et où aucun acteur ne peut vraiment se permettre d'être exclu du plus grand client du monde.

UELe MI5 britannique figure parmi les agences évaluant le modèle Mythos d'Anthropic dans un programme mondial impliquant 40 organisations, signalant un intérêt croissant des services de renseignement européens pour ces technologies d'IA à usage militaire.

💬 Amodei fait ses principes en public, mais Mythos tourne déjà chez la NSA. Le Pentagone élargit sa liste de fournisseurs, soit, mais la vraie info c'est que tout le monde veut que ça reprenne, Maison-Blanche incluse. C'est du théâtre contractuel, pas une rupture idéologique.

BusinessOpinion
1 source
Le gouvernement américain obtient un accès pré-déploiement aux modèles IA de cinq grands laboratoires à des fins de sécurité nationale
238The Decoder 

Le gouvernement américain obtient un accès pré-déploiement aux modèles IA de cinq grands laboratoires à des fins de sécurité nationale

Le Département américain du Commerce vient d'élargir son programme d'accès anticipé aux modèles d'intelligence artificielle développés par les principaux laboratoires du secteur. Après Anthropic et OpenAI, trois nouvelles entreprises ont rejoint le dispositif : Google DeepMind, Microsoft et xAI, la startup d'Elon Musk. Ces acteurs ont signé des accords avec le Center for AI Standards and Innovation (CASI), une entité rattachée au National Institute of Standards and Technology. Concrètement, ils fournissent au gouvernement des versions de leurs modèles dont les garde-fous de sécurité ont été partiellement désactivés, pour permettre des évaluations approfondies dans des environnements classifiés. Cet accès privilégié permet aux agences fédérales d'examiner les capacités réelles de ces systèmes avant leur mise sur le marché, y compris leurs potentiels d'utilisation malveillante. En supprimant les filtres habituels, les testeurs gouvernementaux peuvent sonder les limites des modèles d'une façon que les versions publiques ne permettent pas : identifier des failles exploitables, simuler des scénarios de cyberattaque, ou évaluer les risques liés à la divulgation d'informations sensibles. C'est une rupture significative dans la manière dont l'État supervise ces technologies. Cette expansion s'inscrit dans un contexte de concurrence technologique croissante avec la Chine et de risques cybersécurité liés à l'IA en forte hausse. Washington cherche à établir des standards nationaux solides avant que ces systèmes ne se diffusent à grande échelle. Le fait que cinq des principaux laboratoires mondiaux participent désormais à ce programme signale une convergence inédite entre industrie privée et sécurité nationale, qui pourrait préfigurer un modèle de gouvernance applicable bien au-delà des frontières américaines.

UECe programme américain de supervision pré-déploiement pourrait servir de référence aux autorités européennes qui définissent encore les modalités concrètes d'évaluation des modèles à haut risque dans le cadre de l'AI Act.

💬 C'est le genre d'accord qu'on imaginait se faire dans l'ombre depuis des années, et là c'est officialisé. Cinq labos fournissent des versions sans filtres pour que le gouvernement cherche les failles, ce qui est probablement plus rassurant que l'alternative (tout le monde faisant semblant que ça n'existe pas). Ce qui m'intéresse maintenant, c'est de voir si Bruxelles va copier le modèle ou s'inventer une usine à gaz de plus.

RégulationReglementation
1 source
Elon Musk vs OpenAI : tout ce qu’il faut savoir du procès qui secoue la Silicon Valley
239Next INpact 

Elon Musk vs OpenAI : tout ce qu’il faut savoir du procès qui secoue la Silicon Valley

Depuis le 27 avril, Elon Musk et OpenAI s'affrontent devant un jury fédéral en Californie, dans ce qui s'annonce comme l'un des procès les plus retentissants de la décennie tech. La juge Yvonne Gonzalez Rogers, nommée par Barack Obama en 2011 et déjà arbitre du conflit Epic Games contre Apple, préside les débats. Musk avait déposé plainte en mars 2024 contre OpenAI, son cofondateur Sam Altman, Greg Brockman et Microsoft, avec 26 chefs d'accusation initiaux. Deux seulement ont survécu à l'instruction : enrichissement injustifié d'OpenAI et violation d'une fiducie caritative. Au cœur du litige : la transformation d'une organisation à but non lucratif, fondée en 2015 avec l'ambition de développer une intelligence artificielle générale au bénéfice de l'humanité, en une entité commerciale de plusieurs centaines de milliards de dollars. L'enjeu dépasse largement la querelle personnelle entre deux milliardaires. Musk reproche à OpenAI d'avoir trahi son pacte fondateur en fermant ses modèles comme GPT-4, lancé en mars 2023, et en orientant ses travaux vers la maximisation des profits au bénéfice de Microsoft, actionnaire à environ 27 %. La structure d'OpenAI a certes évolué : plutôt que de basculer vers un pur modèle lucratif comme le souhaitait Altman, l'entreprise a opté pour une gouvernance hybride, avec une entité commerciale convertie en Public Benefit Corporation dans laquelle l'organisation non lucrative conserve 26 % du capital et un droit de regard sur le conseil d'administration. Mais pour Musk, ce compromis ne suffit pas : la mission originelle, celle de publier les recherches en open source et de garantir que l'AGI profite à tous, aurait été sacrifiée sur l'autel de la rentabilité commerciale. Ce procès s'inscrit dans une rupture profonde entre deux visions de l'IA qui coexistaient à l'origine dans la même organisation. Musk était l'un des dix cofondateurs d'OpenAI et avait contribué à lever le premier milliard de dollars promis au lancement, avant de quitter le conseil en 2018, officiellement pour éviter un conflit d'intérêts avec Tesla. Il a depuis fondé xAI et développé Grok, son propre modèle concurrent. La bataille judiciaire reflète ainsi une fracture plus large dans l'industrie entre les tenants de l'open source et ceux du modèle fermé, entre la promesse philanthropique des débuts et la réalité d'une compétition mondiale où les investissements se chiffrent en dizaines de milliards. Le procès, qui durera plusieurs semaines, pourrait forcer OpenAI à revoir sa gouvernance et établir une jurisprudence majeure sur les obligations des organisations technologiques à but non lucratif lorsqu'elles changent de modèle économique.

UESi le procès force OpenAI à revoir sa gouvernance ou à rouvrir ses modèles, cela pourrait affecter les conditions d'accès à ses API pour les entreprises et développeurs européens, et créer une jurisprudence internationale influençant les régulations sur les organisations technologiques à but non lucratif en Europe.

💬 Le vrai sujet ici, c'est pas la haine entre Musk et Altman. C'est qu'on a fondé une asso à but non lucratif pour développer l'AGI au bénéfice de l'humanité, et qu'aujourd'hui c'est une boîte valorisée à des centaines de milliards avec Microsoft à 27%. Reste à voir si la Public Benefit Corporation change quoi que ce soit dans les faits, ou si c'est juste du vernis juridique pour tenir le procès à distance.

RégulationReglementation
1 source
La journée difficile de Greg Brockman
240The Information AI 

La journée difficile de Greg Brockman

Greg Brockman, cofondateur et président d'OpenAI, a comparu lundi 5 mai 2026 devant le tribunal pour la deuxième semaine du procès intenté par Elon Musk contre OpenAI. L'avocat de Musk, Steven Molo, l'a soumis à un interrogatoire serré centré sur ses intérêts financiers dans la société et ses partenaires commerciaux. Molo a d'emblée établi que la participation de Brockman dans OpenAI représente près de 30 milliards de dollars, avant de s'appuyer sur des extraits de son journal numérique personnel pour étayer sa thèse. L'un de ces passages, particulièrement révélateur, montre Brockman s'interrogeant sur différentes trajectoires pour OpenAI en se demandant : « financièrement, qu'est-ce qui me permettra d'atteindre le milliard ? » Cette déposition illustre la tension centrale du procès : Musk accuse OpenAI de violation d'une fiducie caritative et d'enrichissement injuste, en soutenant que les dirigeants de la société auraient dévoyé sa mission originelle au profit d'intérêts personnels. Les documents fondateurs d'OpenAI stipulaient explicitement que l'organisation n'était « pas organisée pour le gain privé d'une personne ». La stratégie de la défense de Musk consiste à démontrer que des fortunes colossales accumulées par les dirigeants contredisent directement cet engagement, remettant en question la légitimité du passage d'OpenAI d'une structure à but non lucratif vers un modèle commercial. Ce procès s'inscrit dans un conflit de longue date entre Elon Musk et OpenAI. Musk, cofondateur historique de la société, l'a quittée en 2018 avant de rompre publiquement avec ses dirigeants, accusant Sam Altman et son équipe d'avoir trahi les idéaux fondateurs au profit de la rentabilité. Depuis, OpenAI a levé des milliards de dollars, notamment auprès de Microsoft, et s'est structurée autour d'une entité commerciale, tout en conservant une gouvernance non lucrative en théorie. L'issue de ce procès pourrait contraindre OpenAI à revoir son architecture juridique au moment même où la société négocie une transformation complète en entreprise à but lucratif.

UEL'issue du procès pourrait contraindre OpenAI à revoir son architecture juridique mondiale au moment où l'AI Act entre pleinement en application, affectant ses obligations de gouvernance et de transparence en Europe.

💬 30 milliards de valeur personnelle et un journal intime qui demande "comment j'atteins le milliard", ça fait un tableau difficile à défendre. Le problème c'est pas que Brockman veuille être riche, c'est que les statuts fondateurs d'OpenAI disaient exactement l'inverse. Musk est peut-être un plaignant de mauvaise foi, mais ces écrits-là, tu les balais pas d'un revers de main.

RégulationReglementation
1 source
Codex gagne du terrain
241Ben's Bites 

Codex gagne du terrain

OpenAI accélère le déploiement de Codex auprès du grand public en annonçant plusieurs évolutions majeures visant à rendre l'outil accessible aux utilisateurs non techniques. La plateforme permet désormais d'importer des paramètres, plugins, agents et configurations de projets depuis des outils concurrents comme Claude, facilitant la migration pour ceux qui souhaitent changer d'environnement. Des améliorations concrètes ont également été déployées pour les tâches du quotidien : création de présentations et de feuilles de calcul, interface plus intuitive, et une intégration iMessage non officielle qui permet d'interagir avec Codex directement depuis son téléphone via un fil de discussion persistant. Par ailleurs, xAI a lancé Grok 4.3 dans son API publique : le modèle supporte un contexte d'un million de tokens, accepte texte et images en entrée, intègre des capacités de raisonnement et dispose d'une base de connaissance arrêtée à décembre 2025. Son tarif, fixé à 1,25 dollar pour un million de tokens en entrée et 2,50 dollars en sortie, le positionne comme une alternative nettement moins chère que Claude Sonnet 4.6 pour des performances comparables. Ces mouvements signalent une intensification de la concurrence dans le segment des assistants de développement et de productivité alimentés par l'IA. En ciblant explicitement les non-développeurs, OpenAI cherche à élargir considérablement son marché potentiel pour Codex, qui était jusqu'ici perçu comme un outil avant tout destiné aux ingénieurs. La guerre des prix entre modèles LLM s'accentue également : la tarification agressive de Grok 4.3 par xAI force les autres acteurs à justifier leurs propres coûts, ce qui devrait bénéficier aux entreprises et développeurs cherchant à réduire leurs dépenses d'infrastructure IA. Enfin, la société Entire, fondée par l'ex-PDG de GitHub, a dévoilé deux outils complémentaires : git-sync, un utilitaire pour synchroniser des dépôts git entre sources sans clonage local, et Dispatches, une fonctionnalité générant automatiquement des notes de version à partir des commits et sessions d'agents par dépôt et plage de dates. Codex a été lancé par OpenAI comme successeur de GitHub Copilot dans une logique d'agent de développement autonome, mais la plateforme peine encore à s'imposer comme outil universel face à des concurrents comme Claude ou Cursor. L'ouverture à des profils non techniques représente un pivot stratégique notable, dans un contexte où la frontière entre outils de développement et outils de productivité généraliste s'efface progressivement. Du côté des benchmarks, un signe d'avertissement : Base44 indique dans son outil Frustration Meter qu'Opus 4.7 génère 43 % de frustration en plus qu'Opus 4.6, suggérant que la course aux capacités ne se traduit pas toujours par une meilleure expérience utilisateur. Les semaines à venir diront si Codex réussit son pari d'élargissement, et si Grok 4.3 parvient à s'imposer comme le modèle rapport qualité-prix de référence.

UELa guerre des prix entre LLM (Grok 4.3 à 1,25 $/M tokens en entrée) devrait permettre aux développeurs et entreprises européens de réduire sensiblement leurs coûts d'infrastructure IA.

OutilsOutil
1 source
OpenAI transforme sa soirée GPT-5.5 complète en un mois d'accès gratuit à Codex pour 8 000 développeurs
242VentureBeat AI 

OpenAI transforme sa soirée GPT-5.5 complète en un mois d'accès gratuit à Codex pour 8 000 développeurs

OpenAI a envoyé lundi un email surprise à plus de 8 000 développeurs ayant postulé pour sa soirée privée baptisée « GPT-5.5 on 5/5 », organisée le 5 mai à San Francisco de 17h55 à 20h55 heure du Pacifique. Incapable d'accueillir tout le monde dans ses locaux, l'entreprise a compensé en multipliant par dix les limites d'utilisation quotidiennes de Codex, son agent de programmation propulsé par IA, sur les comptes ChatGPT personnels des candidats, qu'ils aient été acceptés, mis sur liste d'attente ou refusés. Ce cadeau reste actif jusqu'au 5 juin. Sam Altman avait annoncé la surprise sur X quelques minutes avant l'envoi des emails, récoltant plus de 521 000 vues en quelques heures. La soirée elle-même, tenue dans un lieu gardé secret jusqu'à la confirmation des invitations, ne comportait aucune annonce produit : juste de la nourriture, des boissons, des goodies et une discussion informelle avec l'équipe derrière GPT-5.5. Pour les développeurs, l'impact est concret et immédiat. Codex fonctionne sous des plafonds d'utilisation journaliers variables selon l'abonnement, et un multiplicateur de dix donne accès à un volume d'usage bien plus large pour prototyper, déboguer et livrer du code. GPT-5.5, le modèle qui alimente Codex, affiche selon OpenAI une latence par token comparable à GPT-4, mais à un niveau d'intelligence supérieur et avec significativement moins de tokens par tâche. Sur 31 jours, cette fenêtre d'accès élargi vise à transformer l'essai en habitude profonde : l'idée est que les développeurs qui travailleront pendant un mois entier avec Codex à plein régime hésiteront à revenir en arrière, et qu'une partie d'entre eux souscrira à un abonnement payant pour maintenir ce flux de travail après le 5 juin. Une question reste ouverte : ce bonus se cumule-t-il avec le multiplicateur x20 inclus dans l'abonnement Pro à 200 dollars par mois ? Selon un utilisateur ayant contacté le support OpenAI, la réponse serait non, le système applique la limite la plus haute, sans addition. Cette opération s'inscrit dans une stratégie d'expansion agressive d'OpenAI sur le marché des outils de développement, où GitHub Copilot, Cursor et d'autres concurrents se disputent l'adoption quotidienne des ingénieurs. En inondant des milliers de développeurs d'un accès premium durant une période clé, OpenAI subventionne une adoption intensive plutôt que de laisser Codex se découvrir progressivement. La soirée du 5 mai comportait elle-même un élément de mise en scène produit : Altman a révélé que GPT-5.5 avait lui-même planifié l'événement, proposant la date, suggérant que les toasts soient portés par des humains et recommandant l'installation d'une boîte à suggestions pour le prochain modèle, ce qu'Altman a qualifié de « comportement émergent étrange ». Codex a également géré la sélection des invités, boucle logique dans une soirée conçue autant comme démonstration que comme célébration.

OutilsOutil
1 source
Organiser la mémoire des agents à grande échelle : patterns de conception par namespace dans AgentCore Memory
243AWS ML Blog 

Organiser la mémoire des agents à grande échelle : patterns de conception par namespace dans AgentCore Memory

Amazon a publié un guide technique détaillé sur la conception de namespaces dans AgentCore Memory, le système de mémoire à long terme intégré à Amazon Bedrock. La fonctionnalité, présentée dans un billet de blog officiel d'AWS, permet aux développeurs d'organiser les souvenirs de leurs agents IA sous forme de chemins hiérarchiques, similaires à des arborescences de fichiers. Concrètement, les préférences d'un utilisateur identifié comme customer-123 seront stockées sous /actor/customer-123/preferences/, tandis que les résumés de ses sessions individuelles seront rangés sous /actor/customer-123/session/session-789/summary/. Ces chemins sont générés automatiquement à partir de trois variables prédéfinies : {actorId} pour l'identifiant de l'utilisateur, {sessionId} pour la session en cours, et {memoryStrategyId} pour le type de stratégie mémoire utilisé. Le système prend en charge plusieurs stratégies superposées, notamment la mémoire sémantique pour les faits durables sur un utilisateur, et la mémoire de résumé pour les synthèses de sessions passées. L'enjeu est concret : sans organisation rigoureuse, les agents IA récupèrent du contexte non pertinent lors de leurs requêtes, ce qui dégrade la qualité des réponses et peut créer des failles de sécurité, notamment en exposant les souvenirs d'un utilisateur à un autre. Le système de namespaces résout ces deux problèmes à la fois. D'un côté, la structure hiérarchique permet une récupération à granularité variable : on peut interroger la mémoire d'une session précise, l'ensemble des préférences d'un utilisateur à travers toutes ses sessions, ou encore des données communes à tous les utilisateurs d'un même agent. De l'autre, AWS intègre des contrôles d'accès IAM natifs qui permettent de délimiter précisément qui peut lire ou écrire dans quelle portion de la mémoire, sans dupliquer le stockage physique. Les namespaces sont des partitions logiques au sein d'une même ressource mémoire, une approche que les équipes habituées aux clés de partition DynamoDB ou aux préfixes S3 reconnaîtront immédiatement. Ce guide s'inscrit dans une dynamique plus large : l'essor des agents IA en production crée une demande croissante pour des infrastructures mémoire robustes et sécurisées. Amazon Bedrock, qui concurrence directement les offres d'OpenAI, Google et Microsoft Azure dans l'espace des plateformes d'agents d'entreprise, cherche à se différencier par des primitives de bas niveau bien pensées. AgentCore Memory, présenté comme une brique fondamentale pour les agents à longue durée de vie, cible les équipes qui construisent des assistants client, des copilotes métier ou des agents autonomes nécessitant une continuité de contexte entre les sessions. La prochaine étape annoncée par AWS porte sur les patterns de récupération multi-niveaux et les stratégies d'isolation entre agents dans des architectures multi-tenants.

UEAmazon Bedrock étant déployé dans des régions AWS européennes, ces patterns de conception sont directement exploitables par les équipes françaises et européennes qui construisent des agents IA sur cette plateforme.

OutilsActu
1 source
AWS entre dans la course aux super-agents et lance sa propre version de Claude Cowork
244The Information AI 

AWS entre dans la course aux super-agents et lance sa propre version de Claude Cowork

Amazon Web Services a annoncé mardi le lancement d'Amazon Quick, une nouvelle application de bureau dédiée à ses agents IA. L'application tourne en arrière-plan sur l'ordinateur de l'utilisateur, lui permettant de continuer à travailler pendant que les agents automatisent des tâches comme la création de présentations, de documents ou d'images. Amazon Quick est proposée à partir de 20 dollars par mois et, fait notable, elle ne nécessite pas de compte AWS pour fonctionner. Les agents sont conçus pour interagir avec les fichiers locaux de l'utilisateur ainsi qu'avec des outils professionnels populaires : Google Workspace, Microsoft 365, Zoom et Salesforce. Ce lancement marque une nouvelle étape dans la course aux agents IA enterprise, un marché que tous les grands acteurs du cloud cherchent à conquérir. En rendant Amazon Quick accessible sans compte AWS, Amazon abaisse significativement la barrière à l'entrée pour les professionnels et les petites structures qui n'ont pas d'infrastructure cloud déjà en place. La capacité de déléguer des tâches bureautiques à des agents fonctionnant en parallèle représente un changement concret dans la productivité quotidienne, en particulier pour les équipes qui jonglent entre plusieurs plateformes collaboratives. AWS se retrouve cette semaine sous les feux des projecteurs pour une deuxième raison : le géant du cloud peut désormais proposer les modèles d'OpenAI à ses clients, après un changement dans le partenariat exclusif de longue date entre OpenAI et Microsoft. Pour AWS, la création d'une application enterprise à succès reste un objectif stratégique majeur, un défi que le groupe de Jeff Bezos cherche à relever depuis plusieurs années face à des concurrents comme Microsoft Copilot ou Google Workspace AI. Amazon Quick s'inscrit dans cette ambition, en ciblant directement l'utilisateur final plutôt que les équipes IT, avec une approche tarifaire simple et une intégration large des outils déjà en place dans les entreprises.

UELes professionnels et PME français peuvent désormais accéder à des agents IA bureautiques sans compte cloud préalable à 20 $/mois, abaissant la barrière d'entrée pour l'automatisation des tâches bureautiques dans les petites structures.

OutilsOutil
1 source
Musk et Altman s'affrontent au procès qui déterminera l'avenir d'OpenAI
245Ars Technica AI 

Musk et Altman s'affrontent au procès qui déterminera l'avenir d'OpenAI

Le procès entre Elon Musk et OpenAI s'est ouvert cette semaine devant un tribunal californien. Musk, cofondateur et ancien donateur majeur de l'organisation, attaque Sam Altman et la direction d'OpenAI en affirmant que la société a trahi sa mission originelle : garantir que l'intelligence artificielle bénéficie à l'humanité et non à une poignée de milliardaires. L'audience, très attendue dans le secteur technologique, oppose deux des figures les plus influentes de l'IA mondiale. Musk cherche à démontrer qu'Altman a sciemment orienté OpenAI vers une logique commerciale au détriment de ses engagements fondateurs, avec la complicité tacite d'un conseil d'administration dont la confiance envers le PDG serait, selon des sources internes, de plus en plus fragile. Les enjeux dépassent largement la querelle personnelle entre deux ego de milliardaires. Si Musk obtient gain de cause, OpenAI pourrait être contraint d'abandonner son projet de transformation en entité à but lucratif, une évolution stratégique sur laquelle l'organisation mise pour lever les capitaux nécessaires à ses ambitions. La structure hybride envisagée, où un bras commercial finance la mission nonprofit, serait remise en cause. Plus concrètement, Sam Altman risquerait de perdre son siège au conseil d'administration, et Greg Brockman, président et cofondateur, pourrait également être écarté de ses fonctions. Ce sont donc la gouvernance, les ressources et l'orientation stratégique d'une des entreprises les plus valorisées au monde qui sont en jeu. OpenAI a été fondée en 2015 comme organisation à but non lucratif, avec la participation initiale de Musk, d'Altman et d'autres figures de la Silicon Valley, précisément pour contrebalancer le pouvoir croissant des géants technologiques sur le développement de l'IA. Musk a quitté le conseil en 2018, officiellement pour éviter des conflits d'intérêts avec Tesla, mais des tensions persistantes avec Altman ont depuis alimenté une rivalité publique. Depuis, OpenAI a levé des milliards de dollars auprès d'investisseurs privés dont Microsoft, et s'est rapprochée d'un modèle capitalistique classique. Le verdict de ce procès pourrait redéfinir les règles du jeu pour toute l'industrie de l'IA, en posant la question centrale de la responsabilité des laboratoires qui prétendent développer cette technologie dans l'intérêt général.

UESi le tribunal contraint OpenAI à abandonner sa transformation en entité lucrative, les nombreuses entreprises et développeurs européens qui s'appuient sur ses API pourraient voir la trajectoire et la disponibilité de ces services remises en question.

Amazon Quick Flows automatise les tâches répétitives
246AWS ML Blog 

Amazon Quick Flows automatise les tâches répétitives

Amazon a lancé Quick Flows, une fonctionnalité d'automatisation des flux de travail intégrée à sa suite Amazon Quick, qui permet de créer des automatisations intelligentes en langage naturel, sans écrire une seule ligne de code ni posséder la moindre expertise en machine learning. Le principe est simple : l'utilisateur décrit en quelques phrases ce qu'il souhaite automatiser, et le système génère automatiquement le flux correspondant. Amazon illustre l'outil avec deux cas d'usage concrets : un analyseur de performance financière, capable de collecter en temps réel des cours boursiers, des ratios clés (PER, capitalisation boursière, revenus), des titres d'actualité financière et des recommandations d'analystes à partir d'un simple nom d'entreprise ou d'un ticker symbol, ainsi qu'un système d'automatisation de l'onboarding des employés. Quick Flows s'inscrit dans la suite Amazon Quick, un ensemble de fonctionnalités d'IA permettant d'analyser des données et d'obtenir des insights via des conversations en langage naturel. La seule condition d'accès est de disposer d'un compte AWS actif avec Amazon Quick activé. L'enjeu de productivité est considérable. Une tâche aussi banale que la compilation d'un rapport hebdomadaire, qui exige de copier manuellement des données depuis plusieurs systèmes puis de les reformater pour différents interlocuteurs, peut absorber plusieurs heures chaque lundi. Multipliée sur l'ensemble d'une équipe, la perte de temps devient structurelle. Quick Flows vise à libérer ces heures au profit de travaux à plus forte valeur ajoutée. En rendant l'automatisation accessible à des profils non techniques, c'est potentiellement l'ensemble des fonctions support, finance, RH ou opérations qui peuvent reconfigurer leurs processus sans dépendre d'une équipe d'ingénieurs. La capacité à partager des flux créés avec d'autres membres d'une équipe renforce encore la dimension collaborative et l'impact organisationnel de l'outil. Cette annonce s'inscrit dans la compétition intense que se livrent les grands acteurs du cloud pour proposer des couches d'automatisation basées sur l'IA générative. Microsoft, avec Power Automate et Copilot Studio, et Google, avec ses Workspace Flows, ont déjà pris position sur ce segment. Amazon répond avec une approche centrée sur l'interface conversationnelle et l'intégration native à l'écosystème AWS. Quick Flows permet également de convertir une conversation existante avec un agent de chat en flux automatisé, ce qui réduit encore la friction à l'adoption. La génération de contenu par l'IA restant par nature variable, Amazon prévient explicitement que les résultats peuvent différer d'une exécution à l'autre. La prochaine étape annoncée consiste à passer de l'analyse financière à des automatisations plus complexes comme l'onboarding RH, signal que la plateforme vise des cas d'usage à fort volume de données et d'interactions humaines.

UELes entreprises européennes utilisant AWS peuvent désormais automatiser leurs flux de travail en langage naturel sans compétences techniques, dans un segment où Microsoft et Google proposent déjà des offres concurrentes.

OutilsOutil
1 source
☕️ La Chine bloque l’acquisition de Manus par Meta
247Next INpact 

☕️ La Chine bloque l’acquisition de Manus par Meta

Le gouvernement chinois a officiellement bloqué le rachat de Manus par Meta, mettant fin à une opération évaluée à 2 milliards de dollars annoncée en décembre 2025. La Commission nationale du développement et de la réforme a ordonné aux deux parties de retirer leur dossier, après une enquête du ministère chinois du Commerce sur The Butterfly Effect, la startup derrière Manus. Fondée par des entrepreneurs chinois et relocalisée à Singapour pour tenter d'échapper à la réglementation de Pékin, la société n'a pas réussi à contourner la surveillance des autorités. L'accord prévoyait notamment que Xiao Hong, fondateur et directeur général de Manus, rejoigne Meta en tant que vice-président au siège californien de l'entreprise. Meta n'a fait aucun commentaire sur ce dernier rebondissement. L'échec de cette acquisition prive Meta d'une technologie particulièrement convoitée : Manus développe des agents IA capables d'exécuter des missions complexes de façon autonome, un segment en pleine explosion où se positionnent aussi des acteurs comme OpenAI. La startup avait créé l'événement en mars 2025, quelques semaines seulement après l'onde de choc DeepSeek, et affichait déjà plus de 100 millions de dollars de revenus annuels récurrents après seulement huit mois d'existence. Meta comptait intégrer les agents Manus dans ses produits grand public et professionnels, dont son assistant Meta AI, ce qui aurait représenté un accélérateur majeur dans la course aux agents autonomes face à Google et Microsoft. Le dossier illustre la tension croissante entre les ambitions technologiques des géants américains et les intérêts stratégiques de Pékin sur son industrie IA. La Chine exerce une pression explicite sur les fondateurs de startups pour qu'ils restent sur le territoire national, et les lois encadrant les investissements étrangers, les transferts de technologie et les fusions transfrontalières se sont considérablement durcies. Côté américain, des restrictions interdisent par ailleurs aux investisseurs américains de financer directement des entreprises IA chinoises, transformant ce type d'opération en exercice d'équilibrisme juridique à double risque. La relocalisation à Singapour, stratégie employée par plusieurs startups chinoises pour lever des fonds internationaux, n'a pas suffi à protéger The Butterfly Effect. Avec cet échec, Manus devra trouver d'autres voies de croissance ou de financement, tandis que Meta repart sans l'une des acquisitions les plus ambitieuses de sa stratégie IA en 2026.

UELe durcissement des règles chinoises sur les investissements étrangers et les transferts de technologie crée un précédent géopolitique qui complique également les stratégies d'acquisition des entreprises européennes opérant dans l'IA à l'international.

Google Cloud propose un nouvel outil pour organiser les données de votre entreprise
248Le Big Data 

Google Cloud propose un nouvel outil pour organiser les données de votre entreprise

Google Cloud a annoncé le 22 avril 2026, lors de son événement Google Cloud Next, le lancement de Knowledge Catalog, un moteur de contexte unifié intégré à sa plateforme Dataplex. L'outil agrège les métadonnées issues de multiples systèmes, aussi bien natifs comme BigQuery que des plateformes tierces, pour créer une source unique de vérité accessible en temps réel. Au-delà du simple inventaire technique, Knowledge Catalog automatise l'enrichissement des données en analysant schémas, requêtes et contenus non structurés pour générer des descriptions en langage naturel, construire des glossaires métiers et cartographier les relations entre entités. Des agents spécialisés, dont un basé sur LookML, permettent de générer et harmoniser automatiquement les règles métier. Des entreprises comme Bloomberg Media exploitent déjà cette approche pour permettre à des utilisateurs non techniques d'interroger des lacs de données complexes via des requêtes en langage courant. Le problème que Google Cloud cherche à résoudre est structurel : les agents d'IA en entreprise produisent des résultats médiocres non pas par manque de puissance de calcul, mais par manque de contexte fiable. Lorsque les mêmes indicateurs coexistent sous plusieurs définitions selon les équipes, l'automatisation devient fragile et l'analyse peu fiable. En unifiant ce socle sémantique, Knowledge Catalog permet aux agents de raisonner sur des bases cohérentes et partagées, réduisant les erreurs d'interprétation et accélérant l'accès à l'information. L'intégration avec Gemini renforce encore ce dispositif : même des fichiers bruts non structurés deviennent exploitables directement dans l'écosystème data. Google introduit également la notion de "produits de données", des ensembles packagés conçus pour être consommés directement par des agents ou des équipes métier, ce qui marque un changement de paradigme dans la façon dont les organisations distribuent l'accès à la donnée. La sortie de Knowledge Catalog s'inscrit dans une course que se livrent les grands fournisseurs cloud pour devenir la couche d'infrastructure de référence des entreprises qui déploient des agents d'IA à grande échelle. Microsoft, avec son écosystème Fabric et ses connecteurs Copilot, et AWS, avec son offre autour de Bedrock et des catalogues de données Lake Formation, avancent sur le même terrain. Le défi commun est de dépasser la promesse technique pour s'imposer comme le standard de gouvernance des données en contexte agentique. Pour Google Cloud, qui dispose d'un avantage compétitif avec Gemini et BigQuery, ce catalogue universel représente un levier pour verrouiller les grands comptes dans son écosystème. La prochaine étape sera d'observer si l'enrichissement automatique tient ses promesses à l'échelle, là où la curation manuelle a toujours montré ses limites.

UELes entreprises européennes déployant des agents IA sur Google Cloud peuvent améliorer la gouvernance de leurs données métier, sans impact réglementaire ou institutionnel spécifique pour la France ou l'UE.

OutilsOutil
1 source
Anthropic et la stratégie marketing de la peur autour de sa nouvelle IA Mythos (2/3)
249Next INpact 

Anthropic et la stratégie marketing de la peur autour de sa nouvelle IA Mythos (2/3)

Le 7 avril dernier, Anthropic a annoncé Mythos Preview, un modèle d'intelligence artificielle spécialisé dans la cybersécurité, en mettant en avant sa capacité à avoir déjà identifié "des milliers de vulnérabilités critiques", dont des failles dites 0-day, c'est-à-dire inconnues des éditeurs concernés. Pour contrôler les risques de prolifération, Anthropic a restreint l'accès de Mythos à une cinquantaine d'entreprises et organisations américaines gérant des infrastructures logicielles critiques, regroupées au sein du projet Glasswing. Seules onze d'entre elles ont été nommées publiquement : AWS, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorganChase, la Linux Foundation, Microsoft, NVIDIA et Palo Alto Networks. Hors des États-Unis, seul l'AI Security Institute britannique (AISI) a pu évaluer le modèle à ce stade, tandis que plusieurs institutions européennes tentent depuis de négocier un accès. Cette stratégie de lancement illustre un usage délibéré de ce que le secteur tech désigne par l'acronyme FUD, pour "Fear, Uncertainty and Doubt", soit peur, incertitude et doute. En agitant la menace d'une IA capable de découvrir des failles à grande échelle tout en en limitant l'accès, Anthropic a réussi à générer une fébrilité considérable, y compris au plus haut niveau politique. L'administration Trump, qui menaçait encore récemment de blacklister Anthropic, a finalement invité le PDG Dario Amodei à la Maison-Blanche la semaine passée pour évoquer "des possibilités de collaboration", selon Politico. L'Office of Management and Budget aurait même déjà informé les agences fédérales américaines qu'elles allaient prochainement recevoir un accès à Mythos, d'après Bloomberg. L'histoire du FUD dans la tech remonte aux années 1970, quand IBM utilisait des discours anxiogènes pour freiner la concurrence, une rhétorique reprise plus tard par Microsoft pour dépeindre Linux comme une menace. Avec Mythos, Anthropic n'attaque pas directement ses concurrents, mais joue sur la même mécanique : l'exclusivité d'accès alimente l'inquiétude en Europe, où des gouvernements craignent d'être tenus à l'écart d'un outil potentiellement décisif sur le plan géopolitique. Cette anxiété s'inscrit dans un contexte plus large où l'IA semble, pour l'instant, davantage profiter aux attaquants qu'aux défenseurs, renforçant la pression sur les États à ne pas rater le virage. Que Trump se retrouve simultanément à courtiser Anthropic en justice et à lui ouvrir les portes des agences fédérales illustre bien la contradiction inhérente à cette course : personne ne veut être le dernier à accéder à l'outil qu'il redoute.

UELes institutions européennes tentent activement de négocier un accès à Mythos sans y être parvenues à ce stade, alimentant une anxiété géopolitique réelle face au risque d'exclusion d'un outil potentiellement décisif en matière de cybersécurité d'État.

SécuritéOpinion
1 source
Les audiences synthétiques IA sont déjà là et s'apprêtent à bouleverser le conseil
250VentureBeat AI 

Les audiences synthétiques IA sont déjà là et s'apprêtent à bouleverser le conseil

Les "audiences synthétiques", des versions numériques de personnes réelles simulées par l'IA, sont en train de bousculer l'industrie du conseil et des études de marché. Des startups comme Electric Twin, Artificial Societies et Aaru, ainsi que le géant centenaire Dentsu, ont déjà commercialisé des outils permettant de sonder virtuellement des milliers de profils en quelques minutes, pour quelques dollars. Ce qui nécessitait autrefois quatre mois de terrain, deux mois de mise en forme et des dizaines de milliers d'euros de budget peut désormais être accompli en deux minutes et pour un coût marginal. Le principe : on fournit à un modèle d'IA des informations détaillées sur une personne ou un type de profil, et on lui demande de simuler ses opinions, comportements et décisions face à une série de questions, comme si l'on sondait un vrai individu. L'impact potentiel sur l'ensemble du secteur du conseil, marketing, sondages, études consommateurs, veille stratégique, est considérable. Les cabinets comme McKinsey, Nielsen, Gartner ou Publicis, dont les modèles économiques reposent en partie sur la collecte et l'analyse d'opinions humaines, sont directement exposés. Un article de référence publié en 2024 par Park et al. à Stanford a établi qu'une IA peut reproduire les réponses humaines à des questionnaires avec une précision moyenne de 85 %, dépassant les 90 % sur certaines portions de grandes enquêtes sociales. Le cabinet de capital-risque Andreessen Horowitz (a16z) résume la promesse en trois mots : "plus rapide, plus intelligent, moins cher". Si la rapidité et le coût sont incontestables, la précision reste, elle, un point de débat ouvert. WPP, le géant mondial de la communication dont les effectifs et le chiffre d'affaires rivalisent avec ceux de petits États européens, illustre bien les tensions et les synergies en jeu. L'auteur de l'analyse, qui y a travaillé de 2023 à 2025 au siège londonien, y a construit des outils similaires pour de nombreux groupes du Fortune 500 et conseillé des chercheurs de la New York University. WPP s'est depuis tourné vers des partenariats avec des startups tout en développant ses propres solutions internes. Le principal frein à l'adoption reste la méfiance des grandes entreprises face au risque de fuite de données, une crainte que l'auteur juge plus émotionnelle que rationnelle, en soulignant que ces mêmes entreprises confient déjà leurs données sensibles à Microsoft, Google ou Amazon. Les prochaines années seront décisives : ce sont les acheteurs de ces études, les grands groupes internationaux, qui dicteront la vitesse et la forme de cette transformation.

UEPublicis (groupe français) et WPP (groupe britannique) sont directement exposés à la disruption de leurs modèles économiques fondés sur les études consommateurs, avec des implications stratégiques immédiates pour les cabinets de conseil et agences de communication européens.

OutilsOutil
1 source