Aller au contenu principal

Dossier Microsoft — page 10

1056 articles · page 10 sur 22

Microsoft et l'IA : Copilot, l'intégration d'OpenAI dans Azure et Office, les modèles maison et les annonces produits suivies au fil de l'actualité.

Comment xAI Colossus redéfinit les règles de la course à l’IA
451Le Big Data InfrastructureOpinion

Comment xAI Colossus redéfinit les règles de la course à l’IA

En mars 2023, Elon Musk fonde xAI pour affronter directement OpenAI, Google et Meta dans la course aux grands modèles de langage. Le premier modèle, Grok, sort fin 2023 avec des résultats prometteurs, mais l'entreprise se heurte rapidement à un obstacle structurel majeur : elle ne possède aucune infrastructure propre et loue sa puissance de calcul auprès de fournisseurs cloud comme Oracle. Pour briser cette dépendance, Musk lance dès le printemps 2024 un chantier d'une rapidité inédite. xAI rachète une ancienne usine Electrolux de 73 000 mètres carrés à Memphis, Tennessee, et y déploie le supercalculateur Colossus. Début 2026, le site concentre environ 555 000 processeurs NVIDIA interconnectés, principalement des H100 et H200 dans le premier bloc (Colossus 1), et la nouvelle architecture Blackwell GB200/GB300 dans le second (Colossus 2), auxquels s'ajoute une extension satellitaire en cours à Southaven. À près de 35 000 dollars l'unité, le seul achat des composants dépasse les 18 milliards de dollars. Cette infrastructure redéfinit les rapports de force dans l'industrie de l'IA. En contrôlant son propre parc de calcul, xAI s'affranchit des délais et des contraintes imposés par les fournisseurs tiers, ce qui lui permet d'accélérer l'entraînement de ses modèles au rythme qu'elle impose. La densité thermique extrême générée par 555 000 puces a nécessité l'abandon du refroidissement par air au profit d'un système à eau intégral en circuit fermé, fourni par Dell et Supermicro, qui capte la chaleur directement sur le silicium et réduit significativement les coûts d'électricité liés à la climatisation. Sur le plan réseau, xAI a fait le choix de rejeter l'InfiniBand, standard dominant mais coûteux et en rupture mondiale, pour déployer la plateforme NVIDIA Spectrum-X Ethernet, avec routage adaptatif et protocole RoCE, afin d'éliminer la latence de queue qui paralyse les clusters lors des échanges massifs de paramètres entre processeurs. Ce projet s'inscrit dans une rivalité technologique et géopolitique qui dépasse largement xAI. La puissance de calcul est devenue la ressource stratégique centrale de l'IA : qui contrôle les clusters contrôle le rythme d'innovation. Microsoft, Google et Amazon ont chacun engagé des dizaines de milliards dans leurs propres datacenters, tandis que la pénurie mondiale de puces NVIDIA maintient une pression constante sur les acteurs moins capitalisés. En construisant Colossus en moins d'un an, là où l'industrie estimait le délai à deux ans minimum, xAI a envoyé un signal clair sur sa capacité d'exécution. La prochaine étape sera de transformer cette puissance brute en avance technologique durable face à des concurrents qui ne restent pas immobiles.

UELa concentration de capacité de calcul chez les acteurs américains creuse l'écart avec les laboratoires et startups européens, renforçant leur dépendance aux infrastructures cloud extérieures à l'UE.

1 source
AgentOps : déployer des agents IA à grande échelle avec Amazon Bedrock AgentCore
452AWS ML Blog 

AgentOps : déployer des agents IA à grande échelle avec Amazon Bedrock AgentCore

Amazon Web Services a présenté AgentOps, une nouvelle discipline opérationnelle pour déployer, gérer et améliorer les agents IA en production, en s'appuyant sur sa plateforme Amazon Bedrock AgentCore. Publié début juin 2026, ce cadre de référence s'articule autour de quatre piliers : gouvernance et sécurité, construction et opérations, évaluation, et observabilité. Bedrock AgentCore permet de déployer des agents IA compatibles avec n'importe quel modèle de langage et n'importe quel framework open source, en passant du développement local à la production sans gérer d'infrastructure. AWS propose une architecture de référence complète couvrant l'ensemble du cycle de vie DevOps adapté aux agents : planification, développement, construction, test, déploiement et maintenance. Le besoin derrière AgentOps est concret : contrairement aux pipelines classiques, les agents IA prennent des décisions autonomes et non déterministes, ce qui rend le débogage difficile, les coûts imprévisibles et le contrôle qualité complexe. AgentOps répond à ces défis en traitant chaque agent, outil et configuration mémoire comme un artefact versionné avec son propre pipeline CI/CD. L'évaluation s'effectue à quatre niveaux : l'outil individuel, le tour de conversation, le résultat de session et le système global, aussi bien en développement qu'en production. L'observabilité couvre quatre couches de télémétrie pour tracer chaque décision d'agent, surveiller les baisses de qualité et mesurer le coût par interaction. Ce lancement s'inscrit dans une course industrielle autour de l'IA agentique, où AWS, Google, Microsoft et OpenAI cherchent à proposer des plateformes complètes pour industrialiser le déploiement d'agents. La complexité opérationnelle croissante, notamment la gestion des identités d'agents, des protocoles d'authentification inter-agents (A2A), du Model Context Protocol (MCP) et des mécanismes de contrôle humain (human-in-the-loop), pousse les entreprises à chercher des cadres structurés. Amazon Bedrock AgentCore se positionne comme une réponse cloud-native à ces enjeux, en intégrant nativement sécurité, registre d'outils, gestion de l'état et limites d'exécution. Les suites prévisibles incluent l'adoption de ces pratiques AgentOps dans les grandes organisations, ainsi qu'une pression croissante sur les équipes DevOps pour adapter leurs outils et processus à la nature non déterministe des systèmes agentiques.

UELes entreprises françaises et européennes déployant des agents IA sur AWS peuvent adopter ce cadre AgentOps pour structurer leurs pipelines CI/CD et leur observabilité, sans impact réglementaire spécifique à la France ou l'UE.

OutilsActu
1 source
Asana rachète Stack AI pour renforcer ses agents IA no-code
453Le Big Data 

Asana rachète Stack AI pour renforcer ses agents IA no-code

Asana a annoncé l'acquisition de Stack AI, une startup spécialisée dans la création d'agents IA no-code et l'orchestration de workflows entre systèmes d'entreprise. L'opération, dont le montant n'a pas été divulgué, vise à doter la plateforme de gestion de projets d'une couche d'automatisation opérationnelle capable de connecter des environnements aussi divers que Salesforce, Oracle, AWS ou DocuSign. Stack AI s'est bâti une réputation solide dans les secteurs réglementés, santé, services financiers, services professionnels, précisément grâce à ses engagements en matière de gouvernance, de sécurité et de fiabilité des flux automatisés. L'intégration prévue associera les capacités d'exécution de Stack AI au "Work Graph" d'Asana, la couche de données organisationnelles qui structure projets, responsabilités et historiques de collaboration au sein des équipes. Cette acquisition répond à un problème concret que rencontre l'industrie : la plupart des solutions IA actuelles restent cantonnées à des usages individuels, résumer un document, répondre à une question, assister un employé dans une tâche isolée. Elles peinent à orchestrer des processus complets qui traversent plusieurs équipes et plusieurs logiciels. Avec Stack AI, Asana vise à passer du copilote personnel à l'automatisation opérationnelle à grande échelle. Les entreprises pourront concevoir des workflows qui traitent des demandes IT, des processus de conformité, du support client ou des opérations financières sans recourir à du développement logiciel complexe. L'enjeu devient ainsi opérationnel plutôt que conversationnel, ce qui représente un changement de paradigme significatif pour l'ensemble du marché des plateformes de collaboration. Asana se positionne depuis plusieurs mois sur la notion de "human-agent teams", des environnements où des agents IA travaillent collectivement avec des humains, avec validations, transferts de tâches, approbations et mémoire partagée, plutôt que d'opérer comme des outils parallèles déconnectés des opérations réelles. Le PDG Dan Rogers a formulé clairement l'ambition : selon lui, la valeur durable ne résidera pas dans les modèles IA eux-mêmes, mais dans la capacité des plateformes à coordonner outils, données, gouvernance et exécution métier dans un flux cohérent. Cette vision distingue Asana des acteurs focalisés sur les assistants conversationnels généralistes, et la place en concurrence directe avec des plateformes comme ServiceNow ou Microsoft 365 Copilot, qui cherchent eux aussi à devenir le système nerveux central de l'entreprise automatisée. L'intégration de Stack AI dans les produits AI Studio et AI Teammates d'Asana devrait être précisée dans les prochains mois.

UELes entreprises européennes en quête d'automatisation de workflows métier sans développement logiciel pourront à terme bénéficier de nouvelles capacités no-code, sans impact réglementaire direct sur la France ou l'UE.

BusinessOpinion
1 source
SLM (Small Language Models) : ces modèles IA conviennent-ils aux entreprises ?
454Le Big Data 

SLM (Small Language Models) : ces modèles IA conviennent-ils aux entreprises ?

Face à la montée en puissance des grands modèles de langage généralistes, une nouvelle tendance s'installe dans les entreprises : les SLM, ou Small Language Models. Ces modèles compacts fonctionnent avec un nombre réduit de paramètres et sont entraînés sur des jeux de données ciblés plutôt que sur l'intégralité du web. Contrairement aux LLM classiques qui nécessitent des serveurs spécialisés et des centres de calcul coûteux, les SLM peuvent tourner directement sur l'infrastructure interne d'une entreprise. Leur architecture allégée leur permet d'être déployés sur des machines standard, sans dépendance au cloud. La contrepartie est claire : leur base de connaissances est volontairement restreinte, ce qui rend la qualité des données d'entraînement absolument critique. Un SLM mal entraîné sur des données médiocres devient rapidement inutilisable. L'attrait concret pour les entreprises tient à quatre avantages opérationnels majeurs. D'abord, le coût : chaque requête vers un grand modèle distant génère une dépense, alors qu'un SLM local traite les données sans frais supplémentaires. Ensuite, la vitesse : sans traversée des couches réseau, les réponses arrivent sensiblement plus vite. La confidentialité constitue un troisième argument de poids : aucun document ne quitte le réseau interne, ce qui répond directement aux exigences de nombreux secteurs réglementés comme la finance, la santé ou le juridique. Enfin, la sobriété énergétique : ces modèles consomment nettement moins de ressources matérielles, ce qui réduit à la fois la facture électrique et les besoins en équipement. Un assistant SLM dédié au support client peut par exemple maîtriser parfaitement les procédures internes et les produits d'une entreprise, sans aucun risque de fuite de données vers un tiers. Ce tournant vers les SLM s'inscrit dans une remise en question plus large d'une décennie de course aux grands modèles. Pendant longtemps, l'industrie technologique a postulé que la taille était synonyme de performance, justifiant des investissements colossaux en infrastructure cloud. Cette logique atteint ses limites économiques et pratiques pour une majorité d'entreprises qui n'ont pas les moyens ni les besoins de Google ou Microsoft. Les grands acteurs ont d'ailleurs anticipé ce virage : Microsoft a lancé sa gamme Phi, Google ses modèles Gemma, Meta ses versions légères de LLaMA. La compétition se déplace désormais vers l'efficience plutôt que la seule puissance brute. Pour les organisations qui cherchent une IA fiable, rapide et maîtrisée, les SLM représentent une voie d'adoption plus réaliste que le recours systématique aux géants du cloud.

UELes SLM représentent une option stratégique pour les entreprises européennes soumises au RGPD, permettant de traiter des données sensibles en interne sans les transmettre à des services cloud étrangers.

💬 J'ai vu trop de projets IA bloqués au bout de trois mois parce que le DSI refusait d'envoyer des données patients ou des contrats dans le cloud américain. Les SLM répondent exactement à ça : tu gardes tout en interne, ça tourne sur du hardware qu'une PME peut se payer, et le RGPD devient un avantage plutôt qu'un frein. Le seul truc sur lequel faut pas se louper, c'est la qualité des données d'entraînement, parce que compact et mal nourri, ça donne inutilisable en quinze jours.

LLMsOutil
1 source
Liquid AI lance LFM2.5-8B-A1B : la taille ne fait-elle plus vraiment la performance ?
455Le Big Data 

Liquid AI lance LFM2.5-8B-A1B : la taille ne fait-elle plus vraiment la performance ?

Liquid AI a lancé le 28 mai 2026 son nouveau modèle LFM2.5-8B-A1B, une intelligence artificielle conçue pour fonctionner directement sur des appareils grand public : smartphones, ordinateurs portables, PC, mais aussi des robots et des serveurs légers. Le modèle repose sur une architecture Mixture-of-Experts (MoE) : il dispose de 8 milliards de paramètres au total, mais n'en active qu'1,5 milliard par requête, ce qui réduit drastiquement les besoins en puissance de calcul. Par rapport à son prédécesseur LFM2-8B-A1B, sorti en 2025, il intègre une fenêtre de contexte élargie de 32 768 à 128 000 tokens, un vocabulaire doublé à 128 000 entrées, et un volume d'entraînement multiplié par trois, passant de 12 à 38 billions de tokens. Il introduit également un raisonnement explicite en chaîne de réflexion avant de produire ses réponses, une première pour cette gamme. Il est compatible nativement avec llama.cpp, MLX, vLLM et SGLang. Cette sortie est significative parce qu'elle cible directement un angle mort de l'IA actuelle : la dépendance au cloud. La quasi-totalité des modèles performants exigent une infrastructure serveur coûteuse, ce qui les rend inaccessibles en usage local ou dans des contextes à faible connectivité. En faisant fonctionner une IA avancée directement sur le matériel de l'utilisateur, Liquid AI ouvre la voie à des applications plus privées, plus réactives et moins onéreuses. L'entreprise revendique les meilleures vitesses de sa catégorie sur CPU comme sur GPU, et des performances comparables à des modèles bien plus lourds sur des benchmarks de suivi d'instructions et de tâches agentiques. Le doublement du vocabulaire améliore aussi concrètement la qualité pour des langues non latines comme l'hindi, le thaï, l'arabe ou l'indonésien, jusqu'ici mal servies par les grands modèles occidentaux. Liquid AI s'inscrit dans un mouvement plus large d'optimisation des modèles dit "edge-first", qui vise à rapprocher l'IA du matériel plutôt que de la centraliser dans des datacenters. Face à des acteurs comme Google avec Gemma, Microsoft avec Phi ou Meta avec Llama, la startup mise sur une architecture hybride originale combinant MoE, GQA et blocs de convolution courte pour se différencier. L'ajout de phases d'apprentissage par renforcement pour réduire les hallucinations et améliorer le raisonnement suit également la tendance imposée par les modèles o1 d'OpenAI et DeepSeek-R1. La suite logique pour Liquid AI sera de démontrer ces performances dans des cas d'usage réels embarqués, là où la vitesse et la frugalité en ressources comptent autant que les scores sur des benchmarks académiques.

LLMsOpinion
1 source
META découvre à son tour l’économie du compute
456FrenchWeb 

META découvre à son tour l’économie du compute

Meta Platforms envisage de commercialiser une partie de sa gigantesque infrastructure informatique, une rupture stratégique majeure pour l'entreprise fondée par Mark Zuckerberg. Depuis plus de quinze ans, le groupe utilisait ses data centers exclusivement en interne pour faire fonctionner Facebook, Instagram et WhatsApp, sans jamais vendre de capacités cloud à des tiers. L'explosion des besoins en intelligence artificielle change la donne : Meta disposerait désormais d'une surcapacité de compute suffisante pour envisager une offre commerciale externe. Ce pivot potentiel placerait Meta en concurrence directe avec Amazon Web Services, Microsoft Azure et Google Cloud, les trois géants qui dominent aujourd'hui le marché mondial du cloud, estimé à plusieurs centaines de milliards de dollars. Pour les entreprises qui développent des modèles d'IA, une quatrième alternative crédible serait une opportunité de diversification et de pression à la baisse sur les prix. Meta apporterait une infrastructure taillée pour les workloads IA les plus exigeants, notamment grâce à ses clusters de GPU massivement parallèles. Cette évolution s'inscrit dans une logique que l'histoire de la tech a déjà validée : AWS est né des excédents d'infrastructure d'Amazon, et est devenu sa division la plus rentable. Meta, qui investit des dizaines de milliards de dollars par an en capital expenditure, cherche à rentabiliser ces actifs autrement que par la seule publicité. La question reste de savoir si le groupe possède la culture commerciale B2B nécessaire pour rivaliser avec des acteurs qui ont dix à vingt ans d'avance sur ce marché.

UESi Meta lance une offre cloud commerciale, les entreprises et startups européennes disposeraient d'un quatrième fournisseur d'infrastructure IA majeur, renforçant leur capacité de négociation et potentiellement réduisant leurs coûts de compute.

💬 L'histoire AWS, Meta l'a visiblement relue attentivement. Quand tu as des clusters GPU calibrés pour entraîner des modèles à l'échelle de Facebook et Instagram, laisser ça tourner à vide serait absurde. Reste à voir si Zuckerberg a les équipes commerciales B2B pour vendre ça aux DSI, parce qu'entre avoir l'infra et savoir la packager pour des clients enterprise, il y a un vrai fossé de culture.

InfrastructureOpinion
1 source
Meta lance une offensive commerciale pour accélérer l'adoption de ses outils IA en entreprise
457The Information AI 

Meta lance une offensive commerciale pour accélérer l'adoption de ses outils IA en entreprise

Meta Platforms a annoncé le lancement d'une nouvelle unité interne baptisée Enterprise Solutions, destinée à accélérer l'adoption de ses outils d'intelligence artificielle auprès des grandes entreprises. Selon un mémo interne signé par la directrice générale senior Naomi Gleit, cette organisation regroupera trois types de profils : des chefs de produit chargés de piloter les engagements clients, des ingénieurs data qui préparent les données des clients pour les intégrer dans les systèmes d'IA de Meta, et des ingénieurs logiciels qui connectent directement les outils Meta aux infrastructures opérationnelles des entreprises. Ce positionnement marque un tournant stratégique pour Meta, qui cherche à monétiser ses technologies d'IA au-delà de ses plateformes publicitaires. En plaçant ses propres ingénieurs et chefs de produit directement au sein des équipes de ses clients, l'entreprise mise sur une personnalisation poussée pour convaincre les directions informatiques et les grands comptes de faire confiance à ses solutions. C'est un modèle de vente à haute valeur ajoutée, qui cible clairement les budgets technologiques des entreprises du Fortune 500. Meta suit ainsi une tendance déjà bien établie dans le secteur : Google, Palantir et d'autres acteurs ont popularisé le concept d'ingénieurs déployés en avant-poste, ou "forward-deployed engineers", directement intégrés chez les clients pour adapter les solutions IA à leurs besoins spécifiques. Dans un marché de l'IA d'entreprise de plus en plus disputé, cette approche permet de créer des dépendances techniques profondes et de verrouiller la relation client sur le long terme, au moment où Microsoft, Google et Amazon s'affrontent également pour capter ces contrats.

UELes entreprises européennes pourraient être ciblées par cette offensive commerciale, mais les contraintes du RGPD et les exigences de souveraineté numérique freinent l'adoption d'infrastructures Meta dans les systèmes d'information européens.

BusinessOpinion
1 source
Cognition, créateur de l'agent de code Devin, plus que double sa valorisation à 26 milliards de dollars en moins de neuf mois
458The Decoder 

Cognition, créateur de l'agent de code Devin, plus que double sa valorisation à 26 milliards de dollars en moins de neuf mois

Cognition, la startup américaine à l'origine de Devin, l'agent de développement logiciel piloté par intelligence artificielle, a finalisé une levée de fonds dépassant le milliard de dollars, portant sa valorisation à plus de 26 milliards de dollars. Cette opération, bouclée en moins de neuf mois après un précédent tour de table, plus que double la valorisation de l'entreprise et s'impose comme l'une des plus importantes jamais réalisées dans le secteur des agents IA spécialisés dans le code. Devin avait été présenté en mars 2024 comme le premier "ingénieur logiciel autonome" capable de planifier, coder, tester et déployer des applications sans intervention humaine. Ce financement illustre l'appétit spectaculaire des investisseurs pour les outils capables d'automatiser le développement logiciel, un marché estimé à plusieurs centaines de milliards de dollars. Pour les entreprises tech, l'enjeu est concret : réduire les coûts de développement, accélérer les cycles de production et potentiellement redéfinir le rôle des ingénieurs humains. Pourtant, la valeur opérationnelle réelle de Devin reste vivement discutée dans la communauté des développeurs, certains benchmarks indépendants ayant remis en question ses performances annoncées. Cognition évolue dans un secteur de plus en plus disputé, face à GitHub Copilot d'OpenAI et Microsoft, Cursor, ou encore des agents comme Claude Code d'Anthropic. La course aux agents de codage s'intensifie alors que les grands modèles de langage atteignent un niveau de compétence technique suffisant pour traiter des tâches de programmation complexes. Cette méga-levée signale que, malgré les débats sur les performances actuelles, les investisseurs parient sur un basculement prochain vers une automatisation large du génie logiciel.

BusinessActu
1 source
De l'idée à l'application IA : créer des assistants de recherche intelligents avec Strands
459AWS ML Blog 

De l'idée à l'application IA : créer des assistants de recherche intelligents avec Strands

Amazon Web Services a publié Strands Agents, un framework open source sous licence Apache 2.0 qui permet de construire un assistant de recherche IA fonctionnel en une trentaine de lignes de Python. L'outil s'appuie sur les modèles fondamentaux d'Amazon Bedrock pour doter les agents d'une capacité de raisonnement autonome, sans avoir à coder manuellement chaque étape logique. AWS affirme déjà utiliser Strands Agents en production dans plusieurs de ses propres services, notamment Amazon Q et AWS Glue. L'annonce s'accompagne de la présentation de Kiro, un environnement de développement intégré alimenté par l'IA, qui intègre un mécanisme d'extensions appelé "Kiro Powers" : plus de cinquante modules préconfigurés couvrant la conception, le déploiement, la sécurité et l'observabilité, installables en un clic. Le module Strands, par exemple, embarque la documentation du SDK, des guides de démarrage et les patterns d'API corrects pour que Kiro puisse générer des agents fiables dès le premier essai. L'enjeu est de taille pour les équipes de développement : orchestrer plusieurs appels d'API, gérer l'état des conversations et construire des agents capables de planifier leurs actions représentait jusqu'ici un chantier réservé aux spécialistes du traitement du langage naturel et des systèmes distribués. Strands Agents casse cette barrière grâce à une approche model-driven où c'est le LLM lui-même qui prend en charge la logique et l'enchaînement des outils, le développeur n'ayant plus qu'à fournir un prompt et une liste de fonctions décorées avec @tool. Le framework est agnostique en matière de fournisseur : il fonctionne avec Amazon Bedrock, Anthropic et OpenAI, et supporte des architectures allant du simple agent isolé aux réseaux multi-agents hiérarchiques. Les réponses en streaming temps réel le rendent particulièrement adapté aux interfaces interactives. Cette publication s'inscrit dans une offensive plus large d'AWS pour capter les développeurs dans l'écosystème d'agents IA, un marché en pleine structuration où Google, Microsoft et Anthropic proposent leurs propres frameworks et plateformes. En rendant Strands open source et en le couplant à un IDE maison, AWS mise sur l'effet de réseau et la fidélisation par les outils plutôt que par le seul accès aux modèles. La compatibilité native avec AWS Lambda et IAM Identity Center facilite le passage du prototype à la production sans réécriture, ce qui constitue un argument décisif pour les entreprises déjà ancrées dans l'écosystème cloud d'Amazon. Les prochaines étapes probables incluent l'extension de la bibliothèque de Kiro Powers par la communauté et l'intégration plus étroite de Strands avec d'autres services AWS d'analyse et d'automatisation.

UELes équipes de développement européennes peuvent adopter Strands Agents pour accélérer leurs projets d'agents IA, mais l'intégration native avec Lambda et IAM renforce la dépendance à l'écosystème AWS, ce qui soulève des questions de souveraineté numérique pour les entreprises françaises et européennes.

OutilsOutil
1 source
Le pape Léon XIV demande de « désarmer l’IA » : Anthropic était là pour écouter
460Frandroid 

Le pape Léon XIV demande de « désarmer l’IA » : Anthropic était là pour écouter

Le pape Léon XIV a publié Magnifica Humanitas, la première encyclique pontificale entièrement consacrée à l'intelligence artificielle, appelant la communauté internationale à « désarmer l'IA » et à encadrer strictement son développement. La cérémonie a réuni des représentants du monde technologique, parmi lesquels le cofondateur d'Anthropic, présent au Vatican pour l'occasion. Ce document officiel de l'Église catholique marque une prise de position doctrinale sans précédent sur les technologies numériques, positionnant Rome comme acteur du débat mondial sur la gouvernance de l'IA. La portée symbolique est considérable : en s'adressant à 1,4 milliard de catholiques et au-delà, le pape fait entrer l'IA dans le corpus éthique de l'une des institutions les plus influentes du monde. La présence d'Anthropic n'est pas anodine, elle signale une volonté de dialogue entre la Silicon Valley et les autorités morales traditionnelles, au moment où les régulateurs peinent à trouver un cadre universel. Pour les entreprises d'IA, obtenir une forme de légitimité vaticane représente un atout rhétorique non négligeable face aux critiques. Ce rapprochement s'inscrit dans une tendance plus large : depuis 2020, le Vatican multiplie les initiatives sur l'éthique numérique, ayant notamment signé un appel conjoint avec Microsoft et IBM sur l'IA responsable. Léon XIV, élu en 2025, semble vouloir accentuer cet engagement. Anthropic, de son côté, se distingue de ses concurrents en faisant de la sécurité et de l'alignement des IA un argument central de sa communication. La question est désormais de savoir si ce dialogue Vatican-Silicon Valley débouchera sur des engagements concrets ou restera au stade des déclarations d'intention.

UELa prise de position doctrinale du Vatican pourrait peser sur les débats éthiques et réglementaires en cours au niveau européen, notamment dans des pays catholiques membres de l'UE comme la France, l'Italie ou la Pologne.

Google Gemini : créer des plans de présentation en quelques secondes
461The Information AI 

Google Gemini : créer des plans de présentation en quelques secondes

Google a intégré dans Gemini une fonctionnalité qui permet aux dirigeants d'entreprise de générer en quelques secondes des plans de présentation structurés, là où les équipes consacraient auparavant des jours entiers à cette tâche. Le processus repose sur quatre étapes : rassembler ses idées brutes en cinq minutes de brainstorming libre, les charger dans un notebook Gemini aux côtés de documents existants (rapports trimestriels, guidelines de marque, présentations passées), formuler un prompt en langage naturel ou via Gemini Live (mode vocal sur mobile), puis itérer par conversation pour affiner le résultat. L'outil peut ensuite produire une décomposition slide par slide ou un tableau structuré prêt à transmettre à l'équipe, et même démarrer la présentation directement via la fonction Canvas. L'enjeu est significatif pour les organisations qui consacrent des ressources considérables à préparer des présentations stratégiques. Google illustre le cas d'un CEO de SaaS préparant un keynote pour le lancement d'un produit IA majeur devant des clients enterprise : au lieu de plusieurs réunions de cadrage, de longues chaînes d'e-mails et de cycles de relecture, un plan de haut niveau peut être posé en quelques minutes, donnant à l'équipe un fil directeur immédiat. La capacité de Gemini à ingérer de grands volumes de documents comme contexte d'un prompt permet de personnaliser la sortie bien au-delà d'un simple squelette générique. Pour les entreprises dont les présentations peuvent conditionner des décisions commerciales majeures, le gain en temps de coordination et en itérations internes est potentiellement très élevé. Cette annonce s'inscrit dans la bataille que se livrent Google, Microsoft et OpenAI pour ancrer leurs assistants IA dans les flux de travail professionnels quotidiens. Microsoft a poussé Copilot dans PowerPoint et Word ; OpenAI a développé des capacités de génération de documents structurés dans ChatGPT. Google répond en capitalisant sur l'intégration native de Gemini dans son écosystème Workspace, avec des notebooks qui servent de mémoire persistante entre les sessions. La fonctionnalité de prompt vocal via Gemini Live vise à réduire encore la friction, en permettant de dicter ses instructions comme on le ferait avec un collaborateur. La prochaine étape logique serait une intégration encore plus profonde avec Google Slides pour générer directement des decks complets, une direction que Google semble clairement préparer avec la fonction Canvas déjà disponible.

UELa fonctionnalité est intégrée à Google Workspace utilisé par des millions d'entreprises françaises et européennes, ce qui peut accélérer l'adoption de l'IA générative dans les processus de travail quotidiens.

💬 C'est pas la vitesse qui change le jeu, c'est le contexte. Pouvoir charger ses anciens decks, ses rapports Q, ses guidelines de marque, et obtenir un plan qui sonne vraiment comme ta boîte plutôt qu'un squelette sorti de nulle part, c'est ce que les autres n'ont pas encore bien résolu. Bon, faut que Canvas tienne ses promesses ensuite.

OutilsOutil
1 source
CopilotKit redéfinit l'architecture IA à base d'agents en 2026
462MarkTechPost 

CopilotKit redéfinit l'architecture IA à base d'agents en 2026

CopilotKit, startup basée à Seattle et co-fondée par Atai Barkai et Uli Barkai, s'est imposée en 2026 comme l'un des acteurs centraux de l'infrastructure pour agents IA. La société a lancé en avril 2026 AIMock, un outil de test pour systèmes agentiques, et AG-UI, un protocole d'interaction entre agents et utilisateurs au sein des applications. AG-UI est aujourd'hui soutenu par Google, Microsoft, Amazon et Oracle, ainsi que par des frameworks majeurs comme LangChain, Mastra, PydanticAI et Agno. AWS l'a intégré dans son template FAST (Fullstack AgentCore Solution Template) et dans Bedrock AgentCore. Des SDKs communautaires couvrent déjà Kotlin, Go, Dart, Java, Rust, Ruby et C++, tandis que .NET, Nim, Flowise et Langflow sont en cours de développement. Atai Barkai enseigne par ailleurs un cours complet sur AG-UI chez DeepLearning.AI, couvrant un backend LangChain, un frontend React et AG-UI comme runtime. Ce que CopilotKit résout est concret : jusqu'ici, intégrer une IA dans une application signifiait coller un widget de chat dans un coin d'interface. L'utilisateur tapait, le modèle répondait en texte, et personne ne prenait en charge la traduction de cette réponse en action réelle. AG-UI comble le troisième maillon manquant de la pile agentique : MCP standardise l'accès aux outils externes, A2A coordonne les agents entre eux, AG-UI gère la couche d'interaction entre l'agent, l'application et l'utilisateur. Il permet le streaming en temps réel, la génération dynamique de composants d'interface, la synchronisation d'état bidirectionnelle, et les pauses "human-in-the-loop" où l'agent attend une confirmation avant d'agir. AIMock, lui, s'attaque à un problème que peu d'équipes osent admettre : les suites de tests pour agents sont, pour la plupart, de la fiction. Une requête agentique typique en 2026 traverse six ou sept services (LLM, serveur MCP, base vectorielle, reranker, API de recherche web, couche de modération, sous-agent A2A) et la plupart des équipes n'en simulent qu'un seul, laissant les autres non-déterministes et incontrôlés. L'analogie avancée par CopilotKit est parlante : AG-UI serait à la pile agentique ce que HTML est au web, la couche de présentation et d'interaction que TCP et HTTP rendent possible sans pouvoir la fournir eux-mêmes. Pendant des années, l'IA dans les logiciels est restée un outil passif, fonctionnel comme une calculatrice mais incapable d'agir de façon autonome. CopilotKit parie que l'avenir appartient aux agents qui vivent à l'intérieur des applications, comprennent le contexte de l'utilisateur, prennent des actions et génèrent des interfaces adaptées plutôt que de longs blocs de texte. Avec l'adoption par les grands fournisseurs cloud et l'entrée dans les cursus pédagogiques, la startup semble avoir franchi le cap qui sépare le protocole expérimental de l'infrastructure de production. La prochaine étape annoncée porte sur la persistance runtime, troisième chantier d'une feuille de route 2026 qui vise délibérément les angles morts de l'architecture agentique.

💬 L'idée du maillon manquant est bonne : MCP pour les outils, A2A pour la coordination, AG-UI pour l'utilisateur, la stack agentique commence à avoir une vraie colonne vertébrale. Ce qui me parle autant, c'est AIMock, parce que les suites de tests pour agents c'est de la fiction dans la plupart des équipes, et c'est enfin assumé. AWS dans Bedrock, Google et Microsoft embarqués, bon, sur le papier c'est le seuil qui sépare le protocole expérimental du vrai standard de prod.

InfrastructureOpinion
1 source
MagenticLite, MagenticBrain, Fara1.5 : une expérience à base d'agents optimisée pour les petits modèles
463Microsoft Research 

MagenticLite, MagenticBrain, Fara1.5 : une expérience à base d'agents optimisée pour les petits modèles

Microsoft Research AI Frontiers a publié MagenticLite, une application agentique expérimentale conçue pour fonctionner avec de petits modèles de langage. Successeur de Magentic-UI, MagenticLite opère simultanément dans le navigateur web et le système de fichiers local, au sein d'un seul workflow unifié. Elle repose sur deux modèles développés spécifiquement pour cette architecture : MagenticBrain, chargé du raisonnement, de la planification et de l'exécution de code en terminal, et Fara1.5, une famille de modèles dédiée aux tâches informatiques via le navigateur. Fara1.5 se décline en trois tailles, avec un modèle phare de 9 milliards de paramètres. Par rapport à son prédécesseur Fara-7B, il double presque les performances sur la navigation web et améliore significativement la gestion des formulaires, des sites nécessitant une authentification, et des tâches longues. Fara1.5 établit de nouveaux résultats de référence parmi les petits modèles de computer-use. L'enjeu central de cette publication est de démontrer qu'il est possible d'atteindre des performances agentiques élevées sans recourir à des modèles massifs et coûteux. En faisant tourner l'ensemble du système directement sur la machine de l'utilisateur, MagenticLite préserve la confidentialité des données et réduit drastiquement les coûts d'inférence. Le pari de Microsoft Research est que la capacité agentique repose davantage sur l'orchestration des outils et l'enchaînement d'actions que sur la quantité de connaissances encodées dans un modèle. Cette approche ouvre la voie à des agents capables d'automatiser des tâches réelles, recherche web, gestion de fichiers, remplissage de formulaires, sans dépendre d'une infrastructure cloud onéreuse ni exposer les données à des serveurs distants. Ce projet s'inscrit dans une course plus large que se livrent les grands acteurs de l'IA pour démocratiser les agents autonomes. Face à des systèmes comme Claude Computer Use d'Anthropic ou les agents de Google DeepMind, Microsoft Research mise sur la coconception intégrale : données d'entraînement, architecture des modèles, harnais d'exécution et interface utilisateur ont été repensés ensemble plutôt qu'en silos. Les évaluations ont été construites à partir de scénarios réels plutôt que de benchmarks standardisés seuls, ce qui reflète une volonté de mesurer l'utilité concrète plutôt que des scores abstraits. Les trois composants sont disponibles séparément mais conçus pour fonctionner ensemble, laissant entrevoir une trajectoire vers des agents compétents embarqués directement dans les appareils des utilisateurs finaux, sans connexion permanente au cloud.

OutilsOutil
1 source
Cursor profite des difficultés de GitHub
464The Information AI 

Cursor profite des difficultés de GitHub

Cursor, l'éditeur de code alimenté par l'IA, travaille sur un projet ambitieux visant à concurrencer directement GitHub sur ses fonctions essentielles. Baptisé en interne "Origin", ce projet est porté par les ingénieurs de Graphite, une startup spécialisée dans la revue de code que Cursor a rachetée l'an dernier. L'annonce officielle est prévue pour cet été. Selon une source proche du dossier, Origin proposera des dépôts de code, soit la fonction centrale de GitHub, ainsi qu'un ensemble de fonctionnalités avancées : revues de sécurité automatisées, actions programmées comme les tests continus, gestion des mises à jour sans interruption de service, et intégrations avec des outils tiers. Ce mouvement s'inscrit dans un contexte délicat pour GitHub, filiale de Microsoft. La plateforme a subi une série de pannes et de dysfonctionnements ces derniers mois, au point que Jay Parikh, le dirigeant qui supervise GitHub, a récemment mis en garde ses équipes : les outils de Cursor et d'Anthropic pourraient un jour rendre GitHub obsolète. Si un concurrent aussi jeune que Cursor parvient à intégrer gestion de dépôts, revue de code assistée par IA et automatisation en une seule plateforme cohérente, les millions de développeurs qui utilisent GitHub quotidiennement auraient une raison concrète de migrer. La montée en puissance des éditeurs de code IA redessine progressivement toute la chaîne du développement logiciel. Cursor, qui s'est imposé en quelques mois comme l'un des outils les plus populaires auprès des développeurs professionnels, ne se contente plus de compléter le code ligne par ligne : il s'attaque désormais à l'infrastructure collaborative qui entoure l'écriture du code. GitHub, de son côté, tente de répondre avec ses propres fonctionnalités IA via GitHub Copilot, mais la pression vient maintenant de plusieurs fronts simultanément, incluant Anthropic et d'autres acteurs. L'acquisition de Graphite l'année dernière prenait tout son sens stratégique : Cursor construisait déjà les briques d'une plateforme complète, bien au-delà du simple éditeur.

UELes développeurs français et européens pourraient bénéficier d'une concurrence accrue sur le marché des plateformes de développement collaboratif, potentiellement forçant une amélioration de la fiabilité et des fonctionnalités IA des outils existants.

OutilsOutil
1 source
Nexos.ai : on a testé l’outil qui veut convaincre votre DSI que l’IA n’est pas une passoire
465Le Big Data 

Nexos.ai : on a testé l’outil qui veut convaincre votre DSI que l’IA n’est pas une passoire

Nexos.ai, la plateforme développée par Nord Security, l'éditeur à l'origine de NordVPN, propose une solution de gouvernance de l'intelligence artificielle en entreprise. Le principe est simple : plutôt que de créer un nouveau modèle maison, Nexos fait office de hub centralisé permettant aux équipes d'accéder aux grands modèles du marché, OpenAI, Anthropic, Google, Mistral, depuis un environnement contrôlé, avec des journaux d'activité, des règles configurables et un administrateur aux commandes. L'interface, pensée pour être accessible sans formation, permet de choisir son modèle via un menu déroulant, de définir un profil global avec des instructions permanentes, et de désactiver la mémorisation d'un simple interrupteur. Un détail attire l'attention : un drapeau européen signale les modèles traités sur des serveurs en Europe, garantie concrète pour les entreprises soumises au RGPD. Côté routing, la plateforme dirige intelligemment les tâches vers le modèle le plus adapté, un modèle d'embedding Mistral pour indexer un PDF, sans mobiliser un modèle coûteux, sans que l'utilisateur n'ait à intervenir. L'enjeu adressé est loin d'être anecdotique. Le phénomène dit du "Shadow AI", ces salariés qui utilisent leur compte personnel ChatGPT ou Claude pour coller des contrats, des roadmaps ou des bilans RH, représente en 2026 l'un des principaux vecteurs de fuite de données sensibles en entreprise, non par malveillance, mais faute d'alternative sérieuse mise à disposition. Nexos tente de combler ce vide en offrant aux DSI une visibilité réelle sur les usages, et aux employés un outil suffisamment fluide pour ne pas générer de contournements. Pour un DAF surveillant sa facture cloud, l'optimisation automatique du routing entre modèles représente aussi un argument économique tangible, invisible pour l'utilisateur final mais visible dans les coûts d'infrastructure. Nord Security n'est pas un inconnu dans l'espace cybersécurité : l'entreprise a construit sa réputation sur NordVPN, un produit grand public devenu référence dans la protection de la vie privée en ligne. Ce positionnement lui confère une crédibilité initiale sur le marché de la gouvernance IA, un segment en pleine structuration alors que les régulations se durcissent des deux côtés de l'Atlantique, l'AI Act européen en tête. La limite que la revue identifie est structurelle : les promesses de "forteresse numérique" ne peuvent être vérifiées sans audit technique indépendant, et l'utilisateur doit in fine faire confiance à la réputation de l'éditeur. Dans un marché où les offres se multiplient, Microsoft Copilot, Glean, Perplexity Enterprise, Nexos mise sur la simplicité d'adoption et la conformité RGPD comme différenciateurs, deux arguments qui résonnent particulièrement auprès des ETI et grandes entreprises européennes encore hésitantes à franchir le pas.

UELes entreprises françaises et européennes soumises au RGPD et à l'AI Act disposent d'une plateforme de gouvernance IA avec hébergement européen, réduisant le risque juridique lié au Shadow AI.

SécuritéOutil
1 source
Agents IA : pourquoi Singapour attire OpenAI et Google ?
466Le Big Data 

Agents IA : pourquoi Singapour attire OpenAI et Google ?

Lors de l'ATxSummit 2026 ce 20 mai, Singapour a officialisé deux accords stratégiques distincts avec OpenAI et Google, marquant une nouvelle étape dans son ambition de devenir la capitale asiatique de l'intelligence artificielle. OpenAI s'engage à investir plus de 300 millions de dollars singapouriens dans la cité-État et à y ouvrir son premier laboratoire d'IA appliquée hors des États-Unis, avec la création de plus de 200 postes techniques dédiés à l'intégration de modèles IA dans des environnements métier réels. Google, de son côté, formalise un partenariat axé sur la gouvernance et la recherche appliquée, avec notamment la publication d'un livre blanc conjoint avec le gouvernement sur le déploiement sécurisé des agents IA, dans la continuité d'un environnement de test lancé en 2025. Les deux géants ciblent des secteurs prioritaires comme la santé, la finance, les services publics et les infrastructures numériques, et prévoient des programmes de formation pour ingénieurs, enseignants et PME. Ces annonces confirment Singapour comme terrain d'expérimentation de référence pour l'industrialisation des agents IA en Asie-Pacifique. Pour les entreprises technologiques et les grands groupes qui cherchent à déployer l'IA à grande échelle, la cité-État offre une combinaison rare : infrastructures robustes, cadre réglementaire prévisible, viviers de talents qualifiés et soutien actif de l'État. OpenAI et Google rejoignent ainsi Amazon Web Services, Microsoft et Google DeepMind, qui avaient déjà établi des positions fortes dans le pays. L'enjeu concret est d'accélérer l'adoption opérationnelle des agents autonomes dans des entreprises locales et régionales, en développant des systèmes capables d'automatiser des tâches complexes et de soutenir des opérations métier critiques. Ce positionnement n'est pas le fruit du hasard. Depuis plusieurs années, Singapour investit méthodiquement dans son infrastructure technologique, traitant désormais l'IA comme une infrastructure stratégique au même titre que le cloud ou les télécommunications. Le gouvernement a engagé plus d'un milliard de dollars singapouriens sur la période 2025-2030 pour renforcer la recherche publique et accélérer l'adoption de l'IA dans l'économie nationale. Pour OpenAI, la cité-État représente surtout une porte d'entrée vers l'ensemble de la région Asie-Pacifique, avec un environnement politique et économique plus stable que d'autres marchés régionaux. La question des agents autonomes sécurisés, portée activement par Google, sera centrale pour la suite : à mesure que les entreprises intègrent ces systèmes dans des processus critiques, la gouvernance devient un avantage concurrentiel autant qu'une nécessité réglementaire.

UELa stratégie singapourienne illustre comment un cadre réglementaire stable et un soutien étatique fort peuvent attirer les leaders mondiaux de l'IA, un modèle que l'UE peine encore à reproduire malgré l'AI Act.

Startup IA Sierra : le partenaire des grandes entreprises
467Le Big Data 

Startup IA Sierra : le partenaire des grandes entreprises

Sierra, la startup spécialisée dans les agents d'intelligence artificielle pour le service client B2B, a bouclé une levée de fonds de 950 millions de dollars qui lui confère une valorisation de 15 milliards de dollars. Fondée en 2024 par Bret Taylor, ancien co-PDG de Salesforce, et Clay Bavor, ex-vice-président chez Google, l'entreprise s'est d'abord appuyée sur un premier tour de 110 millions de dollars co-mené par Sequoia Capital et Benchmark avant de franchir ce nouveau palier. En début d'année 2026, Sierra affichait déjà un chiffre d'affaires annuel récurrent de 100 millions de dollars et revendiquait plus de 40 % des entreprises du classement Fortune 50 parmi ses clients, gérant au total des milliards d'interactions clients. Le fonds Tiger Global, qui avait participé à des tours précédents, est revenu pour cette opération, signe d'une confiance renouvelée de la part des investisseurs institutionnels. L'enjeu dépasse la simple performance financière : Sierra incarne un changement de paradigme dans la manière dont les grandes entreprises gèrent leur relation client. Là où les anciens serveurs vocaux interactifs se heurtaient à la moindre demande complexe, les agents Sierra s'appuient sur une architecture multi-modèles, connectant plusieurs grands modèles de langage en simultané, pour traiter en temps réel des volumes massifs de requêtes, y compris des litiges médicaux ou des dossiers financiers sensibles. Le résultat revendiqué ressemble davantage à une conversation avec un conseiller humain qu'à un chatbot scriptés. Pour les entreprises, l'impact se mesure directement en coûts évités et en taux de résolution améliorés, deux métriques que les directeurs opérationnels comprennent sans traduction. Sierra s'inscrit dans une vague plus large de plateformes dites "agentic" qui cherchent à capturer la couche d'exécution de l'IA en entreprise, un marché que se disputent également Salesforce Agentforce, ServiceNow et des dizaines de challengers bien financés. Le profil de ses fondateurs, Taylor a notamment présidé le conseil d'administration de Twitter lors du rachat par Elon Musk et dirigé Salesforce, lui a ouvert des portes que d'autres startups mettent des années à franchir. Avec 15 milliards de valorisation et une base de revenus récurrents solide, la question qui se pose désormais est celle de la trajectoire : introduction en bourse, acquisition stratégique par un acteur comme Salesforce ou Microsoft, ou course solitaire vers le statut de plateforme CX dominante. La levée actuelle lui donne les ressources pour recruter à l'international et accélérer le développement produit, mais aussi la pression d'une valorisation ambitieuse à justifier dans un marché où les promesses d'agents IA se multiplient à mesure que les preuves de valeur réelle se font encore attendre.

BusinessOpinion
1 source
Meilleures plateformes d'IA à agents autonomes pour les entreprises en 2026
468MarkTechPost 

Meilleures plateformes d'IA à agents autonomes pour les entreprises en 2026

En 2026, l'IA agentique d'entreprise a franchi le cap du projet pilote pour entrer dans les déploiements en production. Salesforce a conclu 29 000 contrats Agentforce depuis son lancement, générant 800 millions de dollars de revenus annuels récurrents. Microsoft Copilot Studio compte plus de 160 000 organisations qui font tourner plus de 400 000 agents personnalisés. ServiceNow a reconfiguré l'ensemble de son modèle commercial autour de niveaux d'autonomie IA. Sur le plan tarifaire, les modèles divergent : Agentforce facture 2 dollars par conversation ou 500 dollars pour 100 000 crédits Flex, tandis que Copilot Studio propose 200 dollars pour 25 000 crédits mensuels. Salesforce a par ailleurs finalisé en novembre 2025 l'acquisition d'Informatica pour renforcer la qualité des données intégrées à sa couche Data 360. Ces chiffres traduisent un basculement structurel : la question n'est plus de savoir s'il faut déployer des agents IA, mais quel outil convient à quel flux de travail. Ce mouvement massif vers la production révèle aussi ses limites. Les équipes qui ont réussi la transition des pilotes vers le déploiement réel rapportent que les échecs ne viennent pas des capacités des modèles, mais de trois problèmes récurrents : des données de mauvaise qualité, une propriété floue des cas limites, et une gouvernance jamais construite. Une pratique trompeuse s'est également généralisée dans le secteur, que les praticiens appellent l'« agent washing » : des éditeurs rebaptisent des chatbots existants, des scripts d'automatisation robotique ou des outils de workflow linéaires en les présentant comme des agents autonomes. Or, un vrai agent doit être capable de prise de décision autonome, de raisonnement multi-étapes et de gestion dynamique des erreurs, une barre que la majorité des produits commercialisés aujourd'hui ne franchit pas réellement. Les brochures marketing ne suffisent pas ; il faut tester sur des flux réels qui exigent ramifications, usage d'outils, rétention de contexte et récupération sur erreur. Les deux plateformes dominantes en volume illustrent une logique d'écosystème fermé. Agentforce s'appuie sur le moteur de raisonnement Atlas, qui décompose les tâches en étapes via une boucle Reason-Act-Observe, et reste nativement intégré aux données Salesforce, un avantage décisif pour les entreprises dont Salesforce est le système d'enregistrement central, mais une contrainte réelle pour les environnements SAP ou multi-stack. Copilot Studio bénéficie quant à lui d'une surface d'intégration massive : Teams, SharePoint, Dynamics 365 et le Microsoft Graph couvrent environ un milliard de sièges Microsoft 365 dans le monde. La stratégie gagnante pour 2026, selon les retours terrain, consiste à déployer un seul agent sur un workflow précis et bien documenté, mesurer les résultats, puis étendre progressivement, plutôt que de chercher une transformation générale en une seule vague.

UELes entreprises européennes sous écosystème Salesforce ou Microsoft 365 sont directement concernées par les nouvelles grilles tarifaires et les stratégies de déploiement d'agents autonomes décrites dans cet article.

OutilsOutil
1 source
Le jury juge à l'unanimité qu'Elon Musk a attendu trop longtemps avant de poursuivre OpenAI
469Ars Technica AI 

Le jury juge à l'unanimité qu'Elon Musk a attendu trop longtemps avant de poursuivre OpenAI

Un jury composé de neuf personnes a rendu lundi un verdict unanime dans le procès opposant Elon Musk à OpenAI : la plainte a été déposée trop tard. Musk avait poursuivi OpenAI en 2024, estimant avoir été trompé après avoir contribué 38 millions de dollars pour lancer l'organisation en tant qu'entité à but non lucratif. Il accusait les dirigeants Sam Altman et Greg Brockman d'avoir créé une branche commerciale qui, selon lui, vidait la mission caritative de ses ressources tout en enrichissant les cadres dirigeants. Le jury a conclu qu'Altman et Brockman n'étaient pas responsables des faits reprochés, et a également exonéré Microsoft, investisseur d'OpenAI que Musk avait accusé de complicité dans ce qu'il qualifiait de dérive lucrative. Le rejet repose sur un motif procédural : le jury a établi que Musk était informé des plans de restructuration d'OpenAI dès 2021, ce qui signifie qu'il aurait dû déposer sa plainte au plus tard en 2024 pour respecter le délai légal de prescription de trois ans. En attendant trop longtemps, il a perdu le droit de faire valoir ses griefs devant les tribunaux, quelle que soit leur validité sur le fond. Ce verdict clôt donc sans examen au fond les accusations de détournement de mission caritative. Cette affaire s'inscrit dans une rivalité durable entre Musk et Altman, deux figures centrales de l'essor de l'intelligence artificielle. Musk a été l'un des cofondateurs d'OpenAI en 2015 avant de quitter le conseil d'administration en 2018, et il a depuis fondé sa propre société d'IA, xAI. La transformation d'OpenAI en entité commerciale, qui a permis des levées de fonds massives auprès de Microsoft et d'autres investisseurs, reste un sujet de controverses dans le secteur. Ce verdict ne met pas fin à toutes les procédures : Musk maintient d'autres actions juridiques contre OpenAI, dont certaines portent sur des allégations de concurrence déloyale.

UECe verdict américain n'a pas d'effet direct en France ou en UE, mais la clarification du statut commercial d'OpenAI reste un enjeu de gouvernance pertinent pour les régulateurs européens qui examinent ses activités sur le marché intérieur.

RégulationReglementation
1 source
Business IA : le duel au sommet entre Claude et OpenAI
470Le Big Data 

Business IA : le duel au sommet entre Claude et OpenAI

Anthropic, la société californienne fondatrice de l'assistant Claude, affiche en février 2026 des revenus annuels de 14 milliards de dollars, une trajectoire de croissance inédite dans le logiciel professionnel. Ce chiffre contraste avec la domination médiatique d'OpenAI, dont ChatGPT avait réuni 100 millions d'utilisateurs en deux mois fin 2022. Pourtant, sur le terrain de la monétisation, Anthropic prend nettement l'avantage : chaque client mensuel rapporte en moyenne 211 dollars à l'entreprise, contre 25 dollars par utilisateur hebdomadaire chez OpenAI. La firme a également séduit huit des dix plus grandes fortunes mondiales, preuve d'une pénétration profonde dans les cercles décisionnels. Son outil d'aide à la programmation a lui seul généré 2,5 milliards de dollars de revenus en moins d'un an. Ce succès commercial repose sur un positionnement délibérément différent : la fiabilité avant tout. Là où OpenAI investit dans la vidéo, les images et les fonctionnalités grand public, Anthropic concentre ses efforts sur le traitement de texte, qui constitue le coeur du travail quotidien des cadres, synthèses, rapports, analyses de contrats. Pour une banque ou un cabinet juridique, une erreur factuelle ou une invention légale peut avoir des conséquences financières et réputationnelles graves. La priorité donnée à la sûreté a donc converti des secteurs exigeants comme la finance, le droit et la santé, milieux qui valorisent la précision rédactionnelle bien plus que les prouesses graphiques. Une fois intégré dans les processus internes d'une organisation, Claude crée une dépendance fonctionnelle que le prix seul ne suffit pas à rompre, ce qui explique la solidité des revenus récurrents. L'analogie avec Microsoft et sa suite Office n'est pas anodine : Anthropic développe des versions spécialisées pour Excel et PowerPoint, cherchant à s'installer comme moteur invisible au sein des outils que les professionnels utilisent déjà. Cette stratégie rappelle comment Windows s'est imposé non pas par séduction grand public, mais par intégration systémique dans l'environnement de travail. OpenAI conserve une avance symbolique significative grâce à la notoriété de ChatGPT et à une base d'utilisateurs grand public massive, mais la bataille pour la rentabilité durable se joue désormais sur les bureaux des décideurs, pas dans les salons. Si la course à l'IA semblait se résumer à une guerre de fonctionnalités spectaculaires, Anthropic démontre qu'un positionnement ciblé sur la confiance institutionnelle et l'utilité quotidienne peut constituer un avantage compétitif durable, et potentiellement plus difficile à éroder.

UELes entreprises françaises des secteurs finance, droit et santé qui évaluent l'adoption d'un assistant IA professionnel peuvent s'appuyer sur cette analyse pour arbitrer entre fiabilité rédactionnelle (Anthropic) et notoriété grand public (OpenAI).

BusinessOpinion
1 source
NeurIPS 2026 : la conférence où se joue l’avenir scientifique, industriel et géopolitique de l’IA
471FrenchWeb 

NeurIPS 2026 : la conférence où se joue l’avenir scientifique, industriel et géopolitique de l’IA

NeurIPS 2026 se tiendra du 6 au 13 décembre à Sydney, en Australie, avec deux éditions satellites simultanées à Atlanta et à Paris. Organisée chaque année depuis 1987, la conférence "Neural Information Processing Systems" est l'un des rendez-vous académiques les plus influents du secteur de l'intelligence artificielle, rassemblant chercheurs, ingénieurs et décideurs du monde entier autour des dernières avancées en apprentissage automatique. La formule multi-sites, avec des hubs sur trois continents, confirme l'ampleur croissante d'un événement devenu trop vaste pour un seul lieu. NeurIPS est aujourd'hui bien plus qu'un congrès scientifique : c'est un baromètre de l'état de l'art en IA et un lieu de recrutement stratégique pour les grands laboratoires. Google, Meta, OpenAI, Microsoft ou encore Mistral y exposent leurs travaux, signalent leurs priorités de recherche et captent les meilleurs talents académiques. La présence d'un satellite à Paris souligne par ailleurs la montée en puissance de l'écosystème européen, qui cherche à peser dans une compétition technologique dominée par les États-Unis et la Chine. La conférence s'inscrit dans un contexte de tension géopolitique autour du contrôle des modèles de pointe, des données d'entraînement et des puces spécialisées. Depuis l'émergence des grands modèles de langage à partir de 2022, NeurIPS est devenu un terrain d'observation pour gouvernements et investisseurs autant que pour la communauté scientifique. L'édition 2026 devrait refléter les débats en cours sur la régulation internationale de l'IA, la sécurité des systèmes et la course aux modèles multimodaux de prochaine génération.

UELa tenue d'un hub satellite à Paris pour NeurIPS 2026 offre aux chercheurs et entreprises françaises un accès direct à la conférence de référence mondiale en IA, renforçant la visibilité de l'écosystème européen face aux géants américains et chinois.

💬 Le hub parisien, c'est une bonne nouvelle pour l'éco IA français, même si faut pas se raconter des histoires : le vrai centre de gravité reste à Sydney (et avant ça, dans les labos de San Francisco et Pékin). Ce qui m'intéresse dans cette édition 2026, c'est moins les papers que ce que les grands labos vont choisir de montrer, parce que NeurIPS est devenu autant une vitrine stratégique qu'une conférence scientifique. Reste à voir si Mistral et les européens y font autre chose que de la figuration.

RecherchePaper
1 source
Le prochain défi de Claude en entreprise : pas les modèles, mais le plan de contrôle des agents
472VentureBeat AI 

Le prochain défi de Claude en entreprise : pas les modèles, mais le plan de contrôle des agents

Selon de nouvelles données publiées par VentureBeat Pulse, la prochaine bataille stratégique dans l'IA d'entreprise ne portera pas sur la qualité des modèles, mais sur le contrôle de la couche d'orchestration des agents. Le tracker indépendant VB Pulse, qui mesure régulièrement les préférences de décideurs techniques qualifiés en entreprise, révèle que Microsoft Copilot Studio et Azure AI Studio dominent ce segment avec 38,6 % d'adoption principale en février 2026, en hausse depuis 35,7 % en janvier. L'API Assistants et Responses d'OpenAI occupe la deuxième place avec 25,7 %, contre 23,2 % un mois plus tôt. Anthropic, lui, fait sa première apparition dans ce tracker : passant de 0 % en janvier à 5,7 % en février pour l'usage de ses outils et workflows natifs, soit quatre répondants sur un panel de 70 décideurs. Sur la couche modèle, les données sont encore plus spectaculaires pour l'entreprise de Dario Amodei : Claude est passé de 23,9 % en janvier à 28,6 % en février, puis à 56,2 % en mars, bien que cette dernière mesure soit qualifiée de directionnelle en raison d'un échantillon réduit à 16 répondants. Ce glissement d'Anthropic depuis la couche modèle vers l'orchestration native représente un signal stratégique significatif, même si les chiffres absolus restent modestes. Les entreprises ne choisissent plus seulement un chatbot ou un moteur de génération de texte : elles décident où installer la machinerie opérationnelle de leur IA, quels outils les agents peuvent appeler, quelles données ils peuvent consulter, quels workflows ils peuvent déclencher, et comment prouver aux équipes de sécurité que ces agents n'ont rien fait d'interdit. Tom Findling, PDG de la startup de cybersécurité IA Conifers, résume l'enjeu : les entreprises déplacent leur focus de la qualité du modèle vers le plan de contrôle qui l'entoure, notamment en matière de gouvernance, d'auditabilité et d'orchestration dans des environnements clients complexes. L'enjeu est d'autant plus lourd que remplacer un modèle reste relativement simple en théorie, une entreprise peut router une tâche vers Claude, une autre vers GPT, une troisième vers Gemini. Remplacer un runtime d'agents, en revanche, implique de reconfigurer des pipelines entiers, des intégrations d'outils, des politiques d'accès aux données et des mécanismes d'audit. Celui qui contrôle cette couche crée une dépendance bien plus profonde que celle d'un modèle. Microsoft dispose d'un avantage de distribution considérable dans les entreprises, et OpenAI d'une base installée bien plus large en orchestration. Mais la montée en puissance de Claude sur la couche modèle commence visiblement à se propager vers l'orchestration, et c'est précisément là que se joueront les parts de marché les plus durables des prochaines années.

💬 Anthropic gagne la bataille des modèles, et c'est bien, mais la vraie guerre se joue ailleurs. Changer de LLM, c'est l'affaire d'une clé API, mais démonter un runtime d'agents complet avec ses pipelines, ses intégrations et ses politiques d'accès, c'est des mois de boulot. Microsoft tient l'orchestration à 38 % et Anthropic débarque tout juste à 5,7 %, autant dire que c'est encore loin.

BusinessOpinion
1 source
Le fil AI : tout converge vers Conductor
473Latent Space 

Le fil AI : tout converge vers Conductor

GitHub a annoncé le 13 mai 2026 une préversion technique de son application GitHub Copilot App, un environnement de bureau conçu pour gérer des flux de travail parallèles, le cycle de vie des dépôts et des pull requests, avec flexibilité sur le choix de modèle. Dans le même mouvement, OpenAI a étendu son agent Codex vers les usages mobiles : les utilisateurs peuvent désormais lancer des tâches depuis l'application ChatGPT sur mobile, examiner les sorties, approuver des commandes et piloter l'exécution à distance pendant que Codex continue de tourner sur un laptop, un Mac mini ou un serveur de développement. OpenAI a également rendu généralement disponible le Remote SSH pour les environnements distants gérés, et ajouté des hooks ainsi que des jetons d'accès programmatiques pour l'automatisation Business et Enterprise autour du pipeline Codex. VS Code, de son côté, a livré une nouvelle fenêtre Agents pour les flux multi-agents et multi-projets, avec support navigateur et mobile via vscode.dev/agents, ainsi que des améliorations d'efficacité comme la compression des sorties terminal. Ces annonces convergentes signalent un basculement de l'écosystème entier vers une interface dite "agent-first" : les outils ne sont plus centrés sur l'édition de fichiers, mais sur la supervision d'agents autonomes qui exécutent des tâches longues en parallèle. Pour les développeurs, cela signifie pouvoir déléguer des chantiers entiers à un agent depuis son téléphone, tout en gardant le contrôle à distance. Pour les entreprises, les nouveaux tokens d'accès programmatiques d'OpenAI ouvrent la voie à des pipelines de développement entièrement automatisés. Du côté de l'infrastructure d'agents, LangChain a frappé fort avec le lancement de SmithDB, une base de données conçue spécifiquement pour les traces d'agents, et de LangSmith Engine, qui consomme ces traces, regroupe les échecs, identifie les problèmes dans le code et propose des correctifs, transformant l'observabilité passive en boucle d'amélioration continue. Derrière cette effervescence se profile une dynamique que les observateurs comparent à l'évolution convergente en biologie : tout comme le "plan crab" a émergé indépendamment sept fois dans l'évolution, l'interface "agent-first" est en train de s'imposer simultanément chez GitHub, Microsoft, OpenAI et d'autres. Conductor, la startup qui a popularisé ce paradigme, voit ses idées reprises à grande échelle, ce qui soulève une question structurante pour les pionniers : comment monétiser une innovation de forme quand les géants de l'industrie l'adoptent en quelques mois ? Garry Tan, PDG de Y Combinator, s'est montré publiquement enthousiaste à propos de Conductor, signal que l'écosystème startup suit de près ces convergences. Les prochains mois diront si les premiers à avoir défriché ce terrain peuvent transformer leur avance conceptuelle en avantage durable, ou si la compétition sur la forme laisse place à une guerre sur l'exécution et la distribution.

UELes développeurs et entreprises européens peuvent adopter ces nouveaux outils d'orchestration d'agents, mais aucune réglementation ou institution française ou européenne n'est directement concernée.

💬 C'est le genre de semaine où tout s'aligne. GitHub, OpenAI, VS Code, en même temps, sur le même paradigme : superviser des agents depuis ton mobile pendant qu'ils bossent en arrière-plan, c'est plus une démo, c'est la nouvelle interface standard. Conductor a visé juste, mais se faire copier par Microsoft et OpenAI en six mois, ça n'a jamais vraiment été une stratégie de sortie.

OutilsOutil
1 source
Altman contraint de répondre aux accusations de mensonges répétés lors du procès OpenAI
474Ars Technica AI 

Altman contraint de répondre aux accusations de mensonges répétés lors du procès OpenAI

Sam Altman a témoigné à la barre lors du procès qui oppose OpenAI à Elon Musk, un tribunal chargé de trancher des questions fondamentales sur l'avenir de la société: qui la dirige, d'où vient son financement de recherche, et qui peut tirer profit de ses technologies les plus ambitieuses. Mardi, Altman a passé environ quatre heures à déposer, abordant avec un calme relatif les preuves qu'il espère suffisantes pour démontrer que les accusations de Musk sur la transformation à but lucratif d'OpenAI sont infondées. Sa prestation a fortement contrasté avec celle de Musk, soumis à trois jours d'interrogatoire épuisants au cours desquels il a parfois perdu son calme face aux questions de l'avocat d'OpenAI, William Savitt. L'enjeu du procès va bien au-delà d'un conflit entre deux milliardaires de la tech. Musk accuse les dirigeants actuels d'OpenAI d'avoir abandonné la mission originelle de la société, celle de développer une intelligence artificielle au bénéfice de l'humanité. Selon lui, OpenAI se serait alliée à Microsoft pour détourner une organisation caritative à des fins d'enrichissement personnel, en ayant notamment convaincu Musk d'y injecter 38 millions de dollars de financements à ses débuts. Si Musk obtient gain de cause, cela pourrait remettre en question la structure commerciale qu'OpenAI a construite ces dernières années ainsi que ses partenariats industriels les plus lucratifs. Altman maintient pour sa part que la démarche judiciaire de Musk n'est motivée que par la rancune: l'entrepreneur n'aurait jamais digéré de ne pas avoir été choisi à la tête d'OpenAI, et regarderait avec amertume sa propre société d'IA, xAI, accuser du retard face à son rival. La conversion d'OpenAI d'une structure non lucrative vers un modèle commercial suscite des critiques bien au-delà du cercle de Musk depuis plusieurs années. Le verdict de ce procès pourrait redéfinir les règles du jeu pour tout le secteur, en précisant jusqu'où une organisation fondée sur des valeurs philanthropiques peut évoluer vers des intérêts commerciaux sans trahir sa mission initiale.

UELe verdict pourrait établir un précédent sur la conversion d'organisations à but non lucratif en entités commerciales dans le secteur IA, une question que les régulateurs européens pourraient intégrer dans leurs réflexions sur la gouvernance et l'AI Act.

RégulationReglementation
1 source
L'eau : pas un problème de centres de données, mais un problème d'IA
475The Information AI 

L'eau : pas un problème de centres de données, mais un problème d'IA

La consommation d'eau liée à l'intelligence artificielle est bien plus importante qu'on ne le pense, mais elle ne se concentre pas là où le débat public se focalise. Selon un rapport publié en janvier 2026 par la société de technologie de l'eau Xylem et le cabinet Global Water Intelligence, les usines de fabrication de semi-conducteurs et les centrales électriques qui les alimentent consomment beaucoup plus d'eau que les centres de données eux-mêmes. En 2025, le secteur IA retire 6 260 milliards de litres d'eau par an, un chiffre qui devrait plus que doubler d'ici 2050. Par comparaison, le premier site de Microsoft dans son complexe Fairwater au Wisconsin, l'un des plus grands campus de data centers au monde, ne consomme que l'équivalent de quatre piscines olympiques par an, soit la moitié de la consommation annuelle d'un lave-auto, et 0,1 % de ce que le fabricant Foxconn aurait été autorisé à prélever sur le même terrain, selon Brad Smith, président de Microsoft. Cette efficacité s'explique par l'adoption de systèmes de refroidissement en circuit fermé qui réduisent la consommation d'eau douce de 50 à 70 % par rapport aux anciens équipements. Ce déplacement du problème vers l'amont de la chaîne d'approvisionnement a des conséquences concrètes pour les territoires et les écosystèmes. Aujourd'hui, 40 % des centres de données mondiaux et 29 % des usines de puces électroniques sont implantés dans des zones souffrant d'un stress hydrique élevé ou extrême. Le refroidissement à l'électricité, qui remplace l'évaporation dans les nouveaux data centers, transfère en réalité la pression vers le réseau électrique : les centrales utilisent elles-mêmes de grandes quantités d'eau, et la consommation électrique des infrastructures IA par mètre carré atteint déjà dix fois celle du cloud traditionnel. Avec les futurs racks Nvidia à un mégawatt, cet écart pourrait grimper à cent fois la norme d'avant l'IA. Le numérique représente certes seulement 3,7 % des 168 800 milliards de litres consommés chaque année par l'industrie mondiale, mais c'est le secteur où la croissance est la plus rapide. Le tableau n'est pas uniformément alarmant. Les centrales électriques restituent plus de 90 % de l'eau utilisée pour leur refroidissement, même si elle nécessite parfois un traitement. La transition vers les énergies renouvelables, moins gourmandes en eau que le charbon ou le gaz, pourrait réduire significativement l'intensité hydrique de la production électrique dans les prochaines décennies. Les industriels investissent aussi dans la réutilisation des eaux usées : la société Ecolab a aidé une usine américaine de semi-conducteurs à économiser près de 42 millions de litres grâce à des processus optimisés. Le vrai enjeu n'est donc pas de condamner les data centers, mais d'imposer une transparence et des normes sur l'ensemble de la chaîne IA, des fonderies de puces en Asie aux centrales à gaz d'Amérique du Nord.

UELes centres de données et usines de puces européens sont exposés aux mêmes tensions hydriques, et l'UE pourrait être amenée à étendre ses obligations de transparence environnementale à l'ensemble de la chaîne d'approvisionnement IA, des fonderies aux centrales électriques.

InfrastructureOpinion
1 source
OpenAI présente MRC (Multipath Reliable Connection) : un nouveau protocole réseau ouvert pour les clusters de superordinateurs IA à grande échelle
476MarkTechPost 

OpenAI présente MRC (Multipath Reliable Connection) : un nouveau protocole réseau ouvert pour les clusters de superordinateurs IA à grande échelle

OpenAI a annoncé la publication de MRC (Multipath Reliable Connection), un nouveau protocole réseau développé au cours des deux dernières années en partenariat avec AMD, Broadcom, Intel, Microsoft et NVIDIA. La spécification a été rendue publique via l'Open Compute Project (OCP), une fondation industrielle qui favorise le partage de standards ouverts entre les grandes entreprises technologiques. MRC étend RoCE (RDMA over Converged Ethernet), un standard qui permet à des machines de lire et d'écrire directement dans la mémoire d'autres machines via un réseau Ethernet, sans passer par le processeur central. Il intègre également SRv6, un mécanisme de routage source où chaque paquet transporte dans son en-tête la route exacte qu'il doit emprunter, éliminant le besoin pour les commutateurs réseau de calculer dynamiquement les chemins. Concrètement, MRC repose sur trois mécanismes : une distribution adaptative des paquets sur des centaines de chemins réseau simultanés, une récupération en cas de panne en quelques microsecondes, et un contrôle de congestion basé sur des signaux d'information explicite plutôt que sur la détection de pertes de paquets. L'enjeu est massif : plus de 900 millions de personnes utilisent ChatGPT chaque semaine, et l'entraînement des modèles qui les font fonctionner mobilise des clusters de plusieurs dizaines de milliers de GPU travaillant en parallèle. Or, un seul transfert de données en retard peut paralyser l'ensemble d'une étape d'entraînement, laissant des milliers de GPU en attente. Sur un cluster de cette taille, une panne de lien réseau pouvait auparavant faire échouer un job d'entraînement complet ; avec MRC, le système contourne la défaillance sans interruption perceptible. La réduction du temps mort des GPU représente un gain économique direct considérable, et la prévisibilité des performances réseau permet de planifier les charges de calcul avec beaucoup plus de fiabilité. La publication de MRC s'inscrit dans une bataille plus large pour définir les standards d'infrastructure qui équiperont la prochaine génération de supercalculateurs IA. Depuis plusieurs années, deux camps s'affrontent : InfiniBand, porté historiquement par NVIDIA via Mellanox, et Ethernet, que l'Ultra Ethernet Consortium (UEC) tente de hisser au même niveau de performance. MRC est clairement dans ce second camp, et sa publication via l'OCP signale la volonté d'OpenAI de peser dans la standardisation, au-delà de l'usage interne. Avec AMD, Intel et Broadcom parmi les co-développeurs, l'initiative vise à créer une alternative crédible et ouverte à l'écosystème fermé d'InfiniBand, à un moment où la demande en infrastructures d'entraînement IA s'accélère dans toute l'industrie.

UEL'adoption de ce standard ouvert par les fournisseurs cloud et entreprises européens construisant des clusters IA pourrait réduire leur dépendance à l'écosystème propriétaire d'InfiniBand et abaisser leurs coûts d'infrastructure.

InfrastructureOpinion
1 source
SAP : les entreprises qui adoptent l’IA innovent plus vite et plus efficacement
477Le Big Data 

SAP : les entreprises qui adoptent l’IA innovent plus vite et plus efficacement

SAP affirme que l'intelligence artificielle intégrée à ses solutions cloud ERP bouleverse l'accès aux outils de gestion avancés pour les entreprises de taille moyenne. Avec SAP Business AI et SAP Cloud ERP, l'éditeur allemand propose désormais aux PME et ETI les mêmes capacités d'automatisation, d'analyse et d'optimisation que celles réservées jusqu'ici aux multinationales, sans les coûts d'infrastructure d'autrefois. Des entreprises comme John Boos & Co, centenaire du secteur industriel confrontée à une forte croissance et une lourde dette technologique, s'appuient déjà sur cette plateforme. Son DSI Britt East explique que l'objectif est d'unifier les opérations tout en permettant aux équipes d'utiliser l'IA sur des cas concrets qui simplifient leur travail quotidien. Le modèle par abonnement remplace les investissements massifs en serveurs dédiés et en équipes IT spécialisées, rendant les coûts prévisibles et la montée en charge progressive. Ce changement de paradigme a des implications concrètes pour des milliers d'entreprises qui repoussaient leurs projets ERP par crainte de la complexité et des délais de déploiement. L'IA permet désormais d'automatiser des tâches qui nécessitaient auparavant plusieurs mois de configuration et d'expertise technique : les utilisateurs interagissent en langage naturel avec leurs outils pour accéder aux données, aux analyses et aux recommandations opérationnelles. Dans la logistique, SAP imagine des agents IA capables d'analyser des milliers de commandes en temps réel, de détecter des anomalies, de préparer des réponses fournisseurs ou de proposer des itinéraires alternatifs en cas de perturbation, tout en laissant le contrôle final à l'humain. Selon Tobias Siebler, PDG de FULCRUM Consulting Germany, la perception de complexité et de coût qui freinait les ETI n'est plus adaptée à la réalité du marché actuel. SAP insiste cependant sur un point central : l'IA seule ne suffit pas à produire des résultats fiables. Elle compare la situation à un GPS, aussi sophistiqué soit-il, qui devient inutile sans données routières cohérentes et mises à jour. Pour l'IA, le raisonnement est identique : sans données métier structurées, gouvernées et contextualisées, les décisions générées peuvent rapidement devenir erronées. C'est précisément ce rôle que conservent les ERP, en fournissant une base de données unifiée couvrant la finance, la supply chain, les ressources humaines et les achats. Cette stratégie positionne SAP dans la course aux plateformes d'IA d'entreprise face à des concurrents comme Oracle, Salesforce ou Microsoft Dynamics, tous engagés dans la même course à l'intégration native de l'IA dans leurs suites logicielles. L'enjeu, pour l'éditeur de Walldorf, est de convaincre les ETI qu'adopter l'IA n'est plus un projet de transformation sur cinq ans, mais une évolution incrémentale déjà disponible.

UESAP, éditeur allemand leader de l'ERP, rend ses solutions IA accessibles aux PME et ETI françaises via un modèle cloud par abonnement, abaissant concrètement les barrières à l'entrée pour la transformation numérique des entreprises européennes.

OutilsOutil
1 source
NVIDIA Spectrum-X, le réseau Ethernet ouvert conçu pour l'IA, s'impose comme référence à grande échelle, avec MRC
478NVIDIA AI Blog 

NVIDIA Spectrum-X, le réseau Ethernet ouvert conçu pour l'IA, s'impose comme référence à grande échelle, avec MRC

NVIDIA a annoncé que son infrastructure réseau Spectrum-X Ethernet intègre désormais le protocole MRC (Multipath Reliable Connection), une innovation développée conjointement avec OpenAI et Microsoft, et désormais publiée en spécification ouverte via l'Open Compute Project. MRC est un protocole de transport RDMA qui permet à une seule connexion réseau de distribuer le trafic sur plusieurs chemins simultanément, améliorant le débit, l'équilibrage de charge et la disponibilité des infrastructures d'entraînement IA à grande échelle. Parmi les premiers déploiements en production figurent le datacenter Fairwater de Microsoft et le datacenter Abilene d'Oracle Cloud Infrastructure, deux des plus grandes usines IA au monde dédiées à l'entraînement de modèles de pointe. OpenAI a notamment intégré MRC dans sa génération Blackwell : Sachin Katti, responsable du calcul industriel chez OpenAI, a confirmé que le protocole a permis d'éviter la majorité des ralentissements réseau habituels lors des runs d'entraînement frontier à grande échelle. L'enjeu est directement économique et computationnel : dans un cluster d'entraînement réunissant des milliers de GPU, la moindre interruption réseau peut bloquer l'intégralité d'un job d'entraînement, laissant des GPU à l'arrêt et brûlant des millions de dollars en temps de calcul inutilisé. MRC répond à ce problème en détectant les pannes réseau en quelques microsecondes et en reroutant automatiquement le trafic dans le matériel lui-même, sans intervention logicielle. Le protocole maintient également une bande passante élevée sous congestion en évitant dynamiquement les chemins surchargés en temps réel, et minimise l'impact des pertes de paquets grâce à une retransmission intelligente et ciblée. Les administrateurs gagnent par ailleurs une visibilité granulaire sur les chemins de trafic, ce qui simplifie considérablement les opérations à très grande échelle. Cette annonce s'inscrit dans une course mondiale à la construction d'infrastructures réseau capables de suivre l'explosion des besoins en calcul IA. Jusqu'ici, InfiniBand de Mellanox, aussi propriété de NVIDIA, dominait les clusters HPC et IA haute performance, tandis qu'Ethernet était perçu comme moins adapté aux charges de travail intensives. Spectrum-X représente la tentative de NVIDIA de rendre Ethernet compétitif sur ce terrain en y ajoutant une couche matérielle et protocolaire dédiée à l'IA. La publication de MRC comme spécification ouverte via l'Open Compute Project est un signal stratégique fort : en permettant à d'autres acteurs d'implémenter le protocole, NVIDIA cherche à imposer Spectrum-X comme standard de facto du réseau Ethernet pour l'IA, face aux alternatives comme Ultra Ethernet Consortium poussé par AMD, Intel et d'autres. La prochaine étape sera de voir si d'autres fournisseurs cloud et constructeurs de clusters adoptent MRC à leur tour.

UELa publication de MRC comme spécification ouverte via l'Open Compute Project pourrait à terme bénéficier aux centres de données européens qui développent des infrastructures d'entraînement IA, mais aucune entreprise ou institution européenne n'est directement impliquée dans cette annonce.

InfrastructureOpinion
1 source
Nvidia mise sur l’IA physique : pourquoi les marchés d’Asie s’emballent déjà ?
479Le Big Data 

Nvidia mise sur l’IA physique : pourquoi les marchés d’Asie s’emballent déjà ?

L'Asie représente désormais 90 % des coûts de production de Nvidia, contre 65 % il y a tout juste un an. Ce basculement, documenté par Bloomberg, illustre une réorientation stratégique majeure du géant américain des puces graphiques. Nvidia ne se concentre plus uniquement sur les processeurs pour data centers : sous l'impulsion de son PDG Jensen Huang, l'entreprise accélère dans ce qu'elle appelle l'IA physique, un ensemble de technologies englobant la robotique, les systèmes autonomes et la production industrielle augmentée. Dans ce cadre, des partenariats se nouent à grande vitesse avec des acteurs asiatiques majeurs comme SK Hynix et Samsung Electronics pour la mémoire et les composants avancés, mais aussi avec des entreprises moins connues à l'international : LG Electronics sur un projet de robot domestique, Nanya Technology à Taïwan, et des fabricants chinois comme Huizhou Desay et Pateo Connect. Les marchés boursiers ont immédiatement réagi : LG Electronics a bondi jusqu'à 15 % après l'annonce de discussions avec Nvidia, Nanya Technology a progressé de 10 %, tandis que les titres chinois concernés enregistraient également des hausses marquées. L'impact de cette dynamique dépasse largement les seuls partenaires directs de Nvidia. Chaque annonce de collaboration est désormais perçue par les investisseurs comme un signal de croissance future, transformant des entreprises industrielles régionales en acteurs stratégiques mondiaux du jour au lendemain. Pour Ling Vey-Sern, analyste chez Union Bancaire Privée, cette dépendance croissante à l'égard des chaînes d'approvisionnement asiatiques est structurelle et inévitable : les géants technologiques n'ont d'autre choix que de s'appuyer sur des écosystèmes de fabrication très spécialisés. L'IA physique, contrairement à l'IA générative qui reposait essentiellement sur des infrastructures cloud pilotées par Microsoft, Amazon ou Alphabet, exige une base industrielle dense : capteurs, actionneurs, systèmes embarqués, assemblage de précision. C'est précisément là où l'Asie concentre ses compétences depuis des décennies. Ce virage s'inscrit dans un contexte d'investissements colossaux de la part des géants américains, certains annonçant jusqu'à 200 milliards de dollars de dépenses en infrastructures IA. Nvidia capte une part significative de ces budgets et entraîne dans son sillage l'ensemble de sa chaîne de fournisseurs. Samsung en a déjà tiré les bénéfices, ayant récemment multiplié ses résultats trimestriels. La part asiatique dans les coûts de production de Nvidia n'est pas une simple métrique de dépendance : c'est le reflet d'un cycle d'investissement qui se déplace vers le prochain goulot d'étranglement, après le calcul et la mémoire, désormais vers les composants et systèmes nécessaires à l'IA qui agit dans le monde réel. Les prochaines étapes dépendront de la vitesse à laquelle les robots, véhicules autonomes et usines intelligentes passeront du stade expérimental au déploiement industriel à grande échelle.

UELe basculement des chaînes d'approvisionnement vers l'Asie pour l'IA physique accentue la dépendance technologique de l'Europe vis-à-vis de fournisseurs non-européens, renforçant les enjeux de souveraineté industrielle déjà au cœur des débats sur l'autonomie stratégique de l'UE.

InfrastructureOpinion
1 source
Aouch ! Google publie par accident l’application qui va remplacer Gemini
480Le Big Data 

Aouch ! Google publie par accident l’application qui va remplacer Gemini

Le 30 avril 2026, Google a brièvement publié sur le Play Store une application baptisée COSMO, signée Google Research et présentée comme un « experimental AI assistant ». L'application, pesant 1,13 Go, embarque directement un modèle Gemini Nano capable de fonctionner en local sur l'appareil, sans recours systématique au cloud. Elle a disparu aussi rapidement qu'elle était apparue, mais les captures d'écran et les descriptions techniques ont eu le temps de circuler. L'interface, visiblement non finalisée, ressemblait davantage à un prototype interne qu'à un produit destiné au grand public, certaines illustrations du Play Store étant même mal affichées, signe que la publication était accidentelle. Ce qui distingue COSMO des assistants conversationnels classiques, c'est son comportement proactif : l'application ne répond pas à des requêtes, elle observe ce qui se passe à l'écran et agit sans qu'on le lui demande. Elle repose sur quatorze « Skills » capables de se déclencher automatiquement selon le contexte. Si une conversation mentionne un délai, l'assistant propose un minuteur. Si un rendez-vous apparaît dans un message, il suggère de l'ajouter à Google Agenda. Si un terme inconnu figure dans un PDF ouvert, il en affiche la définition instantanément. L'application intègre même un « Browser Agent » capable de naviguer sur le web à la place de l'utilisateur, rappelant le projet Mariner de Google. Pour fonctionner ainsi, COSMO exploite l'API d'accessibilité d'Android, ce qui lui donne un accès étendu à ce qui s'affiche sur l'écran, une capacité puissante, mais qui soulève immédiatement des questions sérieuses sur la collecte de données et le risque de surveillance permanente. Sur le plan technique, Google teste trois modes de traitement distincts : un mode entièrement local via Gemini Nano pour préserver la confidentialité, un mode cloud via une infrastructure baptisée « PI » pour des traitements plus puissants, et un mode hybride combinant les deux selon la situation. COSMO s'inscrit dans une tendance plus large chez les grands acteurs tech : aller au-delà du chatbot réactif pour construire des agents capables d'agir de manière autonome dans l'environnement numérique de l'utilisateur. Apple développe une vision similaire avec une Siri plus contextuelle, tandis que Microsoft intègre Copilot de plus en plus profondément dans Windows. Cette fuite accidentelle intervient à moins de trois semaines du Google I/O 2026, prévu le 19 mai, où Google devrait officiellement dévoiler sa nouvelle génération d'assistants. COSMO pourrait bien en être la pièce maîtresse.

UEL'accès permanent à l'écran via l'API d'accessibilité d'Android soulève des questions de conformité GDPR et AI Act qui s'appliqueront à COSMO lors de son déploiement en Europe.

La force de Palantir sur les prix de l'IA
481The Information AI 

La force de Palantir sur les prix de l'IA

Palantir publie ses résultats trimestriels ce lundi, dans un contexte de forte attention portée aux valorisations des éditeurs de logiciels. La semaine précédente, Google, Microsoft et Amazon ont confirmé que l'intelligence artificielle continue d'alimenter leurs revenus cloud, propulsant les indices boursiers à des niveaux records vendredi. Palantir, spécialisée dans l'analyse et l'intégration de grandes masses de données pour des clients gouvernementaux et privés, voit pourtant son titre perdre près de 20 % depuis le début de l'année 2026, alors que le Nasdaq Composite progressait de 8 % sur la même période. Ces résultats seront scrutés de près car ils permettront de déterminer si l'IA peut également soutenir les valorisations des logiciels d'entreprise, un segment en net recul. Les actions de Salesforce, ServiceNow, SAP et HubSpot ont toutes cédé du terrain sous la pression d'une même crainte : les outils d'IA générative développés par Anthropic et OpenAI pourraient réduire structurellement la demande pour leurs plateformes, en automatisant des tâches autrefois réservées à leurs logiciels et potentiellement des milliards de dollars de revenus récurrents. La montée en puissance des grands modèles de langage remet en cause le modèle économique des éditeurs traditionnels, qui facturent des licences pour des fonctions que ces outils commencent à assumer directement. ServiceNow présentera ses propres résultats dans la foulée de Palantir cette semaine, offrant un deuxième test de la résilience du secteur. La question centrale pour les investisseurs est désormais de savoir si des acteurs comme Palantir sauront positionner l'IA comme un vecteur de croissance plutôt que d'en subir la concurrence frontale.

UESAP, acteur européen majeur du logiciel d'entreprise, voit sa valorisation fragilisée par la montée des LLMs, ce qui pourrait peser sur les revenus et l'emploi du secteur logiciel en Europe.

BusinessOpinion
1 source
Musk s'affronte à l'avocat d'OpenAI sur le détournement allégué de son organisation caritative
482The Information AI 

Musk s'affronte à l'avocat d'OpenAI sur le détournement allégué de son organisation caritative

Elon Musk a subi mercredi un contre-interrogatoire tendu face à Bill Savitt, l'avocat externe d'OpenAI, lors de ce que la presse américaine décrit déjà comme le procès emblématique de l'ère de l'intelligence artificielle. Savitt, rompu aux batailles judiciaires impliquant Musk, a cherché à dépeindre le milliardaire comme animé par du ressentiment personnel plutôt que par des griefs légitimes. Dans plusieurs passages embarrassants pour le patron de Tesla et xAI, l'avocat a relu à voix haute des emails écrits par Musk lui-même à l'époque de la fondation d'OpenAI, corrigeant publiquement ses souvenirs sur les événements fondateurs de l'organisation. Au coeur du litige se trouve l'accusation de Musk selon laquelle OpenAI aurait trahi ses engagements initiaux envers lui et manqué à ses obligations en tant qu'organisation à but non lucratif, en pivotant vers un modèle commercial dominé par Microsoft et des investisseurs privés. Savitt a tenté de démontrer que cette plainte repose davantage sur une rancune personnelle que sur un préjudice juridique réel, fragilisant ainsi la cohérence de la position de Musk devant le tribunal. Ce procès s'inscrit dans une guerre ouverte entre Musk et les cofondateurs d'OpenAI, Sam Altman en tête, que Musk accuse d'avoir détourné une mission de service public à des fins lucratives. Musk, qui a lui-même fondé xAI en 2023 pour concurrencer directement OpenAI, fait face à des soupçons de conflits d'intérêts. L'issue de ce procès pourrait influencer la gouvernance de l'ensemble du secteur de l'IA générative.

UECe procès pourrait faire jurisprudence sur les obligations de gouvernance des organisations IA à but non lucratif, un débat qui résonne avec les discussions européennes sur la responsabilité des acteurs de l'IA dans le cadre de l'AI Act.

RégulationReglementation
1 source
Google Cloud et AWS brillent dans les résultats trimestriels des géants technologiques
483The Information AI 

Google Cloud et AWS brillent dans les résultats trimestriels des géants technologiques

Google, Microsoft, Amazon et Meta ont simultanément publié leurs résultats du premier trimestre 2026, déclenchant un déluge de chiffres qui a dominé l'actualité financière de la journée. Le constat le plus net qui se dégage de cette publication groupée : la demande en capacité de calcul liée à l'intelligence artificielle continue d'accélérer, et elle tire vers le haut les revenus cloud des trois grands, AWS, Google Cloud et Azure. Amazon a particulièrement brillé, tout comme Google Cloud, avec des croissances qui ont dépassé les attentes des analystes. Andy Jassy, PDG d'Amazon, a résumé l'ambiance en quelques mots : « Ce n'est un secret pour personne que les laboratoires d'IA dépensent des sommes considérables en infrastructure de calcul. » Ce dynamisme a pourtant une face moins reluisante. Une part significative de la demande cloud provient des grands laboratoires d'IA eux-mêmes, Anthropic, OpenAI et leurs équivalents, qui consomment massivement des ressources GPU pour entraîner et faire tourner leurs modèles. Cela signifie que la croissance actuelle du cloud est en partie circulaire : les fournisseurs cloud investissent dans l'IA, et les entreprises d'IA réinjectent ces revenus en achetant encore plus de cloud. Jassy a néanmoins tenu à nuancer le tableau, soulignant qu'une partie non négligeable de la demande émane d'entreprises classiques qui intègrent l'IA dans leurs opérations, ce qui est indispensable si l'on veut que la révolution de l'IA soit économiquement viable à long terme. Sur le front publicitaire, Meta et Google ont également affiché de bons résultats, l'IA améliorant le ciblage et l'efficacité de leurs régies. Ces résultats s'inscrivent dans une séquence d'investissements massifs : les grandes entreprises technologiques ont collectivement annoncé des centaines de milliards de dollars de dépenses en infrastructure IA pour 2025 et 2026. La question qui reste ouverte est celle de la rentabilité de cet écosystème au-delà des hyperscalers eux-mêmes. Si les entreprises ordinaires adoptent l'IA à grande échelle, comme Jassy l'espère, le modèle tient. Dans le cas contraire, la bulle d'investissement repose essentiellement sur une concentration de quelques acteurs qui se financent mutuellement, un équilibre que les prochains trimestres permettront de mieux évaluer.

UEL'essor de la demande cloud tirée par l'IA se répercute indirectement sur les entreprises européennes qui dépendent de ces infrastructures pour déployer leurs propres projets d'IA, sans que l'article n'identifie d'impact direct sur la France ou l'UE.

BusinessActu
1 source
CARLA-Air: infrastructure unifiée pour drones et agents autonomes aériens et terrestres dans CARLA
484arXiv cs.RO 

CARLA-Air: infrastructure unifiée pour drones et agents autonomes aériens et terrestres dans CARLA

Des chercheurs ont publié CARLA-Air, une plateforme de simulation open source qui permet, pour la première fois, de faire voler des drones multirotor directement dans l'environnement urbain de CARLA, le simulateur de référence pour la conduite autonome, développé initialement par Waymo et maintenu par la communauté. La plateforme tourne au sein d'un unique processus Unreal Engine, garantissant une cohérence spatiale et temporelle stricte entre les agents au sol et les drones, tout en capturant simultanément jusqu'à 18 modalités de capteurs à chaque pas de simulation. Elle préserve les API Python natives de CARLA et d'AirSim, ainsi que les interfaces ROS 2, ce qui permet de réutiliser du code existant sans aucune modification. L'enjeu est considérable pour les équipes qui travaillent sur les systèmes robotiques mixtes air-sol, un domaine en pleine expansion avec le développement des économies à basse altitude, livraisons par drone, inspection d'infrastructures, mobilité urbaine aérienne. Jusqu'ici, les simulateurs de conduite manquaient de dynamique aérienne réaliste, tandis que les simulateurs de drones proposaient des environnements urbains trop simplifiés. Les solutions de co-simulation par pont introduisaient des décalages temporels incompatibles avec l'entraînement de politiques de navigation ou de perception multi-modale. CARLA-Air supprime ces compromis en offrant un seul environnement avec trafic conforme aux règles de circulation, piétons à comportement social, et dynamique aérodynamique cohérente. Le projet répond aussi à une urgence pratique : Microsoft a archivé le développement d'AirSim, le simulateur de drones le plus utilisé dans la recherche académique, laissant orphelines de nombreuses équipes. CARLA-Air reprend cet héritage et l'intègre dans une infrastructure moderne et activement maintenue. La plateforme est déjà conçue pour accueillir des charges de travail avancées : coopération air-sol, navigation incarnée, actions guidées par le langage, construction de jeux de données et entraînement par renforcement. Le code source complet et des binaires précompilés sont disponibles sur GitHub, ce qui devrait faciliter son adoption rapide dans la communauté robotique et autonome.

UELes équipes de recherche européennes en robotique et mobilité urbaine aérienne disposent d'une alternative open source maintenue à AirSim pour développer et entraîner des systèmes autonomes mixtes air-sol.

RobotiqueOpinion
1 source
Shopify, l'IA en 2026 : explosion des usages, budget Opus-4.6 illimité, avec le CTO Mikhail Parakhin
485Latent Space 

Shopify, l'IA en 2026 : explosion des usages, budget Opus-4.6 illimité, avec le CTO Mikhail Parakhin

Shopify, la plateforme de commerce en ligne valorisée 200 milliards de dollars, est entrée en 2026 dans ce que son directeur technique Mikhail Parakhin appelle une "phase de transition IA". L'entreprise de vingt ans offre désormais à ses ingénieurs un budget illimité en tokens Claude Opus 4.6 et a déployé trois initiatives internes majeures : Tangle, Tangent et SimGym. Tangle rend les workflows de machine learning reproductibles et collaboratifs grâce à un cache adressé par contenu, se distinguant nettement d'outils comme Airflow. Tangent est un système d'auto-recherche en boucle fermée qui optimise automatiquement des composants comme la recherche produit, la compression de prompts ou le stockage, désormais accessible aux chefs de produit sans expertise ML. SimGym permet de simuler le comportement d'acheteurs à partir des données historiques réelles de Shopify, une infrastructure coûteuse mêlant modèles multimodaux, browser farms et distillation, qui permet d'indiquer précisément à un marchand quoi modifier sur sa boutique pour améliorer ses conversions. Parakhin révèle également que Shopify utilise Liquid AI, qu'il décrit comme la première architecture non-transformer réellement compétitive qu'il ait testée en pratique, notamment pour la compréhension de requêtes à très faible latence. Ce que Shopify documente publiquement est instructif pour toute l'industrie : le vrai goulot d'étranglement dans le développement assisté par IA n'est plus la génération de code, mais la revue, l'intégration continue et la stabilité du déploiement. Parakhin confirme un paradoxe contre-intuitif : les agents IA peuvent produire du code statistiquement plus propre que les humains tout en augmentant le nombre de bugs en production, simplement parce que le volume de code généré explose sans que les processus de validation suivent. Shopify a donc construit son propre workflow de revue de pull requests, jugeant insuffisants les outils standards du marché. Parakhin nuance également la rhétorique de Jensen Huang sur les budgets de tokens : si la direction est juste, le nombre brut de tokens reste une mauvaise métrique pour évaluer la productivité d'une équipe d'ingénierie. Mikhail Parakhin arrive chez Shopify après avoir dirigé des divisions majeures chez Microsoft, notamment Windows, Edge, Bing et la publicité, et avoir présidé à l'ère controversée du chatbot "Sydney" de Bing en 2023. Ce passé lui donne un regard calibré sur la vague actuelle : il situe un point d'inflexion décisif en décembre 2025, moment où la qualité des modèles a franchi un seuil rendant la généralisation à la fois possible et nécessaire pour rester compétitif. Pour Shopify, tenir la frontière technologique n'est plus un avantage optionnel. La combinaison Tangle-Tangent-SimGym est présentée comme un avantage structurel défensif : ces systèmes permettent d'expérimenter de façon reproductible, d'optimiser automatiquement et de simuler le comportement commercial à grande échelle, en s'appuyant sur vingt ans de données transactionnelles que peu de concurrents peuvent répliquer.

BusinessOpinion
1 source
486InfoQ AI 

AWS lance un registre d'agents en aperçu pour gérer la prolifération des agents IA en entreprise

Amazon Web Services a lancé Agent Registry en version préliminaire, une nouvelle fonctionnalité intégrée à Amazon Bedrock AgentCore, destinée à répondre à un problème croissant dans les grandes entreprises : la prolifération incontrôlée d'agents IA déployés en silo. Concrètement, cette solution propose un catalogue centralisé permettant de découvrir, gouverner et réutiliser des agents IA, des outils et des serveurs MCP au sein d'une même organisation, quel que soit l'endroit où ces agents s'exécutent. Le registre prend en charge nativement les protocoles MCP (Model Context Protocol) et A2A (Agent-to-Agent). Pour les équipes techniques des grandes entreprises, l'enjeu est considérable : sans inventaire central, les organisations se retrouvent avec des dizaines d'agents redondants, difficiles à auditer, à maintenir ou à faire évoluer. Agent Registry entend résoudre ce problème de gouvernance en offrant une visibilité unifiée sur l'ensemble du parc d'agents, facilitant ainsi la réutilisation des composants existants et réduisant les coûts de développement. Cette initiative s'inscrit dans une course entre les grands fournisseurs cloud pour imposer leur standard de gestion d'agents IA. Microsoft et Google Cloud proposent leurs propres solutions concurrentes, tandis que l'ACP Registry constitue une alternative indépendante. Le choix d'intégrer nativement les protocoles MCP et A2A signale la volonté d'AWS de s'aligner sur les standards émergents de l'industrie, dans un contexte où l'interopérabilité entre agents de différentes plateformes devient un critère décisif pour les entreprises qui multiplient les déploiements.

UELes grandes entreprises européennes utilisant AWS peuvent désormais centraliser la gouvernance de leurs agents IA via ce registre, facilitant l'audit et la conformité dans un contexte de multiplication des déploiements.

OutilsActu
1 source
487MarkTechPost 

Liquid AI lance LFM2.5-VL-450M : un modèle vision-langage de 450M paramètres avec détection d'objets, support multilingue et inférence en moins de 250ms sur appareils embarqués

Liquid AI a publié LFM2.5-VL-450M, une nouvelle version de son modèle de vision-langage conçu pour fonctionner directement sur du matériel embarqué. Ce modèle de 450 millions de paramètres tourne sur des dispositifs comme le NVIDIA Jetson Orin, l'AMD Ryzen AI Max+ 395 ou le Snapdragon 8 Elite du Samsung Galaxy S25 Ultra, avec une latence inférieure à 250 millisecondes. Par rapport à son prédécesseur LFM2-VL-450M, la nouvelle version apporte quatre améliorations majeures : la prédiction de boîtes englobantes (bounding boxes), un meilleur suivi des instructions, un support multilingue étendu couvrant désormais l'arabe, le chinois, le français, l'allemand, le japonais, le coréen, le portugais et l'espagnol, ainsi que la prise en charge des appels de fonctions. Sur le plan technique, le modèle repose sur LFM2.5-350M comme backbone textuel et SigLIP2 NaFlex comme encodeur visuel de 86 millions de paramètres, avec une fenêtre de contexte de 32 768 tokens. Le pré-entraînement a été multiplié par presque trois, passant de 10 000 à 28 000 milliards de tokens, suivi d'un post-entraînement par optimisation des préférences et apprentissage par renforcement. La capacité de localisation spatiale constitue le saut qualitatif le plus significatif de cette version. Le modèle atteint désormais un score de 81,28 sur le benchmark RefCOCO-M, contre zéro pour la version précédente, ce qui signifie qu'il peut identifier précisément où se trouve un objet dans une image à partir d'une description en langage naturel, en retournant des coordonnées JSON normalisées. Cette différence est cruciale : là où un modèle de description d'images dit "il y a une personne dans le coin gauche", un modèle avec bounding boxes fournit les coordonnées exploitables directement dans un pipeline automatisé. Les scores multilingues ont progressé de 54,29 à 68,09 sur le benchmark MMMB, et le suivi d'instructions est passé de 32,93 à 45,00 sur MM-IFEval. Ces améliorations rendent le modèle utilisable dans des déploiements industriels réels sans infrastructure cloud ni pipeline de localisation séparé. Liquid AI s'est constitué depuis 2023 comme une alternative aux architectures Transformer classiques, en développant des modèles basés sur des réseaux neuronaux à temps continu (Liquid Neural Networks). L'entreprise cible explicitement le marché de l'IA embarquée et de la robotique, où les contraintes de latence et de consommation énergétique rendent les grands modèles cloud impraticables. La course aux modèles compacts et performants s'intensifie : Google, Apple, Microsoft et Meta ont tous publié des variantes "edge" de leurs modèles en 2025, mais peu descendent sous le milliard de paramètres tout en conservant des capacités spatiales. Avec ce positionnement, Liquid AI vise directement des applications comme les caméras de rayonnage en grande distribution, les lunettes intelligentes ou les robots d'entrepôt, des secteurs où le traitement local des images sans connexion au cloud représente un avantage compétitif décisif.

UELe support natif du français et le ciblage de secteurs industriels (grande distribution, robotique d'entrepôt) offrent aux entreprises européennes une option d'IA embarquée compétitive sans dépendance à une infrastructure cloud.

💬 Le score bounding boxes qui passe de zéro à 81 sur RefCOCO, ça ressemble à une note de benchmark de plus, mais c'est en fait ce qui rend le modèle utilisable dans un vrai pipeline industriel. Tu poses ça sur un Jetson Orin ou un téléphone Samsung, tu as des coordonnées JSON exploitables en moins de 250ms, sans cloud, sans infrastructure séparée. Pour les caméras de rayon ou la robotique d'entrepôt, ça change vraiment l'équation.

LLMsActu
1 source
Meta parie 21 milliards sur CoreWeave : La nouvelle référence de la valorisation IA ?
488Le Big Data 

Meta parie 21 milliards sur CoreWeave : La nouvelle référence de la valorisation IA ?

Meta a annoncé le 9 avril 2026 un nouvel accord de 21 milliards de dollars avec CoreWeave, portant l'engagement total du groupe envers ce fournisseur de cloud GPU à plus de 35 milliards de dollars. Cet accord court jusqu'en décembre 2032 et couvre principalement des capacités de calcul dédiées à l'inférence, c'est-à-dire le traitement en temps réel des requêtes IA dans les applications grand public. L'action CoreWeave ($CRWV) a bondi d'environ 8 % à l'annonce de la nouvelle. Le partenariat inclut également un accès anticipé à la plateforme NVIDIA Vera Rubin, la prochaine génération de puces IA qui succède à l'architecture Blackwell, déployée sur plusieurs sites avant sa disponibilité commerciale large. Cet accord illustre un changement de paradigme dans la compétition en intelligence artificielle : l'infrastructure compute est désormais aussi stratégique que les modèles eux-mêmes. Les modèles Llama de Meta sont intégrés dans Facebook, Instagram, WhatsApp et Messenger, soit plusieurs milliards d'utilisateurs actifs. À cette échelle, chaque requête mobilise de la puissance de calcul, et la latence comme les coûts deviennent des variables critiques. CoreWeave, spécialisé dans les clusters GPU haute densité, peut déployer des capacités beaucoup plus rapidement qu'un hyperscaler classique en phase de construction, ce qui en fait un relais opérationnel immédiatement exploitable. L'accès anticipé aux puces Vera Rubin donne par ailleurs à Meta un avantage compétitif concret : optimiser ses modèles sur une architecture plus performante avant que ses concurrents ne puissent faire de même. Meta n'abandonne pas pour autant ses investissements internes. Le groupe prévoit entre 115 et 135 milliards de dollars de dépenses d'investissement pour 2026, dont un centre de données estimé à 10 milliards de dollars au Texas. Mais ces infrastructures propres prennent des années à construire, et l'urgence concurrentielle ne permet pas d'attendre. La stratégie adoptée est donc hybride : construire en interne pour le long terme, louer chez CoreWeave pour répondre aux besoins immédiats. Mike Intrator, PDG de CoreWeave, a résumé cette logique en évoquant un risque opérationnel trop élevé pour dépendre d'une seule approche. Ce modèle de redondance computing, mi-propriétaire mi-externalisé, pourrait rapidement devenir la norme dans l'industrie, à mesure que Google, Microsoft et Amazon font face aux mêmes tensions sur les GPU et aux mêmes exigences de rapidité d'exécution.

UECet accord renforce la concentration des ressources GPU chez les acteurs américains, réduisant indirectement la capacité des entreprises européennes à accéder à des infrastructures IA compétitives à coût et délai raisonnables.

InfrastructureOpinion
1 source
Une IA soutenue par Apple et Google révèle des milliers de failles dans des logiciels très utilisés
489Siècle Digital 

Une IA soutenue par Apple et Google révèle des milliers de failles dans des logiciels très utilisés

Project Glasswing, une initiative de cybersécurité soutenue par douze géants technologiques dont Apple, Google, Microsoft, AWS, Cisco, NVIDIA et JPMorgan Chase, a été lancée pour détecter automatiquement des failles dans les logiciels les plus critiques au monde. Le projet s'appuie sur un système d'intelligence artificielle baptisé Mythos, capable d'analyser en profondeur des bases de code massives pour y repérer des vulnérabilités jusqu'alors inconnues. Plus de quarante organisations gérant des infrastructures logicielles mondiales participent également à l'initiative, coordonnée sous l'égide de la Linux Foundation. Aucun accès public, abonnement commercial ou lancement grand public n'est prévu : le projet fonctionne exclusivement en consortium fermé. L'enjeu est considérable. Les logiciels open source constituent la colonne vertébrale de l'infrastructure numérique mondiale, des serveurs bancaires aux systèmes industriels en passant par les plateformes cloud. Des failles non détectées dans ces composants peuvent exposer des millions d'organisations simultanément, comme l'avait illustré la vulnérabilité Log4Shell en 2021. En automatisant la détection à grande échelle, Mythos promet de réduire drastiquement la fenêtre d'exposition entre l'introduction d'une faille et sa correction, un délai qui se compte aujourd'hui souvent en mois, voire en années. Ce projet s'inscrit dans une tendance de fond : après des années à construire des IA génératives grand public, les grandes entreprises technologiques réorientent une partie de leurs investissements vers des usages à fort impact systémique. La sécurité logicielle, longtemps sous-financée malgré sa criticité, attire désormais des coalitions inédites. Project Glasswing illustre aussi une réponse collective aux pressions réglementaires croissantes en Europe et aux États-Unis, qui imposent aux éditeurs une responsabilité accrue sur la sécurité de leurs chaînes d'approvisionnement logicielles.

UELes pressions réglementaires européennes sur la sécurité des chaînes d'approvisionnement logicielles (Cyber Resilience Act) sont citées comme moteur explicite du projet, qui vise à réduire les risques systémiques pesant sur les infrastructures numériques utilisées en Europe.

SécuritéOpinion
1 source
Y a-t-il trop de Copilot dans l’avion ?
490Next INpact 

Y a-t-il trop de Copilot dans l’avion ?

Microsoft fait face à une prolifération incontrôlable de sa marque Copilot, comme l'a documenté Key Bannerman, spécialiste IA, qui a recensé pas moins de 78 déclinaisons différentes du produit. Chatbots, applications de bureau, outils pour développeurs, plateformes d'entreprise, intégrations dans d'autres logiciels, assistants sectoriels : Copilot est partout. Depuis ce recensement, deux nouvelles variantes sont apparues, Gaming Copilot pour l'aide en jeu sur PC et Xbox, et Microsoft Dragon Copilot pour le secteur de la santé, auxquels s'ajoute Copilot Health annoncé en mars 2026. L'éditeur est allé jusqu'à créer Microsoft Copilot Studio, un outil permettant de fabriquer... d'autres Copilot. Sur le matériel, les PC Copilot+ embarquent une touche physique dédiée, et le navigateur Edge affiche GitHub Copilot en mode Copilot, le tout dans Microsoft 365 Copilot. Cette inflation de marque soulève une question de fond : à force de tout rebaptiser Copilot, Microsoft brouille le message et dilue la valeur perçue du produit. Pour Key Bannerman, ce réflexe de renommage est avant tout "un instinct de survie" interne : chaque équipe cherche à prouver qu'elle fait partie de "l'histoire de l'IA" pour éviter d'être marginalisée. Parallèlement, une clause discrète dans les conditions d'utilisation de Copilot, modifiée en octobre, a refait surface sur les réseaux sociaux : Microsoft y précise en gras que "Copilot est uniquement destiné à des fins de divertissement" et déconseille de s'y fier pour des "conseils importants". Ce message tranche avec le discours commercial de l'entreprise, qui positionne son IA comme un outil de productivité indispensable pour les particuliers et les entreprises. Microsoft a promis de revoir cette formulation, la qualifiant d'"héritage" de l'époque où Copilot était un simple assistant de recherche dans Bing. La concurrence pratique des stratégies similaires, Google apposant l'étiquette Gemini sur l'ensemble de ses produits, mais la surenchère de Microsoft est particulièrement visible car elle touche à Windows lui-même. La réception glaciale réservée en fin d'année dernière à la vision d'un Windows "agentique" a contraint l'éditeur à réduire ses ambitions : en mars 2026, Microsoft a annoncé la suppression progressive d'intégrations Copilot jugées inutiles dans Windows 11, notamment dans Capture et croquis et Photos. La question de la responsabilité des IA reste entière : Anthropic et OpenAI rappellent eux aussi que leurs modèles "peuvent faire des erreurs", mais aucun ne les présente simultanément comme des outils de divertissement et comme la colonne vertébrale de la productivité professionnelle. L'enjeu pour Microsoft est désormais de rationaliser ce portefeuille fragmenté avant que la confusion ne se retourne contre la marque.

UELes entreprises françaises et européennes déployant Microsoft 365 Copilot en environnement professionnel doivent examiner la clause des CGU stipulant que Copilot est 'uniquement destiné à des fins de divertissement', ce qui soulève des questions concrètes de responsabilité contractuelle et de conformité au RGPD.

BusinessOpinion
1 source
Amazon S3 Files offre aux agents IA un espace de travail fichier natif, mettant fin à la séparation objet/fichier
491VentureBeat AI 

Amazon S3 Files offre aux agents IA un espace de travail fichier natif, mettant fin à la séparation objet/fichier

Amazon Web Services a lancé S3 Files, une nouvelle fonctionnalité qui permet de monter directement un bucket S3 dans l'environnement local d'un agent IA ou d'un développeur, comme s'il s'agissait d'un répertoire ordinaire. Disponible dès maintenant dans la plupart des régions AWS, cette solution repose sur la technologie Elastic File System (EFS) d'Amazon, connectée directement à S3 pour offrir une sémantique de fichiers complète et native. Aucune migration de données n'est nécessaire : les fichiers restent dans S3, accessibles simultanément via l'API objet classique et via le système de fichiers monté. Andy Warfield, vice-président et ingénieur distingué chez AWS, a expliqué à VentureBeat que cette approche a produit "une accélération considérable" pour des outils comme Kiro et Claude Code lors de tests internes. Le problème que S3 Files résout est fondamental pour les pipelines d'IA agentique. Les agents IA fonctionnent naturellement avec des chemins de fichiers et des outils de navigation de répertoires, mais l'essentiel des données d'entreprise réside dans des systèmes de stockage objet comme S3, accessibles uniquement via des appels API. Jusqu'ici, les équipes devaient télécharger les données localement avant que l'agent puisse les traiter, ce qui créait un problème critique de persistance d'état : lorsque l'agent compressait sa fenêtre de contexte, il "oubliait" ce qu'il avait déjà téléchargé, forçant l'utilisateur à répéter les instructions. Dans des pipelines multi-agents, où plusieurs agents doivent accéder simultanément aux mêmes données, la situation devenait ingérable. Avec S3 Files, un développeur peut simplement indiquer le chemin d'un répertoire de logs, et l'agent y accède directement sans étape intermédiaire. AWS annonce que des milliers de ressources de calcul peuvent se connecter simultanément à un même système de fichiers S3. Les tentatives précédentes de combler le fossé entre stockage objet et système de fichiers reposaient sur des couches logicielles dites FUSE (Filesystems in USErspace), comme Mount Point d'AWS, gcsfuse de Google ou blobfuse2 de Microsoft. Ces outils simulaient un système de fichiers en surface, mais butaient sur des limitations profondes : S3 ne supporte pas le déplacement atomique d'objets et ne possède pas de répertoires au sens strict. Ces pilotes bricolaient des métadonnées supplémentaires dans les buckets, cassant la vue API objet, ou refusaient les opérations fichier que le stockage ne pouvait pas exécuter. S3 Files rompt avec cette approche en intégrant directement EFS à S3, sans compromis entre les deux interfaces. Cette évolution s'inscrit dans la course des grands fournisseurs cloud à rendre leurs infrastructures compatibles avec les nouveaux usages de l'IA agentique, où la fluidité d'accès aux données devient un avantage concurrentiel direct.

UEDisponible dès maintenant dans la plupart des régions AWS, cette fonctionnalité est accessible aux développeurs et entreprises européens utilisant S3 pour leurs pipelines d'IA agentique.

InfrastructureActu
1 source
Slack lance 30 nouveautés pour placer Slackbot au cœur du travail
492Le Big Data 

Slack lance 30 nouveautés pour placer Slackbot au cœur du travail

Slack a annoncé plus de 30 nouvelles fonctionnalités pour Slackbot, transformant profondément cet assistant autrefois basique en un véritable coéquipier actif au sein des organisations. Disponible dès maintenant pour les abonnements Business+ et Enterprise+ via une activation dans les paramètres administrateur, cette mise à jour s'inscrit dans la continuité des capacités "agentiques" introduites en janvier. Salesforce, propriétaire de Slack, prévoit d'élargir l'accès aux utilisateurs Free et Pro dès avril, avec un quota limité de conversations pour commencer. Parmi les nouvelles capacités concrètes : Slackbot peut écouter une réunion, prendre des notes en temps réel, afficher automatiquement une fiche client dès qu'un nom est mentionné dans la discussion, puis générer un résumé complet à la fin de l'échange. Depuis mobile, il reconnaît les commandes vocales et peut envoyer des invitations ou mettre à jour un CRM directement. Un agent desktop lui permet également d'analyser ce qui apparaît à l'écran et d'agir depuis Slack sans prise de contrôle de l'ordinateur. Un mode de recherche approfondie baptisé Deep Thoughts lui permet enfin de décomposer un problème complexe, consulter plusieurs sources et produire une synthèse structurée. Ce repositionnement de Slackbot répond à un problème identifié par Slack lui-même : les outils d'IA fonctionnent trop souvent en silo, sans offrir suffisamment de contexte opérationnel aux équipes. En intégrant l'assistant directement dans les flux de travail existants plutôt que de demander aux employés de basculer vers un outil séparé, Slack réduit le fossé entre l'analyse et l'action. Les AI Skills, ensembles d'instructions réutilisables que les équipes configurent une fois puis partagent à toute l'organisation, permettent de standardiser des tâches répétitives comme la rédaction de comptes rendus ou la synthèse d'un pipeline commercial. Pour les PME, des fonctions de gestion client permettent de mettre à jour contacts, opportunités et rapports d'appel directement depuis les conversations Slack, sans interface CRM dédiée. Slack s'inscrit dans une course que se livrent Microsoft (Copilot dans Teams), Google (Gemini dans Workspace) et désormais Salesforce pour faire de leur plateforme de collaboration le point d'entrée unique de l'IA en entreprise. L'adoption du protocole MCP — standard d'interopérabilité entre agents IA — permet à Slackbot de se connecter à Agentforce et aux applications tierces compatibles, renforçant l'écosystème Salesforce. La mémorisation progressive des habitudes utilisateur et le respect strict des permissions administrateur sont présentés comme les garanties d'un déploiement sécurisé en entreprise. La prochaine étape sera de vérifier si cet élargissement aux plans gratuits en avril convertit effectivement les utilisateurs vers les offres payantes, véritable enjeu commercial derrière cette offensive fonctionnelle.

UELes entreprises françaises et européennes utilisant Slack en abonnement Business+ ou Enterprise+ peuvent activer dès maintenant ces fonctionnalités agentiques, avec un accès élargi aux plans gratuits prévu en avril.

OutilsOutil
1 source
Slack ajoute 30 fonctionnalités IA à Slackbot, sa mise à jour la plus ambitieuse depuis le rachat par Salesforce
493VentureBeat AI 

Slack ajoute 30 fonctionnalités IA à Slackbot, sa mise à jour la plus ambitieuse depuis le rachat par Salesforce

Slack a annoncé mardi plus de 30 nouvelles fonctionnalités pour Slackbot, son assistant IA intégré, lors d'un événement keynote co-animé par le PDG de Salesforce, Marc Benioff. Cette mise à jour, la plus ambitieuse depuis le rachat de Slack par Salesforce pour 27,7 milliards de dollars en 2021, transforme Slackbot en un véritable agent d'entreprise autonome. Parmi les nouveautés : un mode de recherche approfondie capable de mener des investigations multi-étapes en environ quatre minutes, une intégration du protocole MCP (Model Context Protocol) permettant d'interagir avec plus de 2 600 applications du Slack Marketplace et 6 000 applications Salesforce AppExchange, ainsi qu'une intelligence de réunion qui transcrit et résume les appels sur Zoom, Google Meet ou tout autre fournisseur en captant l'audio directement depuis l'application desktop. Slack introduit également les "AI-Skills", des ensembles d'instructions réutilisables que les équipes peuvent créer une fois et déployer à la demande — Slackbot les appliquant automatiquement dès qu'il reconnaît un cas d'usage correspondant. Ces changements ne sont pas anodins : lancé en disponibilité générale le 13 janvier 2026 pour les abonnés Business+ et Enterprise+, Slackbot est en passe de devenir le produit le plus rapidement adopté des 27 ans d'histoire de Salesforce. Certains employés de sociétés clientes déclarent économiser jusqu'à 90 minutes par jour, tandis qu'en interne, les équipes Salesforce revendiquent des gains allant jusqu'à 20 heures par semaine, soit plus de 6,4 millions de dollars de valeur productive estimée. Pour les petites entreprises, Slackbot peut même faire office de CRM léger, sans installation supplémentaire. L'enjeu est donc considérable : Slack veut se positionner comme un "système d'exploitation agentique" — une interface unique par laquelle les travailleurs pilotent leurs agents IA, leurs applications métier et leurs collaborateurs. Ce pivot s'inscrit dans une bataille frontale avec Microsoft, qui intègre depuis deux ans son assistant Copilot à l'ensemble de sa suite de productivité. Salesforce, longtemps perçu comme n'ayant pas pleinement exploité son acquisition de Slack, semble désormais vouloir en faire le point de convergence de sa stratégie IA, portée par la plateforme Agentforce. Rob Seaman, PDG par intérim de Slack et ancien directeur produit, résume l'ambition sans détour : "La limite supérieure des cas d'usage est effectivement illimitée." Avec l'adoption massive du MCP comme standard d'intégration et une architecture pensée pour l'autonomie des agents, Slack parie que l'interface de messagerie d'entreprise deviendra le cockpit central de l'IA au travail — un territoire que Microsoft, Google et d'autres entendent bien ne pas céder facilement.

UELes entreprises européennes abonnées à Slack Business+ ou Enterprise+ ont accès depuis janvier 2026 à ces capacités agentiques, ce qui peut influencer leurs décisions d'outillage face à Microsoft 365 Copilot.

OutilsOutil
1 source
AWS lance des agents autonomes pour les tests de sécurité et les opérations cloud
494AWS ML Blog 

AWS lance des agents autonomes pour les tests de sécurité et les opérations cloud

Amazon Web Services a annoncé la disponibilité générale de deux agents autonomes d'intelligence artificielle lors de son événement re:Invent : AWS Security Agent, dédié aux tests d'intrusion, et AWS DevOps Agent, spécialisé dans les opérations cloud. Ces systèmes appartiennent à une nouvelle catégorie baptisée « frontier agents » — des IA capables de travailler de façon autonome pendant des heures, voire des jours, sans supervision humaine continue. Selon AWS, les retours des clients en phase de préversion sont significatifs : AWS Security Agent réduit les délais de tests de pénétration de plusieurs semaines à quelques heures, tandis qu'AWS DevOps Agent accélère la résolution d'incidents de 3 à 5 fois. Des entreprises comme Bamboo Health et HENNGE K.K. témoignent de résultats concrets, cette dernière affirmant avoir réduit la durée de ses cycles de sécurité de plus de 90 %. L'enjeu pour les équipes de sécurité et d'exploitation est majeur. La plupart des organisations ne peuvent aujourd'hui faire réaliser des tests de pénétration manuels que sur leurs applications les plus critiques, faute de temps et de budget — laissant la majorité de leur portefeuille logiciel vulnérable entre deux cycles d'audit. AWS Security Agent change cette équation en analysant le code source, les diagrammes d'architecture et la documentation pour reconstituer des chaînes d'attaque complexes que les scanners traditionnels ne détectent pas. Côté opérations, AWS DevOps Agent s'intègre avec les principaux outils du marché — CloudWatch, Datadog, Dynatrace, Splunk, Grafana, GitHub, GitLab — et corrèle télémétrie, code et données de déploiement pour identifier la cause racine d'un incident, qu'il s'agisse d'infrastructures AWS, Azure, hybrides ou on-premise. Pour les équipes SRE débordées, c'est la promesse d'un coéquipier disponible en permanence. Ces annonces s'inscrivent dans une course à l'automatisation des opérations IT qui s'intensifie depuis l'essor des grands modèles de langage. Les hyperscalers — AWS, Microsoft Azure, Google Cloud — cherchent tous à proposer des agents capables de gérer des tâches complexes et durables, au-delà des simples assistants conversationnels. AWS positionne explicitement ces outils non comme des aides ponctuelles, mais comme de véritables extensions de l'équipe humaine, capables de prendre des décisions en plusieurs étapes sans intervention constante. Amy Herzog, vice-présidente et RSSI d'AWS, indique que l'entreprise utilise elle-même AWS Security Agent en interne. La question qui se posera à mesure de l'adoption est celle de la gouvernance : jusqu'où déléguer à une IA des décisions critiques sur la sécurité ou la stabilité des systèmes de production ?

UELes entreprises européennes utilisant AWS peuvent adopter ces agents pour réduire leurs coûts et délais de tests de sécurité, mais la délégation de décisions critiques à une IA soulève des questions de conformité avec le RGPD et l'AI Act.

OutilsOutil
1 source
Arm entre dans l'arène du silicium : le CPU AGI prêt à propulser l'IA agentique, mais au milieu d'une forte concurrence
495ZDNET FR 

Arm entre dans l'arène du silicium : le CPU AGI prêt à propulser l'IA agentique, mais au milieu d'une forte concurrence

Arm, le concepteur britannique de puces dont l'architecture équipe la quasi-totalité des smartphones mondiaux, a annoncé le lancement de son propre processeur destiné aux data centers : l'Arm AGI CPU. Contrairement à son modèle historique de simple vente de licences d'architecture, Arm entre cette fois directement sur le marché du silicium, ciblant spécifiquement les charges de travail liées à l'IA agentique — ces systèmes autonomes capables d'enchaîner des tâches complexes sans intervention humaine. Cette annonce marque un tournant stratégique majeur pour l'industrie. L'IA agentique exige des processeurs capables de gérer des flux de raisonnement continus et intensifs, un segment jusqu'ici dominé par les GPU de Nvidia et les puces custom de Google (TPU) ou Amazon (Trainium). En proposant un CPU optimisé pour ces usages, Arm s'attaque à un marché en croissance explosive, tout en challengeant ses propres clients comme Qualcomm et Apple qui s'appuient sur ses licences. Le mouvement s'inscrit dans un contexte de consolidation verticale accélérée : Meta, Microsoft et Amazon développent leurs propres puces, tandis que SoftBank — propriétaire d'Arm depuis 2016 et reintroduit en bourse en 2023 — pousse à une montée en valeur ajoutée. La concurrence sera néanmoins rude face à des acteurs comme AMD, Intel et surtout Nvidia, dont l'emprise sur l'infrastructure IA reste considérable. Les prochains mois révéleront si Arm peut transformer son omniprésence architecturale en avantage commercial direct sur ce segment stratégique.

UEArm étant une entreprise britannique stratégique soutenue par SoftBank, son entrée sur le marché des processeurs pour data centers pourrait renforcer l'écosystème européen des semi-conducteurs et influencer les choix d'infrastructure IA des acteurs cloud opérant en Europe.

InfrastructureOpinion
1 source
496AI News 

NVIDIA veut rendre les agents IA d'entreprise suffisamment sûrs pour être vraiment déployés

NVIDIA a présenté l'Agent Toolkit lors du GTC 2026 (San Jose, 16 mars), une suite open source permettant aux entreprises de déployer des agents IA autonomes avec des garde-fous de sécurité intégrés via OpenShell, développé en partenariat avec Cisco, CrowdStrike, Google, Microsoft Security et TrendAI. Le toolkit inclut NVIDIA AI-Q, un moteur de recherche agentique basé sur LangChain combinant des modèles frontier et les modèles open Nemotron, réduisant les coûts de requêtes de plus de 50 % tout en atteignant les meilleures performances sur le DeepResearch Bench. Des partenaires majeurs comme Adobe, SAP, Salesforce, ServiceNow et Siemens adoptent déjà la solution, Salesforce intégrant notamment Agentforce dans Slack comme couche d'orchestration.

UELes entreprises européennes utilisant SAP ou Siemens pourraient adopter ce toolkit pour déployer des agents IA sécurisés en conformité avec l'AI Act.

OutilsOutil
1 source
Meta s’allie à Nebius pour sécuriser 27 milliards de puissance IA
497Le Big Data 

Meta s’allie à Nebius pour sécuriser 27 milliards de puissance IA

Meta a conclu un accord de 27 milliards de dollars avec Nebius, société d'infrastructure cloud IA basée à Amsterdam (issue de la restructuration de Yandex), incluant 12 milliards de capacité de calcul dédiée et jusqu'à 15 milliards d'achats supplémentaires sur cinq ans. Le partenariat comprendra l'un des premiers déploiements à grande échelle de la plateforme NVIDIA Vera Rubin. Nebius, dont l'action a progressé de 35 % depuis janvier pour une capitalisation de 28,6 milliards de dollars, cumule ainsi des contrats géants avec Microsoft (17,4 Md$), Meta et Nvidia, malgré une perte nette de 250 M$ au dernier trimestre.

UENebius, domiciliée à Amsterdam, s'impose comme un acteur européen clé de l'infrastructure cloud IA en cumulant des contrats géants avec les plus grands groupes tech mondiaux.

BusinessActu
1 source
The Download : Pokémon Go pour entraîner des modèles du monde, et la course États-Unis/Chine pour trouver des extraterrestres
498MIT Technology Review 

The Download : Pokémon Go pour entraîner des modèles du monde, et la course États-Unis/Chine pour trouver des extraterrestres

Niantic Spatial, spin-off d'IA de Niantic (créateur de Pokémon Go), exploite les données massives collectées par ses 500 millions d'utilisateurs pour construire un « world model » destiné à aider les robots de livraison à naviguer avec précision. Par ailleurs, la sonde Perseverance a découvert en juillet 2024 des formations rocheuses prometteuses pour la recherche de vie martienne, mais le programme NASA de retour d'échantillons est aujourd'hui en sursis — laissant potentiellement la Chine prendre la tête de cette course scientifique. En parallèle, Anthropic craint de perdre des milliards de dollars suite à son inscription sur liste noire par le Pentagone, tandis que Microsoft la soutient dans son recours judiciaire.

RobotiqueActu
1 source
« Je suis sous le choc » : l’IA Claude a résolu un casse-tête mathématique sur lequel butait cette légende de l’informatique
499Numerama 

« Je suis sous le choc » : l’IA Claude a résolu un casse-tête mathématique sur lequel butait cette légende de l’informatique

L'IA Claude d'Anthropic, développée par Microsoft, a résolu un problème mathématique complexe qui a perdu l'informaticien Donald Knuth, lauréat du prix Turing. Cette avancée montre que les IA peuvent être des outils précieux pour les scientifiques, si on sait les interroger correctement.

UEL'IA Claude d'Anthropic, développée par Microsoft, démontre son potentiel pour résoudre des problèmes complexes, impactant potentiellement les recherches scientifiques en France et en Europe, en appuyant l'application de l'AI Act et en offrant des opportunités dans divers secteurs tout en respectant les normes du RGPD.

RechercheOutil
1 source
Comment savoir si un modèle d’IA a été compromis ?
500Blog du Modérateur 

Comment savoir si un modèle d’IA a été compromis ?

Microsoft a développé un outil de scan pour détecter les attaques par empoisonnement de modèles d'IA, identifiant trois signaux d'alerte cruciaux pour les entreprises afin de prévenir les backdoors cachées dans les systèmes d'IA.

UEMicrosoft a créé un outil de scan pour détecter les attaques par empoisonnement de modèles d'IA, offrant une protection potentielle aux entreprises françaises et européennes, notamment celles du secteur technologique, en conformité avec la réglementation AI Act, contre les backdoors cachées dans leurs systèmes d'intelligence artificielle, renforçant ainsi leur sécurité informatique.

RechercheOutil
1 source