Aller au contenu principal

Dossier Souveraineté IA — page 4

286 articles · page 4 sur 6

La bataille pour la souveraineté IA : Mistral, OVHcloud Dragon LLM, infrastructure souveraine européenne et alternatives au cloud américain.

Les 21 meilleurs outils IA sans code ou low-code en 2026
151MarkTechPost OutilsOutil

Les 21 meilleurs outils IA sans code ou low-code en 2026

En 2026, les plateformes sans code et low-code ont franchi un cap décisif : elles ne se contentent plus de glisser-déposer des composants, elles génèrent des applications complètes à partir d'une simple phrase. Un panorama de 21 outils représentatifs de cette nouvelle génération illustre l'ampleur du basculement. Parmi les plus notables, Lovable produit une application web full-stack, frontend React, backend, base de données, authentification, depuis une description en langage naturel, avec déploiement en un clic et synchronisation GitHub bidirectionnelle. Bolt.new, développé par StackBlitz, fonctionne sur le même principe mais en exposant le code source, ce qui permet aux développeurs d'intervenir directement. Replit combine un environnement de développement navigateur avec un agent autonome capable de scaffolding, de construction et de déploiement. Du côté des outils mobiles, Adalo génère des binaires conformes à l'App Store depuis un prompt, tandis que Glide transforme des feuilles de calcul en interfaces applicatives. Sur le terrain de l'automatisation, Zapier reste la référence avec ses milliers de connecteurs SaaS, désormais complétés par des agents IA pilotables en langage naturel, et n8n propose une alternative open-source auto-hébergeable pour les équipes soucieuses de la souveraineté de leurs données. Ce mouvement redessine profondément l'accès au développement logiciel. Des entrepreneurs sans équipe technique peuvent désormais mettre en production un produit monétisable, avec authentification utilisateur, paiement Stripe et hébergement intégré, en quelques minutes, comme le propose Atoms. Pour les grandes organisations, ces outils accélèrent la création d'outils internes, de portails clients et d'automatisations métier sans mobiliser des développeurs seniors. L'enjeu n'est plus seulement la vitesse : c'est la démocratisation de la capacité à construire, tester et itérer sur des produits numériques à une échelle inédite. Les équipes produit et design, en particulier, gagnent une autonomie réelle grâce à des outils comme v0 de Vercel, spécialisé dans la génération de frontends Next.js. Cette convergence entre no-code et IA générative s'est accélérée depuis l'émergence des grands modèles de langage en 2023, qui ont permis d'interpréter des intentions exprimées en prose et de les traduire en architectures logicielles cohérentes. Le marché se segmente désormais clairement entre les constructeurs d'interfaces visuelles (Bubble, Softr, Adalo), les générateurs de code full-stack (Lovable, Bolt.new, Replit), et les orchestrateurs d'agents et d'automatisations (Zapier, Make, n8n). La prochaine frontière sera probablement la maintenance autonome : des agents capables non seulement de construire une application, mais de la faire évoluer en réponse aux comportements utilisateurs, sans intervention humaine.

UELes équipes européennes soucieuses de souveraineté des données peuvent s'appuyer sur n8n, alternative open-source auto-hébergeable, pour répondre aux contraintes RGPD sans dépendre de plateformes américaines.

1 source
Memory OS : une architecture mémoire open source à 6 couches pour agents Hermes
152MarkTechPost 

Memory OS : une architecture mémoire open source à 6 couches pour agents Hermes

Un développeur de la communauté open-source, ClaudioDrews, vient de publier Memory OS, une bibliothèque sous licence MIT qui superpose six couches de mémoire à Hermes Agent, l'agent conversationnel de Nous Research. Là où Hermes propose déjà des fichiers de workspace et une base de données de sessions avec recherche plein texte, Memory OS y ajoute une base vectorielle Qdrant, des faits structurés avec scoring de confiance, un wiki de concepts auto-curé, et un système de rappel chirurgical à chaque appel LLM. L'ensemble tourne en local via Docker, Qdrant, Redis et Python 3.11+, et fonctionne avec n'importe quel fournisseur LLM supporté par Hermes : OpenRouter, OpenAI, Anthropic ou Ollama. Les six couches vont du simple fichier MEMORY.md injecté dans le prompt système (couche 1) jusqu'à un wiki LLM continuellement réingéré dans Qdrant (couche 6), en passant par une base SQLite avec FTS5, des vecteurs Cosine en 4096 dimensions combinés à une recherche BM25, et une version fortement remaniée du plugin Icarus gérant le rappel inter-sessions via 16 outils dédiés. L'intérêt concret de cette architecture réside dans son mécanisme de récupération : à chaque appel LLM, le système interroge simultanément quatre sources (Fabric, Qdrant, Sessions, Facts), filtre les résultats par seuil de pertinence, déduplique par session et ignore les messages triviaux. En sortie de session, il extrait et capitalise automatiquement les nouveaux apprentissages. Un scanner hebdomadaire fait vieillir les entrées obsolètes, et une déduplication sémantique fusionne les souvenirs quasi-identiques dès que la similarité cosinus dépasse 0,92. L'objectif affiché est l'efficacité en tokens : ne charger dans le contexte que ce qui est réellement utile, pas saturer la fenêtre. Pour les équipes soumises à des règles de résidence des données, le fait que rien ne quitte la machine locale représente un avantage réel que les services cloud comme mem0, Zep ou Letta ne peuvent pas offrir. Memory OS s'inscrit dans un débat plus large sur la mémoire des agents IA : jusqu'où peut-on aller avec une mémoire embarquée dans l'agent lui-même, sans passer par une infrastructure cloud payante ? Hermes Agent propose déjà huit fournisseurs de mémoire externes officiels, dont mem0 et Honcho, mais Memory OS n'en fait pas partie, c'est une surcouche communautaire indépendante, ce qui dit quelque chose sur l'appétit des développeurs pour des solutions souveraines. Le projet est récent et sa maturité reste à prouver à l'usage, mais son architecture en cascade de fallback (hybride, puis vectoriel dense, puis lexical, puis SQLite) montre une réflexion sérieuse sur la robustesse. Si l'adoption suit, ce type de stack mémoire locale pourrait devenir un modèle de référence pour les agents à usage intensif en entreprise.

UEL'architecture 100 % locale de Memory OS répond directement aux exigences de résidence des données imposées par le RGPD, offrant aux entreprises européennes une alternative souveraine aux services mémoire cloud pour leurs agents IA.

OutilsOutil
1 source
« Des dizaines de milliards de robots d’ici 10 à 20 ans » : la prédiction folle de Nvidia
153Frandroid 

« Des dizaines de milliards de robots d’ici 10 à 20 ans » : la prédiction folle de Nvidia

Un cadre dirigeant de Nvidia a affirmé que le nombre de robots sur Terre dépassera un jour celui des êtres humains, prédisant l'émergence de dizaines de milliards d'appareils dans un horizon de dix à vingt ans. Cette déclaration, rapportée par Frandroid, illustre l'ambition vertigineuse avec laquelle le géant américain des semi-conducteurs positionne désormais la robotique physique au coeur de sa stratégie de croissance. L'enjeu dépasse largement la provocation chiffrée : Nvidia cherche à s'imposer comme la colonne vertébrale computationnelle de la prochaine vague industrielle. L'entreprise a déjà lancé Project GR00T, un modèle fondateur pour robots humanoïdes, et sa plateforme Isaac pour la simulation et l'entraînement robotique. Si des dizaines de milliards de robots nécessitent des puces, des logiciels et des infrastructures d'entraînement, Nvidia se retrouve en position de fournisseur incontournable, reproduisant à l'échelle physique le rôle qu'elle joue aujourd'hui dans l'IA générative. Cette prédiction s'inscrit dans une course mondiale où Tesla, Figure AI, 1X Technologies et Boston Dynamics parient tous sur l'humanoides à grande échelle. Les gouvernements chinois et américain y voient un enjeu de souveraineté industrielle. La question n'est donc plus de savoir si les robots envahiront les usines, les entrepôts et les foyers, mais à quelle vitesse, et qui contrôlera la chaîne de valeur, des capteurs aux modèles d'IA embarqués, en passant par les puces qui les font tourner.

RobotiqueOpinion
1 source
Formation de modèles de langage en azerbaïdjanais sur Amazon SageMaker AI
154AWS ML Blog 

Formation de modèles de langage en azerbaïdjanais sur Amazon SageMaker AI

Azercell Telecom LLC, principal opérateur télécom d'Azerbaïdjan, a développé en six semaines un grand modèle de langage (LLM) en azerbaïdjanais sur la plateforme Amazon SageMaker AI, en partenariat avec le AWS Generative AI Innovation Center. L'objectif : doter l'entreprise d'un chatbot client et d'outils spécialisés pour les usages télécoms, en partant de zéro dans une langue pour laquelle aucun blueprint d'entraînement n'existait. Le cadre technique mis en place repose sur trois étapes séquentielles : la création d'un tokenizer sur mesure, un pré-entraînement continu à partir du modèle Llama 3.2 1B de Meta, puis un affinage supervisé via la méthode LoRA. Sur une instance ml.p5.48xlarge, les optimisations au niveau noyau permises par la bibliothèque Liger Kernels ont abouti à un débit d'entraînement supérieur de 23 % et une consommation mémoire GPU au pic réduite de 58 %. Le tokenizer azerbaïdjanais personnalisé, quant à lui, divise par deux le nombre de tokens nécessaires par mot, ce qui double concrètement la quantité de texte exploitable dans la fenêtre de contexte du modèle. Ces résultats illustrent un défi bien réel pour l'IA appliquée aux langues à faibles ressources : l'azerbaïdjanais est une langue agglutinante, dans laquelle un seul mot peut encoder des informations grammaticales qu'une phrase anglaise exprime par plusieurs mots distincts. Les tokenizers optimisés pour l'anglais fragmentent ces formes complexes de façon inefficace, dégradant les performances et augmentant les coûts de calcul. En construisant un tokenizer monolingue sur mesure, Azercell et AWS ont résolu ce problème structurel avant même de commencer l'entraînement proprement dit, ce qui améliore chacune des étapes suivantes. Pour les entreprises qui opèrent dans des marchés linguistiques non dominants, cette approche modulaire représente un modèle reproductible : chaque composant (tokenizer, pré-entraînement, affinage) peut être optimisé indépendamment et réutilisé sur des tâches différentes. Le projet s'inscrit dans un mouvement plus large de souveraineté linguistique numérique, alors que les LLM généralistes peinent à performer dans les dizaines de langues mal représentées dans leurs données d'entraînement. L'azerbaïdjanais partage des caractéristiques morphologiques avec le turc, le kazakh ou l'ouzbek, ce qui rend cette méthodologie potentiellement transférable à tout un ensemble de langues turcophones d'Asie centrale. Azercell prévoit de passer à des modèles de plus grande taille, pour lesquels l'entraînement distribué sur SageMaker deviendra indispensable, alors que le proof-of-concept actuel à 1 milliard de paramètres n'en avait pas encore besoin. La collaboration avec le AWS Generative AI Innovation Center suit un modèle désormais courant : un géant du cloud apporte l'ingénierie d'infrastructure, l'entreprise locale apporte la donnée et la connaissance métier, et le résultat est un actif IA propriétaire impossible à obtenir via un modèle généraliste.

UELa méthodologie de tokenizer sur mesure pour langues agglutinantes pourrait inspirer des initiatives similaires pour les langues régionales européennes sous-représentées (basque, hongrois, finnois), sans impact direct sur la France ou l'UE.

LLMsTuto
1 source
Construire un pipeline complet d'observabilité et d'évaluation Langfuse pour le traçage, la gestion des prompts, le scoring et les expériences
155MarkTechPost 

Construire un pipeline complet d'observabilité et d'évaluation Langfuse pour le traçage, la gestion des prompts, le scoring et les expériences

Langfuse, plateforme open-source d'ingénierie LLM, propose un pipeline complet couvrant quatre dimensions critiques du développement d'applications à base de grands modèles de langage : le tracing des appels, la gestion centralisée des prompts, le scoring d'évaluation et les expérimentations sur datasets. Le tutoriel publié cette semaine détaille une implémentation complète, compatible aussi bien avec l'API OpenAI (notamment le modèle gpt-4o-mini) qu'avec un LLM déterministe simulé, permettant à tout développeur d'explorer chaque fonctionnalité sans dépendre d'un accès payant. L'intégration commence par la connexion au client Langfuse via des clés d'authentification publique et secrète (formats pk-lf- et sk-lf-), avec support des régions EU, US et des instances auto-hébergées. Le pipeline instrumente ensuite des fonctions Python simples puis un mini-pipeline RAG (Retrieval-Augmented Generation), en attachant à chaque appel LLM des métadonnées de trace, un modèle, des paramètres de température et des identifiants de prompt. Pour les équipes qui développent des produits IA en production, cette approche résout un problème central : la boîte noire des LLMs. Avec Langfuse, chaque génération devient observable, chaque prompt est versionné et centralisé, et chaque réponse peut recevoir un score d'évaluation automatique ou humain. Cela permet de détecter les régressions de qualité entre versions de prompts, de comparer les performances de différents modèles sur un même dataset, et de construire une boucle d'amélioration continue documentée. Les équipes produit et ML gagnent une visibilité structurée sur ce qui se passe réellement à l'intérieur de leurs pipelines, ce qui est aujourd'hui l'un des manques les plus critiques dans le déploiement d'applications LLM à l'échelle. Langfuse s'inscrit dans un écosystème en pleine structuration autour de l'observabilité LLM, aux côtés de solutions comme LangSmith (LangChain), Weights & Biases Weave ou Helicone. Sa différenciation principale repose sur son caractère open-source et la possibilité de l'auto-héberger, ce qui répond directement aux contraintes de conformité et de souveraineté des données des entreprises européennes. La montée en maturité de ces outils reflète un tournant dans l'industrie : les LLMs ne sont plus des prototypes à évaluer manuellement, mais des composants de production qui exigent la même rigueur d'ingénierie que n'importe quel service critique. L'intégration native avec le SDK OpenAI via un simple remplacement d'import facilite une adoption progressive, sans refonte d'architecture, ce qui devrait accélérer son adoption dans des stacks existantes.

UELangfuse étant open-source et auto-hébergeable, les entreprises européennes peuvent l'adopter en respectant leurs contraintes RGPD et de souveraineté des données, sans dépendre d'infrastructures américaines.

OutilsOutil
1 source
Jensen Huang (NVIDIA) chez Dell Technologies World : la demande explose de façon exponentielle
156NVIDIA AI Blog 

Jensen Huang (NVIDIA) chez Dell Technologies World : la demande explose de façon exponentielle

Lors du Dell Technologies World, Jensen Huang, PDG de NVIDIA, a rejoint sur scène Michael Dell pour présenter une nouvelle génération d'infrastructures dédiées à l'IA agentique. Les deux dirigeants ont annoncé plusieurs serveurs inédits, dont le Dell PowerEdge XE9812, construit autour de la puce NVIDIA Vera Rubin NVL72, qui affiche un coût par token jusqu'à dix fois inférieur à celui de l'architecture Blackwell pour les déploiements d'inférence à grande échelle. À ses côtés, les serveurs PowerEdge XE9880L, XE9885L et XE9882L s'appuient sur les modules NVIDIA HGX Rubin NVL8, premiers systèmes Dell à adopter cette architecture, supportant jusqu'à 144 GPU par rack, avec des noeuds de calcul entièrement refroidis par liquide et des performances jusqu'à 5,5 fois supérieures au HGX B200. Du côté des processeurs, les PowerEdge M9822 et R9822 intègrent le CPU NVIDIA Vera, doté d'une bande passante mémoire de 1,2 To/s, capable d'exécuter des charges agentiques 50 % plus rapidement que les processeurs x86. Dell a également dévoilé le PowerRack, un système entièrement intégré, ainsi qu'une mise à jour de son AI Data Platform incluant le moteur Starburst, qui offre un débit SQL jusqu'à trois fois supérieur sur CPU Vera. Cinq mille entreprises, dont Lilly, Samsung et Honeywell, exploitent déjà des charges de travail IA sur des Dell AI Factories avec NVIDIA. Ces annonces s'inscrivent dans un contexte de demande explosive. Michael Dell a rappelé que les dépenses mondiales en infrastructure IA pourraient atteindre entre 3 000 et 4 000 milliards de dollars d'ici 2030, avec une consommation de tokens projetée en hausse de 3 400 % sur la même période. Jensen Huang a résumé la situation sans détour : "Nous sommes entrés dans l'ère de l'IA utile, c'est pourquoi la demande est parabolique, absolument parabolique." Pour les entreprises, l'enjeu est direct : réduire le coût de l'inférence pour rendre les agents autonomes économiquement viables en production, et non plus seulement dans des environnements pilotes. La vitesse sur les bases de données est particulièrement stratégique, car les agents IA interrogent en continu ces systèmes pour accomplir leurs tâches, rendant la performance CPU aussi critique que celle des GPU. Cette conférence marque une accélération nette dans la course aux infrastructures IA d'entreprise. NVIDIA et Dell s'inscrivent dans une compétition directe avec les géants du cloud -- Amazon, Google, Microsoft -- qui proposent leurs propres puces et services managés. L'argument central de Dell est de permettre aux entreprises de faire tourner leurs modèles frontières et leurs agents autonomes dans leur propre périmètre sécurisé, sans dépendre d'un fournisseur cloud. La génération Rubin succède à Blackwell, lancée en 2024, et la cadence s'accélère : NVIDIA a maintenu un rythme d'une nouvelle architecture tous les un à deux ans. Pour des groupes comme Honeywell ou Lilly, dont les données sont sensibles et les contraintes réglementaires fortes, la promesse d'une IA souveraine et haute performance constitue un argument de poids face aux offres cloud publiques.

UELes entreprises européennes soumises aux contraintes RGPD pourraient tirer parti de l'offre d'IA souveraine on-premise Dell/NVIDIA pour réduire leur dépendance aux clouds publics américains.

InfrastructureActu
1 source
Les événements à ne pas rater pour comprendre la montée en puissance de l’IA en 2026
157FrenchWeb 

Les événements à ne pas rater pour comprendre la montée en puissance de l’IA en 2026

L'année 2026 s'impose comme un tournant décisif pour l'intelligence artificielle. Après plusieurs années d'expérimentation intense portée par l'essor des modèles génératifs, le secteur entre dans une phase de maturité industrielle. Les grandes conférences et salons professionnels de l'année reflètent ce changement de cap : les thématiques dominantes ne sont plus la découverte ou la démonstration, mais l'intégration opérationnelle, le déploiement à grande échelle et la gouvernance des systèmes IA en conditions réelles. Les enjeux qui structurent l'agenda 2026 sont multiples et convergents. Les infrastructures de calcul (compute) et la consommation énergétique des centres de données sont au coeur des débats, à mesure que les modèles deviennent plus complexes et plus gourmands. Les agents IA autonomes, capables d'exécuter des tâches longues et enchaînées, concentrent l'attention des entreprises qui cherchent à automatiser des processus métier entiers. La robotique physique et la souveraineté numérique s'invitent également dans les discussions, portées par des tensions géopolitiques persistantes autour du contrôle des semi-conducteurs et des données. Ce basculement vers une logique industrielle reflète une transformation plus profonde : les entreprises ne se demandent plus si elles doivent adopter l'IA, mais comment le faire sans perdre le contrôle. Les événements professionnels de 2026 servent ainsi de baromètre pour mesurer où en sont réellement les acteurs du secteur, entre les annonces des géants technologiques américains et les ambitions croissantes des acteurs européens et asiatiques.

UEL'article met explicitement en avant les ambitions croissantes des acteurs européens face aux géants américains, notamment sur les enjeux de souveraineté numérique et de gouvernance de l'IA, thématiques centrales du cadre réglementaire européen en cours de déploiement.

💬 La phase POC est officiellement terminée pour beaucoup. Ce qui m'intéresse maintenant, c'est qui va réussir l'industrialisation sans se planter sur la gouvernance, parce que c'est là que ça va coincer. Les Européens ont une carte à jouer sur la souveraineté, si tant est qu'ils arrêtent d'en parler et commencent à livrer.

BusinessOpinion
1 source
Des données cloisonnées aux analyses unifiées : accès Athena multi-comptes dans Amazon QuickSight
158AWS ML Blog 

Des données cloisonnées aux analyses unifiées : accès Athena multi-comptes dans Amazon QuickSight

Amazon vient d'annoncer une nouvelle fonctionnalité pour Amazon QuickSight, sa plateforme de business intelligence alimentée par l'IA : l'accès Athena inter-comptes (cross-account). Concrètement, les entreprises qui centralisent leur déploiement de QuickSight dans un seul compte AWS peuvent désormais interroger des données stockées dans d'autres comptes AWS via Amazon Athena, le service de requêtes SQL serverless d'Amazon qui analyse directement les données hébergées dans Amazon S3. Jusqu'à présent, ce scénario poussait les équipes à maintenir plusieurs abonnements QuickSight distincts, ou à faire absorber tous les coûts de requêtes par le compte central. Avec cette mise à jour, les frais de traitement sont facturés au compte où réside la donnée, et non au compte central. L'impact est direct pour les grandes organisations financières, industrielles ou multidivisionnelles qui fonctionnent avec une architecture AWS multi-comptes. Une banque, par exemple, peut avoir ses données de banque de détail dans un compte A, ses activités d'investissement dans un compte B et sa gestion des risques dans un compte C, tout en pilotant QuickSight depuis un compte central unique. Cette nouvelle fonctionnalité supprime le besoin de dupliquer les abonnements ou de centraliser les coûts de façon artificielle. Elle simplifie aussi la gouvernance : chaque unité métier conserve la maîtrise de ses données et de sa facturation cloud, pendant que les équipes analytiques accèdent à l'ensemble depuis un tableau de bord unifié. Le mécanisme technique repose sur un enchaînement de rôles IAM en deux étapes, appelé role chaining. QuickSight commence par endosser un rôle dit RunAsRole (Rôle A) dans le compte central, qui ne détient aucun accès aux données mais dispose uniquement de la permission de basculer vers un second rôle. Ce second rôle (Rôle B), situé dans le compte consommateur, détient lui les droits d'accès à Athena, au catalogue AWS Glue et aux fichiers S3. Pour éviter les attaques de type "confused deputy", un identifiant externe (ExternalId) lié à l'ARN de la source de données est intégré dans les politiques de confiance. Cette approche s'inscrit dans une tendance plus large d'AWS à décloisonner les silos de données tout en maintenant des contrôles d'accès granulaires, à mesure que les entreprises basculent vers des architectures data mesh distribuées où la donnée reste souveraine au niveau de chaque domaine métier.

UELes grandes organisations européennes fonctionnant avec une architecture cloud multi-comptes peuvent désormais centraliser leurs analyses BI sans dupliquer les abonnements ni concentrer artificiellement les coûts, simplifiant la gouvernance des données distribuées.

OutilsOutil
1 source
OPINION. « De Paris à Nairobi, nous refusons une révolution de l’IA sous dépendance »
159La Tribune 

OPINION. « De Paris à Nairobi, nous refusons une révolution de l’IA sous dépendance »

Un an après le Sommet de Paris pour l'action sur l'intelligence artificielle, la France et le Kenya ont cosigné une tribune commune en marge du Sommet "Africa Forward". Les deux pays, réunis autour d'une conviction partagée, affirment que l'intelligence artificielle souveraine est atteignable, mais qu'aucune nation ne peut la construire seule. Ils identifient des secteurs prioritaires pour cette coopération : la santé, l'agriculture, l'éducation et les services publics, domaines dans lesquels l'IA pourrait transformer en profondeur les conditions de vie de millions de personnes. L'enjeu dépasse le cadre bilatéral. En refusant explicitement une "révolution de l'IA sous dépendance", Paris et Nairobi pointent le risque que les pays du Sud global deviennent captifs de systèmes conçus par quelques grandes puissances technologiques, principalement américaines et chinoises. Pour le continent africain, cette dépendance pourrait se traduire par une perte de contrôle sur les données nationales, les infrastructures numériques et, à terme, les orientations des politiques publiques elles-mêmes. Cette prise de position intervient dans un contexte de tensions croissantes autour de la gouvernance mondiale de l'IA. Depuis le Sommet de Bletchley Park en 2023, les grandes économies peinent à s'accorder sur un cadre réglementaire commun, et les forums multilatéraux successifs n'ont pas encore produit d'engagements contraignants. Le rapprochement franco-kényan illustre une stratégie alternative : construire des coalitions régionales capables de mutualiser expertises, infrastructures et données pour peser face aux géants du secteur. Des obstacles concrets restent à franchir, mais l'ambition commune est désormais posée par écrit.

UELa France cosigne officiellement avec le Kenya une tribune pour une IA souveraine, signalant une orientation diplomatique française visant à contrebalancer la dépendance aux géants technologiques américains et chinois.

RégulationReglementation
1 source
CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils
160MarkTechPost 

CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils

CopilotKit a annoncé son Enterprise Intelligence Platform, une nouvelle couche d'infrastructure managée qui dote les applications agentiques d'une mémoire persistante entre les sessions, les utilisateurs et les appareils. Jusqu'ici, chaque nouvelle session forçait l'agent à repartir de zéro : aucun souvenir des échanges précédents, des workflows en cours ou des décisions déjà prises. Pour contourner ce problème, les équipes de développement devaient construire manuellement leur propre couche de stockage, en choisissant une base de données, en sérialisant l'état applicatif et en gérant les identifiants de session avant même d'écrire la moindre ligne de logique produit. La plateforme résout ce problème en fournissant une infrastructure clé en main, compatible avec n'importe quel framework agentique. Elle peut être auto-hébergée sur Kubernetes, avec une option cloud managée en développement, et répond aux exigences de sécurité enterprise : conformité SOC 2 Type II, intégration SSO, contrôle d'accès par rôles, déploiements hors ligne air-gapped et souveraineté totale des données via une base de données personnalisée. L'élément central de l'architecture est le concept de "Thread" : un objet de session persistant et structuré qui survit aux déconnexions, aux changements d'appareils et aux relances d'agent. Contrairement à un simple historique de messages texte stocké en base, un Thread capture six dimensions de l'interaction : les composants d'interface générés dynamiquement par l'agent, les étapes humaines dans la boucle (approbations, corrections, décisions guidées), l'état partagé entre le backend agentique et le frontend, les entrées et sorties vocales, les fichiers uploadés ou générés, et l'ensemble des interactions multimodales au sein d'un objet unique. Concrètement, un workflow complexe démarré par un collaborateur peut être repris exactement là où il s'était arrêté par un autre membre de l'équipe sur un appareil différent, sans perte d'état ni de contexte. CopilotKit est déjà connu pour son SDK open-source dédié au frontend des agents IA, ainsi que pour l'AG-UI Protocol, un standard ouvert qui connecte les agents aux interfaces utilisateur. Cette plateforme Enterprise ne remplace pas le SDK existant : elle l'enrichit avec la couche d'infrastructure qui lui manquait. L'enjeu est considérable pour l'industrie, car la persistance de l'état est l'un des principaux freins au déploiement en production d'applications agentiques dans les entreprises. Les cas d'usage visés, comme la rédaction collaborative de documents juridiques ou la gestion de pipelines de données en plusieurs étapes, illustrent un marché qui commence à dépasser les chatbots pour entrer dans la logique de workflows longs et critiques. La disponibilité d'une infrastructure standardisée pourrait significativement accélérer cette transition.

UELa plateforme propose des options de souveraineté des données (base de données personnalisée, déploiement air-gapped sur Kubernetes) susceptibles de faciliter la conformité RGPD pour les équipes de développement européennes qui adoptent des architectures agentiques.

OutilsOutil
1 source
HP et l'art de l'IA et des données pour les entreprises
161AI News 

HP et l'art de l'IA et des données pour les entreprises

À quelques jours du salon AI & Big Data Expo, prévu les 18 et 19 mai au McEnery Convention Center de San Jose, Jérôme Gabryszewski, responsable du développement commercial IA et Data Science chez HP, a accordé une interview à Artificial Intelligence News pour évoquer les défis concrets que rencontrent les grandes entreprises dans leur adoption de l'intelligence artificielle. Le constat est sans appel : malgré un accès abondant à leurs propres données, la plupart des organisations peinent à en tirer parti. La première embûche n'est pas technique : c'est la dette organisationnelle et architecturale. Avant d'automatiser quoi que ce soit, les entreprises doivent réconcilier des données éparpillées entre départements, des schémas incohérents et des systèmes legacy jamais conçus pour l'interopérabilité. Le travail de gouvernance précède toujours le déploiement technique. Sur la question des modèles en apprentissage continu, Gabryszewski recommande d'appliquer les mêmes exigences qu'un déploiement logiciel classique : aucune mise à jour en production sans validation formelle. La dérive conceptuelle est surveillée via des pipelines MLOps avec détection automatique, et la contamination des données d'entraînement est traitée comme un problème de traçabilité autant que de sécurité. Les entreprises qui maîtrisent ces risques ne sont pas forcément les plus avancées techniquement, mais celles qui ont intégré la gouvernance IA dans leur cadre de gestion des risques avant de passer à l'échelle. Ce positionnement a des implications concrètes pour des milliers d'équipes data qui cherchent à réduire leur dépendance au cloud sans sacrifier la puissance de calcul. La question du local versus cloud est au cœur des arbitrages actuels : chaque inférence envoyée dans le cloud représente un coût, une latence et une exposition potentielle de données sensibles. Disposer d'une infrastructure locale capable de faire tourner des modèles de grande taille change fondamentalement l'équation économique et réglementaire, notamment pour les secteurs soumis à des contraintes strictes comme la finance, la santé ou la défense. HP s'appuie sur quinze ans de développement de sa gamme professionnelle Z pour positionner son matériel comme épine dorsale de ce cycle IA autonome. Le ZBook Ultra et le Z2 Mini couvrent les usages mobiles et compacts, mais c'est le ZGX Nano qui attire l'attention : un supercalculateur IA de 15x15 cm, équipé du superpuce NVIDIA GB10 Grace Blackwell, 128 Go de mémoire unifiée et 1 000 TOPS de performance FP4, capable de faire tourner localement des modèles jusqu'à 200 milliards de paramètres. En interconnectant deux unités, on atteint 405 milliards de paramètres, sans cloud, sans datacenter, sans file d'attente. L'appareil est livré préconfiguré avec la pile logicielle NVIDIA DGX et le HP ZGX Toolkit, permettant aux équipes d'être opérationnelles en quelques minutes. HP vise ainsi le segment des équipes IA qui ont besoin de puissance souveraine et immédiate, à l'heure où la course aux modèles toujours plus grands redistribue les cartes du marché des workstations professionnelles.

InfrastructureActu
1 source
Comment créer une base de connaissances IA entièrement interrogeable avec OpenKB, OpenRouter et Llama
162MarkTechPost 

Comment créer une base de connaissances IA entièrement interrogeable avec OpenKB, OpenRouter et Llama

Un tutoriel publié récemment détaille comment construire une base de connaissances locale entièrement interrogeable en combinant trois outils : OpenKB, la plateforme OpenRouter et le modèle Llama 3.3 70B de Meta, accessible gratuitement sans carte bancaire. Le guide couvre l'ensemble du pipeline, de l'installation d'OpenKB via pip jusqu'à l'interrogation structurée de documents Markdown, en passant par la génération automatique de résumés et de pages conceptuelles au format wiki. La clé API OpenRouter est récupérée de façon sécurisée via la bibliothèque Python getpass, sans jamais être inscrite en dur dans le code. Le résultat est un système de connaissance navigable, avec gestion des liens croisés entre pages, capable de répondre à des requêtes en langage naturel et d'être mis à jour de manière incrémentale. Ce type d'architecture présente un intérêt concret pour les développeurs, chercheurs et équipes qui souhaitent organiser et interroger des corpus de documents internes sans envoyer leurs données vers des services cloud payants. En s'appuyant sur un modèle de 70 milliards de paramètres disponible gratuitement via OpenRouter, l'approche élimine le coût d'inférence tout en offrant des capacités de synthèse comparables à des solutions propriétaires. La possibilité d'analyser programmatiquement les relations entre pages et les liens croisés ouvre également des usages avancés : cartographie de concepts, détection de lacunes documentaires, ou navigation thématique automatisée dans de larges volumes de texte. L'émergence de ce genre de tutoriel s'inscrit dans une tendance plus large de démocratisation des outils RAG (retrieval-augmented generation), qui permettent d'ancrer les réponses d'un LLM dans une base documentaire locale plutôt que dans ses seuls paramètres d'entraînement. OpenRouter joue ici un rôle d'intermédiaire unifié, donnant accès à des dizaines de modèles open source via une API commune, ce qui réduit la friction technique pour expérimenter. OpenKB, de son côté, se positionne comme une couche d'abstraction au-dessus de ces modèles, spécialisée dans la structuration wiki et la navigation sémantique. Alors que des acteurs comme Notion AI ou Confluence intègrent des fonctions similaires dans des produits fermés, des solutions comme celle-ci permettent de garder le contrôle total sur les données et l'infrastructure, un enjeu croissant pour les entreprises soumises à des contraintes de confidentialité ou de souveraineté.

UECette architecture locale répond directement aux enjeux de souveraineté des données pour les entreprises et administrations européennes soumises au RGPD et aux contraintes de confidentialité.

OutilsTuto
1 source
Neil Zeghidour (Gradium) : « Je gère les talents en IA comme des footballeurs »
163La Tribune 

Neil Zeghidour (Gradium) : « Je gère les talents en IA comme des footballeurs »

Neil Zeghidour, directeur général de Gradium, a pris la parole lors de la conférence Tech For Future pour exposer la vision de sa société, récemment implantée dans l'écosystème parisien de l'intelligence artificielle. Sa mission : constituer une équipe de recherche d'élite pour développer des modèles vocaux capables de rivaliser avec les grandes plateformes américaines. Pour attirer ces profils rares, il revendique une approche singulière, comparant la gestion de ses chercheurs en IA à celle de footballeurs professionnels, des talents à recruter, fidéliser et placer dans les meilleures conditions pour performer. L'enjeu derrière cette métaphore est concret : le marché des chercheurs spécialisés en IA est d'une compétition féroce, avec une poignée d'experts mondiaux se disputés par des géants comme Google, OpenAI ou Meta, capables d'offrir des compensations considérables. Gradium parie sur la voix comme vecteur de différenciation, un segment en croissance exponentielle porté par les assistants conversationnels, l'accessibilité et les interfaces multimodales. Construire des modèles vocaux performants en Europe représente un défi technique autant qu'économique, mais aussi une opportunité stratégique face à la dépendance actuelle aux infrastructures et modèles américains. La démarche de Gradium s'inscrit dans une dynamique plus large : celle de la souveraineté numérique européenne en matière d'IA. Zeghidour insiste sur la nécessité d'entraîner des modèles localement, sur des données et des infrastructures européennes, pour ne pas rester tributaires des choix des acteurs américains. Dans un contexte où la régulation européenne (AI Act) pousse les entreprises à davantage de transparence et de contrôle, des acteurs comme Gradium tentent de transformer cette contrainte en avantage compétitif.

UEGradium, startup française basée à Paris, développe des modèles vocaux sur infrastructures européennes pour réduire la dépendance aux plateformes américaines, s'appuyant sur l'AI Act comme levier de différenciation compétitive.

BusinessOpinion
1 source
164Le Big Data 

MyUnisoft : la protection des données au cœur du choix des logiciels comptables

Une enquête réalisée par OpinionWay pour le compte de MyUnisoft, éditeur français de logiciel comptable, révèle que 70 % des professionnels de l'expertise comptable utilisent désormais l'intelligence artificielle dans leur travail quotidien. Parmi eux, 70 % se tournent prioritairement vers ChatGPT, l'outil d'OpenAI, principalement pour la recherche d'informations expertes et le traitement de dossiers complexes. L'étude montre également que 83 % des décideurs du secteur placent la protection et la localisation des données au sommet de leurs critères de sélection d'un logiciel, devant le prix ou les fonctionnalités pures. L'ergonomie reste le critère numéro un pour 89 % des cabinets interrogés, tandis que 31 % des professionnels n'ont pas encore adopté l'IA, souvent par prudence ou par manque d'accompagnement. Grégoire Leclercq, dirigeant de MyUnisoft, souligne que cette transformation marque une prise de conscience collective des experts-comptables sur leur rôle de gardiens des données financières de leurs clients. Ces résultats traduisent un changement structurel dans la façon dont les cabinets d'expertise comptable évaluent leurs outils technologiques. La souveraineté des données n'est plus un argument marketing secondaire : c'est une barrière à l'entrée réelle. Les professionnels refusent désormais de dépendre de solutions dont l'hébergement serait soumis à des législations extra-européennes ou dont les flux de données resteraient opaques. Pour les éditeurs, cela signifie qu'un stockage local, certifié et transparent devient une condition non négociable pour rester dans la course. Parallèlement, l'usage massif de ChatGPT comme super-assistant documentaire confirme que l'IA ne remplace pas le comptable, mais comprime drastiquement le temps passé sur des tâches à faible valeur ajoutée, libérant de la bande passante pour le conseil. Le secteur de la comptabilité française entre dans une phase où l'automatisation des tâches basiques est considérée comme acquise, et où la compétition se déplace vers la capacité à transformer la donnée en aide à la décision stratégique. Les cabinets attendent de leurs éditeurs qu'ils franchissent un cap : passer du statut de fournisseur de logiciel fiable à celui de partenaire de performance. L'interopérabilité entre systèmes et la capacité à intégrer nativement des fonctionnalités d'IA, sans sacrifier l'ergonomie, deviennent les nouveaux axes de différenciation. MyUnisoft, qui se positionne explicitement sur la souveraineté numérique et l'hébergement français, publie cette étude dans un contexte de consolidation du marché des logiciels comptables, où les acteurs qui ne répondront pas à ces exigences risquent de perdre rapidement leur légitimité auprès d'une clientèle professionnelle de plus en plus avertie.

UELes cabinets d'expertise comptable français placent la souveraineté des données et l'hébergement local en tête de leurs critères de sélection logicielle, renforçant l'avantage concurrentiel des éditeurs français conformes au RGPD face aux solutions hébergées hors UE.

SociétéOutil
1 source
Microsoft investit 10 milliards de dollars dans l'IA et la cybersécurité au Japon
165AI Business 

Microsoft investit 10 milliards de dollars dans l'IA et la cybersécurité au Japon

Microsoft a annoncé un investissement de 10 milliards de dollars au Japon, destiné au développement de l'intelligence artificielle et de la cybersécurité dans le pays. Cette enveloppe, l'une des plus importantes jamais engagées par le géant américain dans une seule région, sera déployée sur plusieurs années pour renforcer les infrastructures cloud, les centres de données et les capacités de défense numérique sur le territoire japonais. Cet investissement massif répond à une demande croissante des entreprises et administrations japonaises en matière de solutions IA souveraines et sécurisées. Pour le Japon, qui cherche activement à rattraper son retard numérique face à ses voisins asiatiques, l'arrivée de cette infrastructure représente un levier concret de modernisation industrielle et de renforcement de sa résilience face aux cybermenaces, en nette augmentation dans la région. Cet engagement s'inscrit dans une vague plus large d'investissements technologiques de Microsoft en Asie : l'entreprise a récemment annoncé des engagements similaires en Thaïlande et à Singapour. Cette stratégie régionale reflète la compétition acharnée entre les grands acteurs du cloud — Amazon, Google et Microsoft — pour s'imposer comme partenaires de confiance des gouvernements et grandes entreprises asiatiques à l'heure de l'accélération de l'IA.

InfrastructureActu
1 source
DeepL : 83 % des grandes entreprises accusent du retard sur l'IA linguistique
166AI News 

DeepL : 83 % des grandes entreprises accusent du retard sur l'IA linguistique

Selon un rapport publié le 10 mars 2026 par DeepL, intitulé « Borderless Business : Transforming Translation in the Age of AI », 83 % des grandes entreprises n'ont pas encore adopté les outils modernes d'intelligence artificielle pour leurs opérations multilingues. L'étude, menée auprès de dirigeants d'entreprise aux États-Unis, au Royaume-Uni, en France, en Allemagne et au Japon, révèle que 35 % des entreprises internationales traitent encore leurs traductions entièrement manuellement, et 33 % supplémentaires s'appuient sur une automatisation classique avec révision humaine systématique. Seulement 17 % ont déployé des outils de nouvelle génération — grands modèles de langage ou IA agentique — pour leurs flux de travail linguistiques. Parallèlement, le volume de contenu d'entreprise a bondi de 50 % depuis 2023, mais 68 % des sociétés fonctionnent toujours avec des processus conçus pour une autre époque. DeepL compte aujourd'hui plus de 200 000 clients professionnels dans 228 marchés, dont 2 000 qui déploient déjà des agents IA pour l'analyse de rapports, le ciblage commercial et la revue de documents juridiques. Ce retard n'est pas anodin : la traduction et les opérations multilingues touchent des fonctions critiques de l'entreprise. D'après le rapport, l'expansion internationale constitue le premier moteur d'investissement dans l'IA linguistique (33 % des cas), devant les ventes et le marketing (26 %), le support client (23 %) et le juridico-financier (22 %). Une étude complémentaire de décembre 2025, conduite auprès de 5 000 cadres dirigeants, révèle que 54 % des dirigeants mondiaux estiment que la traduction vocale en temps réel sera indispensable en 2026, contre 32 % aujourd'hui — avec des écarts notables entre pays : 48 % au Royaume-Uni, 33 % en France, seulement 11 % au Japon. Pour Jarek Kutylowski, PDG et fondateur de DeepL : « L'IA est partout, mais l'efficacité ne l'est pas. La plupart des entreprises ont déployé l'IA sous une forme ou une autre, mais peu atteignent une vraie productivité à l'échelle, parce que les workflows centraux restent conçus autour des personnes, pas des systèmes. » DeepL se distingue de ses concurrents généralistes sur un point stratégique : la souveraineté des données. Dans les secteurs réglementés — finance, santé, droit, administration publique — la conformité est devenue un critère de sélection de premier ordre. L'entreprise est certifiée ISO 27001, SOC 2 Type 2 et RGPD, et propose un chiffrement « Bring Your Own Key » permettant aux clients de révoquer l'accès à leurs données en quelques secondes, y compris pour DeepL lui-même. Cette garantie lui ouvre des portes que les grands fournisseurs de LLM peinent à franchir. En 2026, la société accélère sur l'IA agentique avec DeepL Agent, et son CTO Sebastian Enderlein résume l'ambition : « 2026 sera l'année où l'IA arrête d'expérimenter et commence à exécuter, à une échelle que nous n'avons pas encore vue. »

UEL'étude couvre explicitement la France et l'Allemagne, et la conformité RGPD mise en avant par DeepL répond à une exigence réglementaire européenne directe pour les entreprises traitant des données multilingues sensibles.

OutilsOutil
1 source
OpenClaw : le guide ultime des meilleurs Skills pour booster votre agent IA
167Le Big Data 

OpenClaw : le guide ultime des meilleurs Skills pour booster votre agent IA

OpenClaw, l'agent IA local et open source lancé fin 2025, a rapidement dépassé Linux et React sur GitHub pour atteindre plus de 330 000 étoiles, s'imposant comme l'un des projets les plus suivis de la plateforme. Contrairement aux chatbots classiques, OpenClaw agit directement sur la machine de l'utilisateur de manière autonome. Pour étendre ses capacités, la communauté a développé une marketplace d'extensions appelée ClawHub, proposant des milliers de modules baptisés Skills. Parmi les plus plébiscités : le Skill Obsidian, qui synchronise l'agent avec une base de notes locale en Markdown ; le module RAG (Retrieval-Augmented Generation) pour interroger des documents PDF et archives internes sans envoyer de données vers des serveurs externes ; le Skill GOG pour connecter l'agent à Gmail, Google Calendar et Drive via OAuth ; et enfin le Skill GitHub, qui s'appuie sur le CLI officiel gh pour gérer le cycle de vie complet d'un dépôt de code. Ce qui distingue OpenClaw des assistants IA classiques, c'est précisément cette capacité à passer de la consultation à l'exécution concrète. Un utilisateur peut demander à l'agent de trier sa boîte mail, rédiger une note structurée dans Obsidian, ou créer une pull request sur GitHub — le tout sans ouvrir un seul onglet de navigateur. Le module RAG est particulièrement stratégique pour les entreprises : il permet d'interroger des gigaoctets de documentation interne sensible en restant entièrement en local, éliminant le risque de fuite de données vers des API tierces. Pour les développeurs, le Skill GitHub transforme l'agent en ingénieur DevOps autonome capable de gérer des workflows complexes sans supervision constante. OpenClaw s'inscrit dans une tendance de fond : la montée des agents IA locaux, souverains et extensibles, portée par la communauté open source. Son ascension fulgurante rappelle celle de projets comme Docker ou Kubernetes en leur temps — des outils qui ont redéfini les pratiques professionnelles en quelques mois. La marketplace ClawHub joue un rôle central dans cet écosystème, en reproduisant le modèle de distribution des extensions de VS Code ou des plugins npm, mais appliqué à l'automatisation par IA. Les prochains enjeux tournent autour de la sécurité des Skills tiers, de la standardisation des interfaces entre modules, et de l'émergence d'agents capables de chaîner plusieurs Skills de manière fiable sur des tâches longues — un défi technique que la communauté commence à peine à adresser.

UELe module RAG local d'OpenClaw répond aux exigences de souveraineté des données imposées par le RGPD, permettant aux entreprises européennes de traiter des documents internes sensibles sans transférer de données vers des serveurs tiers.

OutilsOutil
1 source
SAP s'associe à OpenAI pour lancer 'OpenAI pour l'Allemagne
168OpenAI Blog 

SAP s'associe à OpenAI pour lancer 'OpenAI pour l'Allemagne

SAP et OpenAI annoncent une collaboration pour lancer "OpenAI for Germany", un partenariat pour 2026 visant à apporter une intelligence artificielle souveraine et sécurisée au secteur public allemand, améliorant ainsi les services publics efficaces et sûrs.

UESAP et OpenAI collaborent pour introduire "OpenAI for Germany", un partenariat jusqu'en 2026, visant à déployer une intelligence artificielle sécurisée dans le secteur public allemand, bénéficiant indirectement les entreprises françaises et européennes par le biais d'une montée en compétence dans la gestion de l'IA conformément au RGPD et l'AI Act.

RechercheOutil
1 source
Présentation de Stargate UK
169OpenAI Blog 

Présentation de Stargate UK

OpenAI, NVIDIA et Nscale ont lancé Stargate UK, un partenariat souverain en intelligence artificielle fournissant jusqu'à 50 000 GPU et le superordinateur le plus puissant du Royaume-Uni. Ce projet vise à accélérer l'innovation en IA, améliorer les services publics et stimuler la croissance économique du pays.

BusinessActu
1 source