Aller au contenu principal

Dossier Souveraineté IA — page 3

283 articles · page 3 sur 6

La bataille pour la souveraineté IA : Mistral, OVHcloud Dragon LLM, infrastructure souveraine européenne et alternatives au cloud américain.

Les 21 meilleurs outils IA sans code ou low-code en 2026
101MarkTechPost OutilsOutil

Les 21 meilleurs outils IA sans code ou low-code en 2026

En 2026, les plateformes sans code et low-code ont franchi un cap décisif : elles ne se contentent plus de glisser-déposer des composants, elles génèrent des applications complètes à partir d'une simple phrase. Un panorama de 21 outils représentatifs de cette nouvelle génération illustre l'ampleur du basculement. Parmi les plus notables, Lovable produit une application web full-stack, frontend React, backend, base de données, authentification, depuis une description en langage naturel, avec déploiement en un clic et synchronisation GitHub bidirectionnelle. Bolt.new, développé par StackBlitz, fonctionne sur le même principe mais en exposant le code source, ce qui permet aux développeurs d'intervenir directement. Replit combine un environnement de développement navigateur avec un agent autonome capable de scaffolding, de construction et de déploiement. Du côté des outils mobiles, Adalo génère des binaires conformes à l'App Store depuis un prompt, tandis que Glide transforme des feuilles de calcul en interfaces applicatives. Sur le terrain de l'automatisation, Zapier reste la référence avec ses milliers de connecteurs SaaS, désormais complétés par des agents IA pilotables en langage naturel, et n8n propose une alternative open-source auto-hébergeable pour les équipes soucieuses de la souveraineté de leurs données. Ce mouvement redessine profondément l'accès au développement logiciel. Des entrepreneurs sans équipe technique peuvent désormais mettre en production un produit monétisable, avec authentification utilisateur, paiement Stripe et hébergement intégré, en quelques minutes, comme le propose Atoms. Pour les grandes organisations, ces outils accélèrent la création d'outils internes, de portails clients et d'automatisations métier sans mobiliser des développeurs seniors. L'enjeu n'est plus seulement la vitesse : c'est la démocratisation de la capacité à construire, tester et itérer sur des produits numériques à une échelle inédite. Les équipes produit et design, en particulier, gagnent une autonomie réelle grâce à des outils comme v0 de Vercel, spécialisé dans la génération de frontends Next.js. Cette convergence entre no-code et IA générative s'est accélérée depuis l'émergence des grands modèles de langage en 2023, qui ont permis d'interpréter des intentions exprimées en prose et de les traduire en architectures logicielles cohérentes. Le marché se segmente désormais clairement entre les constructeurs d'interfaces visuelles (Bubble, Softr, Adalo), les générateurs de code full-stack (Lovable, Bolt.new, Replit), et les orchestrateurs d'agents et d'automatisations (Zapier, Make, n8n). La prochaine frontière sera probablement la maintenance autonome : des agents capables non seulement de construire une application, mais de la faire évoluer en réponse aux comportements utilisateurs, sans intervention humaine.

UELes équipes européennes soucieuses de souveraineté des données peuvent s'appuyer sur n8n, alternative open-source auto-hébergeable, pour répondre aux contraintes RGPD sans dépendre de plateformes américaines.

1 source
L’IA de Meta censée tout changer sera en retard et c’est à cause de ChatGPT
102Le Big Data 

L’IA de Meta censée tout changer sera en retard et c’est à cause de ChatGPT

Le prochain grand modèle d'intelligence artificielle de Meta, connu en interne sous le nom de « Muse Spark », accuserait des retards répétés avant son déploiement dans les applications du groupe. C'est ce que révèle le Wall Street Journal, qui indique que le lancement a été repoussé à plusieurs reprises. Initialement conçu comme un système multimodal de pointe, Muse Spark devait être capable de traiter simultanément du texte, des images, du raisonnement complexe et des interactions avancées au sein des plateformes Meta. Le groupe prévoyait également de l'ouvrir aux développeurs externes afin qu'ils puissent construire leurs propres services à partir de ce socle technologique. Mark Zuckerberg lui-même en avait fait l'une des priorités stratégiques absolues de l'entreprise, justifiant des investissements de plusieurs dizaines de milliards de dollars dans les centres de données, les infrastructures et les puces spécialisées. Ces retards révèlent la difficulté croissante pour Meta de tenir le rythme face à une concurrence qui ne ralentit pas. En interne, des responsables estiment que Muse Spark demeure en retrait sur plusieurs critères essentiels, notamment la qualité du raisonnement et la stabilité des résultats. Ce n'est pas qu'une question de performances techniques : c'est surtout la capacité du modèle à rivaliser frontalement avec ChatGPT d'OpenAI, Gemini de Google et Claude d'Anthropic qui pose problème. Pour un groupe dont les applications touchent plus de trois milliards d'utilisateurs, lancer un modèle perçu comme inférieur aux alternatives disponibles pourrait nuire à la crédibilité de Meta dans la course à l'IA et freiner l'adoption auprès des développeurs. Ce retard s'inscrit dans une dynamique de marché particulièrement tendue. OpenAI poursuit l'expansion de l'écosystème ChatGPT, Google accélère l'intégration de Gemini dans Android et Workspace, et Anthropic gagne progressivement du terrain dans les entreprises. Meta, malgré des ressources financières considérables, paie le prix d'une compétition qui s'est durcie bien plus vite qu'anticipé. Le groupe avait misé sur une fenêtre d'opportunité pour s'imposer avec un modèle souverain, intégré nativement dans ses plateformes sociales et ouvert à l'écosystème tiers. Si Muse Spark continue à prendre du retard, Meta risque de se retrouver à lancer un modèle dans un paysage où les positions dominantes seront déjà consolidées, rendant la tâche encore plus ardue pour rattraper les leaders actuels.

UELes développeurs européens qui anticipaient l'ouverture de l'API Muse Spark pour construire leurs services devront patienter davantage, sans impact réglementaire ou économique direct pour la France/UE.

LLMsActu
1 source
Memory OS : une architecture mémoire open source à 6 couches pour agents Hermes
103MarkTechPost 

Memory OS : une architecture mémoire open source à 6 couches pour agents Hermes

Un développeur de la communauté open-source, ClaudioDrews, vient de publier Memory OS, une bibliothèque sous licence MIT qui superpose six couches de mémoire à Hermes Agent, l'agent conversationnel de Nous Research. Là où Hermes propose déjà des fichiers de workspace et une base de données de sessions avec recherche plein texte, Memory OS y ajoute une base vectorielle Qdrant, des faits structurés avec scoring de confiance, un wiki de concepts auto-curé, et un système de rappel chirurgical à chaque appel LLM. L'ensemble tourne en local via Docker, Qdrant, Redis et Python 3.11+, et fonctionne avec n'importe quel fournisseur LLM supporté par Hermes : OpenRouter, OpenAI, Anthropic ou Ollama. Les six couches vont du simple fichier MEMORY.md injecté dans le prompt système (couche 1) jusqu'à un wiki LLM continuellement réingéré dans Qdrant (couche 6), en passant par une base SQLite avec FTS5, des vecteurs Cosine en 4096 dimensions combinés à une recherche BM25, et une version fortement remaniée du plugin Icarus gérant le rappel inter-sessions via 16 outils dédiés. L'intérêt concret de cette architecture réside dans son mécanisme de récupération : à chaque appel LLM, le système interroge simultanément quatre sources (Fabric, Qdrant, Sessions, Facts), filtre les résultats par seuil de pertinence, déduplique par session et ignore les messages triviaux. En sortie de session, il extrait et capitalise automatiquement les nouveaux apprentissages. Un scanner hebdomadaire fait vieillir les entrées obsolètes, et une déduplication sémantique fusionne les souvenirs quasi-identiques dès que la similarité cosinus dépasse 0,92. L'objectif affiché est l'efficacité en tokens : ne charger dans le contexte que ce qui est réellement utile, pas saturer la fenêtre. Pour les équipes soumises à des règles de résidence des données, le fait que rien ne quitte la machine locale représente un avantage réel que les services cloud comme mem0, Zep ou Letta ne peuvent pas offrir. Memory OS s'inscrit dans un débat plus large sur la mémoire des agents IA : jusqu'où peut-on aller avec une mémoire embarquée dans l'agent lui-même, sans passer par une infrastructure cloud payante ? Hermes Agent propose déjà huit fournisseurs de mémoire externes officiels, dont mem0 et Honcho, mais Memory OS n'en fait pas partie, c'est une surcouche communautaire indépendante, ce qui dit quelque chose sur l'appétit des développeurs pour des solutions souveraines. Le projet est récent et sa maturité reste à prouver à l'usage, mais son architecture en cascade de fallback (hybride, puis vectoriel dense, puis lexical, puis SQLite) montre une réflexion sérieuse sur la robustesse. Si l'adoption suit, ce type de stack mémoire locale pourrait devenir un modèle de référence pour les agents à usage intensif en entreprise.

UEL'architecture 100 % locale de Memory OS répond directement aux exigences de résidence des données imposées par le RGPD, offrant aux entreprises européennes une alternative souveraine aux services mémoire cloud pour leurs agents IA.

OutilsOutil
1 source
Avec Anthropic, OpenAI et SpaceX, Wall Street s’apprête à vivre son plus grand cycle technologique depuis Internet
104FrenchWeb 

Avec Anthropic, OpenAI et SpaceX, Wall Street s’apprête à vivre son plus grand cycle technologique depuis Internet

Wall Street se prépare à entrer dans ce qui pourrait être le plus grand cycle d'introductions en Bourse depuis la bulle Internet des années 2000, porté par trois géants technologiques encore privés : Anthropic, OpenAI et SpaceX. Ces entreprises, valorisées chacune à des centaines de milliards de dollars, concentrent une attention inédite de la part des investisseurs institutionnels et des marchés publics, qui n'ont jusqu'ici pu y accéder qu'indirectement. Aucune date officielle n'a été annoncée, mais les signaux se multiplient indiquant que la fenêtre d'introduction se rapproche. L'enjeu est considérable pour les marchés financiers : une cotation d'OpenAI ou d'Anthropic représenterait une occasion rare pour les investisseurs particuliers et les fonds classiques d'entrer au capital des acteurs centraux de la révolution IA. Cela redistribuerait les flux de capitaux aujourd'hui concentrés chez quelques fonds de capital-risque et fonds souverains, tout en offrant une liquidité aux premiers actionnaires et employés de ces sociétés. Pendant plus d'une décennie, les entreprises technologiques les plus prometteuses ont délibérément évité la Bourse, préférant lever des dizaines de milliards en privé auprès de SoftBank, des fonds du Golfe ou de Microsoft, qui a investi plus de 13 milliards de dollars dans OpenAI. Cette stratégie a permis de croître sans la pression des marchés trimestriels, mais les valorisations atteignent désormais des niveaux qui rendent une sortie en Bourse quasi inévitable pour offrir de la liquidité aux investisseurs historiques et financer la prochaine phase d'expansion.

UELes fonds institutionnels et investisseurs particuliers européens pourraient pour la première fois accéder directement aux principaux acteurs de l'IA via les marchés publics, redistribuant des flux de capitaux aujourd'hui monopolisés par quelques fonds américains et fonds souverains du Golfe.

BusinessOpinion
1 source
« Des dizaines de milliards de robots d’ici 10 à 20 ans » : la prédiction folle de Nvidia
105Frandroid 

« Des dizaines de milliards de robots d’ici 10 à 20 ans » : la prédiction folle de Nvidia

Un cadre dirigeant de Nvidia a affirmé que le nombre de robots sur Terre dépassera un jour celui des êtres humains, prédisant l'émergence de dizaines de milliards d'appareils dans un horizon de dix à vingt ans. Cette déclaration, rapportée par Frandroid, illustre l'ambition vertigineuse avec laquelle le géant américain des semi-conducteurs positionne désormais la robotique physique au coeur de sa stratégie de croissance. L'enjeu dépasse largement la provocation chiffrée : Nvidia cherche à s'imposer comme la colonne vertébrale computationnelle de la prochaine vague industrielle. L'entreprise a déjà lancé Project GR00T, un modèle fondateur pour robots humanoïdes, et sa plateforme Isaac pour la simulation et l'entraînement robotique. Si des dizaines de milliards de robots nécessitent des puces, des logiciels et des infrastructures d'entraînement, Nvidia se retrouve en position de fournisseur incontournable, reproduisant à l'échelle physique le rôle qu'elle joue aujourd'hui dans l'IA générative. Cette prédiction s'inscrit dans une course mondiale où Tesla, Figure AI, 1X Technologies et Boston Dynamics parient tous sur l'humanoides à grande échelle. Les gouvernements chinois et américain y voient un enjeu de souveraineté industrielle. La question n'est donc plus de savoir si les robots envahiront les usines, les entrepôts et les foyers, mais à quelle vitesse, et qui contrôlera la chaîne de valeur, des capteurs aux modèles d'IA embarqués, en passant par les puces qui les font tourner.

RobotiqueOpinion
1 source
NVIDIA lance DGX Station, un superordinateur IA sous Windows pour les entreprises
106Le Big Data 

NVIDIA lance DGX Station, un superordinateur IA sous Windows pour les entreprises

NVIDIA a dévoilé le 1er juin 2026, lors du GTC Taipei, la DGX Station pour Windows, présentée comme le superordinateur IA de bureau le plus puissant au monde. Propulsée par la puce GB300 Grace Blackwell Ultra Desktop Superchip, qui associe un GPU Blackwell Ultra à un processeur Grace de 72 cœurs via l'interconnexion NVLink-C2C, la machine offre jusqu'à 748 Go de mémoire cohérente et 20 pétaflops de performances en FP4. Elle peut exécuter localement des modèles d'intelligence artificielle atteignant 1 000 milliards de paramètres, et faire tourner plusieurs centaines d'agents IA simultanément. Commercialisée au quatrième trimestre 2026 par ASUS, Dell Technologies, MSI et Supermicro, la station intègre également une carte réseau ConnectX-8 SuperNIC à 800 Gbit/s, permettant d'interconnecter plusieurs unités entre elles pour des charges de travail encore plus exigeantes. L'enjeu central de cette annonce est de réconcilier la puissance des infrastructures de datacenter avec l'environnement Windows, dans lequel travaillent au quotidien la grande majorité des équipes en entreprise : développeurs, ingénieurs, data scientists, concepteurs 3D. Jusqu'ici, les projets IA les plus ambitieux reposaient quasi exclusivement sur des serveurs Linux hébergés dans le cloud ou dans des centres de données, créant un fossé entre les outils de production IA et les environnements de travail réels. Avec la DGX Station, NVIDIA cible directement ce décalage en permettant le développement, le test et le déploiement d'agents IA autonomes au plus près des applications métier, sans dépendance au cloud. Pour les organisations soucieuses de souveraineté des données, l'exécution locale des modèles permet aussi de limiter les transferts vers des infrastructures externes. Cette machine s'inscrit dans un tournant plus large de l'industrie : les entreprises ne cherchent plus seulement à intégrer des chatbots, mais à déployer des agents capables de raisonner, d'interagir avec plusieurs logiciels et d'automatiser des tâches complexes en continu. NVIDIA répond à cette demande en combinant la plateforme OpenShell, conçue pour construire et exécuter des agents sécurisés sous Windows, avec la densité de calcul de l'architecture Blackwell. La possibilité d'y coupler une carte RTX PRO 6000 Blackwell ajoute des capacités de visualisation et de simulation, élargissant encore le spectre des usages. Cette annonce confirme également la stratégie de NVIDIA de pénétrer l'entreprise non plus seulement par le datacenter, mais directement par le poste de travail, en faisant de la puissance de calcul IA une ressource locale, accessible et intégrée aux flux de travail existants.

UELes organisations européennes soumises au RGPD pourraient bénéficier de la capacité à exécuter localement des modèles d'IA volumineux, réduisant leur dépendance aux infrastructures cloud extra-européennes.

💬 20 pétaflops sur un bureau Windows, ça fait mal aux yeux. NVIDIA joue un coup malin : au lieu de vendre encore du datacenter, ils ramènent la puissance là où les équipes bossent au quotidien, sans passer par le cloud. Bon, la facture va être salée, mais pour une boîte avec des modèles sensibles et une DSI soucieuse du RGPD, c'est le premier argument solide.

L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA
107NVIDIA AI Blog 

L'écosystème cloud IA de NVIDIA s'étend dans le monde entier pour répondre à la demande mondiale en calcul IA

NVIDIA accélère la construction d'une infrastructure mondiale d'« usines à IA », en s'appuyant sur un écosystème croissant de partenaires cloud. Jensen Huang, fondateur et PDG de NVIDIA, a annoncé lors d'une communication officielle que cet écosystème couvre désormais six continents, avec l'arrivée de deux nouveaux partenaires : Cassava en Afrique et Claro en Amérique du Sud. Des acteurs comme CoreWeave, Firmus, IREN et Nscale élargissent leurs capacités pour répondre à la demande des laboratoires d'IA, des entreprises et des gouvernements. En Australie, Firmus Technologies déploie son « Project Southgate », un programme de data centers en Tasmanie, Melbourne, Australie-du-Sud et Nouvelle-Galles du Sud, en privilégiant les énergies renouvelables et les infrastructures modulaires. La société a également ouvert des installations à Singapour en partenariat avec ST Telemedia Global Data Centres. Cet élargissement répond à une explosion de la demande en tokens, l'unité de traitement des modèles de langage, portée par les applications d'IA agentique, les copilotes d'entreprise et les modèles frontières. Pour les nations et industries réglementées, ces clouds régionaux permettent de respecter des exigences de souveraineté numérique et de conformité locale, sans dépendre d'infrastructures centralisées aux États-Unis. Pour les développeurs et startups, ils réduisent la latence et simplifient l'accès aux GPU NVIDIA, combinés aux logiciels d'IA et aux réseaux haute performance de la marque. L'argument économique mis en avant par NVIDIA est le coût par token et le débit par watt, deux métriques déterminantes pour qui exploite des modèles d'IA en production à grande échelle. Cette expansion s'inscrit dans une stratégie plus large de NVIDIA pour s'imposer non plus seulement comme fabricant de puces, mais comme architecte de l'ensemble de la chaîne d'infrastructure IA, du silicium aux logiciels en passant par le cloud. Face à la montée en puissance de concurrents comme AMD et aux investissements massifs des hyperscalers (Google, Microsoft, Amazon) dans leurs propres puces, NVIDIA cherche à verrouiller l'écosystème via des partenariats cloud qui intègrent sa pile technologique complète. Des partenaires comme GMI Cloud, Naver Cloud, Indosat Ooredoo Hutchison ou YTL ancrent cette stratégie dans des marchés à forte croissance : Asie du Sud-Est, Moyen-Orient, Afrique. La prochaine étape sera d'observer si ces capacités régionales parviennent à absorber la demande des grands modèles frontières, dont les coûts d'entraînement continuent de croître exponentiellement.

UELes clouds régionaux NVIDIA permettent aux entreprises et industries réglementées européennes de répondre aux exigences de souveraineté numérique sans dépendre d'infrastructures centralisées aux États-Unis.

InfrastructureActu
1 source
Arthur Mensch : itinéraire d’un architecte de l’IA européenne
108Le Big Data 

Arthur Mensch : itinéraire d’un architecte de l’IA européenne

Arthur Mensch, 33 ans, a cofondé Mistral AI en mai 2023 à Paris aux côtés de Guillaume Lample et Timothée Lacroix, deux anciens de Meta AI et camarades de l'École Polytechnique. Dès le mois suivant, la jeune pousse lève 105 millions de dollars en amorçage auprès de Lightspeed Venture Partners, un record européen pour une entreprise sans produit visible, fondé uniquement sur la réputation scientifique des trois associés. Le parcours de Mensch lui-même est celui d'un chercheur de fond formé à Polytechnique, Télécom Paris et au Master MVA de l'ENS Paris-Saclay, avant une thèse à l'Inria et au CEA NeuroSpin sur l'optimisation stochastique appliquée à l'imagerie cérébrale. Il rejoint ensuite Google DeepMind Paris fin 2020, où il travaille pendant près de trois ans sur des architectures multimodales et du traitement du langage à grande échelle. Ce que représente Mistral AI dépasse le simple succès commercial d'une startup : c'est la première fois qu'une entreprise européenne s'installe durablement dans la compétition frontale avec OpenAI, Google et Meta sur les grands modèles de langage. En optant pour des modèles ouverts et publiés librement, Mistral bouscule un secteur où la fermeture est la norme, séduisant à la fois les développeurs indépendants, les entreprises soucieuses de souveraineté des données et les gouvernements européens en quête d'alternatives crédibles aux fournisseurs américains. Cette approche technique traduit aussi un pari stratégique : la transparence comme levier de confiance et d'adoption rapide. Le déclic entrepreneurial de Mensch est né d'un constat précis observé de l'intérieur de DeepMind : l'Europe produit des chercheurs en IA parmi les meilleurs au monde, mais la Silicon Valley en capte systématiquement la valeur économique et la propriété intellectuelle. Plutôt que de tenter d'infléchir cette dynamique depuis un grand groupe américain, il choisit de fonder une structure indépendante sur le continent, capable de retenir les talents locaux et de garantir que les données des utilisateurs européens ne transitent pas par des serveurs étrangers. Depuis ses auditions parlementaires à Bruxelles et Paris, Mensch porte désormais ce discours au niveau politique, plaidant pour une régulation de l'IA qui ne pénalise pas les acteurs européens face à des concurrents qui opèrent hors de toute contrainte comparable. En trois ans, Mistral est passé de feuille blanche à symbole d'une souveraineté technologique possible.

UEMistral AI, entreprise purement française, incarne la souveraineté technologique européenne en offrant aux entreprises et gouvernements du continent une alternative crédible aux modèles américains pour héberger leurs données sans dépendance extra-européenne.

💬 105 millions levés sans produit, juste sur la réputation de trois chercheurs : ça te dit tout sur ce que vaut la crédibilité scientifique quand elle est bien emballée. Ce que Mensch a compris (et que DeepMind n'a pas su retenir), c'est que garder les talents ici passe par leur donner la propriété de ce qu'ils construisent. L'open source comme levier d'adoption, c'est le pari qui a marché jusqu'ici.

BusinessOpinion
1 source
Formation de modèles de langage en azerbaïdjanais sur Amazon SageMaker AI
109AWS ML Blog 

Formation de modèles de langage en azerbaïdjanais sur Amazon SageMaker AI

Azercell Telecom LLC, principal opérateur télécom d'Azerbaïdjan, a développé en six semaines un grand modèle de langage (LLM) en azerbaïdjanais sur la plateforme Amazon SageMaker AI, en partenariat avec le AWS Generative AI Innovation Center. L'objectif : doter l'entreprise d'un chatbot client et d'outils spécialisés pour les usages télécoms, en partant de zéro dans une langue pour laquelle aucun blueprint d'entraînement n'existait. Le cadre technique mis en place repose sur trois étapes séquentielles : la création d'un tokenizer sur mesure, un pré-entraînement continu à partir du modèle Llama 3.2 1B de Meta, puis un affinage supervisé via la méthode LoRA. Sur une instance ml.p5.48xlarge, les optimisations au niveau noyau permises par la bibliothèque Liger Kernels ont abouti à un débit d'entraînement supérieur de 23 % et une consommation mémoire GPU au pic réduite de 58 %. Le tokenizer azerbaïdjanais personnalisé, quant à lui, divise par deux le nombre de tokens nécessaires par mot, ce qui double concrètement la quantité de texte exploitable dans la fenêtre de contexte du modèle. Ces résultats illustrent un défi bien réel pour l'IA appliquée aux langues à faibles ressources : l'azerbaïdjanais est une langue agglutinante, dans laquelle un seul mot peut encoder des informations grammaticales qu'une phrase anglaise exprime par plusieurs mots distincts. Les tokenizers optimisés pour l'anglais fragmentent ces formes complexes de façon inefficace, dégradant les performances et augmentant les coûts de calcul. En construisant un tokenizer monolingue sur mesure, Azercell et AWS ont résolu ce problème structurel avant même de commencer l'entraînement proprement dit, ce qui améliore chacune des étapes suivantes. Pour les entreprises qui opèrent dans des marchés linguistiques non dominants, cette approche modulaire représente un modèle reproductible : chaque composant (tokenizer, pré-entraînement, affinage) peut être optimisé indépendamment et réutilisé sur des tâches différentes. Le projet s'inscrit dans un mouvement plus large de souveraineté linguistique numérique, alors que les LLM généralistes peinent à performer dans les dizaines de langues mal représentées dans leurs données d'entraînement. L'azerbaïdjanais partage des caractéristiques morphologiques avec le turc, le kazakh ou l'ouzbek, ce qui rend cette méthodologie potentiellement transférable à tout un ensemble de langues turcophones d'Asie centrale. Azercell prévoit de passer à des modèles de plus grande taille, pour lesquels l'entraînement distribué sur SageMaker deviendra indispensable, alors que le proof-of-concept actuel à 1 milliard de paramètres n'en avait pas encore besoin. La collaboration avec le AWS Generative AI Innovation Center suit un modèle désormais courant : un géant du cloud apporte l'ingénierie d'infrastructure, l'entreprise locale apporte la donnée et la connaissance métier, et le résultat est un actif IA propriétaire impossible à obtenir via un modèle généraliste.

UELa méthodologie de tokenizer sur mesure pour langues agglutinantes pourrait inspirer des initiatives similaires pour les langues régionales européennes sous-représentées (basque, hongrois, finnois), sans impact direct sur la France ou l'UE.

LLMsTuto
1 source
☕️ Les agences de renseignement américaines à court de puissance de calcul pour leurs IA
110Next INpact 

☕️ Les agences de renseignement américaines à court de puissance de calcul pour leurs IA

La Maison Blanche aurait approuvé une enveloppe de 9 milliards de dollars destinée à doter les agences de renseignement américaines en puces IA de dernière génération, selon des informations rapportées par le New York Times. Ce financement, qui doit encore passer par le Congrès, vise à permettre à la CIA, la NSA et leurs homologues de faire tourner les modèles d'intelligence artificielle les plus récents sur des infrastructures à la hauteur. L'administration Trump aurait par ailleurs déjà redirigé 800 millions de dollars pour accélérer des achats de capacités de calcul en urgence. Parallèlement, la Maison Blanche aurait autorisé la NSA à continuer d'exploiter Mythos, le modèle le plus avancé d'Anthropic, dans le cadre d'un contrat classifié en préparation qui inclurait des restrictions sur le traitement de données concernant des citoyens américains. Les agences américaines se retrouvent dans la même situation que n'importe quel acteur privé : les infrastructures capables d'accueillir les grands modèles d'OpenAI, d'Anthropic ou de Google affichent complet, et les composants les plus puissants, comme les puces Grace Blackwell de NVIDIA, exigent des centres de données dotés de systèmes d'alimentation massifs. Or les réseaux infonuagiques classifiés du gouvernement, dont ceux opérés par AWS, ne peuvent pas être modernisés rapidement. Les agences n'auraient tout simplement pas anticipé les besoins en calcul de ces modèles, et les délais de déploiement restent incompressibles même avec de l'argent disponible. Résultat : les 800 millions déjà mobilisés représentent une goutte d'eau face à l'ampleur des besoins réels, et les 9 milliards supplémentaires n'arriveraient pas immédiatement sur le terrain. Cette situation s'inscrit dans une séquence de tensions entre Washington et les labos d'IA. Le Pentagone avait exigé un accès très large aux modèles avancés d'Anthropic pour ses opérations classifiées, ce qu'Anthropic a refusé, une affaire encore devant les tribunaux. Le DoD a finalement constitué un cercle de fournisseurs IA pour ses opérations secret défense, retenant OpenAI, Google, Microsoft et AWS, mais laissant Anthropic à l'écart, du moins officiellement. Le Pentagone qualifiait même l'entreprise de "risque" pour la chaîne d'approvisionnement et la sécurité nationale, ce qui rend d'autant plus notable la décision d'autoriser la NSA à continuer d'utiliser Mythos. Cette contradiction illustre la difficulté pour les institutions américaines de concilier impératifs de souveraineté numérique, besoins opérationnels croissants en IA, et dépendance inévitable envers quelques entreprises privées qui contrôlent les modèles les plus performants.

UELe retard des agences de renseignement américaines illustre les risques de dépendance envers quelques fournisseurs privés d'IA, un avertissement indirect pour les institutions européennes engagées dans des démarches de souveraineté numérique.

💬 9 milliards pour rattraper un retard que tout le monde voyait venir. Ce qui me frappe, c'est la contradiction : le Pentagone liste officiellement Anthropic comme un "risque sécurité" pour la chaîne d'approvisionnement, et pendant ce temps la NSA continue d'utiliser Mythos via un contrat classifié. Ça dit tout sur ce que vaut la "souveraineté numérique" quand les seuls modèles utilisables sont dans les mains de trois boîtes privées.

InfrastructureOpinion
1 source
Construire un pipeline complet d'observabilité et d'évaluation Langfuse pour le traçage, la gestion des prompts, le scoring et les expériences
111MarkTechPost 

Construire un pipeline complet d'observabilité et d'évaluation Langfuse pour le traçage, la gestion des prompts, le scoring et les expériences

Langfuse, plateforme open-source d'ingénierie LLM, propose un pipeline complet couvrant quatre dimensions critiques du développement d'applications à base de grands modèles de langage : le tracing des appels, la gestion centralisée des prompts, le scoring d'évaluation et les expérimentations sur datasets. Le tutoriel publié cette semaine détaille une implémentation complète, compatible aussi bien avec l'API OpenAI (notamment le modèle gpt-4o-mini) qu'avec un LLM déterministe simulé, permettant à tout développeur d'explorer chaque fonctionnalité sans dépendre d'un accès payant. L'intégration commence par la connexion au client Langfuse via des clés d'authentification publique et secrète (formats pk-lf- et sk-lf-), avec support des régions EU, US et des instances auto-hébergées. Le pipeline instrumente ensuite des fonctions Python simples puis un mini-pipeline RAG (Retrieval-Augmented Generation), en attachant à chaque appel LLM des métadonnées de trace, un modèle, des paramètres de température et des identifiants de prompt. Pour les équipes qui développent des produits IA en production, cette approche résout un problème central : la boîte noire des LLMs. Avec Langfuse, chaque génération devient observable, chaque prompt est versionné et centralisé, et chaque réponse peut recevoir un score d'évaluation automatique ou humain. Cela permet de détecter les régressions de qualité entre versions de prompts, de comparer les performances de différents modèles sur un même dataset, et de construire une boucle d'amélioration continue documentée. Les équipes produit et ML gagnent une visibilité structurée sur ce qui se passe réellement à l'intérieur de leurs pipelines, ce qui est aujourd'hui l'un des manques les plus critiques dans le déploiement d'applications LLM à l'échelle. Langfuse s'inscrit dans un écosystème en pleine structuration autour de l'observabilité LLM, aux côtés de solutions comme LangSmith (LangChain), Weights & Biases Weave ou Helicone. Sa différenciation principale repose sur son caractère open-source et la possibilité de l'auto-héberger, ce qui répond directement aux contraintes de conformité et de souveraineté des données des entreprises européennes. La montée en maturité de ces outils reflète un tournant dans l'industrie : les LLMs ne sont plus des prototypes à évaluer manuellement, mais des composants de production qui exigent la même rigueur d'ingénierie que n'importe quel service critique. L'intégration native avec le SDK OpenAI via un simple remplacement d'import facilite une adoption progressive, sans refonte d'architecture, ce qui devrait accélérer son adoption dans des stacks existantes.

UELangfuse étant open-source et auto-hébergeable, les entreprises européennes peuvent l'adopter en respectant leurs contraintes RGPD et de souveraineté des données, sans dépendre d'infrastructures américaines.

OutilsOutil
1 source
Cohere lance Command A+, un modèle MoE sparse de 218 milliards de paramètres pour agents autonomes, utilisable sur seulement deux GPU H100
112MarkTechPost 

Cohere lance Command A+, un modèle MoE sparse de 218 milliards de paramètres pour agents autonomes, utilisable sur seulement deux GPU H100

Cohere a publié Command A+, un modèle open source sous licence Apache 2.0 conçu pour les workflows agentiques en entreprise. Architecturé comme un Transformer sparse Mixture-of-Experts (MoE) décodeur uniquement, le modèle totalise 218 milliards de paramètres mais n'en active que 25 milliards par inférence, grâce à un mécanisme de routage vers 8 experts parmi 128 disponibles. Cette architecture permet de faire tourner Command A+ sur seulement deux GPU H100 en quantification W4A4 4 bits, ou sur quatre H100 en FP8, rendant le déploiement on-premise accessible sans infrastructure exorbitante. Le modèle prend en charge une fenêtre de contexte de 128 000 tokens, génère jusqu'à 64 000 tokens, traite texte, images et appels d'outils, et couvre désormais 48 langues contre 23 pour ses prédécesseurs. Il fusionne en un seul modèle les capacités de quatre modèles précédents : Command A, Command A Reasoning, Command A Vision et Command A Translate. Les gains de performance sont substantiels. Sur le benchmark tau²-Bench Telecom, Command A+ passe de 37 % à 85 % par rapport à Command A Reasoning. Sur Terminal-Bench Hard, référence pour le codage agentique difficile, le score bondit de 3 % à 25 %. En interne, Cohere mesure une amélioration de 20 % en question-réponse agentique, de 32 % en analyse de tableurs, et la capacité à exploiter la mémoire de sessions précédentes atteint 54 % contre 39 %. Sur le plan multimodal, MathVista progresse de 73,5 % à 80,6 % et Command A+ décroche 37 points sur l'Artificial Analysis Intelligence Index, devançant les principaux modèles open source concurrents. La quantification W4A4, appliquée uniquement aux couches MoE tout en conservant les projections d'attention en pleine précision, n'entraîne aucune dégradation mesurable sur les benchmarks et améliore le débit de sortie de 63 % tout en réduisant le temps avant premier token de 17 % par rapport à Command A Reasoning. Command A+ s'inscrit dans une tendance de fond qui voit les grands laboratoires chercher à réduire drastiquement le coût d'inférence sans sacrifier la qualité. Cohere, positionné historiquement sur le segment entreprise face à OpenAI, Anthropic et Google, mise sur la portabilité et la souveraineté des déploiements : la licence Apache 2.0 permet un usage commercial libre, un argument de poids pour les organisations qui refusent de dépendre de fournisseurs cloud. La technique de distillation avec prise en compte de la quantification (Quantization-Aware Distillation) utilisée en post-entraînement illustre la maturité croissante des méthodes de compression, qui commencent à rivaliser avec les modèles denses pleine précision sur des tâches complexes. La prochaine question sera de savoir si des performances agentiques aussi élevées sur deux H100 suffiront à convaincre les DSI d'internaliser leurs inférences plutôt que de passer par les API managées.

UELa licence Apache 2.0 et la possibilité de déployer Command A+ sur seulement deux GPU H100 ouvrent aux entreprises européennes une option d'inférence on-premise souveraine, réduisant leur dépendance aux APIs cloud américaines.

LLMsOpinion
1 source
IA et performance : le verdict de l’indice mondial Fivetran
113Le Big Data 

IA et performance : le verdict de l’indice mondial Fivetran

Fivetran a publié en 2026 son indice mondial de maturité des pipelines de données, et les résultats sont sans appel : si 60 % des organisations à l'échelle mondiale investissent massivement dans l'IA agentique, avec des budgets estimés à plusieurs dizaines de millions d'euros, seules 15 % d'entre elles disposent réellement d'une infrastructure de données suffisamment solide pour faire fonctionner ces systèmes en production. En France, ce chiffre tombe à 12 %, soit parmi les plus faibles des pays étudiés. George Fraser, PDG de Fivetran, pointe une erreur de diagnostic commune : les entreprises investissent dans les modèles et les interfaces, mais négligent la plomberie informatique qui les alimente. Résultat : des agents autonomes déployés sur des pipelines instables, incapables de fournir des données fiables en temps réel. L'enjeu dépasse largement la performance technique. Contrairement à l'IA générative classique qui produit du texte à la demande, l'IA agentique prend des décisions et exécute des tâches en autonomie, ce qui exige une traçabilité complète et des données de qualité à chaque instant. Or, près de 40 % des professionnels interrogés dans l'étude identifient deux blocages majeurs : l'absence de traçabilité, qui empêche de comprendre l'origine des erreurs quand un agent dérape, et les contraintes réglementaires de souveraineté des données, qui freinent les déploiements à grande échelle. Ces failles de gouvernance transforment les projets pilotes en impasses opérationnelles, avec des risques économiques et réputationnels concrets pour les organisations concernées. Gartner va plus loin en avertissant que plus de la moitié des initiatives d'IA agentique pourraient être abandonnées faute de préparation adéquate des systèmes sous-jacents. Ce rapport intervient dans un contexte d'accélération généralisée des budgets IA, où la pression sur les directions informatiques pour livrer des résultats visibles est maximale. Les entreprises les plus avancées dans leur déploiement partagent une caractéristique commune : elles ont misé sur des architectures interopérables, capables de communiquer entre différents systèmes sans dépendre d'un fournisseur unique, ce que l'industrie appelle l'évitement du "vendor lock-in". Pour les responsables data, cette capacité d'intégration est désormais un critère éliminatoire dans le choix des solutions. La leçon que tire Fivetran de cet indice est claire : la priorité de 2026 n'est plus l'acquisition de nouveaux outils d'IA, mais la consolidation et la fiabilisation des flux de données qui les alimentent. Sans cette fondation, les ambitions agentiques resteront, pour la plupart des organisations, des promesses sur slides.

UELa France affiche le taux de maturité infrastructure le plus bas de l'étude (12%), exposant les entreprises françaises à un risque élevé d'échec de leurs initiatives d'IA agentique faute de pipelines de données fiables.

InfrastructureActu
1 source
Amazon SageMaker AI prend en charge l'API compatible OpenAI
114AWS ML Blog 

Amazon SageMaker AI prend en charge l'API compatible OpenAI

Amazon a annoncé ce mois-ci que SageMaker AI supporte désormais une API compatible avec celle d'OpenAI pour ses endpoints d'inférence en temps réel. Concrètement, les développeurs qui utilisent le SDK OpenAI, LangChain ou le framework Strands Agents peuvent désormais router leurs appels vers des modèles hébergés sur SageMaker AI en changeant uniquement l'URL de l'endpoint. Plus besoin de client personnalisé, de wrapper SigV4, ni de réécriture de code. Les endpoints SageMaker exposent un chemin /openai/v1 qui accepte les requêtes au format Chat Completions et renvoie les réponses du conteneur telles quelles, y compris en streaming. L'authentification repose sur des tokens bearer à durée limitée (jusqu'à 12 heures), générés à partir des credentials AWS existants via le SDK Python SageMaker, sans clé API supplémentaire. Ce changement simplifie radicalement l'intégration de SageMaker dans les stacks d'IA existantes. Pour les équipes qui orchestrent des agents multi-LLM via une gateway (comme Bifrost, mentionnée par Giorgio Piatti, ingénieur ML chez Caffeine.AI), SageMaker devient un fournisseur interchangeable sans adaptation technique. Les cas d'usage sont nombreux : workflows agentiques tournant entièrement sur de l'infrastructure dédiée en compte AWS, hébergement multi-modèles sur un seul endpoint via les inference components (par exemple Llama pour les tâches générales, un Mistral fine-tuné pour un domaine métier, et un petit modèle de classification), ou encore déploiement de modèles open source fine-tunés sans toucher au code applicatif existant. Pour les entreprises soumises à des contraintes de souveraineté des données ou de conformité, c'est un gain concret : elles peuvent utiliser les mêmes frameworks standardisés OpenAI tout en gardant les modèles dans leur propre compte AWS. Cette annonce s'inscrit dans une bataille plus large pour capter les workloads d'inférence IA en entreprise. Le standard OpenAI s'est imposé de facto comme protocole universel pour les LLMs, et les grands fournisseurs cloud (AWS, Google, Azure) cherchent à réduire les frictions pour attirer des équipes déjà investies dans cet écosystème. Amazon avait déjà investi massivement dans Bedrock et SageMaker, mais l'adoption restait freinée par les incompatibilités d'API qui forçaient les migrations de code. En adoptant la compatibilité OpenAI directement au niveau de SageMaker AI, AWS ferme cet écart et concurrence frontalement des solutions comme Azure OpenAI Service ou les endpoints Vertex AI de Google. Le notebook d'exemple avec Qwen3-4B (modèle d'Alibaba disponible sur Hugging Face) illustre aussi l'ouverture vers les modèles open source, un segment en forte croissance face aux modèles propriétaires.

UELes entreprises européennes soumises aux contraintes RGPD et de souveraineté des données peuvent désormais utiliser les frameworks OpenAI standard tout en maintenant leurs modèles dans leur propre infrastructure AWS hébergée en région européenne.

💬 C'est le genre de truc qui semble anodin et qui change tout en pratique. Changer juste l'URL pour basculer d'OpenAI vers SageMaker, sans toucher au code, c'est exactement ce que les équipes enterprise attendaient pour switcher sans se battre avec leur DSI. Bon, ça reste AWS, donc la facture peut vite grimper, mais pour les boîtes avec des contraintes de souveraineté data, l'argument est solide.

OutilsOpinion
1 source
☕️ Le pape lance une commission sur l’intelligence artificielle
115Next INpact 

☕️ Le pape lance une commission sur l’intelligence artificielle

Le pape Léon XIV a annoncé dimanche 18 mai 2026 la création d'une commission vaticane dédiée à l'intelligence artificielle, chargée de coordonner la réponse de l'Église catholique au développement de ces technologies. Cette annonce intervient quelques jours avant la publication de la première encyclique du souverain pontife, prévue pour le 25 mai, dont le contenu reste confidentiel mais qui doit tracer les orientations morales de l'Église sur plusieurs sujets contemporains, dont l'IA. La commission a pour mandat explicite d'examiner la technologie, ses effets potentiels sur les êtres humains et l'humanité entière, ainsi que les préoccupations de l'Église concernant la dignité de chaque personne. Cette initiative traduit une volonté d'institutionnaliser la réflexion éthique catholique sur l'IA à un moment où la technologie s'impose dans tous les secteurs de la société. Pour des centaines de millions de fidèles catholiques dans le monde, cette commission pourrait constituer un cadre de référence moral face à des outils dont l'adoption est souvent plus rapide que la réflexion éthique. L'Église se positionne ainsi non pas comme un acteur technologique, mais comme une autorité morale capable d'interpeller gouvernements et entreprises sur les garde-fous nécessaires, notamment en matière de dignité humaine, de travail et d'usage responsable des données. Cette démarche s'inscrit dans un contexte plus large où les grands développeurs d'IA cherchent activement des repères éthiques auprès des traditions religieuses et philosophiques. Des entreprises comme Google, Microsoft ou des startups spécialisées ont multiplié les consultations avec des leaders religieux de toutes confessions. Le Vatican lui-même avait déjà pris position sur le sujet par le passé, Léon XIV ayant notamment demandé aux prêtres de ne pas utiliser l'IA pour rédiger leurs homélies. Avec cette commission permanente et l'encyclique à venir, l'Église catholique franchit un cap en dotant sa réflexion d'une structure institutionnelle durable, susceptible de peser dans les débats réglementaires internationaux.

UELa commission vaticane et la future encyclique pourraient peser dans les débats réglementaires européens sur l'éthique de l'IA, notamment sur les exigences de dignité humaine déjà inscrites dans l'AI Act.

ÉthiqueOpinion
1 source
Les événements à ne pas rater pour comprendre la montée en puissance de l’IA en 2026
116FrenchWeb 

Les événements à ne pas rater pour comprendre la montée en puissance de l’IA en 2026

L'année 2026 s'impose comme un tournant décisif pour l'intelligence artificielle. Après plusieurs années d'expérimentation intense portée par l'essor des modèles génératifs, le secteur entre dans une phase de maturité industrielle. Les grandes conférences et salons professionnels de l'année reflètent ce changement de cap : les thématiques dominantes ne sont plus la découverte ou la démonstration, mais l'intégration opérationnelle, le déploiement à grande échelle et la gouvernance des systèmes IA en conditions réelles. Les enjeux qui structurent l'agenda 2026 sont multiples et convergents. Les infrastructures de calcul (compute) et la consommation énergétique des centres de données sont au coeur des débats, à mesure que les modèles deviennent plus complexes et plus gourmands. Les agents IA autonomes, capables d'exécuter des tâches longues et enchaînées, concentrent l'attention des entreprises qui cherchent à automatiser des processus métier entiers. La robotique physique et la souveraineté numérique s'invitent également dans les discussions, portées par des tensions géopolitiques persistantes autour du contrôle des semi-conducteurs et des données. Ce basculement vers une logique industrielle reflète une transformation plus profonde : les entreprises ne se demandent plus si elles doivent adopter l'IA, mais comment le faire sans perdre le contrôle. Les événements professionnels de 2026 servent ainsi de baromètre pour mesurer où en sont réellement les acteurs du secteur, entre les annonces des géants technologiques américains et les ambitions croissantes des acteurs européens et asiatiques.

UEL'article met explicitement en avant les ambitions croissantes des acteurs européens face aux géants américains, notamment sur les enjeux de souveraineté numérique et de gouvernance de l'IA, thématiques centrales du cadre réglementaire européen en cours de déploiement.

💬 La phase POC est officiellement terminée pour beaucoup. Ce qui m'intéresse maintenant, c'est qui va réussir l'industrialisation sans se planter sur la gouvernance, parce que c'est là que ça va coincer. Les Européens ont une carte à jouer sur la souveraineté, si tant est qu'ils arrêtent d'en parler et commencent à livrer.

BusinessOpinion
1 source
Supertone lance Supertonic v3 : modèle de synthèse vocale embarquée en 31 langues, avec moins d'erreurs de lecture et des balises d'expression
117MarkTechPost 

Supertone lance Supertonic v3 : modèle de synthèse vocale embarquée en 31 langues, avec moins d'erreurs de lecture et des balises d'expression

Supertone a publié Supertonic 3, la troisième génération de son moteur de synthèse vocale embarqué, basé sur le format ONNX. Cette nouvelle version prend en charge 31 langues, contre seulement 5 dans la version précédente (anglais, coréen, espagnol, portugais et français). Parmi les ajouts figurent l'allemand, l'arabe, le japonais, le russe, le turc, le néerlandais ou encore le vietnamien. Le modèle pèse environ 99 millions de paramètres et occupe 404 Mo sur disque, une empreinte nettement inférieure aux systèmes TTS open-source comparables qui atteignent généralement 700 millions à 2 milliards de paramètres. La v3 corrige aussi les erreurs de lecture que l'on observait dans la v2 (répétitions et omissions de mots), et introduit des balises expressives directement insérables dans le texte : `, , ` permettent de contrôler la prosodie sans modèle auxiliaire. Supertone a également lancé en parallèle un outil baptisé Voice Builder, qui permet aux développeurs de créer des modèles vocaux personnalisés à partir de leurs propres enregistrements. La force de Supertonic 3 réside dans sa capacité à fonctionner entièrement hors ligne, sans GPU, sur du matériel très contraint. Le modèle atteint un RTF (Real-Time Factor) de 0,3 sur un Onyx Boox Go 6, une liseuse e-ink sans connexion réseau, ce qui signifie qu'il génère de la parole trois fois plus vite que la durée réelle du son produit. Pour les développeurs d'interfaces vocales, d'outils d'accessibilité ou d'applications embarquées, cela représente un changement concret : plus besoin d'infrastructure cloud, de latence réseau ou de coût de requête à l'API. Le modèle tient dans un appareil mobile bas de gamme et produit une qualité de lecture compétitive face à des modèles bien plus lourds mesurés sur GPU A100, selon les métriques standard WER (Word Error Rate) et CER (Character Error Rate). Supertone, studio sud-coréen spécialisé dans l'audio IA, s'inscrit dans une tendance plus large vers la synthèse vocale locale et souveraine, à l'opposé des services cloud comme ceux d'ElevenLabs ou d'OpenAI. L'architecture repose sur un autoencoder audio, un module de génération par flow matching en seulement 2 étapes d'inférence (plus rapide que la diffusion classique), et une technique d'entraînement Self-Purifying Flow Matching qui rend le modèle résistant aux données bruitées. La v3 intègre aussi LARoPE (Length-Aware Rotary Position Embedding) pour améliorer l'alignement texte-parole. L'écosystème s'est étendu à Flutter (avec support macOS), .NET 9, Go, et au web via onnxruntime-web pour une exécution entièrement côté client. La compatibilité avec les assets ONNX publics de la v2 facilite la migration. La prochaine étape logique serait l'intégration dans des agents vocaux autonomes ou des lecteurs d'écran multilingues embarqués.

UEL'extension à 31 langues incluant plusieurs langues européennes (allemand, néerlandais, russe, arabe) et la capacité de fonctionnement entièrement hors-ligne représentent une opportunité directe pour les développeurs européens d'applications d'accessibilité et d'outils embarqués soumis aux exigences de souveraineté des données.

OutilsOutil
1 source
Au-delà de ChatGPT : les outils d’IA les plus utilisés dans les bureaux français
118Le Big Data 

Au-delà de ChatGPT : les outils d’IA les plus utilisés dans les bureaux français

Selon un sondage Ifop publié en 2025, 43 % des actifs français déclarent utiliser des outils d'intelligence artificielle générative dans leur travail, et 29 % d'entre eux estiment que leur productivité a progressé de plus de 40 % grâce à ces solutions. Si ChatGPT domine encore largement avec 72 % des utilisateurs, l'écosystème s'est considérablement diversifié : Gemini de Google rassemble 20 % des utilisateurs professionnels, suivi de Microsoft Copilot (12 %), Mistral AI (6 %) et l'outil chinois DeepSeek. Au-delà des assistants conversationnels généralistes, d'autres catégories d'outils s'imposent dans les bureaux français : Notion AI pour la structuration de l'information et la documentation automatisée, Motion et Clockwise pour la planification intelligente des tâches et des agendas, ou encore Power BI et Microsoft Copilot pour transformer des données brutes en tableaux de bord interactifs accessibles en langage naturel. Ces chiffres révèlent une transformation profonde des pratiques professionnelles en France. L'IA n'est plus un outil expérimental réservé aux équipes tech : elle s'intègre dans les flux de travail quotidiens des secteurs aussi variés que la finance, la logistique, le marketing ou les administrations publiques. Microsoft Copilot, directement intégré à Word, Excel et Outlook, s'est imposé dans les grandes entreprises précisément parce qu'il ne demande aucun changement d'outil. Google Gemini progresse dans les organisations déjà équipées de Workspace. Pour les non-experts en données, la capacité à interroger un tableau Excel en français courant représente un gain d'autonomie réel, qui redistribue les compétences analytiques au sein des équipes. Cette montée en puissance de l'IA dans les bureaux français s'inscrit dans un contexte de double tension : entre efficacité et souveraineté des données. Face aux géants américains, plusieurs organisations françaises se tournent vers Mistral AI, principale alternative européenne, dont les modèles sont entraînés et hébergés en Europe, un argument décisif pour les acteurs soumis au RGPD ou à des contraintes de sécurité renforcées. Hugging Face, plateforme open-source fondée à Paris et désormais valorisée à plusieurs milliards de dollars, attire les entreprises qui veulent contrôler leurs pipelines d'IA sans dépendre d'une API propriétaire. L'adoption reste néanmoins inégale selon les secteurs : si les startups et les équipes marketing expérimentent rapidement, les industries plus régulées avancent avec prudence. La prochaine étape sera probablement moins le choix de l'outil que la capacité des organisations à former leurs salariés et à intégrer ces solutions dans des processus métiers cohérents.

UEL'adoption de l'IA dans 43 % des actifs français interroge directement la souveraineté des données face aux géants américains, et renforce le positionnement de Mistral AI et Hugging Face comme alternatives européennes conformes au RGPD.

💬 29 % qui déclarent +40 % de productivité, si c'est vrai, on parle d'un choc comparable à l'arrivée d'Excel dans les bureaux. Ce qui m'intéresse dans ces chiffres, c'est pas le classement des outils, c'est que Copilot tient son rang sans rien demander à personne, juste en restant dans Word et Outlook. La vraie question maintenant, c'est pas quel outil choisir, c'est qui va former les gens à s'en servir vraiment.

SociétéOutil
1 source
CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils
119MarkTechPost 

CopilotKit lance une plateforme d'intelligence pour entreprises dotant les applications à base d'agents d'une mémoire persistante entre sessions et appareils

CopilotKit a annoncé son Enterprise Intelligence Platform, une nouvelle couche d'infrastructure managée qui dote les applications agentiques d'une mémoire persistante entre les sessions, les utilisateurs et les appareils. Jusqu'ici, chaque nouvelle session forçait l'agent à repartir de zéro : aucun souvenir des échanges précédents, des workflows en cours ou des décisions déjà prises. Pour contourner ce problème, les équipes de développement devaient construire manuellement leur propre couche de stockage, en choisissant une base de données, en sérialisant l'état applicatif et en gérant les identifiants de session avant même d'écrire la moindre ligne de logique produit. La plateforme résout ce problème en fournissant une infrastructure clé en main, compatible avec n'importe quel framework agentique. Elle peut être auto-hébergée sur Kubernetes, avec une option cloud managée en développement, et répond aux exigences de sécurité enterprise : conformité SOC 2 Type II, intégration SSO, contrôle d'accès par rôles, déploiements hors ligne air-gapped et souveraineté totale des données via une base de données personnalisée. L'élément central de l'architecture est le concept de "Thread" : un objet de session persistant et structuré qui survit aux déconnexions, aux changements d'appareils et aux relances d'agent. Contrairement à un simple historique de messages texte stocké en base, un Thread capture six dimensions de l'interaction : les composants d'interface générés dynamiquement par l'agent, les étapes humaines dans la boucle (approbations, corrections, décisions guidées), l'état partagé entre le backend agentique et le frontend, les entrées et sorties vocales, les fichiers uploadés ou générés, et l'ensemble des interactions multimodales au sein d'un objet unique. Concrètement, un workflow complexe démarré par un collaborateur peut être repris exactement là où il s'était arrêté par un autre membre de l'équipe sur un appareil différent, sans perte d'état ni de contexte. CopilotKit est déjà connu pour son SDK open-source dédié au frontend des agents IA, ainsi que pour l'AG-UI Protocol, un standard ouvert qui connecte les agents aux interfaces utilisateur. Cette plateforme Enterprise ne remplace pas le SDK existant : elle l'enrichit avec la couche d'infrastructure qui lui manquait. L'enjeu est considérable pour l'industrie, car la persistance de l'état est l'un des principaux freins au déploiement en production d'applications agentiques dans les entreprises. Les cas d'usage visés, comme la rédaction collaborative de documents juridiques ou la gestion de pipelines de données en plusieurs étapes, illustrent un marché qui commence à dépasser les chatbots pour entrer dans la logique de workflows longs et critiques. La disponibilité d'une infrastructure standardisée pourrait significativement accélérer cette transition.

UELa plateforme propose des options de souveraineté des données (base de données personnalisée, déploiement air-gapped sur Kubernetes) susceptibles de faciliter la conformité RGPD pour les équipes de développement européennes qui adoptent des architectures agentiques.

OutilsOutil
1 source
Le Pentagone signe des accords IA confidentiels avec OpenAI, Google et Nvidia, mais pas Anthropic
120The Verge AI 

Le Pentagone signe des accords IA confidentiels avec OpenAI, Google et Nvidia, mais pas Anthropic

Le Pentagone a officialisé des accords d'accès classifié avec OpenAI, Google, Microsoft, Amazon, Nvidia, xAI d'Elon Musk et la startup Reflection, permettant à ces entreprises de fournir leurs outils d'intelligence artificielle à des usages militaires sensibles. L'annonce a été faite vendredi par le département de la Défense américain. OpenAI et xAI avaient déjà conclu des ententes préalables encadrant l'usage "légal" de leurs systèmes, Google ayant quant à lui finalisé un accord similaire selon The Information. Microsoft et Amazon, déjà profondément implantés dans les infrastructures cloud du gouvernement américain via leurs offres souveraines, rejoignent officiellement ce cercle restreint. Ce qui retient l'attention est autant l'inclusion que l'exclusion : Anthropic, qui faisait auparavant partie des prestataires IA du Pentagone pour le traitement d'informations classifiées, a été écarté, le ministère l'ayant désigné comme un "risque de chaîne d'approvisionnement". C'est une rupture significative pour l'entreprise fondée par Dario Amodei, dont la stratégie de sécurité et d'alignement avait jusqu'ici semblé attrayante pour les institutions gouvernementales exigeantes. Cette décision s'inscrit dans une course accélérée entre les grands acteurs de l'IA pour sécuriser des contrats fédéraux américains, marché estimé à plusieurs dizaines de milliards de dollars sur la prochaine décennie. Le label "risque fournisseur" appliqué à Anthropic pourrait refléter des préoccupations liées aux investisseurs étrangers au capital de l'entreprise, notamment Saudi Aramco. Pour les entreprises sélectionnées, l'accès aux environnements classifiés représente un avantage concurrentiel considérable et une validation stratégique au plus haut niveau institutionnel.

UELa désignation d'un prestataire IA comme 'risque de chaîne d'approvisionnement' en raison d'investisseurs étrangers pourrait inspirer des critères similaires dans les appels d'offres européens pour les systèmes IA à usage sensible ou gouvernemental.

BusinessOpinion
1 source
SAP : comment la gouvernance de l'IA en entreprise protège les marges bénéficiaires
121AI News 

SAP : comment la gouvernance de l'IA en entreprise protège les marges bénéficiaires

Manos Raptopoulos, président mondial du succès client pour l'Europe, l'APAC, le Moyen-Orient et l'Afrique chez SAP, a posé un constat sans appel lors de l'AI & Big Data Expo North America : la distance entre 90 % et 100 % de précision n'est pas une nuance graduelle dans le monde de l'entreprise, c'est une différence existentielle. Les systèmes d'IA dits "agentiques" sont désormais capables de planifier, raisonner, coordonner d'autres agents et exécuter des flux de travail de façon autonome. Mais leur déploiement à grande échelle expose les organisations à des risques opérationnels sévères si leur gouvernance reste au stade de la liste de conformité plutôt que de devenir une contrainte d'ingénierie à part entière. Intégrer des bases de données vectorielles modernes aux architectures relationnelles historiques exige des investissements massifs, et restreindre la boucle d'inférence de l'agent pour éviter les hallucinations dans les chaînes financières ou logistiques fait grimper la latence et les coûts de calcul cloud, modifiant les projections de rentabilité initiales. L'enjeu dépasse la simple fiabilité technique : il touche directement les marges et la responsabilité juridique des entreprises. Raptopoulos identifie trois questions que les conseils d'administration doivent impérativement résoudre avant tout déploiement agentique : qui est responsable en cas d'erreur d'un agent, comment tracer les décisions automatisées pour les audits, et à quel seuil précis l'humain doit reprendre la main. Sans ces réponses, l'expansion incontrôlée des agents risque de reproduire les crises du "shadow IT" de la décennie passée, avec des conséquences potentiellement bien plus graves, car ces systèmes agissent directement sur des données sensibles et influencent des décisions à l'échelle de l'organisation entière. Des données maîtres fragmentées, des systèmes métiers en silos ou des ERP surchargés de personnalisations introduisent une imprévisibilité dangereuse au pire moment : lorsqu'un agent autonome s'appuie sur ces fondations défaillantes pour formuler une recommandation touchant la trésorerie, les relations clients ou la conformité réglementaire, les dégâts opérationnels se propagent instantanément. Ce diagnostic s'inscrit dans un contexte de fragmentation géopolitique croissante. Les mandats de souveraineté des données et les exigences de localisation dans des marchés clés comme New York, Francfort, Riyad ou Singapour complexifient la définition des périmètres de responsabilité. SAP avance que l'intelligence d'entreprise authentique ne peut pas reposer sur des grands modèles de langage entraînés sur du texte générique : elle doit être ancrée dans les données propriétaires de l'entreprise, commandes, factures, dossiers logistiques et données financières incluses. Raptopoulos en fait un mandat de direction générale, non un projet informatique : intégrer un contrôle déterministe au coeur d'une intelligence probabiliste est la condition pour que l'IA agentique devienne un levier de rentabilité plutôt qu'une source de risque systémique.

UESAP, éditeur européen majeur, formule un cadre de gouvernance pour l'IA agentique directement applicable aux DSI françaises et européennes soumises aux exigences de localisation des données et à l'AI Act.

BusinessActu
1 source
Analyse de marchés publics : découvrez l’outil Odiana
122Le Big Data 

Analyse de marchés publics : découvrez l’outil Odiana

Le cabinet lyonnais Odialis a lancé Odiana, une plateforme d'intelligence artificielle destinée aux TPE et PME qui souhaitent accéder aux marchés publics sans se noyer dans la complexité administrative. Conçu pour scanner automatiquement les appels d'offres, l'outil extrait en quelques secondes les points de vigilance, les obligations contractuelles et les critères d'éligibilité de chaque dossier. Accessible dès 49 euros par mois, il s'appuie sur seize années d'expérience terrain accumulées par Odialis dans le conseil aux entreprises pour la commande publique. L'outil intègre également un accompagnement à la décision stratégique dite "Go / No Go", qui aide les dirigeants à arbitrer rapidement s'il vaut la peine de répondre à un appel d'offres, et guide ensuite la rédaction du mémoire technique pour maximiser les chances de succès. Pour les petites structures, l'accès aux contrats publics représente un obstacle réel : les dossiers sont volumineux, le vocabulaire juridique opaque, et le temps à y consacrer souvent disproportionné par rapport aux ressources disponibles. Odiana vise à combler ce fossé en automatisant la veille et la phase d'analyse préliminaire, deux tâches chronophages qui découragent de nombreux dirigeants. En réduisant le coût d'entrée technique, la plateforme pourrait permettre à des entreprises qui s'excluaient jusqu'ici du marché public de candidater de manière compétitive, élargissant de facto la concurrence dans un secteur dominé par les grands groupes. Sur le plan technique, Odiana a été conçue avec une architecture entièrement française, hébergée localement et conforme au RGPD, s'appuyant sur les modèles de langage de Mistral AI pour s'affranchir des juridictions étrangères, notamment américaines. Ce choix de souveraineté numérique répond à une demande croissante des acteurs économiques français soucieux de la confidentialité de leurs données stratégiques. Le projet a bénéficié du soutien de Bpifrance et de partenaires industriels comme La Poste. Odiana s'inscrit dans une tendance plus large d'outillage IA à destination des PME françaises, un segment que plusieurs acteurs cherchent à capter en combinant LLM souverains et expertise sectorielle verticale, plutôt qu'en proposant des outils généralistes.

UEOutil 100 % français (hébergement local, RGPD, modèles Mistral AI) soutenu par Bpifrance et La Poste, qui facilite l'accès des TPE/PME françaises aux marchés publics tout en renforçant la souveraineté numérique sur les données stratégiques d'entreprise.

OutilsOutil
1 source
IBM publie deux modèles Granite Speech 4.1 2B : ASR autorégressif avec traduction et édition non-autorégressive rapide
123MarkTechPost 

IBM publie deux modèles Granite Speech 4.1 2B : ASR autorégressif avec traduction et édition non-autorégressive rapide

IBM a mis en ligne deux nouveaux modèles de reconnaissance vocale open source, Granite Speech 4.1 2B et Granite Speech 4.1 2B-NAR, disponibles sur Hugging Face sous licence Apache 2.0. Ces modèles compacts d'environ 2 milliards de paramètres visent à résoudre un problème classique des équipes IA en entreprise : les systèmes de transcription automatique performants exigent généralement des ressources de calcul importantes, tandis que les solutions légères sacrifient la précision. Les deux modèles partagent une architecture en trois composants, un encodeur audio, un adaptateur de modalité et un modèle de langage, mais divergent sur le mécanisme de décodage. Le modèle standard prend en charge la transcription multilingue et la traduction bidirectionnelle en anglais, français, allemand, espagnol, portugais et japonais. La variante NAR (non-autorégressif) se concentre uniquement sur la transcription, sans le japonais ni la traduction, mais avec des temps de réponse nettement plus rapides. IBM a également lancé discrètement une troisième variante, Granite Speech 4.1 2B-Plus, qui ajoute l'attribution par locuteur et des horodatages au niveau du mot. Sur le leaderboard Open ASR d'avril 2026, le modèle principal affiche un taux d'erreur sur les mots (WER) moyen de 5,33%, avec 1,33% sur le benchmark LibriSpeech clean, des résultats compétitifs pour un modèle de cette taille. L'intérêt concret de ces modèles réside dans leur efficacité à l'inférence. La version NAR utilise un modèle de langage bidirectionnel de 1 milliard de paramètres qui corrige la transcription en une seule passe, sans générer les tokens un à un comme le font les architectures autorégressives classiques. Cela réduit considérablement la latence, ce qui en fait une option sérieuse pour les applications temps réel, centres d'appels, sous-titrage en direct, assistants vocaux embarqués. Pour les équipes qui ont besoin de traduction ou de transcription en japonais, le modèle autorégressif standard reste nécessaire, mais la version NAR offre un avantage décisif dès que la vitesse prime sur la polyvalence. IBM s'inscrit ici dans une tendance de fond : la course aux modèles de reconnaissance vocale ouverts et compétitifs s'est intensifiée depuis qu'OpenAI a publié Whisper en 2022. Plusieurs acteurs, dont Meta et Nvidia, ont depuis proposé leurs propres alternatives, chacun cherchant à optimiser le rapport précision/coût computationnel. La famille Granite, déjà connue pour ses modèles de langage orientés entreprise, s'étend désormais à l'audio avec une approche modulaire et documentée, ce qui facilite l'intégration dans des pipelines existants. La publication sous licence Apache 2.0 permet un usage commercial sans restriction, ce qui devrait accélérer l'adoption dans des secteurs comme la santé, la finance ou les médias, où la transcription précise et souveraine est un enjeu stratégique.

UELes entreprises européennes des secteurs santé, finance et médias peuvent déployer ces modèles en souveraineté complète grâce à la licence Apache 2.0, avec un support natif du français pour la transcription et la traduction.

OutilsOpinion
1 source
FlashQLA : Alibaba dévoile une arme secrète qui accélère l’IA jusqu’à 3 fois
124Le Big Data 

FlashQLA : Alibaba dévoile une arme secrète qui accélère l’IA jusqu’à 3 fois

L'équipe Qwen d'Alibaba a présenté le 29 avril 2026 FlashQLA, une bibliothèque de noyaux d'attention linéaire haute performance construite sur TileLang, un langage de programmation optimisé pour le calcul parallèle. Les chiffres avancés sont nets : la propagation avant des modèles est accélérée de 2 à 3 fois, tandis que la rétropropagation, phase critique de l'entraînement, voit sa vitesse pratiquement doubler. L'architecture repose sur une division des calculs en deux noyaux distincts plutôt qu'un bloc unifié, ce qui se traduit par une légère surcharge mémoire mais des performances réelles supérieures sur machines modestes. La rétropropagation bénéficie en particulier d'un pipeline en 16 étapes optimisé au niveau du warp avec des contraintes mémoire très faibles. Ce qui distingue FlashQLA des solutions concurrentes est sa cible explicite : les appareils personnels et l'edge computing, pas les data centers. Alibaba positionne cet outil pour faire tourner des modèles d'IA agentielle directement sur des ordinateurs portables et machines locales, réduisant la dépendance aux serveurs cloud. Les gains sont particulièrement marqués pour les petits modèles et les tâches à contexte long, deux cas d'usage centraux pour l'IA embarquée. Pour les développeurs et les entreprises qui déploient des agents IA en production, cela signifie des coûts d'inférence réduits, des latences plus faibles et une meilleure utilisation de la mémoire sans changement de matériel. FlashQLA s'inscrit dans une tendance de fond qui traverse l'ensemble de l'industrie depuis 2024 : la course à l'efficacité des modèles en dehors du cloud. Face à des coûts d'inférence toujours élevés et à des préoccupations croissantes autour de la souveraineté des données, les grandes entreprises technologiques cherchent à rapprocher la puissance de calcul de l'utilisateur final. Alibaba, via son équipe Qwen déjà connue pour ses modèles ouverts compétitifs face à GPT-4, renforce ici sa position dans l'écosystème open source en proposant une brique d'optimisation bas niveau directement utilisable par la communauté. La publication fait suite à plusieurs annonces similaires dans l'industrie, dont FlashAttention de Tri Dao ou les optimisations kernel de Meta pour Llama. Si FlashQLA tient ses promesses à l'échelle, il pourrait accélérer la migration d'une partie des charges d'inférence vers le local, rééquilibrant durablement le rapport entre cloud centralisé et calcul distribué.

UEL'axe edge computing et réduction de dépendance au cloud s'aligne indirectement avec les objectifs de souveraineté numérique européenne, mais aucun impact direct sur la France ou l'UE n'est identifiable.

InfrastructureOpinion
1 source
Que cache le grand partenariat entre Meta et Amazon autour des puces CPU ?
125Le Big Data 

Que cache le grand partenariat entre Meta et Amazon autour des puces CPU ?

Le 24 avril 2026, Meta Platforms a officialisé un accord de plusieurs milliards de dollars avec Amazon Web Services portant sur l'accès à des dizaines de millions de cœurs de puces Graviton sur une durée estimée entre trois et cinq ans. Les puces concernées sont les Graviton5, gravées en 3 nanomètres, conçues en interne par Amazon via Annapurna Labs sur architecture Arm. Meta devient ainsi l'un des cinq plus grands clients de cette gamme de processeurs. Selon Nafea Bshara, vice-présidente d'AWS, le critère décisif pour Meta a été le rapport performance/prix, dans un contexte où les coûts d'infrastructure liés à l'IA atteignent des niveaux inédits. L'accord marque une rupture avec la logique purement GPU qui dominait les décisions d'infrastructure depuis deux ans et confirme un rééquilibrage profond des architectures de calcul à grande échelle. Ce retour des CPU au premier plan n'est pas un hasard. L'essor des agents IA, ces systèmes capables d'exécuter des tâches complexes de manière autonome, génère des besoins de calcul différents de ceux de l'entraînement des grands modèles. Les CPU jouent un rôle central dans les phases dites de post-entraînement, où les modèles sont ajustés pour des usages spécifiques, ainsi que dans la gestion de l'orchestration en amont et en aval des GPU. Loin de les remplacer, ils les complètent en optimisant l'ensemble de la chaîne de traitement. Pour Meta, qui déploie Meta AI à des centaines de millions d'utilisateurs et développe activement des expériences agentiques, la capacité à absorber des volumes massifs d'inférences à coût maîtrisé est devenue un avantage compétitif direct. Cet accord s'inscrit dans une stratégie d'infrastructure délibérément diversifiée. Meta multiplie les partenariats avec Nvidia, AMD et Arm Holdings, refusant toute dépendance à une architecture unique. La collaboration avec Amazon remonte à 2016, mais bascule ici vers un engagement sur une technologie CPU spécifique, ce qui est inédit dans leur relation. Sur le plan géographique, la majorité des déploiements sera réalisée aux États-Unis, dans un contexte de souveraineté technologique et de sécurisation des chaînes d'approvisionnement devenues des enjeux stratégiques. Du côté d'Amazon, valider Meta comme client de référence renforce la crédibilité des Graviton face aux solutions concurrentes et soutient une intégration verticale plus large : AWS vient d'annoncer 5 milliards de dollars supplémentaires investis dans Anthropic, qui utilisera elle aussi ces mêmes puces maison.

InfrastructureOpinion
1 source
Mercedes-Benz mise sur l’IA on-device avec Liquid AI pour ses futurs modèles
126Le Big Data 

Mercedes-Benz mise sur l’IA on-device avec Liquid AI pour ses futurs modèles

Mercedes-Benz a officialisé le 23 avril 2026 un partenariat pluriannuel avec Liquid AI, une startup spécialisée dans les modèles d'intelligence artificielle embarquée. L'accord prévoit le déploiement à grande échelle de l'IA on-device sur les véhicules équipés des systèmes MBUX de troisième et quatrième générations en Amérique du Nord, avec un premier déploiement en production attendu dès le second semestre 2026. Concrètement, Mercedes-Benz intégrera les modèles Liquid Foundations (LFM) directement dans le matériel du véhicule, ce qui permettra à l'assistant vocal MBUX de traiter localement la reconnaissance vocale, la compréhension du langage naturel et certaines capacités de raisonnement, sans passer par des serveurs distants. Cette IA embarquée ne remplacera pas les architectures cloud existantes, mais les complètera dans une logique hybride : le traitement local pour les usages quotidiens, le cloud pour les cas plus complexes. L'enjeu est double : rapidité et confidentialité. En éliminant la latence des échanges avec des serveurs distants, le système peut répondre en temps réel aux demandes du conducteur, y compris des requêtes complexes combinant navigation, confort et information. La relation entre le conducteur et son véhicule devient plus conversationnelle, moins dépendante de commandes rigides et préformatées. Pour l'industrie automobile, ce virage vers l'IA locale représente une rupture significative : les constructeurs ne sont plus contraints de s'appuyer entièrement sur des infrastructures cloud tierces, ce qui réduit les coûts d'exploitation et renforce la souveraineté sur les données des utilisateurs, un argument commercial de poids face aux régulations croissantes sur la vie privée. Ce partenariat s'inscrit dans la stratégie plus large du "software-defined vehicle", le véhicule défini par logiciel, que Mercedes-Benz construit autour de son système d'exploitation propriétaire MB.OS. Jörg Burzer, membre du directoire de Mercedes-Benz, présente cette approche comme "les bases d'une nouvelle génération d'expériences embarquées intuitives et multimodales". Pour Liquid AI, fondée par Ramin Hasani, le secteur automobile constitue l'un des débouchés les plus ambitieux de l'IA dans le monde physique : ses modèles sont conçus pour être légers et optimisés, capables de fonctionner sur le matériel déjà présent dans les véhicules sans nécessiter de composants supplémentaires coûteux. L'automobile devient ainsi un nouveau terrain de compétition pour les acteurs de l'IA embarquée, aux côtés d'Apple, Google et des équipementiers traditionnels, dans une course où la maîtrise du logiciel embarqué conditionne désormais la différenciation entre constructeurs.

UEMercedes-Benz, constructeur allemand emblématique, renforce la souveraineté des données de ses clients européens en traitant localement les interactions vocales, un argument de conformité direct face au RGPD.

RobotiqueOpinion
1 source
Comment créer une base de connaissances IA entièrement interrogeable avec OpenKB, OpenRouter et Llama
127MarkTechPost 

Comment créer une base de connaissances IA entièrement interrogeable avec OpenKB, OpenRouter et Llama

Un tutoriel publié récemment détaille comment construire une base de connaissances locale entièrement interrogeable en combinant trois outils : OpenKB, la plateforme OpenRouter et le modèle Llama 3.3 70B de Meta, accessible gratuitement sans carte bancaire. Le guide couvre l'ensemble du pipeline, de l'installation d'OpenKB via pip jusqu'à l'interrogation structurée de documents Markdown, en passant par la génération automatique de résumés et de pages conceptuelles au format wiki. La clé API OpenRouter est récupérée de façon sécurisée via la bibliothèque Python getpass, sans jamais être inscrite en dur dans le code. Le résultat est un système de connaissance navigable, avec gestion des liens croisés entre pages, capable de répondre à des requêtes en langage naturel et d'être mis à jour de manière incrémentale. Ce type d'architecture présente un intérêt concret pour les développeurs, chercheurs et équipes qui souhaitent organiser et interroger des corpus de documents internes sans envoyer leurs données vers des services cloud payants. En s'appuyant sur un modèle de 70 milliards de paramètres disponible gratuitement via OpenRouter, l'approche élimine le coût d'inférence tout en offrant des capacités de synthèse comparables à des solutions propriétaires. La possibilité d'analyser programmatiquement les relations entre pages et les liens croisés ouvre également des usages avancés : cartographie de concepts, détection de lacunes documentaires, ou navigation thématique automatisée dans de larges volumes de texte. L'émergence de ce genre de tutoriel s'inscrit dans une tendance plus large de démocratisation des outils RAG (retrieval-augmented generation), qui permettent d'ancrer les réponses d'un LLM dans une base documentaire locale plutôt que dans ses seuls paramètres d'entraînement. OpenRouter joue ici un rôle d'intermédiaire unifié, donnant accès à des dizaines de modèles open source via une API commune, ce qui réduit la friction technique pour expérimenter. OpenKB, de son côté, se positionne comme une couche d'abstraction au-dessus de ces modèles, spécialisée dans la structuration wiki et la navigation sémantique. Alors que des acteurs comme Notion AI ou Confluence intègrent des fonctions similaires dans des produits fermés, des solutions comme celle-ci permettent de garder le contrôle total sur les données et l'infrastructure, un enjeu croissant pour les entreprises soumises à des contraintes de confidentialité ou de souveraineté.

UECette architecture locale répond directement aux enjeux de souveraineté des données pour les entreprises et administrations européennes soumises au RGPD et aux contraintes de confidentialité.

OutilsTuto
1 source
NVIDIA et Google réduisent les coûts d'inférence en IA
128AI News 

NVIDIA et Google réduisent les coûts d'inférence en IA

Lors de la conférence Google Cloud Next, Google et NVIDIA ont dévoilé une nouvelle génération d'infrastructure destinée à réduire drastiquement le coût de l'inférence IA à grande échelle. Les deux entreprises ont présenté les instances A5X bare-metal, reposant sur les systèmes rack NVIDIA Vera Rubin NVL72. Cette architecture promet une réduction jusqu'à dix fois du coût d'inférence par token par rapport aux générations précédentes, tout en multipliant par dix le débit de tokens par mégawatt. Pour atteindre ces performances, les instances A5X combinent les SuperNICs NVIDIA ConnectX-9 avec la technologie réseau Google Virgo, permettant de connecter jusqu'à 80 000 GPU NVIDIA Rubin au sein d'un même site, et jusqu'à 960 000 GPU dans un déploiement multi-sites. Mark Lohmeyer, VP et directeur général de l'infrastructure IA chez Google Cloud, a résumé l'enjeu : "La prochaine décennie de l'IA sera façonnée par la capacité des entreprises à faire tourner leurs charges de travail les plus exigeantes sur une infrastructure vraiment intégrée et optimisée pour l'IA." Ces annonces ont un impact direct sur les secteurs fortement réglementés, comme la finance et la santé, qui butent régulièrement sur des contraintes de souveraineté des données. Google et NVIDIA y répondent avec plusieurs initiatives concrètes : les modèles Gemini fonctionnant sur GPU NVIDIA Blackwell et Blackwell Ultra sont désormais disponibles en préversion sur Google Distributed Cloud, ce qui permet aux organisations de garder les modèles frontier entièrement dans leur environnement contrôlé, au plus près de leurs données sensibles. La sécurité est assurée par NVIDIA Confidential Computing, un protocole de chiffrement matériel qui protège les données d'entraînement et les prompts y compris vis-à-vis des opérateurs cloud eux-mêmes. Pour les environnements cloud public multi-tenant, des VM Confidential G4 équipées de GPU NVIDIA RTX PRO 6000 Blackwell sont également introduites en préversion, marquant la première offre de confidential computing cloud pour des GPU Blackwell. Cette collaboration s'inscrit dans une course plus large à l'optimisation de l'inférence, alors que les coûts opérationnels de l'IA générative restent un frein majeur à son adoption industrielle. Au-delà du matériel, le partenariat couvre aussi la couche logicielle : NVIDIA Nemotron 3 Super est désormais disponible sur la Gemini Enterprise Agent Platform, permettant aux développeurs de construire des systèmes agentiques complexes capables de raisonner, planifier et agir en chaîne. L'ensemble de la plateforme NVIDIA sur Google Cloud est optimisé pour les familles de modèles Gemini et Gemma. Avec des clusters dépassant le million de GPU et une ambition affichée de simplifier le déploiement d'IA souveraine, Google et NVIDIA repositionnent l'infrastructure cloud non plus comme un simple fournisseur de puissance de calcul, mais comme un levier stratégique pour les entreprises qui veulent industrialiser l'IA sans sacrifier performance, coût ou conformité réglementaire.

UELes entreprises européennes des secteurs réglementés (finance, santé) disposent désormais d'options d'infrastructure IA souveraine compatibles avec les exigences RGPD, réduisant un frein concret à l'industrialisation de l'IA en Europe.

InfrastructureActu
1 source
NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents
129NVIDIA AI Blog 

NVIDIA et Google Cloud s'associent pour faire avancer l'IA physique et à base d'agents

NVIDIA et Google Cloud ont annoncé cette semaine, lors de la conférence Google Cloud Next à Las Vegas, une nouvelle étape majeure dans leur partenariat vieux de plus de dix ans. Au cœur de l'annonce : le lancement des instances bare-metal A5X, alimentées par les systèmes rack NVIDIA Vera Rubin NVL72, qui promettent un coût d'inférence jusqu'à dix fois inférieur et un débit de tokens dix fois plus élevé par mégawatt par rapport à la génération précédente. Ces infrastructures s'appuient sur les interconnexions NVIDIA ConnectX-9 SuperNICs couplées au réseau Google Virgo de nouvelle génération, permettant de déployer des clusters allant jusqu'à 80 000 GPU Rubin sur un site unique, et jusqu'à 960 000 GPU dans une configuration multisite. Par ailleurs, Google Cloud met en préversion les modèles Gemini sur Google Distributed Cloud avec les GPU NVIDIA Blackwell et Blackwell Ultra, ainsi que des machines virtuelles confidentielles garantissant le chiffrement des données en cours d'utilisation. Des acteurs comme OpenAI et Thinking Machines Lab utilisent déjà ces infrastructures pour des charges d'inférence massives, notamment pour faire tourner ChatGPT. Ces annonces représentent un saut qualitatif significatif pour les entreprises qui cherchent à industrialiser l'IA agentique et l'IA physique, c'est-à-dire les systèmes capables d'agir de manière autonome dans des environnements réels, comme les robots ou les jumeaux numériques en usine. La réduction drastique des coûts d'inférence change concrètement l'équation économique pour les développeurs d'applications IA à grande échelle. La possibilité de déployer les modèles Gemini en environnement souverain, sur des données sensibles restant chiffrées y compris pendant leur traitement, répond à une exigence croissante des entreprises et des gouvernements en matière de conformité et de confidentialité. L'intégration de modèles ouverts NVIDIA Nemotron dans la plateforme Gemini Enterprise Agent Platform élargit également les options des équipes techniques qui souhaitent combiner modèles propriétaires et open source. Ce partenariat s'inscrit dans une compétition intense entre les grands fournisseurs de cloud pour capter les budgets d'infrastructure IA, qui se chiffrent désormais en dizaines de milliards de dollars annuellement. Google Cloud cherche à rattraper son retard sur AWS et Microsoft Azure, qui ont pris de l'avance sur l'hébergement des charges d'entraînement et d'inférence des grands modèles de langage. En s'associant étroitement à NVIDIA, dont les GPU dominent encore largement le marché de l'accélération IA, Google se positionne comme une plateforme de référence pour la prochaine vague, celle des agents autonomes et de la robotique industrielle. La feuille de route annoncée, avec la transition de Blackwell vers Vera Rubin, suggère que la cadence d'innovation s'accélère et que les entreprises devront adapter leur infrastructure régulièrement pour rester compétitives.

UELe déploiement souverain de Gemini sur Google Distributed Cloud avec chiffrement des données en cours d'utilisation répond aux exigences RGPD des entreprises européennes traitant des données sensibles.

InfrastructureOpinion
1 source
Agents IA autonomes : les meilleurs outils à installer en local sur son PC
130Le Big Data 

Agents IA autonomes : les meilleurs outils à installer en local sur son PC

Les agents IA autonomes capables de s'exécuter directement sur un ordinateur personnel constituent une nouvelle génération d'outils radicalement différents des chatbots classiques. Contrairement à ces derniers, ils ne se contentent pas de répondre à des questions : ils planifient et exécutent des missions complexes de façon indépendante, en décomposant un objectif large en étapes logiques, en vérifiant leurs propres résultats et en ajustant leur stratégie en cas d'erreur. Sur le plan technique, ces systèmes s'appuient sur un modèle de langage (LLM) comme moteur de raisonnement, couplé à une mémoire de suivi et à des outils d'action concrets, lecture de fichiers, navigation web, exécution de code. Des frameworks comme LangChain, CrewAI ou AutoGen structurent ces opérations, tandis que des applications comme GPT4All (développée par Nomic AI) ou Ollama permettent de faire tourner localement des modèles comme Llama 3 ou Mistral. Le choix du modèle dépend directement du matériel disponible : un modèle de 7 milliards de paramètres quantifié (Q4/Q5) exige environ 8 Go de VRAM, quand la précision standard (fp16) double ce besoin, et les modèles de 13 à 34 milliards de paramètres requièrent au moins 24 Go. L'intérêt principal de cette exécution en local réside dans la souveraineté des données et l'indépendance opérationnelle. Les documents sensibles ne quittent jamais le disque dur, ce qui supprime les risques liés aux fuites de données sur des serveurs tiers. L'absence de connexion internet requise élimine également les pannes dépendant de services cloud, les frais d'API et les abonnements mensuels. Pour les professionnels manipulant des données confidentielles, données médicales, juridiques, financières, cette rupture avec le cloud représente un changement de paradigme concret. Les outils comme Lain Agent ciblent les utilisateurs non techniques sous Windows sans configuration avancée, tandis qu'AutoGen ou LangChain offrent aux développeurs une flexibilité totale pour connecter ces agents à des systèmes Git, des bases de données ou des pipelines d'automatisation. Ce mouvement vers l'IA locale s'inscrit dans une tendance plus large de démocratisation matérielle accélérée par la montée en puissance des GPU grand public et des puces NPU intégrées dans les processeurs modernes. Pendant des années, exécuter un LLM performant nécessitait une infrastructure serveur hors de portée du particulier. La quantification des modèles et l'optimisation des runtimes comme Ollama ont radicalement abaissé cette barrière. Les acteurs impliqués sont aussi bien des laboratoires de recherche open source (Meta avec Llama, Mistral AI) que des startups spécialisées dans l'outillage local (Nomic AI). La prochaine étape logique sera l'intégration native de ces agents dans les systèmes d'exploitation et les environnements de développement, rendant l'autonomie locale accessible sans aucune configuration technique préalable.

UEMistral AI (entreprise française) est citée comme acteur clé du mouvement open source local, et la souveraineté des données mise en avant répond directement aux contraintes RGPD pesant sur les entreprises européennes.

OutilsOutil
1 source
131Next INpact 

☕️ Mozilla drague les entreprises avec un client IA open source, Thunderbolt

MZLA, la filiale de Mozilla qui développe le client de messagerie Thunderbird depuis 2020, a annoncé le lancement de Thunderbolt, un client d'intelligence artificielle open source destiné aux entreprises. Disponible dès maintenant sur GitHub, Thunderbolt est conçu pour s'intégrer avec le framework open source Haystack et proposera des applications natives sur macOS, Windows, Linux, iOS et Android. Il se positionne comme un « client d'IA souverain » permettant le chat, la recherche, l'automatisation et les flux de travail multi-appareils via une interface auto-hébergée et extensible. L'outil est agnostique en matière de modèle de langage : il supporte Claude d'Anthropic, GPT d'OpenAI, Mistral et OpenRouter, via les protocoles MCP et ACP. MZLA précise toutefois qu'aucun point d'accès public pour l'inférence n'est encore fourni, et recommande l'usage d'Ollama ou llama.cpp pour une inférence locale gratuite. Thunderbolt répond à une demande croissante des équipes techniques en entreprise : disposer d'une interface unifiée pour accéder à leurs infrastructures IA internes, qu'elles soient hébergées localement ou chez un fournisseur cloud, sans dépendre d'un outil propriétaire. L'architecture pensée « local first » et la compatibilité avec les principaux fournisseurs de modèles en font une alternative crédible aux interfaces propriétaires comme Claude.ai ou ChatGPT Enterprise, avec l'avantage du contrôle total des données et de la personnalisation. Pour les DSI et les équipes soucieuses de souveraineté numérique, c'est un argument de poids. Mozilla s'inscrit ainsi dans une stratégie plus large de repositionnement autour de l'IA, après avoir déjà misé sur la transparence et l'ouverture avec des initiatives comme Mozilla.ai. En confiant ce projet à MZLA plutôt qu'à la fondation, l'organisation cherche à adresser directement le marché professionnel tout en restant fidèle à ses valeurs open source. Thunderbolt arrive dans un écosystème déjà animé par des outils comme Open WebUI ou AnythingLLM, mais bénéficie de la légitimité et de la communauté de développeurs que Mozilla a construites autour de Thunderbird depuis plus de vingt ans.

UEThunderbolt, avec son architecture 'local first' et son support de Mistral, répond directement aux enjeux de souveraineté numérique des DSI européens soumis au RGPD.

Neil Zeghidour (Gradium) : « Je gère les talents en IA comme des footballeurs »
132La Tribune 

Neil Zeghidour (Gradium) : « Je gère les talents en IA comme des footballeurs »

Neil Zeghidour, directeur général de Gradium, a pris la parole lors de la conférence Tech For Future pour exposer la vision de sa société, récemment implantée dans l'écosystème parisien de l'intelligence artificielle. Sa mission : constituer une équipe de recherche d'élite pour développer des modèles vocaux capables de rivaliser avec les grandes plateformes américaines. Pour attirer ces profils rares, il revendique une approche singulière, comparant la gestion de ses chercheurs en IA à celle de footballeurs professionnels, des talents à recruter, fidéliser et placer dans les meilleures conditions pour performer. L'enjeu derrière cette métaphore est concret : le marché des chercheurs spécialisés en IA est d'une compétition féroce, avec une poignée d'experts mondiaux se disputés par des géants comme Google, OpenAI ou Meta, capables d'offrir des compensations considérables. Gradium parie sur la voix comme vecteur de différenciation, un segment en croissance exponentielle porté par les assistants conversationnels, l'accessibilité et les interfaces multimodales. Construire des modèles vocaux performants en Europe représente un défi technique autant qu'économique, mais aussi une opportunité stratégique face à la dépendance actuelle aux infrastructures et modèles américains. La démarche de Gradium s'inscrit dans une dynamique plus large : celle de la souveraineté numérique européenne en matière d'IA. Zeghidour insiste sur la nécessité d'entraîner des modèles localement, sur des données et des infrastructures européennes, pour ne pas rester tributaires des choix des acteurs américains. Dans un contexte où la régulation européenne (AI Act) pousse les entreprises à davantage de transparence et de contrôle, des acteurs comme Gradium tentent de transformer cette contrainte en avantage compétitif.

UEGradium, startup française basée à Paris, développe des modèles vocaux sur infrastructures européennes pour réduire la dépendance aux plateformes américaines, s'appuyant sur l'AI Act comme levier de différenciation compétitive.

BusinessOpinion
1 source
L'enquête chinoise sur le rachat de Manus par Meta inquiète les startups
133The Information AI 

L'enquête chinoise sur le rachat de Manus par Meta inquiète les startups

Le gouvernement chinois a ouvert une enquête sur la vente de la startup d'agents IA Manus à Meta Platforms, provoquant une onde de choc dans l'écosystème des startups d'intelligence artificielle en Chine. Cette investigation, dont les détails précis restent flous, cible une transaction qui représentait pour de nombreux fondateurs un débouché naturel : être rachetés par un géant technologique américain. Hank Yuan, co-fondateur d'une nouvelle startup basée à Shenzhen qui développe un agent IA pour le marché mondial, résume le sentiment général : « Tous les fondateurs de startups IA que je connais suivent l'affaire Manus de très près. » L'impact est immédiat et concret. Plusieurs startups envisagent désormais de déplacer tout ou partie de leurs opérations vers Singapour, ou de quitter la Chine entièrement. Le choix du financement devient aussi une question stratégique brûlante : lever des fonds en yuan chinois ou en dollars américains implique désormais des conséquences géopolitiques directes sur la capacité à vendre à l'international ou à attirer des investisseurs américains. Comme le formule Yuan, les fondateurs doivent « réfléchir encore plus soigneusement aux marchés visés, à la structure juridique de leur entreprise et à la devise dans laquelle lever des fonds ». Les startups dont l'ambition se limite au marché chinois, financées par du capital-risque local ou asiatique, sont moins exposées à ces tensions. Cette affaire s'inscrit dans une rivalité technologique sino-américaine de plus en plus intense, où les acquisitions transfrontalières d'entreprises IA deviennent des enjeux de souveraineté nationale. Pékin surveille de près les transferts de technologie vers des entreprises américaines, notamment dans le domaine de l'IA agentique, considéré comme stratégique. Pour les fondateurs chinois qui cherchent une sortie vers les grands groupes de la Silicon Valley, la fenêtre se resserre. Singapour, hub neutre entre les deux blocs, s'impose comme la destination de repli privilégiée pour ceux qui veulent préserver à la fois un accès aux marchés occidentaux et une base opérationnelle en Asie.

UELes tensions géopolitiques sino-américaines autour des acquisitions d'IA pourraient inciter l'UE à renforcer sa propre surveillance des transferts technologiques transfrontaliers impliquant des startups chinoises.

BusinessOpinion
1 source
Bientôt la fin des patrouilles humaines ? Ce robot français fait des rondes tout seul
134Le Big Data 

Bientôt la fin des patrouilles humaines ? Ce robot français fait des rondes tout seul

Running Brains Robotics, une PME implantée à Mérignac en région bordelaise, s'impose progressivement sur le marché européen de la surveillance autonome avec ses robots patrouilleurs entièrement conçus en France. La société a développé deux modèles complémentaires : le GR100, déjà déployé sur plusieurs sites, et le GR200, conçu pour les environnements difficiles et le tout-terrain. Ces machines effectuent des rondes continues sur des sites sensibles, analysant portes, clôtures et mouvements suspects, lisant des plaques d'immatriculation, détectant des fuites et remontant les anomalies en temps réel vers un centre de supervision. Les robots alternent entre missions actives et recharge rapide, restant connectés en permanence même à l'arrêt. La société est déjà opérationnelle en France et en Italie, où elle a notamment décroché un déploiement au sein du groupe Leonardo, acteur majeur de l'aéronautique et de la défense européenne, pour surveiller des infrastructures sensibles. Ce type de système redéfinit l'organisation des équipes de sécurité sur site. Les robots prennent en charge les tâches répétitives de contrôle et de ronde, libérant les opérateurs humains pour se concentrer sur les interventions à plus forte valeur ajoutée, c'est-à-dire l'analyse et la décision finale. Les machines ne remplacent pas les forces de sécurité et n'interviennent pas directement en cas d'infraction : elles collectent et transmettent les données, les humains agissent. Pour les sites industriels, les ports, les aéroports ou les installations critiques, l'intérêt est double : une couverture 24h/24 sans fatigue ni absence, et une réduction des coûts opérationnels sur les missions à faible valeur ajoutée. Les déploiements en conditions réelles chez Leonardo valident l'efficacité opérationnelle de l'approche, un signal fort pour convaincre d'autres grands groupes industriels. Running Brains Robotics se distingue par une maîtrise intégrale de sa chaîne technologique, de la conception mécanique aux algorithmes de navigation et de détection, sans dépendance envers des fournisseurs extérieurs. Ce positionnement souverain prend une résonance particulière dans un contexte européen où la sécurité des infrastructures critiques est au coeur des préoccupations stratégiques. La robotique de surveillance est un marché en pleine expansion, avec des acteurs américains, asiatiques et israéliens déjà bien installés, et l'émergence d'une solution 100% française répond à des enjeux de souveraineté industrielle que les grandes entreprises et les gouvernements commencent à prendre en compte dans leurs appels d'offres. La montée en puissance annoncée d'ici 2028 suggère que la société compte accélérer son développement commercial en Europe, portée par des références industrielles crédibles et un positionnement technologique différenciant.

UEUne PME française propose une solution souveraine de surveillance autonome déjà déployée chez Leonardo pour protéger des infrastructures critiques européennes, répondant aux enjeux de souveraineté industrielle dans les appels d'offres publics et privés en France et en UE.

RobotiqueOpinion
1 source
135Le Big Data 

MyUnisoft : la protection des données au cœur du choix des logiciels comptables

Une enquête réalisée par OpinionWay pour le compte de MyUnisoft, éditeur français de logiciel comptable, révèle que 70 % des professionnels de l'expertise comptable utilisent désormais l'intelligence artificielle dans leur travail quotidien. Parmi eux, 70 % se tournent prioritairement vers ChatGPT, l'outil d'OpenAI, principalement pour la recherche d'informations expertes et le traitement de dossiers complexes. L'étude montre également que 83 % des décideurs du secteur placent la protection et la localisation des données au sommet de leurs critères de sélection d'un logiciel, devant le prix ou les fonctionnalités pures. L'ergonomie reste le critère numéro un pour 89 % des cabinets interrogés, tandis que 31 % des professionnels n'ont pas encore adopté l'IA, souvent par prudence ou par manque d'accompagnement. Grégoire Leclercq, dirigeant de MyUnisoft, souligne que cette transformation marque une prise de conscience collective des experts-comptables sur leur rôle de gardiens des données financières de leurs clients. Ces résultats traduisent un changement structurel dans la façon dont les cabinets d'expertise comptable évaluent leurs outils technologiques. La souveraineté des données n'est plus un argument marketing secondaire : c'est une barrière à l'entrée réelle. Les professionnels refusent désormais de dépendre de solutions dont l'hébergement serait soumis à des législations extra-européennes ou dont les flux de données resteraient opaques. Pour les éditeurs, cela signifie qu'un stockage local, certifié et transparent devient une condition non négociable pour rester dans la course. Parallèlement, l'usage massif de ChatGPT comme super-assistant documentaire confirme que l'IA ne remplace pas le comptable, mais comprime drastiquement le temps passé sur des tâches à faible valeur ajoutée, libérant de la bande passante pour le conseil. Le secteur de la comptabilité française entre dans une phase où l'automatisation des tâches basiques est considérée comme acquise, et où la compétition se déplace vers la capacité à transformer la donnée en aide à la décision stratégique. Les cabinets attendent de leurs éditeurs qu'ils franchissent un cap : passer du statut de fournisseur de logiciel fiable à celui de partenaire de performance. L'interopérabilité entre systèmes et la capacité à intégrer nativement des fonctionnalités d'IA, sans sacrifier l'ergonomie, deviennent les nouveaux axes de différenciation. MyUnisoft, qui se positionne explicitement sur la souveraineté numérique et l'hébergement français, publie cette étude dans un contexte de consolidation du marché des logiciels comptables, où les acteurs qui ne répondront pas à ces exigences risquent de perdre rapidement leur légitimité auprès d'une clientèle professionnelle de plus en plus avertie.

UELes cabinets d'expertise comptable français placent la souveraineté des données et l'hébergement local en tête de leurs critères de sélection logicielle, renforçant l'avantage concurrentiel des éditeurs français conformes au RGPD face aux solutions hébergées hors UE.

SociétéOutil
1 source
136Numerama 

On a testé le MacBook Pro M5 Pro avec 48 Go de RAM : la config parfaite pour de l’IA locale ?

Apple a lancé début 2025 son MacBook Pro équipé de la puce M5 Pro, disponible à partir de 3 199 euros dans sa configuration 48 Go de RAM unifée. La version haut de gamme, le M5 Max avec 128 Go de mémoire, monte jusqu'à 6 429 euros sans augmentation du stockage. Des journalistes tech ont soumis cette machine à des tests intensifs de LLM locaux, faisant tourner des modèles open source tels que Mistral, DeepSeek, les modèles Alibaba Qwen et plusieurs variantes Google Gemma directement sur le matériel, sans connexion cloud. Ce type de configuration intéresse de plus en plus les développeurs, chercheurs et professionnels qui veulent exécuter des modèles de langage en local pour des raisons de confidentialité, de latence ou de coût. La mémoire unifiée des puces Apple Silicon est une architecture particulièrement adaptée à ce cas d'usage : contrairement aux PC classiques où la RAM et la VRAM sont séparées, le CPU et le GPU partagent le même pool mémoire, ce qui permet de charger entièrement des modèles de 30 à 70 milliards de paramètres sans swap. Les résultats des tests montrent des vitesses d'inférence utilisables au quotidien, loin derrière un GPU NVIDIA haut de gamme mais suffisantes pour un workflow professionnel autonome. Cette tendance s'inscrit dans un mouvement plus large de démocratisation de l'IA locale, accéléré par la sortie de modèles open source performants et compacts. Des acteurs comme Mistral AI, DeepSeek ou Alibaba proposent désormais des versions quantisées de leurs modèles optimisées pour ce type de matériel. Face aux interrogations croissantes sur la souveraineté des données et la dépendance aux API cloud, le couple Apple Silicon + ollama ou LM Studio s'impose comme une alternative crédible pour les professionnels prêts à investir plusieurs milliers d'euros dans une machine autonome.

UELa tendance à l'IA locale répond aux préoccupations européennes de souveraineté des données, et Mistral AI figure parmi les modèles open source testés sur ce type de matériel.

💬 Le M5 Pro 48 Go, c'est le premier Mac où je me dis que l'IA locale est devenue praticable sans compromis majeur. Tu charges un modèle de 30 à 70 milliards de paramètres, ça tourne sur la même mémoire que le reste, pas de swap, pas de GPU externe à brancher. 3 200 euros de base, c'est cher, et la vitesse d'inférence reste loin d'un bon GPU NVIDIA, mais pour du travail autonome sur des données confidentielles, j'ai du mal à voir mieux dans ce format.

InfrastructureActu
1 source
137Le Big Data 

Nvidia vs Meta : qui contrôle vraiment l’IA en 2026 ?

En 2026, deux géants se livrent une bataille ouverte pour le contrôle de l'infrastructure de l'intelligence artificielle mondiale. D'un côté, Nvidia capte entre 80 et 90 % du marché des GPU pour centres de données, enchaînant les trimestres records grâce à une demande pour ses puces Blackwell qui dépasse toutes les prévisions. De l'autre, Meta, dirigé par Mark Zuckerberg, a décidé de rompre sa dépendance à ce fournisseur unique en annonçant jusqu'à 135 milliards de dollars d'investissements en capital pour 2026, dont un contrat historique de 6 gigawatts de puces AMD. Le marché mondial de l'IA générative devrait franchir 100 milliards de dollars d'ici fin 2026, porté par une adoption professionnelle massive : près de 80 % des entreprises prévoient d'intégrer des API d'IA ou de déployer des modèles personnalisés dans leurs processus. Les revenus issus des applications mobiles boostées à l'IA devraient doubler entre 2024 et 2026, avec une répartition géographique marquée : 37,3 milliards de dollars pour les États-Unis (+60 %), 14,7 milliards pour la Chine (+72 %), et une projection de 20 milliards pour la France à horizon 2030. L'enjeu dépasse la simple guerre commerciale entre deux entreprises. Ce que Meta cherche à construire, c'est une souveraineté technologique sur sa propre pile IA, de l'infrastructure physique jusqu'aux modèles. Tant que Nvidia reste le passage obligé pour tout acteur sérieux de l'IA, le géant de Menlo Park reste exposé à des pénuries, des hausses de prix et des délais de livraison qu'il ne contrôle pas. La diversification vers AMD n'est pas un choix technique anodin : c'est un signal politique adressé à toute l'industrie. En parallèle, les joueurs grand public risquent de subir les conséquences de cette course aux serveurs IA, Nvidia orientant clairement sa production vers les centres de données au détriment du segment gaming. La véritable forteresse de Nvidia ne réside pas dans ses puces mais dans son écosystème logiciel CUDA, standard industriel dominant depuis plus de quinze ans, que la concurrence peine à détrôner malgré des investissements considérables. L'architecture Rubin, attendue en succession des Blackwell, devrait creuser encore l'écart en termes de performances brutes. Meta n'est pas seul dans cette tentative de diversification : Google avec ses TPU, Amazon avec ses Trainium, et Microsoft via ses investissements dans OpenAI cherchent tous à réduire leur exposition à un seul fournisseur. La question qui structure désormais toute la filière est celle des infrastructures : les réseaux électriques, les capacités de refroidissement et les chaînes d'approvisionnement en semi-conducteurs peuvent-ils absorber une demande qui double tous les dix-huit mois ? C'est sur ce terrain physique, autant que logiciel, que se jouera la prochaine phase de la course à l'IA.

UELes entreprises européennes restent structurellement dépendantes de l'écosystème Nvidia/CUDA pour leurs projets IA, rendant leur accès à l'infrastructure coûteux et soumis aux arbitrages de production d'acteurs hors UE.

InfrastructureOpinion
1 source
138Le Big Data 

IA et généalogie : un assistant puissant, mais jamais le chef d’orchestre

François Lerebourg, PDG de CDIP et créateur du logiciel Généatique 2026, intègre l'intelligence artificielle au cœur de sa suite généalogique pour automatiser les tâches les plus fastidieuses : transcription paléographique de manuscrits anciens, traduction de documents en latin ou en allemand gothique, identification des métiers d'ancêtres, colorisation de photographies d'époque. Concrètement, l'utilisateur scanne un acte notarial ou un registre paroissial, et l'IA produit une première transcription en signalant les zones d'incertitude par une croix rouge dans le texte restitué. La colorisation de photos s'effectue à la demande, sans altération des pixels originaux, même si l'algorithme peut proposer une teinte de peau que l'utilisateur est libre de corriger. Les traitements passent par le cloud mais les données sont effacées après téléchargement, une architecture pensée pour protéger des informations personnelles sensibles. L'impact est considérable pour les millions d'amateurs de généalogie, souvent des retraités qui passaient jusqu'ici des dizaines d'heures à déchiffrer des écritures illisibles ou à trier des archives papier. Lerebourg parle d'une révolution comparable à l'arrivée du web il y a trente ans : la barrière technique qui décourageait les novices s'effondre, rendant la discipline accessible à un public beaucoup plus large. Le modèle revendiqué est celui du « compagnonnage numérique » plutôt que de l'automatisation totale : l'IA libère du temps pour ce qui a de la valeur, c'est-à-dire vérifier les sources, croiser les indices et construire un récit cohérent. La démocratisation de la généalogie passe ainsi par une redistribution du travail entre machine et humain, où la machine absorbe l'ingrat et l'humain conserve le jugement. Cette approche s'inscrit dans un moment charnière pour les logiciels patrimoniaux, confrontés à des outils d'IA générative dont les hallucinations et les confusions entre homonymes restent des risques réels. Lerebourg ne les minimise pas : des prompts soigneusement conçus et une sélection rigoureuse des modèles permettent de limiter les erreurs, mais la validation humaine reste non négociable. La question de la souveraineté des données personnelles est également centrale dans un secteur qui manipule des informations intimes, noms, dates, lieux de naissance, filiations, et où la confiance des utilisateurs est le premier actif. L'enjeu pour Généatique 2026 et ses concurrents est de montrer qu'une IA utile n'est pas une IA autonome, et que la valeur ajoutée tient précisément dans la capacité à savoir où s'arrêter.

UECDIP est une entreprise française et Généatique 2026 s'adresse directement aux généalogistes francophones, avec une architecture cloud effaçant les données après traitement, pensée pour répondre aux exigences du RGPD.

OutilsOutil
1 source
OpenClaw vs ChatGPT : quel agent IA local bat le roi du cloud ?
139Le Big Data 

OpenClaw vs ChatGPT : quel agent IA local bat le roi du cloud ?

En 2026, le débat entre agents IA locaux et solutions cloud a pris une nouvelle dimension avec l'émergence d'OpenClaw, un agent dit "skills-based" qui s'exécute directement sur la machine de l'utilisateur. Contrairement à ChatGPT Agent, le mode Operator d'OpenAI lancé dans le courant de l'année, OpenClaw accède au terminal, manipule les fichiers locaux, gère les dépôts Git et peut tourner en arrière-plan même session fermée, envoyant des notifications sur Discord à la fin d'une tâche. ChatGPT Agent fonctionne lui exclusivement dans le navigateur : l'IA clique, défile et remplit des formulaires à la place de l'utilisateur, mais s'arrête dès que l'onglet est fermé. Sur le plan tarifaire, OpenClaw revient à environ 10 à 30 dollars par mois selon la consommation d'API, contre 20 dollars fixes pour l'abonnement ChatGPT Plus incluant l'accès au mode Operator. La différence fondamentale entre les deux approches tient à la souveraineté des données et à la flexibilité technique. Avec OpenClaw, l'utilisateur choisit lui-même ses modèles, Claude 3.5 pour les raisonnements complexes, Llama 3 ou Kimi pour les tâches répétitives, afin d'optimiser ses coûts, tandis que ChatGPT impose l'écosystème OpenAI sans possibilité de substitution. La mémoire d'OpenClaw est persistante via des fichiers stockés sur disque ; celle de ChatGPT Agent est éphémère, réinitialisée à chaque session. Pour les professionnels qui valorisent l'intégration profonde dans leur environnement de travail, scripts actifs, assets locaux, automatisations conditionnelles, l'agent local représente un levier que le cloud ne peut pas reproduire. Nvidia a par ailleurs introduit NemoClaw, une couche de sécurité greffable sur OpenClaw pour encadrer les actions de l'agent et prévenir les comportements non désirés, comblant l'un des reproches traditionnels faits aux solutions locales. Ce duel s'inscrit dans un basculement plus large du marché de l'IA : on ne parle plus de simples chatbots, mais d'agents capables d'agir de manière autonome sur des systèmes réels. OpenAI a misé sur l'accessibilité maximale avec une interface sans friction, au prix d'un contrôle réduit pour l'utilisateur. OpenClaw, porté par une communauté technique exigeante, répond à un besoin croissant de confidentialité et d'autonomie, notamment dans les secteurs sensibles, finance, santé, défense, où héberger des données sur des serveurs tiers reste rédhibitoire. La vraie question pour 2026 n'est donc pas laquelle des deux IA est "plus intelligente", mais laquelle correspond au niveau de contrôle et de confiance que chaque utilisateur est prêt à exercer sur ses outils numériques.

UELa souveraineté des données mise en avant par OpenClaw répond aux exigences du RGPD et aux contraintes des secteurs réglementés en France et en UE (finance, santé, défense), où l'hébergement tiers reste problématique.

OutilsOutil
1 source
IA et quantique en zone nordique : un écosystème industriel mûr, ouvert aux innovations françaises
140FrenchWeb 

IA et quantique en zone nordique : un écosystème industriel mûr, ouvert aux innovations françaises

Les pays nordiques s'imposent comme un laboratoire avancé de l'IA et du quantique à l'échelle européenne. Un centre nordique dédié à l'intelligence artificielle vient d'être lancé, accompagné de financements ciblés sur la numérisation industrielle et l'adoption de l'IA dans les grands secteurs productifs. Les entreprises technologiques françaises sont explicitement citées parmi les acteurs bienvenus pour s'intégrer à cet écosystème en pleine structuration. L'enjeu dépasse la simple vitrine technologique : les grands comptes nordiques, industrie manufacturière, énergie, logistique, cherchent des solutions quantiques et d'IA "prêtes à intégrer", c'est-à-dire opérationnelles, documentées et compatibles avec leurs systèmes existants. Ce signal est fort pour les startups et ETI françaises spécialisées, qui peuvent y trouver des clients industriels solvables et des partenaires capables de valider leurs technologies en conditions réelles, bien avant une mise à l'échelle européenne. Cette dynamique s'inscrit dans un tournant stratégique européen autour de la souveraineté technologique, où les pays nordiques jouent un rôle moteur grâce à une culture industrielle forte, des États investisseurs et une densité de talents en ingénierie. La France, de son côté, dispose d'acteurs reconnus en calcul quantique, notamment via le Plan Quantique doté de 1,8 milliard d'euros depuis 2021, et en IA appliquée. La convergence entre l'offre française et la demande nordique représente une fenêtre d'internationalisation concrète, à condition d'adapter les solutions aux exigences d'intégration industrielle des acheteurs scandinaves.

UELe lancement d'un centre nordique dédié à l'IA ouvre une fenêtre concrète d'internationalisation pour les startups et ETI françaises spécialisées en IA et quantique, dans la continuité du Plan Quantique doté de 1,8 milliard d'euros.

BusinessOpinion
1 source
Onyx : une alternative à Claude, plus puissante, open-source et locale ?
141Le Big Data 

Onyx : une alternative à Claude, plus puissante, open-source et locale ?

Onyx est une plateforme d'intelligence artificielle open source qui a franchi le cap des 20 000 étoiles sur GitHub début avril 2026, attirant l'attention des équipes techniques à la recherche d'alternatives aux solutions propriétaires comme Claude d'Anthropic. Conçue pour s'installer en self-hosting via Docker, elle fonctionne comme une couche d'orchestration complète : elle se connecte à plus de 40 sources de données d'entreprise (stockage, messagerie, gestion de projet), indexe les contenus en continu et dialogue avec n'importe quel LLM, qu'il s'agisse de modèles cloud, d'API externes ou de modèles tournant entièrement en local. Sur les benchmarks de recherche approfondie, Onyx affiche des scores supérieurs à plusieurs solutions propriétaires, en combinant recherche sémantique, indexation permanente et exploration web intégrée pour produire des réponses contextualisées et traçables. L'enjeu concret est la souveraineté technologique des organisations. En permettant de choisir librement le modèle sous-jacent selon chaque usage et d'optimiser les coûts sans dépendre d'un fournisseur unique, Onyx élimine le risque de verrouillage propriétaire qui préoccupe de nombreux DSI et responsables de la sécurité informatique. Les réponses ne reposent plus sur des données d'entraînement génériques, mais sur les documents internes réels de l'entreprise, synchronisés en temps réel. Dans des environnements professionnels où chaque réponse doit être justifiable et auditable, cette traçabilité représente un avantage opérationnel direct. L'outil "Craft" intégré pousse la logique plus loin : il permet de générer non seulement des documents, mais aussi des tableaux de bord, des applications web et des visualisations à partir des données internes, dans des environnements isolés garantissant la confidentialité. Le lancement d'Onyx s'inscrit dans une dynamique plus large de professionnalisation de l'IA open source, portée par des projets comme LangChain, Ollama ou LlamaIndex, qui ont progressivement rendu accessibles des capacités jusqu'alors réservées aux grandes plateformes cloud. Face à la montée en puissance de Claude, GPT-4o et Gemini, une partie de l'écosystème technique cherche à construire des infrastructures IA qui restent sous contrôle de l'organisation. Onyx mise sur la dimension collaborative pour se différencier davantage : la plateforme gère des rôles, des accès granulaires et des agents automatisés configurables avec des règles précises, la rapprochant d'un système applicatif complet plutôt que d'un simple assistant conversationnel. La prochaine étape pour le projet sera de démontrer sa robustesse à l'échelle dans des environnements de production critiques, un terrain où les solutions propriétaires conservent encore une avance significative en matière de support et de garanties contractuelles.

UELes organisations européennes soucieuses de souveraineté numérique et de conformité RGPD peuvent déployer Onyx en self-hosting pour garder leurs données internes hors des clouds américains.

OutilsOutil
1 source
Microsoft étend son offre IA avec de nouveaux modèles vocaux et visuels
142AI Business 

Microsoft étend son offre IA avec de nouveaux modèles vocaux et visuels

Microsoft franchit une nouvelle étape dans le développement de ses propres modèles d'intelligence artificielle en annonçant des systèmes dédiés à la voix et à l'image, allant au-delà des grands modèles de langage textuels sur lesquels la firme de Redmond s'est largement appuyée jusqu'ici. Cette initiative marque une volonté affichée de maîtriser l'ensemble de la chaîne des capacités d'IA, plutôt que de sous-traiter ces briques à des partenaires externes. L'enjeu est considérable pour l'industrie : en développant ses propres modèles vocaux et visuels, Microsoft réduit sa dépendance vis-à-vis d'OpenAI, dont il est le principal investisseur et distributeur via Azure. Cela lui permettrait de proposer des solutions plus intégrées, moins coûteuses et plus personnalisables pour ses clients entreprises, tout en gardant la main sur la roadmap technologique de ses produits phares comme Copilot. Cette évolution s'inscrit dans une tendance plus large de verticalisation de l'IA au sein des grandes plateformes technologiques : Google, Apple et Amazon ont chacun suivi une trajectoire similaire. La relation entre Microsoft et OpenAI, longtemps présentée comme un partenariat exclusif, montre ainsi ses limites stratégiques à mesure que l'IA devient un avantage concurrentiel central. La course à la souveraineté sur les modèles fondamentaux ne fait que commencer.

UELes entreprises françaises et européennes utilisant Azure pourraient accéder à des modèles vocaux et visuels plus intégrés et compétitifs, réduisant leur dépendance indirecte à OpenAI.

OutilsOpinion
1 source
IBM publie Granite 4.0 3B Vision : un modèle de langage visuel pour l'extraction de données documentaires en entreprise
143MarkTechPost 

IBM publie Granite 4.0 3B Vision : un modèle de langage visuel pour l'extraction de données documentaires en entreprise

IBM a lancé Granite 4.0 3B Vision, un modèle de langage visuel (VLM) conçu spécifiquement pour l'extraction de données documentaires en entreprise. Contrairement aux grands modèles multimodaux monolithiques, ce modèle adopte une architecture modulaire : il se présente sous forme d'adaptateur LoRA d'environ 0,5 milliard de paramètres, conçu pour se greffer sur le modèle de base Granite 4.0 Micro (3,5 milliards de paramètres). Cette configuration permet un déploiement en « double mode » — le modèle texte fonctionne de manière autonome, et le composant visuel n'est activé qu'en cas de besoin. Pour traiter les images haute résolution, le modèle découpe les documents en tuiles de 384×384 pixels via l'encodeur visuel SigLIP2 de Google, tout en conservant une vue globale réduite de l'image. Les tokens visuels sont ensuite injectés dans le modèle de langage en 8 points d'ancrage distincts grâce à l'architecture DeepStack, assurant un alignement précis entre contenu sémantique et mise en page spatiale. En matière de performances, le modèle atteint 85,5 % de correspondance exacte en extraction de paires clé-valeur sur le benchmark VAREX (zéro-shot), et se classe troisième parmi les modèles de 2 à 4 milliards de paramètres sur ce leaderboard en mars 2026. L'enjeu principal de cette sortie est de permettre aux entreprises d'automatiser l'extraction structurée de données à partir de documents complexes — tableaux financiers, graphiques analytiques, formulaires — avec un modèle compact et déployable localement. Là où les grands modèles généralistes sacrifient la précision structurelle au profit de la polyvalence, Granite 4.0 3B Vision est entraîné spécifiquement sur la conversion de graphiques en CSV ou JSON, la reconnaissance de structures de tableaux en HTML, et l'extraction de paires clé-valeur. IBM a notamment utilisé ChartNet, un dataset multimodal à l'échelle du million d'exemples, ainsi qu'une pipeline d'entraînement « guidée par le code » qui aligne le code de génération d'un graphique, son rendu visuel et la table de données sous-jacente. Cette approche permet au modèle de comprendre la relation structurelle entre une représentation visuelle et sa source, plutôt que de simplement décrire une image. Ce lancement s'inscrit dans la stratégie d'IBM de positionner sa gamme Granite comme une alternative open-source et souveraine aux solutions propriétaires de Microsoft, Google ou Anthropic pour les usages entreprise. La tendance à l'architecture modulaire — un socle texte augmenté d'adaptateurs spécialisés — reflète une évolution plus large du secteur vers des modèles efficaces en ressources, déployables sur des infrastructures maîtrisées plutôt que dans le cloud public. Avec la prolifération des obligations réglementaires autour de la traçabilité des données (RGPD, AI Act européen), des modèles capables de traiter des documents sensibles en local représentent un avantage concurrentiel significatif. La prochaine étape pour IBM sera d'intégrer ce composant dans ses pipelines documentaires Watson et de le rendre accessible via watsonx, sa plateforme d'IA d'entreprise.

UELe déploiement local de Granite 4.0 3B Vision facilite la conformité RGPD et AI Act pour les entreprises européennes traitant des documents sensibles, en évitant tout transfert vers le cloud américain.

LLMsOpinion
1 source
Gemma 4 : intelligence multimodale de pointe sur appareil
144HuggingFace Blog 

Gemma 4 : intelligence multimodale de pointe sur appareil

Google DeepMind a lancé Gemma 4, sa nouvelle génération de modèles open source, disponible depuis début avril 2025. Cette famille comprend quatre variantes allant de 1 milliard à 27 milliards de paramètres, toutes capables de traiter texte et images simultanément. Les modèles sont disponibles sur Hugging Face, Google AI Studio et Kaggle, avec des licences permissives autorisant leur usage commercial. La particularité de Gemma 4 réside dans sa capacité multimodale optimisée pour les appareils locaux, depuis les smartphones jusqu'aux ordinateurs personnels, sans dépendance à un serveur distant. Le modèle 27B affiche des performances comparables à des systèmes bien plus volumineux sur les benchmarks de raisonnement et de vision, tandis que le 1B peut tourner directement sur mobile, ouvrant la voie à des applications IA entièrement hors ligne. Cette sortie s'inscrit dans la compétition ouverte qui oppose Google à Meta, Microsoft et Mistral sur le segment des modèles open source embarqués. Depuis Gemma 1 en février 2024, Google a accéléré le rythme de ses publications pour ne pas céder ce terrain stratégique à Llama. La course aux modèles multimodaux légers devient un enjeu central pour l'IA souveraine et les usages professionnels sans connectivité cloud.

UELes modèles embarqués sans dépendance cloud s'alignent avec les exigences d'IA souveraine portées par l'UE, facilitant des déploiements professionnels conformes au RGPD sans transfert de données vers des serveurs tiers.

LLMsOpinion
1 source
DeepL : 83 % des grandes entreprises accusent du retard sur l'IA linguistique
145AI News 

DeepL : 83 % des grandes entreprises accusent du retard sur l'IA linguistique

Selon un rapport publié le 10 mars 2026 par DeepL, intitulé « Borderless Business : Transforming Translation in the Age of AI », 83 % des grandes entreprises n'ont pas encore adopté les outils modernes d'intelligence artificielle pour leurs opérations multilingues. L'étude, menée auprès de dirigeants d'entreprise aux États-Unis, au Royaume-Uni, en France, en Allemagne et au Japon, révèle que 35 % des entreprises internationales traitent encore leurs traductions entièrement manuellement, et 33 % supplémentaires s'appuient sur une automatisation classique avec révision humaine systématique. Seulement 17 % ont déployé des outils de nouvelle génération — grands modèles de langage ou IA agentique — pour leurs flux de travail linguistiques. Parallèlement, le volume de contenu d'entreprise a bondi de 50 % depuis 2023, mais 68 % des sociétés fonctionnent toujours avec des processus conçus pour une autre époque. DeepL compte aujourd'hui plus de 200 000 clients professionnels dans 228 marchés, dont 2 000 qui déploient déjà des agents IA pour l'analyse de rapports, le ciblage commercial et la revue de documents juridiques. Ce retard n'est pas anodin : la traduction et les opérations multilingues touchent des fonctions critiques de l'entreprise. D'après le rapport, l'expansion internationale constitue le premier moteur d'investissement dans l'IA linguistique (33 % des cas), devant les ventes et le marketing (26 %), le support client (23 %) et le juridico-financier (22 %). Une étude complémentaire de décembre 2025, conduite auprès de 5 000 cadres dirigeants, révèle que 54 % des dirigeants mondiaux estiment que la traduction vocale en temps réel sera indispensable en 2026, contre 32 % aujourd'hui — avec des écarts notables entre pays : 48 % au Royaume-Uni, 33 % en France, seulement 11 % au Japon. Pour Jarek Kutylowski, PDG et fondateur de DeepL : « L'IA est partout, mais l'efficacité ne l'est pas. La plupart des entreprises ont déployé l'IA sous une forme ou une autre, mais peu atteignent une vraie productivité à l'échelle, parce que les workflows centraux restent conçus autour des personnes, pas des systèmes. » DeepL se distingue de ses concurrents généralistes sur un point stratégique : la souveraineté des données. Dans les secteurs réglementés — finance, santé, droit, administration publique — la conformité est devenue un critère de sélection de premier ordre. L'entreprise est certifiée ISO 27001, SOC 2 Type 2 et RGPD, et propose un chiffrement « Bring Your Own Key » permettant aux clients de révoquer l'accès à leurs données en quelques secondes, y compris pour DeepL lui-même. Cette garantie lui ouvre des portes que les grands fournisseurs de LLM peinent à franchir. En 2026, la société accélère sur l'IA agentique avec DeepL Agent, et son CTO Sebastian Enderlein résume l'ambition : « 2026 sera l'année où l'IA arrête d'expérimenter et commence à exécuter, à une échelle que nous n'avons pas encore vue. »

UEL'étude couvre explicitement la France et l'Allemagne, et la conformité RGPD mise en avant par DeepL répond à une exigence réglementaire européenne directe pour les entreprises traitant des données multilingues sensibles.

OutilsOutil
1 source
Liquid AI publie LFM2.5-350M : un modèle compact de 350 millions de paramètres entraîné sur 28 000 milliards de tokens avec apprentissage par renforcement
146MarkTechPost 

Liquid AI publie LFM2.5-350M : un modèle compact de 350 millions de paramètres entraîné sur 28 000 milliards de tokens avec apprentissage par renforcement

Liquid AI a publié LFM2.5-350M, un modèle de langage de 350 millions de paramètres entraîné sur 28 000 milliards de tokens — soit un ratio tokens/paramètres de 80 000 pour 1, un record dans cette catégorie de taille. Contrairement aux architectures Transformer classiques, ce modèle repose sur une structure hybride appelée LIV (Linear Input-Varying Systems) : 10 blocs de convolution LIV à double gating et 6 blocs d'attention GQA (Grouped Query Attention). Cette combinaison permet de gérer une fenêtre de contexte de 32 768 tokens tout en maintenant une empreinte mémoire extrêmement réduite — 169 Mo sur un Snapdragon 8 Elite, 81 Mo sur GPU Snapdragon, et 300 Mo sur Raspberry Pi 5. Sur GPU NVIDIA H100, le modèle atteint 40 400 tokens générés par seconde en forte concurrence. Aux benchmarks, il affiche 76,96 sur IFEval (suivi d'instructions), 30,64 sur GPQA Diamond et 20,01 sur MMLU-Pro. Ce modèle s'adresse directement au marché de l'IA embarquée : appareils mobiles, systèmes edge, IoT, environnements à ressources contraintes. Sa capacité à tourner en moins de 300 Mo de RAM le rend déployable sans cloud, sans GPU serveur, directement sur l'appareil de l'utilisateur final. Pour les développeurs qui construisent des agents autonomes, des pipelines d'extraction de données structurées (JSON, appels de fonctions) ou des systèmes de traitement d'instructions complexes, le LFM2.5-350M offre une vitesse d'inférence difficile à atteindre avec des modèles deux fois plus grands. En revanche, Liquid AI est explicite : ce modèle n'est pas recommandé pour les mathématiques avancées, le code complexe ou l'écriture créative — domaines où la densité de paramètres reste déterminante. Liquid AI, startup fondée par des chercheurs du MIT spécialisés dans les réseaux neuronaux liquides, s'inscrit dans un courant croissant qui remet en question le dogme du « toujours plus grand ». Alors que les grands acteurs — OpenAI, Google, Anthropic — continuent de pousser des modèles frontier aux milliards de paramètres, une contre-tendance émerge autour de la densité d'intelligence : faire mieux avec moins, en optimisant radicalement le ratio données/paramètres et l'architecture elle-même. L'abandon partiel du mécanisme d'attention au profit de systèmes LIV réduit le problème du cache KV qui pénalise les Transformers sur les longues séquences. Cette approche ouvre la voie à une IA véritablement locale, souveraine et déployable sans dépendance à l'infrastructure cloud — un enjeu stratégique croissant dans un contexte de régulation des données et de souveraineté numérique.

UELa capacité du modèle à fonctionner sans infrastructure cloud s'aligne avec les enjeux de souveraineté numérique et de conformité RGPD en Europe, où le traitement local des données réduit la dépendance aux serveurs américains.

LLMsOpinion
1 source
Le passage à la personnalisation des modèles d'IA est une nécessité architecturale
147MIT Technology Review 

Le passage à la personnalisation des modèles d'IA est une nécessité architecturale

Les grands modèles de langage (LLM) généralistes ont connu leur âge d'or : des bonds de performance spectaculaires à chaque nouvelle version. Cette ère touche à sa fin. Les progrès s'accumulent désormais de façon incrémentale sur les benchmarks généraux, tandis qu'une exception subsiste — l'intelligence de domaine. Mistral AI, la startup française spécialisée en IA, documente plusieurs déploiements concrets de modèles sur mesure : un fabricant d'équipements réseau a entraîné un modèle sur ses propres langages et bases de code propriétaires, obtenant une maîtrise que les modèles standards ne pouvaient atteindre ; un grand constructeur automobile a automatisé l'analyse comparative entre simulations numériques et tests physiques de crash, réduisant à quelques minutes ce qui mobilisait autrefois des journées entières de travail spécialisé ; enfin, une agence gouvernementale en Asie du Sud-Est a commandité un modèle fondation calibré sur les langues régionales et les contextes culturels locaux pour créer une infrastructure d'IA souveraine, indépendante des modèles occidentaux. L'enjeu central est la création d'un avantage concurrentiel durable. Lorsqu'un modèle est entraîné sur les données propriétaires d'une organisation — ses processus internes, sa terminologie métier, son historique décisionnel —, il encode la logique de l'entreprise directement dans ses poids. Cela va bien au-delà du fine-tuning classique : c'est l'institutionnalisation de l'expertise dans un système automatisé. Pour l'industrie automobile, cela signifie un copilote capable de proposer des ajustements de conception en temps réel. Pour le secteur public, c'est la garantie que des données sensibles restent sous gouvernance nationale tout en alimentant des services citoyens efficaces. La customisation transforme l'IA d'outil générique en actif stratégique différenciant. Ce changement de paradigme intervient alors que les organisations réalisent les limites des approches expérimentales menées en silos. Les pilotes isolés produisent des pipelines fragiles, une gouvernance improvisée et une portabilité réduite. La vraie rupture exige de traiter l'IA comme une infrastructure d'entreprise — au même titre qu'une base de données ou un système ERP — et non comme un projet ponctuel. Mistral AI se positionne comme partenaire de cette transition en intégrant l'expertise métier dans ses écosystèmes d'entraînement. La course à la personnalisation redéfinit les rapports de force : les entreprises capables d'encoder leur savoir institutionnel dans un modèle construisent une barrière à l'entrée que les acteurs généralistes ne peuvent pas répliquer, car ce fossé se creuse à mesure que le modèle apprend et s'affine avec les données nouvelles de l'organisation.

UEMistral AI, startup française de référence, se positionne comme partenaire stratégique pour les entreprises et institutions européennes souhaitant développer des modèles sur mesure garantissant la souveraineté de leurs données.

LLMsActu
1 source
Le chatbot de DeepSeek tombe en panne pendant plus de 10 heures
148The Information AI 

Le chatbot de DeepSeek tombe en panne pendant plus de 10 heures

Le chatbot de DeepSeek a subi une panne majeure de plus de dix heures dans la nuit de dimanche à lundi, rendant inaccessibles à la fois le site web et l'application mobile de la startup chinoise. Il s'agit de l'interruption de service la plus longue enregistrée depuis que le modèle phare de l'entreprise avait connu un succès viral début 2025. Le service a été rétabli lundi matin, sans que DeepSeek n'ait fourni d'explication publique sur les causes de l'incident. Une panne de cette durée sur un service d'IA aussi fréquenté soulève des questions sérieuses sur la fiabilité de l'infrastructure de DeepSeek. Pour les millions d'utilisateurs qui dépendent du chatbot comme outil de travail quotidien, dix heures d'indisponibilité représentent une interruption significative. L'absence de communication officielle aggrave la situation : les entreprises et développeurs intégrant DeepSeek dans leurs flux de travail se retrouvent sans visibilité sur les risques opérationnels. DeepSeek s'était imposé comme un concurrent inattendu face à OpenAI et Google début 2025, en proposant des performances comparables à des coûts bien inférieurs, ce qui avait provoqué un choc boursier aux États-Unis. Mais la montée en charge rapide d'un service qui n'avait pas été conçu pour une adoption mondiale de masse expose désormais ses faiblesses infrastructurelles. Cette panne survient alors que la fiabilité et la souveraineté des outils d'IA font l'objet d'un examen croissant, notamment en Europe où la provenance chinoise de DeepSeek alimente des débats sur la dépendance technologique.

UELa panne relance le débat en Europe sur la dépendance aux outils d'IA d'origine chinoise et les risques pour la souveraineté technologique.

💬 10 heures, aucune explication, aucun post-mortem. C'est ça qui me pose problème, pas la panne en elle-même (tout tombe, même OpenAI). Quand tu intègres un service dans ton workflow sans avoir aucune visibilité sur ce qui s'est passé, tu travailles à l'aveugle. Bon, c'est le signal pour tous ceux qui hésitaient encore sur la question souveraineté.

InfrastructureOpinion
1 source
« Risque de sécurité réel » : les États-Unis sur le point d’interdire les robots humanoïdes chinois ?
149Numerama 

« Risque de sécurité réel » : les États-Unis sur le point d’interdire les robots humanoïdes chinois ?

Le 26 mars 2026, deux sénateurs américains ont déposé un projet de loi visant à interdire l'utilisation de robots humanoïdes fabriqués en Chine par les agences fédérales américaines. Le texte, dont les détails précis n'ont pas encore été rendus publics, cible explicitement les équipements robotiques d'origine chinoise déployés dans des environnements gouvernementaux sensibles. L'enjeu dépasse la simple question commerciale : les législateurs craignent que ces robots, équipés de capteurs, caméras et microphones, ne constituent des vecteurs potentiels de collecte de renseignements au profit de Pékin. Un robot humanoïde opérant dans un bâtiment fédéral aurait théoriquement accès à des conversations, des documents et des flux vidéo — une surface d'attaque comparable à celle des équipements réseau Huawei, déjà bannis aux États-Unis depuis 2019. Cette initiative s'inscrit dans une rivalité technologique sino-américaine qui s'intensifie dans le domaine de la robotique. Des entreprises chinoises comme Unitree ou Fourier Intelligence gagnent rapidement du terrain sur le marché mondial, inquiétant Washington qui cherche à protéger ses infrastructures critiques. Si le projet est adopté, il pourrait ouvrir la voie à des restrictions similaires chez les alliés américains, et accélérer les appels à une production robotique souveraine en Occident.

UESi le projet de loi est adopté, il pourrait pousser les alliés américains à adopter des restrictions similaires et accélérer les appels à une production robotique souveraine en Europe.

RégulationReglementation
1 source
« La Silicon Valley a compris avant tout le monde que la guerre du futur serait une guerre logicielle »
150Le Monde Pixels 

« La Silicon Valley a compris avant tout le monde que la guerre du futur serait une guerre logicielle »

Georges Nahon, ancien directeur général d'Orange Labs, publie dans Le Monde une tribune dans laquelle il interroge la nécessité d'une nationalisation partielle, voire totale, des grandes entreprises d'intelligence artificielle générative. Face à la montée en puissance de l'IA dans les stratégies militaires mondiales, il soulève une question que peu d'acteurs institutionnels osent encore poser publiquement : peut-on laisser des technologies aussi décisives entre des mains entièrement privées ? L'enjeu est considérable. Si la guerre du futur est avant tout une guerre logicielle — comme le titre de la tribune l'affirme —, alors les entreprises qui maîtrisent les modèles de langage les plus avancés détiennent un avantage stratégique comparable à celui que représentaient autrefois l'armement nucléaire ou le contrôle des ressources énergétiques. Laisser cette puissance aux seules mains d'acteurs privés, non élus et peu régulés, pose des questions démocratiques et sécuritaires fondamentales. La Silicon Valley a, selon Nahon, anticipé bien avant les États cette convergence entre IA civile et militaire. Des contrats comme ceux de Palantir, Microsoft ou Google avec l'armée américaine illustrent ce mouvement. En Europe, la question de la souveraineté numérique resurgit avec une acuité nouvelle, alors que ni la France ni l'Union européenne ne disposent de champions comparables capables de peser dans cette nouvelle course aux armements algorithmiques.

UELa tribune soulève directement la question de la souveraineté numérique française et européenne, pointant l'absence de champions IA capables de peser dans la nouvelle course aux armements algorithmiques face aux acteurs américains.

RégulationReglementation
1 source