InfrastructureMIT Technology Review · 16 avr. 2026, 16:00· 2 min de lecture

Déployer l'IA dans les environnements contraints du secteur public

Les institutions publiques du monde entier subissent une pression croissante pour adopter l'intelligence artificielle, mais leur contexte opérationnel diffère radicalement de celui du secteur privé. Une étude de Capgemini révèle que 79 % des dirigeants du secteur public s'inquiètent de la sécurité des données liées à l'IA, une préoccupation justifiée au regard de la sensibilité des informations gouvernementales et des obligations légales qui les entourent. Han Xiao, vice-président de l'IA chez Elastic, résume la situation : les agences gouvernementales doivent strictement contrôler les données qu'elles envoient sur le réseau, ce qui impose de nombreuses contraintes sur leur approche de l'IA. Une enquête d'Elastic auprès de décideurs publics révèle par ailleurs que 65 % d'entre eux peinent à exploiter leurs données en continu, en temps réel et à grande échelle.

Là où le secteur privé présuppose une connectivité permanente au cloud, une infrastructure centralisée et une liberté de mouvement des données, les administrations publiques ne peuvent accepter ces conditions. Elles doivent garantir que leurs données restent sous leur contrôle, que les informations peuvent être vérifiées, et que la continuité des opérations est assurée, y compris dans des environnements où la connexion internet est limitée ou inexistante. S'ajoute à cela un autre obstacle matériel : les administrations achètent rarement des GPU, ces processeurs graphiques indispensables pour faire tourner les grands modèles d'IA, faute d'habitude de gérer ce type d'infrastructure. Ces contraintes cumulées expliquent pourquoi de nombreux projets pilotes d'IA dans le secteur public ne franchissent jamais le stade de l'expérimentation.

Face à ces limites, les petits modèles de langage, ou SLM (Small Language Models), apparaissent comme une solution adaptée. Contrairement aux grands modèles comme GPT-4 qui mobilisent des centaines de milliards de paramètres, les SLM n'en utilisent que quelques milliards, ce qui les rend bien moins gourmands en ressources de calcul et permet de les héberger localement, sans dépendance au cloud. Des études empiriques montrent que leurs performances sont comparables, voire supérieures à celles des LLM sur des tâches spécialisées. Les données restent stockées en dehors du modèle et ne sont consultées qu'au moment des requêtes, grâce à des techniques comme la recherche vectorielle et l'ancrage sur des sources vérifiables. Des entreprises comme Elastic positionnent ces approches comme la voie réaliste vers une IA véritablement opérationnelle dans les administrations, à l'heure où la pression politique en faveur de la modernisation numérique ne cesse de s'intensifier.

Impact France/UE

Les administrations françaises et européennes, contraintes par le RGPD et les exigences de souveraineté des données, trouvent dans les SLM déployables en local une voie concrète pour dépasser le stade pilote et accélérer leur modernisation numérique sans dépendance au cloud.

Dans nos dossiers

Gemini

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1NVIDIA AI Blog

Modèles ouverts, environnements fermés : Palantir déploie une IA sécurisée dans les agences US avec NVIDIA Nemotron

Palantir a annoncé un nouveau moteur d'intelligence artificielle intégrant les modèles ouverts NVIDIA Nemotron, destiné aux agences fédérales américaines opérant dans des environnements dits "air-gapped", des infrastructures totalement isolées de tout réseau non sécurisé. Concrètement, les agences gouvernementales pourront déployer des modèles Nemotron personnalisés sur leur propre infrastructure, les entraîner sur leurs propres données et conserver la pleine propriété des modèles résultants, y compris des poids qui encodent leur connaissance opérationnelle. Le système repose sur le Sovereign AI Operating System de Palantir, une pile logicielle construite sur ses produits AIP, Ontology, Foundry et Apollo, qui gère les autorisations d'accès aux données et l'isolation architecturale. Les déploiements à grande échelle pourront s'appuyer sur la suite logicielle NVIDIA AI Enterprise. L'enjeu est considérable : le gouvernement fédéral américain emploie environ 3 millions de fonctionnaires civils et opère dans des domaines aussi variés que le commerce, la santé, l'agriculture, l'énergie, l'éducation et les transports, ce qui en fait l'une des plus grandes "entreprises" du monde. L'IA peut y rationaliser des opérations d'une complexité extrême, de la sécurité alimentaire à la gestion des infrastructures routières. Ce partenariat permet aux agences d'entrer dans une logique de "data flywheel" : les modèles s'améliorent en continu grâce aux nouvelles données et aux retours d'usage, sans que ces informations ne quittent jamais le périmètre de contrôle de l'agence. La transparence des modèles ouverts offre par ailleurs une auditabilité totale, permettant aux chercheurs indépendants d'identifier vulnérabilités, biais ou comportements inattendus, un prérequis non négociable en contexte de sécurité nationale. Cette annonce s'inscrit dans une tendance plus large qui voit les modèles ouverts s'imposer comme une alternative crédible aux systèmes propriétaires pour les institutions sensibles. L'histoire de l'open source américain, du noyau UNIX en 1969 au Linux Kernel en 1991, de GitHub à Docker, montre que la mise en commun du code a historiquement renforcé la compétitivité technologique des États-Unis. Aujourd'hui, NVIDIA pousse cette logique dans le domaine des grands modèles de langage avec Nemotron, tandis que Palantir apporte son expertise en gouvernance des données souveraines. La combinaison des deux répond à une demande croissante des États et des grandes entreprises qui veulent accéder aux capacités de l'IA frontier sans sacrifier le contrôle sur leurs données stratégiques ni dépendre d'un fournisseur cloud extérieur.

UELa démonstration qu'un déploiement IA souverain en environnement air-gapped est techniquement viable pourrait accélérer les réflexions européennes sur des architectures similaires pour les institutions publiques et défense de l'UE.

InfrastructureActu

1 source

2NVIDIA AI Blog

Comment les nations déploient l'IA pour leurs priorités stratégiques

Les nations du monde entier accélèrent leurs investissements dans des infrastructures d'intelligence artificielle souveraines, selon une analyse publiée par NVIDIA. L'essor de l'IA générative et agentique a créé une nouvelle catégorie d'infrastructure essentielle baptisée "AI factories" (usines à IA), des centres de données de nouvelle génération conçus pour transformer les données brutes en intelligence exploitable, grâce à des plateformes de calcul accéléré à grande échelle. Jensen Huang, fondateur et directeur général de NVIDIA, a qualifié ces infrastructures de "socle des économies modernes à travers le monde" lors d'un échange avec des médias. Les gouvernements adoptent différents modèles pour bâtir cette capacité de calcul domestique : certains passent par des opérateurs télécoms ou énergétiques publics pour exploiter des clouds IA, d'autres soutiennent des partenaires cloud locaux offrant des plateformes de calcul mutualisées entre secteurs public et privé. Cette course à la souveraineté numérique répond à un enjeu stratégique majeur : garantir que les modèles d'IA reflètent les dialectes régionaux, le contexte culturel et les besoins spécifiques de chaque pays, plutôt que de dépendre entièrement de technologies étrangères. Les grands modèles de langage entraînés localement ne servent plus seulement à comprendre et générer du texte, mais aussi à écrire du code, accélérer la découverte de médicaments, protéger les consommateurs contre la fraude financière ou encore enseigner des compétences physiques à des robots. Certains modèles vocaux contribuent même à préserver et revitaliser des langues autochtones menacées. Pour les États, disposer de capacités d'IA domestiques devient également crucial pour renforcer leur résilience face au changement climatique, améliorer l'efficacité énergétique et se défendre contre les cybermenaces, autant de domaines où l'informatique accélérée s'impose désormais comme un outil incontournable. NVIDIA identifie cinq piliers d'une stratégie nationale d'IA réussie : un impératif politique reconnaissant l'IA comme facteur de croissance économique, de sécurité nationale et de préservation culturelle ; une main-d'œuvre formée aux compétences IA, de l'enseignement scientifique de base jusqu'aux applications sectorielles avancées ; des modèles et données localisés, entraînés et hébergés sur des infrastructures nationales soumises aux seules lois locales ; un écosystème local rassemblant investisseurs, développeurs, chercheurs, entrepreneurs et administrations ; et enfin les fameuses AI factories, détenues et gouvernées localement pour l'entraînement et l'inférence des modèles. Ces partenariats public-privé sont présentés comme la clé permettant aux infrastructures de suivre le rythme de l'innovation. Plusieurs pays ont déjà engagé des programmes nationaux dans cette direction, illustrant une tendance de fond où la maîtrise technologique devient un enjeu de souveraineté au même titre que l'énergie ou les télécommunications.

UELe sujet fait echo aux efforts europeens de souverainete numerique et de clouds souverains, mais l'article ne cite aucune entite ou reglementation francaise ou europeenne precise.

💬 Le rapport vient de NVIDIA, donc forcément les cinq piliers de la souveraineté IA passent tous par des GPU NVIDIA, quelle surprise. Sur le fond ils n'ont pas tort : un pays qui n'a pas ses propres modèles dépend de boîtes américaines pour comprendre ses propres citoyens, et ça va peser le jour où Washington change les règles d'export. Mais faut appeler les choses par leur nom, la souveraineté numérique telle que NVIDIA la vend, c'est une souveraineté qui achète quand même tout son matériel au même fournisseur.

InfrastructureActu

1 source

3VentureBeat AI

Definity intègre des agents dans les pipelines Spark pour détecter les erreurs en amont des systèmes d'IA autonomes

Definity, une startup spécialisée dans la fiabilité des pipelines de données, basée à Chicago, a annoncé mercredi une levée de fonds de 12 millions de dollars en série A, menée par GreatPoint Ventures avec la participation de Dynatrace, StageOne Ventures et Hyde Park Venture Partners. La société a développé une approche radicalement différente de la surveillance des pipelines : plutôt que d'analyser ce qui s'est passé après l'exécution d'un job, elle intègre un agent directement à l'intérieur du moteur Spark ou DBT, pendant que le pipeline tourne. Concrètement, un agent JVM s'installe en une seule ligne de code sous la couche plateforme, capturant en temps réel le comportement des requêtes, la pression mémoire, le déséquilibre des données et les patterns de shuffle. L'agent peut alors intervenir activement : réallouer des ressources à mi-parcours, stopper un job avant que des données corrompues ne se propagent, ou bloquer un pipeline en aval si la table d'entrée en amont est périmée. Un client entreprise a identifié 33 % de ses opportunités d'optimisation dès la première semaine de déploiement, réduit de 70 % l'effort de débogage, et résout désormais les problèmes Spark complexes jusqu'à dix fois plus vite. L'enjeu va bien au-delà de l'efficacité opérationnelle : avec l'essor des systèmes d'IA agentiques, la fiabilité des données en entrée devient critique. Un pipeline qui échoue silencieusement ou livre des données obsolètes ne casse plus seulement un tableau de bord, il compromet l'ensemble du système d'IA qui en dépend. La distinction est fondamentale : la détection et la prévention sont en temps réel, tandis que l'analyse des causes profondes et les recommandations d'optimisation s'effectuent à la demande, avec tout le contexte d'exécution déjà assemblé. L'agent n'ajoute qu'environ une seconde de calcul sur un job d'une heure. Seules les métadonnées transitent à l'extérieur, et un déploiement entièrement on-premises est disponible pour les environnements sensibles. Les outils existants, qu'il s'agisse de Datadog (qui a racheté Metaplane l'an dernier), des system tables Databricks, ou de plateformes comme Unravel Data et Acceldata, lisent tous les métriques une fois le job terminé. Comme le résume Roy Daniel, CEO et co-fondateur de Definity : « Le moment où vous apprenez qu'un problème s'est produit, il s'est déjà produit. » Le marché de l'observabilité des données est en pleine structuration, porté par la multiplication des pipelines complexes et l'exigence croissante des systèmes d'IA en production. Nexxen, plateforme adtech opérant de large pipelines Spark pour la publicité en temps réel, fait partie des premiers clients en production. La participation de Dynatrace au tour de table est notable : l'entreprise, spécialiste de l'observabilité IT, investit ainsi dans une approche concurrente à ses propres capacités de monitoring, signe que la niche de l'exécution inline commence à être prise au sérieux.

UEDynatrace, éditeur autrichien d'observabilité IT coté en bourse, participe au tour de table de Definity, signalant l'intérêt croissant des acteurs européens pour la surveillance inline des pipelines de données critiques aux systèmes d'IA en production.

InfrastructureActu

1 source

4NVIDIA AI Blog

NVIDIA et ses partenaires transforment la publicité et le marketing avec l'IA à Cannes Lions

Au festival Cannes Lions, qui se tient du 22 au 26 juin en France, plusieurs entreprises partenaires de NVIDIA présentent leurs solutions d'intelligence artificielle pour transformer la publicité et le marketing à grande échelle. Parmi elles : Alembic, Amazon Web Services (AWS), Criteo, Higgsfield, KERV.ai et Taboola. Alembic, spécialisée dans l'IA causale, sera la première entreprise du secteur à utiliser les systèmes NVIDIA DGX Vera Rubin SuperPODs pour modéliser les véritables moteurs de croissance marketing, non plus de simples corrélations, mais des relations de causalité réelles entre canaux, marchés et audiences. Criteo, qui gère l'un des plus grands réseaux de recommandation publicitaire au monde, a quant à elle atteint une accélération d'environ deux fois plus rapide dans l'entraînement de ses modèles grâce aux GPU NVIDIA Blackwell et à la bibliothèque open source cuEmbed, libérant ainsi près de 17 000 heures de GPU par an. AWS propose de son côté une pile d'infrastructure clé en main pour les acteurs de l'adtech, permettant de faire tourner des modèles d'IA directement dans les fenêtres d'enchères en temps réel via NVIDIA Triton Inference Server. Taboola utilise ces mêmes GPU pour alimenter DeeperDive, son moteur de réponses conversationnelles. Ces annonces illustrent un basculement profond dans l'industrie publicitaire : là où le numérique avait apporté la vitesse, l'IA apporte désormais l'autonomie opérationnelle. Pour les régies et plateformes publicitaires, l'enjeu n'est plus de savoir si elles adopteront l'IA, mais si leur infrastructure pourra suivre le rythme. La capacité à enchérir, recommander et optimiser en quelques millisecondes sur des milliards de transactions quotidiennes nécessite une puissance de calcul que seuls les GPU spécialisés peuvent fournir aujourd'hui. Pour Criteo, gagner 17 000 heures GPU par an, c'est concrètement réduire les coûts de calcul tout en améliorant la pertinence des recommandations produit pour des centaines de millions d'acheteurs. Pour les annonceurs utilisant AWS, passer de règles manuelles à des modèles d'IA pour l'optimisation des prix d'enchère représente un avantage concurrentiel direct sur les marchés programmatiques. Cette convergence entre NVIDIA et l'écosystème publicitaire s'inscrit dans une dynamique plus large d'industrialisation de l'IA à l'échelle des entreprises. NVIDIA, dont les GPU dominent le marché de l'entraînement des modèles d'IA, cherche désormais à s'imposer aussi dans l'inférence à la milliseconde, le moment où l'IA doit prendre une décision en production. Cannes Lions, rendez-vous annuel de l'industrie créative et publicitaire mondiale, devient ainsi une vitrine technologique où les fournisseurs d'infrastructure rivalisent pour convaincre les grandes marques et agences que l'IA agentique, des systèmes capables de planifier, exécuter et optimiser des campagnes de manière autonome, est désormais prête pour le déploiement en entreprise.

UECriteo, acteur français majeur de l'adtech, économise 17 000 heures GPU par an grâce aux puces NVIDIA Blackwell, renforçant directement sa compétitivité sur les marchés programmatiques européens.

💬 Le festival le plus glamour de la pub qui se transforme en vitrine GPU, ça dit quelque chose sur où en est vraiment l'IA. Ce qui change ici, c'est le pivot de NVIDIA vers l'inférence temps réel : dominer l'entraînement c'était bien, mais dominer la décision à la milliseconde dans les enchères programmatiques, c'est là où se jouent les vraies marges. Criteo qui gagne 17 000 heures GPU par an sur ses modèles, c'est pas du marketing.

InfrastructureActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic