InfrastructureVentureBeat AI11h· 2 min de lecture

Un POC tolère un pipeline de données fragile, l'IA en production non

Lorsqu'une entreprise fait passer un projet d'IA d'une phase pilote à un déploiement en production, c'est souvent l'infrastructure réseau qui craque en premier. Les architectures point à point, dans lesquelles un client S3 se connecte directement au stockage S3, tiennent la route dans des conditions de démonstration contrôlées, mais s'effondrent dès que le trafic devient soutenu et concurrent. Paul Pindell, architecte solutions principal chez F5, l'explique sans détour : si un seul nœud de stockage tombe, l'ensemble du trafic vers le cluster se dégrade, et dans certains cas le cluster entier peut cesser de fonctionner. Les effets en cascade sont immédiats : les pipelines d'inférence se bloquent, les systèmes de RAG (récupération augmentée de génération) perdent l'accès à des données actualisées, et les GPU restent inutilisés pendant que les délais s'accumulent.

Ces pannes ont un coût business concret. Quand un pipeline d'inférence se fige, c'est un engagement de niveau de service qui est violé et une expérience client qui se dégrade. Quand un système RAG ne reçoit plus ses données à temps, le modèle génère des réponses imprécises, obsolètes ou hallucinées, exposant l'entreprise à des risques opérationnels, réglementaires et réputationnels. Parallèlement, les GPU sous-utilisés font grimper les coûts d'infrastructure sans produire de valeur. Tanu Mutreja, directrice senior produit chez F5, résume l'enjeu pour les dirigeants : la vraie question n'est pas de savoir si l'on a des GPU suffisants, mais si l'infrastructure bout-en-bout est capable de délivrer des expériences IA fiables, sécurisées et gouvernées à des coûts unitaires viables.

Face à ce problème, F5 défend l'idée que la livraison des données doit devenir une couche d'infrastructure à part entière, au même titre que la livraison d'applications l'a été pour les requêtes web. Cette couche repose sur trois propriétés : l'observabilité en temps réel des latences, débits et états des flux ; la programmabilité, qui permet de piloter dynamiquement le routage, d'optimiser le trafic et d'automatiser le basculement en cas de défaillance ; et une conception résiliente aux pannes, pensée dès le départ pour l'environnement de production plutôt qu'adaptée après coup. Hunter Smit, responsable marketing produit chez F5, souligne que les organisations qui réussissent à opérationnaliser l'IA sont celles qui construisent leur infrastructure pour absorber les défaillances réelles, et non les conditions idéales d'un pilote. Avec la montée en puissance des architectures agentiques et des systèmes RAG à grande échelle, ce débat sur le chemin des données entre stockage et calcul est appelé à s'intensifier.

Dans nos dossiers

Agents IA

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1MIT Technology Review

Reconstruire la pile de données pour l'IA

L'intelligence artificielle occupe désormais le sommet des priorités des directions d'entreprise, mais une réalité s'impose de plus en plus clairement : le principal frein à une adoption concrète n'est pas la technologie elle-même, mais l'état des données. Bavesh Patel, vice-président senior chez Databricks, résume le problème sans détour : "La qualité de l'IA, son efficacité réelle, dépend directement de l'information disponible dans votre organisation." Or dans la grande majorité des entreprises, cette information reste dispersée entre des systèmes hérités, des applications cloisonnées et des formats incompatibles. Sans infrastructure unifiée, les modèles d'IA produisent des résultats peu fiables, dépourvus de contexte, ce que Patel qualifie simplement de "terrible AI". La solution passe par une consolidation des données dans des formats ouverts, une gouvernance rigoureuse des accès, et une architecture capable de combiner données structurées et non structurées en temps réel. L'enjeu est directement compétitif. Pour Patel, "le vrai différenciateur concurrentiel de la plupart des organisations, c'est leur propre data, combinée aux données tierces qu'elles peuvent y ajouter". Les entreprises qui parviennent à poser ces fondations correctement débloquent des gains mesurables : automatisation de workflows complexes, efficacité opérationnelle accrue, voire création de nouvelles lignes de revenus. Rajan Padmanabhan, responsable technologique chez Infosys, insiste sur la nécessité de relier chaque initiative IA à des indicateurs business précis, plutôt que de traiter ces projets comme des expérimentations isolées. Les entreprises les plus avancées utilisent des cadres de gouvernance pour identifier rapidement ce qui produit des résultats concrets et abandonner ce qui n'en produit pas, une discipline que peu d'organisations ont encore intégrée dans leur fonctionnement quotidien. Cette transformation s'inscrit dans un changement de paradigme plus profond. Pendant des décennies, les systèmes d'information ont été conçus comme des outils d'exécution ou d'engagement. Padmanabhan décrit une nouvelle logique en train d'émerger : "des systèmes d'action", capables de décider et d'agir de manière autonome. C'est précisément la promesse des agents IA, qui évoluent de simples assistants vers des opérateurs autonomes gérant des flux de travail et des transactions entières. Mais cette évolution suppose que les données sous-jacentes soient fiables, accessibles et gouvernées, une condition que la plupart des grandes entreprises ne remplissent pas encore. La question n'est donc plus de savoir si l'IA va transformer l'entreprise, mais si les organisations sauront construire l'infrastructure de données nécessaire avant que la fenêtre d'opportunité ne se referme sur celles qui auront avancé plus vite.

InfrastructureOpinion

1 source

2MIT Technology Review

L'IA a besoin d'une infrastructure de données solide pour créer de la valeur

L'intelligence artificielle s'installe durablement dans les entreprises : selon une enquête récente, la moitié des organisations utilisaient déjà l'IA dans au moins trois fonctions métier d'ici fin 2025, que ce soit en finance, dans les chaînes d'approvisionnement, les ressources humaines ou le service client. Mais à mesure que ces systèmes deviennent centraux dans les opérations quotidiennes, un obstacle inattendu émerge. Ce n'est ni la puissance de calcul ni les performances des modèles qui freinent le déploiement, mais la qualité et surtout le contexte des données sur lesquelles reposent ces systèmes. Irfan Khan, président et directeur produit de SAP Data & Analytics, résume le problème : "L'IA produit des résultats très rapidement, mais sans contexte elle ne peut pas exercer un bon jugement -- et c'est le jugement qui crée de la valeur pour l'entreprise. La vitesse sans jugement ne sert à rien, elle peut même nuire." L'enjeu est concret et mesurable. Deux entreprises qui utilisent l'IA pour gérer des ruptures dans leur chaîne d'approvisionnement peuvent traiter les mêmes données -- niveaux de stock, délais, scores fournisseurs -- mais arriver à des décisions radicalement différentes. Celle qui enrichit ses données avec du contexte métier (quels clients sont stratégiques, quels compromis sont acceptables en cas de pénurie, quelles obligations contractuelles s'appliquent) prendra des décisions alignées sur ses priorités réelles. L'autre produira des réponses techniquement correctes mais opérationnellement défaillantes. Les systèmes d'IA n'affichent pas seulement de l'information, ils agissent dessus -- ce qui rend toute erreur de contexte potentiellement coûteuse. Historiquement, des experts humains compensaient ce manque de contexte en interprétant les données brutes. Avec l'automatisation croissante, ce filet de sécurité disparaît. La réponse architecturale qui s'impose est celle du "data fabric", une couche d'infrastructure qui ne se contente pas d'intégrer les données mais préserve leur signification à travers les systèmes, les applications et les environnements cloud. Pendant deux décennies, les entreprises ont massivement investi dans des entrepôts de données centralisés -- utiles pour les rapports et les tableaux de bord, mais appauvrissants pour le sens métier des données. Le mouvement actuel est inverse : il s'agit de connecter les informations là où elles se trouvent tout en conservant les métadonnées, les politiques et les relations qui décrivent comment l'entreprise fonctionne réellement. SAP, qui positionne ses solutions d'analytique autour de cette vision, n'est pas seul sur ce terrain : toute l'industrie des données se repositionne pour répondre à une exigence nouvelle -- celle d'une IA qui ne se contente pas d'aller vite, mais qui va dans la bonne direction.

UESAP étant une entreprise allemande leader du logiciel d'entreprise, son positionnement sur le 'data fabric' influence directement les choix d'infrastructure des grandes organisations européennes qui déploient l'IA.

InfrastructureActu

1 source

3The Information AI

L'eau : pas un problème de centres de données, mais un problème d'IA

La consommation d'eau liée à l'intelligence artificielle est bien plus importante qu'on ne le pense, mais elle ne se concentre pas là où le débat public se focalise. Selon un rapport publié en janvier 2026 par la société de technologie de l'eau Xylem et le cabinet Global Water Intelligence, les usines de fabrication de semi-conducteurs et les centrales électriques qui les alimentent consomment beaucoup plus d'eau que les centres de données eux-mêmes. En 2025, le secteur IA retire 6 260 milliards de litres d'eau par an, un chiffre qui devrait plus que doubler d'ici 2050. Par comparaison, le premier site de Microsoft dans son complexe Fairwater au Wisconsin, l'un des plus grands campus de data centers au monde, ne consomme que l'équivalent de quatre piscines olympiques par an, soit la moitié de la consommation annuelle d'un lave-auto, et 0,1 % de ce que le fabricant Foxconn aurait été autorisé à prélever sur le même terrain, selon Brad Smith, président de Microsoft. Cette efficacité s'explique par l'adoption de systèmes de refroidissement en circuit fermé qui réduisent la consommation d'eau douce de 50 à 70 % par rapport aux anciens équipements. Ce déplacement du problème vers l'amont de la chaîne d'approvisionnement a des conséquences concrètes pour les territoires et les écosystèmes. Aujourd'hui, 40 % des centres de données mondiaux et 29 % des usines de puces électroniques sont implantés dans des zones souffrant d'un stress hydrique élevé ou extrême. Le refroidissement à l'électricité, qui remplace l'évaporation dans les nouveaux data centers, transfère en réalité la pression vers le réseau électrique : les centrales utilisent elles-mêmes de grandes quantités d'eau, et la consommation électrique des infrastructures IA par mètre carré atteint déjà dix fois celle du cloud traditionnel. Avec les futurs racks Nvidia à un mégawatt, cet écart pourrait grimper à cent fois la norme d'avant l'IA. Le numérique représente certes seulement 3,7 % des 168 800 milliards de litres consommés chaque année par l'industrie mondiale, mais c'est le secteur où la croissance est la plus rapide. Le tableau n'est pas uniformément alarmant. Les centrales électriques restituent plus de 90 % de l'eau utilisée pour leur refroidissement, même si elle nécessite parfois un traitement. La transition vers les énergies renouvelables, moins gourmandes en eau que le charbon ou le gaz, pourrait réduire significativement l'intensité hydrique de la production électrique dans les prochaines décennies. Les industriels investissent aussi dans la réutilisation des eaux usées : la société Ecolab a aidé une usine américaine de semi-conducteurs à économiser près de 42 millions de litres grâce à des processus optimisés. Le vrai enjeu n'est donc pas de condamner les data centers, mais d'imposer une transparence et des normes sur l'ensemble de la chaîne IA, des fonderies de puces en Asie aux centrales à gaz d'Amérique du Nord.

UELes centres de données et usines de puces européens sont exposés aux mêmes tensions hydriques, et l'UE pourrait être amenée à étendre ses obligations de transparence environnementale à l'ensemble de la chaîne d'approvisionnement IA, des fonderies aux centrales électriques.

InfrastructureOpinion

1 source

4VentureBeat AI

La mise en production de l'IA à grande échelle oblige les entreprises à repenser leur infrastructure

Le déploiement de l'intelligence artificielle à grande échelle est en train de redessiner l'architecture informatique des entreprises. C'est le constat que dressent Tarkan Maner, président et directeur commercial de Nutanix, et Thomas Cornely, vice-président exécutif en charge du produit, qui observent une bascule profonde dans la façon dont les organisations abordent l'IA. Après des mois de prototypes et d'expérimentations dans le cloud, les entreprises cherchent désormais à déployer ces systèmes sur des charges de travail réelles, pour des milliers d'utilisateurs simultanés. Cornely résume l'écart : "Faire un prototype, c'est une chose. Déployer ce prototype pour 10 000 employés, c'en est une autre." La montée en puissance des agents IA, capables d'enchaîner des tâches complexes en toute autonomie, amplifie encore cette pression : les infrastructures doivent gérer des workflows multi-étapes, des charges imprévisibles en temps réel, et coordonner l'accès aux données entre équipes. Ce passage du pilote à la production révèle des contraintes pratiques que l'expérimentation en cloud avait masquées. Les questions de gouvernance des données, de contrôle, de sécurité et de coût prennent rapidement le dessus dès que les volumes augmentent. Les cas d'usage qui progressent le plus vite sont la recherche documentaire et la récupération de connaissances, la détection prédictive des menaces en cybersécurité, les workflows de développement logiciel, et le support client. Dans le secteur bancaire, notamment en Europe et aux États-Unis, des établissements déploient déjà des outils de reconnaissance faciale et de détection prédictive des cyberattaques pilotés par l'IA. L'enjeu n'est pas de remplacer les décisions humaines, mais de trouver le bon équilibre entre l'automatisation et l'intervention humaine, ce que Maner résume par l'idée d'une "harmonie" entre agents IA, robotique et capital humain, optimisée pour de meilleurs résultats opérationnels. Cette transformation s'inscrit dans un contexte de mutation accélérée qui touche l'ensemble des secteurs, des industries réglementées comme la banque, la santé et les administrations publiques jusqu'à la distribution et la manufacture. Des frameworks comme OpenClaw facilitent désormais la création d'agents par des équipes qui n'ont pas de compétences en infrastructure IA, ce qui accroît la pression sur les plateformes chargées de sécuriser ces déploiements. La trajectoire dominante est claire : débuter dans le cloud pour accéder rapidement aux ressources, puis rapatrier les applications critiques sur site à mesure qu'elles entrent en production, sur des plateformes qui résolvent les problèmes de sécurité et de coût à la fois. Nutanix se positionne explicitement sur ce segment, voyant dans cette transition une opportunité de croissance majeure à mesure que les entreprises cherchent des partenaires capables d'accompagner l'IA de l'expérimentation au déploiement industriel.

UELe secteur bancaire européen est cité parmi les premiers adopteurs de l'IA en production (reconnaissance faciale, détection prédictive des cyberattaques), illustrant les enjeux croissants de gouvernance et de souveraineté des données pour les entreprises françaises et européennes.

InfrastructureActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic