Aller au contenu principal
L'infrastructure GenAI pour préparer l'avenir
InfrastructureInfoQ AI1j

L'infrastructure GenAI pour préparer l'avenir

Résumé IASource uniqueImpact UE
Source originale ↗·

Merrin Kurian, ingénieure chez Intuit, a présenté l'architecture et les processus organisationnels qui sous-tendent la transformation IA de l'entreprise, connue pour ses logiciels fiscaux et financiers comme TurboTax et QuickBooks. Au cœur de cette transformation se trouve GenOS, la plateforme d'IA générative interne d'Intuit, déployée auprès de 8 000 développeurs et ayant permis la mise en production de plus de 3 500 expérimentations. Pour piloter ce déploiement à grande échelle, Intuit a adopté un cadre en trois niveaux baptisé "fixed, flexible, free", distinguant ce qui est imposé à tous, ce qui est configurable selon les équipes, et ce qui est laissé à la libre initiative des développeurs.

Cette approche structurée répond à un défi concret pour toute grande entreprise qui industrialise l'IA : comment donner de l'autonomie aux équipes sans perdre le contrôle de la qualité, de la sécurité et de la cohérence des systèmes. Kurian a notamment détaillé les modes de défaillance propres aux agents IA, ces systèmes autonomes qui enchaînent des actions, et présenté une stratégie d'évaluation dite "LLM-as-a-judge", où un modèle de langage est utilisé pour noter automatiquement les sorties d'un autre modèle. Intuit travaille également à rendre ses API "tool-ready", c'est-à-dire nativement compatibles avec des agents IA capables de les appeler sans intervention humaine.

Cette présentation s'inscrit dans un mouvement plus large de structuration des infrastructures GenAI dans les grandes entreprises technologiques. Après une phase d'expérimentation, les acteurs comme Intuit cherchent désormais à industrialiser leurs pratiques, en construisant des plateformes internes capables de supporter des milliers de cas d'usage simultanément. Le passage à l'échelle exige des choix d'architecture rigoureux, une gouvernance claire et des outils d'évaluation automatisés pour maintenir la fiabilité dans des environnements de production complexes.

Dans nos dossiers

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

L'IA a besoin d'une infrastructure de données solide pour créer de la valeur
1MIT Technology Review 

L'IA a besoin d'une infrastructure de données solide pour créer de la valeur

L'intelligence artificielle s'installe durablement dans les entreprises : selon une enquête récente, la moitié des organisations utilisaient déjà l'IA dans au moins trois fonctions métier d'ici fin 2025, que ce soit en finance, dans les chaînes d'approvisionnement, les ressources humaines ou le service client. Mais à mesure que ces systèmes deviennent centraux dans les opérations quotidiennes, un obstacle inattendu émerge. Ce n'est ni la puissance de calcul ni les performances des modèles qui freinent le déploiement, mais la qualité et surtout le contexte des données sur lesquelles reposent ces systèmes. Irfan Khan, président et directeur produit de SAP Data & Analytics, résume le problème : "L'IA produit des résultats très rapidement, mais sans contexte elle ne peut pas exercer un bon jugement -- et c'est le jugement qui crée de la valeur pour l'entreprise. La vitesse sans jugement ne sert à rien, elle peut même nuire." L'enjeu est concret et mesurable. Deux entreprises qui utilisent l'IA pour gérer des ruptures dans leur chaîne d'approvisionnement peuvent traiter les mêmes données -- niveaux de stock, délais, scores fournisseurs -- mais arriver à des décisions radicalement différentes. Celle qui enrichit ses données avec du contexte métier (quels clients sont stratégiques, quels compromis sont acceptables en cas de pénurie, quelles obligations contractuelles s'appliquent) prendra des décisions alignées sur ses priorités réelles. L'autre produira des réponses techniquement correctes mais opérationnellement défaillantes. Les systèmes d'IA n'affichent pas seulement de l'information, ils agissent dessus -- ce qui rend toute erreur de contexte potentiellement coûteuse. Historiquement, des experts humains compensaient ce manque de contexte en interprétant les données brutes. Avec l'automatisation croissante, ce filet de sécurité disparaît. La réponse architecturale qui s'impose est celle du "data fabric", une couche d'infrastructure qui ne se contente pas d'intégrer les données mais préserve leur signification à travers les systèmes, les applications et les environnements cloud. Pendant deux décennies, les entreprises ont massivement investi dans des entrepôts de données centralisés -- utiles pour les rapports et les tableaux de bord, mais appauvrissants pour le sens métier des données. Le mouvement actuel est inverse : il s'agit de connecter les informations là où elles se trouvent tout en conservant les métadonnées, les politiques et les relations qui décrivent comment l'entreprise fonctionne réellement. SAP, qui positionne ses solutions d'analytique autour de cette vision, n'est pas seul sur ce terrain : toute l'industrie des données se repositionne pour répondre à une exigence nouvelle -- celle d'une IA qui ne se contente pas d'aller vite, mais qui va dans la bonne direction.

UESAP étant une entreprise allemande leader du logiciel d'entreprise, son positionnement sur le 'data fabric' influence directement les choix d'infrastructure des grandes organisations européennes qui déploient l'IA.

InfrastructureActu
1 source
Nvidia s’allie à IREN pour déployer 5 GW d’infrastructures IA
2Le Big Data 

Nvidia s’allie à IREN pour déployer 5 GW d’infrastructures IA

Nvidia et IREN ont annoncé le 7 mai 2026 un partenariat stratégique visant à déployer jusqu'à 5 gigawatts d'infrastructures IA à travers le réseau mondial de centres de données d'IREN. L'accord s'appuie sur l'architecture DSX de Nvidia, conçue pour industrialiser le déploiement de clusters GPU à très grande échelle. Un contrat de 3,4 milliards de dollars a également été signé dans ce cadre, par lequel IREN fournira des services cloud d'infrastructure IA pour les besoins internes de Nvidia. Le campus texan de Sweetwater, site de 2 gigawatts présenté comme le futur projet phare de ce déploiement, concentrera une grande partie des investissements initiaux. Dans cette architecture, Nvidia apporte la puissance de calcul accélérée et l'expertise en infrastructure, tandis qu'IREN prend en charge l'énergie, le foncier, l'exploitation des data centers et le déploiement physique des clusters GPU. Ce partenariat illustre un basculement profond dans la façon dont se joue la compétition dans l'IA. Pendant des années, l'avantage concurrentiel reposait avant tout sur les performances des modèles et l'accès aux puces. Désormais, la capacité à construire rapidement des infrastructures capables d'alimenter en continu l'entraînement et l'inférence de modèles devient tout aussi décisive. Les cibles prioritaires de ce projet sont les entreprises natives de l'IA, les startups spécialisées et les grands groupes à fort besoin de calcul. Jensen Huang, fondateur et PDG de Nvidia, résume cette vision en affirmant que les "AI factories deviennent une infrastructure fondamentale comparable aux réseaux électriques ou aux télécommunications". Cette déclaration marque le repositionnement explicite de Nvidia : l'entreprise ne vend plus uniquement des GPU, mais une offre complète d'infrastructure IA à l'échelle industrielle. Ce mouvement s'inscrit dans une dynamique plus large où la question énergétique devient aussi stratégique que l'accès aux semi-conducteurs. Le Texas attire une part croissante des investissements dans l'IA et les data centers grâce à son accès à l'énergie, ses disponibilités foncières et ses infrastructures industrielles. IREN occupe une position particulière sur ce marché avec un modèle verticalement intégré qui combine centres de données, accès aux réseaux électriques et clusters GPU, le tout implanté dans des régions riches en énergies renouvelables en Amérique du Nord. Le partenariat avec Nvidia lui confère une crédibilité et une visibilité sans précédent pour capter les besoins colossaux en infrastructure que génère la généralisation de l'IA générative dans les entreprises. Les 5 GW annoncés seront déployés progressivement, ce qui laisse entendre que d'autres sites viendront compléter Sweetwater dans les prochaines années.

💬 5 GW, c'est un chiffre qui donne le vertige. Ce qui m'intéresse là-dedans, c'est pas tellement le partenariat Nvidia-IREN en lui-même, mais ce que ça confirme : l'accès à l'énergie et au foncier est en train de devenir le vrai goulot d'étranglement de l'IA, pas les GPU. Et pendant qu'on débat de réglementation en Europe, le Texas construit.

InfrastructureOpinion
1 source
Le VPS piloté par l’IA : De la gestion technique au pilotage de l’infrastructure
3FrenchWeb 

Le VPS piloté par l’IA : De la gestion technique au pilotage de l’infrastructure

L'infrastructure informatique a longtemps été reléguée au rang de préoccupation purement technique, confiée à des équipes spécialisées et invisible dans les organigrammes décisionnels. Elle ne remontait vers les directions qu'en cas de crise : incident majeur, panne prolongée, ou dérapage budgétaire. Pour les organisations numériques modernes, ce modèle de gestion réactive a atteint ses limites, la complexité croissante des environnements cloud, combinée à la multiplication des serveurs privés virtuels (VPS), rend la supervision manuelle à la fois coûteuse et insuffisante. L'intégration de l'intelligence artificielle dans la gestion des VPS change fondamentalement ce paradigme. Là où un administrateur système devait intervenir après détection d'un problème, les outils pilotés par l'IA permettent d'anticiper les surcharges, d'ajuster automatiquement les ressources allouées et de détecter des anomalies avant qu'elles n'impactent les utilisateurs. Pour les PME comme pour les grandes structures, cela se traduit par une réduction des temps d'indisponibilité, une meilleure maîtrise des coûts et une infrastructure qui devient enfin un levier stratégique plutôt qu'un poste de dépense subi. Cette transformation s'inscrit dans la dynamique plus large de l'AIOps, l'application de l'IA aux opérations informatiques, qui s'est accélérée depuis 2023 avec la maturité des modèles de langage et des systèmes d'agents autonomes. Les grands acteurs de l'hébergement comme OVHcloud, Hetzner ou DigitalOcean intègrent progressivement ces capacités dans leurs offres, tandis que les DSI réévaluent leur rapport à l'infrastructure. Le VPS piloté par l'IA n'est plus un gadget : il devient une brique de compétitivité opérationnelle.

UEOVHcloud, acteur majeur de l'hébergement cloud français, est cité comme intégrant ces capacités IA dans ses offres, avec un impact direct sur les DSI et PME françaises gérant leur infrastructure VPS.

InfrastructureOpinion
1 source
IA et souveraineté numérique : la France choisit AMD pour son infrastructure ?
4Le Big Data 

IA et souveraineté numérique : la France choisit AMD pour son infrastructure ?

La France a officialisé un partenariat pluriannuel avec AMD, le fabricant américain de semi-conducteurs, pour accélérer son infrastructure nationale en intelligence artificielle. L'accord a été signé au ministère de l'Économie et des Finances à Paris, en présence de trois ministres : Philippe Baptiste (Enseignement supérieur et Recherche), Sébastien Martin (Industrie) et Anne Le Hénanff (Numérique), ainsi que Keith Strier, vice-président senior d'AMD pour les marchés IA. Au coeur du dispositif figure le supercalculateur Alice Recoque, développé avec le GENCI, le CEA et le consortium Jules Verne, et dont la puissance visée atteint un exaflop, soit un milliard de milliards d'opérations par seconde. AMD fournira les briques technologiques aux côtés de Bull, désormais sous contrôle de l'État français, et un centre d'excellence sera chargé d'optimiser l'exploitation de cette infrastructure. Le partenariat inclut également un accès élargi aux programmes de formation du fabricant américain : AMD University Program, AMD AI Developer Program et AMD AI Academy. Ce partenariat représente une tentative concrète de combler le fossé entre excellence académique française et industrialisation de l'IA à grande échelle, un manque chroniquement identifié en Europe. En donnant aux chercheurs, start-up et ingénieurs français un accès direct aux technologies qui alimentent déjà les systèmes d'IA les plus avancés au monde, l'accord vise à accélérer le passage de la recherche au déploiement en production. L'infrastructure Alice Recoque ouvrira par ailleurs des capacités de calcul jusqu'ici inaccessibles à l'échelle nationale, couvrant des domaines aussi variés que la simulation climatique, la recherche scientifique avancée ou les applications à usage militaire. Elle alimentera aussi la future AI Factory France, destinée à structurer l'ensemble de la filière industrielle de l'IA dans le pays. Cette collaboration s'inscrit dans un contexte de course mondiale au calcul haute performance, où la France, comme le reste de l'Europe, peine à peser face aux États-Unis et à la Chine. Le choix d'AMD soulève néanmoins une question de fond sur la souveraineté numérique : peut-on revendiquer une autonomie stratégique en matière d'IA lorsque l'infrastructure repose sur un acteur américain ? La réalité industrielle laisse peu de marges de manoeuvre, les technologies de pointe en semi-conducteurs et en calcul étant aujourd'hui quasi exclusivement détenues par des entreprises non européennes. La France semble avoir arbitré en faveur de la performance immédiate, tout en espérant que cet écosystème d'excellence, de formation et de recherche posera les bases d'une plus grande autonomie technologique à moyen terme.

UELe partenariat engage directement la souveraineté numérique de la France en confiant à AMD les briques technologiques du supercalculateur Alice Recoque (1 exaflop) et de la future AI Factory France, pilier de la filière IA nationale.

💬 AMD pour "souveraineté numérique", c'est un oxymore qui fait mal à lire. Bon, sur le papier, un exaflop avec Alice Recoque et l'accès aux programmes de formation AMD, c'est du concret pour les chercheurs et les startups qui galèrent à avoir du compute. Mais confier les fondations de ta filière IA nationale à un acteur américain en appelant ça de l'autonomie stratégique, faut avoir un sacré sens de l'humour.

InfrastructureOpinion
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour