BusinessVentureBeat AI · 16 avr. 2026, 22:55· 2 min de lecture

L'IA tient-elle ses promesses ? Transformer l'élan vers l'IA en valeur mesurable

Les grandes entreprises traversent aujourd'hui ce que Brian Gracely, directeur de la stratégie de portefeuille chez Red Hat, appelle le moment "Day 2" de l'intelligence artificielle : la phase où les pilotes cèdent la place à la production, et où les questions de coût, de gouvernance et de rentabilité deviennent plus complexes que la construction des systèmes eux-mêmes. Lors d'une session de l'AI Impact Tour de VentureBeat, Gracely a illustré cette réalité avec un exemple frappant : des clients qui détiennent 50 000 licences de Microsoft Copilot sans savoir précisément ce que leurs employés en tirent, tout en payant pour ce qu'il décrit comme "le calcul informatique le plus cher du monde, parce que ce sont des GPU". Après deux ou trois cycles budgétaires consacrés à l'IA générative, les directions d'entreprise ne demandent plus "peut-on construire quelque chose ?" mais "obtenons-nous ce pour quoi nous payons ?" Le problème central n'est pas seulement le coût brut de l'infrastructure GPU : c'est l'absence d'instrumentation permettant de relier les dépenses aux résultats concrets, rendant quasi impossible la justification des renouvellements de contrats à grande échelle.

Cette prise de conscience provoque un changement stratégique profond dans la manière dont les entreprises envisagent leur rapport à l'IA. Le modèle dominant des deux dernières années, payer un fournisseur au token, au siège ou à l'appel API en lui déléguant toute l'infrastructure, est de plus en plus remis en question. Gracely résume cette évolution : plutôt que d'être purement "consommateur de tokens", certaines organisations cherchent à devenir "productrices de tokens", en évaluant quels usages justifient de posséder ou louer directement des GPU, et si les cas d'usage nécessitent vraiment les modèles les plus avancés ou si des modèles ouverts plus légers suffisent. Cette décision n'est pas binaire : elle dépend de la tolérance au risque, de la nature des charges de travail et de la maturité de chaque organisation.

Le paradoxe auquel font face les responsables financiers est bien réel. Le PDG d'Anthropic, Dario Amodei, a estimé que les coûts d'inférence chutent d'environ 60 % par an, et l'émergence de modèles open source comme DeepSeek a considérablement élargi les alternatives stratégiques disponibles. Pourtant, la baisse du coût unitaire ne se traduit pas par une réduction des factures totales : l'usage s'accélère à un rythme qui compense largement les gains d'efficacité. C'est une manifestation du paradoxe de Jevons, principe économique selon lequel l'amélioration de l'efficacité d'une ressource tend à augmenter sa consommation globale plutôt qu'à la réduire. Une entreprise qui triple son utilisation de l'IA pendant que les coûts diminuent de moitié dépense encore davantage qu'avant. Pour les décideurs, cela signifie que la maturité de l'IA en entreprise passe désormais par une discipline opérationnelle rigoureuse, et non plus par l'enthousiasme des premières expérimentations.

Dans nos dossiers

Microsoft Anthropic DeepSeek Open weight & Open source

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Le Big Data

Comment Fora utilise l’IA pour transformer le métier d’agent de voyage ?

La startup new-yorkaise Fora vient de boucler une levée de fonds de 60 millions de dollars, menée par les fonds Forerunner et Tactile Ventures. Cette opération porte sa valorisation à un milliard de dollars, lui conférant le statut de licorne. Fondée en 2021, l'entreprise a permis à ses conseillers en voyages de générer plus de 3 milliards de dollars de réservations cumulées depuis sa création. La plateforme fonctionne sur un modèle hybride : elle donne à des milliers de conseillers indépendants les moyens de créer leur propre activité, en leur fournissant les outils nécessaires pour gérer clients, réservations et opérations quotidiennes. Parmi ces outils figure Via, un assistant IA intégré que Fora prévoit justement de développer grâce à une partie importante de ce nouveau financement. Via peut rechercher des destinations, comparer les offres des fournisseurs, préparer des itinéraires personnalisés et rédiger des propositions commerciales. Selon les chiffres communiqués par l'entreprise, environ 15 000 conseillers sont actuellement actifs sur la plateforme, dont 97 % ont rejoint le secteur récemment, souvent après une première carrière dans un tout autre domaine. Cette levée de fonds illustre un choix stratégique qui tranche avec la tendance dominante du secteur : plutôt que d'automatiser entièrement le parcours client comme le font de nombreuses agences de voyages en ligne, Fora mise sur l'IA comme un outil d'augmentation plutôt que de remplacement. Concrètement, Via ne dialogue jamais directement avec les voyageurs à la place des conseillers, il se contente d'absorber les tâches administratives chronophages pour libérer du temps humain. Pour les conseillers, cela signifie pouvoir consacrer davantage d'heures au conseil personnalisé et au développement de leur clientèle, deux activités jugées difficilement automatisables. Pour l'industrie du voyage dans son ensemble, ce pari valide une approche où la confiance des investisseurs se porte sur des modèles combinant technologie et expertise humaine plutôt que sur une automatisation intégrale. Ce choix s'inscrit dans un débat plus large sur la manière dont l'IA générative transforme les métiers de service. Selon des analyses publiées par McKinsey et Accenture, les gains de productivité les plus rapides et les plus durables proviennent souvent de cette logique d'« augmentation », où l'humain garde la main sur les décisions à forte valeur ajoutée. Evan Frank, cofondateur de Fora, défend d'ailleurs l'idée que l'intelligence artificielle renforce la valeur de qualités difficiles à reproduire, comme l'expertise, le goût ou la compréhension fine des attentes d'un client. Reste à savoir si ce modèle hybride résistera à la pression concurrentielle des géants du voyage en ligne, qui misent eux sur une automatisation plus poussée, et si l'afflux de nouveaux conseillers venus d'autres secteurs confirmera la viabilité à long terme de cette approche entrepreneuriale assistée par l'IA.

BusinessActu

1 source

2Le Big Data

Palantir et Zeta Global veulent unifier les données et l’IA pour transformer le marketing

Palantir Technologies et Zeta Global ont annoncé le 23 juin 2026 un partenariat stratégique visant à fusionner données d'entreprise et intelligence marketing au sein d'une infrastructure commune. Le projet central consiste à reconstruire le Data Cloud de Zeta sur Foundry, la plateforme de gestion et de gouvernance des données de Palantir, déjà adoptée par de grandes organisations dans les secteurs de la défense, de l'industrie et des services publics. Athena, le moteur d'IA décisionnelle de Zeta, sera intégré à cette nouvelle architecture pour permettre aux entreprises de piloter leurs campagnes marketing en temps réel, à partir de données unifiées et gouvernées selon les standards de sécurité propres à Palantir. L'enjeu concret est de résoudre un problème structurel que rencontrent la plupart des grandes entreprises : les données clients captées par les équipes marketing restent cloisonnées, séparées des flux opérationnels issus de la production, de la logistique, des ventes ou du service client. En connectant ces univers sur une plateforme unique, Palantir et Zeta promettent une vision consolidée de l'activité et des cycles de décision beaucoup plus courts. Pour les directions marketing, cela signifie passer d'une analyse rétrospective à une exécution pilotée en temps réel par l'IA, Athena étant conçue pour identifier des opportunités, recommander des actions et déclencher des campagnes à partir des signaux remontés par l'ensemble des systèmes de l'entreprise. Ce partenariat s'inscrit dans la montée en puissance du marketing dit agentique, où les systèmes d'IA ne se contentent plus d'analyser mais participent activement à la décision et à l'exécution. Pour Palantir, l'opération marque une percée significative dans le secteur du marketing commercial, un domaine historiquement secondaire dans son portefeuille dominé par les contrats gouvernementaux et industriels. Pour Zeta, s'adosser à l'infrastructure Foundry lui confère une crédibilité auprès d'entreprises exigeantes en matière de conformité et de sécurité des données. La convergence entre données opérationnelles et données marketing, longtemps jugée techniquement trop complexe, devient désormais l'axe de différenciation que les deux acteurs cherchent à imposer comme nouveau standard dans l'industrie.

UEPalantir étant déjà implanté auprès d'institutions et d'entreprises européennes via Foundry, ce partenariat pourrait à terme être accessible aux équipes marketing en Europe, mais Zeta Global reste quasi absente du marché européen.

BusinessActu

1 source

3VentureBeat AI

Chez Zillow, le responsable ingénierie affirme au VB Transform 2026 que le ROI de l'IA ne tient que s'il est mesuré avant le développement

Ces derniers mois, la question du retour sur investissement de l'intelligence artificielle en entreprise est revenue au centre des débats lors de la conférence VB Transform 2026, où Toby Roberts, vice-président senior de l'ingénierie chez Zillow, et Arvind Jain, cofondateur et directeur général de Glean, ont détaillé l'architecture bâtie pour gérer des parcours clients complexes. Zillow, plateforme immobilière qui intervient dans environ 80% des transactions immobilières aux États-Unis chaque année, fait face à un défi particulier : ses clients passent d'un appel téléphonique à un conseiller en prêt puis à un agent immobilier, parfois sur plusieurs mois, et s'attendent à ce que le contexte de leur dossier les suive tout au long du processus. Un simple chatbot ne pouvait pas porter ce fil conducteur. L'entreprise a donc construit sa propre couche de contexte persistante plutôt que de dépendre d'une seule interface de conversation externe, une décision prise rapidement une fois que l'équipe a examiné la réalité d'une transaction complète plutôt qu'une conversation isolée. Contrairement à l'idée reçue selon laquelle la donnée est l'obstacle principal des projets d'IA en entreprise, Roberts a expliqué que chez Zillow, la vraie difficulté n'était pas là : l'entreprise avait déjà posé des bases solides avec une architecture en maillage de données, une traçabilité claire et une gouvernance intégrant permissions et identité. Le vrai problème a été de construire un système capable de se souvenir où en était un client dans son parcours et de transmettre cette information peu importe la plateforme utilisée ensuite. Cette approche a des conséquences concrètes pour les entreprises qui déploient de l'IA agentique à grande échelle : Zillow a pu attribuer de manière crédible une hausse de 40% du code livré à l'adoption de l'IA, mais uniquement parce qu'elle disposait déjà d'une base de métriques DORA établie des années avant le déploiement de l'IA, et non grâce au déploiement lui-même. Autrement dit, mesurer l'impact réel de l'IA suppose d'avoir fixé un point de référence avant de se lancer, pas après. Sur le plan technique, Zillow s'appuie sur vingt ans d'historique en apprentissage automatique, hérité de produits comme Zestimate, pour privilégier des modèles plus petits et spécialisés plutôt qu'un modèle généraliste unique. En parallèle, l'entreprise utilise des milliers d'agents Glean en production, gérant des tâches répétitives avec des dizaines de milliers d'exécutions. Jain a présenté deux leviers de réduction des coûts propres à la plateforme de Glean : le routage vers des modèles moins chers pour la majorité des tâches, et un contexte précalculé qui évite à un agent de consommer des tokens à reconstruire son contexte à chaque requête, ce qui peut diviser par deux la consommation de tokens par rapport à un modèle comme Claude, plus lent selon lui car l'assemblage initial du contexte prend du temps. Jain insiste aussi sur l'intérêt de centraliser cette intégration une seule fois via la passerelle Glean MCP plutôt que de laisser chaque service, finance, juridique ou marketing, reconstruire ses propres connexions aux mêmes systèmes, un coût caché que la plupart des entreprises n'ont pas anticipé. Enfin, même avec une plateforme consciente des permissions, Zillow a ajouté des règles strictes et un contrôle de conformité permanent pour ses catégories de données les plus sensibles, refusant de faire confiance uniquement à l'héritage automatique des droits d'accès.

BusinessActu

1 source

4Le Big Data

Accenture transforme le conseil en IA avec des agents prêts à déployer

Accenture et Google Cloud ont annoncé le 7 juillet 2026 le lancement d'Accenture Edge, une offre d'agents d'intelligence artificielle préconfigurés destinée aux entreprises de taille intermédiaire réalisant entre 300 millions et 3 milliards de dollars de chiffre d'affaires annuel. L'objectif affiché est de réduire le délai entre le pilote et la mise en production à quelques semaines, contre plusieurs mois habituellement pour ce type de déploiement. Ces agents couvrent déjà six domaines : l'intelligence client, l'expérience client, la cybersécurité, les opérations, la productivité des salariés, ainsi que des solutions sectorielles pour la banque, les télécommunications, le retail, les biens de consommation et la supply chain. Sur le plan technique, Google Cloud fournit la base logicielle, combinant Gemini Enterprise, la Gemini Enterprise Agent Platform lancée en avril 2026 et l'Agentic Data Cloud. Le volet cybersécurité s'appuie sur Google AI Threat Defense, qui intègre Gemini, Mandiant et Wiz. Accenture y ajoute sa propriété intellectuelle, son expertise sectorielle et des ingénieurs déployés directement chez les clients. Cette annonce marque un tournant potentiel pour l'industrie du conseil en technologie. Jusqu'ici, un projet d'intégration IA nécessitait une longue phase d'analyse sur mesure : étude des processus métiers, choix d'architecture, développement d'intégrations spécifiques, puis accompagnement au déploiement, chaque client représentant un chantier largement unique. Avec des agents préconfigurés, une partie de cette architecture, des workflows et des mécanismes de gouvernance devient réutilisable d'un client à l'autre, même si la personnalisation reste nécessaire. Pour les entreprises de taille intermédiaire, souvent moins équipées en ressources internes que les grands groupes, cela signifie un accès plus rapide et potentiellement moins coûteux à l'IA agentique appliquée à des fonctions concrètes comme la relation client ou la sécurité informatique. Pour Accenture, l'enjeu est aussi financier : le groupe a triplé ses revenus liés à l'IA générative sur son exercice 2025, et cette offre vise à accélérer encore cette dynamique en captant un segment de marché jusque-là moins servi par le conseil haut de gamme. Ce mouvement dépasse le seul cas d'Accenture. Selon une analyse de Business Insider sur la transformation du conseil par l'IA, les grands cabinets développent de plus en plus leurs propres outils logiciels et se rapprochent des entreprises technologiques, transformant progressivement leur expertise accumulée en produits réutilisables plutôt qu'en prestations sur mesure facturées à l'heure. Cette « productisation » du conseil redéfinit un modèle économique historiquement fondé sur l'intervention humaine personnalisée. Le partenariat entre Accenture et Google Cloud illustre aussi la concurrence croissante entre fournisseurs de cloud pour s'imposer comme la couche technologique de référence de l'IA agentique en entreprise, face à des rivaux comme Microsoft et AWS qui développent des stratégies similaires avec les grands cabinets de conseil.

UELes entreprises europeennes de taille intermediaire pourraient acceder a cette offre d'agents IA via les filiales locales d'Accenture et de Google Cloud, mais aucune entreprise ou reglementation francaise n'est directement impliquee dans cette annonce.

💬 Ce qui compte ici, c'est pas les six domaines couverts, c'est que le conseil bascule du sur-mesure facturé à l'heure vers du prêt-à-déployer. Accenture transforme des années d'expertise accumulée en produit qu'on installe en quelques semaines plutôt qu'en mission de six mois, et pour les boîtes de taille intermédiaire ça ouvre un accès qui leur était fermé jusque-là. Reste à voir si la personnalisation promise tient la route dès que le client a des besoins un peu tordus.

BusinessActu

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic