Aller au contenu principal
JBS Dev : données imparfaites et le dernier kilomètre de l'IA, de la performance des modèles à la viabilité des coûts
OutilsAI News6sem· 2 min de lecture

JBS Dev : données imparfaites et le dernier kilomètre de l'IA, de la performance des modèles à la viabilité des coûts

Source originale ↗·

Joe Rose, président de JBS Dev, un fournisseur de technologies stratégiques, remet en question l'un des mythes les plus répandus autour de l'IA générative : celui selon lequel les données doivent être parfaites avant de lancer tout projet d'IA. Lors de sa participation à l'AI & Big Data Expo, Rose a détaillé comment les outils actuels permettent de travailler efficacement avec des données imparfaites, en donnant l'exemple concret d'un client dans le secteur médical. L'objectif était de migrer vers un nouveau système de réconciliation de facturation, avec des dossiers hétérogènes : certains en PDF, d'autres sous forme d'images scannées, des noms de médecins mal placés dans les champs patients, des procédures mal catégorisées. L'IA générative a permis d'extraire les données exploitables via OCR et extraction de texte, puis des approches plus agentiques ont pris le relais, comme la comparaison automatique entre un dossier patient et un contrat d'assurance pour vérifier que la facturation était correcte. Le niveau d'automatisation est ainsi passé de 20 % à 40 %, puis 60 %, puis 80 %, avec un humain dans la boucle pour traiter les cas limites.

Ce changement de paradigme a des implications concrètes pour les entreprises qui hésitent à se lancer dans des projets d'IA par peur d'un patrimoine data insuffisant. Rose souligne que les conseils des éditeurs et consultants, qui recommandent des lacs de données massifs et des programmes de transformation pluriannuels, servent avant tout leurs propres intérêts commerciaux. En pratique, un LLM est capable de comprendre une instruction à moitié rédigée, ce qui rend ces systèmes étonnamment robustes face à la qualité variable des données. La vraie rupture culturelle est ailleurs : les équipes IT doivent abandonner le réflexe "on construit, ça tourne, on oublie", car les systèmes agentiques nécessitent une supervision continue et une montée en automatisation progressive.

Les prochains enjeux du secteur ne seront pas dans la course aux capacités des modèles, estime Rose, mais dans leur soutenabilité économique et leur portabilité. La question centrale devient : comment faire tourner ces modèles sur un laptop ou un smartphone plutôt que dans des data centers que l'on construit à un rythme difficilement tenable ? Rose va plus loin avec une prise de position tranchée : les entreprises devraient arrêter d'acheter des solutions SaaS pour des cas d'usage IA qu'elles peuvent implémenter elles-mêmes. Les outils cloud des trois grands fournisseurs (AWS, Azure, Google Cloud) suffisent pour démarrer des workloads agentiques dès demain, sans nouvelles licences ni formations spécifiques. Une position qui tranche avec les discours dominants de l'écosystème, et qui reflète une maturité croissante du marché face aux promesses de l'IA d'entreprise.

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

L’IA, la donnée et le piège de la vitesse : quand l’efficacité néglige la fiabilité
1Le Big Data 

L’IA, la donnée et le piège de la vitesse : quand l’efficacité néglige la fiabilité

Une étude publiée par dbt Labs, spécialiste des frameworks de fiabilité des données, révèle un déséquilibre majeur dans l'adoption de l'intelligence artificielle au sein des entreprises. Si 72 % des équipes data utilisent l'IA pour accélérer l'écriture de code, seulement 24 % l'exploitent pour tester et garantir la fiabilité des données produites. Dans le même temps, 83 % des organisations déclarent que la confiance dans les données est devenue leur priorité stratégique numéro un, soit une hausse de 17 points en un an. Autre signal d'alarme : 71 % des professionnels de la data craignent de transmettre aux décideurs des résultats faux ou hallucinés, tandis que 57 % font face à une hausse des coûts d'infrastructure, sans augmentation équivalente des budgets. Et 41 % des entreprises souffrent d'un manque de clarté sur la propriété des données, créant des zones grises propices aux erreurs non détectées. Ce paradoxe a des conséquences concrètes et potentiellement coûteuses. En utilisant l'IA principalement comme accélérateur de production de code, sans l'intégrer dans des pipelines structurés avec des tests robustes, les entreprises risquent de construire ce que Benoît Perigaud, staff developer experience advocate chez dbt Labs, appelle une "usine à bugs ultrarapide". Le vrai danger n'est pas universel : il se concentre là où l'IA génère des requêtes ad hoc sur les données, sans couche sémantique pour encadrer les réponses des modèles de langage. Dans ces cas, une même question peut produire des réponses différentes selon le moment ou le contexte, sapant la crédibilité des analyses. La confiance, une fois perdue après une première hallucination visible, est difficile à reconstruire auprès des dirigeants. Ce constat s'inscrit dans une transformation plus large du rôle des équipes data. L'IA agit comme un multiplicateur de productivité : les mêmes équipes peuvent traiter davantage de demandes, mais la pression sur la qualité s'intensifie proportionnellement. Les frameworks comme dbt, qui intègrent les tests directement dans le cycle de transformation, offrent un modèle où fiabilité et vitesse ne s'excluent pas mutuellement. Mais leur adoption reste inégale, et la gouvernance peine à suivre la cadence d'adoption de l'IA. L'enjeu pour les prochaines années sera de combler ce fossé entre ambition stratégique et pratiques quotidiennes, avant que la multiplication des erreurs non détectées ne vienne éroder durablement la valeur des décisions data-driven.

OutilsOutil
1 source
2VentureBeat AI 

Les entreprises IA à base d'agents : concevoir pour des performances mesurables

Les agents d'intelligence artificielle semi-autonomes capables de gérer des tâches métier complexes en temps réel ne sont plus une promesse lointaine, c'est désormais une réalité opérationnelle pour certaines grandes entreprises. EdgeVerve, filiale d'Infosys spécialisée dans l'automatisation intelligente, a récemment publié un cadre de conception pour déployer ces agents à l'échelle industrielle. L'entreprise cite ses propres déploiements en production : dans un environnement financier réel piloté par un directeur financier, sept agents interconnectés ont généré en un an une amélioration de plus de 3 % des flux de trésorerie mensuels, un gain de productivité de 50 % sur les workflows concernés, un onboarding 90 % plus rapide, et un impact total de 32 millions de dollars sur la trésorerie. En maintenance immobilière, des résultats similaires ont été obtenus grâce à des agents spécialisés dans la coordination des interventions. Ces chiffres illustrent ce qui distingue un pilote réussi d'un projet abandonné : l'ancrage dans des objectifs métier mesurables dès le départ. La méthode préconisée consiste à partir des KPI organisationnels, délai de recouvrement (DSO), taux de conformité, temps moyen de résolution (MTTR), satisfaction client (NPS), pour définir les objectifs des agents, puis seulement choisir les workflows à automatiser. Les "zones grises opérationnelles", ces espaces entre les applications où subsistent encore des validations manuelles, des réconciliations et des transferts humains, représentent le prochain gisement de valeur. C'est là que les agents peuvent éliminer les frictions systémiques sans remplacer intégralement des processus formalisés. Le cadre repose sur quatre piliers : autonomie calibrée selon le niveau de risque (de la simple suggestion à l'exécution avec rollback automatique), gouvernance intégrée dès la conception avec des garde-fous stricts sur les données personnelles et réglementaires, observabilité continue via des évaluations et métriques en temps réel, et flexibilité d'intégration allant bien au-delà des seules API classiques, en incluant les flux événementiels, les connecteurs RAG pour bases documentaires, et des fallbacks RPA là où les API n'existent pas. Le risque central identifié est celui des agents "hallucinant" des actions non vérifiables par l'entreprise, d'où l'insistance sur l'idempotence, les mécanismes de retry et les schémas d'outils standardisés. Dans un contexte où de nombreuses entreprises peinent encore à sortir leurs agents du stade expérimental, ce retour d'expérience chiffré positionne EdgeVerve comme un acteur cherchant à normaliser les déploiements agentiques en environnement critique.

OutilsOutil
1 source
Extraire des données dynamiquement avec des pipelines à la demande et par lots
3AWS ML Blog 

Extraire des données dynamiquement avec des pipelines à la demande et par lots

Amazon Web Services propose une architecture de traitement intelligent de documents combinant deux modes d'inférence sur sa plateforme Bedrock : un pipeline à la demande, capable de traiter un document en quelques secondes, et un pipeline de traitement par lots, conçu pour absorber des volumes massifs à moindre coût. La solution s'appuie sur des modèles de langage large (LLM) pour extraire automatiquement des données structurées depuis des PDF numérisés ou des fichiers texte, y compris des documents aux formats hétérogènes. Le cas d'usage illustratif est parlant : un client disposant de plusieurs centaines de millions de baux fonciers au format PDF scanné, avec de nouveaux documents s'ajoutant chaque jour, peut désormais traiter ce backlog sans intervention humaine. Techniquement, chaque requête peut spécifier dynamiquement l'identifiant du modèle LLM, l'identifiant du prompt et sa version, ces paramètres étant récupérés depuis Amazon Bedrock Prompt Management au moment de l'exécution. Le pipeline temps réel repose sur une file SQS FIFO qui déclenche une fonction AWS Lambda : celle-ci récupère le PDF depuis S3, convertit chaque page en image PNG, compose le message à envoyer au LLM, puis stocke le résultat dans une table DynamoDB. Le pipeline batch, lui, regroupe les requêtes en un seul job d'inférence asynchrone sur Bedrock, ce qui réduit significativement les coûts. L'enjeu concret est double : vitesse et économie. Les entreprises qui traitent des documents sensibles au facteur temps, comme des contrats ou des formulaires réglementaires, peuvent utiliser le mode à la demande et obtenir un résultat en quelques secondes. Pour les traitements différés, les grands volumes ou les migrations de données historiques, le mode batch réduit la facture d'inférence tout en libérant les équipes de toute supervision manuelle. La capacité à configurer le modèle et le prompt au niveau de chaque document est particulièrement significative : elle permet d'utiliser la même infrastructure pour des types de documents très différents, sans redéploiement ni modification du pipeline, simplement en changeant les paramètres de la requête entrante. Cette solution s'inscrit dans une tendance de fond : l'automatisation de l'extraction d'information dans les secteurs très documentés, notamment l'immobilier, le droit, la finance et l'assurance, où des décennies de paperasse physique ou numérisée constituent un gisement de données encore inexploité. Amazon Bedrock, lancé en disponibilité générale en 2023, monte en puissance comme couche d'abstraction pour l'inférence LLM dans les entreprises, concurrençant directement les offres de Microsoft Azure AI et de Google Vertex AI. La gestion centralisée des prompts via Bedrock Prompt Management répond à un besoin croissant de gouvernance et de traçabilité des invocations IA en production, particulièrement dans les contextes réglementés. La prochaine étape logique pour AWS sera d'intégrer des capacités d'évaluation automatique de la qualité d'extraction directement dans ces pipelines.

UEAWS Bedrock étant disponible dans des régions européennes, les entreprises françaises et européennes des secteurs immobilier, juridique et financier peuvent déployer ces pipelines d'extraction documentaire en conservant leurs données sur l'infrastructure cloud européenne.

OutilsOutil
1 source
OpenAI lance Privacy Filter, un modèle open source de suppression des données personnelles dans les jeux de données d'entreprise
4VentureBeat AI 

OpenAI lance Privacy Filter, un modèle open source de suppression des données personnelles dans les jeux de données d'entreprise

OpenAI a publié Privacy Filter, un modèle open source spécialisé dans la détection et la suppression des informations personnelles identifiables (PII) avant qu'elles n'atteignent un serveur distant. Disponible sur Hugging Face sous licence Apache 2.0, cet outil repose sur 1,5 milliard de paramètres mais n'en active que 50 millions à chaque traitement, grâce à une architecture Sparse Mixture-of-Experts qui réduit considérablement la charge de calcul. Contrairement aux grands modèles de langage classiques qui lisent un texte de gauche à droite, Privacy Filter est un classificateur bidirectionnel de tokens : il analyse chaque phrase dans les deux sens simultanément, ce qui lui permet de mieux distinguer, par exemple, si le prénom "Alice" désigne une personne privée ou un personnage littéraire public. Le modèle gère une fenêtre de contexte de 128 000 tokens, suffisante pour traiter un document juridique entier en une seule passe, et s'appuie sur un décodeur de Viterbi contraint avec un schéma de balisage BIOES pour garantir la cohérence des entités redactées. Il détecte huit catégories de données sensibles : noms de personnes, coordonnées, identifiants numériques, URLs, numéros de compte, dates et identifiants secrets comme les clés API. L'enjeu concret est considérable pour les entreprises soumises au RGPD ou à la réglementation HIPAA dans le secteur de la santé. En déployant Privacy Filter directement sur leurs serveurs internes ou dans leur cloud privé, elles peuvent anonymiser les données localement avant de les envoyer vers un modèle plus puissant comme GPT-5 ou gpt-oss-120b, sans jamais exposer d'informations sensibles à l'extérieur. Ce modèle résout un problème structurel de l'adoption de l'IA en entreprise : le risque que des données confidentielles, médicales ou financières se retrouvent intégrées dans des pipelines d'inférence ou de fine-tuning hébergés dans le cloud. La possibilité de faire tourner le modèle sur un laptop standard ou directement dans un navigateur web abaisse encore davantage la barrière d'entrée. Cette publication s'inscrit dans un retour marqué d'OpenAI vers l'open source, après des années centrées sur des modèles propriétaires accessibles uniquement via ChatGPT et l'API. Début 2025, l'entreprise avait déjà lancé la famille gpt-oss, des modèles à poids ouverts orientés raisonnement, puis ouvert plusieurs outils d'orchestration agentique. Privacy Filter est un dérivé direct de cette famille gpt-oss, réentraîné pour la classification plutôt que la génération. Ce virage stratégique suggère qu'OpenAI cherche à consolider sa position dans l'écosystème développeur face à la concurrence de Meta (LLaMA), Mistral et Google, en proposant des briques d'infrastructure que les entreprises peuvent intégrer sans dépendance à ses services payants. La prochaine étape logique serait l'extension des catégories PII supportées et l'intégration native dans les frameworks agentiques déjà publiés.

UELes entreprises françaises et européennes soumises au RGPD peuvent déployer Privacy Filter en local pour anonymiser leurs données sensibles avant tout envoi vers un service cloud, réduisant directement leur risque de non-conformité réglementaire.

💬 C'est exactement le verrou qui bloquait l'adoption en entreprise depuis deux ans. Un modèle léger, déployable en local, qui filtre les données personnelles avant d'envoyer vers le cloud : sur le papier, c'est le genre de brique qu'on attendait. Et distribuer ça sous Apache 2.0, c'est malin : si ton pipeline s'appuie sur leurs outils gratuits, tu vas finir par appeler leurs modèles payants derrière.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, rédigé par un humain · désinscription en un clic