OutilsVentureBeat AI6sem

Intuit a réduit des mois de travail fiscal à quelques heures, avec un workflow adaptable aux secteurs réglementés

Résumé IASource uniqueImpact UE

Lorsque le projet de loi fiscal américain "One Big Beautiful Bill" a été adopté, l'équipe de TurboTax chez Intuit s'est retrouvée face à un document de plus de 900 pages non structurées, sans formulaires officiels de l'IRS disponibles et avec une date de livraison impossible à repousser. Plutôt que de suivre la procédure habituelle qui prenait plusieurs mois, l'équipe a construit un pipeline de travail combinant des modèles de langage commerciaux, un langage de programmation propriétaire et un framework de tests unitaires sur mesure. Joy Shaw, directrice fiscale chez Intuit depuis plus de 30 ans, a supervisé le processus : les équipes ont utilisé ChatGPT pour résumer successivement les versions de la Chambre et du Sénat, réconcilier les différences de formulation entre les deux textes, puis filtrer uniquement les dispositions impactant les clients de TurboTax. Des tâches qui prenaient auparavant plusieurs semaines ont été réduites à quelques heures.

La prouesse va bien au-delà d'un simple gain de productivité. TurboTax repose sur un langage de programmation propriétaire développé en interne chez Intuit, et non sur un langage standard comme Python ou Java. Aucun modèle de langage n'a été entraîné sur cette syntaxe, ce qui rend la génération de code particulièrement délicate. C'est Claude, le modèle d'Anthropic, qui a été utilisé pour traduire le texte juridique en code fonctionnel et cartographier les dépendances entre les nouvelles dispositions et les décennies de code existant. Deux outils propriétaires ont également été développés pendant ce cycle : le premier génère automatiquement les écrans produit de TurboTax à partir des changements législatifs, une tâche auparavant réalisée manuellement pour chaque disposition ; le second produit des cas de test unitaires directement à partir du texte de loi, permettant de vérifier la conformité avec un seuil d'erreur proche de zéro, indispensable dans un domaine où la moindre imprécision engage la responsabilité légale d'Intuit.

Ce workflow a été forgé sous contrainte, mais il dessine un modèle applicable bien au-delà de la fiscalité. Lors de la précédente grande réforme fiscale américaine, le Tax Cuts and Jobs Act de 2017, les mêmes équipes avaient traversé le même processus sans assistance de l'IA, en plusieurs mois de travail manuel. La comparaison illustre l'ampleur du changement. Des secteurs entiers soumis à des corpus réglementaires complexes, comme la santé, la finance ou le droit, font face aux mêmes défis : documents non structurés, délais serrés, exigence de conformité absolue. Intuit a montré qu'il est possible de combiner des LLM généralistes pour l'analyse et des modèles plus spécialisés pour la génération de code, tout en conservant des humains en bout de chaîne pour la validation. La question n'est plus de savoir si l'IA peut s'intégrer dans ces pipelines réglementaires, mais à quelle vitesse les autres acteurs vont adapter cette approche à leurs propres contraintes de domaine.

Impact France/UE

La méthodologie illustre une approche reproductible pour les entreprises européennes des secteurs réglementés (santé, finance, droit) confrontées à des corpus documentaires complexes et des délais de conformité serrés.

Dans nos dossiers

Anthropic

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

1Presse-citron

L’IA brise les règles de la conception automobile : un travail de plusieurs mois se fait maintenant en quelques heures

L'intelligence artificielle est en train de bouleverser les méthodes de conception automobile, compressant des cycles de travail de plusieurs mois en quelques heures seulement. Des outils d'IA générative permettent désormais de produire des modèles 3D complets à partir de simples croquis dessinés à la main par les designers. En parallèle, d'autres solutions calculent instantanément la traînée aérodynamique après chaque modification apportée à la silhouette d'un véhicule, une opération qui nécessitait autrefois des journées entières de simulation numérique. Pour les constructeurs, ces gains de temps représentent un avantage compétitif considérable. Le développement d'un véhicule, traditionnellement étalé sur plusieurs années, peut désormais être accéléré de façon significative, réduisant les coûts et permettant de tester un plus grand nombre de variantes. Les équipes de design et d'ingénierie peuvent itérer en temps réel, passant du croquis à l'évaluation physique sans attendre les longues phases de validation intermédiaire. Cette transformation s'inscrit dans une mutation plus profonde de l'industrie, portée par le concept de "véhicule défini par logiciel". L'IA générative, déjà très performante en développement logiciel, aide les constructeurs à produire plus rapidement les systèmes embarqués complexes que ces véhicules requièrent. Alors que la pression concurrentielle de Tesla et des fabricants chinois comme BYD s'intensifie, réduire les délais de mise sur le marché est devenu une priorité stratégique, faisant de l'IA un levier industriel autant qu'un simple outil de productivité.

UELes constructeurs européens comme Renault et Stellantis sont directement concernés par cette accélération des cycles de conception face à la pression concurrentielle chinoise.

OutilsOutil

1 source

2MarkTechPost

Créer un workflow SuperClaude avec commandes, agents, modes et mémoire de session

Un tutoriel publié récemment détaille comment construire un workflow d'IA avancé en s'appuyant sur le SuperClaude Framework, une couche structurée développée au-dessus de l'API Anthropic. Le projet, hébergé sur GitHub sous l'organisation SuperClaude-Org, s'articule autour de trois types d'assets : des commandes, des agents et des modes, tous définis sous forme de fichiers Markdown. Le tutoriel montre comment créer un pont Python qui clone le dépôt, parcourt ses fichiers, et injecte dynamiquement le contenu Markdown pertinent dans le prompt système avant chaque appel au modèle claude-sonnet-4-5. Les cas d'usage couverts sont variés : brainstorming, implémentation frontend, analyse de sécurité, stratégie business, planification de recherche approfondie, et workflows de développement enchaînés en plusieurs étapes avec sauvegarde et reprise de session. Ce type d'approche représente une avancée concrète pour les équipes de développement qui utilisent les LLM au quotidien. Plutôt que de réécrire des prompts complexes à chaque session, le framework permet de mutualiser des comportements réutilisables : un agent "sécurité" charge automatiquement les instructions de revue de code défensif, un mode "token-efficient" adapte la verbosité des réponses, un agent "frontend" embarque les bonnes pratiques React ou Vue. Le résultat est un système de prompting cohérent, sensible au rôle demandé, et adapté aux tâches longues de développement logiciel assisté par IA. La mémoire de session, qui permet de sauvegarder et recharger le contexte d'une conversation, réduit également la friction lors de projets s'étalant sur plusieurs interactions. Ce tutoriel s'inscrit dans une tendance plus large qui voit émerger des frameworks d'orchestration destinés à industrialiser l'usage des modèles de langage dans les flux de travail professionnels. Depuis l'ouverture de l'API Claude d'Anthropic, plusieurs projets communautaires cherchent à combler l'écart entre les capacités brutes du modèle et les besoins structurés des développeurs : gestion du contexte, séparation des responsabilités, standardisation des prompts. SuperClaude Framework positionne ses fichiers Markdown comme des "assets de comportement" réutilisables, une approche qui rappelle les system prompts modulaires expérimentés dans d'autres écosystèmes comme LangChain ou CrewAI. L'utilisation de claude-sonnet-4-5 comme modèle cible suggère une orientation vers un équilibre coût-performance plutôt que vers les modèles les plus puissants. La prochaine étape logique pour ce type de framework serait l'intégration de mécanismes d'évaluation automatique des sorties et de routage conditionnel entre agents, des fonctionnalités que plusieurs projets concurrents commencent déjà à proposer.

💬 C'est exactement ce que je faisais à la main depuis des mois, mais formalisé. Mutualiser des comportements de prompting sous forme de fichiers Markdown réutilisables, c'est simple et ça marche, surtout quand on enchaîne des sessions longues sans vouloir tout réexpliquer à chaque fois. Reste à voir si la couche d'injection dynamique tient quand les fichiers se multiplient.

OutilsOutil

1 source

3AWS ML Blog

Miro utilise Amazon Bedrock pour améliorer le routage des bugs logiciels et réduire le délai de résolution de plusieurs jours à quelques heures

Miro, la plateforme de collaboration visuelle utilisée par plus de 95 millions d'utilisateurs dans le monde, a développé un système d'intelligence artificielle baptisé BugManager pour automatiser le tri et l'affectation des rapports de bugs à ses équipes d'ingénierie. Avant cette solution, une part significative des bugs manquait les délais internes de résolution, principalement à cause d'erreurs d'affectation et de multiples réassignations entre équipes. L'entreprise estimait ces dysfonctionnements à 42 années cumulées de productivité perdue chaque année. BugManager a été développé en partenariat avec l'équipe AWS Prototyping and Cloud Engineering (PACE) et s'appuie sur Amazon Bedrock, Amazon Nova Pro et Claude Sonnet 4 d'Anthropic. Le résultat est saisissant : six fois moins de réassignations entre équipes, et un temps de résolution réduit de plusieurs jours à quelques heures. L'impact est d'abord opérationnel : les développeurs passent moins de temps à gérer des tickets mal orientés et peuvent se concentrer sur la résolution réelle des problèmes. Pour une organisation comptant près de 100 équipes, chacune responsable d'une portion spécifique du produit, un mauvais routage engendre des investigations redondantes, de la frustration, et des retards visibles pour les utilisateurs finaux. En passant d'une logique de classification traditionnelle à une approche basée sur la génération augmentée par récupération (RAG), Miro s'affranchit également de la nécessité de réentraîner ses modèles à chaque réorganisation interne, ce qui représente un gain stratégique considérable dans un environnement où les équipes fusionnent, se créent ou évoluent régulièrement. Les approches précédentes de Miro reposaient sur des modèles fine-tunés comme BERT ou GPT, qui se dégradaient rapidement dès que la structure organisationnelle changeait, faute de données d'entraînement suffisantes pour les nouvelles configurations. BugManager adopte une architecture radicalement différente : lorsqu'un bug est soumis, le système commence par analyser les éléments non textuels (captures d'écran, enregistrements vidéo) via les capacités multimodales d'Amazon Nova Pro, puis enrichit le rapport via des bases de connaissances contenant des tickets Jira déjà résolus, des pull requests GitHub, de la documentation Confluence et des fichiers README. Claude Sonnet 4, via Amazon Bedrock, synthétise ensuite ces informations pour affecter le bug à l'équipe la plus pertinente, sans nécessiter aucun réentraînement. Cette approche "zero-training" représente une tendance de fond dans l'industrie : déléguer la classification complexe à des grands modèles de langage enrichis de contexte métier, plutôt que de maintenir des pipelines d'entraînement coûteux et fragiles.

UELe modèle architectural RAG sans réentraînement décrit constitue une référence concrète applicable par les équipes d'ingénierie françaises et européennes cherchant à automatiser leur gestion de tickets sans pipeline ML coûteux.

OutilsOutil

1 source

4Le Big Data

Comment les Workflows de Mistral AI transforment l’IA en moteur opérationnel ?

Mistral AI a lancé une fonctionnalité baptisée Workflows, intégrée à sa plateforme Studio, qui vise à résoudre l'un des problèmes les plus documentés de l'IA en entreprise : moins de 20 % des projets d'IA atteignent réellement la production. La startup française propose une couche d'orchestration permettant de passer d'un prototype à un déploiement opérationnel en quelques jours. Techniquement, la solution s'appuie sur le moteur Temporal, déjà adopté par des entreprises comme Salesforce, Netflix ou Stripe, mais adapté aux contraintes spécifiques de l'IA générative : gestion du streaming, mutualisation des ressources, traçage des exécutions et reprise automatique en cas d'erreur. Le modèle de déploiement sépare le plan de contrôle, hébergé par Mistral, du plan de données, qui reste dans l'environnement de l'entreprise via Kubernetes. Des acteurs comme CMA-CGM et La Banque Postale figurent parmi les premiers déploiements concrets. L'enjeu est majeur pour les équipes techniques qui, jusqu'ici, devaient assembler elles-mêmes agents, connecteurs, outils d'observabilité et gestion des erreurs à partir de briques hétérogènes, mobilisant parfois des mois de développement avant d'atteindre une version stable. Les Workflows de Mistral proposent un cadre unifié où ces composants fonctionnent ensemble dès le départ. Le SDK simplifie la configuration des politiques de reprise, des délais d'attente et de la gestion des erreurs en quelques lignes de Python, ce qui permet aux développeurs de se concentrer sur la logique métier plutôt que sur l'infrastructure. L'intégration avec Le Chat permet également aux équipes non techniques d'exécuter ces workflows sans friction, ce qui réduit la fracture habituelle entre développeurs et utilisateurs métiers. Ce lancement s'inscrit dans une compétition accélérée entre fournisseurs de modèles qui cherchent à monter dans la chaîne de valeur, au-delà de la simple inférence. OpenAI, Google et Anthropic investissent tous dans des couches d'orchestration et d'agents, mais Mistral joue une carte différente : la souveraineté des données et le déploiement en environnement contrôlé, un argument central pour les entreprises européennes soumises au RGPD et aux exigences sectorielles strictes du secteur financier ou logistique. En positionnant Workflows comme une infrastructure industrielle plutôt qu'un outil d'expérimentation, Mistral tente de s'imposer comme le partenaire de référence pour les grandes organisations qui ont besoin de garanties sur la fiabilité, l'observabilité et la conformité de leurs systèmes d'IA en production.

UELe lancement de Mistral Workflows renforce la position de cette startup française comme alternative souveraine pour les grandes organisations européennes soumises au RGPD, avec des premiers déploiements concrets chez CMA-CGM et La Banque Postale.

💬 Ce problème des 20% de projets IA qui n'atteignent jamais la prod, tout dev qui bosse en entreprise le connaît. Mistral n'a pas réinventé la roue : ils ont pris Temporal (déjà chez Netflix et Stripe) et l'ont adapté aux contraintes du génératif, ce qui évite de passer six mois à assembler soi-même des briques qui ne se parlent pas. L'argument souveraineté RGPD, c'est pas du flan quand tes premiers clients sont CMA-CGM et La Banque Postale.

OutilsOutil

1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour