Le stack de Trunk Tools réduit la révision de documents de 60 à 10 jours en abandonnant les modèles généralistes
Trunk Tools, entreprise de gestion de projets de construction, a réduit son cycle de révision de documents de 60 jours à seulement 10 jours en abandonnant les modèles d'IA généralistes au profit d'une architecture propriétaire en trois couches : perception, sémantique et agents. Sarah Buchner, fondatrice et PDG de Trunk Tools et ancienne charpentière, explique que l'entreprise a entrepris de prendre les données dispersées de multiples systèmes, de les prétraiter, de les structurer via une ontologie dans un graphe de connaissances, puis d'entraîner des modèles d'IA sur cette base. Amrish Kapoor, directeur technique de Trunk, souligne que les documents de construction posent un problème particulier : la plupart des transformeurs sont des modèles probabilistes qui identifient un élément comme "probablement" ceci ou cela, une approche insuffisante pour l'interprétation symbolique de haute précision qu'exigent ces plans, où un symbole de 2 millimètres peut avoir une signification radicalement différente selon son emplacement.
Cette approche pourrait servir de modèle pour d'autres secteurs confrontés au même problème : les modèles génériques, entraînés pour être compétents sur tout, restent faibles sur les données spécialisées. Kriti Faujdar, cheffe de produit senior en infrastructure IA, note que les termes rares, le raisonnement propre à un domaine et le contexte implicite que tout professionnel connaît intuitivement échappent aux modèles généralistes. Le développeur Sébastien De Bollivier ajoute qu'un modèle de type GPT-4 comprend un contrat juridique français mais échoue à citer précisément les articles de loi requis par les praticiens. Par ailleurs, les données les plus précieuses des entreprises n'ont jamais figuré dans les corpus d'entraînement initiaux : elles restent enfermées dans des systèmes internes et des formats propriétaires, ce qui limite l'efficacité du RAG (génération augmentée par récupération), qui ne fait que fournir de meilleurs faits à un modèle incapable de raisonner correctement dans le domaine concerné.
Pour Faujdar, la solution passe par un pré-entraînement sur des données spécifiques au secteur, suivi d'un ajustement fin sur des exemples de tâches réelles et de l'élaboration d'évaluations maison, quelques milliers d'exemples issus de praticiens valant mieux que des millions de données brutes glanées en ligne. Les architectures hybrides combinant un modèle généraliste pour le raisonnement et l'orchestration avec un modèle plus petit et spécialisé pour l'extraction sectorielle représentent une piste prometteuse, tout comme les modèles à mélange d'experts qui permettent une spécialisation sans explosion des coûts d'inférence. Le bâtiment, le droit et la santé sont cités comme les secteurs où ce type de technique gagne le plus de terrain, en raison de l'enjeu élevé des erreurs combiné à des formats de documents standardisés. Un bémol toutefois : ces modèles spécialisés perdent souvent leur efficacité en dehors de leur domaine d'expertise, sauf à être ré-entraînés.
Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.




