Aller au contenu principal
Meta utilise l'IA pour cartographier les connaissances tacites dans ses pipelines de données
OutilsMeta Engineering ML12sem· 2 min de lecture

Meta utilise l'IA pour cartographier les connaissances tacites dans ses pipelines de données

Source originale ↗·

Meta a développé un système original pour rendre ses agents IA capables de travailler efficacement sur une base de code massive : un pipeline de données couvrant quatre dépôts, trois langages de programmation et plus de 4 100 fichiers. Face à l'inefficacité des assistants IA classiques sur ce terrain, incapables de produire des modifications utiles rapidement, les ingénieurs ont conçu un moteur de pré-calcul composé de plus de 50 agents IA spécialisés. Ces agents ont systématiquement parcouru l'ensemble du code pour produire 59 fichiers de contexte condensés, encodant ce que les développeurs appellent le « tribal knowledge » : les règles implicites et les conventions qui n'existent que dans la tête des ingénieurs. Résultat : la couverture structurée du code est passée de 5 % à 100 % des modules, soit les 4 100 fichiers des trois dépôts. Plus de 50 patterns « non-évidents » ont été documentés pour la première fois, et les tests préliminaires montrent une réduction de 40 % des appels d'outils par les agents IA pour chaque tâche.

L'enjeu n'est pas anodin. Sans cette cartographie, les agents IA se comportaient comme des développeurs juniors largués sur un projet inconnu : ils compilaient du code fonctionnel en apparence, mais subtilement incorrect. Par exemple, deux modes de configuration utilisent des noms de champs différents pour la même opération, les inverser produit une erreur silencieuse. Ou encore, des dizaines de valeurs d'énumération marquées « deprecated » ne peuvent jamais être supprimées, car la compatibilité de sérialisation en dépend. Aucune de ces règles n'était écrite nulle part. En les formalisant, Meta permet désormais à des modèles IA variés de naviguer le codebase de manière fiable, le système de connaissance étant indépendant du modèle utilisé. L'infrastructure se maintient aussi elle-même : toutes les quelques semaines, des jobs automatisés valident les chemins de fichiers, détectent les lacunes de couverture et corrigent les références obsolètes.

Ce projet s'inscrit dans une tendance plus large où les grandes entreprises tech cherchent à industrialiser l'usage des agents IA sur des codebases de production réels, bien au-delà des démos. Meta avait déjà déployé des systèmes IA pour des tâches opérationnelles, surveillance de dashboards, reconnaissance de patterns incidents, suggestions de corrections, mais l'extension aux tâches de développement butait sur ce problème fondamental d'absence de contexte. La solution choisie, baptisée « compass, not encyclopedia », repose sur des fichiers ultra-compacts de 25 à 35 lignes environ 1 000 tokens chacun, organisés en quatre sections : commandes clés, fichiers essentiels, patterns non-évidents, et références croisées. Les 59 fichiers réunis pèsent moins d'un contexte de modèle standard. C'est cette sobriété délibérée, chaque ligne justifie sa présence, qui permet au système de rester maintenable et scalable à mesure que le codebase évolue.

Dans nos dossiers

Cet article vous a été utile ?

Vu une erreur factuelle dans cet article ? Signalez-la. Toutes les corrections valides sont publiées sur /corrections.

À lire aussi

SAP unifie ses données commerciales pour personnaliser l'IA
1AI News 

SAP unifie ses données commerciales pour personnaliser l'IA

SAP a lancé un programme baptisé « Advanced Success Plan » destiné à ses solutions SAP Customer Experience, avec pour objectif de résoudre l'un des problèmes structurels les plus répandus dans les grandes entreprises : l'incapacité à mettre en œuvre une personnalisation pilotée par l'IA à grande échelle. Malgré des ambitions affichées, la plupart des organisations se heurtent au même obstacle : leurs données clients sont éparpillées dans des silos déconnectés, leurs moteurs de recommandation affichent des résultats génériques, leurs campagnes email suivent des calendriers rigides plutôt que les comportements réels des utilisateurs, et leurs programmes de fidélité ignorent tout ce qui ne relève pas d'une transaction financière. L'Advanced Success Plan propose un cadre structuré en trois couches opérationnelles, données, décision, et diffusion, pour faire passer les entreprises d'une logique de solutions ponctuelles à un modèle intégré et continu. La première couche, celle des données, consiste à agréger en temps réel des profils clients unifiés qui consolident les transactions passées, l'historique d'engagement, le comportement de navigation, les tickets de support et l'activité de fidélité, tout en respectant les consentements. La couche de décision exploite ensuite ces données pour que les algorithmes d'IA déterminent quel produit afficher, quelle offre promotionnelle proposer et quel est le moment optimal pour prendre contact. Cette couche implique un cadre de gouvernance précis définissant quand l'algorithme agit seul et quand un opérateur humain reprend la main. Enfin, la couche de diffusion orchestre la livraison de ces expériences personnalisées sur le storefront en ligne, par email, via notifications push mobile et au sein des interfaces de fidélité, en s'assurant que chaque message correspond au contexte réel du client au moment de l'envoi. SAP Commerce Cloud constitue le moteur d'exécution de ce dispositif : il analyse les comportements de navigation en temps réel pour afficher des recommandations de produits pertinentes, des articles associés et des accessoires complémentaires, contournant ainsi les configurations de merchandising statiques que les équipes humaines ne peuvent pas gérer à ce volume. Ce projet s'inscrit dans une course plus large entre les éditeurs de logiciels d'entreprise pour transformer leurs plateformes en systèmes d'IA opérationnels, et non plus seulement analytiques. SAP, qui équipe une part significative des grandes entreprises mondiales, est bien positionné pour imposer ce standard : ses clients disposent déjà des données et des systèmes transactionnels nécessaires, mais manquent de l'architecture de gouvernance et de l'accompagnement technique pour activer les fonctionnalités avancées. L'Advanced Success Plan cherche précisément à combler cet écart d'activation, en déployant expertise et structures de gouvernance plutôt qu'en ajoutant de nouvelles couches logicielles. L'enjeu pour l'industrie est considérable : si la personnalisation à l'IA devient la norme opérationnelle dans le commerce B2C et B2B, les entreprises qui ne franchissent pas ce cap risquent de voir leur taux de conversion et leur fidélisation clients décrocher durablement face à des concurrents mieux équipés.

UESAP étant une entreprise allemande qui équipe une large part des grandes entreprises européennes, ce programme concerne directement les DSI et équipes CX françaises et européennes utilisant SAP Customer Experience.

💬 Ce que SAP vend ici, c'est du déblocage, pas de la technologie. La plupart de ses clients ont déjà les données, les systèmes transactionnels et souvent les licences pour les fonctionnalités avancées. Ce qui bloque, c'est la gouvernance et l'architecture d'activation, et SAP a compris que combler cet écart-là, c'est un marché en soi.

OutilsOutil
1 source
Algorithmes de recommandation dans l’iGaming : comment les plateformes utilisent les données pour personnaliser le contenu
2Le Big Data 

Algorithmes de recommandation dans l’iGaming : comment les plateformes utilisent les données pour personnaliser le contenu

Les plateformes de jeux en ligne (iGaming) déploient depuis plusieurs années des algorithmes de recommandation sophistiqués pour guider les joueurs vers des jeux, des bonus et des fonctionnalités adaptés à leur profil. Ces systèmes reposent sur trois grandes catégories de données : comportementales (clics, temps de session, navigation), transactionnelles (montants misés, historique des dépôts) et contextuelles (type d'appareil, heure de connexion). À partir de ces signaux, les plateformes construisent des indicateurs individuels, fréquence de jeu, jeux préférés, taille moyenne des mises, qui alimentent des modèles d'apprentissage automatique capables de proposer des suggestions de plus en plus précises au fil du temps. Trois familles d'algorithmes dominent le secteur : le filtrage basé sur le contenu, qui recommande des titres similaires à ceux déjà appréciés ; le filtrage collaboratif, qui s'appuie sur les comportements d'utilisateurs aux profils proches pour introduire de la diversité ; et les systèmes hybrides, qui combinent les deux approches et intègrent parfois des règles manuelles pour mettre en avant des nouveautés ou des promotions actives. L'impact de ces systèmes est direct et mesurable : en réduisant le temps que le joueur passe à chercher un jeu adapté, les plateformes augmentent l'engagement et la rétention. Les utilisateurs voient des recommandations cohérentes avec leurs habitudes dès leur connexion, sans avoir à parcourir un catalogue de plusieurs centaines de titres. Certaines plateformes ont poussé la logique plus loin en adoptant des systèmes adaptatifs en temps réel, capables d'ajuster les suggestions en cours de session selon les signaux immédiats. Cette personnalisation fine génère un avantage concurrentiel significatif, mais elle soulève aussi des questions sur l'équilibre à trouver entre pertinence commerciale et responsabilité vis-à-vis des joueurs, notamment ceux présentant des comportements à risque. Le développement de ces technologies dans l'iGaming suit la trajectoire déjà tracée par le e-commerce et les plateformes de streaming, qui ont démontré depuis longtemps l'efficacité de la recommandation personnalisée pour augmenter le temps passé et les conversions. Pour les opérateurs de jeux en ligne, l'enjeu est double : affiner continuellement leurs modèles pour rester compétitifs face à des marchés très saturés, et gérer la conformité réglementaire dans des juridictions qui encadrent de plus en plus strictement l'usage des données personnelles dans ce secteur. En parallèle, des acteurs externes comme les comparateurs de bonus continuent d'exister en complément, répondant au besoin des joueurs de disposer d'un regard indépendant avant de s'engager sur une plateforme donnée.

UELes opérateurs de jeux en ligne actifs en France sont soumis à la réglementation de l'ANJ et au RGPD, qui encadrent strictement l'usage des données personnelles à des fins de personnalisation comportementale.

OutilsOutil
1 source
Les coulisses du système LLM de Target pour le matching sémantique dans les pipelines de prévision marketing
3InfoQ AI 

Les coulisses du système LLM de Target pour le matching sémantique dans les pipelines de prévision marketing

Target, le géant américain de la grande distribution, a développé un système d'intelligence artificielle générative destiné à améliorer la prévision de ses campagnes marketing. Baptisé système de correspondance sémantique, il fonctionne en trois étapes : génération d'embeddings pour représenter chaque campagne sous forme vectorielle, recherche par similarité dans une base de campagnes historiques, puis reclassement des résultats par un grand modèle de langage (LLM). Les évaluations internes montrent un taux de couverture de 75 % pour le premier résultat retourné (top-1) et de 100 % pour les trois premiers (top-3), ce qui signifie que la campagne la plus pertinente figure systématiquement parmi les trois premières suggestions. Ce système remplace des workflows fondés sur des règles métier codées manuellement, souvent rigides et coûteux à maintenir. En automatisant la recherche de précédents pertinents, Target réduit le temps d'analyse de ses équipes marketing et améliore la cohérence des prévisions d'une campagne à l'autre. Un mécanisme de boucle de rétroaction permet d'affiner continuellement la qualité de la récupération en intégrant les résultats réels des campagnes passées, rendant le système plus précis à mesure qu'il accumule des données. Cette initiative s'inscrit dans une tendance de fond : les grands distributeurs intègrent désormais des architectures RAG (retrieval-augmented generation) dans leurs pipelines opérationnels, au-delà des usages conversationnels. Pour Target, dont les dépenses marketing représentent des centaines de millions de dollars annuels, gagner en précision prédictive peut avoir un impact financier significatif. L'approche illustre comment les LLMs passent du rôle de générateurs de texte à celui de moteurs de décision métier intégrés dans des systèmes de production industriels.

OutilsOutil
1 source
Déploiement de l'IA dans le retail pour personnaliser l'expérience et mieux connaître les clients
4AI News 

Déploiement de l'IA dans le retail pour personnaliser l'expérience et mieux connaître les clients

Les détaillants en ligne remplacent leurs interfaces statiques par des systèmes d'intelligence artificielle capables de modifier l'environnement utilisateur en temps réel, pendant la session même de navigation. Les Generative User Interfaces s'appuient sur des modèles prédictifs qui analysent le clic en direct, l'historique d'achat et l'intention supposée du visiteur pour construire une mise en page, des textes et des composants interactifs propres à chaque session. Selon une étude McKinsey, 76% des consommateurs se disent frustrés lorsqu'une expérience numérique ne s'adapte pas à leurs besoins, tandis que les entreprises qui déploient des mises en page personnalisées en temps réel augmentent leur fréquence d'achat de 35% et leur panier moyen de 21%. Parallèlement, la vidéo représente désormais 82% du trafic internet total, les consommateurs passant plus de 60% de leur temps sur des contenus streamés, ce qui pousse les équipes marketing à adopter des plateformes d'écoute sociale multimodales capables d'ingérer flux vidéo, audio et images non étiquetées pour repérer logos, usages de produits et sentiment exprimé oralement. Ce marché des systèmes d'analyse multimodale doit atteindre 2,83 milliards de dollars cette année. Cette bascule change concrètement le rapport de force entre marques et consommateurs. Les entreprises qui investissent dans ces pipelines de détection précoce obtiennent un net avantage analytique: 76% des analystes médias rapportent un retour sur investissement mesurable sur les plateformes visuelles, contre moins de 60% pour ceux qui se limitent aux bases de données textuelles. Repérer une tendance visuelle ou une mention non associée à la marque avant qu'elle n'explose sur les moteurs de recherche classiques donne aux équipes logistiques une fenêtre cruciale pour ajuster les stocks régionaux face à un pic soudain de demande. Sur le plan des tests marketing, les simulations d'utilisateurs synthétiques, construites à partir de grands modèles de langage, remplacent progressivement les focus groups humains coûteux et lents: des personas virtuels dotés de profils démographiques, psychométriques et comportementaux permettent de mener des milliers d'entretiens automatisés et de tests d'interface en parallèle. Cette transformation s'inscrit dans une course plus large à l'automatisation de la relation client, où l'échec des approches par segmentation démographique classique pousse les équipes techniques vers des architectures capables de raisonner session par session. Les ingénieurs combinent différents cadres de modèles, du simple modèle unique aux moteurs capables de basculer dynamiquement entre architectures selon la tâche, et réinjectent en continu des données d'entretiens humains réels pour éviter que les populations synthétiques ne s'éloignent de la réalité du marché. Ces personas permettent ainsi d'identifier les frictions d'usage dans une application avant même sa mise en production, une étape qui préfigure une automatisation encore plus poussée des infrastructures physiques et périphériques évoquée dans la suite de l'article.

💬 Le vrai changement ici, c'est que le site ne te montre plus une page, il te montre une prédiction de toi, calculée en direct sur ton clic. Bon, sur le papier les chiffres McKinsey donnent envie (35% d'achats en plus, quand même), mais je me méfie surtout des personas synthétiques qui remplacent les focus groups: un LLM qui simule un client reste un LLM, pas quelqu'un qui hésite vraiment devant son panier. Reste à voir si ça tient en prod quand la simulation s'éloigne trop du vrai marché.

OutilsOutil
1 source

Recevez l'essentiel de l'IA chaque jour

Une sélection éditoriale quotidienne, sans bruit. Directement dans votre boîte mail.

Recevez l'essentiel de l'IA chaque jour

Gratuit · 1 email le matin, l'essentiel de l'IA · désinscription en un clic