A Production-Style NetworKit 11.2.1 Coding Tutorial for Large-Scale Graph Analytics, Communities, Cores, and Sparsification
Cet article présente un tutoriel sur la mise en œuvre d'une chaîne de traitement de données de grande échelle pour l'analyse de graphes dans NetworKit 11.2.1, mettant l'accent sur la vitesse, l'efficacité mémoire et les API sûres par version. Le tutoriel couvre la génération d'un grand graphe réseau libre, l'extraction du composant le plus connecté, le calcul de signaux structurels via la décomposition en noyau k et le classement de centralité, ainsi que la détection de communautés avec PLM et l'estimation de la qualité en utilisant la modularité. Il aborde également l'estimation de la structure de distance en utilisant les diamètres effectifs et estimés, et la sparsification du graphe pour réduire les coûts tout en préservant les propriétés clés. Enfin, le graphe sparsifié est exporté sous forme de liste d'arêtes pour une réutilisation dans des workflows en aval, des tests de performance et une préparation de données pour l'apprentissage automatique sur les graphes.