Skip to main content
QUICK REVIEW

[论文解读] A Survey on Subgraph Counting: Concepts, Algorithms and Applications to Network Motifs and Graphlets

Pedro Ribeiro, Pedro Paredes|arXiv (Cornell University)|Oct 29, 2019
Complex Network Analysis Techniques参考文献 172被引用 43
一句话总结

这篇论文提供了对子图计数的全面综述,将精确、近似和并行算法分类,并将它们与网络基元和图块联系起来,同时给出实现与应用。

ABSTRACT

Computing subgraph frequencies is a fundamental task that lies at the core of several network analysis methodologies, such as network motifs and graphlet-based metrics, which have been widely used to categorize and compare networks from multiple domains. Counting subgraphs is however computationally very expensive and there has been a large body of work on efficient algorithms and strategies to make subgraph counting feasible for larger subgraphs and networks. This survey aims precisely to provide a comprehensive overview of the existing methods for subgraph counting. Our main contribution is a general and structured review of existing algorithms, classifying them on a set of key characteristics, highlighting their main similarities and differences. We identify and describe the main conceptual approaches, giving insight on their advantages and limitations, and provide pointers to existing implementations. We initially focus on exact sequential algorithms, but we also do a thorough survey on approximate methodologies (with a trade-off between accuracy and execution time) and parallel strategies (that need to deal with an unbalanced search space).

研究动机与目标

  • 提供对现有子图计数算法(精确、近似和并行)的结构化、全面评述。
  • 按关键特征对算法进行分类,识别它们的相似性、差异性和局限性。
  • 突出概念性方法,讨论实际实现,并将计数与网络基元和图块的应用联系起来。
  • 澄清面向网络、面向子图和面向集合的计数方法之间的区别。
  • 就何时使用不同的计数策略提供指导,并指向可用的实现。

提出的方法

  • 将子图计数字文献组织成六个特征(方法、类型、k 限制、轨道感知、有向、代码可用性)上的分类法。
  • 将精确计数分为枚举法和解析法,然后讨论单子图搜索和封装(封装式)方法。
  • 回顾近似计数和并行策略,详细说明准确性与运行时间之间的权衡,以及如何处理不均衡的搜索空间。
  • 提供历史视角并澄清子图计数、基元与图块的正式定义。
  • 将子图计数与相关问题(FSM,子图同构)进行比较,并讨论实现的实际考量。

实验结果

研究问题

  • RQ1精确子图计数的主要算法范式有哪些,它们在方法论和可扩展性上有何差异?
  • RQ2近似计数和并行策略如何以牺牲精度换取性能,它们各自的局限性是什么?
  • RQ3影响在网络中心、子图中心和集合中心计数方法之间选择的关键因素是什么?
  • RQ4这些主要计数方法有哪些实现,与网络基元和图块的实际应用之间有何关系?
  • RQ5子图计数如何与更广泛的网络分析任务(如基元显著性和基于图块的比较)相关?

主要发现

  • 该综述提供了关于50多种精确、近似和并行子图计数算法的全面分类法和历史视角。
  • 它澄清了概念性方法、优点和局限性,并指向现有实现。
  • 它讨论了子图计数在网络基元、图块和轨道感知分析中的作用及其在各领域的应用。
  • 该工作区分网络中心、子图中心和集合中心的计数策略,并解释何时更可取。
  • 它强调了子图计数与子图同构、图块度分布及网络对齐之间的关系。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。