Skip to main content
QUICK REVIEW

[论文解读] Using Triangles to Improve Community Detection in Directed Networks

Christine Klymko, David F. Gleich|arXiv (Cornell University)|Apr 23, 2014
Complex Network Analysis Techniques参考文献 28被引用 50
一句话总结

本文提出了一种针对有向网络的新型边加权方案,利用有向三元组(三角形)的存在来改进社区检测。通过基于三角形参与度将有向图转换为加权无向图,该方法显著减少了划分过程中被切割的三元组数量——与无权方法相比,最多可减少50%——同时保持了现有社区检测性能。

ABSTRACT

In a graph, a community may be loosely defined as a group of nodes that are more closely connected to one another than to the rest of the graph. While there are a variety of metrics that can be used to specify the quality of a given community, one common theme is that flows tend to stay within communities. Hence, we expect cycles to play an important role in community detection. For undirected graphs, the importance of triangles -- an undirected 3-cycle -- has been known for a long time and can be used to improve community detection. In directed graphs, the situation is more nuanced. The smallest cycle is simply two nodes with a reciprocal connection, and using information about reciprocation has proven to improve community detection. Our new idea is based on the four types of directed triangles that contain cycles. To identify communities in directed networks, then, we propose an undirected edge-weighting scheme based on the type of the directed triangles in which edges are involved. We also propose a new metric on quality of the communities that is based on the number of 3-cycles that are split across communities. To demonstrate the impact of our new weighting, we use the standard METIS graph partitioning tool to determine communities and show experimentally that the resulting communities result in fewer 3-cycles being cut. The magnitude of the effect varies between a 10 and 50% reduction, and we also find evidence that this weighting scheme improves a task where plausible ground-truth communities are known.

研究动机与目标

  • 通过整合有向三角形的结构信息,改进有向网络中的社区检测。
  • 解决现有方法在社区分配中忽略方向流动性和环路结构的局限性。
  • 开发一种简单、即插即用的加权方案,增强标准无向社区检测工具在有向图上的适用性。
  • 提出一种新的质量度量指标——三元组切割比率,用于评估社区在多大程度上保留了有向三元组。
  • 在具有已知社区结构的真实网络上验证该方法,展示其与真实社区更高的对齐度。

提出的方法

  • 该方法通过基于边在有向三元组(长度为三的闭合路径)中的参与度,将有向网络转换为加权无向图。
  • 四种类型的有向三角形包含三元组,用于定义边的权重;处于这些三角形中的边获得更高的权重。
  • 该方法还将互惠性(相互边)作为次要加权因子,以进一步增强社区的凝聚性。
  • 将标准的无向社区检测工具(例如 METIS)应用于加权无向图,以识别社区。
  • 引入了一项新指标——三元组切割比率,用于量化划分后被分割到不同社区的三元组数量。
  • 通过合成数据和真实社区基准,对方法在真实世界网络上的表现进行了评估。

实验结果

研究问题

  • RQ1将有向三角形结构纳入边权重是否能改善有向网络中的社区检测?
  • RQ2与无权或仅基于互惠性的加权相比,基于三角形的加权在减少三元组切割方面表现如何?
  • RQ3该方法在真实世界网络中是否能提高与真实社区的对齐度?
  • RQ4三元组切割比率在多大程度上可作为评估有向社区检测的有意义指标?
  • RQ5通过此加权方案,现有无向社区检测工具能否被有效重新用于有向网络?

主要发现

  • 在 web-NotreDame 网络中,基于三元组的加权方案相比无权情况,将三元组切割比率降低了高达80%。
  • 在大多数网络中,三元组加权使被切割的三元组数量减少了10%至50%,且在除少数测试案例外的所有情况下均观察到显著改进。
  • 在八组网络中的四组(包括 Celegans、web-BerkStan、web-NotreDame 和 wiki-Vote)中,该方法比无权基线保留了更多的互惠边。
  • 在包含25个社区的 Wikipedia 数据集中,三元组加权使社区内部边的切割比例相比无权基线降低了5%。
  • 仅使用互惠边加权的方案在大多数网络中反而增加了三元组切割比率,表明其效果不如基于三元组的加权。
  • 该方法在不改变传统指标(如模块度)的前提下,提升了真实社区检测任务的性能,证明其与现有框架具有良好的兼容性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。