Skip to main content
QUICK REVIEW

[论文解读] Towards Linear Time Overlapping Community Detection in Social Networks

Jierui Xie, Bolesław K. Szymański|arXiv (Cornell University)|Feb 11, 2012
Complex Network Analysis Techniques参考文献 10被引用 35
一句话总结

该论文提出SLPA,一种线性时间重叠社区检测算法,通过在社交网络中使用动态标签传播,允许节点持有多个标签,从而实现对重叠、嵌套及二分图社区结构的检测。该算法在网络规模上实现近线性可扩展性,并在合成网络和真实世界网络(包括二分图和分层结构)中优于现有方法(如COPRA)。

ABSTRACT

Membership diversity is a characteristic aspect of social networks in which a person may belong to more than one social group. For this reason, discovering overlapping structures is necessary for realistic social analysis. In this paper, we present a fast algorithm1, called SLPA, for overlapping community detection in large-scale networks. SLPA spreads labels according to dynamic interaction rules. It can be applied to both unipartite and bipartite networks. It is also able to uncover overlapping nested hierarchy. The time complexity of SLPA scales linearly with the number of edges in the network. Experiments in both synthetic and real- world networks show that SLPA has an excellent performance in identifying both node and community level overlapping structures.

研究动机与目标

  • 解决现实社交网络中个体自然属于多个群体时,传统不相交社区检测方法的局限性。
  • 开发一种可扩展的算法,无需输入社区数量即可检测重叠社区。
  • 支持多样化网络拓扑结构,包括单部图、二分图及分层嵌套社区。
  • 在实际应用中实现线性时间复杂度,使算法适用于大规模网络。

提出的方法

  • SLPA在每个节点的内存中初始化一个唯一标签,并通过发言者与听者节点之间的动态交互迭代更新标签。
  • 在每次迭代中,听者节点从其邻居收集标签,选择概率与邻居内存中标签的频率成正比。
  • 听者将接收到频率最高的标签添加到其内存中,允许多个标签存在于单个节点,从而支持重叠社区检测。
  • 该算法通过阈值r的后处理步骤,从标签内存中过滤并提取最终社区。
  • 通过在标签传播过程中对每类节点一视同仁,支持单部图和二分图网络。
  • 通过保留标签传播历史,自然捕捉嵌套社区层次结构,并支持递归社区形成。

实验结果

研究问题

  • RQ1社区检测算法能否在准确识别大规模网络中重叠社区的同时实现线性时间复杂度?
  • RQ2与COPRA等现有方法相比,SLPA在二分图网络中的表现如何?
  • RQ3SLPA能否在真实社交网络中检测到重叠嵌套社区结构?
  • RQ4SLPA的动态标签传播机制是否能避免其他基于标签的算法中常见的产生过多小社区的问题?
  • RQ5考虑到其非确定性特性,SLPA在不同网络规模和结构变化下的鲁棒性如何?

主要发现

  • SLPA实现了与边数成线性关系的时间复杂度,使其适用于大规模网络。
  • 在类似Facebook的网络(FB-M1)中,SLPA的标准化模块度得分为0.23(标准差0.10),显著优于COPRA的0.02。
  • 在交错董事网络(IL-M2)中,SLPA得分为0.69(标准差0.01),略低于COPRA的0.72,但仍表现高效。
  • SLPA成功恢复了高中网络(HS2)中的四级嵌套社区层次结构,基于属性的社区解释匹配度高达0.85。
  • 在二分图网络中,SLPA可直接在全网络上检测到有意义的社区,而COPRA需对每类节点分别处理,且在类似Facebook的网络中未能检测到社区。
  • 当最大迭代次数T超过20时,SLPA在多次运行中表现出稳定性能,表明其对随机初始化具有鲁棒性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。