[论文解读] SLPA: Uncovering Overlapping Communities in Social Networks via A Speaker-listener Interaction Dynamic Process
本文提出SLPA,一种动态发言者-听众标签传播算法,通过模拟节点间的信息交换,在社交网络中检测重叠社区。节点根据频率累积并传播多个标签,从而准确识别重叠节点与社区,SLPA在基准网络和真实网络中均优于现有方法,使用NMI和Qov指标评估。
Overlap is one of the characteristics of social networks, in which a person may belong to more than one social group. For this reason, discovering overlapping structures is necessary for realistic social analysis. In this paper, we present a novel, general framework to detect and analyze both individual overlapping nodes and entire communities. In this framework, nodes exchange labels according to dynamic interaction rules. A specific implementation called Speaker-listener Label Propagation Algorithm (SLPA1) demonstrates an excellent performance in identifying both overlapping nodes and overlapping communities with different degrees of diversity.
研究动机与目标
- 解决社交网络中节点属于多个群体的重叠社区检测挑战。
- 开发一种可扩展且高效的算法,利用动态交互过程建模现实的社区结构。
- 通过允许多个标签分配给单个节点,并模拟人类通信中的信息扩散,改进现有标签传播方法。
- 使用标准指标(如NMI和Qov)在合成基准数据集和真实网络上评估算法性能。
提出的方法
- 每个节点维护一个包含多个标签的记忆,代表其感知到的社区归属。
- 在每次迭代中,一个随机节点充当听众,根据邻居记忆中标签频率的成比例概率,从每个邻居接收一个标签。
- 听众从接收到的标签中选择出现频率最高的标签,相应地更新自身记忆。
- 该过程重复进行,直到满足停止条件(如固定迭代次数或收敛)。
- 后处理阶段基于每个节点记忆中累积的标签频率提取最终社区。
- 该算法高度可配置,支持对发言规则、倾听规则、记忆更新策略和停止条件进行自定义。
实验结果
研究问题
- RQ1如何通过建模节点间动态的、类人类的信息交换来改进重叠社区检测?
- RQ2SLPA在具有不同重叠程度的合成基准网络中,相较于现有重叠社区检测算法,在多大程度上表现更优?
- RQ3在真实社交网络中,SLPA在检测到的重叠结构的模块度和准确性方面表现如何?
- RQ4不同参数设置对SLPA检测具有不同多样性与重叠程度社区的能力有何影响?
- RQ5在多种网络类型中,SLPA与SOTA方法(如Copra、CFinder和LFM)相比,在鲁棒性和可扩展性方面表现如何?
主要发现
- SLPA在所有测试网络结构中均达到最高的标准化互信息(NMI),尤其在高重叠多样性情况下(如μ = 0.3和大Om)表现更优。
- 随着重叠多样性增加,SLPA的NMI下降速度慢于其他算法,表明其具有更强的鲁棒性。
- 在真实网络中,SLPA在大多数情况下获得了最高的Qov值,仅在爵士网络中略低于Copra(低0.01)。
- 在空手道网络、线虫神经网络和电子邮件网络中,SLPA的Qov值显著优于Copra,差距超过0.1。
- SLPA检测到的社区数量和重叠节点数量更接近真实情况,尤其在低至中等重叠的网络中表现更优。
- 尽管检测到的重叠节点数量少于CFinder,但SLPA的结果与非重叠社区检测基线更为一致,表明其对重叠的定义更保守且更准确。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。