Skip to main content
QUICK REVIEW

[论文解读] vGraph: A Generative Model for Joint Community Detection and Node Representation Learning

Fan-Yun Sun, Meng Qu|arXiv (Cornell University)|Jun 18, 2019
Complex Network Analysis Techniques被引用 45
一句话总结

vGraph 提出一个概率生成模型,通过将每个节点建模为社区的混合,并将每个社区建模为对节点的分布,来联合学习节点表示和社区成员资格,使用变分推断和一个平滑性正则化项。

ABSTRACT

This paper focuses on two fundamental tasks of graph analysis: community detection and node representation learning, which capture the global and local structures of graphs, respectively. In the current literature, these two tasks are usually independently studied while they are actually highly correlated. We propose a probabilistic generative model called vGraph to learn community membership and node representation collaboratively. Specifically, we assume that each node can be represented as a mixture of communities, and each community is defined as a multinomial distribution over nodes. Both the mixing coefficients and the community distribution are parameterized by the low-dimensional representations of the nodes and communities. We designed an effective variational inference algorithm which regularizes the community membership of neighboring nodes to be similar in the latent space. Experimental results on multiple real-world graphs show that vGraph is very effective in both community detection and node representation learning, outperforming many competitive baselines in both tasks. We show that the framework of vGraph is quite flexible and can be easily extended to detect hierarchical communities.

研究动机与目标

  • 推动全局(社区)和局部(节点)图结构的联合学习。
  • 开发一个可扩展的概率模型,将节点嵌入与社区成员资格耦合起来。
  • 在一个统一框架内实现重叠和非重叠社区检测。
  • 在多个真实数据集上展示两类任务的经验有效性。
  • 展示对分层社区检测的可扩展性。

提出的方法

  • 引入 vGraph,使用由节点和社区嵌入参数化的 p(z|w) 和 p(c|z)。
  • 使用变分分布 q(z|w,c) 来近似 p(z|w,c),并通过 KL 项最大化 ELBO。
  • 通过对邻居聚合来计算 p(z|w),使用 Eq. (7)。
  • 对离散社区变量使用 Gumbel-Softmax 重参数化。
  • 引入一个平滑正则化项,鼓励相邻节点共享相似的社区分布(L_reg)。
  • 提供一个分层扩展,其中一个 d 级树产生一个社区决策向量 vec{z}。

实验结果

研究问题

  • RQ1将节点嵌入和社区成员资格联合建模,是否能相较于分离方法同时改善社区检测和节点表示学习?
  • RQ2在相邻节点上引入平滑正则化是否会提升重叠与非重叠社区检测的性能?
  • RQ3vGraph 对大图的扩展性如何,是否能够扩展到分层社区检测?

主要发现

  • 在跨多个数据集的重叠社区检测中,vGraph 在 F1-Score 或 Jaccard 相似性方面优于基线方法。
  • 相较于嵌入+聚类基线,vGraph 在非重叠社区检测的 NMI 和模块度方面取得具有竞争力甚至更优的结果。
  • vGraph 在节点分类任务中表现强劲,通常超过基线,因为将全局社区上下文融入节点嵌入。
  • 平滑正则化(vGraph+)在结果上始终优于基础的 vGraph 模型。
  • 该框架支持分层社区检测,并直观可视化第一层和第二层社区。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。