Skip to main content
QUICK REVIEW

[論文レビュー] vGraph: A Generative Model for Joint Community Detection and Node\n Representation Learning

Fan-Yun Sun, Meng Qu|arXiv (Cornell University)|Jun 18, 2019
Complex Network Analysis Techniques被引用数 45
ひとこと要約

vGraph は、各ノードをコミュニティの混合として、各コミュニティをノードの分布としてモデル化することにより、ノード表現とコミュニティ memberships を同時に学習する確率的生成モデルを提案し、変分推論とスムースネス正則化を用います。

ABSTRACT

This paper focuses on two fundamental tasks of graph analysis: community\ndetection and node representation learning, which capture the global and local\nstructures of graphs, respectively. In the current literature, these two tasks\nare usually independently studied while they are actually highly correlated. We\npropose a probabilistic generative model called vGraph to learn community\nmembership and node representation collaboratively. Specifically, we assume\nthat each node can be represented as a mixture of communities, and each\ncommunity is defined as a multinomial distribution over nodes. Both the mixing\ncoefficients and the community distribution are parameterized by the\nlow-dimensional representations of the nodes and communities. We designed an\neffective variational inference algorithm which regularizes the community\nmembership of neighboring nodes to be similar in the latent space. Experimental\nresults on multiple real-world graphs show that vGraph is very effective in\nboth community detection and node representation learning, outperforming many\ncompetitive baselines in both tasks. We show that the framework of vGraph is\nquite flexible and can be easily extended to detect hierarchical communities.\n

研究の動機と目的

  • グローバル(コミュニティ)とローカル(ノード)グラフ構造の共同学習を動機づける。
  • ノード埋め込みとコミュニティ memberships を結びつける、スケーラブルな確率的モデルを開発する。
  • 統一フレームワーク内で重複するコミュニティ検出と非重複の検出を可能にする。
  • 両タスクに対して複数の実世界データセットで経験的効果を示す。
  • 階層的なコミュニティ検出への拡張性を示す。

提案手法

  • ノードおよびコミュニティ埋込でパラメータ化された p(z|w) および p(c|z) を用いた vGraph を導入する。
  • 変分分布 q(z|w,c) を用いて p(z|w,c) を近似し、KL項を用いて ELBO を最大化する。
  • Eq. (7) を用いて隣接ノードを集約して p(z|w) を計算する。
  • 離散コミュニティ変数には Gumbel-Softmax の再パラメータ化を活用する。
  • 近傍ノードが類似のコミュニティ分布を共有するよう促すスムースネス正則化項(L_reg)を組み込む。
  • d レベルのツリーが vec{z} のコミュニティ決定ベクトルを生み出す階層拡張を提供する。

実験結果

リサーチクエスチョン

  • RQ1ノード埋め込みとコミュニティ memberships の結合モデル化は、別個のアプローチと比較して、コミュニティ検出とノード表現学習の両方を改善しますか?
  • RQ2隣接ノードに対するスムースネス正則化を組み込むと、重複および非重複のコミュニティ検出の性能が向上しますか?
  • RQ3大規模グラフに対する vGraph のスケーラビリティはどの程度か、階層的なコミュニティ検出に拡張できますか?

主な発見

  • vGraphは、複数のデータセットにおける重複するコミュニティ検出で、F1スコアまたはジャカード係数の点でベースライン手法を上回る。
  • 埋め込み+クラスタリングのベースラインと比較して、非重複コミュニティ検出の NMI およびモジュラリティで競争力のある、または優れた結果を達成。
  • グローバルなコミュニティ文脈をノード埋め込みに組み込むことにより、ノード分類性能が高く、しばしばベースラインを上回る。
  • スムースネス正則化(vGraph+)はベースのvGraphモデルより一貫して結果を改善する。
  • このフレームワークは、第一層および第二層コミュニティの直感的な可視化とともに、階層的なコミュニティ検出をサポートします。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。