QUICK REVIEW

[論文レビュー] Towards Linear Time Overlapping Community Detection in Social Networks

Jierui Xie, Bolesław K. Szymański|arXiv (Cornell University)|Feb 11, 2012

Complex Network Analysis Techniques参考文献 10被引用数 35

ひとこと要約

本稿では、社会的ネットワークにおける動的ラベル伝播を用いて、ノードが複数のラベルを保持できることを許容することで、重複する、ネストされた、および二部構造のコミュニティ構造を検出可能な線形時間の重複コミュニティ検出アルゴリズムであるSLPAを提案する。本手法はネットワークサイズに対してほぼ線形のスケーラビリティを達成し、合成ネットワークおよび実世界のネットワーク（二部構造および階層的構造を含む）において、COPRAなどの既存手法を上回る性能を発揮する。

ABSTRACT

Membership diversity is a characteristic aspect of social networks in which a person may belong to more than one social group. For this reason, discovering overlapping structures is necessary for realistic social analysis. In this paper, we present a fast algorithm1, called SLPA, for overlapping community detection in large-scale networks. SLPA spreads labels according to dynamic interaction rules. It can be applied to both unipartite and bipartite networks. It is also able to uncover overlapping nested hierarchy. The time complexity of SLPA scales linearly with the number of edges in the network. Experiments in both synthetic and real- world networks show that SLPA has an excellent performance in identifying both node and community level overlapping structures.

研究の動機と目的

現実の社会的ネットワークでは人々が自然に複数のグループに属するが、これに対して、非重複コミュニティ検出手法にはその制限があるため、これを解消すること。
コミュニティ数を事前入力として必要としない、スケーラブルなアルゴリズムを開発すること。
単一部、二部、および階層的ネストされたコミュニティを含む多様なネットワークトポロジーをサポートすること。
実用的に線形時間計算量を達成し、大規模ネットワークへの適用を可能とすること。

提案手法

SLPAは、各ノードに固有のラベルを初期化し、発話者と聴聞者ノード間の動的相互作用を通じてラベルを反復的に更新する。
各反復において、聴聞者ノードは隣接ノードからラベルを収集し、その選択確率は隣接ノードのメモリ内におけるラベル頻度に比例する。
聴聞者ノードは、最も頻繁に受信したラベルを自身のメモリに追加することで、ノードごとに複数のラベルを保持でき、重複コミュニティ検出が可能になる。
アルゴリズムは、ラベルメモリから最終的なコミュニティを抽出するために、しきい値rを用いた後処理ステップを実施する。
ラベル伝播プロセスにおいてノードタイプを一様に扱うことで、単一部および二部ネットワークの両方をサポートする。
ラベル伝播履歴を保持することで、ネストされたコミュニティ階層を自然に捉え、再帰的なコミュニティ形成を可能にする。

実験結果

リサーチクエスチョン

RQ1大規模ネットワークにおいて、重複コミュニティを正確に同定できるコミュニティ検出アルゴリズムが、線形時間計算量を達成できるか。
RQ2COPRAなどの既存手法と比較して、SLPAは二部ネットワークにおいてどの程度の性能を示すか。
RQ3SLPAは、現実の社会的ネットワークにおける重複するネストされたコミュニティ構造を検出できるか。
RQ4SLPAの動的ラベル伝播メカニズムは、他のラベルベースのアルゴリズムで見られる過剰な小規模コミュニティの生成を回避できるか。
RQ5非決定的性質を有するSLPAは、ネットワークサイズや構造的変動に対してどの程度のロバストネスを示すか。

主な発見

SLPAはエッジ数に比例する線形時間計算量を達成し、大規模ネットワークに適している。
Facebookに類似したネットワーク（FB-M1）において、SLPAは正規化モジュラリティスコア0.23（標準偏差0.10）を達成し、COPRAの0.02を顕著に上回った。
相互接続取締役ネットワーク（IL-M2）において、SLPAはスコア0.69（標準偏差0.01）を達成し、COPRAの0.72をわずかに下回ったが、依然として非常に効果的であった。
高校ネットワーク（HS2）において、SLPAは4段階のネストされたコミュニティ階層を成功裏に回復し、属性ベースのコミュニティ説明において最高で0.85の一致スコアを達成した。
二部ネットワークにおいて、SLPAは完全なネットワーク上で直接意味のあるコミュニティを検出できたが、COPRAは各ノードタイプに対して別々に処理を実施する必要があり、Facebookに類似したネットワークではコミュニティ検出に失敗した。
最大反復回数Tが20を超えた場合、複数回の実行において安定した性能を示したため、ランダム初期化に対してロバストであることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。