QUICK REVIEW

[論文レビュー] Community Detection in Networks using Graph Distance

Sharmodeep Bhattacharyya, Peter J. Bickel|arXiv (Cornell University)|Jan 16, 2014

Complex Network Analysis Techniques参考文献 49被引用数 23

ひとこと要約

本稿では、ネットワークトポロジーにおける頂点の近接性を活用してコミュニティを同定する、グラフ距離に基づくコミュニティ検出アルゴリズムを提案する。固定または増加するブロック数を想定したストークスティックブロックモデル（SBM）および度数補正済みモデルにおいて、正しいコミュニティ回復の理論的保証を提供し、ネットワークサイズが増加するにつれて誤分類ノードの割合が0に収束することを示す。

ABSTRACT

The study of networks has received increased attention recently not only from the social sciences and statistics but also from physicists, computer scientists and mathematicians. One of the principal problem in networks is community detection. Many algorithms have been proposed for community finding but most of them do not have have theoretical guarantee for sparse networks and networks close to the phase transition boundary proposed by physicists. There are some exceptions but all have some incomplete theoretical basis. Here we propose an algorithm based on the graph distance of vertices in the network. We give theoretical guarantees that our method works in identifying communities for block models and can be extended for degree-corrected block models and block models with the number of communities growing with number of vertices. Despite favorable simulation results, we are not yet able to conclude that our method is satisfactory for worst possible case. We illustrate on a network of political blogs, Facebook networks and some other networks.

研究の動機と目的

スパarsesなネットワークおよびフェーズ遷移境界付近におけるコミュニティ検出の理論的保証の欠如に対処すること。
広範なネットワーク密度に適用可能な汎用的コミュニティ検出手法を開発すること。
ストークスティックブロックモデル（SBM）、度数補正済みSBM、および増加するブロック数を伴うモデルにおけるコミュニティ回復の理論的裏付けを提供すること。
政治的ブログネットワークやFacebook大学内ネットワークを含む実世界ネットワークにおける実験的性能を示すこと。
理論的仮定において必要とされる固有ベクトル条件（C1）が満たされない場合の手法のロバストネスを調査すること。

提案手法

隣接行列の構造から導かれる、長さ2のパスの期待数として、頂点間のグラフ距離を定義する。
グラフ距離行列を用いてノード間の類似度を測定し、クラスタリングの根拠とする。
グラフ距離行列に対してスペクトルクラスタリングを適用し、コミュニティ構造を回復する。
理論的分析は、行列 $\tilde{K}$ の固有構造に依存し、条件（C1）として $\mathbf{1}$ が $\tilde{K}$ の固有ベクトルでないことを仮定する。
固定された $Q$ を伴うSBMにおいて、$P$ および $\boldsymbol{\pi}$ にやや厳しい条件が課せられれば、$n \to \infty$ のときノードの誤分類確率が0に収束することを証明する。
理論的枠組みを度数補正ブロックモデルおよび $n \to \infty$ のとき $Q \to \infty$ となるモデルに拡張し、類似した保証が成り立つと推測する。

実験結果

リサーチクエスチョン

RQ1スパarsesなネットワークにおいてフェーズ遷移閾値付近で、グラフ距離に基づく手法が理論的一貫性を達成できるか？
RQ2シミュレーションおよび実世界ネットワークにおいて、グラフ距離手法と疑似尤度法の性能をどのように比較できるか？
RQ3理論的証明に必要とされる固有ベクトル条件（C1）が満たされない場合でも、手法は有効に機能するか？
RQ4増加するコミュニティ数や度数の不均一性を伴うモデルへ、この手法をどのように拡張できるか？
RQ5政治的ブログネットワークやFacebook大学内ネットワークといった実世界ネットワークにおいて、真のコミュニティはどの程度回復できるか？

主な発見

グラフ距離に基づく手法は理論的一致性を達成する：固定された $Q$ を伴うストークスティックブロックモデル下で、$n \to \infty$ のとき誤分類ノードの割合は0に収束する。
シミュレーションにおいて、疑似尤度法と同等の性能を示し、さまざまなネットワーク密度において類似した実験的精度を達成する。
Facebookカリフォルニア工科大学ネットワークにおける実験結果から、グラフ距離に基づくコミュニティと実際の寮所属が強く一致していることが示された。
政治的ブログネットワーク（1222ノード、平均次数27）において、この手法はリベラル／コンservativeコミュニティ構造を正常に回復した。
シミュレーションから、$\mathbf{1}$ が $\tilde{K}$ の固有ベクトルである場合でも、手法が有効に機能することが示唆され、条件（C1）が過剰に制限的である可能性がある。
理論的保証は度数補正ブロックモデルおよび $Q \to \infty$ となるモデルへ拡張され、類似した証明手法に基づく一貫性の推測がなされている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。