Skip to main content
QUICK REVIEW

[論文レビュー] A New Metric for Quality of Network Community Structure

Mingming Chen, Tommy Nguyen|arXiv (Cornell University)|Jul 15, 2015
Complex Network Analysis Techniques参考文献 37被引用数 58
ひとこと要約

本稿では、コミュニティの数が少ないことと解像度の限界問題という2つの主な欠陥を是正することで、従来のモジュラリティを改善した新しい指標であるモジュラリティ密度を提案する。相互結合エッジの割合を差し引くとともにコミュニティ密度を組み込むことで、モジュラリティ密度はコミュニティ品質のより一貫性があり正確な測定を可能にする。実動的ネットワークにおける実験により、他の標準的な指標と整合性を保ちながら、モジュラリティを上回ることを検証した。

ABSTRACT

Modularity is widely used to effectively measure the strength of the community structure found by community detection algorithms. However, modularity maximization suffers from two opposite yet coexisting problems: in some cases, it tends to favor small communities over large ones while in others, large communities over small ones. The latter tendency is known in the literature as the resolution limit problem. To address them, we propose to modify modularity by subtracting from it the fraction of edges connecting nodes of different communities and by including community density into modularity. We refer to the modified metric as Modularity Density and we demonstrate that it indeed resolves both problems mentioned above. We describe the motivation for introducing this metric by using intuitively clear and simple examples. We also prove that this new metric solves the resolution limit problem. Finally, we discuss the results of applying this metric, modularity, and several other popular community quality metrics to two real dynamic networks. The results imply that Modularity Density is consistent with all the community quality measurements but not modularity, which suggests that Modularity Density is an improved measurement of the community quality compared to modularity.

研究の動機と目的

  • モジュラリティの2つの共存する問題、すなわち小コミュニティの偏向と解像度の限界問題に対処すること。
  • 複数の標準的指標と整合的であり、モジュラリティの不整合を回避するコミュニティ品質指標を開発すること。
  • 理論的に裏付けられ、実証的に検証された、コミュニティ構造品質を評価するためのモジュラリティの代替指標を提供すること。
  • 構造的バイアスに弱い指標ではなく、より信頼性の高いコミュニティ検出を可能にするために、モジュラリティではなくモジュラリティ密度を最大化するアルゴリズムの基盤を築くこと。
  • 将来のアルゴリズムがモジュラリティではなくモジュラリティ密度を最大化することを目的とする基盤を提供すること。

提案手法

  • 標準モジュラリティから相互結合エッジの割合(スプリットペナルティ)を差し引くことで、変更された指標としてモジュラリティ密度を提案する。
  • コミュニティ密度をモジュラリティの式に組み込み、疎結合コミュニティをペナルティ化する。
  • モジュラリティ密度が解像度の限界問題を解消することを形式的に証明し、不適切なコミュニティの統合や分割を回避することを示す。
  • 2つの実動的ネットワーク(上院とリアリティマイニングBluetoothスキャン)に対して、モジュラリティと6つの他の標準指標(例:コンダクタンス、エクスパンション、内部エッジ)と併用して指標を適用する。
  • パラメータ化されたコミュニティ検出(qを変化させるLabelRankT)を用いて、異なるコミュニティ構造における指標の一貫性を評価する。
  • 各指標が特定した最適なq値を比較し、モジュラリティベースの検出における不一致やバイアスを検出する。

実験結果

リサーチクエスチョン

  • RQ1モジュラリティの最大化は、異なるネットワークスナップショットにおいて一貫して最適なコミュニティ構造を特定できるか?
  • RQ2修正された指標は、小コミュニティバイアスと解像度の限界問題の両方を同時に解消できるか?
  • RQ3実動的ネットワークにおける他のコミュニティ品質指標と比較して、モジュラリティ密度はどれほど一貫性があるか?
  • RQ4モジュラリティは、最適なコミュニティ分割を特定する際に、他の指標とどれほど一致しないか?
  • RQ5モジュラリティ密度は、コミュニティ検出アルゴリズムの評価と誘導に信頼できる代替指標として機能できるか?

主な発見

  • モジュラリティ密度は、上院およびリアリティマイニングBluetoothスキャンの両データセットにおいて、一貫して最適なコミュニティ構造を特定するが、モジュラリティはそうではない。
  • 上院データセットでは、モジュラリティ(Q)は最適なq=0.5を、イントラエッジはq=0.7を選び、他の6つの指標はq=0.6を選んだ。これは、モジュラリティの評価における不整合を示している。
  • リアリティマイニングBluetoothスキャンでは、モジュラリティとインターエッジ指標が他の6つの指標とは異なる最適なq値を選んだ。これは、それらの指標の不整合性を示している。
  • 結果から、モジュラリティ密度は他の6つの指標と一致しており、コミュニティ品質のより信頼性が高く一貫性のある測定であることが示された。
  • 形式的に証明されたように、この指標は解像度の限界問題を効果的に解消しており、不適切なコミュニティの統合や分割を回避する。
  • 図5~7は、Qがしばしば負であるのに対し、Q_sとQ_dsは正であることを示しており、標準モジュラリティよりもモジュラリティ密度がより安定的かつ意味のある評価を提供していることを確認している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。