Skip to main content
QUICK REVIEW

[論文レビュー] Maximizing Modularity is hard

Ulrik Brandes, Daniel Delling|ArXiv.org|Aug 25, 2006
Complex Network Analysis Techniques参考文献 13被引用数 173
ひとこと要約

この論文は、ネットワークコミュニティ検出におけるモジュラリティの最大化が強いかつNP完全であることを証明しており、すべてのインスタンスに対して最適解を保証する多項式時間アルゴリズムが存在しないことを示している。著者らは、強いかつNP完全な3分割問題をモジュラリティ最大化の決定問題に還元し、最適なクラスタリングがモジュラリティによって達成可能でないことを示している。したがって、実際の応用においてヒューリスティック法や近似アルゴリズムの使用が正当化される。

ABSTRACT

Several algorithms have been proposed to compute partitions of networks into communities that score high on a graph clustering index called modularity. While publications on these algorithms typically contain experimental evaluations to emphasize the plausibility of results, none of these algorithms has been shown to actually compute optimal partitions. We here settle the unknown complexity status of modularity maximization by showing that the corresponding decision version is NP-complete in the strong sense. As a consequence, any efficient, i.e. polynomial-time, algorithm is only heuristic and yields suboptimal partitions on many instances.

研究の動機と目的

  • ネットワーククラスタリングにおけるモジュラリティ最大化の計算複雑性という長年の未解決問題を解消すること。
  • P = NP でない限り、すべてのインスタンスに対してモジュラリティ最大化を最適に解く多項式時間アルゴリズムが存在しないことを確立すること。
  • 問題の計算困難性を証明することで、コミュニティ検出におけるヒューリスティック法や近似アルゴリズムの使用を正当化すること。
  • 重み付きグラフにおいても同様の複雑性結果を拡張し、重み付きグラフでも問題が強いかつNP完全のままであることを示すこと。

提案手法

  • 強いかつNP完全な3分割問題を、モジュラリティ最大化の決定問題に還元した。
  • 3分割インスタンス $A$ から、$k$ 個のクリークと、分割値に従って接続される要素頂点を用いてグラフ $G(A)$ を構築した。
  • クラスタリング $\mathcal{C}$ が $Q(\mathcal{C}) \geq K(A)$ を満たすことが、$A$ が有効な3分割を許容するための必要十分条件となるように、ターゲットモジュラリティ閾値 $K(A)$ を定義した。
  • クラスタの品質を分析するために、再定式化されたモジュラリティの公式 $Q(\mathcal{C}) = \sum_{C \in \mathcal{C}} \left[ \frac{|E(C)|}{m} - \left( \frac{\sum_{v \in C} \deg(v)}{2m} \right)^2 \right]$ を用いた。
  • 最適なモジュラリティは、要素頂点の次数がクリーククラスタ間で完全に均等化されている必要があることを証明した。これは、3分割インスタンスが充足可能である場合にのみ可能である。
  • 還元が擬似多項式的であることを示し、3分割問題の強いかつNP完全性に依存することで、入力値が一進法表現であっても困難さが保たれることを保証した。

実験結果

リサーチクエスチョン

  • RQ1モジュラリティ最大化の問題は計算的に扱いやすく、それともNP困難なのであろうか?
  • RQ2多項式時間アルゴリズムがすべてのグラフに対して最適なモジュラリティパーティションを保証できるのであろうか?
  • RQ3モジュラリティ最大化のNP完全性は強いかつ意味で成り立つのか? これは、入力値が小さくても計算困難であることを示唆する。
  • RQ4この困難性の結果は重み付きグラフに拡張可能であろうか?
  • RQ5最適なモジュラリティクラスタリングが3分割問題を解く必要があるという構造的条件は存在するのであろうか?

主な発見

  • モジュラリティ最大化は強いかつNP完全である。これは、P = NP でない限り、すべてのインスタンスに対して多項式時間で最適に解くことは不可能であることを意味する。
  • 3分割問題からモジュラリティへの還元により、最適なクラスタリングは要素頂点がクリーククラスタに完全に分割されることを要請する。これは、3分割インスタンスが充足可能である場合にのみ可能である。
  • モジュラリティ $K(A) = \frac{(k-1)(a-1)}{k(a+1)}$ を達成するクラスタリングが存在するための必要十分条件は、3分割インスタンスが解を有することである。
  • 最適なモジュラリティクラスタリングは、正確に $k$ 個のクリーククラスタから構成され、各クラスタに正確に合計が $b = \frac{1}{k}a$ となる要素頂点の集合が含まれる。これにより、次数の寄与がバランスされる。
  • 困難性の結果は重み付きグラフへも拡張可能であり、無重みグラフのケースは重み付きモジュラリティ問題の特殊ケースであるため、同様に強いかつNP完全のままである。
  • したがって、モジュラリティ最大化のためのすべての既存のアルゴリズム(グリーディ法、スペクトル法、シミュレーテッドアニーリング法など)は本質的にヒューリスティックであり、一部のインスタンスでは最適でない結果を生じる可能性がある。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。