Skip to main content
QUICK REVIEW

[論文レビュー] Spectral Theory of Unsigned and Signed Graphs. Applications to Graph Clustering: a Survey

Jean Gallier|arXiv (Cornell University)|Jan 18, 2016
Graph theory and applications参考文献 23被引用数 42
ひとこと要約

本調査は、符号付きおよび符号なしグラフのためのスペクトルグラフ理論を包括的に扱い、グラフクラスタリングにおける正規化および比率カットに焦点を当てる。正規化されたK-ウェイクラスタリングの新しい一般化を、符号付きラプラシアン行列を用いて符号付きグラフに拡張し、射影空間およびグラスマンニアンにおける理論的基盤を提示するとともに、解の比較のためのリーマン幾何学的接続を確立する。

ABSTRACT

This is a survey of the method of graph cuts and its applications to graph clustering of weighted unsigned and signed graphs. I provide a fairly thorough treatment of the method of normalized graph cuts, a deeply original method due to Shi and Malik, including complete proofs. The main thrust of this paper is the method of normalized cuts. I give a detailed account for K = 2 clusters, and also for K > 2 clusters, based on the work of Yu and Shi. I also show how both graph drawing and normalized cut K-clustering can be easily generalized to handle signed graphs, which are weighted graphs in which the weight matrix W may have negative coefficients. Intuitively, negative coefficients indicate distance or dissimilarity. The solution is to replace the degree matrix by the matrix in which absolute values of the weights are used, and to replace the Laplacian by the Laplacian with the new degree matrix of absolute values. As far as I know, the generalization of K-way normalized clustering to signed graphs is new. Finally, I show how the method of ratio cuts, in which a cut is normalized by the size of the cluster rather than its volume, is just a special case of normalized cuts.

研究の動機と目的

  • 正規化および比率カットのためのグラフクラスタリングに関する、完全で自己完結的な解説を提供すること。これには完全な証明と幾何的直感が含まれる。
  • エッジ重みが負である可能性がある符号付きグラフに、スペクトルクラスタリング手法を拡張すること。これには絶対値を用いた符号付きラプラシアン行列の導入が含まれる。
  • 射影空間およびグラスマン多様体におけるクラスタリング解の幾何的解釈を明確にすること。正式なリーマン距離計量を用いる。
  • クラスタリングにおいて有効なグラフ分割を表す行列が満たすべき必要十分条件を確立すること。
  • 正規化カットと比率カットの概念を統一し、行列形式によって比率カットが正規化カットの特殊ケースとして示されることを示すこと。

提案手法

  • 符号なしグラフではグラフラプラシアン $ L = D - W $ を使用し、符号付きグラフに一般化する際には $ \overline{L} = \overline{D} - W $ を用いる。ここで $ \overline{D} $ は絶対値を用いたエッジ重みに基づく。
  • レイリー商とコーラン=フィッシャーの定理を用いて、正規化カット最適化のためのスペクトル緩和を導出する。
  • K-ウェイクラスタリング解をグラスマン多様体 $ G(K,N) $ の要素としてモデル化し、2-ウェイ解を $ (\mathbb{RP}^{N-1})^K $ のタプルとしてモデル化することで、幾何的比較を可能にする。
  • 2つのリーマン距離を導入する。1つは実射影空間の直積上に、もう1つはグラスマン多様体上に定義され、解の類似度を評価する。
  • 対称正規化ラプラシアン $ L_{\mathrm{sym}} $ を非正規化ラプラシアン $ L $ に置き換えることで、比率カットを正規化カットの特殊ケースとして再定式化する。
  • エネルギー最小化と固有ベクトル埋め込みを用いてグラフ描画を行う。ラプラシアンを用いてノードを $ \mathbb{R}^d $ に配置する。

実験結果

リサーチクエスチョン

  • RQ1スペクトル緩和を用いて、K > 2 のクラスタに対して正規化カットクラスタリングを厳密に導出し、一般化することは可能か?
  • RQ2K-ウェイグラフクラスタリングにおけるクラスタリング解を表現・比較するための正しい幾何的フレームワークは何か?
  • RQ3正規化カット理論を、類似性を示す負のエッジ重みを有する符号付きグラフに拡張することは可能か?
  • RQ4比率カットと正規化カットの関係は何か?比率カットは正規化カットフレームワークに埋め込むことができるか?
  • RQ5行列がグラフクラスタリングにおける有効な頂点分割を表すために必要な十分条件は何か?

主な発見

  • 符号付きラプラシアン $ \overline{L} = \overline{D} - W $ は常に半正定値であり、非バランスな符号付きグラフでは正定値である可能性がある。これによりスペクトル解析が可能になる。
  • 本研究では、符号付きラプラシアンとグラスマン多様体に基づく解表現を用いて、符号付きグラフにおけるK-ウェイ正規化クラスタリングが初めて一般化されている。
  • 緩和されたK-ウェイクラスタリング問題の解は、自然に $ \mathbb{R}^N $ 上のベクトルではなく、グラスマン多様体 $ G(K,N) $ の要素として表現される。これにより幾何的に整合性のあるフレームワークが得られる。
  • 2-ウェイ正規化カット解は自然に $ (\mathbb{RP}^{N-1})^K $ のタプルとしてモデル化され、解の類似度を測る明確なリーマン距離が定義される。
  • 比率カットが $ L_{\mathrm{sym}} $ を $ L $ に置き換えることで、正規化カットの特殊ケースとして正式に示され、両手法が一つのスペクトルフレームワークに統一される。
  • 本研究は、行列が有効な分割を表すための必要十分条件が、列が互いに素で空でない頂点部分集合の指示関数であり、直交性および正規化制約を満たすことに明確にしている。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。