Skip to main content
QUICK REVIEW

[論文レビュー] Graph Similarity and Approximate Isomorphism

Martin Grohe, Gaurav Rattan|arXiv (Cornell University)|Jan 1, 2018
Graph Theory and Algorithms参考文献 3被引用数 14
ひとこと要約

本稿は、木でさえもNP困難である重み付きグラフ類似度問題(WSim)のNP困難性を確立し、取り扱える領域を同定する。それは、一方のグラフの隣接行列のクラスタリング数が有界である場合である。この場合の多項式時間アルゴリズムを提示する。スペクトル分解と部分空間の分割上での凸最適化を用い、行列の類似性と正定値行列構造を活用して、近似グラフ同型写像を効率的に計算する。

ABSTRACT

The graph similarity problem, also known as approximate graph isomorphism or graph matching problem, has been extensively studied in the machine learning community, but has not received much attention in the algorithms community: Given two graphs G,H of the same order n with adjacency matrices A_G,A_H, a well-studied measure of similarity is the Frobenius distance dist(G,H):=min_{pi}|A_G^{pi}-A_H|_F, where pi ranges over all permutations of the vertex set of G, where A_G^pi denotes the matrix obtained from A_G by permuting rows and columns according to pi, and where |M |_F is the Frobenius norm of a matrix M. The (weighted) graph similarity problem, denoted by GSim (WSim), is the problem of computing this distance for two graphs of same order. This problem is closely related to the notoriously hard quadratic assignment problem (QAP), which is known to be NP-hard even for severely restricted cases. It is known that GSim (WSim) is NP-hard; we strengthen this hardness result by showing that the problem remains NP-hard even for the class of trees. Identifying the boundary of tractability for WSim is best done in the framework of linear algebra. We show that WSim is NP-hard as long as one of the matrices has unbounded rank or negative eigenvalues: hence, the realm of tractability is restricted to positive semi-definite matrices of bounded rank. Our main result is a polynomial time algorithm for the special case where the associated (weighted) adjacency graph for one of the matrices has a bounded number of twin equivalence classes. The key parameter underlying our algorithm is the clustering number of a graph; this parameter arises in context of the spectral graph drawing machinery.

研究の動機と目的

  • 制限付きグラフクラスにおける重み付きグラフ類似度問題(WSim)の計算複雑性を確立すること。
  • 行列のランクと固有値構造の分析を通じて、WSimの取り扱える境界を同定すること。
  • 一方のグラフのクラスタリング数が有界である場合に、WSimの多項式時間アルゴリズムを開発すること。
  • 正定値行列の文脈において、グラフ類似度と二次割り当て問題(QAP)との間の関係を形式化すること。
  • 機械学習およびデータベーススキーママッチングにおける近似グラフ同型写像の理論的基盤を提供すること。

提案手法

  • ハミルトニアンパス問題をWSimに還元することで、木に対してもNP困難であることを証明する。
  • 隣接行列AとBのスペクトル分解を用い、フロベニウスノルムの最小化問題をTr(Aπ, B)の最大化問題に再定式化する。
  • 構造的パラメータとして行列のクラスタリング数を導入し、取り扱えるインスタンスを定義する。
  • 置換に関する最適化問題を、固有ベクトルのクラスタの上での二次的ベクトル分割(QVP)問題に再定式化する。
  • 部分集合の制約下で重み付き内積の和を最大化するための凸最適化技術を適用する。
  • R^kにおける超平面分離の議論を用いて、クラスタリングのための最適k点超平面の存在を示す。

実験結果

リサーチクエスチョン

  • RQ1構造が単純であるにもかかわらず、重み付きグラフ類似度問題(WSim)は木に対してもNP困難であるか?
  • RQ2隣接行列のどのような構造的性質がWSimの取り扱いやすさを決定するか?
  • RQ3一方の行列のクラスタリング数が有界である場合、グラフ類似度問題は多項式時間で解けるか?
  • RQ4グラフ間のフロベニウス距離と二次割り当て問題(QAP)との関係は何か?
  • RQ5正定値性と有界ランクは、WSimの取り扱いやすさにどのような役割を果たすか?

主な発見

  • WSimは、木に制限されてもNP困難であることが示され、従来の困難性結果を強化する。
  • 少なくとも一方の行列が無限ランクであるか、負の固有値を持つ場合、WSimは依然としてNP困難である。
  • 問題が取り扱えるのは、両方の行列が正定値かつ有界ランクである場合に限る。
  • クラスタリング数が有界である場合に、WSimの多項式時間アルゴリズムが提示される。
  • アルゴリズムはスペクトル分解とクラスタ分割上での凸最適化を用い、最適な置換を効率的に計算する。
  • 置換問題をクラスタレベルのベクトル上での凸二次計画問題に変換することで、多項式時間で解ける。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。