[论文解读] Graph Similarity and Approximate Isomorphism
本文證明了加權圖相似性問題(WSim)即使在樹圖上亦為NP難問題,並識別出一個可有效處理的範疇:當其中一個圖的鄰接矩陣具有有界聚類數時。本文提出一種多項式時間演算法,利用特徵分解與分區子空間上的凸優化,藉由矩陣相似性與半正定結構,有效計算近似圖同構。
The graph similarity problem, also known as approximate graph isomorphism or graph matching problem, has been extensively studied in the machine learning community, but has not received much attention in the algorithms community: Given two graphs G,H of the same order n with adjacency matrices A_G,A_H, a well-studied measure of similarity is the Frobenius distance dist(G,H):=min_{pi}|A_G^{pi}-A_H|_F, where pi ranges over all permutations of the vertex set of G, where A_G^pi denotes the matrix obtained from A_G by permuting rows and columns according to pi, and where |M |_F is the Frobenius norm of a matrix M. The (weighted) graph similarity problem, denoted by GSim (WSim), is the problem of computing this distance for two graphs of same order. This problem is closely related to the notoriously hard quadratic assignment problem (QAP), which is known to be NP-hard even for severely restricted cases. It is known that GSim (WSim) is NP-hard; we strengthen this hardness result by showing that the problem remains NP-hard even for the class of trees. Identifying the boundary of tractability for WSim is best done in the framework of linear algebra. We show that WSim is NP-hard as long as one of the matrices has unbounded rank or negative eigenvalues: hence, the realm of tractability is restricted to positive semi-definite matrices of bounded rank. Our main result is a polynomial time algorithm for the special case where the associated (weighted) adjacency graph for one of the matrices has a bounded number of twin equivalence classes. The key parameter underlying our algorithm is the clustering number of a graph; this parameter arises in context of the spectral graph drawing machinery.
研究动机与目标
- 建立加權圖相似性問題(WSim)在受限圖類別中的計算複雜度。
- 透過分析矩陣的秩與特徵值結構,識別出WSim可有效處理的邊界。
- 當其中一個圖具有有界聚類數時,發展WSim的多項式時間演算法。
- 形式化圖相似性與二次指派問題(QAP)之間的關聯,特別是在半正定矩陣的脈絡下。
- 為機器學習與資料庫結構匹配中的近似圖同構提供理論基礎。
提出的方法
- 將哈密頓路徑問題歸約至WSim,以證明即使在樹圖上WSim亦為NP難。
- 利用鄰接矩陣A與B的特徵分解,將Frobenius距離最小化問題重新表述為Tr(Aπ, B)的最大化。
- 引入矩陣的聚類數作為結構參數,以定義可有效處理的實例。
- 將排列空間上的優化問題重新表述為特徵向量群聚上的二次向量分割(QVP)問題。
- 應用凸優化技術,在分區約束下最大化加權內積之和。
- 在R^k中使用超平面分離論證,以證明存在最佳k點超平面用於聚類。
实验结果
研究问题
- RQ1即使在結構簡單的樹圖上,加權圖相似性問題(WSim)是否仍為NP難?
- RQ2鄰接矩陣的哪些結構性質使得WSim可有效處理?
- RQ3當其中一個矩陣具有有界聚類數時,是否能以多項式時間求解圖相似性問題?
- RQ4圖之間的Frobenius距離與二次指派問題(QAP)有何關係?
- RQ5半正定性與有界秩在WSim可有效處理性中扮演何種角色?
主要发现
- WSim即使限制在樹圖上亦為NP難,強化了先前的難度結果。
- 若至少一個矩陣具有無界秩或負特徵值,WSim仍為NP難。
- 僅當兩個矩陣皆為半正定且有界秩時,問題才可有效處理。
- 當其中一個矩陣具有有界聚類數時,本文提出一項多項式時間演算法。
- 該演算法利用特徵分解與群聚分區上的凸優化,以高效方式計算最佳排列。
- 解法依賴於將排列問題轉化為群聚層級向量上的凸二次規劃,可在多項式時間內求解。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。