Skip to main content
QUICK REVIEW

[논문 리뷰] Graph Similarity and Approximate Isomorphism

Martin Grohe, Gaurav Rattan|arXiv (Cornell University)|2018. 01. 01.
Graph Theory and Algorithms참고 문헌 3인용 수 14
한 줄 요약

이 논문은 나무조차도 포함된 경우에 가중 그래프 유사도 문제(WSim)의 NP-난이도를 입증하고, 한 그래프의 인접행렬이 유계 클러스터링 수를 가질 경우의 다루기 쉬운 영역를 규명한다. 이 경우에 스펙트럼 분해와 분할된 부분공간 위에서의 볼록 최적화를 이용한 다항시간 알고리즘을 제시하며, 행렬 유사도와 양의 준정부호 구조를 활용해 근사적인 그래프 이somorphism을 효율적으로 계산한다.

ABSTRACT

The graph similarity problem, also known as approximate graph isomorphism or graph matching problem, has been extensively studied in the machine learning community, but has not received much attention in the algorithms community: Given two graphs G,H of the same order n with adjacency matrices A_G,A_H, a well-studied measure of similarity is the Frobenius distance dist(G,H):=min_{pi}|A_G^{pi}-A_H|_F, where pi ranges over all permutations of the vertex set of G, where A_G^pi denotes the matrix obtained from A_G by permuting rows and columns according to pi, and where |M |_F is the Frobenius norm of a matrix M. The (weighted) graph similarity problem, denoted by GSim (WSim), is the problem of computing this distance for two graphs of same order. This problem is closely related to the notoriously hard quadratic assignment problem (QAP), which is known to be NP-hard even for severely restricted cases. It is known that GSim (WSim) is NP-hard; we strengthen this hardness result by showing that the problem remains NP-hard even for the class of trees. Identifying the boundary of tractability for WSim is best done in the framework of linear algebra. We show that WSim is NP-hard as long as one of the matrices has unbounded rank or negative eigenvalues: hence, the realm of tractability is restricted to positive semi-definite matrices of bounded rank. Our main result is a polynomial time algorithm for the special case where the associated (weighted) adjacency graph for one of the matrices has a bounded number of twin equivalence classes. The key parameter underlying our algorithm is the clustering number of a graph; this parameter arises in context of the spectral graph drawing machinery.

연구 동기 및 목표

  • 제한된 그래프 클래스에서 가중 그래프 유사도 문제(WSim)의 계산 복잡도를 규명하는 것.
  • 행렬 질량과 고유값 구조를 분석하여 WSim의 다루기 쉬운 영역의 경계를 규명하는 것.
  • 한 그래프의 클러스터링 수가 유계일 경우 WSim에 대해 다항시간 알고리즘을 개발하는 것.
  • 그래프 유사도와 이차할당문제(QAP) 사이의 관계를 공식화하는 것, 특히 양의 준정부호 행렬의 맥락에서.
  • 기계학습 및 데이터베이스 스키마 매칭 분야에서 근사적인 그래프 이somorphism을 위한 이론적 기반을 마련하는 것.

제안 방법

  • 해밀토니안 경로 문제를 WSim으로 감소시켜, 나무일 경우조차도 NP-난이도임을 증명한다.
  • 인접행렬 A와 B의 스펙트럼 분해를 사용하여 프로베니우스 거리 최소화 문제를 Tr(Aπ, B)의 최대화 문제로 재구성한다.
  • 다루기 쉬운 인스턴스를 정의하기 위해 행렬의 클러스터링 수를 구조적 파라미터로 도입한다.
  • 순열에 대한 최적화 문제를 고유벡터의 클러스터에 대한 이차 벡터 분할(QVP) 문제로 재구성한다.
  • 분할 제약 조건 하에 가중 내적의 합을 최대화하기 위해 볼록 최적화 기법을 적용한다.
  • R^k에서의 초평면 분리 논증을 활용하여 클러스터링을 위한 최적의 k점 초평면 존재성을 보여준다.

실험 결과

연구 질문

  • RQ1나무의 단순한 구조에도 불구하고, 가중 그래프 유사도 문제(WSim)는 NP-난이도인가?
  • RQ2어떤 인접행렬의 구조적 성질이 WSim의 다루기 쉬움을 결정하는가?
  • RQ3한 행렬의 클러스터링 수가 유계일 경우 그래프 유사도 문제를 다항시간 내에 해결할 수 있는가?
  • RQ4그래프 간 프로베니우스 거리와 이차할당문제(QAP) 사이의 관계는 무엇인가?
  • RQ5양의 준정부호성과 유계 질량이 WSim의 다루기 쉬움에 어떤 역할을 하는가?

주요 결과

  • WSim는 나무로 제한된 경우조차도 NP-난이도이며, 이는 이전의 난이도 결과를 강화한다.
  • 최소한 하나의 행렬이 무한한 질량 또는 음의 고유값을 가질 경우 WSim은 여전히 NP-난이도이다.
  • 문제가 다루기 쉬운 경우는 양의 준정부호이면서 유계 질량을 가진 두 행렬일 때에만 성립한다.
  • 클러스터링 수가 유계일 경우 WSim에 대해 다항시간 알고리즘을 제시한다.
  • 이 알고리즘은 스펙트럼 분해와 클러스터 분할 위에서의 볼록 최적화를 활용하여 최적의 순열을 효율적으로 계산한다.
  • 해결책은 순열 문제를 클러스터 수준의 벡터에 대한 볼록 이차계획문제로 변환함으로써 다항시간 내에 해결 가능하다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.