Skip to main content
QUICK REVIEW

[논문 리뷰] Efficient Graph Similarity Computation with Alignment Regularization

Wei Zhuo, Guang Tan|arXiv (Cornell University)|2024. 06. 21.
Advanced Graph Neural Networks인용 수 5
한 줄 요약

ERIC는 Alignment Regularization(AReg)을 도입하여 GED 추정을 위한 그래프 정렬을 학습하는 GNN 인코더를 훈련시키고, 테스트 시 그래프 간 매칭을 제거하여 추론을 더 빠르게 하며 GED 예측 정확도를 높이기 위해 다중 스케일 GED 판별기를 결합한다.

ABSTRACT

We consider the graph similarity computation (GSC) task based on graph edit distance (GED) estimation. State-of-the-art methods treat GSC as a learning-based prediction task using Graph Neural Networks (GNNs). To capture fine-grained interactions between pair-wise graphs, these methods mostly contain a node-level matching module in the end-to-end learning pipeline, which causes high computational costs in both the training and inference stages. We show that the expensive node-to-node matching module is not necessary for GSC, and high-quality learning can be attained with a simple yet powerful regularization technique, which we call the Alignment Regularization (AReg). In the training stage, the AReg term imposes a node-graph correspondence constraint on the GNN encoder. In the inference stage, the graph-level representations learned by the GNN encoder are directly used to compute the similarity score without using AReg again to speed up inference. We further propose a multi-scale GED discriminator to enhance the expressive ability of the learned representations. Extensive experiments on real-world datasets demonstrate the effectiveness, efficiency and transferability of our approach.

연구 동기 및 목표

  • GED 추정을 통해 효율적인 그래프 유사도 계산(GSC)을 동기 부여하고 엔드-투-엔드 GNN 기반 GSC 모델에서 노드 간 매칭의 높은 비용을 해결한다.
  • 추론 시 교차 그래프 매칭을 필요로 하지 않도록 훈련 중에 노드-그래프 정렬을 강제하는 Alignment Regularization(AReg)을 제안한다.
  • GED 예측을 위한 표현력 향상을 위해 다중 스케일 GED 판별기를 도입한다.
  • 학습된 그래프 수준 표현이 매칭 모듈 없이 빠른 추론을 가능하게 함을 보여준다.
  • 실제 데이터셋에서 최첨단 성능, 효율성 및 전이 가능성에 대한 실증적 증거를 제시한다.

제안 방법

  • GED를 최적 정렬 문제로 공식화하고 최상의 순열에서의 필요한 조건을 도출하여 표현 학습을 안내한다.
  • AReg를 GIN 기반 인코더와 순열 불변 리드아웃(DeepSets)을 사용한 정규화 항으로 정의하여 정렬 인식 임베딩을 촉진한다.
  • 한 쌍의 두 그래프에 대해 공유된 GNN 인코더를 사용하고 다중 계층(다중 스케일)에서 AReg을 적용하여 노드 수준 및 그래프 수준의 정렬 신호를 포착한다.
  • 다중 스케일 GED 판별기를 사용하며 구성은: (i) 가중치를 분해한 Neural Tensor Network(NTN)을 이용한 교차 그래프 상호작용 모델링, 그리고 (ii) 추가적인 지수적 Minkowski(ell-2) 거리 판별기; 최종 점수는 두 가지의 가중 합이다.
  • 실제 GED 유도 유사도에 대한 회귀 손실에 AReg 손실을 보강하여 GED 예측기를 학습한다; 추론 시 AReg 구성요소를 제거하고 학습된 그래프 표현에서 직접 유사도를 계산한다.
  • 학습 시간에 GIN 및 판별기 비용이 포함된 복잡도 분석을 제공하되, 추론은 테스트 시간에 교차 그래프 상호작용이 계산되지 않으므로 더 빠르다.
Figure 1 : Illustration of separating the matching model from the end-to-end GSC framework to achieve a fast model (right side). In the fast model, the dotted arrow means the matching model does not participate in the similarity computation in the inference stage.
Figure 1 : Illustration of separating the matching model from the end-to-end GSC framework to achieve a fast model (right side). In the fast model, the dotted arrow means the matching model does not participate in the similarity computation in the inference stage.

실험 결과

연구 질문

  • RQ1추론 시 비용이 큰 교차 그래프 노드 매칭 없이 Alignment Regularization이 GED 기반 그래프 유사도 추정을 정확하게 가능하게 할 수 있는가?
  • RQ2다중 스케일 GED 판별기를 AReg와 결합하는 것이 단일 판별기나 무 정규화 기준선에 비해 판별력과 예측 정확도를 향상시키는가?
  • RQ3다른 GSC 모델에 적용할 때 AReg의 이점이 ERIC에서 얼마나 잘 전이되는가?
  • RQ4최신 기준선과 비교할 때 추론 시 ERIC의 계산 효율성 이득은 어느 정도인가?
  • RQ5ERIC는 거리/판별기 유형의 선택 및 Minkowski 매개변수 p에 대해 얼마나 민감한가?

주요 결과

데이터셋MSE_AIDS700Rho_AIDS700Tau_AIDS700p@10_AIDS700p@20_AIDS700MSE_LINUXRho_LINUXTau_LINUXp@10_LINUXp@20_LINUXMSE_IMDBRho_IMDBTau_IMDBp@10_IMDBp@20_IMDBMSE_NCI109Rho_NCI109Tau_NCI109p@10_NCI109p@20_NCI109
ERIC1.3830.9060.7400.6790.7460.1130.9880.9080.9940.9960.3850.8900.7910.8820.8910.1130.9880.9940.996
  • ERIC은 여러 GSC 벤치마크(AIDS700, LINUX, IMDB, NCI109)에서 MSE, 순위 상관계수(rho, tau), 그리고 상위 k 정밀도에서 최첨단 성능을 달성한다.
  • AReg은 성능을 향상시키고, 이를 제거하면 데이터셋 전반에서 MSE, rho, tau 및 p@k 지표가 저하된다.
  • NTN 기반 판별기와 ell-2 거리 판별기 모두 성능에 기여하며, 어느 하나를 제거하면 효과가 감소하고 NTN이 더 큰 이점을 제공한다.
  • ERIC의 추론 시간은 교차 그래프 매칭이 테스트 시 사용되지 않기 때문에 모든 기준선보다 현저히 빠르며 정확도은 유지 또는 향상된다.
  • AReg은 SimGNN과 EGSC에 그들의 손실 함수와 결합하여 개선을 보이며 모델에 구애받지 않는 유용성을 시사한다.
  • 시각화 및 어블레이션 연구는 ERIC의 인코더가 GED와 상관관계가 있는 노드-그래프 정렬 신호를 학습한다는 것을 보여주며, 이는 정렬 기반 규제의 합치를 뒷받침한다.
Figure 2 : The optimal edit path with 3 edit operations to transform $G_{i}$ to $G_{j}$ . As a result, $\mathrm{GED}(G_{i},G_{j})=3$ .
Figure 2 : The optimal edit path with 3 edit operations to transform $G_{i}$ to $G_{j}$ . As a result, $\mathrm{GED}(G_{i},G_{j})=3$ .

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.