Skip to main content
QUICK REVIEW

[論文レビュー] An Efficient Heuristic for Graph Edit Distance

Lijun Chang, Xing Feng|arXiv (Cornell University)|Sep 20, 2017
Graph Theory and Algorithms参考文献 2被引用数 8
ひとこと要約

本稿では、アンカーフレンドの下界推定を組み込んだ統一的なフレームワークを用いて、グラフ編集距離(GED)の計算および検証のための効率的なヒューリスティクス、AStar+-BMaを提案する。部分的マッピングにおける下界のタイトニングとベストファーストサーチ(AStar+)の優先を組み合わせることで、探索空間を削減し、大規模グラフにおけるGED計算および検証において、最先端手法と比較して4桁以上の高速化を達成する。

ABSTRACT

Graph edit distance (GED) is an important similarity measure adopted in a similarity-based analysis between two graphs, and computing GED is a primitive operator in graph database analysis. Partially due to the NP-hardness, the existing techniques for computing GED are only able to process very small graphs with less than 30 vertices. Motivated by this, in this paper we systematically study the problems of both GED computation, and GED verification (i.e., verify whether the GED between two graphs is no larger than a user-given threshold). Firstly, we develop a unified framework that can be instantiated into either a best-first search approach AStar+ or a depth-first search approach DFS+. Secondly, we design anchor-aware lower bound estimation techniques to compute tighter lower bounds for intermediate search states, which significantly reduce the search spaces of both AStar+ and DFS+. We also propose efficient techniques to compute the lower bounds. Thirdly, based on our unified framework, we contrast AStar+ with DFS+ regarding their time and space complexities, and recommend that AStar+ is better than DFS+ by having a much smaller search space. Extensive empirical studies validate that AStar+ performs better than DFS+, and show that our AStar+-BMa approach outperforms the state-of-the-art technique by more than four orders of magnitude.

研究の動機と目的

  • グラフ編集距離(GED)の計算の非決定的困難性(NP困難)に対処すること。これは、既存の手法が小規模なグラフに限られる要因である。
  • ベストファースト(AStar+)およびディープファースト(DFS+)探索戦略をサポートする、GED計算および検証のための統一フレームワークの開発。
  • 部分的マッピングにおけるよりタイトな下界推定技術、特にアンカーフレンドの下界を設計し、GED計算における探索空間を顕著に削減すること。
  • AStar+にタイトな下界(AStar+-BMa)を組み合わせた手法が、時間的・空間的効率の両面でDFS+および既存のアルゴリズムを上回ることを実験的に検証すること。

提案手法

  • GED計算および検証の両方に対応できる統一的な探索フレームワークを提案し、AStar+(ベストファースト)またはDFS+(ディープファースト)としてインスタンス化可能である。
  • 頂点およびエッジラベルの不一致を用いて、未マッピング部分の変換に必要な最小コストを推定するアンカーフレンドの下界(δBMa、δBM、δBMaN)を導入する。
  • 各下界に対して、部分的マッピングの最良拡張を効率的に計算するアルゴリズムを設計し、探索空間の探索を最小限に抑える。
  • AStar+では優先度キューを用いて、推定コストが最小のマッピングを最初に探索することで、最適解が早期に得られることを保証する。
  • 一貫性を保ち、部分的な枝刈りを回避するために、ノードのすべての子を展開する(expand-all)戦略を採用する。
  • ラベルセットベースの下界(δLS)をベースラインとして採用し、構造的アンカーを考慮するより情報度の高い下界(δBMa)によりそれを改善する。

実験結果

リサーチクエスチョン

  • RQ1GED計算および検証の両方に対応できる、ベストファーストおよびディープファースト探索をサポートする統一フレームワークを設計できるか?
  • RQ2部分的マッピングにおけるよりタイトな下界をどのように計算すれば、GED計算における探索空間を削減できるか?
  • RQ3アンカーフレンドの下界を用いたAStar+は、DFS+に比べて探索空間および実行時間の両面で優れているか?
  • RQ4本手法は大規模グラフ(例:1024頂点まで)および高GED値に対してもスケーラブルか?
  • RQ5AStar+-BMaは、GED計算および検証の両タスクにおいて、最先端のアルゴリズムと比較して優れているか?

主な発見

  • AStar+-BMaは、最大60頂点のグラフにおいて、最先端のアルゴリズムと比較して4桁以上の高速化を達成した。
  • AStar+は、特にグラフサイズが増加するにつれて、探索空間が著しく小さくなるため、DFS+を一貫して上回る。
  • アンカーフレンドの下界δBMaはδLSよりもタイトな推定を提供し、収束が速く、メモリ使用量も削減された。
  • AStar+-BMaは大規模グラフ(例:1024頂点のGR)および高GED値に対しても良好にスケーリングでき、16GBのメインメモリ内で全テストを完了した。
  • GED検証において、AStar+-BMaはCSI GEDおよびAStar+-LSよりも顕著に優れた性能を示した、特に類似性の低いグラフペアにおいて顕著だった。
  • GED検証において、δBMaはδLSaよりも効果的であり、AStar+は類似性の高いグラフペアにおいても、DFS+にわずかだが一貫した優位性を示した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。