[论文解读] An Efficient Heuristic for Graph Edit Distance
该论文提出 AStar+-BMa,一种基于统一框架与锚点感知下界估计的图编辑距离(GED)计算与验证的高效启发式方法。通过在部分映射上收紧下界并采用最佳优先搜索(AStar+),该方法显著缩小了搜索空间,在大规模图上的 GED 计算与验证任务中相比当前最先进方法实现了四个多数量级的速度提升。
Graph edit distance (GED) is an important similarity measure adopted in a similarity-based analysis between two graphs, and computing GED is a primitive operator in graph database analysis. Partially due to the NP-hardness, the existing techniques for computing GED are only able to process very small graphs with less than 30 vertices. Motivated by this, in this paper we systematically study the problems of both GED computation, and GED verification (i.e., verify whether the GED between two graphs is no larger than a user-given threshold). Firstly, we develop a unified framework that can be instantiated into either a best-first search approach AStar+ or a depth-first search approach DFS+. Secondly, we design anchor-aware lower bound estimation techniques to compute tighter lower bounds for intermediate search states, which significantly reduce the search spaces of both AStar+ and DFS+. We also propose efficient techniques to compute the lower bounds. Thirdly, based on our unified framework, we contrast AStar+ with DFS+ regarding their time and space complexities, and recommend that AStar+ is better than DFS+ by having a much smaller search space. Extensive empirical studies validate that AStar+ performs better than DFS+, and show that our AStar+-BMa approach outperforms the state-of-the-art technique by more than four orders of magnitude.
研究动机与目标
- 为解决图编辑距离(GED)的计算不可行性问题,该问题为 NP-难问题,限制了现有方法仅适用于小规模图。
- 设计一个统一框架,同时支持 GED 计算与验证,支持最佳优先(AStar+)与深度优先(DFS+)搜索策略。
- 设计更紧致的下界估计技术——特别是锚点感知下界——显著减少 GED 计算中的搜索空间。
- 通过实验验证 AStar+ 搭配更紧致下界(AStar+-BMa)在时间与空间效率方面均优于 DFS+ 与现有算法。
提出的方法
- 提出一个统一的搜索框架,可实例化为 AStar+(最佳优先)或 DFS+(深度优先),用于 GED 计算与验证。
- 引入锚点感知下界(δBMa、δBM、δBMaN),通过顶点与边标签不匹配情况估计图未映射部分的最小转换成本。
- 设计高效算法,在每种下界下计算部分映射的最佳可能扩展,以最小化搜索空间探索。
- 在 AStar+ 中使用优先队列,优先探索估计成本最小的映射,确保尽早找到最优解。
- 采用展开所有子节点(expand-all)策略,以保持一致性并避免次优剪枝。
- 采用基于标签集的下界(δLS)作为基线,并通过更智能的下界如 δBMa(考虑结构锚点)进行改进。
实验结果
研究问题
- RQ1能否设计一个统一框架,同时支持 GED 计算与验证中的最佳优先与深度优先搜索?
- RQ2如何为部分映射计算更紧致的下界,以减少 GED 计算中的搜索空间?
- RQ3AStar+ 搭配锚点感知下界是否在搜索空间与运行时间方面优于 DFS+?
- RQ4所提方法能否在大规模图(例如最多 1024 个顶点)与高 GED 值下实现可扩展性?
- RQ5AStar+-BMa 在 GED 计算与验证任务中与最先进算法相比表现如何?
主要发现
- 在最多 60 个顶点的图上,AStar+-BMa 相较于最先进算法在 GED 计算中实现了超过四个数量级的速度提升。
- AStar+ 由于显著更小的搜索空间,始终优于 DFS+,尤其在图规模增大时优势更明显。
- 锚点感知下界 δBMa 比 δLS 提供更紧致的估计,带来更快收敛与更低内存占用。
- AStar+-BMa 在大规模图(如 GR 图含 1024 个顶点)与高 GED 值下表现良好,所有测试均在 16GB 主内存内完成。
- 在 GED 验证任务中,AStar+-BMa 显著优于 CSI GED 与 AStar+-LS,尤其在图对差异较大时。
- δBMa 下界在 GED 验证中比 δLSa 更有效,且 AStar+ 在相似图对上对 DFS+ 展现出微小但稳定的性能优势。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。