Skip to main content
QUICK REVIEW

[论文解读] Robust Counterfactual Explanations on Graph Neural Networks

Mohit Bajaj, Lingyang Chu|arXiv (Cornell University)|Jul 8, 2021
Explainable Artificial Intelligence (XAI)参考文献 42被引用 36
一句话总结

介绍 RCExplainer,通过用线性决策边界建模常见决策区域并训练一个基于边的解释器网络来生成对 GNNs 的稳健反事实解释,从而实现稳健、简洁的边子集。

ABSTRACT

Massive deployment of Graph Neural Networks (GNNs) in high-stake applications generates a strong demand for explanations that are robust to noise and align well with human intuition. Most existing methods generate explanations by identifying a subgraph of an input graph that has a strong correlation with the prediction. These explanations are not robust to noise because independently optimizing the correlation for a single input can easily overfit noise. Moreover, they do not align well with human intuition because removing an identified subgraph from an input graph does not necessarily change the prediction result. In this paper, we propose a novel method to generate robust counterfactual explanations on GNNs by explicitly modelling the common decision logic of GNNs on similar input graphs. Our explanations are naturally robust to noise because they are produced from the common decision boundaries of a GNN that govern the predictions of many similar input graphs. The explanations also align well with human intuition because removing the set of edges identified by an explanation from the input graph changes the prediction significantly. Exhaustive experiments on many public datasets demonstrate the superior performance of our method.

研究动机与目标

  • 在高风险 GNN 应用中,需要既具备对抗事实又稳健的解释的需求。
  • 使用线性决策边界(LDBs)在大量相似图之间对 GNN 的常见决策逻辑建模,以形成决策区域。
  • 开发一个训练目标,使其产生稳健且最小的边子集,其移除会改变预测,同时对噪声保持稳定。
  • 实现端到端的快速解释生成,新图无需重新训练即可得到解释。
  • 提供全面的经验证据,将保真度、鲁棒性、准确性和效率与最先进基线进行比较。

提出的方法

  • 将 GNN 的决策逻辑建模为凸多面体(决策区域),由最后一层非线性函数的一部分线性决策边界诱导。
  • 通过对 LDBs 采样并求解一个子模成本子模覆盖问题来提取决策区域,以在区域外实现零误分类的情况下最大化被覆盖的图数量。
  • 使用贪心边界选择来构建决策区域并逐步覆盖覆盖多个类别的区域。
  • 训练一个边解释网络 f_theta,基于 GNN 的最后一层卷积层的节点嵌入输出边的优先级 M_ij,产生 S 作为 M_ij > 0.5 的边。
  • 定义一个端到端损失,包括项 L_same(G_theta 与与 G 同属同一决策区域的一致性)、L_opp(与 G_prime_theta 的对比反事实),再加上稀疏性和离散性正则化,以获得稀疏、近二值的解释矩阵。
  • 讨论解释的时间复杂度为 O(|E|),并指出推理效率,因为解释器网络可以重复使用而无需重新训练。

实验结果

研究问题

  • RQ1可以通过利用相似图之间的共同决策区域为 GNNs 推导稳健的反事实解释吗?
  • RQ2从 GNNs 采样的线性决策边界是否能产生稳定、可迁移且对输入噪声具有抗性解释?
  • RQ3与现有 GNN 解释方法相比,基于边的解释框架在保真度、鲁棒性和效率方面的表现如何?
  • RQ4端到端训练的解释器能否生成稀疏、可靠的反事实边集,并推广到未见过的图?

主要发现

  • RCExplainer 在不同稀疏度水平下对各数据集均实现了更高的保真度(反事实强度)。
  • RCExplainer 生成的解释对输入噪声更鲁棒,在鲁棒性评估中显示了更高的 AUC。
  • 使用基于决策区域的解释(LDBs)在忠实度方面优于不依赖共同决策逻辑的方法。
  • 基于边的解释允许高效的端到端训练和快速推断,每个图的时间复杂度为 O(|E|)。
  • 与基线相比,RCExplainer 和 RCExp-NoLDB 展示了将线性决策边界引入解释生成的好处。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。