Skip to main content
QUICK REVIEW

[论文解读] Discovering Invariant Rationales for Graph Neural Networks

Yingxin Wu, Xiang Wang|arXiv (Cornell University)|Jan 30, 2022
Explainable Artificial Intelligence (XAI)被引用 59
一句话总结

DIR 通过对非因果特征的干预来发现不变量因果理由,以学习鲁棒且可解释的图分类,从而在不同分布下具有更好的泛化能力。

ABSTRACT

Intrinsic interpretability of graph neural networks (GNNs) is to find a small subset of the input graph's features -- rationale -- which guides the model prediction. Unfortunately, the leading rationalization models often rely on data biases, especially shortcut features, to compose rationales and make predictions without probing the critical and causal patterns. Moreover, such data biases easily change outside the training distribution. As a result, these models suffer from a huge drop in interpretability and predictive performance on out-of-distribution data. In this work, we propose a new strategy of discovering invariant rationale (DIR) to construct intrinsically interpretable GNNs. It conducts interventions on the training distribution to create multiple interventional distributions. Then it approaches the causal rationales that are invariant across different distributions while filtering out the spurious patterns that are unstable. Experiments on both synthetic and real-world datasets validate the superiority of our DIR in terms of interpretability and generalization ability on graph classification over the leading baselines. Code and datasets are available at https://github.com/Wuyxin/DIR-GNN.

研究动机与目标

  • 通过避免依赖在分布偏移下会失效的捷径特征,来激发 GNN 的内在可解释性。
  • 提出一个因果、不变的 rationalization 框架来识别引导预测的环境不变因果模式。
  • 开发 DIR 目标以及一个四模块 GNN 架构以提取并验证不变的理由。
  • 提供理论论证和经验证据,显示在合成和真实数据集上有改进的泛化和可解释性。

提出的方法

  • 用结构化因果模型 formalize 数据生成过程,将因果(C)和非因果(S)部分分离。
  • 定义不变的合理化为在干预分布之间最小化风险,同时对环境的方差进行惩罚(DIR 目标)。
  • 引入一个理由生成器将图分割为因果子图和非因果子图;一个分布干预器来创建干预分布;一个图编码器;以及两个对因果/非因果部分的分类器。
  • 通过对 S 进行 do(S=s) 的干预来构建干预分布,并训练以识别在这些分布上产生不变 Y 的 C。
  • 在干预下推断预测,并使用带掩蔽非因果贡献的联合预测来强调因果推理。
  • 给出优化:DIR 目标结合期望干预风险与方差正则化(R_DIR)。
  • 对非因果分支提供辅助损失以促进单独学习伪相关特征(R_S)。

实验结果

研究问题

  • RQ1RQ1: DIR 在发现因果特征与提升 GNN 泛化方面有多有效?
  • RQ2RQ2: 学习不变合理化时,会出现哪些训练动态和模式?
  • RQ3RQ3: DIR 发现的合理化是否在 OOD 数据上提升了可解释性和鲁棒性?

主要发现

模型Spurious-Motif Balanceb=0.5b=0.7b=0.9MNIST-75spGraph-SST2Molhiv
ERM42.99 \u0000b1 1.9339.69 \u0000b1 1.7338.93 \u0000b1 1.7433.61 \u0000b1 1.0212.71 \u0000b1 1.4381.44 \u0000b1 0.5976.20 \u0000b1 1.14
Attention43.07 \u0000b1 2.5539.42 \u0000b1 1.5037.41 \u0000b1 0.8633.46 \u0000b1 0.4315.19 \u0000b1 2.6281.57 \u0000b1 0.7175.84 \u0000b1 1.33
ASAP44.44 \u0000b1 8.1944.25 \u0000b1 6.8739.19 \u0000b1 4.3931.76 \u0000b1 2.8915.54 \u0000b1 1.8781.57 \u0000b1 0.8473.81 \u0000b1 1.17
Top- k Pool43.43 \u0000b1 8.7941.21 \u0000b1 7.0540.27 \u0000b1 7.1233.60 \u0000b1 0.9114.91 \u0000b1 3.2579.78 \u0000b1 1.3573.01 \u0000b1 1.65
SAG Pool45.23 \u0000b1 6.7643.82 \u0000b1 6.3240.45 \u0000b1 7.5033.60 \u0000b1 1.1814.31 \u0000b1 2.4480.24 \u0000b1 1.7273.26 \u0000b1 0.84
GSN43.18 \u0000b1 5.6534.67 \u0000b1 1.2134.03 \u0000b1 1.6932.60 \u0000b1 1.7519.03 \u0000b1 2.3982.54 \u0000b1 1.1674.53 \u0000b1 1.90
Group DRO41.51 \u0000b1 1.1139.38 \u0000b1 0.9339.32 \u0000b1 2.2333.90 \u0000b1 0.5215.13 \u0000b1 2.8381.29 \u0000b1 1.4475.44 \u0000b1 2.70
V-REx42.83 \u0000b1 1.5939.43 \u0000b1 2.6939.08 \u0000b1 1.5634.81 \u0000b1 2.0418.92 \u0000b1 1.4181.76 \u0000b1 0.0875.62 \u0000b1 0.79
IRM42.26 \u0000b1 2.6941.30 \u0000b1 1.2840.16 \u0000b1 1.7435.12 \u0000b1 2.7118.62 \u0000b1 1.2281.01 \u0000b1 1.1374.46 \u0000b1 2.74
DIR-Var45.87 \u0000b1 2.6143.81 \u0000b1 1.9342.69 \u0000b1 1.7737.12 \u0000b1 1.5617.74 \u0000b1 4.1781.74 \u0000b1 0.8976.05 \u0000b1 0.86
DIR47.03 \u0000b1 2.4645.50 \u0000b1 2.1543.36 \u0000b1 1.6439.87 \u0000b1 0.5620.36 \u0000b1 1.7883.29 \u0000b1 0.5377.05 \u0000b1 0.57
  • DIR 在合成和真实数据集上的泛化方面总体上优于 ERM 和若干不变学习基线。
  • 在消融实验中,方差正则化的 DIR(DIR)通过利用不变分布相较 DIR-Var(λ>0)有所提升。
  • DIR 实现了更好的内在可解释性,在 Spurious-Motif 偏差增加时 Precision@5 更高。
  • 两阶段训练动态显示一个适应阶段,在此阶段推理器学习显著特征,随后进入拟合阶段,稳定因果推理并细化预测器。
  • 可视化显示 DIR 专注于与真实理由对齐的显著因果标记/边,并且在分布偏移下仍然具有信息性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。