[論文レビュー] Beyond Edge Deletion: A Comprehensive Approach to Counterfactual Explanation in Graph Neural Networks
XPlore broadens counterfactual search for GNNs by allowing edge insertions/removals and node-feature perturbations, guided by gradients and cosine similarity to improve validity and fidelity.
Graph Neural Networks (GNNs) are increasingly adopted across domains such as molecular biology and social network analysis, yet their black-box nature hinders interpretability and trust. This is especially problematic in high-stakes applications, such as predicting molecule toxicity, drug discovery, or guiding financial fraud detections, where transparent explanations are essential. Counterfactual explanations - minimal changes that flip a model's prediction - offer a transparent lens into GNNs' behavior. In this work, we introduce XPlore, a novel technique that significantly broadens the counterfactual search space. It consists of gradient-guided perturbations to adjacency and node feature matrices. Unlike most prior methods, which focus solely on edge deletions, our approach belongs to the growing class of techniques that optimize edge insertions and node-feature perturbations, here jointly performed under a unified gradient-based framework, enabling a richer and more nuanced exploration of counterfactuals. To quantify both structural and semantic fidelity, we introduce a cosine similarity metric for learned graph embeddings that addresses a key limitation of traditional distance-based metrics, and demonstrate that XPlore produces more coherent and minimal counterfactuals. Empirical results on 13 real-world and 5 synthetic benchmarks show up to +56.3% improvement in validity and +52.8% in fidelity over state-of-the-art baselines, while retaining competitive runtime.
研究の動機と目的
- 高リスク領域における GNN の説明性を動機づける。
- エッジ削除を超える包括的な反事実エ explainer を開発する。
- 勾配信号を活用して最小かつ意味的に忠実な反事実を見つける。
- コサイン類似度の忠実性指標を通じて分布外 artifacts を緩和する。
- 最先端手法よりも優れた妥当性と忠実性を経験的に示す。
提案手法
- Edge の挿入・削除とノード特徴 perturbation を可能にする勾配ガイド付き perturbation フレームワーク XPlore を導入する。
- 損失 L(G,G′)=Lpred(G,G′|Φ)+β Ldist(G,G′) としてソフト最適化として反事実探索を定式化する。
- 自己ループを持つ swapped A/P スキームを用いて可逆的な P ゲートで隣接行列を perturb し、エッジ挿入を許可する。
- ゲーティングまたは連続的変化を通じたノード特徴 perturbation を同じ勾配ループに組み込む。
- 元のグラフ埋め込みと反事実グラフ埋め込みの意味的忠実性を定量化するコサイン類似度指標を使用する。
- 収束保証と複雑さが約 O(|E| d + n d f) の効率的かつスケーラブルなアルゴリズムを提供する。
- 非微分可能なしきい値処理を用いてバイナリア adj perturbation を生成する際にスループロパゲーションをバックプロパゲートするストレートスルー推定子を用いる。

実験結果
リサーチクエスチョン
- RQ1エッジ削除だけでなくエッジ挿入とノード特徴 perturbation を許すことで、GNN の反事実説明はどのように生成できるか。
- RQ2勾配ガイド付き perturbation が構造空間と特徴空間の双方で、エッジ削除のみの方法と比べてより妥当性・忠実性・意味的一貫性のある反事実を生み出すか。
- RQ3コサインベースの意味的忠実性を取り入れることで、グラフ反事実における分布外 artifact を低減できるか。
- RQ4XPlore は多様なデータセットに対して、最先端のグラフ反事実 explainer のベースラインと比較してどの程度性能を発揮するか。
- RQ5自由なノード特徴 perturbation とゲーティング機構の違いが説明品質にどのような影響を与えるか。
主な発見
- XPlore は 17/18 データセットで妥当性と忠実性がベースラインを上回る。
- XPlore はベンチマーク上で妥当性が最大 +56.3%、忠実性が最大 +52.8% 向上を示す。
- エッジ挿入とノード特徴 perturbation を許すことで、エッジ削除のみよりもより豊かで一貫した反事実が得られる。
- グラフ埋め込みのコサイン類似度は意味的忠実性と相関し、反事実の意味の保持が改善されていることを示す。
- 自由なノード perturbation(およびゲーティングを含む variants)は、妥当性と忠実性の点でエッジ削除のみまたはゲーティングのみの variants を上回る。
- XPlore はランタイムを競合的に維持しつつ、説明性指標が明確に優れている。

より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。