QUICK REVIEW

[論文レビュー] On Explainability of Graph Neural Networks via Subgraph Explorations

Hao Yuan, Haiyang Yu|arXiv (Cornell University)|Feb 9, 2021

Explainable Artificial Intelligence (XAI)参考文献 49被引用数 89

ひとこと要約

SubgraphX は Monte Carlo Tree Search と Shapley 値ベースのスコアリングを用いた効率的な近似で、重要な連結サブグラフを識別して GNN の予測を説明し、合理的な計算で説明を改善します。

ABSTRACT

We consider the problem of explaining the predictions of graph neural networks (GNNs), which otherwise are considered as black boxes. Existing methods invariably focus on explaining the importance of graph nodes or edges but ignore the substructures of graphs, which are more intuitive and human-intelligible. In this work, we propose a novel method, known as SubgraphX, to explain GNNs by identifying important subgraphs. Given a trained GNN model and an input graph, our SubgraphX explains its predictions by efficiently exploring different subgraphs with Monte Carlo tree search. To make the tree search more effective, we propose to use Shapley values as a measure of subgraph importance, which can also capture the interactions among different subgraphs. To expedite computations, we propose efficient approximation schemes to compute Shapley values for graph data. Our work represents the first attempt to explain GNNs via identifying subgraphs explicitly and directly. Experimental results show that our SubgraphX achieves significantly improved explanations, while keeping computations at a reasonable level.

研究の動機と目的

GNN におけるノード/エッジの説明を超えたサブグラフレベルの説明の必要性を動機づける。
GNN の予測を説明する重要な連結サブグラフを識別する SubgraphX を提案する。
サブグラフ探索のための Shapley 値ベースの効率的なスコアリングと Monte Carlo Tree Search フレームワークを開発する。
グラフ分類とノード分類タスク全体での有効性と効率を示す。

提案手法

Score(f, G, Gi) に基づいてサイズ上限の下で最も重要な連結サブグラフを見つけることとして説明を定式化する。
サブグラフを探索するためにモンテカルロ木探索を用い、枝刈りベースのアクションと UCB に触発された選択規則を採用する。
グラフ構造間の相互作用を捉えるサブグラフの重要度スコアとして Shapley 値を採用する。
L-hop 階層の相互作用に制限し、コールティオンをモンテカルロサンプリングすることによって Shapley 値を近似する。
入力へのゼロパディング摂動を用いて周辺の影響を除去せずに逐次寄与度を計算し、グラフ構造を保持しつつ f を評価する。

実験結果

リサーチクエスチョン

RQ1GNN に対してサブグラフレベルの説明はノード/エッジの説明より直感的で忠実な洞察を提供できるのか。
RQ2グラフ構成要素間の相互作用を考慮してサブグラフの重要度をどのように定量化するのか。
RQ3Shapley ベースのスコアリングを用いた SubgraphX における説明の忠実度と計算効率のトレードオフはどうなるのか。
RQ4グラフ分類とノード/リンク予測タスクで SubgraphX はどの程度の性能を示すのか。
RQ5現実のグラフで Shapley 値の計算をスケーリング可能にする実用的な近似は何か。

主な発見

方法	時間	忠実度
MCTS*	$>$ 10 hours	N/A
MCTS†	865.4±1.6 s	0.53
SubgraphX	77.8±3.8 s	0.55
GNNExplainer	16.2±0.2 s	0.19
PGExplainer	0.02 s (Training 362s)	0.18

SubgraphX は孤立したエッジやノードを特定するのではなく、連結したサブグラフを同定することでより人間にとって理解しやすい説明を提供する。
Shapley 値スコアリングはサブグラフ間の相互作用を捉え、忠実な説明を生み出す。
近似（L-hop の枝刈りとモンテカルロ連合サンプリング）により、SubgraphX は厳密な Shapley 計算より大幅に低コストで競合的な忠実度を達成する。
BA-2Motifs や MUTAG のようなグラフでは、SubgraphX はグラウンドトゥルースのモチーフや化学的に関連するグループに対応する主要なサブ構造を局在化する。
データセットとモデル（GCN/GAT/GIN）を横断して、マッチしたスパースさレベルで基準より忠実度が高く、実行時間も妥当である。
SubgraphX の説明はグラフ分類、ノード分類、リンク予測タスクにも適用可能である。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。