Skip to main content
QUICK REVIEW

[論文レビュー] Robust Counterfactual Explanations on Graph Neural Networks

Mohit Bajaj, Lingyang Chu|arXiv (Cornell University)|Jul 8, 2021
Explainable Artificial Intelligence (XAI)参考文献 42被引用数 36
ひとこと要約

RCExplainerを導入し、線形決定境界によって一般的な意思決定領域をモデル化し、エッジベースの説明ネットワークを訓練して頑健で簡潔なエッジサブセットを生成することで、GNNの頑健な反実仮想説明を生成する。

ABSTRACT

Massive deployment of Graph Neural Networks (GNNs) in high-stake applications generates a strong demand for explanations that are robust to noise and align well with human intuition. Most existing methods generate explanations by identifying a subgraph of an input graph that has a strong correlation with the prediction. These explanations are not robust to noise because independently optimizing the correlation for a single input can easily overfit noise. Moreover, they do not align well with human intuition because removing an identified subgraph from an input graph does not necessarily change the prediction result. In this paper, we propose a novel method to generate robust counterfactual explanations on GNNs by explicitly modelling the common decision logic of GNNs on similar input graphs. Our explanations are naturally robust to noise because they are produced from the common decision boundaries of a GNN that govern the predictions of many similar input graphs. The explanations also align well with human intuition because removing the set of edges identified by an explanation from the input graph changes the prediction significantly. Exhaustive experiments on many public datasets demonstrate the superior performance of our method.

研究の動機と目的

  • 高リスクなGNNアプリケーションで、反事実かつ頑健性を備えた説明の必要性を動機づける。
  • 線形決定境界(LDBs)を用いて多数の類似グラフに共通するGNNの意思決定ロジックをモデル化し、決定領域を形成する。
  • 予測を変える頑健で最小限のエッジサブセットを得る訓練目的を開発し、ノイズに対して安定である。
  • 新しいグラフに再訓練を要さず、迅速なエンドツーエンドの説明生成を可能にする。
  • 忠実性、頑健性、精度、効率性を現状態の最先端ベースラインと比較した包括的な実証を提供する。

提案手法

  • GNNの意思決定ロジックを、最後の層の非線形性から生じる線形決定境界の一部によって誘導される凸ポリトープ(決定領域)としてモデル化する。
  • LDBをサンプリングし、領域の外での誤分類をゼロに抑えつつ、被覆グラフを最大化するサブモジュラコストサブモジュールカバー問題を解くことによって決定領域を抽出する。
  • 貪欲的な境界選択を用いて決定領域を構築し、複数クラスをカバーするよう領域を剥ぎ取る。
  • エッジ説明ネットワーク f_theta を訓練し、GNNの最後の畳み込み層からのノード埋め込みに基づいてエッジ優先度 M_ij を出力し、M_ij > 0.5 のエッジ群を S とする。
  • 端から端への損失関数を定義し、L_same(G_theta が同じ決定領域と一致することの整合性)、L_opp(G_prime_theta との反事実対比)、さらにはスパース性と離散性正則化を加えて、スパースでほぼ二値の説明マトリクスを得る。
  • 説明の時間計算量を O(|E|) とし、推論の効率性にも言及する。エクスプレイナー網は再訓練なしで再利用可能だから。

実験結果

リサーチクエスチョン

  • RQ1類似グラフ間で共通の決定領域を活用することにより、GNNの頑健な反事実説明を導出できるか?
  • RQ2GNNからサンプルされた線形決定境界は、入力ノイズに対して安定で転移可能な説明を生み出すか?
  • RQ3エッジベースの説明フレームワークは、忠実度、頑健性、効率性の点で既存のGNN説明法と比較してどのように機能するか?
  • RQ4エンドツーエンド訓練済みの説明器は、未見のグラフに一般化する稀少で信頼性の高い反事実エッジ集合を生成できるか?

主な発見

  • RCExplainer は、さまざまなスパース性レベルでデータセットを横断した忠実度(反事実の強さ)で優位を示す。
  • RCExplainer によって生成された説明は、入力ノイズに対して他のいくつかのベースラインより頑健であることが、頑健性評価における高い AUC で示される。
  • 決定領域ベースの説明(LDBs)を用いることで、共通の意思決定ロジックに依存しない方法より忠実性が向上する。
  • エッジベースの説明により、エンドツーエンドの訓練と推論が効率的に行え、1グラフあたりの時間計算量は O(|E|) である。
  • ベースラインと比較すると、RCExplainerおよびRCExp-NoLDBは、説明生成に線形決定境界を組み込む利点を示す。)

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。