Skip to main content
QUICK REVIEW

[論文レビュー] Neural Network Attributions: A Causal Perspective

Aditya Chattopadhyay, Piyushi Manupriya|arXiv (Cornell University)|Feb 6, 2019
Explainable Artificial Intelligence (XAI)参考文献 34被引用数 32
ひとこと要約

この論文は、入力ニューロンの出力に対する平均因果効果を計算しつつ、Structural Causal Modelsとしてネットワークをモデル化することで因果的アトリビューション手法を提案し、高次元にもスケールしRNNにも適用可能である。

ABSTRACT

We propose a new attribution method for neural networks developed using first principles of causality (to the best of our knowledge, the first such). The neural network architecture is viewed as a Structural Causal Model, and a methodology to compute the causal effect of each feature on the output is presented. With reasonable assumptions on the causal structure of the input data, we propose algorithms to efficiently compute the causal effects, as well as scale the approach to data with large dimensionality. We also show how this method can be used for recurrent neural networks. We report experimental results on both simulated and real datasets showcasing the promise and usefulness of the proposed algorithm.

研究の動機と目的

  • ニューラルネットワーク予測に対して解釈可能で因果的に根拠のある説明を動機づける。
  • ニューラルネットワークをStructural Causal Models (SCMs)としてモデル化し、因果的アトリビューションを定義・計算する。
  • 高次元設定で介入期待値とACEを推定するスケーラブルなアルゴリズムを開発する。
  • このアプローチを再帰的アーキテクチャへ拡張し、実践的な計算課題に対処する。

提案手法

  • フィードフォワードネットワークをSCMsとして表現し、隠れ層を周辺化して縮約された因果モデルを得る。
  • do-操作を用いて入力ニューロンが出力ニューロンに及ぼすAverage Causal Effect (ACE)を定義する。
  • 介入平均と介入共分散の周りでのテイラー展開を用いて介入期待値 E[y|do(x_i=α)]を計算する。
  • 介入期待値を効率的に推定するため、因果回帰子 (ベイズ線形回帰で学習された多項式関数) を導入する。
  • Phase I (介入期待値の計算) と Phase II (因果回帰子とベースラインの学習) のワークフローを提供する。
  • 時系列展開されたSCMと、タイムステップ間の依存性の扱いを含む、RNNへの拡張を議論する。

実験結果

リサーチクエスチョン

  • RQ1ニューラルネットワークにおける特定の入力ニューロンが特定の出力ニューロンに及ぼす因果効果は何か?
  • RQ2高次元のニューラルネットワークにおいて介入期待値とACEをどのように計算・近似できるか?
  • RQ3この因果アトリビューションの枠組みを再帰的アーキテクチャに拡張できるか?
  • RQ4因果アトリビューションは勾配ベースや摂動ベースの手法と、バイアスやロバスト性の点でどう比較されるか?

主な発見

  • 他の入力を周辺化して特徴間相関から生じるバイアスを回避する、SCMsとACEに基づく原理的な因果アトリビューション手法を提案する。
  • テイラー展開と介入共分散を用いて介入期待値を計算する方法を示し、スケーラブルなACE推定を実現する。
  • ACEを即時に推定するための因果回帰子を導入し、計算コストを削減する。
  • 適切な周辺化の考慮を伴い、Recurrent Neural Networksへ拡張する。
  • Irisデータ、シミュレーションデータ、および飛行経路データに関する実証結果は、有用性と特定の設定での勾配ベースのベースラインに対する利点を示す。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。