Skip to main content
QUICK REVIEW

[論文レビュー] Preserving Causal Constraints in Counterfactual Explanations for Machine Learning Classifiers

Divyat Mahajan, Chenhao Tan|arXiv (Cornell University)|Dec 6, 2019
Explainable Artificial Intelligence (XAI)参考文献 16被引用数 101
ひとこと要約

本研究は反実仮想説明におけるグローバルな実現可能性とローカルな実現可能性を定義し、因果近接正則化項と因果制約の下で実現可能な反実仮想を生成するVAEベースの手法を提案する。実現可能性が未知の場合にはユーザーフィードバックを活用する。

ABSTRACT

To construct interpretable explanations that are consistent with the original ML model, counterfactual examples---showing how the model's output changes with small perturbations to the input---have been proposed. This paper extends the work in counterfactual explanations by addressing the challenge of feasibility of such examples. For explanations of ML models in critical domains such as healthcare and finance, counterfactual examples are useful for an end-user only to the extent that perturbation of feature inputs is feasible in the real world. We formulate the problem of feasibility as preserving causal relationships among input features and present a method that uses (partial) structural causal models to generate actionable counterfactuals. When feasibility constraints cannot be easily expressed, we consider an alternative mechanism where people can label generated CF examples on feasibility: whether it is feasible to intervene and realize the candidate CF example from the original input. To learn from this labelled feasibility data, we propose a modified variational auto encoder loss for generating CF examples that optimizes for feasibility as people interact with its output. Our experiments on Bayesian networks and the widely used ''Adult-Income'' dataset show that our proposed methods can generate counterfactual explanations that better satisfy feasibility constraints than existing methods.. Code repository can be accessed here: extit{https://github.com/divyat09/cf-feasibility}

研究の動機と目的

  • 構造的因果モデルに関連して、反実仮想説明のグローバルな実現可能性とローカルな実現可能性を定義する。
  • 反実仮想生成中の因果関係を保つための因果的近接損失を導入する。
  • 因果制約が明示されていない場合にユーザーフィードバックから実現可能性を学習する例ベースCF(Example-Based CF)というVAEベースの手法を提案する。
  • 因果を考慮した手法がAdult-Incomeおよびベイズネットワークデータセットでより実現可能な反実仮想を生み出すことを示す。
  • 提案手法がいくつかの既存手法と比較して反実仮想の生成でより高速であることを示す。

提案手法

  • 実現可能性を、基底となる構造的因果モデル(SCM)によって含意される制約として定式化する。
  • CF生成時に因果関係を保存する距離項としてDistCausalを提案する。
  • 完全なSCMが未知の場合の実用的近似として、一項・二項の実現可能性制約を提供する。
  • 部分的SCMを有するモデルベースCFと実現可能性を組み込んだモデル近似CFを導入する。
  • VAEを用いてCFを生成し、オラクルを通じてユーザーフィードバックから実現可能性を学習するExample-Based CFを開発する。
  • 妥当性・近接性・実現可能性を組み合わせた損失を最適化し、VAE目的関数にKL項を含める。

実験結果

リサーチクエスチョン

  • RQ1反実仮想説明が因果制約を遵守し、現実世界で実現可能であり続けるにはどうすればよいか?
  • RQ2CF生成時に因果実現可能性を課す実用的な近接損失とは何か?
  • RQ3完全な因果モデルが利用できない場合に、ユーザーフィードバックを用いて実現可能性制約を学習できるか?
  • RQ4因果を考慮したCF法は、既存手法と比較してより実現可能な反実仮想と妥当性の点で同等か?
  • RQ5提案手法は、実データセットと合成データセット(Adult, Simple-BN, Sangiovese)において、実現可能性と効率の点でどのように性能を示すか?

主な発見

  • 因果実現可能性を組み込む手法は、データセット全体で実現可能性スコアにおいてベースライン手法を上回る。
  • 提案されたすべての実現可能性を考慮した手法は、テスト済みデータセットでターゲットクラスの妥当性を完全に達成する。
  • モデルベースCF、モデル近似CF、Example-Based CFは、一般にCEMより制約実現性スコアが高い。
  • Example-Based CFはラベル付き例から実現可能性を学習し、ラベルが増えるほど実現可能性を改善できる。
  • 既知の因果構造を持つデータセットで、これらの手法は因果エッジのスコアが競合的または優れている。
  • 提案手法は、いくつかの既存の最適化ベースのベースラインよりも反実仮想の生成が速い。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。