Skip to main content
QUICK REVIEW

[論文レビュー] Learning to Explain: An Information-Theoretic Perspective on Model Interpretation

Jianbo Chen, Le Song|arXiv (Cornell University)|Feb 21, 2018
Machine Learning and Data Classification被引用数 274
ひとこと要約

本論文は、学習された特徴サブセットとモデル出力との相互情報量を最大化する、インスタンスごとの特徴セレクタを提案します。効率的な訓練と説明のための変分下限と連続緩和を用います。

ABSTRACT

We introduce instancewise feature selection as a methodology for model interpretation. Our method is based on learning a function to extract a subset of features that are most informative for each given example. This feature selector is trained to maximize the mutual information between selected features and the response variable, where the conditional distribution of the response variable given the input is the model to be explained. We develop an efficient variational approximation to the mutual information, and show the effectiveness of our method on a variety of synthetic and real data sets using both quantitative metrics and human evaluation.

研究の動機と目的

  • インスタンスごとに、モデル出力を情報として提供する特徴のサブセットを選択することとして、インスタンスごとの特徴選択を定義する。
  • 選択された特徴とモデル応答の間の相互情報量を最大化する情報理論的目的を提案する。
  • 効率的な訓練のための扱いやすい変分下限とニューラルネットワークベースの説明者を開発する。
  • 定量的指標と人間評価を用いて、定量データと実データセットで有効性と効率を示す。

提案手法

  • 説明を、入力 X ごとに k 個の特徴サブセット S を選択して I(X_S; Y) を最大化することとして定式化する。
  • Y|X_S の分布族 Q を用いた相互情報の変分下限を導入する。
  • Q を単一のニューラルネットワーク g_alpha でパラメータ化し、P_m(Y|X_S) をモデル化する。
  • 連続的緩和(Gumbel-softmax / Concrete)を用いて S をサンプルし、微分可能な最適化を可能にする。
  • 確率的勾配法で、説明者パラメータ theta とモデル近似パラメータ alpha を同時に最適化する。
  • 学習された重み w_theta(X) に基づいて特徴を順位付けし、上位 k 個の特徴を選択して後で説明する。

実験結果

リサーチクエスチョン

  • RQ1各インスタンスについて、モデル出力との相互情報量を最大化するインスタンスごとの特徴サブセットを学習できるか?
  • RQ2扱いやすい変分下限は、モデル非依存で推論時に効率的な説明者を訓練するのに十分か?
  • RQ3提案された L2X アプローチは、精度と速度の点で既存のインスタンス別説明法を上回るか?
  • RQ4合成非線形データおよび実データセット(テキストと画像)で、説明品質と人間との整合性の点で方法はどうか?

主な発見

  • L2X は、非線形およびスイッチング特徴データセットにおける特徴ランキング品質の点で、ベースライン(Saliency、DeepLIFT、SHAP、LIME)を上回る。
  • 本アプローチは、事後の精度で競争力があるか優れており、感情分析と MNIST 実験で人間の判断とよく一致する。
  • L2X は説明時の効率性が高く、インスタンスごとに説明を生成するのに一度のフォワードパスしか必要としない。
  • データ規模が大きくなるにつれてトレーニング時間は総時間の割合が小さくなり、相対的な効率が向上する。
  • 本手法はモデル非依存の説明を可能にしつつ、元のモデル予測への忠実度を高く保つ。)

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。