Skip to main content
QUICK REVIEW

[論文レビュー] Invariant Rationalization

Shiyu Chang, Shuicheng Yan|arXiv (Cornell University)|Mar 22, 2020
Explainable Artificial Intelligence (XAI)参考文献 25被引用数 37
ひとこと要約

Invariant Rationalization (InvRat) は、偽の相関を避けるための選択的合理化のための、ゲーム理論的で環境ベースの基準を導入し、最大相互情報量(MMI)ベースのアプローチより一般化性能と人間の判断との整合性を改善する。

ABSTRACT

Selective rationalization improves neural network interpretability by identifying a small subset of input features -- the rationale -- that best explains or supports the prediction. A typical rationalization criterion, i.e. maximum mutual information (MMI), finds the rationale that maximizes the prediction performance based only on the rationale. However, MMI can be problematic because it picks up spurious correlations between the input features and the output. Instead, we introduce a game-theoretic invariant rationalization criterion where the rationales are constrained to enable the same predictor to be optimal across different environments. We show both theoretically and empirically that the proposed rationales can rule out spurious correlations, generalize better to different test scenarios, and align better with human judgments. Our data and code are available.

研究の動機と目的

  • ニューラルモデルにおける合理化のための最大相互情報量(MMI)の限界を動機づけ、定式化する。
  • 環境を跨いで予測可能性を不変に保つ不変な合理化基準を提案する。
  • 三者ゲーム理論フレームワークを開発して、不変性制約の下で合理化生成を最適化する。
  • InvRatの収束性と一般化特性を分析する。
  • 合成データと実データの偽の相関を含むデータセットでInvRatを実証的に検証する。

提案手法

  • 合理化のためのMMI目的を形式化し、偽の相関に対する脆弱性を示す。
  • 環境変数とY ⟂ E | Z の不変性制約を導入して、非因果特徴を除去する。
  • 三者InvRatフレームワークを提案する:合理化生成器G、環境に依存しない予測器Fi、環境対応予測器Fe。
  • 不変性制約をラグランジュ/エントロピー視点によるミニマックス目的として再定式化し、交互勾配法で解く。
  • ソフトまたはハード制約法によって合理化マスクに疎性/連続性制約を実装する。
  • KKT条件とゲーム理論的解釈による収束性の洞察を提供する。

実験結果

リサーチクエスチョン

  • RQ1不変な合理化は、因果特徴を偽の相関と区別する点で、MMIベースの方法より優れていると言えるか?
  • RQ2環境を跨ぐ不変性を課すことで、未知のテスト環境への一般化が改善されるか?
  • RQ3三者ゲーム理論フレームワークは、疎性制約の下でどのように効果的に不変な合理化を生成できるか?
  • RQ4不変な合理化は従来の合理化より人間の判断とより一致するか?

主な発見

  • InvRatはMMIが捉えがちな偽の相関への依存を効果的に減らす。
  • 環境駆動の句読点手がかりを用いた合成IMDBデータで、InvRatは注入されたトークンを強調表示することに失敗するが、MMIベースのベースラインではそうではない。
  • 複数の側面/合理化長の設定で、人間が注釈した合理化との整合性がより高い状態で、複数側面のビールレビュー データセットでInvRatはベースラインを上回る。
  • 被験者評価は、InvRatが生成する合理化が対象の側面をより良く伝えることを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。