QUICK REVIEW

[論文レビュー] A Game Theoretic Approach to Class-wise Selective Rationalization

Shiyu Chang, Shuicheng Yan|arXiv (Cornell University)|Oct 28, 2019

Explainable Artificial Intelligence (XAI)被引用数 42

ひとこと要約

Class-wise Adversarial Rationalization (Car)を導入した、事実的および反事実的な理由付け生成器と識別器を備え、テキスト分類のクラスごとに意図した説明を生成するゲーム理論的フレームワーク。

ABSTRACT

Selection of input features such as relevant pieces of text has become a common technique of highlighting how complex neural predictors operate. The selection can be optimized post-hoc for trained models or incorporated directly into the method itself (self-explaining). However, an overall selection does not properly capture the multi-faceted nature of useful rationales such as pros and cons for decisions. To this end, we propose a new game theoretic approach to class-dependent rationalization, where the method is specifically trained to highlight evidence supporting alternative conclusions. Each class involves three players set up competitively to find evidence for factual and counterfactual scenarios. We show theoretically in a simplified scenario how the game drives the solution towards meaningful class-dependent rationales. We evaluate the method in single- and multi-aspect sentiment classification tasks and demonstrate that the proposed method is able to identify both factual (justifying the ground truth label) and counterfactual (countering the ground truth label) rationales consistent with human rationalization. The code for our method is publicly available.

研究の動機と目的

異なる結果をサポートする多面的な合理の必要性を、単一の全体的な説明ではなく動機づける。
反事実を含む任意のクラスに対して根拠を提供する、クラス依存的な合理化フレームワークを提案する。
クラス別の説明を最適化するために、事実的および反事実的な合理生成器と識別器を備えた adversarial Car システムを構築する。
簡略化された設定における Car の情報理論的性質を理論的に分析する。
人間の合理化との一致度を評価するために、単一および複数の側面を持つ感情分類において Car を経験的に評価する。）
method_to_translate:[]
method2_translate:[]
research_questions1_translate:[]
research_questions2_translate:[]
research_questions3_translate:[]
research_questions4_translate:[]
research_questions5_translate:[]
key_findings1_translate:[]
key_findings2_translate:[]
key_findings3_translate:[]
key_findings4_translate:[]
key_findings5_translate:[]
key_findings6_translate:[]
table_headers_translate:[]
table_rows_translate:[]

提案手法

クラス別合理化を、6人のプレイヤーからなる敵対的ゲームとして定式化する：2つの事実的合理生成器、2つの反事実的合理生成器、および2つの識別器（クラスごとに1つ）.
クラスごとの生成器が単一のネットワークを共有し、識別器はパラメータを共有する、クラス情報を入力とする共有パラメータアーキテクチャを使用する。
選択された合理に対してスパース性と連続性の制約を課し、簡潔で一貫性のある説明を保証する。
目的をクラス別の相互情報量問題として、f-ダイバージェンスに関連づけ、生成器を意味のあるクラス特異的合理化へと導く。
独立性仮定（bag-of-words モデル）のもとで最適戦略を示す情報理論的分析を提供する。
離散的な合理マスクのストレートスルー勾配推定を用いた交互の確率的勾配更新による訓練を説明する。

実験結果

リサーチクエスチョン

RQ1クラス別合理は、事実的（グラウンドトゥルース）クラスと反事実的（代替）クラスの両方に対して効果的に生成できるか？
RQ2敵対的なクラス別生成器と識別器は、単一および複数の側面の感情タスクにおいて、人間の説明と一致する合理を生み出すか？
RQ3情報理論的レンズの下で、Car フレームワークはクラス別相互情報量目的とどのように関連するか？
RQ4生成器と識別器間のパラメータ共有は、性能と訓練の安定性に影響を与えるか？
RQ5Car は他の generator-predictor 合理化フレームワークで見られる退化問題を緩和できるか？

主な発見

Car は、ドメインを横断した Amazon レビューにおけるスパース性制約の下で、事実的な合理の精度を一貫して向上させる。
Car が生成する反事実的合理は、ベースラインより高い精度を達成しつつ、競争力のあるスパース性を維持する。
複数の側面を持つデータセット（beer と hotel）では、Car はほとんどの側面で最良またはほぼ最高の事実的合理を達成し、特に beer の Appearance と Palate、ホテルの複数の側面で顕著。
主観的な人間評価は、Car の合理が人間をよりうまく騙して意図した感情を推測させることを示し、特に事実といくつかの反事実ケースで顕著。
Car は、反事実が単に無情報信号を模倣して識別器を騙すことができないようにすることで退化に対する頑健性を示す。
共有パラメータを持つアーキテクチャは、競争力のある性能を維持しつつモデルの複雑さを低減する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。