QUICK REVIEW

[論文レビュー] Towards Quantification of Explainability in Explainable Artificial Intelligence Methods

Sheikh Rabiul Islam, William Eberle|arXiv (Cornell University)|Nov 22, 2019

Explainable Artificial Intelligence (XAI)参考文献 18被引用数 27

ひとこと要約

本論文は、認知的チャンク化、相互作用強度、出力構造を測定することで、XAIにおける説明可能性をモデルに依存しないプロキシベースの方法で定量化する手法を提案する。ドメイン知識に基づく特徴量構築（例：クレジットの5C）を用いることで、元の特徴量と比較して説明可能性スコアが60.14%向上し、性能への影響は最小限に抑えられ、クレジットリスク予測などのハイリスク分野における解釈可能性が向上する。

ABSTRACT

Artificial Intelligence (AI) has become an integral part of domains such as security, finance, healthcare, medicine, and criminal justice. Explaining the decisions of AI systems in human terms is a key challenge--due to the high complexity of the model, as well as the potential implications on human interests, rights, and lives . While Explainable AI is an emerging field of research, there is no consensus on the definition, quantification, and formalization of explainability. In fact, the quantification of explainability is an open challenge. In our previous work, we incorporated domain knowledge for better explainability, however, we were unable to quantify the extent of explainability. In this work, we (1) briefly analyze the definitions of explainability from the perspective of different disciplines (e.g., psychology, social science), properties of explanation, explanation methods, and human-friendly explanations; and (2) propose and formulate an approach to quantify the extent of explainability. Our experimental result suggests a reasonable and model-agnostic way to quantify explainability

研究の動機と目的

説明可能AI（XAI）手法における説明可能性の定義の不一致と形式的定量化の欠如に対処すること。
心理学、社会学、認知科学など複数分野の視点から説明可能性を定義し、その性質を形式化すること。
人間の評価を必要とせず、人間の評価を必要としない、転送可能なプロキシベースの説明可能性の定量化手法を開発すること。
ドメイン知識の統合が、実世界の応用において説明可能性とモデル性能の両方を向上させるかどうかを評価すること。
異なるモデルアーキテクチャーや特徴量セット間でXAI手法を比較可能な測定可能で解釈可能な指標を提供すること。

提案手法

入力チャンク（Ni）、出力チャンク（No）、相互作用強度（I）に基づいて説明可能性（E）を計算する形式的公式（式5）を提案する。
Rのimlパッケージを用いて、特徴量相互作用の部分従属分析により相互作用強度（I）を計算する。
認知的チャンク化理論を適用：入力および出力チャンクが少ない、意味のあるものであるほど、説明可能性の認識が向上する。
相関重み付き累積和を用いて、元の特徴量からドメイン固有の特徴量（例：クレジットの5C）を構築し、解釈可能性を向上させる。
3つの特徴量設定（元の特徴量、ドメイン関連特徴量、新たに構築された特徴量）を比較し、説明可能性スコアを評価する。
複数の機械学習モデル（例：ランダムフォレスト、勾配ブースティング）を用いて、住宅ローン破産予測データセットで手法を実証的に検証する。

実験結果

リサーチクエスチョン

RQ1心理学、社会学、認知科学などの分野において、説明可能性を形式的に定義・定量化することは可能か？
RQ2生の特徴量と比較して、ドメイン知識に基づく特徴量構築がどの程度説明可能性を向上させるか？
RQ3人間の評価や実験的調査を必要としないプロキシベースの手法で、説明可能性を定量化できるか？
RQ4ドメイン知識に基づく特徴量工学を用いる際の、説明可能性とモデル性能のトレードオフはいかほどか？
RQ5入力および出力表現における認知的チャンクの数が、AI意思決定の説明可能性の認識にどのように影響するか？

主な発見

クレジットの5Cの原則に基づいて新たに構築された特徴量が、最高の説明可能性スコア0.2723を達成し、元の特徴量（0.1701）と比較して60.14%の向上を示した。
ドメイン関連特徴量は説明可能性スコア0.2539を示し、完全な特徴量再設計がなくても、ドメイン知識の統合が解釈可能性を向上させることを示した。
提案手法は、性能への顕著な悪影響を伴わず、一部のモデル（例：ランダムフォレスト、勾配ブースティング）ではレアなターゲットクラスの再現率が向上した。
この手法はモデルに依存せず、SHAPのような後処理解釈器を含む任意のXAI手法に適用可能であり、元の特徴量空間に限定されるため、0.1701の説明可能性の上限に達しない。
相互作用強度（I）は、設定間で比較的安定しており（0.52–0.56）、説明可能性の向上要因は主に入出力チャンクの構造的単純化に起因しており、特徴量相互作用ではないことが示された。
図2および図3に示される、元の特徴量とドメイン特徴量の性能の分散は、ほとんど負の影響を示さず、実運用における手法の実現可能性を裏付けた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。