Skip to main content
QUICK REVIEW

[論文レビュー] SHAP-IQ: Unified Approximation of any-order Shapley Interactions

Fabian Fumagalli, Maximilian Muschalik|arXiv (Cornell University)|Mar 2, 2023
Explainable Artificial Intelligence (XAI)被引用数 11
ひとこと要約

SHAP-IQ は、任意順位の Cardinal Interaction Indices(CII)を近似するための統一された、偏りのない、一貫したサンプリングベースの手法を提供し、SII、STI、FSI に跨る Shapley 相互作用計算を統一・簡素化します。

ABSTRACT

Predominately in explainable artificial intelligence (XAI) research, the Shapley value (SV) is applied to determine feature attributions for any black box model. Shapley interaction indices extend the SV to define any-order feature interactions. Defining a unique Shapley interaction index is an open research question and, so far, three definitions have been proposed, which differ by their choice of axioms. Moreover, each definition requires a specific approximation technique. Here, we propose SHAPley Interaction Quantification (SHAP-IQ), an efficient sampling-based approximator to compute Shapley interactions for arbitrary cardinal interaction indices (CII), i.e. interaction indices that satisfy the linearity, symmetry and dummy axiom. SHAP-IQ is based on a novel representation and, in contrast to existing methods, we provide theoretical guarantees for its approximation quality, as well as estimates for the variance of the point estimates. For the special case of SV, our approach reveals a novel representation of the SV and corresponds to Unbiased KernelSHAP with a greatly simplified calculation. We illustrate the computational efficiency and effectiveness by explaining language, image classification and high-dimensional synthetic models.

研究の動機と目的

  • XAI における単一特徴の寄与を超える特徴間相互作用を定量化する必要性を動機づける。
  • Cardinal Interaction Index(CII)フレームワークの下で Shapley 相互作用の概念を一般化する。
  • 任意の CII に対して理論的保証を備えた統一的なサンプリングベースの推定量を開発する。
  • Shapley 値のためのUnbiased KernelSHAPを含む、既存手法との関係を明らかにする。
  • 言語モデル、画像モデル、および高次元の合成データセットへの適用性と計算効率を示す。

提案手法

  • D のすべての部分集合 T の和として CII を、新しい重みが |T| および |T ∩ S| に依存する表現を導入する。
  • この表現を用いてモンテカルロ推定量として SHAP-IQ を定義し、調整可能なサンプリング順序 k0 と分布 p_{k0}(T) を持つ。
  • SHAP-IQ が偏りなく一貫性を持つことを証明し、分散推定を含む一般的な近似界を提供する。
  • 導入された s-効率性の概念を通じて、n-SII および STI の効率を SHAP-IQ が保持することを示す。
  • SHAP-IQ を Shapley 値へ特化し、新しい表現を導出し、それを Unbiased KernelSHAP (U-KSH) に結びつける。
  • 言語モデルと画像モデル、および高次元の合成データに対する実験を通じて実用的な性能を示す。
Figure 1: Interaction scores for a movie review excerpt presented to a sentiment analysis model.
Figure 1: Interaction scores for a movie review excerpt presented to a sentiment analysis model.

実験結果

リサーチクエスチョン

  • RQ1線形性・対称性・ダミー公理の下で、単一の統一推定量が任意順位の CII を近似できるだろうか?
  • RQ2モデル評価からの CII の効率的で、偏りのない一貫した推定を可能にする表現は何か?
  • RQ3SHAP-IQ は既存の Shapley ベースの推定量、特に SV のための U-KSH との関係はどうで、どのように単純化するか?
  • RQ4SHAP-IQ の推定はオーダーを跨いで n-SII および STI の効率を維持するか?
  • RQ5SHAP-IQ は NLP、コンピュータビジョン、および高次元の合成設定で有効か?

主な発見

  • SHAP-IQ は一般的な分散上界を伴う、任意順位 CII の偏りのない一貫した推定量を提供する。
  • 著者らは、モデル評価からすべてのスコアを同時に計算できる新しい CII 表現を導出する。
  • SV の場合、SHAP-IQ は新しい SV 表現を生み出し、U-KSH に等価な形に簡略化され、計算を容易にする。
  • SHAP-IQ は s-効率性を通じて n-SII および STI の効率を維持する一方、FSI は s-効率的でない可能性がある。
  • 実証結果は、言語モデルと画像モデルの SII および STI に対して SHAP-IQ がベースラインを上回り、高次元の合成データにもスケールすることを示す。
Figure 2: Approximation quality of SHAP-IQ and the baseline for orders $s=1,2,3$ of SII measured by MSE for the LM (left) and Prec@10 for orders $s=2,3$ for the LM (middle) and ICM (right).
Figure 2: Approximation quality of SHAP-IQ and the baseline for orders $s=1,2,3$ of SII measured by MSE for the LM (left) and Prec@10 for orders $s=2,3$ for the LM (middle) and ICM (right).

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。