[論文レビュー] The Tractability of SHAP-scores over Deterministic and Decomposable Boolean Circuits.
本稿は、決定的かつ分解可能なブール回路(例:意思決定木やOBDD)において、その取り扱いやすい構造を活用することで、SHAPスコアが多項式時間で計算可能であることを証明している。さらに、任意のブール回路クラスにおいてSHAPスコアの計算がモデルカウンティングと同程度難しいことを示しており、DNF式では#P困難であることが示され、決定的であることの重要性が明確になった。
Scores based on Shapley values are currently widely used for providing explanations to classification results over machine learning models. A prime example of this corresponds to the influential SHAP-score, a version of the Shapley value in which the contribution of a set $S$ of features from a given entity $\mathbf{e}$ over a model $M$ is defined as the expected value in $M$ of the set of entities $\mathbf{e}'$ that coincide with $\mathbf{e}$ over all features in $S$. While in general computing Shapley values is a computationally intractable problem, it has recently been claimed that the SHAP-score can be computed in polynomial time over the class of decision trees. In this paper, we provide a proof of a stronger result over Boolean models: the SHAP-score can be computed in polynomial time over deterministic and decomposable Boolean circuits, also known as tractable probabilistic circuits. Such circuits encompass a wide range of Boolean circuits and binary decision diagrams classes, including binary decision trees and Ordered Binary Decision Diagrams (OBDDs). Moreover, we establish the computational limits of the notion of SHAP-score by showing that computing it over a class of Boolean models is always (polynomially) as hard as the model counting problem for this class (under some mild condition). This implies, for instance, that computing the SHAP-score for DNF propositional formulae is a #P-hard problem, and, thus, that determinism is essential for the circuits that we consider.
研究の動機と目的
- 解釈可能AIで用いられる広範なブール回路クラスにおけるSHAPスコアの計算的取り扱いやすさを確立すること。
- さまざまなブール回路クラスにおけるSHAPスコア計算の根本的な計算複雑性を調査すること。
- 意思決定木におけるSHAPスコアの取り扱いやすさが、より一般的な回路クラスへと拡張可能かどうかを特定すること。
- SHAPスコアが多項式時間で計算可能であるための最小限の構造的条件(特に決定的性と分解可能性)を同定すること。
- SHAPスコア計算とブール論理におけるモデルカウンティング問題との関係を明確にすること。
提案手法
- 決定的かつ分解可能なブール回路(d-DNNF)の構造的性質を活用し、動的計画法を用いてSHAPスコアを効率的に計算する。
- SHAPスコアの定義を、特徴量の部分集合における期待モデル出力として再定式化し、回路の分解構造内での条件付き期待値を用いる。
- 既知の取り扱いやすいモデルカウンティング技術を適用し、回路の分解可能性と決定的性を活用して必要な期待値を効率的に計算する。
- 回路の階層的構造を活用してブルートフォースな列挙を避けることで、SHAPスコア計算問題を部分回路におけるモデルカウンティング問題に還元する。
- 互いに重複のない部分回路からの結果を集約する再帰的アルゴリズムを採用し、多項式時間複雑性を保証する。
- SHAPスコア計算をモデルカウンティング問題に形式的に還元し、やや緩い条件下でも計算の難易度が同等であることを証明する。
実験結果
リサーチクエスチョン
- RQ1決定的かつ分解可能なブール回路において、SHAPスコアは多項式時間で計算可能か?
- RQ2意思決定木におけるSHAPスコアの取り扱いやすさは、より広範なブール回路クラスへと拡張可能か?
- RQ3任意のブール回路クラスにおけるSHAPスコア計算の根本的計算複雑性は何か?
- RQ4SHAPスコア計算の複雑性は、命題論理におけるモデルカウンティング問題とどのように関係するか?
- RQ5この文脈において、決定的性はSHAPスコアの多項式時間計算のための必要条件か?
主な発見
- OBDDや2分決定木を含む、決定的かつ分解可能なブール回路(例:d-DNNF)において、SHAPスコアは多項式時間で計算可能である。
- やや緩い条件下では、任意のブール回路クラスにおいてSHAPスコア計算の計算複雑性は、モデルカウンティングの複雑性と同等である。
- DNF式におけるSHAPスコアの計算は#P困難であるため、決定的性のような構造的制限がなければ取り扱いやすさは達成できない。
- 本結果により、ブール回路の文脈において、決定的性がSHAPスコア計算の取り扱いやすさのための必要条件であることが示された。
- 本フレームワークにより、取り扱いやすい確率的回路に基づく多様な解釈可能AIモデルに対して、効率的な説明生成が可能になった。
- モデルカウンティングへの還元により、さまざまな回路クラスにおけるSHAPスコア計算の統一的複雑性理論的理解が得られた。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。