[论文解读] The Tractability of SHAP-scores over Deterministic and Decomposable Boolean Circuits.
本文证明了在确定性且可分解的布尔电路(如决策树和OBDD)上,SHAP得分可通过利用其可 tractable 的结构,在多项式时间内计算得出。此外,本文进一步表明,计算SHAP得分的复杂度与任意布尔电路类别的模型计数问题相当,从而对DNF公式表明其为#P难问题,凸显了确定性在可 tractable 性中的必要性。
Scores based on Shapley values are currently widely used for providing explanations to classification results over machine learning models. A prime example of this corresponds to the influential SHAP-score, a version of the Shapley value in which the contribution of a set $S$ of features from a given entity $\mathbf{e}$ over a model $M$ is defined as the expected value in $M$ of the set of entities $\mathbf{e}'$ that coincide with $\mathbf{e}$ over all features in $S$. While in general computing Shapley values is a computationally intractable problem, it has recently been claimed that the SHAP-score can be computed in polynomial time over the class of decision trees. In this paper, we provide a proof of a stronger result over Boolean models: the SHAP-score can be computed in polynomial time over deterministic and decomposable Boolean circuits, also known as tractable probabilistic circuits. Such circuits encompass a wide range of Boolean circuits and binary decision diagrams classes, including binary decision trees and Ordered Binary Decision Diagrams (OBDDs). Moreover, we establish the computational limits of the notion of SHAP-score by showing that computing it over a class of Boolean models is always (polynomially) as hard as the model counting problem for this class (under some mild condition). This implies, for instance, that computing the SHAP-score for DNF propositional formulae is a #P-hard problem, and, thus, that determinism is essential for the circuits that we consider.
研究动机与目标
- 建立解释性AI中所用布尔电路广泛类别上SHAP得分计算的可 tractable 性。
- 研究不同布尔电路类别上SHAP得分计算的基本计算复杂度。
- 确定决策树中SHAP得分可 tractable 的性质是否可推广至更一般的电路类别。
- 识别出使SHAP得分保持多项式时间可计算的最小结构条件——特别是确定性与可分解性。
- 阐明SHAP得分计算与布尔逻辑中模型计数问题之间的关系。
提出的方法
- 利用确定性且可分解布尔电路(d-DNNF)的结构特性,通过动态规划实现SHAP得分的高效计算。
- 将SHAP得分定义为特征子集上期望模型输出的重述,利用电路分解结构中的条件期望进行形式化。
- 应用已知的可 tractable 模型计数技术,高效计算所需期望值,利用电路的可分解性与确定性。
- 通过利用电路的分层结构,将SHAP得分计算问题约化为子电路上的模型计数问题,避免暴力枚举。
- 采用递归算法,通过聚合互不重叠的子电路结果来计算贡献值,确保多项式时间复杂度。
- 建立从SHAP得分计算到模型计数问题的正式约化,证明在弱条件下计算难度的等价性。
实验结果
研究问题
- RQ1SHAP得分是否可在确定性且可分解的布尔电路上以多项式时间计算?
- RQ2决策树中SHAP得分的可 tractable 性是否可推广至更广泛的布尔电路类别?
- RQ3在任意布尔电路类别上,SHAP得分计算的基本计算复杂度是什么?
- RQ4SHAP得分计算的复杂度与命题逻辑中模型计数问题有何关系?
- RQ5在该上下文中,确定性是否为SHAP得分多项式时间计算的必要条件?
主要发现
- SHAP得分可在确定性且可分解的布尔电路(包括OBDD和二叉决策树)上以多项式时间计算。
- 在弱条件下,SHAP得分计算的计算复杂度与任意给定布尔电路类别的模型计数问题复杂度等价。
- 计算DNF公式的SHAP得分是#P难的,表明在缺乏如确定性等结构限制时,可 tractable 性不可实现。
- 该结果表明,在布尔电路的上下文中,确定性是实现SHAP得分可 tractable 计算的必要条件。
- 该框架为基于可 tractable 概率电路的广泛解释性AI模型提供了高效的解释生成能力。
- 约化到模型计数为不同电路类别上SHAP得分计算的统一复杂性理论理解提供了支持。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。