[论文解读] Model-Agnostic Counterfactual Explanations for Consequential Decisions
介绍 MACE,一种模型无关的方法,通过求解一系列 SMT 可满足性问题,为任意预测器生成最近、合理且多样化的反事实解释,达到 100% 覆盖率,并且得到比先前工作更接近的反事实。
Predictive models are being increasingly used to support consequential decision making at the individual level in contexts such as pretrial bail and loan approval. As a result, there is increasing social and legal pressure to provide explanations that help the affected individuals not only to understand why a prediction was output, but also how to act to obtain a desired outcome. To this end, several works have proposed optimization-based methods to generate nearest counterfactual explanations. However, these methods are often restricted to a particular subset of models (e.g., decision trees or linear models) and differentiable distance functions. In contrast, we build on standard theory and tools from formal verification and propose a novel algorithm that solves a sequence of satisfiability problems, where both the distance function (objective) and predictive model (constraints) are represented as logic formulae. As shown by our experiments on real-world data, our algorithm is: i) model-agnostic ({non-}linear, {non-}differentiable, {non-}convex); ii) data-type-agnostic (heterogeneous features); iii) distance-agnostic ($\ell_0, \ell_1, \ell_\infty$, and combinations thereof); iv) able to generate plausible and diverse counterfactuals for any sample (i.e., 100% coverage); and v) at provably optimal distances.
研究动机与目标
- 动机:在重大决策(如保释、贷款)中需要解释的原因,以及现有方法的局限性。
- 提出 MACE,一种模型无关的方法,能够在保证条件下生成最近的反事实。
- 在确保可行性和多样性的同时,处理异构特征空间与任意距离度量。
- 提供一个可扩展的工作流,在 SMT 公式下产生可证明最优距离的反事实。
- 在真实世界数据集上展示实际有效性,并提供全覆盖保证。
提出的方法
- 将最近反事实问题表示为一系列可满足性问题,通过将模型、距离、可行性和多样性约束编码为逻辑公式。
- 使用模型的特征公式(从程序表示构建)来捕捉不同模型类别的 f(x)=y(如决策树、MLPs)。
- 将距离函数与可行性/多样性约束表达为 SMT 友好程序,实现模型和距离无关的优化。
- 对距离阈值 delta 进行二分搜索,以在可控精度下逼近最近的反事实,利用 SMT 预言机进行可行性检查。
- 通过添加约束来强制多个反事实之间的最小距离,从而实现多样性。
- 支持异构数据类型(数值、分类、序数),使用归一化每特征变化并结合 L0、L1 和 Linf 范数的距离度量。
实验结果
研究问题
- RQ1如何以模型无关的方式为重大决策生成反事实解释?
- RQ2在一般距离度量下,能否使用 SMT 求解器找到具有最优性保证的最近反事实?
- RQ3可行性与多样性约束如何影响反事实的质量与可行性?
- RQ4在真实世界、异构数据集上,与现有方法在覆盖率和距离方面相比,MACE 的表现如何?
- RQ5可操作性约束(可行性)与产生的反事实距离之间有哪些权衡?
主要发现
- MACE 在所评估的实例中按设计实现了 100% 覆盖率。
- 与先前的方法相比,MACE 在多个数据集(Adult、Credit、COMPAS)上产生的反事实更接近。
- 与基线相比的平均距离降低幅度达到 70.2%(Adult)、75.4%(Credit)和 21.1%(COMPAS)。
- MACE 支持异构特征空间和任意距离组合(L0、L1、L∞),并具有最优距离保证。
- 引入可行性约束(如不可变特征如年龄不改变)会在 L1 和 L∞ 范数下增加距离,但仍保持可行、合规的解释。
- 该方法提供 100% 覆盖率,并通过纳入多样性约束来生成多样的反事实。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。