Skip to main content
QUICK REVIEW

[论文解读] Generating Counterfactual and Contrastive Explanations using SHAP

Shubham Rathi|arXiv (Cornell University)|Jun 21, 2019
Explainable Artificial Intelligence (XAI)参考文献 14被引用 55
一句话总结

本论文提出一个使用 SHAP 的模型无关管道,用于生成对比性解释和相应的反事实数据点,在 Iris、Wine Quality 和 Mobile Features 数据集以及多种模型上进行评估。

ABSTRACT

With the advent of GDPR, the domain of explainable AI and model interpretability has gained added impetus. Methods to extract and communicate visibility into decision-making models have become legal requirement. Two specific types of explanations, contrastive and counterfactual have been identified as suitable for human understanding. In this paper, we propose a model agnostic method and its systemic implementation to generate these explanations using shapely additive explanations (SHAP). We discuss a generative pipeline to create contrastive explanations and use it to further to generate counterfactual datapoints. This pipeline is tested and discussed on the IRIS, Wine Quality & Mobile Features dataset. Analysis of the results obtained follows.

研究动机与目标

  • 推动 GDPR 驱动的可解释 AI 需求以及人类中心的解释,如对比性和反事实解释。
  • 提出一个使用 SHAP 的模型无关管道,以生成对比性解释及相应的反事实数据点。
  • 在多种数据集和分类器上评估该方法,以评估所生成解释的质量和实用性。

提出的方法

  • 使用 SHAP 计算目标类别下每个数据点的特征归因。
  • 利用正负 SHAP 值为 '为何是 P?' 和 '为何不是 Q?' 构建自然语言解释。
  • 仅对对目标类别不利贡献的特征进行变异,以生成反事实数据点。
  • 通过探索变异的特征集并生成最近邻基础的反事实,直到点被分类为期望的类别 Q。
  • 在模型(KNN、NN、RF、SVM)和数据集(IRIS、Wine Quality、Mobile Features)之间进行比较,以评估反事实生成。

实验结果

研究问题

  • RQ1可以使用基于 SHAP 的归因来为不同分类器的模型输出生成连贯的对比性解释(“为何是 P 而不是 Q?”)吗?
  • RQ2是否可以通过仅变异对目标类别有负贡献的特征,以模型无关的方式生成多样且现实的反事实数据点?
  • RQ3所提出的解释在密度和特征维数不同的数据集上表现如何?

主要发现

模型CFsCPs比率平均值
SVM4726814.4%7.8
RF44615133.85%7.4
NN4386715.29%7.3
KNN45213830.53%7.5
  • 该方法在若干模型和数据集上产生对比性解释和反事实数据点。
  • 大多数生成的反事实并未出现在原始数据集中,表明其探索超出了局部邻域。
  • SVM 与神经网络倾向于生成更多的反事实,表明其决策边界更易于进行这种变异。
  • 在 Iris、RF、NN、KNN 上,反事实的数量及其与数据的重叠程度不同,重叠度越低,表示决策边界越紧凑。
  • 密集数据集(Wine Quality、Mobile Features)产生的共同反事实较少,暗示模型拥有更好的分离。
  • 系统实现(网页仪表板)展示了对给定点生成解释的可行性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。