[论文解读] Do Not Trust Additive Explanations
本文批评用于表格数据的加性解释方法(LIME、SHAP、Break Down),展示它们在存在交互时可能不一致且具有误导性,并引入 iBreakDown 以在局部解释中捕捉交互、并进行不确定性评估和基准测试。
Explainable Artificial Intelligence (XAI)has received a great deal of attention recently. Explainability is being presented as a remedy for the distrust of complex and opaque models. Model agnostic methods such as LIME, SHAP, or Break Down promise instance-level interpretability for any complex machine learning model. But how faithful are these additive explanations? Can we rely on additive explanations for non-additive models? In this paper, we (1) examine the behavior of the most popular instance-level explanations under the presence of interactions, (2) introduce a new method that detects interactions for instance-level explanations, (3) perform a large scale benchmark to see how frequently additive explanations may be misleading.
研究动机与目标
- 说明为何对于复杂的、非加性模型,加性解释可能不可靠。
- 展示特征之间的交互如何影响 LIME、SHAP 和 Break Down 等局部解释的保真度。
- 提出并验证一种方法(iBreakDown)以在实例级解释中检测交互。
- 提供对解释的不确定性评估,并展示在实际中交互的频率。
提出的方法
- 回顾并通过一个类似泰坦尼克号的 toy 示例说明加性解释的问题。
- 定义单步特征贡献和成对交互以量化非加法性。
- 引入 iBreakDown 以捕捉局部交互并生成带交互可视化的非加法解释。
- 建立基于自助法/自放回 bootstrapping 的程序来量化解释的不确定性。
- 在 OpenML 二分类数据集上,对具有不同交互深度的模型基准 iBreakDown。
- 证明 Shapley 值与 Break Down 贡献之间的关系,即作为所有排列的平均值。
实验结果
研究问题
- RQ1加性解释是否在考虑特征的不同顺序时产生一致的归因?
- RQ2特征之间的交互如何影响 LIME、SHAP 和 Break Down 等局部解释的保真度?
- RQ3一种明确建模交互的方法(iBreakDown)是否能提供更可信的解释并量化不确定性?
- RQ4在真实数据集和随着交互深度增加的模型中,局部交互有多频繁?
主要发现
- 当存在交互时,加性解释可能不一致且不可靠。
- 在加性解释中可以观察到不确定性,表现为不同特征顺序之间的变异性。
- 所提出的 iBreakDown 方法捕捉局部交互并能够产生带有交互的非加性解释,可在瀑布图中可视化。
- 在 OpenML 数据的基准测试中,具有更高交互深度的模型检测到的局部交互更多,表明交互普遍存在且与模型相关。
- iBreakDown 解释与 Shapley 值作为所有顺序的平均值对齐,将新方法与既有归因概念联系起来。
- 作者提供了 iBreakDown 的 R 和 Python 实现。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。