Skip to main content
QUICK REVIEW

[论文解读] Nothing Else Matters: Model-Agnostic Explanations By Identifying Prediction Invariance

Marco Túlio Ribeiro, Sameer Singh|arXiv (Cornell University)|Nov 17, 2016
Explainable Artificial Intelligence (XAI)参考文献 8被引用 62
一句话总结

本文提出aLIME,一种模型无关的方法,用于生成局部、基于规则的解释(即锚点),识别使模型预测保持不变的特征子集——即其他特征的变化不会影响模型输出。通过使用带有霍夫丁不等式的贪心采样算法,aLIME在文本、图像和视觉问答等模拟与真实任务中,实现了高精度、可解释的解释,并具有清晰的适用范围边界,其表现优于线性LIME。

ABSTRACT

At the core of interpretable machine learning is the question of whether humans are able to make accurate predictions about a model's behavior. Assumed in this question are three properties of the interpretable output: coverage, precision, and effort. Coverage refers to how often humans think they can predict the model's behavior, precision to how accurate humans are in those predictions, and effort is either the up-front effort required in interpreting the model, or the effort required to make predictions about a model's behavior. In this work, we propose anchor-LIME (aLIME), a model-agnostic technique that produces high-precision rule-based explanations for which the coverage boundaries are very clear. We compare aLIME to linear LIME with simulated experiments, and demonstrate the flexibility of aLIME with qualitative examples from a variety of domains and tasks.

研究动机与目标

  • 为解决现有模型无关解释方法(如LIME)在覆盖范围明确性和高精度方面的不足。
  • 开发一种可生成人类易于理解与应用的直观规则化解释的方法。
  • 通过预测不变性确保解释既精确又具有明确定义的适用边界。
  • 通过在概率近似正确(PAC)框架下优化简短、高精度的锚点,实现覆盖度、精确度与工作量之间的平衡。
  • 在包括文本、图像和视觉问答在内的多种领域中,验证该方法的有效性。

提出的方法

  • aLIME将锚点生成为IF-THEN规则,识别在这些规则约束下模型预测保持不变的特征条件。
  • 该方法采用贪心搜索策略,选择能最大化精确度的约束条件,精确度通过在锚点条件下的数据分布上进行蒙特卡洛采样估计。
  • 应用霍夫丁不等式,确保估计的精确度在用户定义的误差范围(1−ε)内以高概率成立。
  • 当当前锚点的精确度超过1−ε时,算法停止,从而保证高可靠性。
  • 通过在实例x上条件化数据分布𝒟(z|c,x),实现上下文相关的采样,提升相关性。
  • 该方法采用子模优化(Submodular Pick)技术,高效探索可能的锚点空间。

实验结果

研究问题

  • RQ1我们能否生成具有明确、可解释适用边界的模型无关解释?
  • RQ2我们能否在保持人类解释低工作量的同时,确保解释的高精确度?
  • RQ3如何识别使模型预测对其他特征变化保持不变的特征子集?
  • RQ4基于规则的解释是否能在人类可解释性和精确度方面优于线性近似?
  • RQ5锚点在表格数据、文本、图像和视觉问答等多样化模态中表现如何?

主要发现

  • aLIME生成的锚点具有高精确度:在图像分类和视觉问答任务中精确度达到95%或以上。
  • 在斑马图像分类任务中,即使将灰度化超像素替换为随机图像,锚点仍保持预测不变。
  • 在视觉问答中,锚点揭示了模型偏差——例如,问题中出现'What'时,模型95%的时间预测为'banana',表明其推理存在缺陷。
  • 在词性标注任务中,锚点正确捕捉了句法模式,例如当'play'前有代词时,它被识别为动词。
  • 在模拟实验中,aLIME优于线性LIME,表现出更高的精确度和更清晰的适用条件。
  • 该方法在多种领域中表现出鲁棒性,包括医院再入院预测和文本分类,且生成的规则简短、可解释。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。