Skip to main content
QUICK REVIEW

[论文解读] InterpretML: A Unified Framework for Machine Learning Interpretability

Harsha Nori, Samuel Jenkins|arXiv (Cornell University)|Sep 19, 2019
Explainable Artificial Intelligence (XAI)参考文献 16被引用 316
一句话总结

InterpretML 提供一个统一的 Python 框架,用于机器学习可解释性,结合玻璃盒模型与黑盒解释工具,并引入可解释提升机(EBM)。

ABSTRACT

InterpretML is an open-source Python package which exposes machine learning interpretability algorithms to practitioners and researchers. InterpretML exposes two types of interpretability - glassbox models, which are machine learning models designed for interpretability (ex: linear models, rule lists, generalized additive models), and blackbox explainability techniques for explaining existing systems (ex: Partial Dependence, LIME). The package enables practitioners to easily compare interpretability algorithms by exposing multiple methods under a unified API, and by having a built-in, extensible visualization platform. InterpretML also includes the first implementation of the Explainable Boosting Machine, a powerful, interpretable, glassbox model that can be as accurate as many blackbox models. The MIT licensed source code can be downloaded from github.com/microsoft/interpret.

研究动机与目标

  • 提供统一的 API,用于在玻璃盒和黑盒方法之间比较可解释性算法。
  • 通过一致的接口公开可解释模型(玻璃盒)和模型无关的解释(黑盒)。
  • 实现可视化和基于仪表板的比较,帮助模型可解释性决策。
  • 引入并评估可解释提升机(EBM)作为一个准确且易理解的模型。

提出的方法

  • 采用 scikit-learn 风格的 API,以简化可解释性算法的比较。
  • 呈现两种可解释性形式:玻璃盒模型(本质可解释)和黑盒解释(适用于任何管道)。
  • 引入可解释提升机(EBM),这是一种广义加法模型,学习特征函数与可选的成对交互。
  • 对特征进行轮访提升,使用较小学习率,以缓解多重共线性并确保加性可解释性。
  • EBM 使用 C++/Python 实现,并通过 joblib 进行并行化,以实现可扩展训练和快速预测。
  • 提供对特征贡献 f_j(x_j) 的可视化,以解释单个预测。

实验结果

研究问题

  • RQ1如何在统一 API 下暴露可解释性算法,以促进比较?
  • RQ2高度可解释的透明盒模型(EBM)是否能够在预测性能上达到与最先进黑盒方法的竞争力?
  • RQ3EBM 相对于其他模型在不同数据集上的计算特性(训练/预测)是什么?
  • RQ4用于理解特征贡献和交互的可视化与交互工具的效果如何?

主要发现

模型心脏病(303, 13)乳腺癌(569, 30)电信流失(7043, 19)成人收入(32561, 14)信用欺诈(284807, 30)
EBM0.9160.9950.8510.9280.975
LightGBM0.8640.9920.8350.9280.685
逻辑回归0.8950.9950.8040.9070.979
随机森林0.890.9920.8240.9030.95
XGBoost0.870.9950.850.9220.981
  • 在多个数据集上,EBM 的预测性能常常可与随机森林(Random Forest)和 XGBoost 等最先进模型相媲美。
  • 由于其加性结构和简单项查找,EBM 提供快速预测且内存占用低。
  • EBM 支持自动包含成对交互以提升准确性,同时保持可解释性。
  • 该框架使多种可解释性算法之间的比较变得简单,并包含交互式可视化和仪表板。
  • EBM 的默认参数强调速度,并有用于最佳准确性和可解释性的推荐参考参数。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。