[论文解读] Explainable Artificial Intelligence Approaches: A Survey
本综述基于信用违约预测案例研究,评估流行的 XAI 方法,分析优缺点,并讨论可解释性量化与面向人本的 AI 路径。
The lack of explainability of a decision from an Artificial Intelligence (AI) based "black box" system/model, despite its superiority in many real-world applications, is a key stumbling block for adopting AI in many high stakes applications of different domain or industry. While many popular Explainable Artificial Intelligence (XAI) methods or approaches are available to facilitate a human-friendly explanation of the decision, each has its own merits and demerits, with a plethora of open challenges. We demonstrate popular XAI methods with a mutual case study/task (i.e., credit default prediction), analyze for competitive advantages from multiple perspectives (e.g., local, global), provide meaningful insight on quantifying explainability, and recommend paths towards responsible or human-centered AI using XAI as a medium. Practitioners can use this work as a catalog to understand, compare, and correlate competitive advantages of popular XAI methods. In addition, this survey elicits future research directions towards responsible or human-centric AI systems, which is crucial to adopt AI in high stakes applications.
研究动机与目标
- 使用互惠贷款违约预测任务演示流行的 XAI 方法
- 从多角度比较 XAI 方法的优缺点及竞争优势
- 提供在 XAI 下量化可解释性和评估人本 AI 的见解
- 提出以可解释性为媒介的负责任 AI 方向建议
提出的方法
- 将 XAI 方法描述并分类为固有可解释、模型无关、以及基于示例的解释
- 使用 Freddie Mac 数据集的互惠测试用例(信用违约预测)来说明方法的工作原理
- 从全局与局部、先验(ante-hoc)与后验(post-hoc)、固有与仿真解释等角度分析方法
- 应用 R 的 iml 包生成并比较该案例研究的解释
- 咨询并综合最近调查的发现以增强分析
- 提出用于比较解释的框架,并讨论未解问题与未来研究方向
实验结果
研究问题
- RQ1在不同解释(局部/全局、ante-hoc/post-hoc、固有/仿真)下,流行的 XAI 方法有哪些竞争优势与局限性?
- RQ2可解释性如何量化与评估,包括人机协同评估和代理性指标?
- RQ3在像信用违约预测这样的高风险现实任务中,XAI 方法的表现与沟通如何?
- RQ4在将 XAI 作为媒介时,哪些方向对负责任或人本导向的 AI 是有前景的?
主要发现
- XAI 方法在可解释性、保真度及在不同模型与任务中的适用性方面提供一系列权衡
- 全局方法(如 PDP、ALE)提供整体模型行为,而局部方法(如 LIME、SHAP)解释实例级预测
- 特征重要性、交互分析和代理模型有帮助,但可能受特征相关性与交互的影响
- 反事实、原型和基于示例的解释提供对人更友好的见解,但面临如 Rashomon 效应 和 选择代表性实例等挑战
- 需要方法无关、局部且实际的解释(非幻象)来支持负责任、以人为本的 AI
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。