[论文解读] Concept-based Explainable Artificial Intelligence: A Survey
本文综述基于概念的可解释性人工智能(C-XAI),定义概念,提出九类分类法,并为该领域提供指南和评估策略。
The field of explainable artificial intelligence emerged in response to the growing need for more transparent and reliable models. However, using raw features to provide explanations has been disputed in several works lately, advocating for more user-understandable explanations. To address this issue, a wide range of papers proposing Concept-based eXplainable Artificial Intelligence (C-XAI) methods have arisen in recent years. Nevertheless, a unified categorization and precise field definition are still missing. This paper fills the gap by offering a thorough review of C-XAI approaches. We define and identify different concepts and explanation types. We provide a taxonomy identifying nine categories and propose guidelines for selecting a suitable category based on the development context. Additionally, we report common evaluation strategies including metrics, human evaluations and dataset employed, aiming to assist the development of future methods. We believe this survey will serve researchers, practitioners, and domain experts in comprehending and advancing this innovative field.
研究动机与目标
- 在概念基于解释领域界定关键术语,并澄清概念与解释。
- 提出基于概念使用、训练与解释的九类C-XAI分类法。
- 基于开发约束提供选择合适C-XAI方法的指南。
- 在13维度上分析方法,以实现系统的比较与评估。
- 报告现有的度量指标、数据集和评估实践,以支持未来的C-XAI研究。
提出的方法
- 定义并对概念类型进行分类(符号、无监督基础、原型、文本化)。
- 区分基于概念的解释(类别-概念关系、节点-概念关联、概念可视化)。
- 区分事后基于概念的解释与可解释设计的基于概念的模型。
- 开发一个13维分析框架,以在概念、适用性和资源等方面刻画方法。
- 提出一套指南框架,帮助从业者选择合适的C-XAI方法。
- 回顾并综合评估策略,包括度量指标、人工评估和数据集。
实验结果
研究问题
- RQ1在C-XAI中,概念及概念基于解释的核心定义是什么?
- RQ2如何将C-XAI方法分类到一个全面的分类法中,以及对使用的含义是什么?
- RQ3在约束和目标下,哪些指南能帮助研究者选择合适的C-XAI方法?
- RQ4用于评估C-XAI方法的评估策略、指标和数据集是什么?
- RQ5基于概念的可解释性当前的应用及未来方向是什么?
主要发现
- 首次系统性综述概念基XAI(C-XAI)。
- 定义四种概念类型和三种解释类型,为正式化术语表做出贡献。
- 提供九类分类法及方法选择的实用指南。
- 在13个维度上分析方法,以实现结构化比较。
- 讨论C-XAI开发的度量指标、数据集和人类评估实践。
- 强调早期应用及未来研究的有前景方向。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。