Skip to main content
QUICK REVIEW

[论文解读] Extended Empirical Validation of the Explainability Solution Space

Antoni Mestre, Manoli Albert|arXiv (Cornell University)|Mar 1, 2026
Explainable Artificial Intelligence (XAI)被引用 0
一句话总结

该论文将 Explainability Solution Space (ESS) 应用于实时银行欺诈检测系统,比较五类 XAI 家族,在监管与延迟约束下提出分层混合推荐(SHAP 始终开启、争议情形使用对抗性解释、离线规则提取)

ABSTRACT

This technical report provides an extended validation of the Explainability Solution Space (ESS) through cross-domain evaluation. While initial validation focused on employee attrition prediction, this study introduces a heterogeneous intelligent urban resource allocation system to demonstrate the generality and domain-independence of the ESS framework. The second case study integrates tabular, temporal, and geospatial data under multi-stakeholder governance conditions. Explicit quantitative positioning of representative XAI families is provided for both contexts. Results confirm that ESS rankings are not domain-specific but adapt systematically to governance roles, risk profiles, and stakeholder configurations. The findings reinforce ESS as a generalizable operational decision-support instrument for explainable AI strategy design across socio-technical systems.

研究动机与目标

  • 展示 ESS 在实时、符合法规的欺诈检测领域的应用性。
  • 评估在运营约束下,不同 XAI 家族在合规性、用户可理解性与开发者效用等维度的表现。
  • 提供在具备 200 ms 延迟预算的替代部署中的分层混合可解释性部署建议。
  • 展示 ESS 结果与先前 HR attrition 实例的一致性,以支持框架的泛化性。

提出的方法

  • 用适用于表格化欺诈数据的五大 XAI 家族来实例化 ESS:SHAP TreeExplainer、LIME Tabular、DiCE 风格的 Counterfactuals、全局 Rule Extraction、以及 k-NN Prototypes。
  • 计算每种技术在七个维度上的内在属性向量(Audit., Trace., Compr., Action., Fidelity, Debug., Eff.)。
  • 使用加权公式将属性聚合到利益相关者维度以获得 C_t、U_t、D_t。
  • 应用替代情境乘数并离散化为定性等级,以获得最终 ESS 坐标(C', U', D')及等级。
  • 进行资源感知的多目标优化,利用综合效用 U_t 及成本代理 R_t 评估部署可行性。
  • 基于多目标结果推导分层混合推荐。

实验结果

研究问题

  • RQ1不同 XAI 家族在实时欺诈检测场景中如何在合规性、用户可理解性与开发者效用间取得平衡?
  • RQ2替代情境乘数对解释技术的排名与选择有何影响?
  • RQ3在替代部署中,哪种分层混合解释策略最能满足监管要求、用户需求和实时约束?
  • RQ4ESS 推荐是否在不同领域情境(欺诈检测 vs HR attrition)中保持一致性,体现泛化性?

主要发现

TechniqueU_tR_tU_t / R_tEfficiency/Latency Note
SHAP3.820.2515.3< 50 ms (✓)
LIME3.560.3310.8~ 80 ms (✓)
Counterfactuals3.800.3311.5~ 100 ms (≈)
Rule Extraction3.900.507.8Offline only (×)
Prototypes3.520.3310.7~ 60 ms (✓)
  • SHAP 在合规性与开发者效用方面实现了最平衡的性能,且延迟预算内(< 50 ms)。
  • Counterfactuals 在降低用户可理解性方面实现了最大化的后续申诉可用性,但合规性稳定性较低且延迟较高(约 100 ms)。
  • Rule Extraction 在合规性方面占主导,但由于离线性质及较低的实时性性能,不适合实时部署。
  • LIME 提供较轻量的替代方案,合规性适中、用户有用性高。
  • Prototypes 提供强烈的用户直觉,但在合规性与开发者价值方面受限。
  • 分层 ESS 推荐(SHAP 始终开启、CF 针对争议场景选择、Rule Extraction 离线)符合延迟与治理需求,同时最大化整体效用。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。