[论文解读] A Consistent and Efficient Evaluation Strategy for Attribution Methods
本文介绍 ROAD(Remove and Debias,去偏),一种无需重新训练的去偏本地归因评估框架,在一致性方面有显著提升并将计算成本最高降低 99%。
With a variety of local feature attribution methods being proposed in recent years, follow-up work suggested several evaluation strategies. To assess the attribution quality across different attribution techniques, the most popular among these evaluation strategies in the image domain use pixel perturbations. However, recent advances discovered that different evaluation strategies produce conflicting rankings of attribution methods and can be prohibitively expensive to compute. In this work, we present an information-theoretic analysis of evaluation strategies based on pixel perturbations. Our findings reveal that the results are strongly affected by information leakage through the shape of the removed pixels as opposed to their actual values. Using our theoretical insights, we propose a novel evaluation framework termed Remove and Debias (ROAD) which offers two contributions: First, it mitigates the impact of the confounders, which entails higher consistency among evaluation strategies. Second, ROAD does not require the computationally expensive retraining step and saves up to 99% in computational costs compared to the state-of-the-art. We release our source code at https://github.com/tleemann/road_evaluation.
研究动机与目标
- 在存在不一致的扰动策略面前,动机是需要对局部特征归因方法进行可靠评估。
- 提供对像素扰动评估的形式信息理论分析,并通过掩码过程识别信息泄漏混淆变量。
- 提出 ROAD(Remove and Debias)以去偏评估并通过避免重新训练来减少计算。
- 引入 Noisy Linear Imputation(噪声线性插补)以最小化信息泄漏并提高跨方法的一致性。
提出的方法
- 对像素扰动评估策略进行信息理论分析。
- 使用互信息概念将评估结果分解为特征信息和掩码信息。
- 通过二值掩码识别类别信息泄漏并形式化缓解措施(Mitigator)。
- 提出通过 Noisy Linear Imputation 的最小揭示插补以降低泄漏。
- 证明 ROAD 相较于 ROAR 能实现高一致性与显著的计算节省。
实验结果
研究问题
- RQ1扰动基的归因评估策略如何因掩码与像素值导致信息泄漏而受影响?
- RQ2我们能否提出一个去偏评估框架以降低对超参数的敏感性并避免重新训练?
- RQ3Noisy Linear Imputation 是否能充分缓解掩码泄漏,从而在 MoRF 和 LeRF 序列之间产生一致的排名?
- RQ4相对于 ROAR,ROAD 的效率提升有多大?且无需重新训练是否在不牺牲排序质量的情况下可行?
主要发现
- 通过掩码移除信息泄漏可以在 MoRF 和 LeRF 顺序下获得更一致的归因方法排名。
- Noisy Linear Imputation 显著减少掩码信息泄漏,并使评估结果与最小揭示插补原则保持一致。
- ROAD 实现了跨序的一致性高水平(例如,在有重新训练的情况下 MoRF 对 LeRF 的 Spearman 相关提升至 0.61,无重新训练时为 0.58)。
- ROAD 相较于 ROAR 将计算成本降低最多 99%,使得无需重新训练的评估成为可能且结果变动不大。
- 在 CIFAR-10(和 Food-101)的经验结果表明,ROAD 的排序与重新训练基线高度吻合,同时需要数量级更少的计算。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。