Skip to main content
QUICK REVIEW

[论文解读] On the Benefits of Attributional Robustness.

Mayank Singh, Nupur Kumari|arXiv (Cornell University)|Nov 29, 2019
Bayesian Modeling and Causal Inference被引用 7
一句话总结

本文提出了一种新颖的训练方法,通过使用软边缘三元组损失将输入图像与其显著性图对齐,以提升机器学习模型的归因鲁棒性。该方法在SVHN、CIFAR10和GTSRB上将归因鲁棒性提升了6–18%,并实现了弱监督目标定位任务在CUB-200上的新SOTA性能。

ABSTRACT

Interpretability is an emerging area of research in trustworthy machine learning. Safe deployment of machine
 learning system mandates that the prediction and its explanation be reliable and robust. Recently, it was shown that one could craft perturbations that produce perceptually indistinguishable inputs having the same prediction, yet very different interpretations. We tackle the problem of attributional robustness (i.e. models having robust explanations) by maximizing the alignment between the input image and its saliency map using soft-margin triplet loss. We propose a robust attribution training methodology that beats the stateof-the-art attributional robustness measure by a margin of≈ 6-18 % on several standard datasets, ie. SVHN, CIFAR10 and GTSRB. We further show the utility of the proposed robust model in the domain of weakly supervised object localization and segmentation. Our proposed robust model also achieves a new state-of-the-art object localization accuracy on the CUB-200 dataset.

研究动机与目标

  • 解决在小幅度输入扰动下模型解释(归因)缺乏鲁棒性的问题。
  • 确保即使在对抗性或难以察觉的扰动下,显著性图仍能与输入图像保持一致且对齐。
  • 提升解释的可靠性,以支持可信的机器学习部署。
  • 利用鲁棒的解释提升弱监督目标定位与分割任务的性能。
  • 在归因鲁棒性与目标定位准确率方面建立新的SOTA标准。

提出的方法

  • 使用软边缘三元组损失,以最大化输入图像与其对应显著性图之间的对齐程度。
  • 训练模型在输入发生微小但感知上无法区分的扰动时,仍能生成一致的显著性图。
  • 将三元组损失应用于对比三元组:锚点(原始图像)、正样本(预测结果相同的扰动图像)和负样本(预测结果不同的图像)。
  • 端到端优化模型,以在训练过程中提升归因鲁棒性。
  • 利用学习到的鲁棒显著性图服务于下游任务,如弱监督目标定位。
  • 引入一种训练目标,优先确保在分布偏移下解释的忠实性与稳定性。

实验结果

研究问题

  • RQ1我们能否在小幅度、难以察觉的输入扰动下提升模型解释的鲁棒性?
  • RQ2输入图像与显著性图之间的对齐程度如何影响归因鲁棒性?
  • RQ3鲁棒归因能否提升弱监督目标定位任务的性能?
  • RQ4所提方法是否在标准基准上优于现有的归因鲁棒性基线?
  • RQ5鲁棒解释能否在CUB-200上实现目标定位的SOTA性能?

主要发现

  • 所提方法在SVHN、CIFAR10和GTSRB上相较于SOTA基线,将归因鲁棒性提升了6–18%。
  • 该模型在CUB-200数据集的弱监督目标定位任务中达到了新的SOTA准确率。
  • 即使在对抗性扰动下,鲁棒显著性图仍能与输入图像保持一致对齐。
  • 该方法在不损害预测准确率的前提下提升了解释的保真度。
  • 该方法在多种视觉数据集和任务上均表现出良好的泛化能力。
  • 软边缘三元组损失能有效实现归因鲁棒性,且无需额外推理阶段处理。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。