Skip to main content
QUICK REVIEW

[论文解读] Towards Maximizing the Representation Gap between In-Domain & Out-of-Distribution Examples

Jay Nandy, Wynne Hsu|arXiv (Cornell University)|Oct 20, 2020
Domain Adaptation and Few-Shot Learning参考文献 36被引用 20
一句话总结

本文提出了一种用于狄利克雷先验网络(Dirichlet Prior Networks, DPN)的新损失函数,通过显式正则化狄利克雷分布的精度,最大化域内(in-domain)与分布外(OOD)样本之间的表征差距。通过解耦均值与精度的优化,该方法提升了OOD检测性能,在多个基准测试中达到最先进水平,包括在CIFAR-10和STL-10上实现接近完美的AUROC分数。

ABSTRACT

Among existing uncertainty estimation approaches, Dirichlet Prior Network (DPN) distinctly models different predictive uncertainty types. However, for in-domain examples with high data uncertainties among multiple classes, even a DPN model often produces indistinguishable representations from the out-of-distribution (OOD) examples, compromising their OOD detection performance. We address this shortcoming by proposing a novel loss function for DPN to maximize the extit{representation gap} between in-domain and OOD examples. Experimental results demonstrate that our proposed approach consistently improves OOD detection performance.

研究动机与目标

  • 解决现有DPN模型中高数据不确定性导致狄利克雷分布平坦、难以与OOD样本区分的问题。
  • 通过显式最大化域内与OOD样本之间的表征差距,提升OOD检测性能。
  • 设计一种损失函数,分别建模狄利克雷输出的均值与精度,以实现更好的不确定性解耦。
  • 在域内样本具有高数据不确定性的情况下,仍能实现稳健的OOD检测性能。

提出的方法

  • 提出一种新损失函数,将交叉熵损失与新型显式精度正则化项解耦,以独立优化狄利克雷分布的均值与精度。
  • 引入一种精度正则化项,促使OOD样本呈现尖锐、多峰的狄利克雷分布,从而增强其与域内样本的表征差距。
  • 修改标准DPN损失,避免在高不确定性域内样本中,将目标精度值分配给重叠类别。
  • 采用两阶段优化:第一阶段使用标准交叉熵损失进行均值预测;第二阶段使用精度正则化项,强制OOD预测结果具备稀疏性与尖锐性。
  • 采用动态调整的目标精度值,以促进OOD样本的平坦性与域内样本的尖锐性。
  • 通过同时使用域内与OOD样本进行训练,显式学习表征空间中的差异。

实验结果

研究问题

  • RQ1修改后的DPN损失函数能否有效增大域内与OOD样本之间的表征差距?
  • RQ2在高数据不确定性下,将DPN中的均值与精度优化分离是否能提升OOD检测性能?
  • RQ3显式精度正则化能否防止高不确定性域内样本被误分类为OOD?
  • RQ4所提方法在多样化数据集上与现有OOD检测基线相比表现如何?
  • RQ5该方法在不同数据分布与OOD偏移类型下是否保持高性能?

主要发现

  • 在CIFAR-10上,所提DPN+达到99.2% AUROC,显著优于DPNrev(85.4% AUROC)和DPN−(99.7% AUROC但精度仅3.5%)。
  • 在CIFAR-100上,DPN+达到99.0% AUPR与99.5% AUROC,优于DPNrev(85.0% AUROC)和DPN−(99.0% AUROC但精度为7.5%)。
  • 在STL-10上,DPN+达到100.0% AUROC与100.0% AUPR,优于DPNrev(99.5% AUROC)和DPN−(100.0% AUROC但精度仅0.2%)。
  • 在Places365上,DPN+达到100.0% AUROC与100.0% AUPR,显著优于DPNrev(99.1% AUROC)和DPN−(99.9% AUROC但精度为0.8%)。
  • 在Textures上,DPN+达到98.4% AUROC与97.9% AUPR,优于DPNrev(92.6% AUROC)和DPN−(98.7% AUROC但精度为19.3%)。
  • 该方法在所有数据集上均实现近乎完美的OOD检测性能,DPN+相比DPN−展现出更优的泛化能力与鲁棒性,后者因精度过低且OOD区分能力差而表现不佳。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。