QUICK REVIEW

[论文解读] A Simple Fix to Mahalanobis Distance for Improving Near-OOD Detection

Jie Ren, Stanislav Fort|arXiv (Cornell University)|Jun 16, 2021

Adversarial Robustness in Machine Learning参考文献 21被引用 71

一句话总结

本文分析 Mahalanobis 距离在 near-OOD 检测中的失败，并引入 Relative Mahalanobis Distance (RMD)，一种简单的背景调整修正，在无需额外训练的情况下提升在多种基准上的 near-OOD AUROC。

ABSTRACT

Mahalanobis distance (MD) is a simple and popular post-processing method for detecting out-of-distribution (OOD) inputs in neural networks. We analyze its failure modes for near-OOD detection and propose a simple fix called relative Mahalanobis distance (RMD) which improves performance and is more robust to hyperparameter choice. On a wide selection of challenging vision, language, and biology OOD benchmarks (CIFAR-100 vs CIFAR-10, CLINC OOD intent detection, Genomics OOD), we show that RMD meaningfully improves upon MD performance (by up to 15% AUROC on genomics OOD).

研究动机与目标

在不重新训练或不需要 OOD 数据的前提下，激发鲁棒的 near-OOD 检测。
识别标准 Mahalanobis 距离 (MD) 在 near-OOD 场景中的失效模式。
提出一个简单、无超参数的修正（RMD），提升 IND 与 near-OOD 数据的判别能力。
展示 RMD 在视觉、语言和基因组基准上的鲁棒性与性能。

提出的方法

评估 MD 在 OOD 检测中的表现，利用中间网络特征的类条件高斯拟合。
在所有训练特征上定义一个背景（与类无关）高斯拟合。
对每个类别 k 计算 MD_k(z') = (z' - mu_k)^T Sigma^{-1} (z' - mu_k)。
利用背景模型 N(mu_0, Sigma_0) 计算 MD_0(z')。
定义 Relative Mahalanobis Distance: RMD_k(z') = MD_k(z') - MD_0(z')。
将 C_RMD(x') = -min_k { RMD_k(z') } 作为 OOD 检测的置信分数；等价于似然比视角 max_k log p_k(z') - log p_0(z')。
表明 RMD 能减少来自非判别性背景特征的贡献，强调判别性最高维。

实验结果

研究问题

RQ1MD 基于的 OOD 检测是否可能因高维度的非判别特征而在 near-OOD 情况下不可靠？
RQ2在不额外训练或 OOD 数据的前提下，背景调整分数（RMD）是否能改善 on 分布数据与 near-OOD 数据之间的分离？
RQ3RMD 对超参数选择是否鲁棒，在多模态与预训练方案中是否有效？
RQ4在视觉、语言和基因组 near-OOD 基准上，RMD 与 MD 和 MSP 的比较如何？

主要发现

RMD 在多项基准上持续提升 near-OOD AUROC，相较于 MD 不需要重新训练或 OOD 数据。
在 CIFAR-100 对 CIFAR-10 的场景中，MD AUROC 为 74.91%，而 RMD 为 81.01%（MSP 80.14%）。
在 CIFAR-10 对 CIFAR-100 的场景中，MD AUROC 为 88.49%，而 RMD 为 89.71%（MSP 89.27%）。
基因组 OOD 在使用预训练模型时，RMD 显著优于 MD（例如 MD 48.46% vs RMD 60.36% 结合 BERT 预训练；CLINC OOD：MD 75.48% vs RMD 91.98% 结合 BERT 预训练）。
在不微调的预训练骨干网络下，RMD 在 ViT、BiT、CLIP 与基于 BERT 的设置中均优于 MD；例如在 BiT 的 CIFAR-100 对 CIFAR-10 场景中：MD 81.37% vs RMD 84.60%。
经微调后，MD 的性能通常会提高，有时会缩小与 RMD 的差距（例如 ViT-B16 的 CIFAR 任务：MD 94.42% vs RMD 93.09%；CIFAR-10 对 CIFAR-100：MD 99.87% vs RMD 98.82%）。
RMD 在训练过程中的稳定性高于 MD，在基因组 BERT 微调情境下 MD 可能下降；RMD 依然鲁棒而 MD 可能下滑。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。