QUICK REVIEW

[论文解读] Multiscale Score Matching for Out-of-Distribution Detection

Ahsan Mahmood, Junier B. Oliva|arXiv (Cornell University)|May 3, 2021

Cell Image Analysis Techniques参考文献 27被引用 1

一句话总结

本文提出了一种新颖的无监督分布外（OOD）检测方法，采用多尺度得分匹配：训练深度网络以在多个噪声水平下估计得分，计算这些得分在输入维度上的L2-范数，并使用辅助模型（例如高斯混合模型，GMM）学习所得L维空间中的分布内区域。该方法在性能上显著优于当前最先进方法，尤其在CIFAR-10与SVHN的OOD检测设定下表现突出。

ABSTRACT

We present a new methodology for detecting out-of-distribution (OOD) images by utilizing norms of the score estimates at multiple noise scales. A score is defined to be the gradient of the log density with respect to the input data. Our methodology is completely unsupervised and follows a straight forward training scheme. First, we train a deep network to estimate scores for L levels of noise. Once trained, we calculate the noisy score estimates for N in-distribution samples and take the L2-norms across the input dimensions (resulting in an NxL matrix). Then we train an auxiliary model (such as a Gaussian Mixture Model) to learn the in-distribution spatial regions in this L-dimensional space. This auxiliary model can now be used to identify points that reside outside the learned space. Despite its simplicity, our experiments show that this methodology significantly outperforms the state-of-the-art in detecting out-of-distribution images. For example, our method can effectively separate CIFAR-10 (inlier) and SVHN (OOD) images, a setting which has been previously shown to be difficult for deep likelihood models.

研究动机与目标

解决深度生成模型中检测分布外（OOD）图像的挑战，特别是在基于似然的模型失效的设定下。
开发一种不依赖于标准分布之外的分布内训练数据的方法，实现完全无监督的OOD检测。
在如区分CIFAR-10与SVHN等困难基准设定下，提升OOD检测性能，此类设定对现有方法而言极具挑战。
利用多尺度下得分估计的几何结构，更好地表征潜在空间中的分布内数据区域。

提出的方法

使用每个尺度的得分匹配损失，训练深度神经网络以在L个不同噪声水平下估计得分（对数密度的梯度）。
对于每个分布内输入，计算在L个噪声水平下，各输入维度上得分估计的L2-范数，形成每个样本的L维嵌入。
使用辅助模型（如高斯混合模型，GMM）从分布内数据中学习这些L2-范数嵌入的分布。
若样本的L2-范数嵌入在L维空间中位于学习到的分布内区域之外，则将其分类为OOD。
该方法完全无监督，训练过程中无需OOD数据，且无需为新分布重新训练。
多尺度得分估计可捕捉数据的分层结构，从而提升对分布内与分布外样本的判别能力。

实验结果

研究问题

RQ1与单尺度基线相比，多尺度得分估计是否能提升对分布外图像的检测性能？
RQ2在区分相似但不同的分布（如CIFAR-10与SVHN）时，所提方法的有效性如何？
RQ3在多个噪声水平下使用得分估计的L2-范数，是否能提供比原始得分值更鲁棒的分布内建模表示？
RQ4简单的辅助模型（如GMM）是否能有效捕捉多尺度得分范数空间中的分布内流形？
RQ5该方法在不需重新训练或访问OOD数据的前提下，对不同分布内数据集的泛化能力如何？

主要发现

所提方法在OOD检测任务中达到最先进性能，尤其在具有挑战性的CIFAR-10与SVHN基准测试中表现卓越。
显著优于现有基于似然的模型，后者在分离CIFAR-10（分布内）与SVHN（分布外）图像方面表现不佳。
多尺度得分范数的使用通过捕捉多噪声水平下的分层数据结构，实现了更优的判别能力。
即使辅助模型简单（如高斯混合模型），方法仍保持有效，表明所学表示具有鲁棒性。
该方法完全无监督，训练过程中无需访问OOD数据，适用于实际部署。
在多个噪声尺度下得分估计的L2-范数构成了一种紧凑且具有判别力的特征空间，适用于OOD检测。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。