QUICK REVIEW

[논문 리뷰] Multiscale Score Matching for Out-of-Distribution Detection

Ahsan Mahmood, Junier B. Oliva|arXiv (Cornell University)|2021. 05. 03.

Cell Image Analysis Techniques참고 문헌 27인용 수 1

한 줄 요약

이 논문은 다중 척도 스코어 매칭을 사용하는 새로운 비지도 OOD(외부 분포) 탐지 방법을 제안한다: 깊은 신경망을 여러 노이즈 수준에서 스코어를 추정하도록 훈련시키고, 입력 차원을 따라 이들의 L2-노름을 계산하며, 결과적으로 얻어진 L차원 공간에서 내부 분포 영역을 학습하기 위해 보조 모델(예: GMM)을 사용한다. 이 방법은 특히 어려운 CIFAR-10 대 SVHN OOD 탐지 설정에서 최신 기술을 크게 앞서며 성능을 발휘한다.

ABSTRACT

We present a new methodology for detecting out-of-distribution (OOD) images by utilizing norms of the score estimates at multiple noise scales. A score is defined to be the gradient of the log density with respect to the input data. Our methodology is completely unsupervised and follows a straight forward training scheme. First, we train a deep network to estimate scores for L levels of noise. Once trained, we calculate the noisy score estimates for N in-distribution samples and take the L2-norms across the input dimensions (resulting in an NxL matrix). Then we train an auxiliary model (such as a Gaussian Mixture Model) to learn the in-distribution spatial regions in this L-dimensional space. This auxiliary model can now be used to identify points that reside outside the learned space. Despite its simplicity, our experiments show that this methodology significantly outperforms the state-of-the-art in detecting out-of-distribution images. For example, our method can effectively separate CIFAR-10 (inlier) and SVHN (OOD) images, a setting which has been previously shown to be difficult for deep likelihood models.

연구 동기 및 목표

가능한 한 확률 밀도 기반 모델이 실패하는 환경에서 딥 생성 모델 내에서 외부 분포 이미지를 탐지하는 문제를 해결한다.
표준 분포 이외의 내부 분포 훈련 데이터를 요구하지 않는 방법을 개발하여 완전히 비지도 OOD 탐지가 가능하도록 한다.
CIFAR-10과 SVHN을 구분하는 것과 같이 기존 방법으로는 어려움을 겪는 어려운 벤치마크 설정에서 OOD 탐지 성능을 향상시킨다.
다양한 노이즈 척도에서 스코어 추정의 기하학적 구조를 활용하여 잠재 공간 내에서 내부 분포 데이터 영역을 더 잘 특징화한다.

제안 방법

각 척도에 대해 스코어 매칭 손실을 사용하여, L개의 다른 노이즈 수준에서 스코어(로그 밀도의 기울기)를 추정하는 딥 네트워크를 훈련시킨다.
각 내부 분포 입력에 대해, L개의 노이즈 수준 각각에서 입력 차원을 따라 스코어 추정의 L2-노름을 계산하여, 각 샘플당 L차원 임베딩을 형성한다.
이 L2-노름 임베딩의 분포를 내부 분포 데이터로부터 학습하기 위해 보조 모델(예: 혼합 정규분포 모델(GMM))을 사용한다.
샘플의 L2-노름 임베딩이 L차원 공간 내에서 학습된 내부 분포 영역을 벗어나면, 이를 OOD로 분류한다.
이 방법은 완전히 비지도이며, 훈련 중에 OOD 데이터가 필요로 하지 않으며, 새로운 내부 분포 분포에 대해 재훈련이 필요로 하지 않는다.
다중 척도 스코어 추정은 계층적인 데이터 구조를 포착하여 내부 및 외부 분포 샘플 간의 구분 능력을 향상시킨다.

실험 결과

연구 질문

RQ1단일 척도 기반 모델 대비 다중 척도 스코어 추정이 외부 분포 이미지 탐지에 개선을 이끌 수 있는가?
RQ2CIFAR-10과 SVHN처럼 유사하지만 다른 분포를 구분하는 데에 제안된 방법이 얼마나 효과적인가?
RQ3다양한 노이즈 수준에서 스코어 추정의 L2-노름은 원본 스코어 값에 비해 내부 분포 모델링에 더 강건한 표현을 제공하는가?
RQ4간단한 보조 모델, 예를 들어 GMM이 다중 척도 스코어 노름 공간 내에서 내부 분포 다양체를 효과적으로 포괄할 수 있는가?
RQ5재훈련이나 OOD 데이터가 필요 없이 다양한 내부 분포 데이터셋에 대해 얼마나 잘 일반화되는가?

주요 결과

제안된 방법은 OOD 탐지에서 최신 기술 수준의 성능을 달성하였으며, 특히 도전적인 CIFAR-10 대 SVHN 벤치마크에서 뛰어난 성능을 발휘한다.
기존의 확률 밀도 기반 모델은 CIFAR-10(내부 분포)과 SVHN(OOD) 이미지를 분리하는 데 어려움을 겪지만, 이 방법은 이를 크게 뛰어넘는 성능을 보인다.
다중 척도 스코어 노름의 사용은 노이즈 수준 간 계층적 데이터 구조를 포착함으로써 더 나은 분류 성능을 가능하게 한다.
보조 모델이 단순한 경우, 예를 들어 GMM일지라도 효과적으로 내부 분포 다양체를 포괄할 수 있음을 확인하여, 학습된 표현의 강건성을 입증한다.
이 방법은 완전히 비지도이며, 훈련 중에 OOD 데이터에 접근할 필요가 없어 실세계 적용에 실용적이다.
다양한 노이즈 척도에서 스코어 추정의 L2-노름은 OOD 탐지에 대해 압축적이고 구분력 있는 특징 공간을 형성한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.