QUICK REVIEW

[논문 리뷰] GLOD: Gaussian Likelihood Out of Distribution Detector.

Guy Amit, Moshe Levy|arXiv (Cornell University)|2020. 08. 16.

Adversarial Robustness in Machine Learning참고 문헌 14인용 수 2

한 줄 요약

GLOD는 사전 훈련된 딥 네ural 네트워크에 가우시안 우도층을 추가하여 이상치 입력(OOD)를 탐지하는 새로운 효율적인 방법이다. 이 방법은 OOD 샘플 탐지에 대한 로그우도비를 계산하기 위해 가우시안 우도층을 도입하며, 추가적인 런타임 오버헤드나 보조 OOD 훈련 데이터가 필요 없이 추론 시점에 정확한 OOD 탐지를 가능하게 한다. SVHN, CIFAR-10, CIFAR-100에서 뛰어난 성능을 달성한다.

ABSTRACT

Discriminative deep neural networks (DNNs) do well at classifying input associated with the classes they have been trained on. However, out-of-distribution (OOD) input poses a great challenge to such models and consequently represents a major risk when these models are used in safety-critical systems. In the last two years, extensive research has been performed in the domain of OOD detection. This research has relied mainly on training the model with OOD data or requiring additional computation for OOD detection. Such methods may not be applicable in many real world use cases. In this paper, we propose GLOD -- Gaussian likelihood out of distribution detector -- an extended DNN classifier capable of efficiently detecting OOD samples with no additional runtime overhead and without auxiliary training data. GLOD uses a layer that models the Gaussian density function of the trained classes. The layer outputs are used to estimate a Log-Likelihood Ratio which is employed to detect OOD samples. We evaluate GLOD's detection performance on SVHN, CIFAR-10 and CIFAR-100.

연구 동기 및 목표

안전이 중요한 딥 러닝 시스템에서 이상치 입력(OOD)을 탐지하는 데 있어 핵심 과제를 해결하기 위해.
추가 훈련 데이터나 런타임 계산이 필요 없는 OOD 탐지 방법을 개발하기 위해.
기존 DNN 추론 파이프라인 내에서 효율적이고 실시간 OOD 탐지를 가능하게 하기 위해.
기존 분류기 아키텍처를 재학습하거나 수정하지 않고도 높은 탐지 정확도를 유지하기 위해.

제안 방법

GLOD는 훈련된 클래스의 특징 밀도를 다변량 가우시안 분포로 모델링하는 가우시안 우도층을 도입한다.
이 층은 학습된 클래스 조건부 가우시안 분포 하에서 입력 특징의 로그우도를 계산한다.
최대 로그우도를 모든 클래스에 대해 계산한 로그우도비를 바탕으로 OOD 점수를 유도한다.
표준 순방향 전파 외에 추가적인 계산 비용 없이 추론 시점에서 작동한다.
주 네트워크의 재학습 없이 추론 중에 DNN 아키텍처에 가우시안 층을 삽입한다.
OOD 탐지 임계값은 내재된 데이터에 대한 로그우도비 분포를 기반으로 결정된다.

실험 결과

연구 질문

RQ1사전 훈련된 딥 네럴 네트워크에 가우시안 우도층을 추가하여 추가 훈련 데이터 없이 OOD 샘플을 탐지할 수 있는가?
RQ2제안된 방법이 런타임 추론 오버헤드가 0인 상태에서 높은 OOD 탐지 성능을 달성하는가?
RQ3가우시안 모델링에서 유도된 로그우도비는 표준 벤치마크에서 기존 OOD 탐지 기준과 비교해 어떻게 성능을 내는가?
RQ4이 방법은 SVHN, CIFAR-10, CIFAR-100와 같은 다양한 데이터셋 간에 일반화 가능한가?

주요 결과

GLOD는 OOD 훈련 데이터가 전혀 필요 없이 SVHN, CIFAR-10, CIFAR-100에서 최신 기술 수준의 OOD 탐지 성능을 달성한다.
추가적인 런타임 추론 비용이 없어 실시간 안전 중심 응용 분야에 적합하다.
가우시안 층에서 계산된 로그우도비는 내재된 입력과 이상치 샘플을 효과적으로 구분한다.
최소한의 아키텍처 수정으로도 다양한 벤치마크 데이터셋에서 높은 탐지 정확도를 유지한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.