QUICK REVIEW

[논문 리뷰] Principled Detection of Out-of-Distribution Examples in Neural Networks.

Shiyu Liang, Yixuan Li|arXiv (Cornell University)|2017. 06. 08.

Adversarial Robustness in Machine Learning인용 수 78

한 줄 요약

ODIN은 재학습이 필요 없이 신경망 내에서 분포 외 입력을 탐지하기 위한 원칙적이고 사후 처리 방법이다. 온도 조정과 입력 변형을 사용하여 소프트맥스 점수 분포를 분리함으로써 OOD 탐지 성능을 크게 향상시키며, DenseNet/CIFAR-10에서 95%의 진짜 양성률을 유지할 때 거짓 양성률을 34.7%에서 4.3%로 감소시킨다.

ABSTRACT

We consider the problem of detecting out-of-distribution examples in neural networks. We propose ODIN, a simple and effective out-of-distribution detector for neural networks, that does not require any change to a pre-trained model. Our method is based on the observation that using temperature scaling and adding small perturbations to the input can separate the softmax score distributions of in- and out-of-distribution samples, allowing for more effective detection. We show in a series of experiments that our approach is compatible with diverse network architectures and datasets. It consistently outperforms the baseline approach[1] by a large margin, establishing a new state-of-the-art performance on this task. For example, ODIN reduces the false positive rate from the baseline 34.7% to 4.3% on the DenseNet (applied to CIFAR-10) when the true positive rate is 95%. We theoretically analyze the method and prove that performance improvement is guaranteed under mild conditions on the image distributions.

연구 동기 및 목표

재학습 없이 신경망 내에서 분포 외 입력을 신뢰성 있게 사후 처리 방법으로 탐지하는 것.
내분포 및 외분포 소프트맥스 점수 분포 간의 분리도 향상시키는 것.
다양한 아키텍처와 데이터셋 간의 호환성 확보.
약간의 분포 가정 하에 성능 향상의 이론적 근거 제공.

제안 방법

최종 소프트맥스 레이어에 온도 조정을 적용하여 신뢰도 점수를 날카롭게 또는 둥그스름하게 조정한다.
시험 입력에 대해 작은, 입력에 특화된 변형을 추가하여 소프트맥스 출력의 차이를 증폭시킨다.
변형은 입력에 대한 손실의 미분값을 작은 에프실론으로 스케일링하여 계산된다.
모델 학습 후 적용되며, 재학습이나 아키텍처 변경이 필요하지 않다.
분포 외 샘플이 내분포 샘플보다 변형에 더 민감하다는 사실을 활용한다.
변형 후의 소프트맥스 점수를 사용하여 입력을 내분포 또는 외분포로 분류한다.

실험 결과

연구 질문

RQ1재학습 없이 온도 조정과 입력 변형이 OOD 탐지 성능을 향상시킬 수 있는가?
RQ2이 방법은 다양한 신경망 아키텍처와 데이터셋에 일반화되는가?
RQ3관찰된 성능 향상의 이론적 근거는 무엇인가?
RQ4거짓 양성률과 진짜 양성률 측면에서 기존 기준 대비 성능은 어떻게 비교되는가?

주요 결과

DenseNet이 CIFAR-10에 대해 학습된 경우, 진짜 양성률이 95%일 때 ODIN은 거짓 양성률을 34.7%에서 4.3%로 감소시킨다.
이 방법은 다양한 네트워크 아키텍처와 데이터셋에서 기준 방법을 일관되게 뛰어넘는다.
입력 분포에 대한 약간의 조건 하에 성능 향상은 이론적으로 보장된다.
온도 조정과 입력 변형은 내분포 및 외분포 샘플의 소프트맥스 점수 분포를 효과적으로 분리한다.
이 방법은 사전 학습된 신경망과 어떤 경우에도 호환되며, 아키텍처나 학습 변경이 필요하지 않다.
이 방법은 신경망 내 OOD 탐지 분야에서 새로운 최고 기록을 수립한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.