Skip to main content
QUICK REVIEW

[논문 리뷰] Principled Detection of Out-of-Distribution Examples in Neural Networks.

Shiyu Liang, Yixuan Li|arXiv (Cornell University)|2017. 06. 08.
Adversarial Robustness in Machine Learning인용 수 78
한 줄 요약

ODIN은 재학습이 필요 없이 신경망 내에서 분포 외 입력을 탐지하기 위한 원칙적이고 사후 처리 방법이다. 온도 조정과 입력 변형을 사용하여 소프트맥스 점수 분포를 분리함으로써 OOD 탐지 성능을 크게 향상시키며, DenseNet/CIFAR-10에서 95%의 진짜 양성률을 유지할 때 거짓 양성률을 34.7%에서 4.3%로 감소시킨다.

ABSTRACT

We consider the problem of detecting out-of-distribution examples in neural networks. We propose ODIN, a simple and effective out-of-distribution detector for neural networks, that does not require any change to a pre-trained model. Our method is based on the observation that using temperature scaling and adding small perturbations to the input can separate the softmax score distributions of in- and out-of-distribution samples, allowing for more effective detection. We show in a series of experiments that our approach is compatible with diverse network architectures and datasets. It consistently outperforms the baseline approach[1] by a large margin, establishing a new state-of-the-art performance on this task. For example, ODIN reduces the false positive rate from the baseline 34.7% to 4.3% on the DenseNet (applied to CIFAR-10) when the true positive rate is 95%. We theoretically analyze the method and prove that performance improvement is guaranteed under mild conditions on the image distributions.

연구 동기 및 목표

  • 재학습 없이 신경망 내에서 분포 외 입력을 신뢰성 있게 사후 처리 방법으로 탐지하는 것.
  • 내분포 및 외분포 소프트맥스 점수 분포 간의 분리도 향상시키는 것.
  • 다양한 아키텍처와 데이터셋 간의 호환성 확보.
  • 약간의 분포 가정 하에 성능 향상의 이론적 근거 제공.

제안 방법

  • 최종 소프트맥스 레이어에 온도 조정을 적용하여 신뢰도 점수를 날카롭게 또는 둥그스름하게 조정한다.
  • 시험 입력에 대해 작은, 입력에 특화된 변형을 추가하여 소프트맥스 출력의 차이를 증폭시킨다.
  • 변형은 입력에 대한 손실의 미분값을 작은 에프실론으로 스케일링하여 계산된다.
  • 모델 학습 후 적용되며, 재학습이나 아키텍처 변경이 필요하지 않다.
  • 분포 외 샘플이 내분포 샘플보다 변형에 더 민감하다는 사실을 활용한다.
  • 변형 후의 소프트맥스 점수를 사용하여 입력을 내분포 또는 외분포로 분류한다.

실험 결과

연구 질문

  • RQ1재학습 없이 온도 조정과 입력 변형이 OOD 탐지 성능을 향상시킬 수 있는가?
  • RQ2이 방법은 다양한 신경망 아키텍처와 데이터셋에 일반화되는가?
  • RQ3관찰된 성능 향상의 이론적 근거는 무엇인가?
  • RQ4거짓 양성률과 진짜 양성률 측면에서 기존 기준 대비 성능은 어떻게 비교되는가?

주요 결과

  • DenseNet이 CIFAR-10에 대해 학습된 경우, 진짜 양성률이 95%일 때 ODIN은 거짓 양성률을 34.7%에서 4.3%로 감소시킨다.
  • 이 방법은 다양한 네트워크 아키텍처와 데이터셋에서 기준 방법을 일관되게 뛰어넘는다.
  • 입력 분포에 대한 약간의 조건 하에 성능 향상은 이론적으로 보장된다.
  • 온도 조정과 입력 변형은 내분포 및 외분포 샘플의 소프트맥스 점수 분포를 효과적으로 분리한다.
  • 이 방법은 사전 학습된 신경망과 어떤 경우에도 호환되며, 아키텍처나 학습 변경이 필요하지 않다.
  • 이 방법은 신경망 내 OOD 탐지 분야에서 새로운 최고 기록을 수립한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.