QUICK REVIEW

[논문 리뷰] Confidence estimation in Deep Neural networks via density modelling

Akshayvarun Subramanya, Suraj Srinivas|arXiv (Cornell University)|2017. 07. 21.

Adversarial Robustness in Machine Learning참고 문헌 14인용 수 33

한 줄 요약

이 논문은 딥 네ural 네트워크를 위한 밀도 모델링 기반 신뢰도 추정 방법을 제안하며, 기존의 소프트맥스보다 우수한 성능을 보인다. 특히 노이즈, 블러, JPEG 압축, 적대적 편향 등의 영향을 받는 이미지에서 소프트맥스가 실패하는 바에 비해, 단조 감소하는 신뢰도 점수를 생성한다. 이 방법은 대각 행렬을 가진 가우시안 모델을 사용하여 예측 불확실성을 추정하며, 왜곡에 대한 강건성을 입증한다.

ABSTRACT

State-of-the-art Deep Neural Networks can be easily fooled into providing incorrect high-confidence predictions for images with small amounts of adversarial noise. Does this expose a flaw with deep neural networks, or do we simply need a better way to estimate confidence? In this paper we consider the problem of accurately estimating predictive confidence. We formulate this problem as that of density modelling, and show how traditional methods such as softmax produce poor estimates. To address this issue, we propose a novel confidence measure based on density modelling approaches. We test these measures on images distorted by blur, JPEG compression, random noise and adversarial noise. Experiments show that our confidence measure consistently shows reduced confidence scores in the presence of such distortions - a property which softmax often lacks.

연구 동기 및 목표

이미지 왜곡이나 적대적 노이즈가 존재할 때조차 과신하는 예측을 하는 딥 네트워크의 심각한 결함을 해결한다.
소프트맥스를 넘어서 밀도 모델링 접근법을 통해 신뢰도 추정을 향상시킬 수 있는지 조사한다.
이미지 품질이 악화됨에 따라 단조 감소하는 신뢰도 점수를 생성하는 방법을 개발한다.
다양한 왜곡과 적대적 예제에서 제안된 방법의 강건성을 소프트맥스와 비교하여 평가한다.
밀도 기반의 신뢰도 추정이 소프트맥스보다 실제 모델 정확도와 더 잘 상관관계를 가지는 경험적 증거를 제시한다.

제안 방법

신뢰도 추정을 밀도 모델링 문제로 재정의하여, 소프트맥스 대신 확률 모델을 사용해 예측 분포 P(y|X)를 추정한다.
예측 전의 활성화 값 z를 대각 행렬 공분산을 가진 다변량 가우시안 분포로 모델링하여, 이 분포 하에서의 가능도를 통해 불확실성을 추정한다.
실제 클래스에 대한 가능도를 정규화하여 신뢰도를 계산한다.
적합된 가우시안 모델 하에서 진짜 클래스 레이블의 로그 가능도를 사용해 신뢰도를 표현하며, 입력 편향에 민감하도록 보장한다.
표준 교차 엔트로피 손실을 사용해 모델을 엔드 투 엔드로 훈련한 후, 추론 시에 밀도 모델을 적용해 신뢰도를 추정한다.
청결한 이미지가 기준 신뢰도 값(예: 1.0)을 가지도록 신뢰도 점수를 스케일링하여 시각화 및 비교를 가능하게 한다.

실험 결과

연구 질문

RQ1이미지 왜곡 상황에서 밀도 모델링이 소프트맥스보다 더 신뢰할 수 있는 신뢰도 추정을 가능하게 하는가?
RQ2노이즈, 블러, 압축으로 인한 이미지 품질 악화에 따라 제안된 방법이 단조 감소하는 신뢰도 프로파일을 보이는가?
RQ3제안된 신뢰도 측정법이 적대적 예제를 탐지하는 데 소프트맥스와 비교해 어떻게 성능을 내는가?
RQ4왜 소프트맥스는 편향이 있을 때도 신뢰도를 낮추지 못하는가? 이는 활성화 값의 척도 민감성 때문인가?
RQ5고차원 입력 공간에서 밀도 모델의 선택(예: 대각 가우시안)이 성능에 어느 정도 영향을 미치는가?

주요 결과

제안된 밀도 기반의 신뢰도 측정법은 점점 증가하는 가우시안 노이즈와 블러 상황에서 단조 감소하는 프로파일을 보이며, 소프트맥스는 고도의 왜곡 상황에서도 신뢰도를 낮추지 못한다.
MNIST 데이터셋에서 제안된 방법은 노이즈가 증가함에 따라 지속적으로 신뢰도를 낮추지만, 소프트맥스는 높고 불안정한 상태를 유지한다.
ImageNet에서는 가우시안 블러(σ = 0에서 36까지) 상황에서 신뢰도가 감소하는 것을 탐지하지만, MNIST에 비해 성능이 덜 일관되며 고차원 밀도 추정의 과제를 암시한다.
JPEG 압축 상황에서는 소프트맥스와 제안된 방법 모두 품질 요소가 낮아질수록 신뢰도가 감소하지만, 제안된 방법이 더 신뢰할 수 있는 프로파일을 유지한다.
ImageNet 검증 세트의 적대적 예제에서 제안된 방법은 5,795개의 경우 중 단 2,214건에서만 신뢰도를 제대로 낮추지 못했고, 소프트맥스는 5,795건 전부에서 실패했다. 이는 명백한 향상이다.
제안된 방법의 신뢰도 점수(정규화되지 않은)는 청결한 이미지에서 왜곡된 이미지로 갈수록 일관되게 감소하지만, 소프트맥스 점수는 대부분 변화가 없거나 특히 적대적 경우에 증가하는 경향이 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.