[논문 리뷰] Anomaly Detection for Skin Disease Images Using Variational Autoencoder
논문은 피부 질환 이미지에 대한 비지도 이상감지를 위해 Variational Autoencoder (VAE)를 적용했으며, ISIC2018 Task 3에서 흑색종과 AKIEC에 대해 주목할 만한 AUC를 달성했다.
In this paper, we demonstrate the potential of applying Variational Autoencoder (VAE) [10] for anomaly detection in skin disease images. VAE is a class of deep generative models which is trained by maximizing the evidence lower bound of data distribution [10]. When trained on only normal data, the resulting model is able to perform efficient inference and to determine if a test image is normal or not. We perform experiments on ISIC2018 Challenge Disease Classification dataset (Task 3) and compare different methods to use VAE to detect anomaly. The model is able to detect all diseases with 0.779 AUCROC. If we focus on specific diseases, the model is able to detect melanoma with 0.864 AUCROC and detect actinic keratosis with 0.872 AUCROC, even if it only sees the images of nevus. To the best of our knowledge, this is the first applied work of deep generative models for anomaly detection in dermatology.
연구 동기 및 목표
- 깊은 생성모델, 특히 VAE를 피부과의 이상감지에 활용하는 가능성 시연.
- 정상 피부 이미지로 학습하여 라벨링된 이상 없이 이상 질환을 탐지.
- ISIC2018 Task 3 데이터셋에서 VAE 기반 이상점수 다수 평가.
제안 방법
- DCGAN에서 영감을 받은 CNN 기반 인코더/디코더 아키텍처를 갖춘 엔드투엔드 VAE 모델링.
- 재구성과 KL 항의 균형을 맞추는 작은 베타를 갖는 beta-VAE 목적에 해당하는 손실 최적화.
- VAE 기반 재구성 우도와 KL 발산을 이용한 이상점수 계산 및 IWAE 변형과의 비교.
- 피부과 데이터셋(ISIC2018 Task 3)에서 여러 이상점수 전략 평가.
- 128x128 이미지 전처리 및 ADAM 최적화; 잠재 차원 300.
실험 결과
연구 질문
- RQ1정상 피부 이미지만으로 학습된 VAE가 다양한 피부질환을 이상으로 탐지할 수 있는가?
- RQ2어떤 이상점수 전략(재구성, KL, 또는 IWAE 변형)이 정상 이미지와 이상 이미지 간의 차별화에 가장 효과적인가?
- RQ3nevus 이미지만으로 학습된 VAE 기반 이상감지가 흑색종 및 actinic keratosis에서 어떤 성능을 보이는가?
- RQ4이 태스크에 간단한 사전분포를 사용하는 VAE의 실제 한계는 무엇인가?
주요 결과
| AKIEC | BCC | BKL | DF | MEL | VASC | 모든 질환 |
|---|---|---|---|---|---|---|
| 0.872 | 0.803 | 0.792 | 0.682 | 0.862 | 0.662 | 0.779 |
| 0.871 | 0.802 | 0.793 | 0.678 | 0.864 | 0.657 | 0.777 |
| 0.441 | 0.454 | 0.472 | 0.398 | 0.690 | 0.487 | 0.491 |
| 0.406 | 0.431 | 0.441 | 0.383 | 0.677 | 0.477 | 0.469 |
| 0.864 | 0.795 | 0.783 | 0.671 | 0.861 | 0.651 | 0.771 |
| 0.864 | 0.795 | 0.784 | 0.670 | 0.861 | 0.648 | 0.771 |
- 최고의 종합 AUC는 재구성 기반 점수(s_vae^reconst)로 모든 질환에서 0.779, 개별적으로 평가 시 AKIEC 0.872, MEL 0.864까지 달성.
- IWAE 기반 점수는 이 설정에서 표준 VAE에 비해 미미한 개선을 제공하며 AUC의 차이가 작다.
- KL 기반 점수는 베타 가중치(beta = 0.01)에서 이상감지에 대한 구분력이 낮다.
- 모델은 nevus(정상) 이미지로만 학습했음에도 흑색종과 AKIEC를 높은 AUC로 탐지.
- 본 연구는 딥 생성모델을 피부과 이상감지에 비지도 방식으로 apply하는 가능성을 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.