Skip to main content
QUICK REVIEW

[논문 리뷰] Skin cancer detection based on deep learning and entropy to detect outlier samples

André G. C. Pacheco, Abder-Rahman Ali|arXiv (Cornell University)|2019. 09. 10.
Anomaly Detection Techniques and Applications참고 문헌 20인용 수 50
한 줄 요약

본 논문은 13개의 CNN으로 구성된 앙상블을 구축하여 여덟 가지 피부 병변 유형을 분류하고 이상치 UNK 클래스를 검출한다; 또한 엔트로피 기반의 이상치 탐지와 메타데이터를 활용해 성능을 향상시키며, 균형 정확도와 높은 AUC에서 경쟁력을 달성한다.

ABSTRACT

We describe our methods that achieved the 3rd and 4th places in tasks 1 and 2, respectively, at ISIC challenge 2019. The goal of this challenge is to provide the diagnostic for skin cancer using images and meta-data. There are nine classes in the dataset, nonetheless, one of them is an outlier and is not present on it. To tackle the challenge, we apply an ensemble of classifiers, which has 13 convolutional neural networks (CNN), we develop two approaches to handle the outlier class and we propose a straightforward method to use the meta-data along with the images. Throughout this report, we detail each methodology and parameters to make it easy to replicate our work. The results obtained are in accordance with the previous challenges and the approaches to detect the outlier class and to address the meta-data seem to be work properly.

연구 동기 및 목표

  • ISIC 2019 데이터를 사용한 피부암 진단의 자동화를 목표로 한다.
  • 여덟 개의 알려진 병변 클래스를 분류하기 위한 CNN 모델들의 앙상블을 개발한다.
  • UNK(outlier) 클래스를 탐지하는 방법을 제안하고 여러 접근법을 비교한다.
  • 가능한 경우 연령, 성별, 지역 등의 메타데이터를 도입하여 분류 성능을 향상시킨다.

제안 방법

  • ImageNet에서 사전학습된 13개 CNN 아키텍처(SENet, PNASNet, InceptionV4, ResNet-50/101/152, DenseNet-121/169/201, MobileNetV2, GoogleNet, VGG-16/19)를 학습하고 Adam으로 150에포크 미세조정한다.
  • 데이터셋 불균형을 해결하기 위해 클래스 가중치가 적용된 교차 엔트로피를 사용하되, 업샘플링도 검토하지만 가중 손실을 선호한다.
  • 앙상블 두 가지를 평가: Ensemble 1(모든 13개 모델)과 Ensemble 2(균형 정확도 기준 상위 3개 모형); 확률의 평균으로 예측을 결합한다.
  • 두 가지 이상치 탐지 접근법을 개발: (i) 피부 이미지 구분을 위한 계층적 분류기(기준선) 및 (ii) 각 클래스 엔트로피 임계값과 히트/미스 분포와의 코사인 유사도를 이용한 엔트로피 기반 선택.
  • 작업 2에서 연령, 성별, 지역에 조건화된 히스토그램 기반 확률을 통해 메타데이터를 CNN 출력에 보강하고, 상위 예측을 조정한다.

실험 결과

연구 질문

  • RQ1최첨단 CNN들의 앙상블이 ISIC 2019에서 여덟 개의 클래스 피부 병변 분류에서 경쟁력 있는 성능을 달성할 수 있는가?
  • RQ2ISIC 2019 테스트 세트에서 UNK 이상치 클래스를 효과적으로 감지하는 방법은?
  • RQ3메타데이터(연령, 성별, 지역)를 도입하면 피부 병변 진단의 분류 성능이 향상되는가?
  • RQ4엔트로피 기반 이상치 탐지와 계층적 피부 이미지 탐지기의 비교 영향은 무엇인가?

주요 결과

  • Ensemble 2가 평가된 모델 중 가장 높은 균형 정확도(0.897)와 정확도(0.910), AUC 0.989를 달성했다.
  • 메타데이터를 포함한 Ensemble 2는 균형 정확도를 0.901로, 정확도를 0.910으로 약간 높이고(AUC 0.987).
  • 메타데이터 통합은 메타데이터를 사용하지 않은 경우에 비해 미미하지만 이익이 되는 향상을 제공한다.
  • 엔트로피 기반 이상치 탐지는 Ensemble 1에서 944개(11.45%), Ensemble 2에서 579개(7.02%)의 이상치를 식별하여 계층적 접근법보다 미지의 샘플 탐지에서 우수함을 보였다.
  • 여덟 클래스 분류 성능은 이전 ISIC 챌린지와 경쟁력이 있으며, SENet이 단일 모델 중 가장 강한 편에 속하고 앙상블이 최고를 기록한다.
  • 제안된 엔트로피 기반 이상치 방법은 더 넓은 이상치 탐지를 가능하게 하지만 더 많은 샘플을 미지의 것으로 포함시키므로 개선 여지가 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.