[논문 리뷰] Skin Cancer Images Classification using Transfer Learning Techniques
요약: 본 논문은 ISIC 데이터셋에서 이진 피부암 분류를 위해 데이터 증강을 포함한 다섯 개의 사전 학습된 전이 학습 모델(ResNet-50, MobileNet, InceptionV3, InceptionResNetV2, DenseNet-169/201)을 평가하고, ResNet-50이 0.935 정확도로 가장 잘 수행함을 발견했다.
Skin cancer is one of the most common and deadliest types of cancer. Early diagnosis of skin cancer at a benign stage is critical to reducing cancer mortality. To detect skin cancer at an earlier stage an automated system is compulsory that can save the life of many patients. Many previous studies have addressed the problem of skin cancer diagnosis using various deep learning and transfer learning models. However, existing literature has limitations in its accuracy and time-consuming procedure. In this work, we applied five different pre-trained transfer learning approaches for binary classification of skin cancer detection at benign and malignant stages. To increase the accuracy of these models we fine-tune different layers and activation functions. We used a publicly available ISIC dataset to evaluate transfer learning approaches. For model stability, data augmentation techniques are applied to improve the randomness of the input dataset. These approaches are evaluated using different hyperparameters such as batch sizes, epochs, and optimizers. The experimental results show that the ResNet-50 model provides an accuracy of 0.935, F1-score of 0.86, and precision of 0.94.
연구 동기 및 목표
- 자동화된, 더 빠른 피부암 진단을 촉진하여 조기 발견 및 비용이 많이 드는 수동 진단 의존도 감소를 돕는다.
- ISIC 피부 병변 데이터에서 데이터 증강이 있는 전이 학습 모델이 기존 접근법보다 우수한지 평가한다.
- 이 이진 분류 작업에 대한 최적의 하이퍼파라미터(batch size, learning rate, optimizer)를 식별한다.
- 벤ign 대 악성 분류에서 최상의 성능을 내는 모델을 결정하기 위해 여러 pretrained 아키텍처를 비교한다.
제안 방법
- ISIC 이미지를 224x224x3으로 재조정한 상태에서 다섯 가지 pretrained CNN(ResNet-50, MobileNet, InceptionV3, InceptionResNetV2, DenseNet-169/201)을 미세조정한다.
- 학습 세트를 균형 있게 만들고 확장하기 위해 데이터 증강(회전, 플립, 밝기, 확대)을 적용한다.
- 배치 크기(32, 64), 학습률(0.0001, 0.00001), 옵티마이저(Adam, SGD)와 같은 하이퍼파라미터를 실험한다.
- 최상위 층을 평균 풀링 및 완전 연결 층으로 대체하고 이진 벤ign/malignant 분류에 soft-max를 사용한다.
- 모델과 하이퍼파라미터 전반에 대해 정확도, 정밀도, 재현율, F1, ROC-AUC 및 혼동 행렬로 평가한다.
실험 결과
연구 질문
- RQ1전이 학습 모델이 ISIC에서 이진 피부암 분류에 높은 정확도를 달성할 수 있는가?
- RQ2제한된 의료 영상 데이터셋에서 데이터 증강이 모델 성능에 미치는 영향은?
- RQ3어떤 pretrained 아키텍처와 하이퍼파라미터 설정이 양성(benign) 대 악성(malignant) 피부 병변 분류에 최상의 성능을 낳는가?
- RQ4ISIC 데이터셋에서 전이 학습 모델은 최신 연구 방법과 어떻게 비교되는가?
주요 결과
| 모델 | 정확도 | 정밀도 | 재현율 | F1 점수 | ROC-AUC |
|---|---|---|---|---|---|
| ResNet-50 | 0.935 | 0.94 | 0.77 | 0.86 | 0.891 |
| MobileNet | 0.884 | 0.91 | 0.73 | 0.81 | 0.824 |
| InceptionV3 | 0.884 | 0.91 | 0.73 | 0.81 | 0.824 |
| InceptionResnetv2 | 0.884 | 0.91 | 0.73 | 0.81 | 0.824 |
| DenseNet-201 | 0.884 | 0.91 | 0.73 | 0.81 | 0.824 |
- ResNet-50은 0.935 정확도, 0.94 정밀도, 0.77 재현율, 0.86 F1, 0.891 ROC-AUC로 최상의 성능을 달성했다.
- 배치 크기 64, 학습률 0.0001, 그리고 Adam 옵티마이저가 모델 전반에서 일반적으로 최상의 결과를 낳았다.
- 데이터 증강으로 학습 데이터가 2818에서 5636 샘플로 증가했고 성능이 향상되었다.
- 다른 평가 모델들(MobileNet, InceptionV3, InceptionResnetv2, DenseNet-201)은 0.884 정확도와 유사한 지표를 달성했다.
- 본 연구는 ISIC에서 최신 방법과 경쟁력이 있음을 주장하며, 소형 데이터셋에 대한 전이 학습이 시간 절약에 유리하다고 강조한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.