Skip to main content
QUICK REVIEW

[논문 리뷰] Advanced U-Net Architectures with CNN Backbones for Automated Lung Cancer Detection and Segmentation in Chest CT Images

Alireza Golkarieh, Kiana Kiashemshaki|ArXiv.org|2025. 07. 14.
Radiomics and Machine Learning in Medical Imaging인용 수 3
한 줄 요약

이 논문은 VGG16, ResNet50, Xception 백본을 사용한 U-Net 분할을 흉부 CT 영상에서 평가하고, 폐암 탐지를 위한 CNN 및 하이브리드 CNN+ML 분류기를 분석하여 U-Net 분할을 이용해 최대 99.1%의 분류 정확도를 달성한다.

ABSTRACT

This study investigates the effectiveness of U-Net architectures integrated with various convolutional neural network (CNN) backbones for automated lung cancer detection and segmentation in chest CT images, addressing the critical need for accurate diagnostic tools in clinical settings. A balanced dataset of 832 chest CT images (416 cancerous and 416 non-cancerous) was preprocessed using Contrast Limited Adaptive Histogram Equalization (CLAHE) and resized to 128x128 pixels. U-Net models were developed with three CNN backbones: ResNet50, VGG16, and Xception, to segment lung regions. After segmentation, CNN-based classifiers and hybrid models combining CNN feature extraction with traditional machine learning classifiers (Support Vector Machine, Random Forest, and Gradient Boosting) were evaluated using 5-fold cross-validation. Metrics included accuracy, precision, recall, F1-score, Dice coefficient, and ROC-AUC. U-Net with ResNet50 achieved the best performance for cancerous lungs (Dice: 0.9495, Accuracy: 0.9735), while U-Net with VGG16 performed best for non-cancerous segmentation (Dice: 0.9532, Accuracy: 0.9513). For classification, the CNN model using U-Net with Xception achieved 99.1 percent accuracy, 99.74 percent recall, and 99.42 percent F1-score. The hybrid CNN-SVM-Xception model achieved 96.7 percent accuracy and 97.88 percent F1-score. Compared to prior methods, our framework consistently outperformed existing models. In conclusion, combining U-Net with advanced CNN backbones provides a powerful method for both segmentation and classification of lung cancer in CT scans, supporting early diagnosis and clinical decision-making.

연구 동기 및 목표

  • 흉부 CT 스캔에서 폐암 탐지 및 분할의 정확도 향상을 도모한다.
  • 세 가지 사전학습 CNN 백본(VGG16, ResNet50, Xception)을 이용한 U-Net 분할 성능을 평가한다.
  • U-Net 분할로 학습된 CNN과 하이브리드 CNN+ML 분류기(SVM, RF, GB)를 이용한 분류 성능을 평가한다.
  • 강건한 교차검증 및 다중 지표를 적용하여 분할 및 분류 결과를 비교한다.
  • 제안된 프레임워크를 기존 연구와 비교하여 분할 및 탐지 정확도에서의 이점을 강조한다.

제안 방법

  • CLAHE로 CT 이미지를 전처리하고, 128×128로 크기 조정하며 픽셀 값을 정규화한다.
  • VGG16, ResNet50, 또는 Xception 백본으로 U-Net을 사용해 폐를 분할한다(인코더는 사전학습된 CNN에서 가져옴).
  • U-Net 분할로 암 대 비암 탐지를 위한 독립적인 CNN 분류기를 학습시킨다.
  • CNN에서 추출한 특징을 SVM, Random Forest, Gradient Boosting 분류기에 입력하여 하이브리드 모델을 개발한다.
  • Dice, IoU, 정확도, 정밀도, 재현율, F1, ROC-AUC를 사용한 5-fold 교차검증으로 평가하고 평균과 표준편차를 보고한다.

실험 결과

연구 질문

  • RQ1서로 다른 사전학습 백본(VGG16, ResNet50, Xception)을 가진 U-Net 분할이 암 대 비암 CT 영상에서 더 우수한 폐 구획화를 제공하는가?
  • RQ2U-Net 분할로 학습된 CNN 모델의 분류 성능은 어떠하며, 하이브리드 CNN+ML 접근법은 어떻게 비교되는가?
  • RQ3흉부 CT 데이터에서 폐암 탐지를 위한 정밀도, 재현율, ROC-AUC의 균형이 가장 잘 맞는 백본과 분류기 조합은 무엇인가?

주요 결과

  • U-Net with ResNet50은 암 구획 Dice 0.9495 및 정확도 0.9735(±0.1015)를 달성했다.
  • U-Net with VGG16은 비암 구획 폐를 가장 잘 분할했고 Dice 0.9532 및 정확도 0.9513(±0.1006)를 기록했다.
  • U-Net with Xception은 일관된 결과를 제공했다(암 Dice 0.9383, 비암 Dice 0.9521).
  • Xception 백본을 갖춘 U-Net 분할로 학습된 CNN 모델은 99.10%의 정확도, 99.74% 재현율, 99.42% F1-score(ROC-AUC 0.9911)를 달성했다.
  • 하이브리드 CNN+ML 모델은 경쟁력 있는 성능을 보였으며, CNN-SVM-Xception은 높은 정확도와 F1을, CNN-GB-VGG16은 높은 ROC-AUC를 달성했다.
  • 사전훈련된 백본은 Xception이 균형 잡힌 결과를 제공하며 강력한 분류를 보였고(정확도 0.9580, 재현율 0.9950, F1 0.9739, ROC-AUC 0.9193).

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.