[논문 리뷰] Stacked Convolutional Neural Network for Diagnosis of COVID-19 Disease from X-ray Images
이 논문은 COVID-19 X-선 데이터셋으로 학습된 스택드 CNN 앙상블(CovNet30 + VGG19 서브모델)과 로지스틱 회귀를 결합하여 COVID-19, Normal, Pneumonia를 고정밀도로 분류하는 방법을 제시합니다.
Automatic and rapid screening of COVID-19 from the chest X-ray images has become an urgent need in this pandemic situation of SARS-CoV-2 worldwide in 2020. However, accurate and reliable screening of patients is a massive challenge due to the discrepancy between COVID-19 and other viral pneumonia in X-ray images. In this paper, we design a new stacked convolutional neural network model for the automatic diagnosis of COVID-19 disease from the chest X-ray images. We obtain different sub-models from the VGG19 and developed a 30-layered CNN model (named as CovNet30) during the training, and obtained sub-models are stacked together using logistic regression. The proposed CNN model combines the discriminating power of the different CNN`s sub-models and classifies chest X-ray images into COVID-19, Normal, and Pneumonia classes. In addition, we generate X-ray images dataset referred to as COVID19CXr, which includes 2764 chest x-ray images of 1768 patients from the three publicly available data repositories. The proposed stacked CNN achieves an accuracy of 92.74%, the sensitivity of 93.33%, PPV of 92.13%, and F1-score of 0.93 for the classification of X-ray images. Our proposed approach shows its superiority over the existing methods for the diagnosis of the COVID-19 from the X-ray images.
연구 동기 및 목표
- 가슴 X-선 영상에서 COVID-19, Normal, Pneumonia를 구분하는 자동 CAD 시스템을 개발한다.
- 공개 소스로부터 COVID19CXr 데이터셋을 생성하고 선별한다.
- 다양한 서브모델을 활용해 진단 성능을 향상시키는 스택드 CNN 프레임워크를 설계한다.
제안 방법
- X-선 데이터에서 30층 CNN인 CovNet30을 처음부터 학습시킨다.
- X-선 데이터셋에서 사전 학습된 VGG19 모델을 미세조정한다.
- 학습 중에 CovNet30과 VGG19로부터 다섯 개의 서브모델을 생성한다.
- 로지스틱 회귀를 사용해 서브모델의 예측을 스택하여 최종 스택드 분류기를 형성한다.
- 정확도, 민감도, 특이도, PPV, F1, AUC를 포함한 지표로 5-폴드 교차검증으로 평가한다.
실험 결과
연구 질문
- RQ1스택드 CNN 앙상블이 개별 모델보다 흉부 X-선에서 멀티클래스 COVID-19, Normal, Pneumonia 진단 정확도를 향상시킬 수 있는가?
- RQ2COVID19CXr 데이터셋에서 스택드 모델의 진단 성능(민감도, 특이도, 정확도, PPV, F1, AUC)은 어떠한가?
- RQ3제안된 방법이 독립적인 CovNet30 및 VGG19 모델과 비교하여 어떤 차이가 있는가?
- RQ4클래스 불균형 및 작은 COVID-19 샘플 크기에 대해 폴드 간 모델의 견고성이 있는가?
주요 결과
| 폴드 | 민감도 (%) | 특이도 (%) | 정확도 (%) | 오차 ± CI (%) | PPV (%) | F1-점수 | AUC ± CI |
|---|---|---|---|---|---|---|---|
| Fold1 | 95.5 | 98.19 | 96.94 | 3.06 ± 1.42 | 97.69 | 0.97 | 0.989 ± 0.003 |
| Fold2 | 92.66 | 94.97 | 91.44 | 8.56 ± 2.39 | 91.32 | 0.92 | 0.982 ± 0.015 |
| Fold3 | 91.45 | 95.01 | 91.34 | 8.66 ± 2.35 | 92.13 | 0.92 | 0.982 ± 0.011 |
| Fold4 | 92.47 | 94.77 | 90.22 | 9.78 ± 2.48 | 85.97 | 0.88 | 0.977 ± 0.023 |
| Fold5 | 94.59 | 96.12 | 93.74 | 6.26 ± 2.02 | 93.54 | 0.94 | 0.981 ± 0.009 |
- 5폴드 전체 평균 정확도 92.74%.
- 평균 민감도 93.33% 및 평균 특이도 95.81%.
- 평균 PPV 92.13–92.74% 및 F1-점수 0.93.
- COVID-19 클래스의 평균 AUC 0.994(CI 제공); 전체 평균 AUC 0.984.
- 스택드 CNN이 CovNet30 및 VGG19 단독 모델보다 우수한 성능을 보인다.
- 서브모델은 폴드별로 다른 성능을 보이나, 스택드 모델이 최상위 결과를 도출한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.