[논문 리뷰] Automatic Detection of Coronavirus Disease (COVID-19) in X-ray and CT Images: A Machine Learning-Based Approach
이 논문은 COVID-19를 chest X-ray 및 CT 영상에서 탐지하기 위해 전이 학습 기반의 깊은 CNN 특징 추출기 앙상블 뒤에 전통 ML 분류기를 결합한 방법을 평가하며, 공개 데이터셋에서 최대 99% 정확도를 달성합니다.
The newly identified Coronavirus pneumonia, subsequently termed COVID-19, is highly transmittable and pathogenic with no clinically approved antiviral drug or vaccine available for treatment. The most common symptoms of COVID-19 are dry cough, sore throat, and fever. Symptoms can progress to a severe form of pneumonia with critical complications, including septic shock, pulmonary edema, acute respiratory distress syndrome and multi-organ failure. While medical imaging is not currently recommended in Canada for primary diagnosis of COVID-19, computer-aided diagnosis systems could assist in the early detection of COVID-19 abnormalities and help to monitor the progression of the disease, potentially reduce mortality rates. In this study, we compare popular deep learning-based feature extraction frameworks for automatic COVID-19 classification. To obtain the most accurate feature, which is an essential component of learning, MobileNet, DenseNet, Xception, ResNet, InceptionV3, InceptionResNetV2, VGGNet, NASNet were chosen amongst a pool of deep convolutional neural networks. The extracted features were then fed into several machine learning classifiers to classify subjects as either a case of COVID-19 or a control. This approach avoided task-specific data pre-processing methods to support a better generalization ability for unseen data. The performance of the proposed method was validated on a publicly available COVID-19 dataset of chest X-ray and CT images. The DenseNet121 feature extractor with Bagging tree classifier achieved the best performance with 99% classification accuracy. The second-best learner was a hybrid of the a ResNet50 feature extractor trained by LightGBM with an accuracy of 98%.
연구 동기 및 목표
- X-ray 및 CT 영상에서 COVID-19 분류를 위한 깊은 CNN을 사용한 일반적이고 비수작업(feature extraction) 추출 접근 방식 시연.
- 대규모 사전학습된 CNN에서 지식을 전이하는 것이 제한된 COVID-19 데이터일 때 탐지 성능을 향상시키는지 평가.
- 일관되지 않은 영상 소스 간 일반화를 촉진하기 위해 광범위한 전처리를 피합니다.
- 정확도와 효율성을 극대화하는 CNN 특성 추출기와 ML 분류기의 조합을 식별합니다.
- 의심 사례의 신속한 스크리닝을 위한 웹 기반 CAD 도구를 제공합니다.
제안 방법
- 사전학습된 CNN 아키텍처(MobileNet, DenseNet, Xception, InceptionV3, InceptionResNetV2, ResNet, VGGNet, NASNet)를 특징 추출기로 사용(전이 학습)하여 이미지를 저차원 특징 벡터로 인코딩합니다.
- CNN 유도 특징에 대해 여러 전통 ML 분류기(Decision Tree, Random Forest, XGBoost, AdaBoost, Bagging, LightGBM)를 학습합니다.
- 공개 chest X-ray 및 CT 이미지 데이터셋에서 10-fold 교차 검증으로 평가합니다; 가중치는 ImageNet에서 초기화합니다.
- 두 가지 최소한의 전처리 단계(일관된 차원으로 리사이즈, 이미지 정규화(ImageNet 평균 뺄셈 및 최솟값-최댓값 정규화))를 적용합니다.
- CNN+ML 조합을 비교하기 위해 정확도, 정밀도, 재현율, F1-score를 보고합니다.
실험 결과
연구 질문
- RQ1깊은 CNN으로부터 얻은 특징 표현과 ML 분류기가 X-ray 및 CT 영상에서 COVID-19를 건강 대조군과 얼마나 잘 구분하는가?
- RQ2어떤 CNN 아키텍처와 ML 분류기가 이 작업에서 가장 높은 정확도와 신뢰성을 제공하는가?
- RQ3최소한의 전처리와 전이 학습이 이질적 영상 소스 전반에 걸친 강건한 일반화를 제공하는가?
- RQ4실용적 CAD 배치를 위한 특징 추출과 분류기 학습 간의 계산 시간 트레이드오프는 무엇인가?
주요 결과
| DT | RF | XGBoost | AdaBoost | Bagging | LightGBM |
|---|---|---|---|---|---|
| 83.00 ± 0.26 | 93.00 ± 0.23 | 95.00 ± 0.16 | 80.00 ± 0.17 | 96.00 ± -0.11 | 82.00 ± 0.28 |
| 92.00 ± 0.15 | 90.00 ± 0.21 | 94.00 ± 0.16 | 92.00 ± 0.19 | 99.00 ± 0.07 | 96.00 ± 0.11 |
| 84.00 ± 0.26 | 90.00 ± 0.24 | 90.00 ± 0.18 | 87.00 ± 0.25 | 96.00 ± 0.11 | 87.00 ± 0.17 |
| 95.00 ± 0.17 | 90.00 ± 0.19 | 96.00 ± 0.11 | 93.00 ± 0.20 | 96.00 ± 0.11 | 96.00 ± 0.11 |
| 82.00 ± 0.22 | 84.00 ± 0.29 | 88.00 ± 0.15 | 80.00 ± 0.12 | 95.00 ± 0.12 | 84.00 ± 0.16 |
| 84.00 ± 0.31 | 93.00 ± 0.16 | 93.00 ± 0.19 | 87.00 ± 0.33 | 94.00 ± 0.12 | 88.00 ± 0.21 |
| 89.00 ± 0.17 | 90.00 ± 0.15 | 93.00 ± 0.16 | 94.00 ± 0.12 | 93.00 ± 0.16 | 98.00 ± 0.09 |
| 93.00 ± 0.12 | 92.00 ± 0.16 | 93.00 ± 0.16 | 94.00 ± 0.17 | 91.00 ± 0.22 | 93.00 ± 0.20 |
| 90.00 ± 0.19 | 91.00 ± 0.19 | 88.00 ± 0.19 | 90.00 ± 0.19 | 90.00 ± 0.19 | 85.00 ± 0.19 |
| 82.00 ± 0.23 | 88.00 ± 0.19 | 89.00 ± 0.17 | 81.00 ± 0.23 | 93.00 ± 0.19 | 82.00 ± 0.26 |
| 87.00 ± 0.17 | 88.00 ± 0.22 | 94.00 ± 0.19 | 87.00 ± 0.17 | 93.00 ± 0.19 | 89.00 ± 0.17 |
| 86.00 ± 0.26 | ? | ? | ? | ? | ? |
| 87.00 ± 0.12 | 96.00 ± 0.11 | 92.00 ± 0.19 | 90.00 ± 0.18 | 95.00 ± 0.12 | 88.00 ± 0.10 |
| 79.00 ± 0.32 | 89.00 ± 0.24 | 89.00 ± 0.28 | 76.00 ± 0.32 | 95.00 ± 0.12 | 78.00 ± 0.26 |
| 90.00 ± 0.27 | 86.00 ± 0.26 | 93.00 ± 0.16 | 89.00 ± 0.20 | 96.00 ± 0.11 | 88.00 ± 0.28 |
- 가장 좋은 결과는 DenseNet121 특징과 Bagging 분류기를 사용했을 때 99.00% 정확도(±0.09)
- 다음으로 근접한 결과는 DenseNet121 특징(또는 ResNet50 특징)과 LightGBM을 조합했을 때 98.00% 정확도(±0.09)
- 최고의 정밀도, 재현율, F1-점수(99.00%)는 Bagging 분류기를 사용할 때 MobileNet 및 InceptionV3 특징으로 달성
- 전반적으로 DenseNet121/DenseNet201/MobileNet/Xception/InceptionV3 등 깊은 CNN 특징과 Bagging 또는 XGBoost 분류기가 제공된 데이터 셋에서 다른 CNN+ML 조합보다 우수한 성능
- 추출 및 학습 시간은 처음부터 매우 깊은 CNN을 학습하는 것보다 빠르며 CAD 시스템에 거의 실시간 추론을 가능하게 함
- 임상 검증이 아직 필요하지만 임상 선별 파이프라인을 시뮬레이션하기 위한 웹 기반 탐지 도구가 구현됨
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.