Skip to main content
QUICK REVIEW

[논문 리뷰] Automatic Detection of Coronavirus Disease (COVID-19) in X-ray and CT Images: A Machine Learning-Based Approach

Sara Hosseinzadeh Kassani, Peyman Hosseinzadeh Kassasni|arXiv (Cornell University)|2020. 04. 22.
COVID-19 diagnosis using AI참고 문헌 41인용 수 62
한 줄 요약

이 논문은 COVID-19를 chest X-ray 및 CT 영상에서 탐지하기 위해 전이 학습 기반의 깊은 CNN 특징 추출기 앙상블 뒤에 전통 ML 분류기를 결합한 방법을 평가하며, 공개 데이터셋에서 최대 99% 정확도를 달성합니다.

ABSTRACT

The newly identified Coronavirus pneumonia, subsequently termed COVID-19, is highly transmittable and pathogenic with no clinically approved antiviral drug or vaccine available for treatment. The most common symptoms of COVID-19 are dry cough, sore throat, and fever. Symptoms can progress to a severe form of pneumonia with critical complications, including septic shock, pulmonary edema, acute respiratory distress syndrome and multi-organ failure. While medical imaging is not currently recommended in Canada for primary diagnosis of COVID-19, computer-aided diagnosis systems could assist in the early detection of COVID-19 abnormalities and help to monitor the progression of the disease, potentially reduce mortality rates. In this study, we compare popular deep learning-based feature extraction frameworks for automatic COVID-19 classification. To obtain the most accurate feature, which is an essential component of learning, MobileNet, DenseNet, Xception, ResNet, InceptionV3, InceptionResNetV2, VGGNet, NASNet were chosen amongst a pool of deep convolutional neural networks. The extracted features were then fed into several machine learning classifiers to classify subjects as either a case of COVID-19 or a control. This approach avoided task-specific data pre-processing methods to support a better generalization ability for unseen data. The performance of the proposed method was validated on a publicly available COVID-19 dataset of chest X-ray and CT images. The DenseNet121 feature extractor with Bagging tree classifier achieved the best performance with 99% classification accuracy. The second-best learner was a hybrid of the a ResNet50 feature extractor trained by LightGBM with an accuracy of 98%.

연구 동기 및 목표

  • X-ray 및 CT 영상에서 COVID-19 분류를 위한 깊은 CNN을 사용한 일반적이고 비수작업(feature extraction) 추출 접근 방식 시연.
  • 대규모 사전학습된 CNN에서 지식을 전이하는 것이 제한된 COVID-19 데이터일 때 탐지 성능을 향상시키는지 평가.
  • 일관되지 않은 영상 소스 간 일반화를 촉진하기 위해 광범위한 전처리를 피합니다.
  • 정확도와 효율성을 극대화하는 CNN 특성 추출기와 ML 분류기의 조합을 식별합니다.
  • 의심 사례의 신속한 스크리닝을 위한 웹 기반 CAD 도구를 제공합니다.

제안 방법

  • 사전학습된 CNN 아키텍처(MobileNet, DenseNet, Xception, InceptionV3, InceptionResNetV2, ResNet, VGGNet, NASNet)를 특징 추출기로 사용(전이 학습)하여 이미지를 저차원 특징 벡터로 인코딩합니다.
  • CNN 유도 특징에 대해 여러 전통 ML 분류기(Decision Tree, Random Forest, XGBoost, AdaBoost, Bagging, LightGBM)를 학습합니다.
  • 공개 chest X-ray 및 CT 이미지 데이터셋에서 10-fold 교차 검증으로 평가합니다; 가중치는 ImageNet에서 초기화합니다.
  • 두 가지 최소한의 전처리 단계(일관된 차원으로 리사이즈, 이미지 정규화(ImageNet 평균 뺄셈 및 최솟값-최댓값 정규화))를 적용합니다.
  • CNN+ML 조합을 비교하기 위해 정확도, 정밀도, 재현율, F1-score를 보고합니다.

실험 결과

연구 질문

  • RQ1깊은 CNN으로부터 얻은 특징 표현과 ML 분류기가 X-ray 및 CT 영상에서 COVID-19를 건강 대조군과 얼마나 잘 구분하는가?
  • RQ2어떤 CNN 아키텍처와 ML 분류기가 이 작업에서 가장 높은 정확도와 신뢰성을 제공하는가?
  • RQ3최소한의 전처리와 전이 학습이 이질적 영상 소스 전반에 걸친 강건한 일반화를 제공하는가?
  • RQ4실용적 CAD 배치를 위한 특징 추출과 분류기 학습 간의 계산 시간 트레이드오프는 무엇인가?

주요 결과

DTRFXGBoostAdaBoostBaggingLightGBM
83.00 ± 0.2693.00 ± 0.2395.00 ± 0.1680.00 ± 0.1796.00 ± -0.1182.00 ± 0.28
92.00 ± 0.1590.00 ± 0.2194.00 ± 0.1692.00 ± 0.1999.00 ± 0.0796.00 ± 0.11
84.00 ± 0.2690.00 ± 0.2490.00 ± 0.1887.00 ± 0.2596.00 ± 0.1187.00 ± 0.17
95.00 ± 0.1790.00 ± 0.1996.00 ± 0.1193.00 ± 0.2096.00 ± 0.1196.00 ± 0.11
82.00 ± 0.2284.00 ± 0.2988.00 ± 0.1580.00 ± 0.1295.00 ± 0.1284.00 ± 0.16
84.00 ± 0.3193.00 ± 0.1693.00 ± 0.1987.00 ± 0.3394.00 ± 0.1288.00 ± 0.21
89.00 ± 0.1790.00 ± 0.1593.00 ± 0.1694.00 ± 0.1293.00 ± 0.1698.00 ± 0.09
93.00 ± 0.1292.00 ± 0.1693.00 ± 0.1694.00 ± 0.1791.00 ± 0.2293.00 ± 0.20
90.00 ± 0.1991.00 ± 0.1988.00 ± 0.1990.00 ± 0.1990.00 ± 0.1985.00 ± 0.19
82.00 ± 0.2388.00 ± 0.1989.00 ± 0.1781.00 ± 0.2393.00 ± 0.1982.00 ± 0.26
87.00 ± 0.1788.00 ± 0.2294.00 ± 0.1987.00 ± 0.1793.00 ± 0.1989.00 ± 0.17
86.00 ± 0.26?????
87.00 ± 0.1296.00 ± 0.1192.00 ± 0.1990.00 ± 0.1895.00 ± 0.1288.00 ± 0.10
79.00 ± 0.3289.00 ± 0.2489.00 ± 0.2876.00 ± 0.3295.00 ± 0.1278.00 ± 0.26
90.00 ± 0.2786.00 ± 0.2693.00 ± 0.1689.00 ± 0.2096.00 ± 0.1188.00 ± 0.28
  • 가장 좋은 결과는 DenseNet121 특징과 Bagging 분류기를 사용했을 때 99.00% 정확도(±0.09)
  • 다음으로 근접한 결과는 DenseNet121 특징(또는 ResNet50 특징)과 LightGBM을 조합했을 때 98.00% 정확도(±0.09)
  • 최고의 정밀도, 재현율, F1-점수(99.00%)는 Bagging 분류기를 사용할 때 MobileNet 및 InceptionV3 특징으로 달성
  • 전반적으로 DenseNet121/DenseNet201/MobileNet/Xception/InceptionV3 등 깊은 CNN 특징과 Bagging 또는 XGBoost 분류기가 제공된 데이터 셋에서 다른 CNN+ML 조합보다 우수한 성능
  • 추출 및 학습 시간은 처음부터 매우 깊은 CNN을 학습하는 것보다 빠르며 CAD 시스템에 거의 실시간 추론을 가능하게 함
  • 임상 검증이 아직 필요하지만 임상 선별 파이프라인을 시뮬레이션하기 위한 웹 기반 탐지 도구가 구현됨

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.