QUICK REVIEW

[논문 리뷰] Automatic Detection of Coronavirus Disease (COVID-19) in X-ray and CT Images: A Machine Learning-Based Approach

Sara Hosseinzadeh Kassani, Peyman Hosseinzadeh Kassasni|arXiv (Cornell University)|2020. 04. 22.

COVID-19 diagnosis using AI참고 문헌 41인용 수 62

한 줄 요약

이 논문은 COVID-19를 chest X-ray 및 CT 영상에서 탐지하기 위해 전이 학습 기반의 깊은 CNN 특징 추출기 앙상블 뒤에 전통 ML 분류기를 결합한 방법을 평가하며, 공개 데이터셋에서 최대 99% 정확도를 달성합니다.

ABSTRACT

The newly identified Coronavirus pneumonia, subsequently termed COVID-19, is highly transmittable and pathogenic with no clinically approved antiviral drug or vaccine available for treatment. The most common symptoms of COVID-19 are dry cough, sore throat, and fever. Symptoms can progress to a severe form of pneumonia with critical complications, including septic shock, pulmonary edema, acute respiratory distress syndrome and multi-organ failure. While medical imaging is not currently recommended in Canada for primary diagnosis of COVID-19, computer-aided diagnosis systems could assist in the early detection of COVID-19 abnormalities and help to monitor the progression of the disease, potentially reduce mortality rates. In this study, we compare popular deep learning-based feature extraction frameworks for automatic COVID-19 classification. To obtain the most accurate feature, which is an essential component of learning, MobileNet, DenseNet, Xception, ResNet, InceptionV3, InceptionResNetV2, VGGNet, NASNet were chosen amongst a pool of deep convolutional neural networks. The extracted features were then fed into several machine learning classifiers to classify subjects as either a case of COVID-19 or a control. This approach avoided task-specific data pre-processing methods to support a better generalization ability for unseen data. The performance of the proposed method was validated on a publicly available COVID-19 dataset of chest X-ray and CT images. The DenseNet121 feature extractor with Bagging tree classifier achieved the best performance with 99% classification accuracy. The second-best learner was a hybrid of the a ResNet50 feature extractor trained by LightGBM with an accuracy of 98%.

연구 동기 및 목표

X-ray 및 CT 영상에서 COVID-19 분류를 위한 깊은 CNN을 사용한 일반적이고 비수작업(feature extraction) 추출 접근 방식 시연.
대규모 사전학습된 CNN에서 지식을 전이하는 것이 제한된 COVID-19 데이터일 때 탐지 성능을 향상시키는지 평가.
일관되지 않은 영상 소스 간 일반화를 촉진하기 위해 광범위한 전처리를 피합니다.
정확도와 효율성을 극대화하는 CNN 특성 추출기와 ML 분류기의 조합을 식별합니다.
의심 사례의 신속한 스크리닝을 위한 웹 기반 CAD 도구를 제공합니다.

제안 방법

사전학습된 CNN 아키텍처(MobileNet, DenseNet, Xception, InceptionV3, InceptionResNetV2, ResNet, VGGNet, NASNet)를 특징 추출기로 사용(전이 학습)하여 이미지를 저차원 특징 벡터로 인코딩합니다.
CNN 유도 특징에 대해 여러 전통 ML 분류기(Decision Tree, Random Forest, XGBoost, AdaBoost, Bagging, LightGBM)를 학습합니다.
공개 chest X-ray 및 CT 이미지 데이터셋에서 10-fold 교차 검증으로 평가합니다; 가중치는 ImageNet에서 초기화합니다.
두 가지 최소한의 전처리 단계(일관된 차원으로 리사이즈, 이미지 정규화(ImageNet 평균 뺄셈 및 최솟값-최댓값 정규화))를 적용합니다.
CNN+ML 조합을 비교하기 위해 정확도, 정밀도, 재현율, F1-score를 보고합니다.

실험 결과

연구 질문

RQ1깊은 CNN으로부터 얻은 특징 표현과 ML 분류기가 X-ray 및 CT 영상에서 COVID-19를 건강 대조군과 얼마나 잘 구분하는가?
RQ2어떤 CNN 아키텍처와 ML 분류기가 이 작업에서 가장 높은 정확도와 신뢰성을 제공하는가?
RQ3최소한의 전처리와 전이 학습이 이질적 영상 소스 전반에 걸친 강건한 일반화를 제공하는가?
RQ4실용적 CAD 배치를 위한 특징 추출과 분류기 학습 간의 계산 시간 트레이드오프는 무엇인가?

주요 결과

DT	RF	XGBoost	AdaBoost	Bagging	LightGBM
83.00 ± 0.26	93.00 ± 0.23	95.00 ± 0.16	80.00 ± 0.17	96.00 ± -0.11	82.00 ± 0.28
92.00 ± 0.15	90.00 ± 0.21	94.00 ± 0.16	92.00 ± 0.19	99.00 ± 0.07	96.00 ± 0.11
84.00 ± 0.26	90.00 ± 0.24	90.00 ± 0.18	87.00 ± 0.25	96.00 ± 0.11	87.00 ± 0.17
95.00 ± 0.17	90.00 ± 0.19	96.00 ± 0.11	93.00 ± 0.20	96.00 ± 0.11	96.00 ± 0.11
82.00 ± 0.22	84.00 ± 0.29	88.00 ± 0.15	80.00 ± 0.12	95.00 ± 0.12	84.00 ± 0.16
84.00 ± 0.31	93.00 ± 0.16	93.00 ± 0.19	87.00 ± 0.33	94.00 ± 0.12	88.00 ± 0.21
89.00 ± 0.17	90.00 ± 0.15	93.00 ± 0.16	94.00 ± 0.12	93.00 ± 0.16	98.00 ± 0.09
93.00 ± 0.12	92.00 ± 0.16	93.00 ± 0.16	94.00 ± 0.17	91.00 ± 0.22	93.00 ± 0.20
90.00 ± 0.19	91.00 ± 0.19	88.00 ± 0.19	90.00 ± 0.19	90.00 ± 0.19	85.00 ± 0.19
82.00 ± 0.23	88.00 ± 0.19	89.00 ± 0.17	81.00 ± 0.23	93.00 ± 0.19	82.00 ± 0.26
87.00 ± 0.17	88.00 ± 0.22	94.00 ± 0.19	87.00 ± 0.17	93.00 ± 0.19	89.00 ± 0.17
86.00 ± 0.26	?	?	?	?	?
87.00 ± 0.12	96.00 ± 0.11	92.00 ± 0.19	90.00 ± 0.18	95.00 ± 0.12	88.00 ± 0.10
79.00 ± 0.32	89.00 ± 0.24	89.00 ± 0.28	76.00 ± 0.32	95.00 ± 0.12	78.00 ± 0.26
90.00 ± 0.27	86.00 ± 0.26	93.00 ± 0.16	89.00 ± 0.20	96.00 ± 0.11	88.00 ± 0.28

가장 좋은 결과는 DenseNet121 특징과 Bagging 분류기를 사용했을 때 99.00% 정확도(±0.09)
다음으로 근접한 결과는 DenseNet121 특징(또는 ResNet50 특징)과 LightGBM을 조합했을 때 98.00% 정확도(±0.09)
최고의 정밀도, 재현율, F1-점수(99.00%)는 Bagging 분류기를 사용할 때 MobileNet 및 InceptionV3 특징으로 달성
전반적으로 DenseNet121/DenseNet201/MobileNet/Xception/InceptionV3 등 깊은 CNN 특징과 Bagging 또는 XGBoost 분류기가 제공된 데이터 셋에서 다른 CNN+ML 조합보다 우수한 성능
추출 및 학습 시간은 처음부터 매우 깊은 CNN을 학습하는 것보다 빠르며 CAD 시스템에 거의 실시간 추론을 가능하게 함
임상 검증이 아직 필요하지만 임상 선별 파이프라인을 시뮬레이션하기 위한 웹 기반 탐지 도구가 구현됨

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.