[논문 리뷰] Deep Convolutional Neural Networks to Diagnose COVID-19 and other Pneumonia Diseases from Posteroanterior Chest X-Rays
본 논문은 다수의 CNN 아키텍처(VGG16/19, InceptionResNetV2, InceptionV3, Xception)를 PA 흉부 X선에서 COVID-19, No Finding, 및 Other Pneumonia를 분류하도록 학습시켰으며, VGG16이 최상의 성능을 보였다.
The article explores different deep convolutional neural network architectures trained and tested on posteroanterior chest X-rays of 327 patients who are healthy (152 patients), diagnosed with COVID-19 (125), and other types of pneumonia (48). In particular, this paper looks at the deep convolutional neural networks VGG16 and VGG19, InceptionResNetV2 and InceptionV3, as well as Xception, all followed by a flat multi-layer perceptron and a final 30% drop-out. The paper has found that the best performing network is VGG16 with a final $30$% drop-out trained over 3 classes (COVID-19, No Finding, Other Pneumonia). It has an internal cross-validated accuracy of $93.9(\pm3.4)$%, a COVID-19 sensitivity of $87.7(-1.9,+2)$%, and a No Finding sensitivity of $96.8(\pm0.8)$%. The respective external cross-validated values are $84.1(\pm13.5)$%, $87.7(-1.9,2)$%, and $96.8(\pm0.8)$%. The model optimizer was Adam with a 1e-4 learning rate, and categorical cross-entropy loss. It is hoped that, once this research will be put to practice in hospitals, healthcare professionals will be able in the medium to long-term to diagnosing through machine learning tools possible pneumonia, and if detected, whether it is linked to a COVID-19 infection, allowing the detection of new possible COVID-19 foyers after the end of possible "stop-and-go" lockdowns as expected by until a vaccine is found and widespread. Furthermore, in the short-term, it is hoped practitioners can compare the diagnosis from the deep convolutional neural networks with possible RT-PCR testing results, and if clashing, a Computed Tomography could be performed as they are more accurate in showing COVID-19 pneumonia.
연구 동기 및 목표
- PA 흉부 X선에서 COVID-19 및 기타 폐렴을 진단하기 위한 심층 CNN의 가능성을 평가한다.
- 세 가지 클래스로 구성된 작업에서 여러 아키텍처(VGG16, VGG19, InceptionResNetV2, InceptionV3, Xception)를 비교한다.
- 교차 검증 성능 지표를 제시하고 병원에서의 실용적 활용 및 한계에 대해 논의한다.
제안 방법
- ImageNet 사전 학습 가중치로 네트워크를 초기화하여 전이 학습을 사용한다.
- Adam 옵티마이저를 학습률 0.0001로 사용하여 모든 모델을 200 에폭 학습한다.
- 최종 드롭아웃 30%와 다항 로스(카테고리형 교차 엔트로피 손실)를 적용한다.
- 내부 및 외부 테스트 성능을 보고하기 위해 계층화된 5-fold 교차 검증을 활용한다.
- PA 흉부 X선을 182x182로 크기 조정하고 데이터 증강(회전, 이동, 확대, 반전, 채널 시프트)을 적용하여 전처리한다.
실험 결과
연구 질문
- RQ1PA 흉부 X선 기반 CNN이 COVID-19를 No Finding 및 기타 폐렴과 구분할 수 있는가?
- RQ2이 3클래스 작업에서 교차 검증 성능이 가장 좋은 CNN 아키텍처는 무엇인가?
- RQ3아키텍처별 COVID-19 및 No Finding 탐지 민감도는 무엇인가?
- RQ4외부 테스트 성능은 내부 교차 검증과 어떻게 비교되는가?
- RQ5병원 환경에서 PA X선과 이러한 모델 사용의 한계는 무엇인가?
주요 결과
- VGG16이 내부 및 외부 세트에서 평가된 모델 중 전반적으로 가장 우수한 성능을 달성했다.
- VGG16의 내부 5-폴드 교차 검증 정확도: 93.9% (±3.4); COVID-19 재현율: 87.7% (±2.0); No Finding 재현율: 96.8% (±0.8).
- VGG16의 외부 테스트 정확도: 84.1% (±13.5); COVID-19 재현율: 87.7% (±2.0); No Finding 재현율: 96.8% (±0.8).
- InceptionResNetV2 및 InceptionV3는 COVID-19 민감도가 낮고 분산이 큰 중간 수준의 성능을 보였다; InceptionResNetV2의 COVID-19 재현율은 내부/외부에서 약 70.8–71.0%였다.
- VGG19는 VGG16과 비슷한 성능을 보였지만 신뢰도 향상이 약간 낮고 비용이 더 높은 편이다.
- Xception은 이 데이터셋에서 VGG 기반 모델에 비해 성능이 떨어졌다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.