Skip to main content
QUICK REVIEW

[논문 리뷰] CVR-Net: A deep convolutional neural network for coronavirus recognition from chest radiography images

Md. Kamrul Hasan, Md. Ashraful Alam|arXiv (Cornell University)|2020. 07. 21.
COVID-19 diagnosis using AI참고 문헌 60인용 수 27
한 줄 요약

CVR-Net는 흉부 X선 및 CT 영상에서 코로나19를 종단간 인식하기 위해 설계된 다중 스케일, 다중 인코더 앙상블 컨volution 신경망이다. 전이 학습, 데이터 증강 및 클래스 균형 조정을 통해 제한된 훈련 데이터 조건에서도 강건한 성능을 보이며, 2개 클래스 작업에서 F1 스코어 0.997과 정확도 0.998을 달성하여 최신 기술 수준을 확립한다.

ABSTRACT

The novel Coronavirus Disease 2019 (COVID-19) is a global pandemic disease spreading rapidly around the world. A robust and automatic early recognition of COVID-19, via auxiliary computer-aided diagnostic tools, is essential for disease cure and control. The chest radiography images, such as Computed Tomography (CT) and X-ray, and deep Convolutional Neural Networks (CNNs), can be a significant and useful material for designing such tools. However, designing such an automated tool is challenging as a massive number of manually annotated datasets are not publicly available yet, which is the core requirement of supervised learning systems. In this article, we propose a robust CNN-based network, called CVR-Net (Coronavirus Recognition Network), for the automatic recognition of the coronavirus from CT or X-ray images. The proposed end-to-end CVR-Net is a multi-scale-multi-encoder ensemble model, where we have aggregated the outputs from two different encoders and their different scales to obtain the final prediction probability. We train and test the proposed CVR-Net on three different datasets, where the images have collected from different open-source repositories. We compare our proposed CVR-Net with state-of-the-art methods, which are trained and tested on the same datasets. We split three datasets into five different tasks, where each task has a different number of classes, to evaluate the multi-tasking CVR-Net. Our model achieves an overall F1-score & accuracy of 0.997 & 0.998; 0.963 & 0.964; 0.816 & 0.820; 0.961 & 0.961; and 0.780 & 0.780, respectively, for task-1 to task-5. As the CVR-Net provides promising results on the small datasets, it can be an auspicious computer-aided diagnostic tool for the diagnosis of coronavirus to assist the clinical practitioners and radiologists. Our source codes and model are publicly available at https://github.com/kamruleee51/CVR-Net.

연구 동기 및 목표

  • 느린 비용이 많이 드는 RT-PCR 검사에 의존도를 줄이기 위해 자동화되고 신뢰할 수 있으며 조기에 코로나19를 진단할 수 있는 긴급한 필요성을 해결한다.
  • 감독 학습 기반 깊이 신경망 모델 훈련을 위한 공개된 수동으로 주석이 달린 의료 영상 데이터셋이 부족한 문제를 해결한다.
  • 클래스 불균형과 소규모 훈련 세트에도 불구하고 다양한 흉부 영상에 일반화할 수 있는 강건한 종단간 깊이 학습 시스템을 개발한다.
  • 대도시 외부 또는 자원이 제한된 환경에서 임상 의사결정 지원을 위해 거짓 음성 예측을 최소화한다.
  • 연구 및 임상 적용을 가속화하기 위해 공개 가능하고 재현 가능한 모델을 제공한다.

제안 방법

  • 다양한 스케일에서 두 개의 다른 인코더 브랜치에서 유도된 특징을 융합하여 특징 표현을 향상시키는 다중 스케일, 다중 인코더 앙상블 CNN 아키텍처인 CVR-Net을 제안한다.
  • 작은 의료 영상 데이터셋에서 특징 학습을 향상시키기 위해 ImageNet 사전 훈련된 가중치로 네트워크를 초기화하는 전이 학습을 적용한다.
  • 훈련 데이터 다양성을 높이고 과적합을 줄이기 위해 다양한 데이터 증강 기법(예: 회전, 뒤집기, 스케일링)을 적용한다.
  • 다수 클래스에 대한 편향을 완화하기 위해 클래스 재균형 전략을 구현한다. 특히 양성(코로나19) 사례의 부족으로 인해 이는 매우 중요하다.
  • 다양한 스케일과 인코더에서의 예측을 평균화하는 앙상블 평균 전략을 사용하여 강건성과 일반화 능력을 향상시킨다.
  • 총 3개의 오픈 소스 데이터셋을 종합적으로 훈련 및 평가하며, 클래스 수가 다른 5개의 다중 클래스 분류 작업으로 분할한다.

실험 결과

연구 질문

  • RQ1제한된 주석이 달린 훈련 데이터가 존재하는 상황에서도 깊이 신경망 기반 모델이 흉부 X선 및 CT 영상에서 코로나19를 분류할 때 높은 정확도와 낮은 거짓 음성 비율을 달성할 수 있는가?
  • RQ2총 훈련 샘플 수가 일정할 때, 클래스 수가 증가함에 따라(COVID-19 vs. 2개 클래스 vs. 4개 클래스) CVR-Net의 성능은 어떻게 변화하는가?
  • RQ3단일 브랜치 모델 대비 다중 스케일, 다중 인코더 특징 융합이 인식 강건성 향상에 얼마나 기여하는가?
  • RQ4데이터 증강 및 클래스 재균형 전략이 소규모 의료 영상 데이터셋에서 클래스 불균형의 영향을 얼마나 효과적으로 완화하는가?
  • RQ5ImageNet에서의 전이 학습이 저자원 의료 영상 분류 작업에서 코로나19 검출 성능을 크게 향상시킬 수 있는가?

주요 결과

  • CVR-Net은 2개 클래스 작업(COVID-19 대비 무징후)에서 F1 스코어 0.997과 정확도 0.998을 달성하여 소규모 데이터셋에서 거의 완벽한 성능을 보였다.
  • 클래스 수가 증가함에 따라 성능이 저하됨—4개 클래스 작업(COVID-19, 정상, 세균성 폐렴, 바이러스성 폐렴)에서는 F1 스코어가 0.816으로 떨어지고 정확도는 0.820으로 감소함—이는 더 높은 클래스 간 유사성과 내부 클래스 다양성으로 인한 것이다.
  • 교차 검증에서의 폴드 간 변동성이 매우 적어, 다양한 데이터 분할에 걸쳐 강력한 강건성과 일반화 능력을 보였다.
  • 정상 클래스가 정상 및 폐렴(Bacterial/Viral)으로 분할될 경우 거짓 음성 예측이 크게 증가하여, 제한된 훈련 샘플에서 클래스 모호성 문제의 어려움을 드러냈다.
  • 다중 스케일, 다중 인코더 앙상블 설계가 과적합과 기울기 소실을 효과적으로 줄였으며, 이는 소규모 데이터셋에서도 높은 성능을 달성하는 데 기여했다.
  • 모델의 성능은 클래스 분포와 유사도에 가장 민감하며, 향후 더 명확하고 균형 잡히며 세분화된 훈련 샘플이 제공될 경우 성능 향상이 기대된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.