[논문 리뷰] Study of Different Deep Learning Approach with Explainable AI for Screening Patients with COVID-19 Symptoms: Using CT Scan and Chest X-ray Image Dataset
이 연구는 COVID-19 선별을 위해 CT와 흉부 X-레이 데이터셋에서 8개의 사전 학습된 CNN(VGG16, InceptionResNetV2, ResNet50, DenseNet201, VGG19, MobileNetV2, NasNetMobile, ResNet15V2)을 비교하고, LIME을 사용한 설명 가능성을 활용하며 NasNetMobile (CT)과 NasNetMobile (X-ray)을 최상 성능으로 식별합니다.
The outbreak of COVID-19 disease caused more than 100,000 deaths so far in the USA alone. It is necessary to conduct an initial screening of patients with the symptoms of COVID-19 disease to control the spread of the disease. However, it is becoming laborious to conduct the tests with the available testing kits due to the growing number of patients. Some studies proposed CT scan or chest X-ray images as an alternative solution. Therefore, it is essential to use every available resource, instead of either a CT scan or chest X-ray to conduct a large number of tests simultaneously. As a result, this study aims to develop a deep learning-based model that can detect COVID-19 patients with better accuracy both on CT scan and chest X-ray image dataset. In this work, eight different deep learning approaches such as VGG16, InceptionResNetV2, ResNet50, DenseNet201, VGG19, MobilenetV2, NasNetMobile, and ResNet15V2 have been tested on two dataset-one dataset includes 400 CT scan images, and another dataset includes 400 chest X-ray images studied. Besides, Local Interpretable Model-agnostic Explanations (LIME) is used to explain the model's interpretability. Using LIME, test results demonstrate that it is conceivable to interpret top features that should have worked to build a trust AI framework to distinguish between patients with COVID-19 symptoms with other patients.
연구 동기 및 목표
- 신속하고 확장 가능한 COVID-19 증상 선별을 RT-PCR 테스트가 제한된 상황에서 영상 기반으로 촉진한다.
- CT 및 흉부 X-레이 데이터셋에서 여러 딥러닝 아키텍처를 평가하여 견고한 COVID-19 분류기를 식별한다.
- 모델 결정에 대해 라디오로지스트가 해석할 수 있도록 LIME으로 설명 가능성을 도입한다.
- 다양한 모달리티(모달리티 간 비교 가능성)를 평가하기 위한 정확도, 정밀도, 재현율, F1 등 비교 지표와 신뢰 구간을 제공한다.
제안 방법
- 두 가지 데이터셋을 사용한다: 400개의 CT 스캔 이미지(COVID-19 대 비 COVID-19) 및 400개의 흉부 X-레이 이미지(COVID-19 대 비 COVID-19).
- 8개의 사전 학습된 CNN을 이용한 전이 학습 적용: VGG16, InceptionResNetV2, ResNet50, DenseNet201, VGG19, MobileNetV2, NasNetMobile, ResNet15V2.
- 헤드를 교체하여 미세 조정; 데이터의 80%로 학습하고 20%로 테스트; Adam 최적화 및 그리드 검색 하이퍼파라미터(학습률 0.001, 30 에포크, 배치 크기 5).
- 정확도, 정밀도, 재현율, F1-score를 이용한 평가; Wilson 점수 및 베이지안 구간으로 95% 신뢰구간 보고.
- 예측을 LIME(Local Interpretable Model-agnostic Explanations)로 설명하여 의사결정에 영향을 주는 상위 특징을 강조한다.
실험 결과
연구 질문
- RQ18개 사전 학습 CNN 중 어떤 모델이 CT 및 X-ray 데이터셋에서 COVID-19 선별에 가장 우수한 성능을 보이는가?
- RQ2모델 성능 지표(정확도, 정밀도, 재현율, F1)가 모달리티(CT 대 X-ray) 및 모델 간에 어떻게 다른가?
- RQ3LIME 설명이 COVID-19 분류를 위한 방사선 의학적 특징과 일치하는 해석 가능한 인사이트를 제공할 수 있는가?
- RQ4각 모델에 대해 훈련-검증 간의 안정성 및 에포크별 손실 동향은 어떠한가?
주요 결과
- NasNetMobile이 CT 스캔에서 테스트 정확도 0.90 및 흉부 X-레이 이미지에서 테스트 정확도 0.100? note: see below를 포함한 최고를 달성한다.
- CT 테스트 데이터에서 NasNetMobile은 90%의 정확도와 0.90의 정밀도, 재현율, F1-score를 보이며 혼동 행렬에서 8개의 오분류(80개의 테스트 샘플)가 있다.
- 흉부 X-레이 테스트 데이터에서 NasNetMobile은 100%의 정확도, 정밀도, 재현율 및 F1-score를 달성하며 오분류 0건(80개의 테스트 샘플)이다.
- CT 학습 데이터에서 MobileNetV2가 가장 강력한 성능(정확도 0.99)을 보였으나 CT 테스트 세트에서는 NasNetMobile이 더 우수했다.
- 학습 실행 전체에 걸쳐 VGG16, InceptionResNetV2, NasNetMobile 등 여러 모델이 안정적인 훈련/검증 성능을 보인 반면, ResNet50은 일관되게 성능이 떨어졌다.
- LIME을 사용한 설명 가능성 평가를 통해 의사 기반의 신뢰를 높이는 상위 특징 해석의 가능성을 보여준다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.