[论文解读] Stacked Convolutional Neural Network for Diagnosis of COVID-19 Disease from X-ray Images
本文提出一个堆叠式 CNN 集成模型(CovNet30 + VGG19 子模型),在 COVID-19 X 光数据集上训练,并与逻辑回归结合,以对 COVID-19、Normal 与 Pneumonia 进行高精度分类。
Automatic and rapid screening of COVID-19 from the chest X-ray images has become an urgent need in this pandemic situation of SARS-CoV-2 worldwide in 2020. However, accurate and reliable screening of patients is a massive challenge due to the discrepancy between COVID-19 and other viral pneumonia in X-ray images. In this paper, we design a new stacked convolutional neural network model for the automatic diagnosis of COVID-19 disease from the chest X-ray images. We obtain different sub-models from the VGG19 and developed a 30-layered CNN model (named as CovNet30) during the training, and obtained sub-models are stacked together using logistic regression. The proposed CNN model combines the discriminating power of the different CNN`s sub-models and classifies chest X-ray images into COVID-19, Normal, and Pneumonia classes. In addition, we generate X-ray images dataset referred to as COVID19CXr, which includes 2764 chest x-ray images of 1768 patients from the three publicly available data repositories. The proposed stacked CNN achieves an accuracy of 92.74%, the sensitivity of 93.33%, PPV of 92.13%, and F1-score of 0.93 for the classification of X-ray images. Our proposed approach shows its superiority over the existing methods for the diagnosis of the COVID-19 from the X-ray images.
研究动机与目标
- 开发一个自动化的 CAD 系统,用于从胸部 X 光图像中区分 COVID-19、Normal 和 Pneumonia。
- 从公开来源创建和整理一个 COVID-19 X 射线数据集(COVID19CXr)。
- 设计一个堆叠式 CNN 框架,以利用多样化的子模型来提升诊断性能。
提出的方法
- 构建 CovNet30,一个从头开始在 X 光数据上训练的 30 层 CNN。
- 在 X 射线数据集上对一个预训练的 VGG19 模型进行微调。
- 在训练过程中从 CovNet30 和 VGG19 生成五个子模型。
- 使用逻辑回归对子模型预测进行堆叠,以形成最终的堆叠分类器。
- 使用 5 折交叉验证进行评估,指标包括准确率、灵敏度、特异性、PPV、F1 和 AUC。
实验结果
研究问题
- RQ1堆叠式 CNN 集成是否能在胸部 X 光上相较于单独模型提高多类(COVID-19、Normal、Pneumonia)的诊断准确性?
- RQ2在 COVID19CXr 数据集上,堆叠模型的诊断性能(灵敏度、特异性、准确率、PPV、F1、AUC)是多少?
- RQ3所提出的方法与独立的 CovNet30 和 VGG19 模型相比如何?
- RQ4在不同折之间,模型是否对类别不均衡和 COVID-19 样本量较小具有鲁棒性?
主要发现
| Fold | Sensitivity (%) | Specificity (%) | Accuracy (%) | Err ± CI (%) | PPV (%) | F1-Score | AUC ± CI |
|---|---|---|---|---|---|---|---|
| Fold1 | 95.5 | 98.19 | 96.94 | 3.06 ± 1.42 | 97.69 | 0.97 | 0.989 ± 0.003 |
| Fold2 | 92.66 | 94.97 | 91.44 | 8.56 ± 2.39 | 91.32 | 0.92 | 0.982 ± 0.015 |
| Fold3 | 91.45 | 95.01 | 91.34 | 8.66 ± 2.35 | 92.13 | 0.92 | 0.982 ± 0.011 |
| Fold4 | 92.47 | 94.77 | 90.22 | 9.78 ± 2.48 | 85.97 | 0.88 | 0.977 ± 0.023 |
| Fold5 | 94.59 | 96.12 | 93.74 | 6.26 ± 2.02 | 93.54 | 0.94 | 0.981 ± 0.009 |
- 在 5 折中平均准确率为 92.74%。
- 平均灵敏度为 93.33%,平均特异性为 95.81%。
- 平均 PPV 为 92.13–92.74%,F1 分数为 0.93。
- COVID-19 类的平均 AUC 为 0.994,含置信区间;总体平均 AUC 为 0.984。
- 堆叠式 CNN 的表现优于 CovNet30 和 VGG19 的独立模型。
- 各子模型在不同折中的表现各不相同,而堆叠模型取得了最佳结果。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。