[論文レビュー] Stacked Convolutional Neural Network for Diagnosis of COVID-19 Disease from X-ray Images
この論文は、COVID-19 X 線データセットで訓練され、ロジスティック回帰と組み合わせるスタック型CNNアンサンブル(CovNet30 + VGG19サブモデル)を導入し、COVID-19、Normal、Pneumoniaを高精度で分類します。
Automatic and rapid screening of COVID-19 from the chest X-ray images has become an urgent need in this pandemic situation of SARS-CoV-2 worldwide in 2020. However, accurate and reliable screening of patients is a massive challenge due to the discrepancy between COVID-19 and other viral pneumonia in X-ray images. In this paper, we design a new stacked convolutional neural network model for the automatic diagnosis of COVID-19 disease from the chest X-ray images. We obtain different sub-models from the VGG19 and developed a 30-layered CNN model (named as CovNet30) during the training, and obtained sub-models are stacked together using logistic regression. The proposed CNN model combines the discriminating power of the different CNN`s sub-models and classifies chest X-ray images into COVID-19, Normal, and Pneumonia classes. In addition, we generate X-ray images dataset referred to as COVID19CXr, which includes 2764 chest x-ray images of 1768 patients from the three publicly available data repositories. The proposed stacked CNN achieves an accuracy of 92.74%, the sensitivity of 93.33%, PPV of 92.13%, and F1-score of 0.93 for the classification of X-ray images. Our proposed approach shows its superiority over the existing methods for the diagnosis of the COVID-19 from the X-ray images.
研究の動機と目的
- 胸部X線画像からCOVID-19、Normal、Pneumoniaを識別する自動CADシステムを開発する。
- 公的ソースからCOVID-19 X線データセット(COVID19CXr)を作成・整理する。
- 多様なサブモデルを活用して診断性能を向上させるスタック型CNNフレームワークを設計する。
提案手法
- X線データ上でスクラッチから訓練された30層CNNであるCovNet30を構築する。
- X線データセットで事前学習済みVGG19モデルをファインチューニングする。
- 訓練中にCovNet30とVGG19から5つのサブモデルを生成する。
- ロジスティック回帰を用いてサブモデルの予測をスタックし、最終的なスタック分類器を形成する。
- 5分割交差検証を用いて評価し、精度、感度、特異度、PPV、F1、AUCなどの指標を算出する。
実験結果
リサーチクエスチョン
- RQ1スタック型CNNアンサンブルは、単一モデルと比較して胸部X線からのCOVID-19、Normal、Pneumoniaの多クラス診断精度を向上させることができるか?
- RQ2COVID19CXrデータセットにおけるスタック型モデルの診断性能(感度、特異度、精度、PPV、F1、AUC)はどの程度か?
- RQ3提案手法は単独のCovNet30およびVGG19モデルとどう比較されるか?
- RQ4小規模なCOVID-19サンプルサイズとクラス不均衡に関して、フォールド間でモデルは頑健か?
主な発見
| Fold | 感度 (%) | 特異度 (%) | 精度 (%) | 誤差 ± CI (%) | PPV (%) | F1-スコア | AUC ± CI |
|---|---|---|---|---|---|---|---|
| Fold1 | 95.5 | 98.19 | 96.94 | 3.06 ± 1.42 | 97.69 | 0.97 | 0.989 ± 0.003 |
| Fold2 | 92.66 | 94.97 | 91.44 | 8.56 ± 2.39 | 91.32 | 0.92 | 0.982 ± 0.015 |
| Fold3 | 91.45 | 95.01 | 91.34 | 8.66 ± 2.35 | 92.13 | 0.92 | 0.982 ± 0.011 |
| Fold4 | 92.47 | 94.77 | 90.22 | 9.78 ± 2.48 | 85.97 | 0.88 | 0.977 ± 0.023 |
| Fold5 | 94.59 | 96.12 | 93.74 | 6.26 ± 2.02 | 93.54 | 0.94 | 0.981 ± 0.009 |
- 5 Fold全体の平均精度は92.74%。
- 平均感度93.33%、平均特異度95.81%。
- 平均PPVは92.13–92.74%、F1スコアは0.93。
- COVID-19クラスの平均AUCは0.994(CIを含む)、全体の平均AUCは0.984。
- スタック型CNNはCovNet30およびVGG19の単独モデルを上回る。
- サブモデルはfoldごとに性能が異なるが、スタック型モデルが最良の結果を出す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。