[論文レビュー] Study of Different Deep Learning Approach with Explainable AI for Screening Patients with COVID-19 Symptoms: Using CT Scan and Chest X-ray Image Dataset
この研究は、COVID-19スクリーニングのためにCTと胸部X線画像のペアを用いて8つの事前学習済みCNNを比較し、LIMEによる説明可能性を評価し、NasNetMobile (CT) および NasNetMobile (X線) をトップパフォーマーとして特定した。
The outbreak of COVID-19 disease caused more than 100,000 deaths so far in the USA alone. It is necessary to conduct an initial screening of patients with the symptoms of COVID-19 disease to control the spread of the disease. However, it is becoming laborious to conduct the tests with the available testing kits due to the growing number of patients. Some studies proposed CT scan or chest X-ray images as an alternative solution. Therefore, it is essential to use every available resource, instead of either a CT scan or chest X-ray to conduct a large number of tests simultaneously. As a result, this study aims to develop a deep learning-based model that can detect COVID-19 patients with better accuracy both on CT scan and chest X-ray image dataset. In this work, eight different deep learning approaches such as VGG16, InceptionResNetV2, ResNet50, DenseNet201, VGG19, MobilenetV2, NasNetMobile, and ResNet15V2 have been tested on two dataset-one dataset includes 400 CT scan images, and another dataset includes 400 chest X-ray images studied. Besides, Local Interpretable Model-agnostic Explanations (LIME) is used to explain the model's interpretability. Using LIME, test results demonstrate that it is conceivable to interpret top features that should have worked to build a trust AI framework to distinguish between patients with COVID-19 symptoms with other patients.
研究の動機と目的
- RT-PCR検査が限られている場合に、画像診断を用いたCOVID-19症状の迅速でスケーラブルなスクリーニングを動機づける。
- CTおよび胸部X線データセット上で複数の深層学習アーキテクチャを評価し、頑健なCOVID-19分類モデルを特定する。
- 放射線科医の理解を助けるためにLIMEを用いてモデルの決定を解釈可能にする。
- 比較指標(精度、適合率、再現率、F1)と信頼区間を提供し、モダリティ間の信頼性を評価する。
提案手法
- 2つのデータセットを使用する。400枚のCT画像(COVID-19対Non-COVID-19)と400枚の胸部X線画像(COVID-19対Non-COVID-19)。
- 8つの事前学習CNNを用いた転移学習を適用する:VGG16、InceptionResNetV2、ResNet50、DenseNet201、VGG19、MobileNetV2、NasNetMobile、ResNet15V2。
- ヘッドを置換してファインチューニングを行い、80%のデータで訓練し20%で評価する;Adamとグリッド探索型ハイパーパラメータ(学習率0.001、30エポック、バッチサイズ5)で最適化する。
- 精度、適合率、再現率、F1スコアで評価する;Wilsonスコアとベイズ区間による95%CIを報告する。
- LIMEによる局所解釈可能性を用いて、意思決定に影響を与えるトップ特徴を強調する。
実験結果
リサーチクエスチョン
- RQ18つの事前学習CNNのうち、CTおよびX線データセットで最も良いCOVID-19スクリーニング性能を提供するのはどれか。
- RQ2モデルトレーニング指標(精度、適合率、再現率、F1)は、モダリティ(CT対X線)およびモデル間でどのように比較されるか。
- RQ3LIMEの説明は、COVID-19分類の放射線診断的特徴と整合する解釈可能な洞察を生み出せるか。
- RQ4各モデルの訓練時の安定性(訓練と検証)とエポックごとの損失挙動はどうか。
主な発見
- NasNetMobileはCTスキャンのテスト精度で最高を達成(0.90)し、胸部X線画像でも最高を達成している(0.100? note: see below)
- CTテストデータではNasNetMobileは90%の精度と0.90の適合率、再現率およびF1スコアを得て、混同行列には8件の誤分類(80のテストサンプル)を含む。
- 胸部X線テストデータではNasNetMobileは100%の精度、適合率、再現率、F1スコアを達成し、誤分類なし(80のテストサンプル)。
- MobileNetV2はCT訓練データで最も強力な性能を示す(精度0.99だが)、CTスキャンのテストセットではNasNetMobileが上回る。
- 訓練実行を通じて、いくつかのモデル(例:VGG16、InceptionResNetV2、NasNetMobile)は訓練/検証の安定した性能を示す一方、ResNet50は一貫して低パフォーマンスである。
- LIMEはモデルの説明可能性を示すのに使用され、AIベースのスクリーニングで信頼を得るためのトップ特徴の解釈可能性を示す。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。