[論文レビュー] DeepCOVIDExplainer: Explainable COVID-19 Predictions Based on Chest X-ray Images
DeepCOVIDExplainer は、Grad-CAM++ と LRP を用いた解釈可能性を備えた深層学習フレームワークを提案し、CXR 画像からの自動 COVID-19 検出を実現する。15,959枚の CXR 画像からなるデータセットにおいて、COVID-19 分類で 96.12% の陽性予測妥当性と 94.6% の F1 スコアを達成し、高い精度と臨床的解釈可能性を示した。
Amid the coronavirus disease(COVID-19) pandemic, humanity experiences a rapid increase in infection numbers across the world. Challenge hospitals are faced with, in the fight against the virus, is the effective screening of incoming patients. One methodology is the assessment of chest radiography(CXR) images, which usually requires expert radiologist's knowledge. In this paper, we propose an explainable deep neural networks(DNN)-based method for automatic detection of COVID-19 symptoms from CXR images, which we call DeepCOVIDExplainer. We used 15,959 CXR images of 15,854 patients, covering normal, pneumonia, and COVID-19 cases. CXR images are first comprehensively preprocessed, before being augmented and classified with a neural ensemble method, followed by highlighting class-discriminating regions using gradient-guided class activation maps(Grad-CAM++) and layer-wise relevance propagation(LRP). Further, we provide human-interpretable explanations of the predictions. Evaluation results based on hold-out data show that our approach can identify COVID-19 confidently with a positive predictive value(PPV) of 91.6%, 92.45%, and 96.12%; precision, recall, and F1 score of 94.6%, 94.3%, and 94.6%, respectively for normal, pneumonia, and COVID-19 cases, respectively, making it comparable or improved results over recent approaches. We hope that our findings will be a useful contribution to the fight against COVID-19 and, in more general, towards an increasing acceptance and adoption of AI-assisted applications in the clinical practice.
研究の動機と目的
- 放射線科医の数が限られる医療現場における、COVID-19 患者の迅速かつ正確なスクリーニングの課題に対処すること。
- CXR 画像を正常、肺炎、COVID-19 の3クラスに分類するだけでなく、人間が理解可能な説明を提供する深層学習モデルの開発。
- 解釈可能な AI 技術を用いて CXR 画像内のクラス特徴を示す領域を強調することで、放射線学における AI の臨床的信頼性と採用促進。
- 正常、肺炎、COVID-19 の症例をカバーする、15,959枚の CXR 画像からなる大規模かつ多様なデータセットを用いた、モデルの性能評価。
提案手法
- CXR 画像の標準化と強化を前処理パイプラインで行い、増幅処理を実施する。
- 増幅済みの CXR 画像を用いて、神経ネットワークアンサンブルモデルを学習させ、正常、肺炎、COVID-19 の各クラスにおける汎化性とロバスト性を向上。
- Grad-CAM++ を適用し、予測意思決定に寄与する画像内の領域を特定するクラス特徴の活性化マップを生成。
- レイヤーごとの関連性プロパゲーション(LRP)を用いて、各画素が最終予測に与える寄与度をさらに分解・解釈。
- Grad-CAM++ と LRP の統合により、人間が読み取り可能な局所化された予測解釈が可能。
- ホールドアウトテストデータを用いて、精度、再現率、F1 スコア、陽性予測妥当性を用いた性能測定。
実験結果
リサーチクエスチョン
- RQ1解釈可能な AI 技術を備えた深層ニューラルネットワークアンサンブルは、CXR 画像を正常、肺炎、COVID-19 に分類する際に高い精度を達成できるか?
- RQ2Grad-CAM++ と LRP は、CXR 画像のモデル予測に対して、臨床的に意味のある解釈可能な説明をどの程度提供できるか?
- RQ3予測性能と解釈可能性の観点から、最近の手法と比較して、本手法はどのように差別化されるか?
- RQ4本モデルは、実臨床現場における多様な患者集団や画像変動に対しても、高い性能を維持できるか?
主な発見
- ホールドアウトテストデータにおいて、正常例で 91.6%、肺炎例で 92.45%、COVID-19 例で 96.12% の陽性予測妥当性(PPV)を達成。
- COVID-19 分類における適合率、再現率、F1 スコアはそれぞれ 94.6%、94.3%、94.6% であり、バランスの取れた高い性能を示した。
- Grad-CAM++ と LRP の統合により、疾患に関連する解剖学的領域を画像内で明確に強調でき、臨床的解釈可能性が向上した。
- 精度と解釈可能性の両面で、最近の最先端手法と同等またはそれ以上の性能を示した。
- 結果から、早期の COVID-19 スクリーニングにおける信頼性と解釈可能性を備えた予測を提供することで、臨床意思決定を支援できる可能性が示された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。