[論文レビュー] COVIDGR dataset and COVID-SDNet methodology for predicting COVID-19 based on Chest X-Ray images
本稿では、4つのCOVID-19重症度レベルにラベルが付与された、バランスの取れた均質な852枚の後前位撮影胸部レントゲン(CXR)画像からなるCOVIDGR-1.0データセットを紹介するとともに、セグメンテーション、データ拡張、特徴変換を統合したディーブラーニングフレームワークであるCOVID-SDNet手法を提案する。本手法は重症例で97.72%の正確性を達成し、特に中等症および重症例において優れた汎化性能を示し、早期発見のための信頼性の高いトリアージを可能にする。
Currently, Coronavirus disease (COVID-19), one of the most infectious diseases in the 21st century, is diagnosed using RT-PCR testing, CT scans and/or Chest X-Ray (CXR) images. CT (Computed Tomography) scanners and RT-PCR testing are not available in most medical centers and hence in many cases CXR images become the most time/cost effective tool for assisting clinicians in making decisions. Deep learning neural networks have a great potential for building COVID-19 triage systems and detecting COVID-19 patients, especially patients with low severity. Unfortunately, current databases do not allow building such systems as they are highly heterogeneous and biased towards severe cases. This paper is three-fold: (i) we demystify the high sensitivities achieved by most recent COVID-19 classification models, (ii) under a close collaboration with Hospital Universitario Clínico San Cecilio, Granada, Spain, we built COVIDGR-1.0, a homogeneous and balanced database that includes all levels of severity, from normal with Positive RT-PCR, Mild, Moderate to Severe. COVIDGR-1.0 contains 426 positive and 426 negative PA (PosteroAnterior) CXR views and (iii) we propose COVID Smart Data based Network (COVID-SDNet) methodology for improving the generalization capacity of COVID-classification models. Our approach reaches good and stable results with an accuracy of $97.72\% \pm 0.95 \%$, $86.90\% \pm 3.20\%$, $61.80\% \pm 5.49\%$ in severe, moderate and mild COVID-19 severity levels (Paper accepted for publication in Journal of Biomedical and Health Informatics). Our approach could help in the early detection of COVID-19. COVIDGR-1.0 along with the severity level labels are available to the scientific community through this link https://dasci.es/es/transferencia/open-data/covidgr/.
研究の動機と目的
- CXR画像を用いたCOVID-19分類の分野において、バランスの取れた、均質的で臨床的に関連性のあるデータセットが不足しているという問題に対処すること。
- 現在のベンチマークにおけるデータバイアスと不均衡の影響を明らかにすることで、既存のディーブラーニングモデルの誇張された感受性の主張を解明すること。
- COVID-19のあらゆる重症度レベルで性能が向上する、強固で汎化性の高いディーブラーニング手法(COVID-SDNet)の開発。
- Grad-CAMに基づく注目マップと対向説明を通じて、臨床的信頼性と検証を可能にする解釈可能な予測を提供すること。
- 高い信頼性を持つトリアージ対応システムを用いて、中等症および重症例の早期検出を可能にすること。
提案手法
- 著者らは、グランダのHospital Universitario Clínico San Cecilioと密接に協力して、4つの重症度レベル(正常(RT-PCR陽性)、軽症、中等症、重症)に均等に分布するようにCOVIDGR-1.0データセットを構築した。
- データセットは、426枚の陽性および426枚の陰性のPAビューCXR画像を含み、画像の重症度は放射線学的整合性を保つために改訂されたRALEスコアを用いてラベル付けされた。
- 提案されたCOVID-SDNet手法は、3つのコアコンponentを統合している:(1) 肺領域の意味的セグメンテーション、(2) 少数クラスの強化を目的とした生成的対抗ネットワーク(GAN)を用いたデータ拡張、(3) 病変領域に注目を向けるためのアテンション機構を用いた特徴変換。
- モデルの解釈可能性は、適応されたGrad-CAM手法により達成され、予測に影響を与える画像領域を強調するヒートマップと、逆クラスの対向説明が生成される。
- フレームワークは5分割交差検証を用いて訓練および評価され、性能は重症度レベルごとに正確性、感受性、特異性で測定された。
- モデルの重症度レベルにわたる汎化能力が評価され、特に視覚的特徴が乏しい軽症および正常例において重点が置かれた。
実験結果
リサーチクエスチョン
- RQ1現在のCOVID-19分類のためのディーブラーニングモデルは、どのようにして高い感受性を達成しているのか。また、データの不均衡と不均一性は、これらの結果にどのような役割を果たしているのか。
- RQ2バランスの取れた、均質的で臨床的にアノテートされたCXRデータセットは、COVID-19検出のためのディーブラーニングモデルの汎化性能と信頼性を向上させることができるか。
- RQ3COVID-SDNetフレームワークにおけるセグメンテーション、データ拡張、特徴変換の統合は、病変の重症度レベルに応じたモデル性能と頑健性を向上させるか。
- RQ4注目ベースの解釈可能性手法(例:Grad-CAM)は、CXR画像のAI診断システムにおける臨床的信頼性をどの程度向上させることができるか。
- RQ5提案された手法は、中等症および重症例を効果的に検出できるか。また、軽症および正常(PCR陽性)例においても安定性を維持できるか。
主な発見
- COVIDGR-1.0データセットは、4つの重症度レベルにわたり、陽性426枚、陰性426枚のバランスの取れた分布を達成しており、既存のデータセットと比較して顕著にバイアスが低減されている。
- COVID-SDNetモデルは、重症例で97.72% ± 0.95%の正確性、中等症例で86.90% ± 3.20%、軽症例で61.80% ± 5.49%を達成し、重症および中等症疾患において優れた性能を示している。
- モデルは特に、明確な病変所見(例:実質化、ガラス状混濁)が存在する重症および中等症例において、高い汎化能力を示している。
- Grad-CAMヒートマップを用いた解釈可能性分析により、モデルが肺浸潤、実質化、関節症などの注目領域を正しく同定していることが確認され、注目マップが放射線学的所見と一致している。
- 対向説明により、モデルの予測が頑健であり、逆クラスの予測が明確で臨床的に妥当な解剖的領域によって駆動されていることが判明し、モデルの透明性が向上した。
- データセットおよび手法はhttps://dasci.es/es/transferencia/open-data/covidgr/で公開されており、再現性および今後の研究を支援している。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。