[論文レビュー] A cascade network for Detecting COVID-19 using chest x-rays
本論文はCascade-SEMEnetを提案する。2段階のCascadeとしてSEME-ResNet50とSEME-DenseNet169を組み合わせ、胸部X線画像から肺炎タイプを検出し、COVID-19を含むCOVID-19を細かく分類する。Grad-CAMの視覚化を用いて解釈性を提供する。
The worldwide spread of pneumonia caused by a novel coronavirus poses an unprecedented challenge to the world's medical resources and prevention and control measures. Covid-19 attacks not only the lungs, making it difficult to breathe and life-threatening, but also the heart, kidneys, brain and other vital organs of the body, with possible sequela. At present, the detection of COVID-19 needs to be realized by the reverse transcription-polymerase Chain Reaction (RT-PCR). However, many countries are in the outbreak period of the epidemic, and the medical resources are very limited. They cannot provide sufficient numbers of gene sequence detection, and many patients may not be isolated and treated in time. Given this situation, we researched the analytical and diagnostic capabilities of deep learning on chest radiographs and proposed Cascade-SEMEnet which is cascaded with SEME-ResNet50 and SEME-DenseNet169. The two cascade networks of Cascade - SEMEnet both adopt large input sizes and SE-Structure and use MoEx and histogram equalization to enhance the data. We first used SEME-ResNet50 to screen chest X-ray and diagnosed three classes: normal, bacterial, and viral pneumonia. Then we used SEME-DenseNet169 for fine-grained classification of viral pneumonia and determined if it is caused by COVID-19. To exclude the influence of non-pathological features on the network, we preprocessed the data with U-Net during the training of SEME-DenseNet169. The results showed that our network achieved an accuracy of 85.6\% in determining the type of pneumonia infection and 97.1\% in the fine-grained classification of COVID-19. We used Grad-CAM to visualize the judgment based on the model and help doctors understand the chest radiograph while verifying the effectivene.
研究の動機と目的
- RT-PCRリソースが限られている状況で胸部X線撮影を活用してCOVID-19の迅速なスクリーニングを動機づける。
- 最初に正常、細菌性肺炎、ウイルス性肺炎を分類し、次にウイルス性肺炎を細かく分類してCOVID-19を検出する2段階カスケードネットワークを開発する。
- グローバル平均プーリング、SEアテンションモジュール、大きな入力サイズ、CLAHE、MoEx、U-Netベースの肺マスクで性能を向上させる。
- Grad-CAM視覚化を通じてモデルの解釈性を提供し、臨床意思決定を支援する。
提案手法
- Cascade-SEMEnetをSEME-ResNet50とSEME-DenseNet169で構築する。
- 病変の詳細を保持し受容野を広げるために、より大きな入力サイズとグローバル平均プーリングを使用する。
- ResNet50とDenseNet169のブランチにSqueeze-and-Excitation (SE)アテンションを組み込む。
- CLAHEを適用してコントラストを強化し、MoExデータ拡張を用いて異なる病理カテゴリーからの特徴を融合する。
- 訓練中に非病理的特徴を除去するためにU-Netを用いて肺領域をセグメントする。
- Grad-CAMを使って胸部X線に基づく分類根拠を視覚化する。
実験結果
リサーチクエスチョン
- RQ12段階カスケードネットワークは胸部X線から正常、細菌性肺炎、ウイルス性肺炎を正確に区別できるか?
- RQ2細粒度なウイルス性肺炎段階は他のウイルス性肺炎の中からCOVID-19を識別できるか?
- RQ3データ拡張(MoEx、CLAHE)とアテンション機構は胸部X線データの肺炎分類性能を改善するか?
- RQ4U-Netによる肺領域マスキングは非病理的特徴を除去して診断精度を向上させるか?
主な発見
| モデル | 精度 | F1スコア |
|---|---|---|
| VGG19 | 69.69% | 0.70 |
| ResNet50 | 72.81% | 0.73 |
| DenseNet169 | 77.50% | 0.78 |
| VGG19-GAP | 77.81% | 0.78 |
| ResNet50-GAP | 74.06% | 0.74 |
| DenseNet169-GAP | 80.94% | 0.81 |
| SE-ResNet50 | 81.59% | 0.82 |
| SE-DenseNet169 | 81.87% | 0.81 |
| SEME-ResNet50 | 85.62% | 0.86 |
| SEME-DenseNet169 | 80.31% | 0.81 |
- ベースモデル(VGG19、ResNet50、DenseNet169)は肺炎タイプ分類の精度にばらつきがあり、DenseNet169がそれらの中で最も良い性能を示す。
- グローバル平均プーリング(GAP)とSEアテンションを追加すると、モデル全体の精度とROC指標が改善される。
- SEME-ResNet50は、テストセットでの85.6%の精度、AUC 0.904で実験した構成の中で最高の精度とROC性能を達成する。Grad-CAM視覚は決定領域を肺領域に局在させる。
- SEME-DenseNet169も高い性能を示す(GAP/SEバッグで80.3%のテスト精度、AUCは図に記載)。
- ベースラインと比較して、SEME構成はウイルス性肺炎およびCOVID-19区分での精度とF1スコアを大幅に改善し、Grad-CAMはモデルの注意が肺領域と一致していることを確認する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。