Skip to main content
QUICK REVIEW

[論文レビュー] CVR-Net: A deep convolutional neural network for coronavirus recognition from chest radiography images

Md. Kamrul Hasan, Md. Ashraful Alam|arXiv (Cornell University)|Jul 21, 2020
COVID-19 diagnosis using AI参考文献 60被引用数 27
ひとこと要約

CVR-Net は、胸部X線およびCT画像からのコロナウイルス感染症のエンドツーエンド認識を目的としたマルチスケール・マルチエンコーダー集合型畳み込みニューラルネットワークである。転移学習、データ増強、クラスバランス処理を活用することで、限られた学習データでも高い頑健性を示し、2クラス分類タスクにおいてF1スコア0.997、正解率0.998の最先端の性能を達成した。

ABSTRACT

The novel Coronavirus Disease 2019 (COVID-19) is a global pandemic disease spreading rapidly around the world. A robust and automatic early recognition of COVID-19, via auxiliary computer-aided diagnostic tools, is essential for disease cure and control. The chest radiography images, such as Computed Tomography (CT) and X-ray, and deep Convolutional Neural Networks (CNNs), can be a significant and useful material for designing such tools. However, designing such an automated tool is challenging as a massive number of manually annotated datasets are not publicly available yet, which is the core requirement of supervised learning systems. In this article, we propose a robust CNN-based network, called CVR-Net (Coronavirus Recognition Network), for the automatic recognition of the coronavirus from CT or X-ray images. The proposed end-to-end CVR-Net is a multi-scale-multi-encoder ensemble model, where we have aggregated the outputs from two different encoders and their different scales to obtain the final prediction probability. We train and test the proposed CVR-Net on three different datasets, where the images have collected from different open-source repositories. We compare our proposed CVR-Net with state-of-the-art methods, which are trained and tested on the same datasets. We split three datasets into five different tasks, where each task has a different number of classes, to evaluate the multi-tasking CVR-Net. Our model achieves an overall F1-score & accuracy of 0.997 & 0.998; 0.963 & 0.964; 0.816 & 0.820; 0.961 & 0.961; and 0.780 & 0.780, respectively, for task-1 to task-5. As the CVR-Net provides promising results on the small datasets, it can be an auspicious computer-aided diagnostic tool for the diagnosis of coronavirus to assist the clinical practitioners and radiologists. Our source codes and model are publicly available at https://github.com/kamruleee51/CVR-Net.

研究の動機と目的

  • 遅延が大きくコストも高いRT-PCR検査に依存しない、自動的で信頼性が高く早期のCOVID-19検出を実現する必要性に対応する。
  • 教師あり深層学習モデルの学習に必要な、公開可能で手作業でアノテートされた医療画像データセットが限られているという課題を克服する。
  • クラスの不均衡や小規模な学習データセットに対しても一般化可能な、頑健なエンドツーエンドの深層学習システムの開発を目的とする。
  • パンデミック期における臨床意思決定を支援するため、偽陰性予測を最小限に抑えること。特にリソースが限られた環境において重要である。
  • 研究の加速とAIベースのCADツールの臨床的導入を促進するため、公開可能で再現性のあるモデルを提供する。

提案手法

  • CVR-Net を提案する。これは、複数のスケールで2つの異なるエンコーダーブランチからの特徴を統合するマルチスケール・マルチエンコーダー集合型畳み込みニューラルネットワークアーキテクチャであり、特徴表現の向上を図る。
  • ImageNetで事前学習済み重みを初期値として使用することで、小規模な医療画像データセット上でも特徴の学習を向上させる転移学習を採用する。
  • 回転、反転、スケーリングなどの広範なデータ増強技術を適用し、学習データの多様性を高め、過学習を低減する。
  • 多数クラスに偏るバイアスを軽減するため、クラス再バランス戦略を実装する。これは、陽性(COVID-19)例が極めて少ない状況において特に重要である。
  • 複数のスケールおよびエンコーダーからの予測をアンサンブル平均化することで統合し、モデルの頑健性と一般化性能を向上させる。
  • 3つのオープンソースデータセットを用いてエンドツーエンドでモデルを学習・評価し、クラス数が異なる5つの多クラス分類タスクに分割して評価した。

実験結果

リサーチクエスチョン

  • RQ1限られたアノテート済み学習データを前提とした場合でも、深層畳み込みニューラルネットワークベースのモデルが、胸部X線およびCT画像からのCOVID-19分類において高い正解率と低い偽陰性率を達成できるか?
  • RQ2全学習サンプル数を一定に保った状態で、クラス数が増加する(例:2クラス vs. 4クラス)場合、CVR-Netの性能はどのように変化するか?
  • RQ31本のブランチを持つモデルと比較して、マルチスケール・マルチエンコーダー特徴統合は、認識の頑健性をどの程度向上させるか?
  • RQ4データ増強およびクラス再バランス処理は、小規模な医療画像データセットにおけるクラス不均衡の影響をどの程度軽減できるか?
  • RQ5ImageNetからの転移学習は、リソースが限られた医療画像分類タスクにおけるコロナウイルス検出の性能を顕著に向上させられるか?

主な発見

  • CVR-Net は、2クラス分類タスク(COVID-19 対 陰性所見なし)において、F1スコア0.997、正解率0.998を達成し、小規模データセットでもほぼ完璧な性能を示した。
  • クラス数が増加するにつれて性能が低下した——4クラス分類タスク(COVID-19、正常、細菌性肺炎、ウイルス性肺炎)では、F1スコアが0.816、正解率が0.820に低下した。これは、クラス間の類似性が高まり、クラス内多様性が増加するためである。
  • 交差検証における各fold間の差が最小限に抑えられており、異なるデータ分割に対して強い頑健性と一般化性能を示した。
  • 正常クラスを「正常」と「肺炎(細菌性/ウイルス性)」に分割した場合、偽陰性予測が顕著に増加した。これは、限られた学習サンプルにおいてクラスの曖昧さが生じる課題を示している。
  • マルチスケール・マルチエンコーダー集合型アーキテクチャは、過学習および勾配消失の低減に効果を発揮し、小規模データセットでも高い性能を達成できた。
  • モデルの性能は、クラス分布と類似性に最も敏感であることが判明した。今後の改善は、より明確でバランスの取れた、かつセグメンテーションが施された学習サンプルの提供によって期待できる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。