QUICK REVIEW

[論文レビュー] Towards computer-aided severity assessment: training and validation of deep neural networks for geographic extent and opacity extent scoring of chest X-rays for SARS-CoV-2 lung disease severity

Alexander Wong, Zhong Qiu Lin|arXiv (Cornell University)|May 26, 2020

COVID-19 diagnosis using AI参考文献 23被引用数 28

ひとこと要約

本研究では、胸部レントゲン画像を用いてSARS-CoV-2肺疾患の重症度を自動的に評価するための深層学習システム、COVIDNet-Sの提案と検証を行った。396例のCXRsで訓練され、層別モンテカルロ交差検証を用いて評価されたモデルは、地理的広がりと透明度広がりの両方でそれぞれR²スコア0.664および0.635を達成した。最高のモデルではR²が0.739および0.741に達し、コンピュータ支援の重症度スコアリングにおける強力な可能性を示している。

ABSTRACT

Background: A critical step in effective care and treatment planning for severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) is the assessment of the severity of disease progression. Chest x-rays (CXRs) are often used to assess SARS-CoV-2 severity, with two important assessment metrics being extent of lung involvement and degree of opacity. In this proof-of-concept study, we assess the feasibility of computer-aided scoring of CXRs of SARS-CoV-2 lung disease severity using a deep learning system. Materials and Methods: Data consisted of 396 CXRs from SARS-CoV-2 positive patient cases. Geographic extent and opacity extent were scored by two board-certified expert chest radiologists (with 20+ years of experience) and a 2nd-year radiology resident. The deep neural networks used in this study, which we name COVIDNet-S, are based on a COVID-Net network architecture. 100 versions of the network were independently learned (50 to perform geographic extent scoring and 50 to perform opacity extent scoring) using random subsets of CXRs from the study, and evaluated the networks using stratified Monte Carlo cross-validation experiments. Findings: The COVIDNet-S deep neural networks yielded R$^2$ of 0.664 $\pm$ 0.001 and 0.635 $\pm$ 0.002 between predicted scores and radiologist scores for geographic extent and opacity extent, respectively, in stratified Monte Carlo cross-validation experiments. The best performing networks achieved R$^2$ of 0.739 and 0.741 between predicted scores and radiologist scores for geographic extent and opacity extent, respectively. Interpretation: The results are promising and suggest that the use of deep neural networks on CXRs could be an effective tool for computer-aided assessment of SARS-CoV-2 lung disease severity, although additional studies are needed before adoption for routine clinical use.

研究の動機と目的

胸部レントゲン画像を用いたSARS-CoV-2肺疾患の重症度を自動的に評価するコンピュータ支援システムの開発。
深層ニューラルネットワークが放射線科医が評価した重症度指標（地理的広がりおよび透明度広がり）を予測する可能性の評価。
専門家がアノテートしたスコアを有する396例のSARS-CoV-2陽性CXRsの多様なセットを用いた深層学習モデルの訓練および検証。
層別モンテカルロ交差検証を用いてモデルの性能を評価し、妥当性と一般化能力を確保。

提案手法

重症度スコアリングタスクに適応された深層ニューラルネットワークアーキテクチャ、COVIDNet-Sを、元のCOVID-Netから変更して使用した。
地理的広がりスコアリング用と透明度広がりスコアリング用の2つの別々のモデルを訓練した。それぞれ50個の独立したネットワークバージョンを用いた。
396例のCXRsのランダムサブセットを用いて各ネットワークバージョンを訓練し、多様で代表的な学習を確保した。
モデル性能の評価に層別モンテカルロ交差検証を適用し、訓練およびテスト分割の両方でクラス分布を維持した。
予測スコアと放射線科医が評価したスコアの間の決定係数（R²）を用いてモデル性能を定量化した。
2名のボード資格を有する放射線科医と1名のレジデントが、すべてのCXRsについて地理的広がりおよび透明度広がりを独立してスコア付けし、基準値を確立した。

実験結果

リサーチクエスチョン

RQ1深層ニューラルネットワークは、SARS-CoV-2陽性患者の肺への影響範囲の放射線科医が評価した地理的広がりを、CXRsを用いて正確に予測できるか？
RQ2深層ニューラルネットワークは、SARS-CoV-2に影響を受ける肺の透明度広がりをCXRsから信頼性高く推定できるか？
RQ3異なるランダムな訓練サブセットおよび交差検証イタレーションにおいて、モデルの性能はどのように変動するか？
RQ4このようなモデルが、専門家がアノテートした重症度指標を予測する際の上限性能はどの程度か？
RQ5深層学習システムは、SARS-CoV-2肺疾患の重症度スコアリングにおける評価者間ばらつきをどの程度低減できるか？

主な発見

深層学習モデルであるCOVIDNet-Sは、予測スコアと放射線科医が評価した地理的広がりスコアの間に平均R²0.664 ± 0.001を達成した。
透明度広がりスコアリングに関しては、層別モンテカルロ交差検証実験全体で平均R²0.635 ± 0.002を達成した。
最も優れた個々のネットワークバージョンでは、地理的広がりスコアリングでR²0.739、透明度広がりスコアリングでR²0.741を達成した。
上位モデルの高いR²値は、専門家評価と強い相関があることを示しており、強力な予測能力を示している。
結果から、CXRsにおけるSARS-CoV-2肺疾患の自動的・コンピュータ支援の重症度スコアリングに深層学習を用いることが実現可能であることが示された。
強力な性能を示したものの、臨床的導入のためにはさらなる検証が必要であると結論づけた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。