QUICK REVIEW

[論文レビュー] COVID-CT-Dataset: A CT Scan Dataset about COVID-19

Yang, Xingyi, Xuehai He|arXiv (Cornell University)|Mar 30, 2020

COVID-19 diagnosis using AI参考文献 21被引用数 728

ひとこと要約

この論文は COVID-CT、COVID-19 のオープンソース CT 画像データセットを提示し、マルチタスク学習とコントラスト自己教師付き学習を用いて CT ベースの診断モデルを訓練する際の臨床的に有用な性能を達成することを示す。

ABSTRACT

During the outbreak time of COVID-19, computed tomography (CT) is a useful manner for diagnosing COVID-19 patients. Due to privacy issues, publicly available COVID-19 CT datasets are highly difficult to obtain, which hinders the research and development of AI-powered diagnosis methods of COVID-19 based on CTs. To address this issue, we build an open-sourced dataset -- COVID-CT, which contains 349 COVID-19 CT images from 216 patients and 463 non-COVID-19 CTs. The utility of this dataset is confirmed by a senior radiologist who has been diagnosing and treating COVID-19 patients since the outbreak of this pandemic. We also perform experimental studies which further demonstrate that this dataset is useful for developing AI-based diagnosis models of COVID-19. Using this dataset, we develop diagnosis methods based on multi-task learning and self-supervised learning, that achieve an F1 of 0.90, an AUC of 0.98, and an accuracy of 0.89. According to the senior radiologist, models with such performance are good enough for clinical usage. The data and code are available at https://github.com/UCSD-AI4H/COVID-CT

研究の動機と目的

CT からの AI ベースの COVID-19 診断を促進・実現する公開データセットを提供する。
論文由来の COVID-19 CT 画像が CT ベースの分類器の訓練に効果的かどうかを評価する。
マスキングを用いたガイダンスと自己監督表現を用いて診断精度を向上させる方法を開発する。
結果として得られたモデルの臨床的有用性を放射線科医と共に検証する。
論文抽出版の CT 画像と元の CT 画像での訓練を比較し、データ品質の影響を理解する。

提案手法

論文の図とキャプションから COVID-19 陽性 CT を組み合わせ、訓練用に公開ソースから陰性 CT を収集する。
ImageNet で事前学習した DenseNet-169 および ResNet-50 のファインチューニングを用いて分類器を評価する。
COVID-CT-349（論文抽出）、COVID-Seg（元画像）、COVID-CT-118（サブセット）での訓練を比較し、データ品質の影響を調査する。
肺マスクと病変マスクをマルチタスク学習に組み込み、関連領域への注意を導く。
対照的自己教師あり学習（CSSL）を適用して、監督付きファインチューニング前に表現を事前訓練する。
テスト設定にはマルチタスク学習（肺マスク/病変マスク）と CSSL の事前学習を含め、精度、F1、AUC を報告する。

実験結果

リサーチクエスチョン

RQ1論文から抽出した CT 画像は、元の CT と比較して CT ベースの COVID-19 診断モデルの訓練に有用ですか？
RQ2陽性の COVID-19 CT データ量を増やすことは、診断性能を大幅に改善しますか？
RQ3肺マスクと病変マスクを組み込むことで、CT 画像でのCOVID-19検出モデルの性能は向上しますか？
RQ4対照的自己教師付き事前学習は、標準的な転移学習を超えた COVID-19 CT 診断の性能向上をもたらしますか？
RQ5得られたモデルの性能は、上級放射線科医によって臨床的に有用とされますか？

主な発見

Model	Positive training data	Accuracy (%)	F1-score (%)	AUC (%)
DenseNet-169	COVID-Seg	69.8	61.1	86.9
DenseNet-169	COVID-CT-349	79.5	76.0	90.1
DenseNet-169	COVID-CT-118	57.8	36.3	75.2
ResNet-50	COVID-Seg	66.3	58.1	80.6
ResNet-50	COVID-CT-349	77.4	74.6	86.4
ResNet-50	COVID-CT-118	60.4	42.6	74.1

COVID-CT-349（論文抽出画像）は、両方のネットワークにとって COVID-Seg（元画像）よりはるかに良い性能を示す。
陽性訓練データを118から349へ増やすと、精度、F1、および AUC が有意に向上する。
肺マスクと病変マスクの両方が性能を向上させ、組み合わせマスクが最良の結果をもたらす。
対照的自己教師あり学習と転移学習を組み合わせた CSSL+TL は、TL のみやランダム初期化よりも性能が上回る。
結合データセットでは、CSSL+TL が F1=0.89–0.90、AUC=0.98、accuracy=0.89 を達成し、上級放射線科医によって臨床的に有用と見なされる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。