QUICK REVIEW

[論文レビュー] Computer Aided Detection for Pulmonary Embolism Challenge (CAD-PE)

Germán González, Daniel Jiménez‐Carretero|arXiv (Cornell University)|Mar 30, 2020

Venous Thromboembolism Diagnosis and Management被引用数 8

ひとこと要約

本論文は、肺塞栓症（PE）のためのコンピュータ支援診断を進展させるために、91例のラジオロジストがアノテートしたCTPA画像を含むオープンデータベース「CAD-PEチャレンジ」を紹介する。このベンチマーク上でディープラーニングを用いた結果、最良のアルゴリズムは1スキャンあたり2件の誤検出で75%の1個体あたり感受性を達成した。これは、以前の最先端技術を上回るものであり、グローバルセグメンテーションネットワークが特定の候補を絞る手法を上回ることを示している。

ABSTRACT

Rationale: Computer aided detection (CAD) algorithms for Pulmonary Embolism (PE) algorithms have been shown to increase radiologists' sensitivity with a small increase in specificity. However, CAD for PE has not been adopted into clinical practice, likely because of the high number of false positives current CAD software produces. Objective: To generate a database of annotated computed tomography pulmonary angiographies, use it to compare the sensitivity and false positive rate of current algorithms and to develop new methods that improve such metrics. Methods: 91 Computed tomography pulmonary angiography scans were annotated by at least one radiologist by segmenting all pulmonary emboli visible on the study. 20 annotated CTPAs were open to the public in the form of a medical image analysis challenge. 20 more were kept for evaluation purposes. 51 were made available post-challenge. 8 submissions, 6 of them novel, were evaluated on the 20 evaluation CTPAs. Performance was measured as per embolus sensitivity vs. false positives per scan curve. Results: The best algorithms achieved a per-embolus sensitivity of 75% at 2 false positives per scan (fps) or of 70% at 1 fps, outperforming the state of the art. Deep learning approaches outperformed traditional machine learning ones, and their performance improved with the number of training cases. Significance: Through this work and challenge we have improved the state-of-the art of computer aided detection algorithms for pulmonary embolism. An open database and an evaluation benchmark for such algorithms have been generated, easing the development of further improvements. Implications on clinical practice will need further research.

研究の動機と目的

アルゴリズムのベンチマーク評価のため、放射線科医がアノテートした肺塞栓症を有する高品質なCTPAスキャンの公開データベースを構築すること。
標準化された指標を用いて、既存のCAD-PEアルゴリズムの性能を評価および比較すること。
感受性を高めつつ誤検出を低減する手法を同定することで、CAD-PE分野におけるイノベーションを推進すること。
将来的な肺塞栓症検出分野の研究の再現可能性を確保するための評価フレームワークを確立すること。
現在のCADシステムにおける高い誤検出率という臨床的障壁を、データ駆動型のアルゴリズム開発によって克服すること。

提案手法

複数名の読影者によるコンSENSUSと仲裁を用いて、91例のCTPAスキャンを肺塞栓症に対してアノテートした。
アルゴリズム開発および評価のため、20例を公開チャレンジデータセットとして提供した。
20例の別個のテストセット上で、8件の提出（うち6件が新規手法）を、1個体あたり感受性と1スキャンあたりの誤検出数という主な指標を用いて評価した。
U-Netベースのグローバルセグメンテーションなど、ディープラーニングモデルと、SVM、AdaBoostなどの従来の機械学習手法を比較した。
入力表現の影響を調査するため、平面再形成画像および2D/2.5D入力戦略を用いた。
チャレンジ終了後に追加で51例のアノテート済み症例を追加し、将来的なアルゴリズムのトレーニングおよび検証を支援した。

実験結果

リサーチクエスチョン

RQ1専門家がアノテートした肺塞栓症を有する、公開可能な高品質なCTPAデータセットは、CAD-PEアルゴリズムの性能向上に寄与するか？
RQ2ディープラーニングベースのアプローチは、従来の機械学習手法に比べ、CTPAにおける肺塞栓症検出において優れているか？
RQ3トレーニングケース数や入力表現（例：2D対2.5D対再形成画像）の違いに伴い、CAD-PEアルゴリズムの性能はどのように変化するか？
RQ4グローバルセグメンテーションネットワークは、候補抽出ベースの検出パイプラインと比較して、偽陰性を低減できるか？
RQ5アルゴリズムの性能指標は、肺塞栓症の分布やスキャン特性といったデータセット構成にどれほど依存するか？

主な発見

最良のアルゴリズムは、1スキャンあたり2件の誤検出で75%の1個体あたり感受性を達成し、以前の最先端技術を上回った。
ディープラーニングアプローチは、特に誤検出率が2件/スキャン未満の低水準で、従来の機械学習手法を上回った。
U-Netベースのグローバルセグメンテーションモデル（UA-2D）は、カスタム設計された候補中心のディープラーニング手法を上回った。これは、候補選択が偽陰性を引き起こす可能性があることを示唆している。
20件のチャレンジ用トレーニングセットを全量使用してトレーニングしたアルゴリズムは、小規模なサブセットでトレーニングしたものよりも顕著に高い性能を示した。これは、データ依存性が強いことを示している。
以前に報告されたアルゴリズムの性能は、この新しいベンチマークでテストした際、著しく変動した。これは、データセット依存の性能シフトが顕著であることを示している。
オープンデータベースと評価フレームワークは、将来的なCAD-PEシステムの研究および臨床応用の加速が期待される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。