QUICK REVIEW

[論文レビュー] Deep Generative Models in the Real-World: An Open Challenge from Medical Imaging

Xiaoran Chen, Nick Pawlowski|arXiv (Cornell University)|Jun 14, 2018

Generative Adversarial Networks and Image Synthesis参考文献 28被引用数 38

ひとこと要約

本論文は、健常者のスキャンを用いて正常組織の分布を学習する、自己符号化器ベースの深層生成モデル（VAE、AAE、GANなど）を用いた、脳MRIにおける非教師付き異常検出の評価を行っている。強力な生成性能を示す一方で、特にT1強調画像では検出精度が限定的であり、病理的構造の再構成やピクセル単位の異常推定の面で大幅な改善の余地があることが示唆される。

ABSTRACT

Recent advances in deep learning led to novel generative modeling techniques that achieve unprecedented quality in generated samples and performance in learning complex distributions in imaging data. These new models in medical image computing have important applications that form clinically relevant and very challenging unsupervised learning problems. In this paper, we explore the feasibility of using state-of-the-art auto-encoder-based deep generative models, such as variational and adversarial auto-encoders, for one such task: abnormality detection in medical imaging. We utilize typical, publicly available datasets with brain scans from healthy subjects and patients with stroke lesions and brain tumors. We use the data from healthy subjects to train different auto-encoder based models to learn the distribution of healthy images and detect pathologies as outliers. Models that can better learn the data distribution should be able to detect outliers more accurately. We evaluate the detection performance of deep generative models and compare them with non-deep learning based approaches to provide a benchmark of the current state of research. We conclude that abnormality detection is a challenging task for deep generative models and large room exists for improvement. In order to facilitate further research, we aim to provide carefully pre-processed imaging data available to the research community.

研究の動機と目的

最先端の深層生成モデルを用いた、医療画像における非教師付き異常検出の可能性を評価すること。
公開済みの脳MRIデータセットを用いて、自己符号化器ベースのモデル（VAE、AAE、GANの変種）を非深層学習手法と比較してベンチマークすること。
T1強調画像とT2強調画像の両方において、病変の検出における性能のボトルネックを特定すること。
今後のベンチマークと開発を支援するため、研究コミュニティに整理済みで事前処理済みのデータセットを提供すること。
前処理（例：データのクロッピング）としきい値選択が検出性能に与える影響を調査すること。

提案手法

健常者からのT2強調画像およびT1強調画像を用いて、自己符号化器ベースの生成モデル（VAE、AAE、DAE、GANの変種）を訓練し、正常脳組織の分布を学習する。
再構成誤差を異常検出の代理指標として用いる：誤差が大きいほど病変の可能性が高くなる。
BraTS（腫瘍）およびISLES（脳卒中病変）の2つの外部データセットにモデルを適用し、教師なしで異常領域を検出する。
AUC（受信者操作特性曲線の下側面積）およびmDSC（平均Dice類似係数）を複数のしきい値で評価する。
背景の干渉を低減し、再構成の焦点を高めるために、訓練中にデータのクロッピングを実施する。
パーセンタイル（例：90百分位数）を用いたしきい値選択を検討し、最適なしきい値は固定しないまま検出性能を最適化する。

実験結果

リサーチクエスチョン

RQ1自己符号化器ベースの深層生成モデルは、病理データのラベルなしに、脳MRIにおける異常病変を効果的に検出できるか？
RQ2VAE、AAE、GANなどの異なる生成モデルは、T2強調画像とT1強調画像の両方において、病変検出においてどのように比較されるか？
RQ3前処理（例：クロッピング）が再構成品質および下流の異常検出性能に与える影響は何か？
RQ4同じ訓練データを用いても、なぜT1強調画像ではT2強調画像ほど性能が高くないのか？
RQ5再構成誤差のみが異常性の信頼できる指標として十分か？ピクセル単位の確率推定の向上にはどのような改善が必要か？

主な発見

畳み込み型VAEはBraTS-T2wで最高のmDSC 0.42を達成し、ベイジアンVAEやAAEを上回った。
ATLAS-T1wでは、すべての自己符号化器モデルがmDSC 0.1未満にとどまり、病変検出能力が著しく低いことが示されたが、AUCはやや高い水準を維持していた。
教師ありU-NetはATLAS-T1wでDiceスコア0.50を達成しており、これは比較的低い水準であり、教師あり手法ですらT1強調画像の病変セグメンテーションに苦労していることを示唆している。
DAEおよびα-GANは上位3モデルと比べて著しく性能が低く、α-GANは元のデータセットでmDSC 0.33、ダウンサンプリング後では0.35を記録した。
訓練中にデータのクロッピングを実施することで、背景の再構成誤差が低減し、関連する解剖学的領域に注目したモデルの性能が向上した。
本研究は、非教師付き異常検出が依然として未解決の課題であり、特にT1強調画像においては再構成品質とピクセル単位の確率推定の向上がさらに必要であると結論づけた。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。