[論文レビュー] Lung Segmentation from Chest X-rays using Variational Data Imputation
この論文は、高不透明度の胸部X線画像における欠損データを推定するための変分エンコーダを強化した U-net 種の肺 segmentation モデルを提案し、陰影化を模倣する特別なデータ拡張によって segmentation の性能を改善する。最良の結果は、ブロックマスキングと拡散ノイズ拡張を変分データ推定と組み合わせたときに得られる。
Pulmonary opacification is the inflammation in the lungs caused by many respiratory ailments, including the novel corona virus disease 2019 (COVID-19). Chest X-rays (CXRs) with such opacifications render regions of lungs imperceptible, making it difficult to perform automated image analysis on them. In this work, we focus on segmenting lungs from such abnormal CXRs as part of a pipeline aimed at automated risk scoring of COVID-19 from CXRs. We treat the high opacity regions as missing data and present a modified CNN-based image segmentation network that utilizes a deep generative model for data imputation. We train this model on normal CXRs with extensive data augmentation and demonstrate the usefulness of this model to extend to cases with extreme abnormalities.
研究の動機と目的
- CXRs における極端な陰影化での頑健な肺セグメンテーションを動機づける。
- 正常な CXRs から欠損データを推定して、異常で高度に不透明な CXRs へ一般化できるセグメンテーションモデルを開発する。
- より良い性能のために U-net セグメンテーションネットワークを拡張する変分エンコーダを活用する。
- 欠損領域と不透明度の増加を模倣するデータ拡張戦略を探求し、推定モデルを訓練する。
提案手法
- 欠損データ推定を行う追加の変分エンコーダを備えた肺マスク用の U-net 種のセグメンテーションネットワークを使用する。
- q_phi(z|x) からサンプルされた潜在変数 z を導入し、デコード前に U-net のエンコーダ出力と結合して結合する。
- seg メンテーション損失に加えて q_phi(z|x) と p(z) の間の KL 発散で訓練する。
- VAE デコーダをセグメンテーションデコーダと共有して、セグメンテーションとデータ推定を同時に予測する。
- 欠損データと病的陰影を模倣するデータ拡張(標準、ブロックマスキング、拡散ノイズ)を試して訓練する。
- 正常な訓練セット由来のモデルで評価し、高不透明度 CXRs を専門家提供のマスクでテストする。
実験結果
リサーチクエスチョン
- RQ1欠損した高不透明度 CXRs にラベル付けされた異常例が欠如していても、正常 CXRs で訓練された変分データ推定モジュールはセグメンテーションを改善できるか。
- RQ2遮蔽領域と不透明度の増加を模倣する高度なデータ拡張は、 severe opacification の下で肺セグメンテーションモデルの性能を向上させるか。
- RQ3VAE 推定とセグメンテーションネットワーク間でデコーダを共有すると、ベースライン U-net よりも肺マスクが改善されるか。
- RQ4ブロックマスクと拡散ノイズ拡張を組み合わせることは肺セグメンテーションの Dice と精度にどのような影響を与えるか。
- RQ5提案手法は通常の CXRs から高度に異常な CXRs への一般化が COVID-19 関連分析においてどれほど達成可能か。
主な発見
| Models | Augmentation | Dice Overlap | Accuracy |
|---|---|---|---|
| Baseline | Standard | 0.7335\u00b1 0.17 | 0.8449\u00b1 0.09 |
| Proposed | Standard | 0.7204\u00b1 0.18 | 0.8392\u00b1 0.10 |
| Baseline | Block | 0.7563\u00b1 0.15 | 0.8522\u00b1 0.09 |
| Proposed | Block | 0.7688\u00b1 0.17 | 0.8552\u00b1 0.10 |
| Baseline | Diffuse | 0.7757\u00b1 0.15 | 0.8654\u00b1 0.10 |
| Proposed | Diffuse | 0.7965\u00b1 0.11 | 0.8652\u00b1 0.11 |
| Baseline | Block+Diffuse | 0.8173\u00b1 0.12 | 0.8654\u00b1 0.11 |
| Proposed | Block+Diffuse | 0.8503\u00b1 0.07 | 0.8815\u00b1 0.11 |
- 提案モデルは、変分データ推定とブロックマスキング+拡散ノイズを組み合わせたとき、Dice が 0.8503(±0.07)、Accuracy が 0.8815(±0.11)で最高を達成する。
- 標準的な拡張を用いたベースラインは Dice 0.7335(±0.17)、Accuracy 0.8449(±0.09)。
- ブロック拡張を用いたベースラインは Dice 0.7563(±0.15)、Accuracy 0.8522(±0.09)。
- 拡散拡張を用いたベースラインは Dice 0.7757(±0.15)、Accuracy 0.8654(±0.10)。
- 標準拡張を用いた提案は Dice 0.7204(±0.18)、Accuracy 0.8392(±0.10)。
- ブロック拡張を用いた提案は Dice 0.7688(±0.17)、Accuracy 0.8552(±0.10)。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。