QUICK REVIEW

[論文レビュー] Comparison of U-net-based Convolutional Neural Networks for Liver Segmentation in CT

Hans Meine, Grzegorz Chlebus|arXiv (Cornell University)|Jan 1, 2018

Medical Image Segmentation Techniques参考文献 12被引用数 7

ひとこと要約

本研究では、219例のアノテート済み症例を用いて、CTスキャンにおける肝臓セグメンテーションを目的としたU-netベースの畳み込みニューラルネットワークを評価する。本研究では、直交スライス上で訓練された2D U-netのアンサンブルを提案し、ハードウェア制限のため3D U-netを上回る性能を達成した。平均および中央値のDiceスコアは0.97以上であり、解像度損失を伴うリサンプリングにもかかわらず、表面距離指標も優れた結果を示した。

ABSTRACT

Various approaches for liver segmentation in CT have been proposed: Besides statistical shape models, which played a major role in this research area, novel approaches on the basis of convolutional neural networks have been introduced recently. Using a set of 219 liver CT datasets with reference segmentations from liver surgery planning, we evaluate the performance of several neural network classifiers based on 2D and 3D U-net architectures. An interesting observation is that slice-wise approaches perform surprisingly well, with mean and median Dice coefficients above 0.97, and may be preferable over 3D approaches given current hardware and software limitations.

研究の動機と目的

CTスキャンにおける2Dおよび3D U-netアーキテクチャの性能を比較すること。
ボクセルリサンプリング解像度（2 mm 対 1 mm）がセグメンテーション精度に与える影響を評価すること。
直交ビューで訓練された2D U-netのアンサンブルが、単一の2Dまたは3D U-netと比較して、より高い耐性を示すかを調査すること。
損失関数（Dice対バイナリクロスエントロピー）がモデルの収束および性能に与える影響を分析すること。
特にGPUメモリに起因するハードウェアおよびソフトウェア制限が、3D U-netのトレーニングおよび推論をどのように制限するかを同定すること。

提案手法

専門家がアノテートした219例のCTボリュームを用いて、4または5段階の解像度レベルを持つ複数の2Dおよび3D U-netバージョンをトレーニングした。
CTデータにはLanczos補間を、マスクには最近傍補間を用いて、等方的リサンプリングを2 mmおよび1 mmのボクセルサイズに実施した。
軸方向、冠状方向、 coronal スライスで訓練された3つの2D U-netを組み合わせたアンサンブル分類器を実装し、空間的一般化性を向上させた。
トレーニングの高速化と収束性の向上を目的に、ReLU活性化関数の前段にバッチ正規化を適用した。
Dice係数、表面距離指標（MICCAIスコア）、および統計的有意性検定（Wilcoxon符号順位検定）を用いてモデルを評価した。
特に8 GiBのGPUメモリに起因するバッチサイズ制限を念頭に、アーキテクチャ間でのトレーニング効率およびメモリ使用量を比較した。

実験結果

リサーチクエスチョン

RQ1直交ビューで訓練された2D U-netアンサンブルは、CTスキャンにおける肝臓セグメンテーションにおいて、単一の2Dおよび3D U-netアーキテクチャを上回る性能を示すか？
RQ2異なるボクセルリサンプリング解像度（2 mm 対 1 mm）は、セグメンテーション性能および表面距離指標にどのように影響するか？
RQ3GPUメモリ制限に起因する3D U-netの性能劣化は、2Dアンサンブルと比較してどの程度顕著か？
RQ4この高品質なセグメンテーションタスクにおいて、Dice損失がバイナリクロスエントロピーに比べて顕著な性能向上をもたらすか？
RQ5ハードウェア制限により3Dトレーニングのバッチサイズが制限される状況下で、2Dスライスワイズアプローチが3Dモデルを上回る結果を達成できるか？

主な発見

直交スライスで訓練された2D U-netアンサンブルは、平均Dice係数が0.97以上、中央値Diceが0.97以上を達成し、単一の2Dおよび3D U-netモデルを上回った。
2 mmの等方的ボクセルにリサンプリングされたにもかかわらず、2Dアンサンブルはトレーニング済みの人間専門家を上回るMICCAIスコアを達成し、高いセグメンテーション精度を示した。
3D U-netモデルは、GPUメモリの制限により有効なバッチサイズが制限され、トレーニングの安定性が損なわれるため、2Dアンサンブルと比較して顕著に性能が劣った。
パディングを施した畳み込みを用いた3Dpad U-netは、素の3D U-netよりも顕著に優れた性能を示し、メモリ制限下でのアーキテクチャの最適化の重要性を示した。
このデータセットでは、Dice損失がバイナリクロスエントロピーに比べて顕著な性能向上をもたらさなかった。これは、専門家が作成した高品質なリファレンスセグメンテーションに起因すると考えられる。
ボクセルサイズを2 mmから1 mmに縮小することで、MICCAIスコアが有意に向上した（p < 0.05）。これは表面距離指標の改善によるものであり、体積的オーバーラップに顕著な向上は認められなかった。これは、解像度と計算コストのトレードオフを示している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。