QUICK REVIEW

[論文レビュー] Deep Learning for Medical Image Segmentation

Matthew Lai|arXiv (Cornell University)|May 8, 2015

Advanced Neural Network Applications参考文献 26被引用数 96

ひとこと要約

本稿では、ADNIデータセットを用いて、3次元MRIスキャンにおける海馬のセグメンテーションのための2次元、3方向平面（トリプランア）、3次元畳み込みニューラルネットワークアーキテクチャを評価している。トリプランアアプローチが、正確性と学習効率の両立において最良のトレードオフを示し、標準的な2次元パッチと比較して優れているが、計算コストが高いため、3次元ネットワークに迫るがそれを上回らない全画像ラベリング性能を示している。

ABSTRACT

This report provides an overview of the current state of the art deep learning architectures and optimisation techniques, and uses the ADNI hippocampus MRI dataset as an example to compare the effectiveness and efficiency of different convolutional architectures on the task of patch-based 3-dimensional hippocampal segmentation, which is important in the diagnosis of Alzheimer's Disease. We found that a slightly unconventional "stacked 2D" approach provides much better classification performance than simple 2D patches without requiring significantly more computational power. We also examined the popular "tri-planar" approach used in some recently published studies, and found that it provides much better results than the 2D approaches, but also with a moderate increase in computational power requirement. Finally, we evaluated a full 3D convolutional architecture, and found that it provides marginally better results than the tri-planar approach, but at the cost of a very significant increase in computational power requirement.

研究の動機と目的

3次元海馬セグメンテーションにおける、スタックド2次元、トリプランア、3次元畳み込みネットワークといった異なるディープラーニングアーキテクチャの性能と効率を比較すること。
これらのアーキテクチャ間で、分類精度、学習速度、計算コストのトレードオフを評価すること。
3次元ネットワークは計算コストが高いため、全画像セグメンテーション性能が2次元またはトリプランア手法よりも優れているかどうかを検証すること。
データサンプリングとクラス不均衡が、異なるアーキテクチャにおけるモデルの汎化性および全MRIボリュームにわたるラベリングの一貫性に与える影響を調査すること。

提案手法

研究ではADNI海馬MRIデータセットを用い、2次元、トリプランア、3次元畳み込みアーキテクチャを用いたパッチベースの学習を実施している。
スタックド2次元アプローチでは、冠状面、 coronal（冠状）、矢状面からの複数の2次元スライスを個別に処理し、最終分類の前に連結している。
トリプランア手法では、3つの直交する2次元スライスを入力チャネルとして同時に処理し、平面間の空間的コンテキストを保持している。
3次元アプローチでは、ボリュームパッチを用い、3次元畳み込みを用いて3次元すべての次元における空間的関係を捉えている。
すべてのモデルはミニバッチ確率的勾配降下法を用いて学習され、バッチ正規化とReLU活性化関数を適用しており、評価にはDiceスコアおよび誤検出・誤未検出ボクセル数を用いている。
セグメンテーション出力を精緻化するために後処理が施されており、モデルの一貫性を評価するために複数のランダム初期化が用いられている。

実験結果

リサーチクエスチョン

RQ1トリプランア畳み込みアーキテクチャは、海馬セグメンテーションにおいて、標準的な2次元パッチベースネットワークと比較して、より優れた正確性-計算コストのトレードオフを提供するか？
RQ23次元畳み込みネットワークのパッチレベル分類性能と全画像ラベリング精度は、2次元およびトリプランア手法と比較してどの程度異なるか？
RQ33次元ネットワークはパッチレベルで優れた性能を示すが、なぜ全画像セグメンテーションではトリプランアアプローチに劣るのか？
RQ4サンプリングされたパッチにおけるクラス分布の不均衡が、異なるアーキテクチャにおけるラベリング結果の一貫性と信頼性にどの程度影響を及えるか？

主な発見

トリプランアアプローチは、性能と学習効率の両立において最良のバランスを達成し、テスト誤差8.64％、1分間あたり約221イテレーションの学習速度を達成した。
2次元スタックドパッチ手法は、1分間あたり約754イテレーションと最も高速に学習されたが、テスト誤差が9.11％で、精度が低かった。
3次元ネットワークは、パッチレベルでの誤差が最小（6.95％）であったが、全画像ラベリング性能に一貫性がなく、トリプランアよりも誤検出・誤未検出ボクセル数が多くなった。
パッチ分類性能は優れていたが、3次元モデルは全画像セグメンテーションで劣っていた。これは、パッチサンプリングバイアスに起因するクラス分布のシフトが原因である可能性が高い。
同じアーキテクチャの複数回の実行では、バリデーションおよびテスト性能が一貫していたが、画像レベルのラベリングは顕著に変動しており、サンプリングパッチにおけるクラス不均衡への感受性が示された。
3次元ネットワークは、トリプランア（187.57分）および2次元（42.06分）と比較して、著しく長い学習時間を要した（最大301.54分）、計算コストの高さが顕著であった。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。