Skip to main content
QUICK REVIEW

[論文レビュー] Extended 2D Volumetric Consensus Hippocampus Segmentation

Diedre Carmo, Bruna Silva|arXiv (Cornell University)|Feb 12, 2019
Advanced Image and Video Retrieval Techniques被引用数 3
ひとこと要約

本稿では、残差接続、バッチ正規化、VGG重み転送、および隣接パッチベースのデータ拡張を組み合わせた三平面U-Netに基づく完全畳み込みネットワークのコンSENSUSを用いた3次元海馬セグメンテーション手法を提案する。本手法はテストデータセットで96%のDiceスコアを達成し、公開HARPデータセットでは87.48%を記録した。1体積あたり数秒の推論時間であり、ソースコードは公開されている。

ABSTRACT

Hippocampus segmentation plays a key role in diagnosing various brain disorders such as Alzheimer's disease, epilepsy, multiple sclerosis, cancer, depression and others. Nowadays, segmentation is still mainly performed manually by specialists. Segmentation done by experts is considered to be a gold-standard when evaluating automated methods, buts it is a time consuming and arduos task, requiring specialized personnel. In recent years, efforts have been made to achieve reliable automated segmentation. For years the best performing authomatic methods were multi atlas based with around 80-85% Dice coefficient and very time consuming, but machine learning methods are recently rising with promising time and accuracy performance. A method for volumetric hippocampus segmentation is presented, based on the consensus of tri-planar U-Net inspired fully convolutional networks (FCNNs), with some modifications, including residual connections, VGG weight transfers, batch normalization and a patch extraction technique employing data from neighbor patches. A study on the impact of our modifications to the classical U-Net architecture was performed. Our method achieves cutting edge performance in our dataset, with around 96% volumetric Dice accuracy in our test data. In a public validation dataset, HARP, we achieve 87.48% DICE. GPU execution time is in the order of seconds per volume, and source code is publicly available. Also, masks are shown to be similar to other recent state-of-the-art hippocampus segmentation methods in a third dataset, without manual annotations.

研究の動機と目的

  • 専門家による手作業によるラベリングに依存するのを減らすために、自動的で高速かつ高精度な海馬セグメンテーション手法の開発を目的とする。
  • 三平面推論とU-Netアーキテクチャへの構造的改善を組み合わせることで、既存のマルチアトラス法およびディープラーニング手法を上回ることを目的とする。
  • 低推論時間と広範な適用可能性を維持しながら、海馬セグメンテーション分野における最先端のパフォーマンスを達成することを目的とする。
  • 手動ラベリングが行われない公開データセット上で本手法を検証し、汎用性と頑健性を示すこと。
  • 再現可能性および神経画像解析分野における今後の研究を支援するため、ソースコードを公開すること。

提案手法

  • 本手法は、冠状面、矢状面、軸面の各平面で学習された3つの2次元U-Netベースの完全畳み込みネットワークを用い、ボリュメトリックな予測を生成する。
  • 残差接続をU-Netアーキテクチャに統合することで、深層ネットワークにおける勾配の流れと特徴量学習を改善する。
  • エンコーダー部への事前学習済みVGG重みの転送により、収束の加速と特徴表現の向上を図る。
  • 各畳み込み層の後にバッチ正規化を適用することで、学習の安定化と高速化を実現する。
  • 隣接するパッチからの文脈的情報を含めるためのパッチ抽出技術を用い、局所的特徴理解を強化する。
  • 最終的なセグメンテーションマスクは、3つの平面ネットワークからの予測を平均化することで得られ、コンセンサスボリュームを形成する。

実験結果

リサーチクエスチョン

  • RQ1三平面U-Netバージョンのコンセンサスに構造的改善を加えた手法が、標準的な2次元または3次元U-Net手法と比較して、優れた海馬セグメンテーション精度を達成できるか?
  • RQ2残差接続、バッチ正規化、VGG重み転送が、海馬セグメンテーションのパフォーマンスにそれぞれどのように影響を与えるか?
  • RQ3全ボリュームの文脈情報が欠落している状況下で、隣接パッチのデータを用いることで、どれほど一般化性と頑健性が向上するか?
  • RQ4本手法は、検証用に手動ラベルが提供されていないHARPなどの公開データセットにおいて、最先端のパフォーマンスを達成できるか?
  • RQ5本手法の推論速度はどの程度で、臨床的または研究用途への実用的適用が可能と見なせるか?

主な発見

  • 著者らのプライベートテストデータセットでは、ボリュメトリックなDice係数が約96%に達し、高いセグメンテーション精度を示している。
  • 公開HARPバリデーションデータセットでは、Diceスコアが87.48%に達しており、外部データへの強い汎用性を示している。
  • GPU上で実行した場合、1体積あたり数秒の推論時間であり、臨床的および高スループット応用に適している。
  • 第三者の未ラベル化データセットにおいても、他の最近の最先端手法と同等の品質のセグメンテーションマスクが得られている。
  • アブレーションスタディの結果、特に残差接続とバッチ正規化がベースラインU-Netと比較してパフォーマンスを顕著に向上させていることが確認された。
  • コードの公開により、再現性が確保され、今後の海馬セグメンテーション分野におけるベンチマーク評価や手法開発が促進される。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。