Skip to main content
QUICK REVIEW

[論文レビュー] Hough-CNN: Deep Learning for Segmentation of Deep Brain Regions in MRI and Ultrasound

Fausto Milletarì, Seyed‐Ahmad Ahmadi|arXiv (Cornell University)|Jan 26, 2016
Medical Image Segmentation Techniques参考文献 41被引用数 31
ひとこと要約

Hough-CNN は、畳み込みニューラルネットワーク(CNN)とハフ投票を組み合わせることで、MRI および超音波画像における深部脳構造のロバストでマルチリージョン分類を実現する、深層学習フレームワークを提案する。この手法は、ネットワークの最も深い層からの特徴表現を活用し、後処理や登録処理を必要とせずに高精度で滑らかな分類を達成する。従来の CNN やアトラスベース手法に比べて、コントラストが低くノイズが多い超音波画像において特に優れた性能を示す。

ABSTRACT

In this work we propose a novel approach to perform segmentation by leveraging the abstraction capabilities of convolutional neural networks (CNNs). Our method is based on Hough voting, a strategy that allows for fully automatic localisation and segmentation of the anatomies of interest. This approach does not only use the CNN classification outcomes, but it also implements voting by exploiting the features produced by the deepest portion of the network. We show that this learning-based segmentation method is robust, multi-region, flexible and can be easily adapted to different modalities. In the attempt to show the capabilities and the behaviour of CNNs when they are applied to medical image analysis, we perform a systematic study of the performances of six different network architectures, conceived according to state-of-the-art criteria, in various situations. We evaluate the impact of both different amount of training data and different data dimensionality (2D, 2.5D and 3D) on the final results. We show results on both MRI and transcranial US volumes depicting respectively 26 regions of the basal ganglia and the midbrain.

研究の動機と目的

  • 低コントラスト、ノイズ、解剖学的文脈の欠如により従来手法が困難となる、MRI や超音波画像における深部脳構造の分類課題に対処すること。
  • 画像登録を必要とせず、モダリティに特化しないロバストで柔軟かつスケーラブルな深層学習ベースの分類手法を開発すること。
  • ネットワークアーキテクチャ、トレーニングデータサイズ、データ次元性(2D, 2.5D, 3D)が、限られたデータを前提とした臨床的環境での分類性能に与える影響を調査すること。
  • 事前定義されたアトラスや複雑な登録に依存せず、CNN の内部特徴とハフ投票のみを用いて、完全自動の局在化と分類を実現すること。
  • 経頭部超音波画像における多様なスキャンジオメトリと患者固有の頭骨窓のばらつきに対しても、一般化可能な分類を実現できることを示すこと。

提案手法

  • 本手法は、各パッチをトレーニング済みの CNN で分類し、その予測結果をハフ投票によって集約することで、ターゲット構造の局在化と分類を実現するパッチワイズのマルチアトラスアプローチを採用する。
  • ハフ投票は、最も深い畳み込み層からの特徴マップに適用され、空間的プライオリティおよび解剖学的文脈を暗黙的にエンコードする。
  • 分類は、投票結果を元の画像空間にバックプロジェクションすることで実行され、後処理を必要とせず滑らかで連続的な輪郭を生成する。
  • このフレームワークはモダリティに依存せず、モダリティ固有のデータで CNN を再トレーニングすることで、異なる画像プロトコルに容易に適応可能である。
  • 本手法は外部のアトラスや登録を一切使用せず、CNN の内部特徴表現のみに依存する。
  • 異なるネットワークアーキテクチャ(例:7-5-3, SmallAlex, 3-3-3-3-3-3-3-3)を評価し、複雑さとデータタイプの違いに応じた性能を検証する。

実験結果

リサーチクエスチョン

  • RQ1Hough-CNN は、標準的なボクセル単位の CNN と比較して、MRI や超音波画像における深部脳領域の分類性能をどのように向上させるか?
  • RQ2低コントラスト・ノイズの多い超音波と、よりコントラストの高い MRI の両環境において、ネットワークアーキテクチャの複雑さが分類精度に与える影響は何か?
  • RQ32D, 2.5D, 3D といった異なるデータモダリティが、特に中脳の同定に軸断層画像のみが診断的価値を持つ超音波において、分類性能にどのように影響を与えるか?
  • RQ4登録処理を一切行わず、多様な超音波スキャンジオメトリと患者固有の頭骨窓のばらつきに対しても、Hough-CNN がロバストで一般化可能な分類を達成できるか?
  • RQ5本手法は、大規模なアノテート済みデータセットへの依存をどの程度軽減でき、後処理やアトラス登録を回避できるか?

主な発見

  • Hough-CNN は、すべてのパrameter設定において、標準的なボクセル単位の CNN よりも優れた性能を示し、後処理を必要とせず滑らかで高精度な分類を達成した。
  • MRI では、より単純な 7-5-3 ネットワークが最良の結果を達成したが、超音波では、複雑な視覚的パターンを捉える必要があるため、より深いネットワーク(3-3-3-3-3-3-3-3 および SmallAlex)が最良の性能を示した。
  • 3D データは MRI の分類性能を向上させたが、超音波では性能が低下した。これは、専門家が中脳同定に軸断層画像のみに依存しているためである。
  • MRI では、大きなコントラストの高い領域に対して高い Dice 係数を達成し、小さな低コントラスト領域ではサブボクセル平均表面距離が良好であった。
  • 3D経頭部超音波において、Hough-CNN は、20名以上の被験者から得られた114体積のデータにおいて、多様なスキャンジオメトリと画像品質のばらつきに対しても、中脳の分類がロバストに実行された。
  • 本手法は、アトラスベース手法よりも著しく高速であり(超音波で30秒、MRIで3〜4分)、完全に登録フリーであるため、登録が失敗しやすい臨床的超音波用途に適している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。