QUICK REVIEW

[論文レビュー] A Localisation-Segmentation Approach for Multi-label Annotation of Lumbar Vertebrae using Deep Nets

Anjany Sekuboyina, Alexander Valentinitsch|arXiv (Cornell University)|Mar 13, 2017

Medical Imaging and Analysis参考文献 7被引用数 49

ひとこと要約

本稿では、CTスキャンにおける腰椎（L1–L5）の多ラベルセグメンテーションのための2段階のディーブラーニング手法を提案する。まず、コンテキスト強度特徴に基づいて非線形回帰を用いて腰椎領域を局所化するためのディープパーセプトロンを用い、次に、完全畳み込みネットワーク（FCN）を用いて同時にすべての椎間板をセグメンテーションおよびラベリングする。本手法は、側弯症や骨折を伴う重度の脊椎変形を含む、挑戦的なxVertSegデータセットにおいて、平均Dice係数が90%以上を達成した。

ABSTRACT

Multi-class segmentation of vertebrae is a non-trivial task mainly due to the high correlation in the appearance of adjacent vertebrae. Hence, such a task calls for the consideration of both global and local context. Based on this motivation, we propose a two-staged approach that, given a computed tomography dataset of the spine, segments the five lumbar vertebrae and simultaneously labels them. The first stage employs a multi-layered perceptron performing non-linear regression for locating the lumbar region using the global context. The second stage, comprised of a fully-convolutional deep network, exploits the local context in the localised lumbar region to segment and label the lumbar vertebrae in one go. Aided with practical data augmentation for training, our approach is highly generalisable, capable of successfully segmenting both healthy and abnormal vertebrae (fractured and scoliotic spines). We consistently achieve an average Dice coefficient of over 90 percent on a publicly available dataset of the xVertSeg segmentation challenge of MICCAI 2016. This is particularly noteworthy because the xVertSeg dataset is beset with severe deformities in the form of vertebral fractures and scoliosis.

研究の動機と目的

隣接椎間板の外観が類似しているため、多クラスセグメンテーションが困難である腰椎の課題に対処すること。
骨折や側弯症を伴う異常な脊椎では失敗する、モデルベースの手法の限界を克服すること。
腰椎領域を局所化し、一括してセグメンテーションとラベリングを実行する、汎用的でエンドツーエンドのパイプラインを構築すること。
多様な臨床データ、特に重度に変形した病理的脊椎症例においても、頑健なパフォーマンスを達成すること。
今後のディープラーニングを用いた多クラス脊椎セグメンテーションタスクの強力なベースラインを提供すること。

提案手法

コンテキスト強度特徴に基づいて、非線形回帰による腰椎領域の局所化を実行するため、ReLU活性化関数を用いた5層のディープパーセプトロンを用いる。
ランダムにオフセットされた立方体内の平均強度を用いてボクセル単位の特徴を構築し、回帰のための長距離空間的コンテキストを符号化する。
腰椎脊椎を包囲む3次元バウンディングボックスを形成するために、6つの平面（x_min, x_max, y_min, y_max, z_min, z_max）を定義する。
予測されたバウンディングボックスの周囲に15ボクセルの許容誤差マージンを設け、腰椎領域の完全なカバーを保証する。
局所化された領域上で、完全畳み込みニューラルネットワーク（FCN）を訓練し、L1–L5およびバックグラウンドを同時に多クラスセグメンテーションおよびラベリングする。
Adamソルバーを用いた交差エントロピー損失を最適化し、xVertSegデータセット上で事前学習および微調整を実施し、2000エポックの訓練を実施する。

実験結果

リサーチクエスチョン

RQ12段階のディープラーニングパイプラインは、高精度でCTスキャンにおける複数の腰椎を局所化およびセグメンテーションできるか？
RQ2従来のモデルベース手法と比較して、本手法は、骨折や側弯症を伴う病理的症例においてどれほど一般化性能を発揮するか？
RQ3回帰によるグローバルコンテキストとFCNによるローカルコンテキストの統合が、相関の高い椎間板におけるセグメンテーション性能をどの程度向上させるか？
RQ4xVertSegベンチマークにおいて、特に重度の脊椎変形が存在する状況下で、全椎間板のDice係数としてどの程度のパフォーマンスが達成可能か？
RQ5再トレーニングをほとんど行わずに、多様な臨床的FOVおよびスキャナープロトコルに対しても一貫したパフォーマンスを発揮できるか？

主な発見

本手法は、トレーニングセットで平均Dice係数92.7%、テストセット（レーティング者1）で94.3%を達成し、全椎間板で90%以上を維持した。
中央部の椎間板（L3およびL4）のセグメンテーション性能が最も高く、それぞれDiceスコア93.5%および92.9%を記録した。一方、周辺部の椎間板（L1およびL5）はわずかに低いが、依然として優れた性能を示した。
局所化段階では、テストケース全体で平均感度0.98を達成し、1例（Case025）を除き、すべてのケースでほぼ完璧な性能（1.0）を示した。このケースでは、FOVに仙骨が含まれていた。
本手法は、側弯症や椎間板骨折を伴う重度の変形脊椎を効果的にセグメンテーションでき、従来のモデルベース手法が通常失敗する状況でも成功した。
ネットワークは、多様な解剖的変異、BMD分布、脊椎湾曲を示す未観測データに対しても、良好に一般化した。
視覚的結果から、T12とL1、またはL5とS1の境界が曖昧な場合でも、強力なセグメンテーションが可能であることが確認された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。