QUICK REVIEW

[論文レビュー] DeepSPINE: Automated Lumbar Vertebral Segmentation, Disc-level Designation, and Spinal Stenosis Grading Using Deep Learning

Jen-Tang Lu, Stefano Pedemonte|arXiv (Cornell University)|Jul 26, 2018

Medical Imaging and Analysis被引用数 39

ひとこと要約

DeepSPINEは、MRIを用いて、完全自動の腰椎椎体セグメンテーション、ディスクレベルの局所化、脊柱管狭窄症の重症度評価を実現するディープラーニングフレームワークを提案する。自然言語処理を活用してレポートからレベル別に狭窄度を抽出し、U-Netベースのセグメンテーションと脊椎曲線フィッティングを統合し、冠状断層および矢状断層MRIを同時に処理するマルチインプット・マルチタスク畳み込みニューラルネットワークを採用することで、L5-S1における中央管狭窄症の重症度評価でSOTAの99.1%の正確性を達成した。

ABSTRACT

The high prevalence of spinal stenosis results in a large volume of MRI imaging, yet interpretation can be time-consuming with high inter-reader variability even among the most specialized radiologists. In this paper, we develop an efficient methodology to leverage the subject-matter-expertise stored in large-scale archival reporting and image data for a deep-learning approach to fully-automated lumbar spinal stenosis grading. Specifically, we introduce three major contributions: (1) a natural-language-processing scheme to extract level-by-level ground-truth labels from free-text radiology reports for the various types and grades of spinal stenosis (2) accurate vertebral segmentation and disc-level localization using a U-Net architecture combined with a spine-curve fitting method, and (3) a multi-input, multi-task, and multi-class convolutional neural network to perform central canal and foraminal stenosis grading on both axial and sagittal imaging series inputs with the extracted report-derived labels applied to corresponding imaging level segments. This study uses a large dataset of 22796 disc-levels extracted from 4075 patients. We achieve state-of-the-art performance on lumbar spinal stenosis classification and expect the technique will increase both radiology workflow efficiency and the perceived value of radiology reports for referring clinicians and patients.

研究の動機と目的

腰椎MRIにおける脊柱管狭窄症の解釈にかかる高リスクの読影者間ばらつきと時間的負担を軽減すること。
腰椎ディスクごとのレベルで、椎体セグメンテーション、ディスクレベルの局所化、狭窄症の重症度評価を完全自動で行うシステムの開発。
新規のコンSENSUS読影を必要とせず、大規模なアーカイブ済みレポートと画像データを活用してディープラーニングモデルを学習すること。
放射線科のワークフロー効率化を図り、臨床意思決定および患者ケアのための狭窄症の重症度評価の標準化を実現すること。

提案手法

自由記述形式のレポートから、レベルごとの狭窄症重症度（正常、軽度、中等度、重度）を抽出するために自然言語処理（NLP）を活用。
脊椎曲線フィッティングを組み合わせたU-Netアーキテクチャを採用し、冠状断層および矢状断層MRIシリーズにおける椎体とディスクレベルのセグメンテーションを高精度に実現。
冠状断層および矢状断層MRIスライスを同時に処理するマルチインプット・マルチタスク・マルチクラス畳み込みニューラルネットワークを設計し、狭窄症の重症度評価を実施。
4,075例の患者から得た22,796個のディスクレベルの大量データセットを用い、専門放射線科レポートに基づくラベルでモデルを学習。
各腰椎レベル（L3-L4、L4-L5、L5-S1）における中央管狭窄症および椎間孔狭窄症に対して、4段階の重症度評価システムを適用。
性能評価にはROC曲線下積分（AUC）と全体の正確性を用い、95%信頼区間を報告。

実験結果

リサーチクエスチョン

RQ1未構造化レポートから、正確でレベル別に特化した狭窄症重症度ラベルを自然言語処理で効果的に抽出できるか？
RQ2脊椎曲線フィッティングを組み合わせたU-Netは、最小限の手動アノテーションで、腰椎MRIにおける椎体およびディスクレベルのセグメンテーションを堅牢かつ正確に実現できるか？
RQ3冠状断層および矢状断層MRIを同時に処理するマルチタスク・マルチインプットディープラーニングモデルは、単一方向のモデルを上回る狭窄症評価性能を示せるか？
RQ4複数の放射線科医によるクラウドソーシングによる専門家レポートラベルを活用することで、モデルの汎化性能と性能がどの程度向上するか？
RQ5モデルの出力確率は放射線科医のコンSENSUSや不一致を反映できるか？また、これにより読影者間ばらつきの分析が可能になるか？

主な発見

L5-S1における中央管狭窄症の重症度評価で、全体の正確性が99.1%に達し、既存のSOTA手法を顕著に上回った。
椎間孔狭窄症ではL5-S1で91.2%の正確性を達成し、全ディスクレベルで優れた性能を示した。
中央管狭窄症分類のAUCは0.983（95%信頼区間：0.971–0.992）であり、優れた識別性能を示した。
椎間孔狭窄症のAUCは0.961（95%信頼区間：0.955–0.967）であり、狭窄症重症度の検出において高い信頼性を確認した。
単一方向（冠状または矢状）のMRIを用いた既存手法よりも、特に多段階狭窄症の検出において優れた性能を示した。
アーカイブ済みレポートを活用して高品質な学習ラベルを生成するフレームワークが有効であり、新たなコンセンサス読影への依存を低減した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。