[论文解读] DeepSPINE: Automated Lumbar Vertebral Segmentation, Disc-level Designation, and Spinal Stenosis Grading Using Deep Learning
DeepSPINE 提出了一种深度学习框架,用于完全自动化地进行腰椎椎体分割、椎间盘节段定位和脊柱狭窄程度分级,使用 MRI 成像。该框架利用自然语言处理技术从放射科报告中提取节段特异的狭窄程度分级,结合基于 U-Net 的分割与脊柱曲线拟合,并采用多输入、多任务卷积神经网络处理矢状面和轴向 MRI,实现了在 L5-S1 中央椎管狭窄程度分级上的最先进准确率 99.1%。
The high prevalence of spinal stenosis results in a large volume of MRI imaging, yet interpretation can be time-consuming with high inter-reader variability even among the most specialized radiologists. In this paper, we develop an efficient methodology to leverage the subject-matter-expertise stored in large-scale archival reporting and image data for a deep-learning approach to fully-automated lumbar spinal stenosis grading. Specifically, we introduce three major contributions: (1) a natural-language-processing scheme to extract level-by-level ground-truth labels from free-text radiology reports for the various types and grades of spinal stenosis (2) accurate vertebral segmentation and disc-level localization using a U-Net architecture combined with a spine-curve fitting method, and (3) a multi-input, multi-task, and multi-class convolutional neural network to perform central canal and foraminal stenosis grading on both axial and sagittal imaging series inputs with the extracted report-derived labels applied to corresponding imaging level segments. This study uses a large dataset of 22796 disc-levels extracted from 4075 patients. We achieve state-of-the-art performance on lumbar spinal stenosis classification and expect the technique will increase both radiology workflow efficiency and the perceived value of radiology reports for referring clinicians and patients.
研究动机与目标
- 为解决腰椎 MRI 影像在脊柱狭窄诊断中因阅片者间差异大且耗时长的问题。
- 开发一个完全自动化的系统,实现对每个腰椎间盘节段的椎体分割、节段定位和狭窄程度分级。
- 利用大规模归档的放射科报告和影像数据,训练深度学习模型,而无需依赖新的共识读片。
- 提高放射科工作流程效率,并在临床决策和患者照护中实现狭窄程度分级的标准化。
提出的方法
- 利用自然语言处理(NLP)从自由文本的放射科报告中提取逐节段的狭窄严重程度分级(正常、轻度、中度、重度)。
- 采用基于 U-Net 的架构并结合脊柱曲线拟合,以在轴向和矢状面 MRI 系列中实现对椎体和椎间盘节段的精确分割与定位。
- 设计一种多输入、多任务、多分类卷积神经网络,同时处理轴向和矢状面 MRI 切片以实现狭窄程度分级。
- 使用来自 4,075 名患者的 22,796 个椎间盘节段的大规模数据集进行模型训练,标签来源于专家放射科报告。
- 在每个腰椎节段(L3-L4、L4-L5、L5-S1)采用四分制分级系统对中央椎管狭窄和椎间孔狭窄进行评估。
- 使用受试者工作特征曲线下面积(AUC)和总体准确率评估性能,报告 95% 置信区间。
实验结果
研究问题
- RQ1自然语言处理能否有效从非结构化放射科报告中提取精确的、节段特异的狭窄程度分级标签?
- RQ2基于 U-Net 并结合脊柱曲线拟合的模型能否在最小人工标注的前提下,实现对腰椎 MRI 中椎体和椎间盘节段的鲁棒且准确的分割?
- RQ3在同时处理轴向和矢状面 MRI 系列的多任务、多输入深度学习模型,是否能在狭窄程度分级任务中优于仅使用单一方向影像的模型?
- RQ4使用来自多位放射科医生的众包专家报告标签,在多大程度上能提升模型的泛化能力和性能?
- RQ5模型输出的概率是否能反映放射科共识或分歧?该信息能否用于分析阅片者间差异?
主要发现
- 该模型在 L5-S1 中央椎管狭窄程度分级上的总体准确率达到 99.1%,显著优于以往最先进方法。
- 对于椎间孔狭窄,该模型在 L5-S1 达到 91.2% 的准确率,表明在所有椎间盘节段上均表现出色。
- 中央椎管狭窄分类的 AUC 为 0.983(95% 置信区间:0.971–0.992),表明具有极佳的判别性能。
- 椎间孔狭窄的 AUC 为 0.961(95% 置信区间:0.955–0.967),证实其在检测狭窄严重程度方面具有高度可靠性。
- 该模型优于以往仅使用轴向或仅使用矢状面 MRI 的方法,尤其在多节段狭窄检测方面表现更优。
- 该框架有效利用了归档的放射科报告,生成了高质量的训练标签,减少了对新共识读片的依赖。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。