QUICK REVIEW

[논문 리뷰] DeepSPINE: Automated Lumbar Vertebral Segmentation, Disc-level Designation, and Spinal Stenosis Grading Using Deep Learning

Jen-Tang Lu, Stefano Pedemonte|arXiv (Cornell University)|2018. 07. 26.

Medical Imaging and Analysis인용 수 39

한 줄 요약

DeepSPINE는 뇌경색 영상에서 척추분류, 디스크 수준 위치 특정, 척추관 협착도 평가를 위한 완전 자동화된 딥러닝 프레임워크를 제안한다. 이는 자연어 처리를 활용해 방사선의학 보고서에서 수준별 협착도를 추출하고, U-Net 기반 분할과 척추곡선 피팅을 결합하며, 축성 및 곡면 영상에 동시에 작용하는 다중 입력, 다중 작업 컨볼루션 신경망을 활용하여 L5-S1 척추관 협착도 평가에서 최신 기술 수준의 정확도 99.1%를 달성한다.

ABSTRACT

The high prevalence of spinal stenosis results in a large volume of MRI imaging, yet interpretation can be time-consuming with high inter-reader variability even among the most specialized radiologists. In this paper, we develop an efficient methodology to leverage the subject-matter-expertise stored in large-scale archival reporting and image data for a deep-learning approach to fully-automated lumbar spinal stenosis grading. Specifically, we introduce three major contributions: (1) a natural-language-processing scheme to extract level-by-level ground-truth labels from free-text radiology reports for the various types and grades of spinal stenosis (2) accurate vertebral segmentation and disc-level localization using a U-Net architecture combined with a spine-curve fitting method, and (3) a multi-input, multi-task, and multi-class convolutional neural network to perform central canal and foraminal stenosis grading on both axial and sagittal imaging series inputs with the extracted report-derived labels applied to corresponding imaging level segments. This study uses a large dataset of 22796 disc-levels extracted from 4075 patients. We achieve state-of-the-art performance on lumbar spinal stenosis classification and expect the technique will increase both radiology workflow efficiency and the perceived value of radiology reports for referring clinicians and patients.

연구 동기 및 목표

척추관 협착도에 대한 요추 척추 MRI 해석의 높은 독자 간 변동성과 시간 소모 문제를 해결하기 위해.
각 요추 디스크 수준에서 척추 분할, 디스크 수준 위치 특정, 협착도 평가를 수행하는 완전 자동화 시스템을 개발하기 위해.
신규 공인 독서가 필요 없이 대규모 암호화된 방사선 보고서와 영상 데이터를 활용해 딥러닝 모델을 훈련시키기 위해.
방사선의학 워크플로우 효율성을 향상시키고 임상 의사결정 및 환자 치료를 위한 협착도 평가의 표준화를 위해.

제안 방법

자연어 처리(NLP)를 활용해 자유형 텍스트로 된 방사선 보고서에서 수준별 협착도 심각도(정상, 경도, 중도, 중증)를 추출한다.
척추곡선 피팅을 통합한 U-Net 아키텍처를 활용해 축성 및 곡면 MRI 시리즈에서 척추와 디스크 수준을 정확하게 분할하고 위치를 특정한다.
축성 및 곡면 MRI 슬라이스를 동시에 처리하는 다중 입력, 다중 작업, 다중 클래스 컨볼루션 신경망을 설계하여 협착도 평가를 수행한다.
전문 방사선 보고서에서 유도된 레이블을 사용해 4,075명의 환자에서 유래한 총 22,796개의 디스크 수준 데이터셋을 활용해 모델을 훈련한다.
각 요추 수준(L3-L4, L4-L5, L5-S1)에서 중심관 협착도 및 관절공 협착도에 대해 4단계 평가 체계를 적용한다.
성능 평가에 영역 하위 ROC 곡선(AUC)과 총 정확도를 사용하며, 95% 신뢰구간을 보고한다.

실험 결과

연구 질문

RQ1자연어 처리 기술이 비정형 방사선 보고서에서 정확하고 수준별 협착도 레이블을 효과적으로 추출할 수 있는가?
RQ2척추곡선 피팅을 통합한 U-Net 아키텍처가 최소한의 수동 레이블링으로 요추 MRI에서 척추 및 디스크 수준 분할을 안정적이고 정확하게 수행할 수 있는가?
RQ3축성 및 곡면 MRI 시리즈를 동시에 훈련시킨 다중 작업, 다중 입력 딥러닝 모델이 단일 방향 모델보다 협착도 평가에서 뛰어난 성능을 보일 수 있는가?
RQ4여러 방사선의학자가 작성한 커뮤니티 기반 전문 보고서 레이블을 활용할 경우 모델의 일반화 능력과 성능이 얼마나 향상되는가?
RQ5모델의 출력 확률이 방사선의학 공인 의견 또는 이견을 반영할 수 있으며, 이를 통해 독자 간 변동성 분석을 지원할 수 있는가?

주요 결과

모델은 L5-S1 중심관 협착도 평가에서 총 정확도 99.1%를 기록하여 이전 최신 기술 수준의 방법보다 뚜렷이 뛰어난 성능을 보였다.
관절공 협착도의 경우 L5-S1에서 91.2%의 정확도를 기록하여 모든 디스크 수준에서 뛰어난 성능을 보였다.
중심관 협착도 분류의 AUC는 0.983(95% CI: 0.971–0.992)였으며, 뛰어난 분류 성능를 나타내었다.
관절공 협착도의 AUC는 0.961(95% CI: 0.955–0.967)였으며, 협착도 심각도 탐지에 높은 신뢰성을 확인했다.
모델는 축성 또는 곡면 MRI만을 사용한 이전 방법보다 다수 수준 협착도 탐지에서 뛰어난 성능을 보였다.
프레임워크는 암호화된 방사선 보고서를 효과적으로 활용해 고품질의 훈련 레이블을 생성하여 신규 공인 독서에 대한 의존도를 감소시켰다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.