[논문 리뷰] Deep learning to achieve clinically applicable segmentation of head and neck anatomy for radiotherapy
3D U-Net 기반 모델이 CT 계획 스캔에서 expert 방사선사 수준으로 머리와 목의 위험장기 21개를 분할하며, 임상 보정 노력을 반영하는 새로운 표면 Dice 유사성 계수(surface Dice similarity coefficient)를 도입하고, 다수 데이터셋에서 일반화 가능성을 입증했습니다.
Over half a million individuals are diagnosed with head and neck cancer each year worldwide. Radiotherapy is an important curative treatment for this disease, but it requires manual time consuming delineation of radio-sensitive organs at risk (OARs). This planning process can delay treatment, while also introducing inter-operator variability with resulting downstream radiation dose differences. While auto-segmentation algorithms offer a potentially time-saving solution, the challenges in defining, quantifying and achieving expert performance remain. Adopting a deep learning approach, we demonstrate a 3D U-Net architecture that achieves expert-level performance in delineating 21 distinct head and neck OARs commonly segmented in clinical practice. The model was trained on a dataset of 663 deidentified computed tomography (CT) scans acquired in routine clinical practice and with both segmentations taken from clinical practice and segmentations created by experienced radiographers as part of this research, all in accordance with consensus OAR definitions. We demonstrate the model's clinical applicability by assessing its performance on a test set of 21 CT scans from clinical practice, each with the 21 OARs segmented by two independent experts. We also introduce surface Dice similarity coefficient (surface DSC), a new metric for the comparison of organ delineation, to quantify deviation between OAR surface contours rather than volumes, better reflecting the clinical task of correcting errors in the automated organ segmentations. The model's generalisability is then demonstrated on two distinct open source datasets, reflecting different centres and countries to model training. With appropriate validation studies and regulatory approvals, this system could improve the efficiency, consistency, and safety of radiotherapy pathways.
연구 동기 및 목표
- 방사선치료 계획을 위한 수작업으로 머리와 목의 위험장기 구획화에서 시간, 변동성 및 안전성 문제를 해결한다.
- clinically representative data에 대해 전문가 방사선사 수준의 성능에 도달하는 심층 학습 분할 모델을 개발하고 검증한다.
- 자동 분할의 교정 작업을 반영하는 임상적으로 의미 있는 평가 지표(surface DSC)를 제안한다.
제안 방법
- planning CT 스캔에서 21개의 위험장기를 구획화하기 위해 3D U-Net 아키텍처를 활용한다.
- 임상적으로 출처를 갖고 방사선사가 생성한 구획화와 함께 일반 진료에서 식별된 663개의 비식별화된 CT 스캔에서 학습한다.
- 동일 병원의 21 CT 스캔으로 구성된 테스트 세트에서 두 명의 독립된 전문가를 대상으로 평가하고, 일반화 가능성을 테스트하기 위해 개방 소스 데이터셋으로 평가한다.
- 표면 Dice 유사도 계수(surface Dice similarity coefficient, surface DSC)를 도입하여 장기별 허용 오차 내 표면 중첩을 측정하고, 부피가 아닌 수정 가능한 경계 영역에 초점을 맞춘다.
- 모델의 성능을 경험 많은 방사선사 및 종양학자 기준의 정답판정과 비교하여 전문가 수준의 성능을 확립한다.
실험 결과
연구 질문
- RQ1심층 학습 모델이 CT 계획 스캔에서 21개 머리와 목의 위험장기에 대해 전문가 수준의 구획화를 달성할 수 있는가?
- RQ2모델이 다양한 인구 통계 및 영상 프로토콜을 가진 외부 데이터셋으로 일반화되는가?
- RQ3표면 중심의 평가 지표(surface DSC)가 임상 교정 노력을 더 잘 반영하는가(체적 지표보다)?
- RQ4대표 테스트 세트에서 모델과 방사선사, 종양학자 간의 비교 성능은 어떠한가?
주요 결과
- 모델은 UCLH 테스트 세트에서 모든 21개의 위험장기에 대해 표면 DSC 성능이 장기별 허용 오차 내에서 방사선사와 유사한 성능을 보였다.
- TCIA 개방 소스 테스트 세트에서 모델은 21개 위험장기 중 19개에서 방사선사와 동등한 성능을 보였고, 두 개의 장기(뇌간, 오른쪽 렌즈)는 영상 품질로 인해 방사선사보다 낮은 성능을 보였다.
- 표면 수준의 일치를 장기별 허용 오차 내로 측정하기 위해 novel surface Dice similarity coefficient(surface DSC)을 도입했고, 임상적으로 중요한 수정 평가를 제공했다.
- 세 가지 테스트 코호트(UCLH, TCIA, PDDCA)에서 일반화 가능성을 보여주며 서로 다른 센터, 인구통계, 스캐너/프로토콜 변동에 대한 강건성을 입증했다.
- 저자들은 방사선치료 계획 자동 분할을 위한 객관적 비교와 향후 연구를 지원하기 위해 TCIA 라벨 데이터셋을 공개했다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.