QUICK REVIEW

[논문 리뷰] Efficient Semi-Supervised Gross Target Volume of Nasopharyngeal Carcinoma Segmentation via Uncertainty Rectified Pyramid Consistency

Xiangde Luo, Wenjun Liao|arXiv (Cornell University)|2020. 12. 13.

Head and Neck Cancer Studies참고 문헌 28인용 수 23

한 줄 요약

이 논문은 제한된 레이블이 부여된 MRI 데이터를 사용하여 후두부암(NPC)에서의 효율적인 총 목표 부위(GTV) 분할을 위한 새로운 준지도 학습 프레임워크인 불확실성 보정 피라미드 일致성(URPC)을 제안한다. 피라미드 네트워크에서 다중 척도 예측을 활용하고 단일 순방향 전파에서 예측 분산을 통해 불확실성 추정을 수행함으로써, URPC는 일치 정규화를 향상시키고 최신 기술 수준의 성능을 달성하며, 레이블이 50%인 경우 평균 DICE 스코어 82.74%를 기록한다.

ABSTRACT

Gross Target Volume (GTV) segmentation plays an irreplaceable role in radiotherapy planning for Nasopharyngeal Carcinoma (NPC). Despite that Convolutional Neural Networks (CNN) have achieved good performance for this task, they rely on a large set of labeled images for training, which is expensive and time-consuming to acquire. In this paper, we propose a novel framework with Uncertainty Rectified Pyramid Consistency (URPC) regularization for semi-supervised NPC GTV segmentation. Concretely, we extend a backbone segmentation network to produce pyramid predictions at different scales. The pyramid predictions network (PPNet) is supervised by the ground truth of labeled images and a multi-scale consistency loss for unlabeled images, motivated by the fact that prediction at different scales for the same input should be similar and consistent. However, due to the different resolution of these predictions, encouraging them to be consistent at each pixel directly has low robustness and may lose some fine details. To address this problem, we further design a novel uncertainty rectifying module to enable the framework to gradually learn from meaningful and reliable consensual regions at different scales. Experimental results on a dataset with 258 NPC MR images showed that with only 10% or 20% images labeled, our method largely improved the segmentation performance by leveraging the unlabeled images, and it also outperformed five state-of-the-art semi-supervised segmentation methods. Moreover, when only 50% images labeled, URPC achieved an average Dice score of 82.74% that was close to fully supervised learning.

연구 동기 및 목표

NPC 총 목표 부위(GTV) 분할을 위한 딥 러닝 모델 학습에 필요한 높은 애너테이션 비용 문제를 해결하기 위해 완전히 레이블이 부여된 데이터에 대한 의존도를 줄이기.
비정상적 또는 신뢰할 수 없는 가짜 레이블로 인해 발생하는 준지도 학습의 불안정성과 세부 정보 손실 문제를 해결하기.
비용이 많이 드는 몬테카를로 샘플링을 피하면서도 더 빠르고 안정적인 학습을 가능하게 하는 효율적인 불확실성 추정 방법 개발하기.
다중 척도 예측 간의 일관성 강제를 통해 준지도 의료 영상 분할의 일반화 능력과 강인성을 향상시키기.
특히 애너테이션이 시간이 많이 소요되는 임상 환경에서, 최소한의 레이블 데이터로도 완전 지도 학습에 가까운 성능 달성하기.

제안 방법

단일 입력에서 다중 공간 척도에서의 분할 출력을 생성하는 피라미드 예측 네트워크(PPNet) 설계하기.
모든 피라미드 척도에서 레이블이 부여된 이미지에 표준 지도 학습 손실 적용하여 다중 척도 특징 학습 지원하기.
비레이블 이미지에 대해 피라미드 일치 손실을 적용하여 다양한 해상도 간의 일致성 강제하기.
단일 순방향 전파에서 척도 간 예측 분산을 이용해 불확실성 추정하기, 이는 계산 비용이 높은 몬테카를로 샘플링 대체하기.
신뢰할 수 없는 예측(예: 경계 근처)을 동적으로 억제하는 불확실성 보정 모듈 도입하여 학습 안정성 향상 및 세부 정보 유지하기.
불확실성 맵을 사용해 일치 손실을 가이드하여 높은 신뢰도의 신뢰할 수 있는 영역에 집중하고 노이즈 유도 붕괴 감소시키기.

실험 결과

연구 질문

RQ1다중 척도 예측 일치성이 준지도 의료 영상 분할에서 효과적이고 효율적인 정규화 신호로 기능할 수 있는가?
RQ2척도 간 예측 분산에서 추정한 불확실성이 몬테카를로 드롭아웃을 대체해 성능 저하 없이 불확실성 추정에 활용될 수 있는가?
RQ3불확실성 유도 일치가 GTV 분할에서 모델의 강인성 향상과 세밀한 해부학적 세부 정보 유지에 기여하는가?
RQ4준지도 학습 프레임워크가 얼마나 효과적으로 애너테이션 부담을 줄일 수 있으며, NPC GTV 분할의 높은 정확도를 유지할 수 있는가?
RQ5성능 및 계산 효율성 측면에서 제안된 방법은 최신 기술 수준의 준지도 학습 방법들과 비교해 어떻게 성과를 내는가?

주요 결과

레이블이 10%인 경우 URPC는 평균 DICE 스코어 81.22%를 기록하여 지도 학습(77.44%)과 기존 최신 기술 수준 방법들을 뛰어넘었다.
레이블이 20%인 경우 URPC는 평균 DICE 스코어 81.22%를 기록하여 EM, UAMT, DAN을 포함한 모든 비교된 최신 기술 수준 방법들을 능가했다.
레이블이 50%인 경우 URPC는 평균 DICE 스코어 82.74%를 기록하여 완전 지도 학습(100% 레이블 기준 83.51%)에 근접한 성능를 달성했다.
URPC가 생성한 불확실성 맵은 경계 영역을 효과적으로 강조하여 신뢰할 수 있는 신뢰도 추정과 노이즈 억제에 기여했다.
특히 3D 볼륨 수준 평가에서 모델의 일반화 능력 향상과 거짓 음성 감소를 입증했다.
단일 순방향 전파 기반의 불확실성 추정으로 다중 전파가 필요한 방법들에 비해 학습 시간과 메모리 비용을 감소시켰다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.