Skip to main content
QUICK REVIEW

[论文解读] Efficient Semi-Supervised Gross Target Volume of Nasopharyngeal Carcinoma Segmentation via Uncertainty Rectified Pyramid Consistency

Xiangde Luo, Wenjun Liao|arXiv (Cornell University)|Dec 13, 2020
Head and Neck Cancer Studies参考文献 28被引用 23
一句话总结

该论文提出了一种新型半监督学习框架——不确定性校正金字塔一致性(URPC),旨在使用有限的标注MRI数据,实现鼻咽癌(NPC)大体靶体积(GTV)分割的高效训练。通过利用金字塔网络生成的多尺度预测,并在单次前向传播中通过预测方差估计不确定性,URPC提升了一致性正则化效果,实现了最先进性能,在仅使用50%标注数据的情况下,平均Dice分数达到82.74%。

ABSTRACT

Gross Target Volume (GTV) segmentation plays an irreplaceable role in radiotherapy planning for Nasopharyngeal Carcinoma (NPC). Despite that Convolutional Neural Networks (CNN) have achieved good performance for this task, they rely on a large set of labeled images for training, which is expensive and time-consuming to acquire. In this paper, we propose a novel framework with Uncertainty Rectified Pyramid Consistency (URPC) regularization for semi-supervised NPC GTV segmentation. Concretely, we extend a backbone segmentation network to produce pyramid predictions at different scales. The pyramid predictions network (PPNet) is supervised by the ground truth of labeled images and a multi-scale consistency loss for unlabeled images, motivated by the fact that prediction at different scales for the same input should be similar and consistent. However, due to the different resolution of these predictions, encouraging them to be consistent at each pixel directly has low robustness and may lose some fine details. To address this problem, we further design a novel uncertainty rectifying module to enable the framework to gradually learn from meaningful and reliable consensual regions at different scales. Experimental results on a dataset with 258 NPC MR images showed that with only 10% or 20% images labeled, our method largely improved the segmentation performance by leveraging the unlabeled images, and it also outperformed five state-of-the-art semi-supervised segmentation methods. Moreover, when only 50% images labeled, URPC achieved an average Dice score of 82.74% that was close to fully supervised learning.

研究动机与目标

  • 通过减少对完全标注数据的依赖,降低训练深度学习模型进行NPC大体靶体积(GTV)分割的高标注成本。
  • 克服因未标注数据中噪声或不可靠伪标签导致的半监督学习不稳定性与细节丢失问题。
  • 开发一种高效的不确定性估计方法,避免昂贵的蒙特卡洛采样,实现更快、更稳定的训练。
  • 通过强制多尺度预测间的一致性,提升半监督医学图像分割的泛化能力与鲁棒性。
  • 在仅使用极少标注数据的情况下,实现接近完全监督学习的性能,尤其适用于标注耗时的临床场景。

提出的方法

  • 设计一种金字塔预测网络(PPNet),从单个输入生成多个空间尺度的分割输出。
  • 在所有金字塔尺度上对标注图像应用标准监督损失,以监督多尺度特征学习。
  • 通过金字塔一致性损失在未标注图像上强制多尺度预测的一致性,促进不同分辨率间的预测一致性。
  • 在单次前向传播中利用不同尺度间预测的方差估计不确定性,替代计算成本高昂的蒙特卡洛采样。
  • 引入不确定性校正模块,动态抑制不可靠预测(如边界附近区域),以提升训练稳定性并保留精细细节。
  • 利用不确定性图引导一致性损失,使学习聚焦于高置信度、可靠的区域,减少噪声引起的崩溃。

实验结果

研究问题

  • RQ1多尺度预测一致性能否作为半监督医学图像分割中有效且高效的正则化信号?
  • RQ2能否通过多尺度间预测方差估计不确定性,替代蒙特卡洛Dropout方法,同时不损失性能?
  • RQ3不确定性引导的一致性是否能提升模型鲁棒性,并在GTV分割中保留细粒度解剖细节?
  • RQ4半监督框架在多大程度上可减少标注负担,同时保持NPC GTV分割的高精度?
  • RQ5与当前最先进方法相比,所提出方法在性能与计算效率方面表现如何?

主要发现

  • 仅使用10%标注数据时,所提出的URPC方法实现了81.22%的平均Dice分数,显著优于监督学习(77.44%)和现有SOTA方法。
  • 在20%标注数据下,URPC实现了81.22%的平均Dice分数,超越所有对比的SOTA方法,包括EM、UAMT和DAN。
  • 当50%的数据被标注时,URPC实现了82.74%的平均Dice分数,接近完全监督学习的性能(使用100%标签时为83.51%)。
  • URPC生成的不确定性图有效突出了边界区域,表明其具备可靠的置信度估计能力,并有助于噪声抑制。
  • 该方法在GTV分割中表现出更优的泛化能力,并显著减少了假阴性,尤其在3D体素级评估中表现突出。
  • 单次前向传播的不确定性估计相比需要多次前向传播的不确定性估计方法,显著降低了训练时间和内存消耗。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。