[论文解读] Semi-supervised Segmentation via Uncertainty Rectified Pyramid Consistency and Its Application to Gross Target Volume of Nasopharyngeal Carcinoma.
该论文提出了一种不确定性校正金字塔一致性(URPC)方法,这是一种半监督深度学习框架,仅使用20%的标注数据即可实现鼻咽癌(NPC)大体肿瘤体积(GTV)的半自动分割。通过利用多尺度金字塔预测和不确定性感知的一致性正则化,该方法提升了分割精度,在包含258个体素的NPC数据集上实现了81.22%的平均DSC和1.88个体素的平均表面距离(ASD)。
Gross Target Volume (GTV) segmentation plays an irreplaceable role in radiotherapy planning for Nasopharyngeal Carcinoma (NPC). Despite that convolutional neural networks (CNN) have achieved good performance for this task, they rely on a large set of labeled images for training, which is expensive and time-consuming to acquire. Recently, semi-supervised methods that learn from a small set of labeled images with a large set of unlabeled images have shown potential for dealing with this problem, but it is still challenging to train a high-performance model with the limited number of labeled data. In this paper, we propose a novel framework with Uncertainty Rectified Pyramid Consistency (URPC) regularization for semi-supervised NPC GTV segmentation. Concretely, we extend a backbone segmentation network to produce pyramid predictions at different scales, the pyramid predictions network (PPNet) was supervised by the ground truth of labeled images and a multi-scale consistency loss for unlabeled images, motivated by the fact that prediction at different scales for the same input should be similar and consistent. However, due to the different resolution of these predictions, encouraging them to be consistent at each pixel directly is not robust and may bring much noise and lead to a performance drop. To deal with this dilemma, we further design a novel uncertainty rectifying module to enable the framework to gradually learn from meaningful and reliable consensual regions at different scales. Extensive experiments on our collected NPC dataset with 258 volumes show that our method can largely improve performance by incorporating the unlabeled data, and this framework achieves a promising result compared with existing semi-supervised methods, which achieves 81.22% of mean DSC and 1.88 voxels of mean ASD on the test set, where the only 20% of the training set were annotated.
研究动机与目标
- 解决为GTV分割标注大量NPC MRI影像所面临的高成本和高劳动强度问题。
- 在标注数据有限的情况下,提升医学图像分割中半监督学习的性能。
- 开发一种稳健的多尺度一致性正则化方法,以减少不同特征金字塔层级间不一致预测带来的噪声。
- 通过基于不确定性估计的选择性学习,聚焦于跨尺度层级的一致可靠区域,从而提升模型泛化能力。
提出的方法
- 设计了一种金字塔预测网络(PPNet),从共享主干网络生成多尺度分割输出。
- 模型在标注图像上使用真实标签进行监督训练,并在未标注图像上使用多尺度一致性损失,以强制不同尺度层级之间达成一致。
- 引入不确定性校正模块,根据预测置信度动态调整一致性损失的权重,从而减少来自不可靠区域的噪声。
- 不确定性模块对每个空间位置和尺度估计不确定性,使网络在训练过程中能够聚焦于高置信度、一致的区域。
- 将不确定性感知的一致性正则化集成到基于U-Net的主干网络中,支持使用标注和未标注数据进行端到端训练。
- 通过逐步强调跨尺度的一致可靠区域,对预测进行精细化优化,从而提升模型的鲁棒性和性能。
实验结果
研究问题
- RQ1当与一致性正则化结合时,多尺度金字塔预测是否能提升NPC中半监督GTV分割的性能?
- RQ2不确定性估计在多尺度半监督学习中如何增强一致性损失的鲁棒性?
- RQ3当仅20%的训练数据被标注时,未标注数据在多大程度上能提升分割性能?
- RQ4不确定性校正是否能有效抑制不同尺度层级间噪声或不一致的预测?
- RQ5在NPC GTV分割任务中,所提出的URPC框架与现有半监督方法相比,在DSC和ASD指标上的表现如何?
主要发现
- 所提出的URPC框架在测试集上实现了81.22%的平均Dice相似系数(DSC),证明了在仅使用20%标注数据的情况下仍具有强大性能。
- 该方法将平均表面距离(ASD)降低至1.88个体素,表明在GTV勾画中具有较高的空间精度。
- 引入未标注数据显著提升了分割性能,验证了半监督学习策略的有效性。
- 不确定性校正模块有效抑制了不一致预测带来的噪声,从而实现了更稳定可靠的训练过程。
- 该框架在相同NPC数据集上优于现有半监督方法,证实其在低数据场景下的优越性。
- 消融实验证实,金字塔一致性与不确定性校正两个组件对实现最优性能均至关重要。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。