[论文解读] Learning under Distributed Weak Supervision
本文提出一种基于网络的众包框架,利用非专家标注者提供的超像素弱标注,训练全卷积神经网络(FCN)以实现T2加权MR图像中的胎儿脑部分割。尽管仅使用非专家的弱标注,该方法仍实现了与全监督方法相当的最先进性能,将标注时间从专家的三天减少至12名非专家的不到一小时。
The availability of training data for supervision is a frequently encountered bottleneck of medical image analysis methods. While typically established by a clinical expert rater, the increase in acquired imaging data renders traditional pixel-wise segmentations less feasible. In this paper, we examine the use of a crowdsourcing platform for the distribution of super-pixel weak annotation tasks and collect such annotations from a crowd of non-expert raters. The crowd annotations are subsequently used for training a fully convolutional neural network to address the problem of fetal brain segmentation in T2-weighted MR images. Using this approach we report encouraging results compared to highly targeted, fully supervised methods and potentially address a frequent problem impeding image analysis research.
研究动机与目标
- 通过将弱标注任务分发给非专家众包,解决医学图像分析中专家标注数据的瓶颈问题。
- 评估非专家是否能够为T2加权MR图像中的胎儿脑部分割生成可靠的超像素标注。
- 使用弱监督数据训练全卷积神经网络(FCN),并与全监督基线进行性能比较。
- 证明分布式弱监督可在显著减少标注时间的同时,实现接近专家水平监督的性能。
提出的方法
- 使用JavaScript开发了基于网络的众包接口,实现客户端的SLIC超像素分割,从而高效分发标注任务。
- 非专家标注者使用改进的LabelMe风格界面,对体积MR图像中的胎儿脑部所属超像素进行选择。
- 采用包含四层堆叠卷积与池化层、随后为两层分类层及跳跃连接的全卷积神经网络(FCN)进行分割。
- FCN采用反卷积层进行上采样,并通过逐元素相加将低层特征与高层语义预测相结合。
- 模型在来自专家和非专家标注者的弱监督数据上进行训练,结合数据增强和随机采样以减少方差。
- 通过与人工创建的金标准对比,使用Dice相似性系数(DSC)评估性能。
实验结果
研究问题
- RQ1非专家标注者能否为T2加权MR图像中的胎儿脑部分割生成可靠的超像素标注?
- RQ2在非专家弱监督数据上训练的全卷积神经网络的性能与全监督训练相比如何?
- RQ3分布式弱监督能否在保持高分割精度的同时减少标注时间?
- RQ4系统性标注错误(如颅骨或脑脊液误分类)对模型性能有何影响?
主要发现
- 在非专家弱标注数据上训练的FCN获得了0.85的Dice相似性系数(DSC),与专家监督基线相当。
- 每幅切片的平均标注时间为7.2 ± 3.4秒,12名非专家在不到一小时内完成了超过5,000幅切片的标注。
- 使用多平面界面进行专家手动分割的总标注时间约为三天全工作日,凸显了90%的时间减少。
- 在非专家弱标注数据上训练的模型性能与在专家弱标注数据上训练的模型相似,两者均实现了较高的DSC值。
- 观察到系统性错误,如颅骨过度分割和脑脊液被排除,可能源于对超像素边界的理解差异。
- 结果表明,对临床专业知识要求较低的解剖结构分割任务可有效实现众包,从而实现医学图像学习中可扩展的数据收集。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。