[论文解读] An Adversarial Regularisation for Semi-Supervised Training of Structured Output Neural Networks
本文提出了一种用于结构化输出神经网络半监督训练的对抗正则化方法,其中判别器能够区分来自标注数据和未标注数据的输出,从而为模型提供误差信号以提升泛化能力。该方法在语义分割任务中仅使用一半的标注数据,即可达到与完全监督训练相当的性能。
We propose a method for semi-supervised training of structured-output neural networks. Inspired by the framework of Generative Adversarial Networks (GAN), we train a discriminator network to capture the notion of a quality of network output. To this end, we leverage the qualitative difference between outputs obtained on the labelled training data and unannotated data. We then use the discriminator as a source of error signal for unlabelled data. This effectively boosts the performance of a network on a held out test set. Initial experiments in image segmentation demonstrate that the proposed framework enables achieving the same network performance as in a fully supervised scenario, while using two times less annotations.
研究动机与目标
- 减少结构化输出学习任务(如语义分割)中对大规模标注数据的依赖。
- 开发一种正则化技术,利用未标注数据,且不对主网络的架构施加约束。
- 通过判别器区分标注数据和未标注数据的输出,从而提升泛化能力。
- 实现一种与特征提取组件无关的、适用于任何结构化输出架构的端到端训练方法。
提出的方法
- 在标注数据和未标注数据上端到端训练分割网络,生成结构化输出。
- 训练一个二分类判别器,以判断某输出是否来自标注数据。
- 将判别器相对于未标注输入的负梯度作为分割网络的误差信号。
- 每更新一次主网络(k=1)后,使用交叉熵损失更新一次判别器。
- 对两个网络均使用带有动量(0.9)和权重衰减(0.001)的随机梯度下降法。
- 通过随机图像平移(0–32像素)进行数据增强,并在不使用验证集模型选择的情况下评估最终模型权重。
实验结果
研究问题
- RQ1在结构化输出学习的半监督训练中,对网络输出进行判别器对抗训练是否能提升泛化性能?
- RQ2在保持性能的前提下,未标注数据能在多大程度上减少对标注数据的需求?
- RQ3在低数据场景下,所提出的对抗正则化方法与标准权重衰减相比表现如何?
- RQ4该方法是否具备架构无关性,可应用于任意结构化输出网络的端到端训练?
主要发现
- 所提方法在测试集上达到49.3%的交并比(IoU),优于原始工作中报告的基线47.7%。
- 仅使用1/4的标注数据时,该方法即可达到使用两倍标注数据的完全监督基线的性能。
- 在1/8标注数据比例下,该方法相比采用权重衰减的基线性能提升3个百分点,表明其具有附加优势。
- 当仅使用一半标注数据时,该方法始终优于完全监督基线,表明实现同等性能可将标注成本降低两倍。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。