[论文解读] Toward Robustness against Label Noise in Training Deep Discriminative Neural Networks
提出一个半监督 CNN-CRF 框架,通过建模干净标签和噪声标签的关系,使用潜在变量和辅助分布对深度判别网络进行训练,以在图像标注任务(包括 CIFAR-10 和 MS COCO)上实现鲁棒性。
Collecting large training datasets, annotated with high-quality labels, is costly and time-consuming. This paper proposes a novel framework for training deep convolutional neural networks from noisy labeled datasets that can be obtained cheaply. The problem is formulated using an undirected graphical model that represents the relationship between noisy and clean labels, trained in a semi-supervised setting. In our formulation, the inference over latent clean labels is tractable and is regularized during training using auxiliary sources of information. The proposed model is applied to the image labeling problem and is shown to be effective in labeling unseen images as well as reducing label noise in training on CIFAR-10 and MS COCO datasets.
研究动机与目标
- 解决用廉价收集的带噪声标签训练深层 CNN 的挑战。
- 引入一个条件随机场(CRF)结构,用潜在变量耦合干净标签和噪声标签。
- 提供一个半监督目标,利用辅助信息对学习进行正则化。
- 在标准图像数据集(CIFAR-10 和 MS COCO)上展示鲁棒性和标注性能的提升。
提出的方法
- 在一个将干净标签与噪声标签条件化于输入 x 的 CRF 内,将干净标签建模为潜在变量。
- 引入隐藏二值变量 h 以捕捉标签之间的相关性,同时保持推断的可控性。
- 定义一个二次能量函数,其偏置来自 CNN,及 y 与 ŷ 之间的对偶互动,由 W 和 W'(CRF-CNN)正则化。
- 建立一个结合完全标注的干净数据和带噪声标签数据的半监督学习目标,通过持久对比散度(类似 EM)进行优化。
- 纳入辅助分布 p_aux 以正则化潜在推断并引导 q(ŷ,h|y,x) 朝向 p_aux,其受超参数 α 控制。
- 端到端训练,交替进行 E 步(更新 q)和 M 步(更新 θ),并通过调度 α 将对 p_aux 的依赖随时间转移到 p_θ。
- 使用受限玻尔兹曼机(RBM)作为在干净数据上训练的辅助模型,在 CNN-CRF 训练期间固定其参数。
实验结果
研究问题
- RQ1CNN-CRF 框架是否能够建模噪声标签与干净标签之间的关系,以提高深度网络对标签噪声的鲁棒性?
- RQ2如何将辅助信息纳入,以在半监督训练中对潜在的干净标签推断进行正则化?
- RQ3相比基线,提出的方法是否在带噪声标签的数据集上提升了图像标注性能?
- RQ4在多类分类与多标签设置下,以及在不同网络结构(例如 VGG-16、ResNet-50)上的性能如何?
主要发现
- CNN-CRF 模型通过显式建模干净标签与噪声标签的关系(含潜在变量)来实现对标签噪声的鲁棒性。
- 通过 p_aux 引入辅助分布并调度 α,可改善潜在变量推断和训练稳定性。
- 在带噪声标签的 Microsoft COCO 数据集及 COCO Flickr-Tag 设置上,相较于若干基线,方法获得了更好的标注性能。
- 该方法可适用于多类和多标签分类,可以集成为现有网络中的鲁棒损失层。
- 在使用 VGG-16 或 ResNet-50 架构时,模型在评估的配置中相较于带噪声标签的基线训练显示出提升。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。