[论文解读] Confidence Regularized Self-Training
CRST通过使用软伪标签和输出平滑正则化,在无监督领域自适应方面提升,多个基准数据集上达到最新结果。
Recent advances in domain adaptation show that deep self-training presents a powerful means for unsupervised domain adaptation. These methods often involve an iterative process of predicting on target domain and then taking the confident predictions as pseudo-labels for retraining. However, since pseudo-labels can be noisy, self-training can put overconfident label belief on wrong classes, leading to deviated solutions with propagated errors. To address the problem, we propose a confidence regularized self-training (CRST) framework, formulated as regularized self-training. Our method treats pseudo-labels as continuous latent variables jointly optimized via alternating optimization. We propose two types of confidence regularization: label regularization (LR) and model regularization (MR). CRST-LR generates soft pseudo-labels while CRST-MR encourages the smoothness on network output. Extensive experiments on image classification and semantic segmentation show that CRSTs outperform their non-regularized counterpart with state-of-the-art performance. The code and models of this work are available at https://github.com/yzou2/CRST.
研究动机与目标
- 激发无监督领域自适应并解决自训练中嘈杂的伪标签。
- 引入一个连续伪标签框架,以放宽独热编码假设。
- 提出两种正则化范式(标签正则化和模型正则化)以稳定训练。
- 在理论上将 CRST 与正则化最大似然估计和期望最大化(EM)相关联。
- 在图像分类和语义分割基准上进行经验验证 CRST。
提出的方法
- 将 CBST 泛化为目标域上的连续伪标签。
- 引入带软伪标签和负熵约束(LRENT)的标签正则化(LR)。
- 引入带输出平滑项的模型正则化(MRL2、MRENT、MRKLD)。
- 通过交替步骤进行优化:伪标签生成和网络再训练。
- 为正则化项提供闭式解或梯度,并将 LRENT 与带温度的 softmax 联系起来。
- 证明 CRST 的变体在多个数据集上优于 CBST。
实验结果
研究问题
- RQ1在无监督领域自适应的自训练中,连续伪标签是否能提升稳定性和准确性?
- RQ2标签正则化和模型正则化是否能降低来自错误伪标签的误差传播?
- RQ3CRST 正则化项如何与已知的概率/softmax 公式相关?
- RQ4哪些正则化项在不同视觉任务上提供最佳性能?
- RQ5CRST 对分类和分割基准的经验影响是什么?
主要发现
- CRST 变体在基线未正则化的 CBST 上跨基准表现优越。
- 在单一正则化项中,使用 MRKLD 配合 LRENT 往往取得最佳或具竞争力的结果。
- 将 MRKLD 与 LRENT 结合,在 VisDA17 和 Office-31 上实现进一步提升。
- 在 GTA5→Cityscapes 和 SYNTHIA→Cityscapes 下,CRST 在 DeepLabv2 与其他骨干网络上达到最新研究水平。
- 软伪标签和输出平滑正则化降低了过度自信的错误并改善领域自适应性能。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。