[论文解读] FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence
FixMatch 引入了一种简单的半监督学习(SSL)算法,它使用弱增强来生成伪标签,然后在强增强版本上进行训练以匹配这些标签;在标准 SSL 基准测试中实现了最先进的性能,包括 CIFAR-10 仅使用 250 个标签以及每个类别只需 4 个标签的情况。
Semi-supervised learning (SSL) provides an effective means of leveraging unlabeled data to improve a model's performance. In this paper, we demonstrate the power of a simple combination of two common SSL methods: consistency regularization and pseudo-labeling. Our algorithm, FixMatch, first generates pseudo-labels using the model's predictions on weakly-augmented unlabeled images. For a given image, the pseudo-label is only retained if the model produces a high-confidence prediction. The model is then trained to predict the pseudo-label when fed a strongly-augmented version of the same image. Despite its simplicity, we show that FixMatch achieves state-of-the-art performance across a variety of standard semi-supervised learning benchmarks, including 94.93% accuracy on CIFAR-10 with 250 labels and 88.61% accuracy with 40 -- just 4 labels per class. Since FixMatch bears many similarities to existing SSL methods that achieve worse performance, we carry out an extensive ablation study to tease apart the experimental factors that are most important to FixMatch's success. We make our code available at https://github.com/google-research/fixmatch.
研究动机与目标
- 将 SSL 作为一种实用方法,利用未标记数据,并尽量减少标注工作量。
- 提出一种简单的 SSL 算法,将伪标签生成与一致性正则化相结合。
- 证明强增强结合阈值化的伪标签在各项基准测试中能带来强劲的性能。
- 评估影响 SSL 性能的关键因素,包括增强策略和优化器的选择。
提出的方法
- 使用模型预测从弱增强的未标记图像中生成伪标签。
- 仅当最大类别概率超过阈值 τ 时才保留伪标签。
- 在同一未标记图像的强增强版本上训练,以通过交叉熵损失匹配伪标签。
- 将未标记数据的损失与带标注数据的标准监督损失结合起来(ℓs + λuℓu)。
- 对标签预测使用弱增强,训练时使用强增强(RandAugment/CTAugment 与 Cutout)。
- 报告对阈值设定、锐化、增强策略和正则化等因素的广泛消融实验。
实验结果
研究问题
- RQ1更简单的伪标签与一致性正则化的组合是否比更复杂的 SSL 方法具有更好性能?
- RQ2在低标注情形下,增强选择、阈值设定和优化设置如何影响 FixMatch 的性能?
- RQ3在最小超参数调整的情况下,FixMatch 能否在标准 SSL 基准测试中达到最先进的结果?
主要发现
- FixMatch 在 CIFAR-10 250 labels(94.93% accurary)以及每类 4 个标签时(88.61% accurary)达到最先进结果。
- 该方法在 CIFAR-10/100、SVHN、STL-10 和 ImageNet 上依然表现出色,通常优于以往的 SSL 方法,同时保持更简洁。
- 基于阈值的伪标签(τ = 0.95)和使用强增强对性能至关重要;仅进行锐化在使用阈值时并不能改善结果。
- 正则化选择(权重衰减)和 SGD 优化是影响 SSL 成功的重要因素,即使在 FixMatch 的简单性下也是如此。
- 来自相关 SSL 工作的扩展(如 Distribution Alignment)可以进一步提升 FixMatch 的性能,尽管核心方法简单而有效。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。