[论文解读] Adversarial AutoAugment
论文提出一种对抗性增强策略网络,在目标网络训练过程中动态生成增强策略,复用计算以评估策略,显著降低成本同时在 CIFAR 和 ImageNet 上提升准确率。
Data augmentation (DA) has been widely utilized to improve generalization in training deep neural networks. Recently, human-designed data augmentation has been gradually replaced by automatically learned augmentation policy. Through finding the best policy in well-designed search space of data augmentation, AutoAugment can significantly improve validation accuracy on image classification tasks. However, this approach is not computationally practical for large-scale problems. In this paper, we develop an adversarial method to arrive at a computationally-affordable solution called Adversarial AutoAugment, which can simultaneously optimize target related object and augmentation policy search loss. The augmentation policy network attempts to increase the training loss of a target network through generating adversarial augmentation policies, while the target network can learn more robust features from harder examples to improve the generalization. In contrast to prior work, we reuse the computation in target network training for policy evaluation, and dispense with the retraining of the target network. Compared to AutoAugment, this leads to about 12x reduction in computing cost and 11x shortening in time overhead on ImageNet. We show experimental results of our approach on CIFAR-10/CIFAR-100, ImageNet, and demonstrate significant performance improvements over state-of-the-art. On CIFAR-10, we achieve a top-1 test error of 1.36%, which is the currently best performing single model. On ImageNet, we achieve a leading performance of top-1 accuracy 79.40% on ResNet-50 and 80.00% on ResNet-50-D without extra data.
研究动机与目标
- 推动在训练期间自适应的数据增强,而不是使用固定策略。
- 在对抗性、在线框架中联合优化目标网络训练与增强策略搜索。
- 通过复用目标网络训练计算以评估策略来降低计算成本。
- 在 CIFAR-10/100 和 ImageNet 上在不使用额外数据的情况下展示最先进的结果。
提出的方法
- 构建一个 min-max 博弈,其中增强策略网络(一个 RNN 控制器)生成对抗性增强策略以最大化训练损失。
- 在包含每个输入多个增强实例的大批量上训练目标网络,使用与策略相关的损失作为奖励。
- 使用 REINFORCE 训练策略网络,采用移动平均基线以降低梯度方差。
- 修改 AutoAugment 的搜索空间,包含 16 种操作和 10 个强度等级,每个策略组成 5 个子策略。
- 复用目标网络训练中的计算来评估策略,避免为每个策略重新训练目标网络。
- 在训练过程中动态应用策略,随着训练进行提高变换难度。
实验结果
研究问题
- RQ1对抗性训练的增强策略是否比固定或随机抽样的策略更高效地提升泛化?
- RQ2在整个数据集上进行在线、动态策略搜索是否比代理任务 AutoAugment 降低计算成本?
- RQ3对抗性增强策略是否在不使用额外数据的情况下提升 CIFAR-10/100 和 ImageNet 的性能?
主要发现
- 在 CIFAR-10 上,使用 PyramidNet+ShakeDrop 获得 1.36% 的 top-1 测试误差,超过先前的最先进水平。
- 在 CIFAR-10/100 上,我们的方法在多种模型(如 Wide-ResNet-28-10、Shake-Shake 变体、PyramidNet+ShakeDrop 等)上持续优于 AutoAugment 和 PBA。
- 在 ImageNet 上,在 ResNet-50 上达到 79.40% 的 top-1 准确率,在 ResNet-50-D 上达到 80.00%,且不使用额外数据,超过 AutoAugment。
- 使用对抗性策略训练相比 AutoAugment,在 ImageNet 的 ResNet-50 上将计算成本降低约 12 倍,时间开销约降低 11 倍。
- 迁移性:学习到的策略在跨数据集/架构迁移时表现具有竞争力,尽管策略迁移通常不如联合学习那样有效。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。