Skip to main content
QUICK REVIEW

[论文解读] Generalizing to Unseen Domains via Adversarial Data Augmentation

Riccardo Volpi, Hongseok Namkoong|arXiv (Cornell University)|May 30, 2018
Domain Adaptation and Few-Shot Learning参考文献 28被引用 365
一句话总结

本文提出在语义空间中使用基于 Wasserstein 的最坏情况形式来进行对抗性数据增强,以提高对未见域的泛化,包含迭代增强过程和针对未知目标偏移的模型集成。

ABSTRACT

We are concerned with learning models that generalize well to different \emph{unseen} domains. We consider a worst-case formulation over data distributions that are near the source domain in the feature space. Only using training data from a single source distribution, we propose an iterative procedure that augments the dataset with examples from a fictitious target domain that is "hard" under the current model. We show that our iterative scheme is an adaptive data augmentation method where we append adversarial examples at each iteration. For softmax losses, we show that our method is a data-dependent regularization scheme that behaves differently from classical regularizers that regularize towards zero (e.g., ridge or lasso). On digit recognition and semantic segmentation tasks, our method learns models improve performance across a range of a priori unknown target domains.

研究动机与目标

  • 促使学习模型在仅有单一源分布可用时对未见域具有泛化能力。
  • 在语义空间使用 Wasserstein 距离来公式化最坏情境的鲁棒性问题。
  • 开发一个迭代自适应数据增强算法,在训练过程中添加对抗样本。
  • 展示该方法对 softmax 损失具有基于数据的正则化作用,并在目标距离水平上实现集成策略。

提出的方法

  • 定义由网络表示所诱导的语义空间中的分布之间的 Wasserstein 距离 D_theta。
  • 通过引入惩罚参数 gamma 来放宽最坏情况问题,以获得鲁棒代理损失 phi_gamma。
  • 迭代地执行最大化步以通过求解 x^*_gamma = argmax_x { ell(theta; (x, y)) - gamma c_theta((x, y), (x0, y)) } 生成对抗性(困难)样本,然后在增强数据集上用 SGD 进行最小化步。
  • 将增强样本解读为自适应数据增强,近似于语义空间中的 Tikhonov 正则化的牛顿步。
  • 对于分类,表明鲁棒代理 phi_gamma 对应于一个基于数据的正则化器,鼓励真实标签分类器与类别特定分类器的软平均之间的一致性。
  • 通过以不同 gamma 值训练多个模型并在测试时使用 softmax confidences 进行选择,提供一种集成方法。

实验结果

研究问题

  • RQ1在训练阶段不获取目标域数据的情况下,使用对抗数据增强训练的模型能否对未见目标域进行泛化?
  • RQ2语义空间的 Wasserstein 鲁棒性与像素空间扰动及标准正则化相比,在提升跨域泛化方面有何不同?
  • RQ3在测试时使用具有不同目标距离水平的模型集合进行选择对鲁棒预测的作用是什么?
  • RQ4在多样化的未见域偏移下,上述技术是否在数字识别和语义分割上都能提升性能?

主要发现

  • 该方法在跨域数字识别基准测试中对多个未见目标实现了泛化性能提升。
  • 该方法在不同季节和天气条件下提升了语义分割性能,相较于 ERM 基线。
  • 在测试时基于 softmax 置信度进行选择时,具有不同鲁棒性水平的模型集成进一步带来收益。
  • 最大化步骤产生的对抗样本对应于语义空间中自适应、基于数据的牛顿式更新,具有有效的增强作用。
  • 对 softmax 损失而言,鲁棒代理充当基于数据的正则化器,将真实标签分类器与类别分类器的加权平均对齐。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。