Skip to main content
QUICK REVIEW

[论文解读] Few-Shot Adversarial Domain Adaptation

Saeid Motiian, Quinn Jones|arXiv (Cornell University)|Nov 5, 2017
Adversarial Robustness in Machine Learning参考文献 47被引用 205
一句话总结

FADA 使用 四组样本对对抗设置,配合一个领域-类别判别器,在目标标签极少的情况下实现有监督域自适应,达到语义对齐和领域混淆。

ABSTRACT

This work provides a framework for addressing the problem of supervised domain adaptation with deep models. The main idea is to exploit adversarial learning to learn an embedded subspace that simultaneously maximizes the confusion between two domains while semantically aligning their embedding. The supervised setting becomes attractive especially when there are only a few target data samples that need to be labeled. In this few-shot learning scenario, alignment and separation of semantic probability distributions is difficult because of the lack of data. We found that by carefully designing a training scheme whereby the typical binary adversarial discriminator is augmented to distinguish between four different classes, it is possible to effectively address the supervised adaptation problem. In addition, the approach has a high speed of adaptation, i.e. it requires an extremely low number of labeled target training samples, even one per category can be effective. We then extensively compare this approach to the state of the art in domain adaptation in two experiments: one using datasets for handwritten digit recognition, and one using datasets for visual object recognition.

研究动机与目标

  • 在深度视觉识别任务中,当目标标签稀缺时,激发域自适应的动力。
  • 提出一个利用对抗学习与语义对信息的训练方案。
  • 在成对分组中编码领域和类别信息,以促进领域混淆和语义对齐。
  • 证明极少的带标签目标样本(甚至每个类别只有一个)就能显著优于仅源数据的基线。

提出的方法

  • 创建四组编码领域与类别关系的样本对(同源-同类、源-目标-同类、源-不同类、源-目标-不同类)。
  • 训练一个多类领域-类别判别器(DCD),将样本对分为这四组。
  • 使用对抗目标更新特征提取器 g,使 DCD 无法区分某些组别(促进领域混淆与语义对齐)。
  • 为源/目标特征提取器(g_s, g_t)采用权重共享或非权重共享方案,并学习用于分类的 h,同时在分类损失与混淆损失之间引入平衡项 gamma。
  • 迭代地训练 DCD(冻结 g),然后训练 g/h(冻结 DCD)以达到收敛。
  • 在 MNIST-USPS-SVHN 与 Office 数据集上进行评估,比较有监督的 SDA 和多种 UDA 基线。

实验结果

研究问题

  • RQ1在使用对抗学习时,每类极少量的带标签目标样本是否能够支持有效的有监督域自适应?
  • RQ2在成对采样(四组 DCD)中编码领域和类别信息是否比纯域混淆更能提升语义对齐?
  • RQ3在极小的目标数据情况下,权重共享与分离的源/目标特征提取器有何影响?
  • RQ4在数字和对象识别基准测试中,FADA 相对最先进的 SDA 和 UDA 方法的表现如何?
  • RQ5当目标标签从 1 增加到每个类别的一小组时,所提出的方法是否会带来快速的提升?

主要发现

  • FADA 在 MNIST-USPS-SVHN 任务中,与最先进的 SDA 及若干 UDA 方法相比,甚至在每类仅1个带标签目标样本的情况下也能达到竞争性或更高的准确率。
  • 随着每个类别带标签目标样本数量的增加,性能提升,在相对很小的目标数据预算下实现高准确率。
  • 源和目标特征提取器之间的权重共享提供正则化,在稀缺标签条件下相对于非权重共享提高稳定性。
  • 在 Office 数据集上,FADA 的准确率达到或优于该论文评估协议下的若干无监督与有监督基线。
  • 四组配对策略实现了领域混淆与语义类别对齐,解决了以往对抗性域自适应仅关注领域不变性的局限性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。