Skip to main content
QUICK REVIEW

[论文解读] Improving Adversarial Discriminative Domain Adaptation.

Aaron Chadha, Yiannis Andreopoulos|arXiv (Cornell University)|Sep 10, 2018
Domain Adaptation and Few-Shot Learning参考文献 16被引用 8
一句话总结

本文提出了一种新颖的对抗性域自适应框架,通过扩展判别器输出以建模域与任务的联合分布,结合MMD和重建损失,将目标特征对齐至源分布,从而在图像和神经形态视觉数据集上提升了性能,优于当前最先进的无监督域自适应方法。

ABSTRACT

Adversarial discriminative domain adaptation (ADDA) is an efficient framework for unsupervised domain adaptation in image classification, where the source and target domains are assumed to have the same classes, but no labels are available for the target domain. We investigate whether we can improve performance of ADDA with a new framework and new loss formulations. Following the framework of semi-supervised GANs, we first extend the discriminator output over the source classes, in order to model the joint distribution over domain and task. We thus leverage on the distribution over the source encoder posteriors (which is fixed during adversarial training) and propose maximum mean discrepancy (MMD) and reconstruction-based loss functions for aligning the target encoder distribution to the source domain. We compare and provide a comprehensive analysis of how our framework and loss formulations extend over simple multi-class extensions of ADDA and other discriminative variants of semi-supervised GANs. In addition, we introduce various forms of regularization for stabilizing training, including treating the discriminator as a denoising autoencoder and regularizing the target encoder with source examples to reduce overfitting under a contraction mapping (i.e., when the target per-class distributions are contracting during alignment with the source). Finally, we validate our framework on standard domain adaptation datasets, such as SVHN and MNIST. We also examine how our framework benefits recognition problems based on modalities that lack training data, by introducing and evaluating on a neuromorphic vision sensing (NVS) sign language recognition dataset, where the source and target domains constitute emulated and real neuromorphic spike events respectively. Our results on all datasets show that our proposal competes or outperforms the state-of-the-art in unsupervised domain adaptation.

研究动机与目标

  • 在无目标域标签的无监督域自适应设置中,提升对抗性判别式域自适应(ADDA)的性能。
  • 通过将判别器扩展为输出源类别,对域与分类任务的联合分布进行建模。
  • 利用最大均值差异(MMD)和基于重建的损失,将目标编码器的特征分布与源域对齐。
  • 通过正则化技术稳定训练,包括对判别器进行去噪自编码器训练,以及对目标编码器实施收缩映射正则化。
  • 在SVHN和MNIST等标准基准数据集,以及一个新颖的神经形态视觉传感(NVS)手语识别数据集上评估该框架。

提出的方法

  • 将ADDA中的判别器扩展为对源类别输出,实现对域与分类任务的联合建模。
  • 利用固定的源编码器后验分布,通过MMD和基于重建的损失引导目标编码器的对齐。
  • 对判别器应用去噪自编码器目标,以提升鲁棒性与训练稳定性。
  • 通过使用源样本对目标编码器实施收缩映射正则化,以减少在分布对齐过程中的过拟合。
  • 引入多头判别器,在对抗训练中联合优化域与类别判别。
  • 采用重建损失,促使目标编码器能够重建源样本,从而对齐跨域的特征分布。

实验结果

研究问题

  • RQ1将判别器扩展为同时建模域与类别标签,是否能提升域自适应性能?
  • RQ2MMD和基于重建的损失与标准分类损失相比,在对齐源域与目标域特征方面表现如何?
  • RQ3对判别器进行去噪自编码器训练对模型稳定性与性能有何影响?
  • RQ4收缩映射正则化是否能有效减少目标编码器在域对齐过程中的过拟合?
  • RQ5所提出的框架是否能泛化至低资源识别任务,如神经形态视觉传感?

主要发现

  • 所提出的框架在标准域自适应基准(包括SVHN和MNIST)上实现了最先进或具有竞争力的性能。
  • 使用MMD和重建损失可使目标特征更好地对齐至源域,优于ADDA的简单多分类扩展。
  • 对判别器进行去噪自编码器训练可提升泛化能力并降低训练不稳定性。
  • 收缩映射正则化能有效减少目标编码器在目标域数据有限时的过拟合。
  • 该框架在低数据模态上表现出强泛化能力,在无真实目标模态训练数据的神经形态视觉传感(NVS)手语识别数据集上取得了优异性能。
  • 实证结果表明,多种评估指标上均取得一致提升,证实了联合域-任务建模与损失设计的有效性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。