[论文解读] Multi-Adversarial Domain Adaptation
MADA 引入多类级域判别器,以对源数据和目标数据进行细粒度的多对抗对齐,从而在未监督域自适应方面优于以往单判别器方法。
Recent advances in deep domain adaptation reveal that adversarial learning can be embedded into deep networks to learn transferable features that reduce distribution discrepancy between the source and target domains. Existing domain adversarial adaptation methods based on single domain discriminator only align the source and target data distributions without exploiting the complex multimode structures. In this paper, we present a multi-adversarial domain adaptation (MADA) approach, which captures multimode structures to enable fine-grained alignment of different data distributions based on multiple domain discriminators. The adaptation can be achieved by stochastic gradient descent with the gradients computed by back-propagation in linear-time. Empirical evidence demonstrates that the proposed model outperforms state of the art methods on standard domain adaptation datasets.
研究动机与目标
- 通过利用数据分布中的多模态结构来激励并解决域自适应中的负迁移。
- 提出一个框架,使用多个按类别区分的域判别器,以实现源域和目标域之间的细粒度对齐。
- 证明通过按标签预测概率对域判别器输入加权可以提升迁移性能。
提出的方法
- 将单个域判别器拆分为 K 个按类别的判别器 G_d^k,每个负责对齐属于类别 k 的数据。
- 使用标签预测器 G_y 生成每个样本的类别概率 ŷ_i^k,以对每个 G_d^k 的输入进行加权,形成一种软性、类似注意力的机制。
- 优化一个联合目标,最小化源分类损失以及跨所有 K 个判别器的域判别损失的加权和。
- 使用随机梯度下降和梯度反向传播机制进行训练,以促进域混淆同时保持判别性的类别结构。
- 提供线性时间的反向传播以实现与深度网络兼容的高效训练。
实验结果
研究问题
- RQ1通过多个判别器利用多模态(按类别分)的结构,能否改善源域与目标域之间的对齐?
- RQ2将域判别器输入按类别概率加权,相较于单一判别器,能否降低负迁移?
- RQ3在标准基准上,MADA 相对于现有的深度域自适应方法的表现如何?
主要发现
- 在无监督域自适应中,MADA 在 Office-31 和 ImageCLEF-DA 基准测试上超过了最新方法。
- 在域差异较大的困难迁移任务上,MADA 展现出显著提升(例如 A→W、A→D、D→A、W→A)。
- 在消融和鲁棒性分析中,MADA 比单判别器方法更能减少负迁移,并保持稳定收敛。
- 特征可视化表明,MADA 产生的特征比 RevGrad 更具判别性且对域不变。
- 完全在多个判别器间共享参数的共享策略可能会降低性能,支持需要独立的按类别区分的判别器。
- Proxy A-distance 分析显示,MADA 特征的域差异比 RevGrad 或普通 ResNet 特征更小。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。