[论文解读] Larger Norm More Transferable: An Adaptive Feature Norm Approach for Unsupervised Domain Adaptation
本文提出自适应特征范数(AFN)方法,逐步增大特征范数以提升无监督域自适应,在多个基准数据集上证明 SAFN 达到新的状态前沿且无需额外超参数。
Domain adaptation enables the learner to safely generalize into novel environments by mitigating domain shifts across distributions. Previous works may not effectively uncover the underlying reasons that would lead to the drastic model degradation on the target task. In this paper, we empirically reveal that the erratic discrimination of the target domain mainly stems from its much smaller feature norms with respect to that of the source domain. To this end, we propose a novel parameter-free Adaptive Feature Norm approach. We demonstrate that progressively adapting the feature norms of the two domains to a large range of values can result in significant transfer gains, implying that those task-specific features with larger norms are more transferable. Our method successfully unifies the computation of both standard and partial domain adaptation with more robustness against the negative transfer issue. Without bells and whistles but a few lines of code, our method substantially lifts the performance on the target task and exceeds state-of-the-arts by a large margin (11.5% on Office-Home and 17.1% on VisDA2017). We hope our simple yet effective approach will shed some light on the future research of transfer learning. Code is available at https://github.com/jihanyang/AFN.
研究动机与目标
- 揭示特征范数在域迁移中的作用以及源/目标域之间的模型退化。
- 提出一个无参数的 AFN 框架,用于自适应特征范数并提高迁移性能。
- 在一个鲁棒、简单的范数自适应机制下,将 vanilla 和部分域自适应统一起来。
- 通过一种轻量级、无参数的方法,在多个视觉域自适应基准上展示了最先进的性能。
提出的方法
- 定义 MMFND 用于衡量源域和目标域之间的平均特征范数差异。
- 提出 Hard AFN (HAFN),将平均特征范数对齐到一个共享标量 R,并最小化到 R 的 L2 距离。
- 引入 Stepwise AFN (SAFN),在样本之间以步长 Delta r 逐步增大特征范数。
- 提供一个统一的优化目标,将源分类损失与特征范数惩罚结合。
- 通过评估协议(CNG、ONG、PNG)扩展框架,以稳健地处理部分域自适应和负迁移。
- 使用固定超参数的无参数设置,以展示跨任务的鲁棒性。
实验结果
研究问题
- RQ1均值特征范数是否能解释无监督域自适应中目标域的判别失败,增大目标特征是否能改善迁移?
- RQ2对齐特征范数或逐步增大它们是否比传统的分布匹配获得更好的迁移?
- RQ3通过范数自适应方法,vanilla 和部分 DA 设置是否得到有效统一,该方法对负向迁移是否鲁棒?
- RQ4AFN 变体(HAFN 与 SAFN)在如 Office-Home 和 VisDA2017 等基准上的影响?
主要发现
- 在 vanilla DA 设置下,SAFN 和 HAFN 超越了 Office-Home(等)和 VisDA2017 的最先进方法。
- SAFN 在 VisDA2017 的 ResNet-101 上实现高达 67.3% 的平均精度,并显示出强大的逐域提升。
- 在部分 DA 下,SAFN 和 SAFN+ENT 变体相较基线带来显著提升(如 Office-Home 上 11.5%、VisDA2017 上 17.1%)。
- 该方法无参数、轻量级,同时在各任务中持续取得增益,对源端离群类别具有鲁棒性。
- 负迁移协议表明相较于竞争方法,SAFN 最小化负迁移效应(CNG/ONG/PNG)。
- 特征可视化表明在适应后,目标特征从小范数区域转移到更大范数且对齐更好的簇。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。