QUICK REVIEW

[论文解读] Progressive Feature Alignment for Unsupervised Domain Adaptation

Chaoqi Chen, Weiping Xie|arXiv (Cornell University)|Nov 21, 2018

Domain Adaptation and Few-Shot Learning参考文献 43被引用 24

一句话总结

该论文提出了一种新型无监督域自适应方法——渐进特征对齐网络（PFAN），通过一种易到难迁移策略（EHTS）迭代选择可靠的伪标签样本，并利用自适应原型对齐（APA）方法改进跨域类别对齐。通过使用温度缩放的Softmax函数减缓源分类器的收敛速度，PFAN在三个无监督域自适应基准上实现了最先进性能，有效缓解了误差累积并保持了类别一致性。

ABSTRACT

Unsupervised domain adaptation (UDA) transfers knowledge from a label-rich source domain to a fully-unlabeled target domain. To tackle this task, recent approaches resort to discriminative domain transfer in virtue of pseudo-labels to enforce the class-level distribution alignment across the source and target domains. These methods, however, are vulnerable to the error accumulation and thus incapable of preserving cross-domain category consistency, as the pseudo-labeling accuracy is not guaranteed explicitly. In this paper, we propose the Progressive Feature Alignment Network (PFAN) to align the discriminative features across domains progressively and effectively, via exploiting the intra-class variation in the target domain. To be specific, we first develop an Easy-to-Hard Transfer Strategy (EHTS) and an Adaptive Prototype Alignment (APA) step to train our model iteratively and alternatively. Moreover, upon observing that a good domain adaptation usually requires a non-saturated source classifier, we consider a simple yet efficient way to retard the convergence speed of the source classification loss by further involving a temperature variate into the soft-max function. The extensive experimental results reveal that the proposed PFAN exceeds the state-of-the-art performance on three UDA datasets.

研究动机与目标

解决由于目标样本不可靠伪标签化导致的无监督域自适应（UDA）中的误差累积问题。
利用目标域中的类内差异性，提升伪标签样本的可靠性。
通过渐进式、迭代方式对齐源域和目标域的原型，增强跨域类别一致性。
通过引入温度可变参数减缓源分类损失的收敛速度，缓解对源数据的过拟合。
构建一个联合提升伪标签质量与域不变表示学习的鲁棒框架。

提出的方法

提出一种易到难迁移策略（EHTS），基于跨域相似性，迭代选择可靠的伪标签目标样本。
引入自适应原型对齐（APA），利用所选伪标签样本对源域和目标域的类别原型进行统计对齐，降低错误标签样本带来的偏差。
在迭代训练循环中交替使用EHTS与APA，逐步优化特征对齐并提升伪标签可靠性。
在Softmax函数中引入温度超参数，减缓源分类损失的收敛速度，促进源分类器保持非饱和状态。
使用核SVM估计A-距离，作为域差异的度量，验证分布偏移的减少。
应用t-SNE可视化比较PFAN与基线模型在特征空间中的聚类情况，证明PFAN具有更清晰的类间分离性和更小的类内差异。

实验结果

研究问题

RQ1通过迭代选择可靠的伪标签样本，能否提升无监督域自适应的鲁棒性？
RQ2自适应原型对齐在多大程度上缓解了错误标签样本在UDA中的负面影响？
RQ3减缓源分类器收敛速度在多大程度上提升了域自适应性能？
RQ4仅减少A-距离是否足以保证更高的目标域准确率？还是类级别对齐等其他因素更为关键？
RQ5能否有效利用目标域中的类内方差来提升伪标签质量与类别一致性？

主要发现

PFAN在三个标准UDA基准上达到最先进性能，优于包括RevGrad和基线模型在内的现有方法。
消融实验表明，所有组件——EHTS、APA、温度缩放和全局原型对齐——均不可或缺，任一组件的移除均导致性能显著下降。
由于EHTS的存在，伪标签准确率在整个训练过程中保持高且稳定，表明在大域偏移下仍能实现可靠的样本选择。
测试准确率与正确分类样本数量成比例增长，表明PFAN能有效抑制错误标签样本的负面影响。
t-SNE可视化显示，与RevGrad相比，PFAN学习到的特征更具判别性，类间分离更清晰，类内差异更小。
尽管A-距离的减小程度小于RevGrad，PFAN仍实现了显著更高的目标准确率，表明低域差异既非必要也非充分条件，以实现强UDA性能。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。