QUICK REVIEW

[论文解读] Semi-supervised Domain Adaptation via Minimax Entropy

Kuniaki Saito, Donghyun Kim|arXiv (Cornell University)|Apr 13, 2019

Domain Adaptation and Few-Shot Learning参考文献 39被引用 76

一句话总结

简要结论：引入 Minimax Entropy (MME)，一种对抗性、基于熵的SSDA方法，通过在未标注目标数据上交替最大熵和在特征提取器中最小熵，学习领域不变的原型和判别特征。

ABSTRACT

Contemporary domain adaptation methods are very effective at aligning feature distributions of source and target domains without any target supervision. However, we show that these techniques perform poorly when even a few labeled examples are available in the target. To address this semi-supervised domain adaptation (SSDA) setting, we propose a novel Minimax Entropy (MME) approach that adversarially optimizes an adaptive few-shot model. Our base model consists of a feature encoding network, followed by a classification layer that computes the features' similarity to estimated prototypes (representatives of each class). Adaptation is achieved by alternately maximizing the conditional entropy of unlabeled target data with respect to the classifier and minimizing it with respect to the feature encoder. We empirically demonstrate the superiority of our method over many baselines, including conventional feature alignment and few-shot methods, setting a new state of the art for SSDA.

研究动机与目标

在目标标签数量很少的SSDA设置中，演示无监督/领域对齐方法的局限性。
提出一种最小-最大熵框架，通过利用未标记的目标数据来适应分类器。
开发一个基于余弦相似性的原型分类器，其原型通过基于熵的目标进行自适应。
证明 MM E 在 DomainNet、Office-Home 和 Office 数据集的 one-shot 与 three-shot 设置中优于基线。

提出的方法

采用一个基于相似度的网络，包含特征提取器 F 和使用类原型 W 的余弦相似度分类器 C。
通过最大化未标注目标数据上的预测熵来估计领域不变的类别原型（原型自适应）。
相对于特征提取器最小化熵，以将未标注目标特征聚集在原型周围（判别性聚簇）。
用带标签的源数据和目标数据的标准分类损失来训练 F 和 C，并加上由超参数 lambda 控制的 minimax 熵项。
通过梯度反转层实现极小极大博弈，以联合优化熵最大化（针对 C）和熵最小化（针对 F）。
在 DomainNet、Office-Home 和 Office 数据集上，以 one-shot 和 three-shot 目标标签制度进行评估，报告相较于基线的改进。

实验结果

研究问题

RQ1当只有少量标注目标样本可用时，现有的 UDA/SSL 方法是否能提升 SSDA 的性能？
RQ2一种对抗性、基于熵的估计领域不变原型的方法是否能提升目标域的判别能力？
RQ3在未标注目标数据上最大化熵以调整原型，然后在特征提取器中进行熵最小化，是否能降低域间差异并提高准确率？
RQ4MM E 相较于标准熵最小化和基于域对齐的基线，在多个数据集和网络骨干上表现如何？

主要发现

MME 在跨多个基准和架构的 SSDA 上取得了最先进的性能。
与基线相比，MME 在 one-shot 和 three-shot 设置下相对于简单的源-目标训练在误差上有显著下降。
基于熵的原型自适应结合 featureExtractor 聚类，带来更好的域对齐和具有判别力的目标特征。
MME 一贯优于仅依赖特征分布对齐的无监督域适应方法，在 SSDA 场景中。
可视化和分析显示，在 MME 下，域差异减少，目标特征簇更紧凑、以原型为中心。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。