Skip to main content
QUICK REVIEW

[论文解读] Unsupervised Domain Adaptation of Black-Box Source Models

Haojian Zhang, Yabin Zhang|arXiv (Cornell University)|Jan 8, 2021
Domain Adaptation and Few-Shot Learning参考文献 58被引用 37
一句话总结

本论文提出 IterLNL,一种用于黑盒无监督域自适应(B2UDA)的框架,利用来自黑盒源模型的预测,对目标数据进行迭代标注,具备噪声处理和按类别采样能力,在未访问源数据或源模型本身的情况下实现具有竞争力的结果。

ABSTRACT

Unsupervised domain adaptation (UDA) aims to learn models for a target domain of unlabeled data by transferring knowledge from a labeled source domain. In the traditional UDA setting, labeled source data are assumed to be available for adaptation. Due to increasing concerns for data privacy, source-free UDA is highly appreciated as a new UDA setting, where only a trained source model is assumed to be available, while labeled source data remain private. However, trained source models may also be unavailable in practice since source models may have commercial values and exposing source models brings risks to the source domain, e.g., problems of model misuse and white-box attacks. In this work, we study a subtly different setting, named Black-Box Unsupervised Domain Adaptation (B$^2$UDA), where only the application programming interface of source model is accessible to the target domain; in other words, the source model itself is kept as a black-box one. To tackle B$^2$UDA, we propose a simple yet effective method, termed Iterative Learning with Noisy Labels (IterLNL). With black-box models as tools of noisy labeling, IterLNL conducts noisy labeling and learning with noisy labels (LNL), iteratively. To facilitate the implementation of LNL in B$^2$UDA, we estimate the noise rate from model predictions of unlabeled target data and propose category-wise sampling to tackle the unbalanced label noise among categories. Experiments on benchmark datasets show the efficacy of IterLNL. Given neither source data nor source models, IterLNL performs comparably with traditional UDA methods that make full use of labeled source data.

研究动机与目标

  • 在仅能访问黑盒源模型 API 的前提下解决隐私保护的UDA。
  • 开发一种对来自黑盒预测的标签噪声不平衡性进行鲁棒学习的策略。
  • 在没有标注的目标数据的情况下估计噪声率,并按类别自适应选择训练样本。
  • 在不使用源数据的前提下,将目标域性能提高到接近传统UDA和白盒UDA基线的水平。

提出的方法

  • 从黑盒源模型获取目标预测以为未标注的目标数据生成带噪标签。
  • 利用一个再缩放的基于概率的度量从目标预测中估计噪声率以指导训练(eq. 6–10)。
  • 应用按类别采样,在每个类别的缓冲区内选择最低损失的样本用于训练(具有每类别缓冲区)。
  • 使用带噪标签的学习(LNL)更新目标模型,并由逐步下降的课程R(n)引导训练(eq. 6)。
  • 迭代更新目标模型并将其重新用作后续标注轮次的新黑盒源(IterLNL 循环)。

实验结果

研究问题

  • RQ1当只提供黑盒源模型API且无源数据时,B2UDA 是否能实现具竞争力的性能?
  • RQ2在B2UDA中,如何有效处理由域转移引起的标签噪声不平衡?
  • RQ3哪些机制(噪声率估计、按类别采样、迭代)推动 IterLNL 的鲁棒学习?
  • RQ4IterLNL 在基准数据集上与现有的 B2UDA、无源学习 UDA 和标准 UDA 方法相比如何?

主要发现

  • IterLNL 在基准数据集上显著优于现有的 B2UDA 方法。
  • IterLNL 的结果可与白盒UDA方法和传统UDA相媲美,尽管无法访问源数据或源模型内部结构。
  • 按类别采样和迭代学习对于处理高度不平衡的标签噪声以及避免类别特定的失败至关重要。
  • 消融研究显示噪声率估计、再缩放曲线以及按类别采样对鲁棒性能的重要性。
  • 在 VisDA-2017、Office31 和 Digits 任务上,IterLNL 超越基线源模型和若干 B2UDA 变体,取得显著优势。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。