[论文解读] An introduction to domain adaptation and transfer learning
本技术报告综述在什么条件下、以何种方式在源域训练的分类器可以泛化到目标域,详细讨论简单数据分布转变及自适应策略。
In machine learning, if the training data is an unbiased sample of an underlying distribution, then the learned classification function will make accurate predictions for new samples. However, if the training data is not an unbiased sample, then there will be differences between how the training data is distributed and how the test data is distributed. Standard classifiers cannot cope with changes in data distributions between training and test phases, and will not perform well. Domain adaptation and transfer learning are sub-fields within machine learning that are concerned with accounting for these types of changes. Here, we present an introduction to these fields, guided by the question: when and how can a classifier generalize from a source to a target domain? We will start with a brief introduction into risk minimization, and how transfer learning and domain adaptation expand upon this framework. Following that, we discuss three special cases of data set shift, namely prior, covariate and concept shift. For more complex domain shifts, there are a wide variety of approaches. These are categorized into: importance-weighting, subspace mapping, domain-invariant spaces, feature augmentation, minimax estimators and robust algorithms. A number of points will arise, which we will discuss in the last section. We conclude with the remark that many open questions will have to be addressed before transfer learners and domain-adaptive classifiers become practical.
研究动机与目标
- 解释领域自适应与迁移学习的一般问题以及在分布转变下为何标准分类器会失败。
- 定义领域并形式化跨领域泛化风险界限。
- 刻画简单的数据转变(先验、协变量、概念)并讨论相应的自适应策略。
- 提出针对更复杂领域转变的方法学分类(如重要性加权、子空间映射、领域不变空间、特征增强、极小极大估计量、鲁棒算法)的分类。
- 突显在使迁移学习器和域自适应分类器可行方面的未解决问题和实际挑战。
提出的方法
- 将讨论置于风险最小化和经验风险框架之中。
- 引入跨域设定的泛化界,使用如 HΔH-发散度 和 联合误差 e*_{S,T} 等度量。
- 在分布转变下通过重要性加权和联合分布比值调整(R_T(h) 及相关形式)推导目标风险估计量。
- 将数据转变分为先验、协变量和概念转变,并给出相应的自适应技术。
- 提供对更复杂领域转变的自适应方法的结构化概览(如领域不变空间、特征增强、极小极大估计量、鲁棒方法)。
- 讨论在实践中应用迁移学习的局限性与未解问题。
实验结果
研究问题
- RQ1在何种条件下,在源域训练的分类器可以泛化到目标域?
- RQ2不同类型的数据集转变(先验、协变量、概念)如何影响跨领域泛化风险?
- RQ3应对领域转变的主要自适应策略是什么,它们如何与风险最小化原理相关?
- RQ4在领域自适应中,哪些理论界限将源域训练性能与目标域性能联系起来?
- RQ5使迁移学习模型可用的关键未解问题与实际障碍是什么?
主要发现
- 当明确规定源域与目标域之间的关系时,可以建立跨领域泛化界(如通过 HΔH-发散度与理想联合误差 e*_{S,T})。
- 源训分类器的目标误差与最优目标分类器的目标误差之差,由联合误差、域发散和复杂度项之和界定。
- 先验移位、协变量移位和概念移位各自有不同的重加权或抵消技术,在没有带标签目标数据时估计目标风险(在适用时)。
- 协变量移位和先验移位可以通过调整采样权重或联合分布比值以反映目标概率来解决。
- 在没有带标签目标数据的情况下,概念转变仍然具有挑战性,需要估计依赖于带标签目标观测的条件分布。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。