Skip to main content
QUICK REVIEW

[论文解读] Overcoming Negative Transfer: A Survey

Wen Zhang, Lingfei Deng|arXiv (Cornell University)|Sep 2, 2020
Domain Adaptation and Few-Shot Learning参考文献 149被引用 32
一句话总结

本文对近100种克服负迁移(NT)的方法进行了全面综述,通过将方法划分为四个领域:源域和目标域数据质量、域间差异性以及集成算法。文章系统性地回顾了迁移学习、多任务学习、多语言模型和终身学习中负迁移缓解策略的研究,填补了文献中的关键空白。

ABSTRACT

Transfer learning (TL) tries to utilize data or knowledge from one or more source domains to facilitate the learning in a target domain. It is particularly useful when the target domain has few or no labeled data, due to annotation expense, privacy concerns, etc. Unfortunately, the effectiveness of TL is not always guaranteed. Negative transfer (NT), i.e., the source domain data/knowledge cause reduced learning performance in the target domain, has been a long-standing and challenging problem in TL. Various approaches to overcome NT have been proposed in the literature. However, there has not been a systematic survey on overcoming NT. This paper fills the gap, by categorizing and reviewing near 100 approaches for combating NT, from four perspectives: source data quality, target data quality, domain divergence, and integrated algorithms. NT in related fields, e.g., multi-task learning, multilingual models, and lifelong learning, is also discussed.

研究动机与目标

  • 为解决迁移学习中源域知识损害目标域性能的持续性挑战,即负迁移(NT)问题。
  • 识别并分类现有缓解NT的方法,特别是在低资源或数据稀缺的目标域中。
  • 系统性回顾多种学习范式(包括多任务学习、多语言模型和终身学习)中的NT缓解策略。
  • 通过将方法组织为四个连贯视角(源数据质量、目标数据质量、域间差异性以及集成算法),整合分散的NT研究。

提出的方法

  • 将98种NT缓解方法按四大主要视角进行分类:源数据质量、目标数据质量、域间差异性以及集成算法。
  • 分析通过过滤或重加权源域中不可靠或噪声示例来提升源数据质量的方法。
  • 评估通过主动学习、数据增强或不确定性估计来提升目标数据质量的技术,以减少负面影响。
  • 调查域自适应与对齐技术,以减少源域与目标域之间的域偏移和分布差异。
  • 回顾整合多种NT缓解策略的混合算法,如动态加权或基于元学习的域选择方法。
  • 将分析扩展至多任务学习、多语言模型和终身学习等相关领域,以识别跨范式NT缓解的共性模式。

实验结果

研究问题

  • RQ1在迁移学习中,负迁移的主要成因是什么?这些成因在不同数据和域配置下如何变化?
  • RQ2现有方法如何对NT缓解策略进行分类或分组?在所识别的四个类别中,主导的设计模式是什么?
  • RQ3数据质量与域间差异性在多大程度上导致负迁移?当前方法如何应对这些因素?
  • RQ4迁移学习中的NT缓解策略与多任务学习和终身学习等相关领域的策略相比如何?
  • RQ5当前NT缓解技术存在哪些关键空白与局限?未来研究最具有前景的方向是什么?

主要发现

  • 将近百种NT缓解方法系统性地划分为四个不同视角,为理解与比较现有方法提供了统一框架。
  • 通过过滤或重加权来提升源数据质量是一种普遍策略,尤其在源数据包含噪声或无关示例时更为有效。
  • 通过数据选择或数据增强提升目标数据质量,能显著降低低资源目标域中的负迁移风险。
  • 减少域间差异性的技术(如对抗性对齐和分布适应)被广泛使用且在最小化性能下降方面效果显著。
  • 整合多种策略的集成算法(如动态域加权或元学习注意力机制)在多种迁移场景中表现出更强的鲁棒性。
  • 多语言模型和终身学习等相关领域中的NT缓解方法与迁移学习具有方法论上的相似性,表明核心技术具有跨领域适用性。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。