Skip to main content
QUICK REVIEW

[论文解读] Domain Generalization in Vision: A Survey

Kaiyang Zhou, Ziwei Liu|arXiv (Cornell University)|Mar 3, 2021
Domain Adaptation and Few-Shot Learning参考文献 251被引用 67
一句话总结

本综述全面回顾了计算机视觉中的域泛化(DG)研究,涵盖域对齐、元学习、数据增强和集成学习等方法,以提升分布外(OOD)泛化能力。它系统性地对DG方法进行分类,阐明其与相关领域的关联,并基于2011年以来十年的进展,提出未来研究方向。

ABSTRACT

Generalization to out-of-distribution (OOD) data is a capability natural to humans yet challenging for machines to reproduce. This is because most learning algorithms strongly rely on the i.i.d.~assumption on source/target data, which is often violated in practice due to domain shift. Domain generalization (DG) aims to achieve OOD generalization by using only source data for model learning. Since first introduced in 2011, research in DG has made great progresses. In particular, intensive research in this topic has led to a broad spectrum of methodologies, e.g., those based on domain alignment, meta-learning, data augmentation, or ensemble learning, just to name a few; and has covered various vision applications such as object recognition, segmentation, action recognition, and person re-identification. In this paper, for the first time a comprehensive literature review is provided to summarize the developments in DG for computer vision over the past decade. Specifically, we first cover the background by formally defining DG and relating it to other research fields like domain adaptation and transfer learning. Second, we conduct a thorough review into existing methods and present a categorization based on their methodologies and motivations. Finally, we conclude this survey with insights and discussions on future research directions.

研究动机与目标

  • 为解决计算机视觉中因域移位导致模型失效的分布外(OOD)泛化挑战。
  • 正式定义域泛化(DG),并将其与域自适应和迁移学习等相关领域区分开来。
  • 基于其底层方法论和动机,对DG方法进行系统性分类。
  • 总结2011年至论文发表时这十年间DG研究的演进过程与最新进展。
  • 识别开放性挑战,并为视觉应用中的DG研究提出未来研究方向。

提出的方法

  • 本文对计算机视觉中的DG方法进行了详尽的文献回顾,分析了十余年来的研究成果。
  • 将DG方法按方法论类别进行分类,如域对齐、元学习、数据增强和集成学习。
  • 建立DG与相关领域(包括域自适应和迁移学习)之间的概念性联系,以澄清其区别与关联。
  • 基于其动机(如最小化域移位或提升模型不变性)评估各类方法。
  • 分析涵盖物体识别、语义分割、动作识别和行人重识别等视觉任务的应用。
  • 综合多种方法论的见解,识别当前DG研究中的共性原则与局限性。

实验结果

研究问题

  • RQ1域泛化如何被正式定义?它与域自适应和迁移学习有何不同?
  • RQ2计算机视觉中DG方法的主要方法论类别是什么?其底层动机为何?
  • RQ3自2011年DG研究提出以来,取得了哪些进展?其方法论的主要趋势是什么?
  • RQ4哪些视觉应用从DG技术中获益最多?将其扩展时面临的主要挑战是什么?
  • RQ5DG研究中存在哪些开放性问题?未来有哪些有前景的研究方向?

主要发现

  • 域泛化已发展为一个成熟的科研领域,涌现出多样化的研究方法,包括域对齐、元学习、数据增强和集成学习。
  • 综述指出,域对齐方法旨在通过最小化域特定特征来学习域不变表示。
  • 基于元学习的DG方法聚焦于学习一种可在未见域上泛化的模型初始化或优化策略。
  • DG中的数据增强技术旨在模拟域移位,从而在训练过程中提升模型鲁棒性。
  • DG中的集成学习方法通过结合在不同域上训练的多个模型的预测结果,以提升泛化能力。
  • 综述结论认为,尽管已取得显著进展,但在建模复杂域移位以及在多样化视觉任务中实现可靠的分布外泛化方面,仍存在挑战。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。