QUICK REVIEW

[논문 리뷰] Domain Generalization in Vision: A Survey

Kaiyang Zhou, Ziwei Liu|arXiv (Cornell University)|2021. 03. 03.

Domain Adaptation and Few-Shot Learning참고 문헌 251인용 수 67

한 줄 요약

이 종합 검토는 컴퓨터 시각 분야에서 도메인 일반화(DG)에 대해 포괄적인 리뷰를 제공하며, 분야 정렬, 메타학습, 데이터 증강, 앙상블 학습 등의 방법론을 통해 분포 외 일반화를 향상시키는 데 초점을 맞춘다. 이 리뷰는 DG 접근 방식을 체계적으로 분류하고 관련 분야와 연관지으며, 2011년 이후 10년 간의 발전에 기반해 향후 연구 방향을 제시한다.

ABSTRACT

Generalization to out-of-distribution (OOD) data is a capability natural to humans yet challenging for machines to reproduce. This is because most learning algorithms strongly rely on the i.i.d.~assumption on source/target data, which is often violated in practice due to domain shift. Domain generalization (DG) aims to achieve OOD generalization by using only source data for model learning. Since first introduced in 2011, research in DG has made great progresses. In particular, intensive research in this topic has led to a broad spectrum of methodologies, e.g., those based on domain alignment, meta-learning, data augmentation, or ensemble learning, just to name a few; and has covered various vision applications such as object recognition, segmentation, action recognition, and person re-identification. In this paper, for the first time a comprehensive literature review is provided to summarize the developments in DG for computer vision over the past decade. Specifically, we first cover the background by formally defining DG and relating it to other research fields like domain adaptation and transfer learning. Second, we conduct a thorough review into existing methods and present a categorization based on their methodologies and motivations. Finally, we conclude this survey with insights and discussions on future research directions.

연구 동기 및 목표

분야 이탈(Out-of-Distribution, OOD) 일반화 문제를 다루기 위해, 모델이 도메인 이동으로 인해 실패하는 이유를 해결하기 위함.
도메인 일반화(DG)를 공식적으로 정의하고, 도메인 적응 및 전이 학습과 같은 관련 분야와의 차이를 명확히 하기 위함.
기본 방법론과 동기를 기반으로 DG 방법을 체계적으로 분류하기 위함.
2011년부터 출판 시점까지의 10년 간의 DG 연구 발전 과정과 최신 동향을 요약하기 위함.
DG 연구의 열린 과제를 식별하고, 시각 응용 분야를 위한 향후 연구 방향을 제안하기 위함.

제안 방법

이 논문은 컴퓨터 시각 분야의 DG 방법에 대한 철저한 문헌 조사를 수행하며, 10년 이상의 연구를 분석한다.
DG 접근 방식을 도메인 정렬, 메타학습, 데이터 증강, 앙상블 학습 등의 방법론적 그룹으로 분류한다.
DG와 관련 분야 간의 개념적 연결 고리를 설정하여, 도메인 적응 및 전이 학습과 같은 분야와의 차이점과 관계를 명확히 한다.
모델의 도메인 이동 최소화 또는 불변성 향상과 같은 동기를 바탕으로 방법을 평가한다.
객체 인식, 세분화, 행동 인식, 사람 재식별 등의 다양한 시각 작업에 응용된 사례를 포함한다.
다양한 방법론에서 유래한 통찰을 통합하여 현재 DG 연구의 공통 원칙과 한계를 규명한다.

실험 결과

연구 질문

RQ1도메인 일반화는 어떻게 공식적으로 정의되며, 도메인 적응 및 전이 학습과 어떻게 다릅니까?
RQ2컴퓨터 시각 분야에서 DG 접근 방식의 주요 방법론적 범주와 그 배경이 되는 동기는 무엇입니까?
RQ32011년 DG 연구가 시작된 이래로 어떤 진전이 있었고, 방법론에서 지배적인 추세는 무엇입니까?
RQ4어떤 시각 응용 분야에서 DG 기법이 가장 큰 도움을 받았으며, 이를 확장하는 데 있어 핵심 과제는 무엇입니까?
RQ5DG 연구의 열린 문제점과 유망한 향후 연구 방향은 무엇입니까?

주요 결과

도메인 일반화는 도메인 정렬, 메타학습, 데이터 증강, 앙상블 학습 등의 다양한 방법론을 포함해 성숙한 연구 분야로 발전하였다.
이 리뷰는 도메인 정렬 방법이 도메인 특수 특징을 최소화하여 도메인 불변 표현을 학습하는 데 목적이 있음을 밝혔다.
메타학습 기반 DG 방법은 미리 정의된 도메인 외의 도메인에서도 일반화 가능한 모델 초기화 또는 최적화 전략을 학습하는 데 초점을 맞춘다.
DG에서의 데이터 증강 기법은 도메인 이동을 시뮬레이션하고 학습 중 내구성을 향상시키기 위해 설계된다.
DG에서의 앙상블 학습 접근 방식은 서로 다른 도메인에서 학습된 여러 모델의 예측을 조합하여 일반화 성능을 향상시킨다.
이 리뷰는 상당한 진전이 있었음에도 불구하고, 복잡한 도메인 이동을 모델링하고 다양한 시각 작업에서 신뢰할 수 있는 분포 외 일반화를 달성하는 데 여전히 과제가 남아 있다고 결론 내렸다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.