QUICK REVIEW

[논문 리뷰] Episodic Training for Domain Generalization

Da Li, Jianshu Zhang|arXiv (Cornell University)|2019. 01. 31.

Domain Adaptation and Few-Shot Learning참고 문헌 42인용 수 29

한 줄 요약

이 논문은 도메인 일반화(DG)를 위한 에피소드 트레이닝을 제안하며, 특성 추출기와 분류기 모듈 간의 적대적 상호작용을 통해 훈련 중 도메인 시프트를 시뮬레이션함으로써, 표준 DG 벤치마크에서 최신 기술 성능(SOTA)을 달성하고, 대규모 Visual Decathlon 벤치마크에서 다운스트림 작업을 위한 ImageNet 사전 훈련된 특성의 강건성 향상을 입증한다.

ABSTRACT

Domain generalization (DG) is the challenging and topical problem of learning models that generalize to novel testing domains with different statistics than a set of known training domains. The simple approach of aggregating data from all source domains and training a single deep neural network end-to-end on all the data provides a surprisingly strong baseline that surpasses many prior published methods. In this paper, we build on this strong baseline by designing an episodic training procedure that trains a single deep network in a way that exposes it to the domain shift that characterises a novel domain at runtime. Specifically, we decompose a deep network into feature extractor and classifier components, and then train each component by simulating it interacting with a partner who is badly tuned for the current domain. This makes both components more robust, ultimately leading to our networks producing state-of-the-art performance on three DG benchmarks. Furthermore, we consider the pervasive workflow of using an ImageNet trained CNN as a fixed feature extractor for downstream recognition tasks. Using the Visual Decathlon benchmark, we demonstrate that our episodic-DG training improves the performance of such a general-purpose feature extractor by explicitly training a feature for robustness to novel problems. This shows that DG training can benefit standard practice in computer vision.

연구 동기 및 목표

목표 도메인 데이터가 없을 때 도메인 시프트에 대한 모델 강건성을 향상시키는 것, 이는 도메인 일반화(DG)의 핵심 과제이다.
복잡한 아키텍처나 최적화 기법에 의존하지 않고도 일반화 능력을 향상시킬 수 있는 간단하고 모델에 종속되지 않는 훈련 방법을 개발하는 것.
표준 비전 워크플로우에서 ImageNet 사전 훈련된 특성의 활용을 통해 고립된 벤치마크를 넘어서 DG 훈련의 실용적 가치를 입증하는 것.
다양한 도메인과 레이블 공간을 포함하는 이질적인 대규모 벤치마크(Visual Decathlon)에서 에피소드 DG를 평가하는 것.

제안 방법

딥 네트워크를 특성 추출기와 분류기로 분해하고, 각각을 떨어진 파트너 모듈과의 상호작용을 시뮬레이션하여 도메인 시프트를 모방하도록 훈련한다.
에피소드 트레이닝은 분류기가 현재 도메인에 대해 무작위로 초기화되거나 잘 튜닝되지 않은 경우를 가정하여, 합성 훈련 에피소드를 생성함으로써 구현된다. 이는 특성 추출기가 이러한 악성 설정에 적응하도록 유도한다.
이 방법은 이질적인 레이블 공간을 지원하기 위해 랜덤 분류기(R) 변형을 사용하여, 서로 다른 클래스를 가진 도메인 간의 훈련을 가능하게 한다.
다중 도메인 훈련 루프를 사용하여 각 에피소드에서 소스 도메인과 무작위로 초기화된 분류기를 샘플링하고, 특성 추출기가 이러한 적대적 설정 간에 일반화하도록 훈련한다.
이 방법은 엔드 투 엔드이며, 모델에 종속되지 않으며, ResNet-18와 같은 표준 최적화 기법과 아키텍처와 호환된다.
실용적 평가를 위해, 훈련된 특성 추출기를 ImageNet 사전 훈련된 특성과 연결하고 평균 풀링을 통해 다운스트림 작업의 성능을 향상시킨다.

실험 결과

연구 질문

RQ1에피소드 트레이닝은 전용 아키텍처나 최적화 기법 없이도 표준 DG 벤치마크에서 도메인 일반화 성능을 향상시킬 수 있는가?
RQ2에피소드 트레이닝은 이질적인 환경에서 새로운, 볼 수 없는 도메인으로 일반화할 수 있는 더 강건한 특성을 만들어내는가?
RQ3DG 훈련은 표준 ImageNet 사전 훈련된 CNN을 고정된 특성 추출기로 사용할 때 다운스트림 작업의 성능을 향상시킬 수 있는가?
RQ4에피소드 트레이닝은 Visual Decathlon와 같이 다양한 도메인과 레이블 공간을 포함하는 대규모 실세계 벤치마크에 어떻게 스케일링되는가?

주요 결과

제안된 에피소드 트레이닝 방법은 세 가지 주요 DG 벤치마크에서 최신 기술 성능(SOTA)을 달성하며, MLDG, CrossGrad, DANN과 같은 기존 방법들을 능가한다.
Visual Decathlon 벤치마크에서 에피소드-DG 방법(Epi-R)은 강력한 AGG 기반선과 다른 DG 경쟁자들보다 높은 평균 정확도와 VD 스코어를 기록했다.
다운스트림 작업에서 고정된 추출기로 사용될 때 ImageNet 사전 훈련된 특성의 성능을 향상시켜, 고립된 벤치마크를 넘어서는 실용적 가치를 입증했다.
ImageNet 사전 훈련된 특성과 VD-DG로 훈련된 특성의 조합을 연결하고 평균 풀링을 적용한 결과, ImageNet을 소스 도메인으로 직접 포함한 경우보다 더 뛰어난 전체 성능을 달성했다.
결과는 에피소드 트레이닝이 대규모 이질적 도메인 일반화 환경에서 특성의 강건성을 효과적으로 향상시킬 수 있음을 보여주며, 이는 대규모에서의 첫 번째 suchDemonstration이다.
이 방법은 효율적이며, 모델에 종속되지 않으며, 비표준 훈련 절차가 필요 없어 컴퓨터 비전 워크플로우에서 널리 채택하기에 적합하다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.