[논문 리뷰] Generalizing to Unseen Domains via Adversarial Data Augmentation
이 논문은 Wasserstein 기반의 최악의 경우 형식을 이용한 의미 공간에서의 적대적 데이터 증강을 도입하여 미지의 도메인에 대한 일반화를 향상시키고, 반복적인 증강 절차와 미지의 대상 이동에 대한 앙상블 모델을 제시한다.
We are concerned with learning models that generalize well to different \emph{unseen} domains. We consider a worst-case formulation over data distributions that are near the source domain in the feature space. Only using training data from a single source distribution, we propose an iterative procedure that augments the dataset with examples from a fictitious target domain that is "hard" under the current model. We show that our iterative scheme is an adaptive data augmentation method where we append adversarial examples at each iteration. For softmax losses, we show that our method is a data-dependent regularization scheme that behaves differently from classical regularizers that regularize towards zero (e.g., ridge or lasso). On digit recognition and semantic segmentation tasks, our method learns models improve performance across a range of a priori unknown target domains.
연구 동기 및 목표
- 단일 소스 분포만 이용 가능할 때도 미지의 도메인에 일반화하는 학습 모델을 동기 부여한다.
- 의미 공간에서 Wasserstein 거리를 사용한 최악의 경우 분포 강건성 문제를 수식화한다.
- 훈련 중에 적대적 샘플을 추가하는 반복적이고 적응적인 데이터 증강 알고리즘을 개발한다.
- 이 방법이 소프트맥스 손실에 대한 데이터 의존적 정규화로 작용하고, 대상 거리 수준에 따라 앙상블 전략을 가능하게 함을 보인다.
제안 방법
- 네트워크 표현으로 유도된 의미 공간에서 분포 간의 Wasserstein 거리 D_theta를 정의한다.
- 감마 페널티 파라미터로 최악의 경우 문제를 완화하여 강건한 대리 손실 phi_gamma를 얻는다.
- 증강 데이터셋에서의 SGD로 최소화하는 것을 차례로 수행하기 전에 x^*_gamma = argmax_x { ell(theta; (x, y)) - gamma c_theta((x, y), (x0, y)) }를 풀어 적대적(어려운) 샘플을 생성하는 최대화 단계를 반복적으로 수행한다.
- 증강 샘플을 의미 공간에서의 Tikhonov 정규화 뉴턴 단계에 근사하는 적응형 데이터 증강으로 해석한다.
- 분류의 경우 강건한 대리 손실 phi_gamma가 데이터 의존적 정규화에 해당하며, 실제 레이블 분류기와 클래스별 분류기의 소프트 평균 간의 정렬을 촉진한다는 것을 보인다.
- 다양한 gamma 값으로 다수의 모델을 학습시키고 테스트 시 softmax 신뢰도(확률)에 따라 선택하는 앙상블 접근법을 제공한다.
실험 결과
연구 질문
- RQ1적대적 데이터 증강으로 학습된 모델이 훈련 도중 대상 도메인 데이터를 접할 수 없이도 미지의 대상 도메인으로 일반화할 수 있는가?
- RQ2의미 공간의 Wasserstein 강건성이 픽셀 공간의 노이즈와 표준 정규화에 비해 교차 도메인 일반화를 얼마나 개선하는가?
- RQ3테스트 시점에 강건한 예측을 선택하는 데, 서로 다른 대상 거리 수준을 갖는 모델 앙상블의 역할은 무엇인가?
- RQ4다양한 미지의 도메인 시프트 하에서 제안된 기법이 디지털 인식과 의미적 분할 모두에서 성능 향상을 보이는가?
주요 결과
- 이 방법은 다수의 미지의 대상에 걸친 숫자 인식 벤치마크에서 교차 도메인 일반화 향상을 보인다.
- 이 방법은 ERM 기준선에 비해 계절과 기상 조건이 다양한 상황에서 의미적 분할 성능을 향상시킨다.
- 서로 다른 강건성 수준의 모델 앙상블은 test-time에 softmax 신뢰도에 따라 모델 선택이 사용될 때 추가 이득을 제공한다.
- 최대화 단계는 의미 공간에서 적응적이고 데이터 의존적인 Newton 유사 업데이트에 해당하는 적대적 샘플을 생성하여 효과적인 증강으로 작용한다.
- 소프트맥스 손실의 경우 강건한 대리 손실은 데이터 의존적 정규화로 작용하여 실제 레이블 분류기와 클래스 분류기의 가중 평균 사이의 정렬을 촉진한다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.