[논문 리뷰] Improve Unsupervised Domain Adaptation with Mixup Training
이 논문은 특징 수준의 일관성 정규화와 도메인 적대 학습을 활용하여 교차 도메인 및 도메인 내 혼합 학습(IIMT) 프레임워크를 제시하고, 시각 및 HAR 작업 전반의 비지도 도메인 적응을 개선한다.
Unsupervised domain adaptation studies the problem of utilizing a relevant source domain with abundant labels to build predictive modeling for an unannotated target domain. Recent work observe that the popular adversarial approach of learning domain-invariant features is insufficient to achieve desirable target domain performance and thus introduce additional training constraints, e.g. cluster assumption. However, these approaches impose the constraints on source and target domains individually, ignoring the important interplay between them. In this work, we propose to enforce training constraints across domains using mixup formulation to directly address the generalization performance for target data. In order to tackle potentially huge domain discrepancy, we further propose a feature-level consistency regularizer to facilitate the inter-domain constraint. When adding intra-domain mixup and domain adversarial learning, our general framework significantly improves state-of-the-art performance on several important tasks from both image classification and human activity recognition.
연구 동기 및 목표
- 소스와 타깃 제약을 별도로 처리하는 도메인-적대 방법의 한계를 해결한다.
- 혼합 학습을 활용하여 교차 도메인 감독을 생성하고 예측의 선형성을 강제한다.
- 큰 도메인 차이에 대한 혼합 학습을 돕기 위해 특징 수준의 일관성 정규화를 도입한다.
- 시각 및 HAR 도메인 적응 벤치마크에서 최첨단 방법보다 향상을 보인다.
제안 방법
- 타깃의 inferred 타깃 레이블을 약한 감독으로 사용하여 소스와 타깃 간의 도메인 간 혼합 학습을 적용한다.
- 타깃 샘플을 증강하고, 예측을 평균화하며, 온도 제어 소프트맥스로 샤프닝하여 타깃 가상 레이블을 계산한다.
- 도메인 간 레이블 수준 혼합 손실과 도메인 간 특징 수준 혼합 손실(L_q 및 L_z)을 강제한다.
- 도메인 불변 특징을 촉진하기 위해 도메인 적대적 손실을 도입한다(DANN).
- 레이블 수준 혼합을 사용하여 소스 도메인 내부 및 타깃 도메인 내부에서 도메인 내 혼합을 수행한다(L_s 및 L_t).
- 모든 손실을 tunable 가중치로 결합하고 타깃 특성 손실의 가중치를 점진적으로 증가시키는 최종 목적함수를 구성한다.
실험 결과
연구 질문
- RQ1교차 도메인 혼합 감독이 비지도 라벨 도메인으로의 일반화에 전통적 도메인-적대 훈련을 넘어서는 개선을 가져올 수 있는가?
- RQ2도메인 차이가 큰 상황에서 특징 수준의 일관성 정규화가 효과적인 혼합 학습을 촉진하는가?
- RQ3이미지 분류와 HAR 작업에서 교차 도메인 혼합과 도메인 내 혼합 구성 요소가 성능에 어떻게 기여하는가?
주요 결과
- IIMT는 여러 시각적 UDA 벤치마크와 HAR 작업에서 최첨단 방법보다 상당한 성능 우수성을 보였다.
- 분해(ablations)에서 도메인 간 및 도메인 내 혼합 구성 요소 각각이 이득을 제공하며, 도메인 간 혼합의 결합이 상당한 향상을 가져왔다.
- 도메인 내 혼합만으로도 VAT와 같은 다른 Lipschitz 제약 방법과 견줄 만큼 예측의 안정화를 달성할 수 있다.
- 이 프레임워크는 MNIST, SVHN, CIFAR- STL, 및 OPPORTUNITY HAR 데이터 세트를 포함한 다양한 도메인에서 강건한 개선을 보인다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.