Skip to main content
QUICK REVIEW

[논문 리뷰] Conditional Adversarial Domain Adaptation

Mingsheng Long, Zhangjie Cao|arXiv (Cornell University)|2017. 05. 26.
Domain Adaptation and Few-Shot Learning인용 수 1,428
한 줄 요약

CDAN은 특징과 분류기 예측 간의 교차 공분산을 이용하는 조건부 적대적 도메인 판별기를 도입하여 멀티모달 도메인 분포를 정렬하고, 여러 벤치마크에서 최첨단 결과를 달성합니다(엔트로피 조건화 옵션 포함).

ABSTRACT

Adversarial learning has been embedded into deep networks to learn disentangled and transferable representations for domain adaptation. Existing adversarial domain adaptation methods may not effectively align different domains of multimodal distributions native in classification problems. In this paper, we present conditional adversarial domain adaptation, a principled framework that conditions the adversarial adaptation models on discriminative information conveyed in the classifier predictions. Conditional domain adversarial networks (CDANs) are designed with two novel conditioning strategies: multilinear conditioning that captures the cross-covariance between feature representations and classifier predictions to improve the discriminability, and entropy conditioning that controls the uncertainty of classifier predictions to guarantee the transferability. With theoretical guarantees and a few lines of codes, the approach has exceeded state-of-the-art results on five datasets.

연구 동기 및 목표

  • 도메인 분포가 멀티모달하고 다양할 때 로버스트한 도메인 적응을 동기화합니다.
  • 도메인 정렬을 이끌기 위해 분류기 예측을 활용하는 조건부 적대적 프레임워크를 제안합니다.
  • 교차 도메인 특징-클래스 의존성과 불확실성을 모델링하기 위해 다중 선형 조건화와 엔트로피 조건화를 도입합니다.
  • 도메인 적응 이론 하에서 CDAN의 일반화 보장을 이론적으로 제공합니다.
  • 여러 벤치마크 데이터셋에서 최첨단 방법 대비 경험적 개선을 입증합니다.

제안 방법

  • 조건부 도메인 적대 네트워크(CDAN)를 joint feature-class 표현 h=(f,g)에 조건화된 도메인 판별자 D와 함께 minimax 게임으로 정의합니다.
  • 특징과 예측 간의 교차 공분산을 포착하기 위해 다중 선형 조건화 맵 f ⊗ g를 사용하고, 차원이 높을 때 무작위 근사 T⊙를 적용합니다.
  • 필요에 따라 엔트로피 조건화를 적용해 g의 예측 불확실성으로 예시를 가중치화합니다(CDAN+E).
  • 조건화가 멀티모달 분포를 모델링하는 데 도움이 되며 Δ-거리 기반 분석으로 타깃 위험을 구간화(bound)한다고 증명합니다.
  • 분판자(discriminator)에 대한 역전파 이용 선형 시간 학습 방식과 점진적 학습 스케줄을 제공하여 훈련합니다.

실험 결과

연구 질문

  • RQ1적대적 도메인 적응을 어떻게 개선해 멀티모달하고 복잡한 도메인 시프트를 다룰 수 있을까?
  • RQ2도메인 판별자를 분류기 예측(및 그 불확실성)으로 조건화하는 것이 더 나은 도메인 정렬과 타깃 성능을 가져오는가?
  • RQ3CDAN에 대해 도메인 적응 이론 내에서 일반화 경계(bound)를 수립할 수 있는가?
  • RQ4다중 선형 및 엔트로피 조건화가 표준 도메인 적응 벤치마크에서 어떤 경험적 이득을 제공하는가?

주요 결과

MethodA→WD→WW→DA→DD→AW→AAvg
AlexNet61.6 ± 0.595.4 ± 0.399.0 ± 0.263.8 ± 0.551.1 ± 0.649.8 ± 0.470.1
DAN68.5 ± 0.596.0 ± 0.399.0 ± 0.367.0 ± 0.454.0 ± 0.553.1 ± 0.572.9
RTN73.3 ± 0.396.8 ± 0.299.6 ± 0.171.0 ± 0.250.5 ± 0.351.0 ± 0.173.7
DANN73.0 ± 0.596.4 ± 0.399.2 ± 0.372.3 ± 0.353.4 ± 0.451.2 ± 0.574.3
ADDA73.5 ± 0.696.2 ± 0.498.8 ± 0.471.6 ± 0.454.6 ± 0.553.5 ± 0.674.7
JAN74.9 ± 0.396.6 ± 0.299.5 ± 0.271.8 ± 0.258.3 ± 0.355.0 ± 0.476.0
CDAN77.9 ± 0.396.9 ± 0.2100.0 ± 0.075.1 ± 0.254.5 ± 0.357.5 ± 0.477.0
CDAN+E78.3 ± 0.297.2 ± 0.1100.0 ± 0.076.3 ± 0.157.3 ± 0.257.3 ± 0.377.7
ResNet-5068.4 ± 0.296.7 ± 0.199.3 ± 0.168.9 ± 0.262.5 ± 0.360.7 ± 0.376.1
DAN80.5 ± 0.497.1 ± 0.299.6 ± 0.178.6 ± 0.263.6 ± 0.362.8 ± 0.280.4
RTN84.5 ± 0.296.8 ± 0.199.4 ± 0.177.5 ± 0.366.2 ± 0.264.8 ± 0.381.6
DANN82.0 ± 0.496.9 ± 0.299.1 ± 0.179.7 ± 0.468.2 ± 0.467.4 ± 0.582.2
ADDA86.2 ± 0.596.2 ± 0.398.4 ± 0.377.8 ± 0.369.5 ± 0.468.9 ± 0.582.9
JAN85.4 ± 0.397.4 ± 0.299.8 ± 0.284.7 ± 0.368.6 ± 0.370.0 ± 0.484.3
  • CDAN은 다섯 개 벤치마크 데이터셋에서 최첨단 결과를 넘어섭니다.
  • 다중 선형 조건화는 특징과 예측 간의 교차 공분산을 포착해 멀티모달 분포를 더 잘 모델링합니다.
  • 엔트로피 조건화는 쉽게 전이될 수 있는 예시를 우선시하여 전이 가능성을 높입니다(CDAN+E).
  • 오피스-31 및 기타 데이터셋에 대한 실험에서 DANN, JAN, ADDA와 같은 베이스라인 대비 상당한 정확도 향상을 보입니다.
  • 본 논문은 도메인 판별자 훈련과 결합 분포 간의 Δ-거리 경계와 관련된 일반화 오차 분석을 제공합니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.