[논문 리뷰] Domain Generalization via Conditional Invariant Representation
이 논문은 입력 및 조건부 레이블 분포가 모두 변화하는 상황에서도 강건한 일반화를 가능하게 하는 조건부 불변 도메인 일반화(CIDG)를 제안한다. 이는 도메인 간에 조건부 분포 𝕡(h(X)|Y)가 불변하도록 특징 표현을 학습한다. 실험 결과, 기존 방법들에 비해 합성 및 실세계 데이터셋에서 CIDG가 뛰어난 성능을 보이며, 특히 prior 𝕡(Y|X)가 안정되지 않는 비-i.i.d. 데이터 이동 상황에서 뛰어난 성능을 발휘한다.
Domain generalization aims to apply knowledge gained from multiple labeled source domains to unseen target domains. The main difficulty comes from the dataset bias: training data and test data have different distributions, and the training set contains heterogeneous samples from different distributions. Let $X$ denote the features, and $Y$ be the class labels. Existing domain generalization methods address the dataset bias problem by learning a domain-invariant representation $h(X)$ that has the same marginal distribution $\mathbb{P}(h(X))$ across multiple source domains. The functional relationship encoded in $\mathbb{P}(Y|X)$ is usually assumed to be stable across domains such that $\mathbb{P}(Y|h(X))$ is also invariant. However, it is unclear whether this assumption holds in practical problems. In this paper, we consider the general situation where both $\mathbb{P}(X)$ and $\mathbb{P}(Y|X)$ can change across all domains. We propose to learn a feature representation which has domain-invariant class conditional distributions $\mathbb{P}(h(X)|Y)$. With the conditional invariant representation, the invariance of the joint distribution $\mathbb{P}(h(X),Y)$ can be guaranteed if the class prior $\mathbb{P}(Y)$ does not change across training and test domains. Extensive experiments on both synthetic and real data demonstrate the effectiveness of the proposed method.
연구 동기 및 목표
- 입력 분포 𝕡(X)와 조건부 레이블 분포 𝕡(Y|X)가 도메인 간에 변화하는 상황에서 도메인 일반화 문제를 해결한다. 이는 일반적으로 안정적인 𝕡(Y|X)를 가정하는 것과는 도전적인 상황이다.
- 표현 학습을 통해 𝕡(h(X)|Y)의 불변성을 확보하여 공동 분포 𝕡(h(X),Y)의 불변성을 보장하는 방법을 개발한다.
- 𝕨(Y|X)가 도메인 간에 안정되어 있다는 가정에 의존하지 않도록 하여, Y→X와 같은 실세계 인과적 구조에서 자주 실패하는 가정을 제거한다.
- 조건부 분포 불변성을 명시적으로 정규화하여, 미관측 타겟 도메인에서의 일반화 성능을 향상시킨다.
제안 방법
- 소스 도메인 간에 조건부 분포 𝕡(h(X)|Y)의 분산을 최소화하는 표현 학습 프레임워크를 제안한다.
- 전역 분포 불일치를 줄이기 위해 클래스 사전 분포 정규화된 근사 분포 𝕡_N(h(X))의 분산 기반 정규화 항을 도입한다.
- 클래스 사전 분포의 정규화를 통해 도메인 간 𝕡(Y)의 잠재적 이동에 미치는 영향을 완화한다.
- 핵 페어시피셔 할류분석(Kernel Fisher Discriminant Analysis)에서 영감을 얻어 내부 클래스 및 외부 클래스 거리 제약 조건을 통합하여 분류 성능 유지를 도모한다.
- 모든 실험에서 RBF 커널 기반 방법을 사용하여 커널 행렬을 계산하고, 최종 분류에는 KNN을 사용한다.
- 분포 불변성과 분류 학습의 조합을 최적화하여 강건성과 정확성의 균형을 확보한다.
실험 결과
연구 질문
- RQ1입력 분포 𝕡(X)와 조건부 레이블 분포 𝕡(Y|X)가 모두 도메인 간에 변화하는 상황에서 도메인 일반화 성능를 향상시킬 수 있는가?
- RQ2조회분포 𝕡(h(X)|Y)의 불변성을 강제로 적용할 경우, 단지 근사 분포 𝕡(h(X))의 불변성만 강제하는 것보다 더 나은 일반화 성능를 달성하는가?
- RQ3𝕨(Y|X)가 안정되지 않는 현실적인 분포 이동 상황에서 기존 도메인 일반화 기법들과 비교해 본다면, 제안된 방법은 어떻게 성능를 발휘하는가?
- RQ4클래스 사전 분포 이동이 도메인 일반화 모델의 성능에 어떤 영향을 미치며, 이를 어떻게 완화할 수 있는가?
주요 결과
- 합성 데이터에서 CIDG는 86.67%의 정확도를 기록했으며, KPCA, DICA, SCA는 떨어진 클러스터링 또는 혼합된 클래스 표현으로 인해 성능가 낮았다.
- VLCS 데이터셋에서 CIDG는 10개 도메인 일반화 작업 중 9개에서 최고 성능를 기록했으며, 다양한 이미지 도메인 간의 강건성을 입증했다.
- Office+Caltech 데이터셋에서 CIDG는 10개 작업 중 9개에서 최고 성능를 기록했으며, 복잡한 실세계 분포 이동 상황에서도 열등함을 입증했다.
- KPCA 및 DICA와 같은 기법들은 조건부 분포가 이동할 경우 일반화 성능가 떨어지며, 이는 단지 근사 분포 불변성에 의존하는 것의 한계를 보여준다.
- 이론적 프레임워크에서 가정한 바와 같이 소스 및 타겟 도메인 간에 클래스 사전 분포 𝕡(Y)가 그대로 유지되더라도, 제안된 방법은 강력한 성능를 유지한다.
- 정규화 항에 클래스 사전 분포 정규화를 적용함으로써 클래스 사전 분포의 도메인 이동 영향을 효과적으로 감소시켜 일반화 안정성을 향상시켰다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.