Skip to main content
QUICK REVIEW

[논문 리뷰] Domain Generalization using Causal Matching

Divyat Mahajan, Shruti Tople|arXiv (Cornell University)|2020. 06. 12.
Domain Adaptation and Few-Shot Learning참고 문헌 65인용 수 81
한 줄 요약

본 논문은 클래스 조건부 도메인 불변성만으로는 도메인 일반화에 충분하지 않다고 주장하며 매칭을 통한 인과적 객체 기반 불변성을 제안한다; 또한 동일 객체 입력을 도메인 간에 정렬하는 표현 학습을 위해 MatchDG와 MDGHybrid를 도입하여 도메인 밖에서의 정확도를 경쟁력 있게 달성한다.

ABSTRACT

In the domain generalization literature, a common objective is to learn representations independent of the domain after conditioning on the class label. We show that this objective is not sufficient: there exist counter-examples where a model fails to generalize to unseen domains even after satisfying class-conditional domain invariance. We formalize this observation through a structural causal model and show the importance of modeling within-class variations for generalization. Specifically, classes contain objects that characterize specific causal features, and domains can be interpreted as interventions on these objects that change non-causal features. We highlight an alternative condition: inputs across domains should have the same representation if they are derived from the same object. Based on this objective, we propose matching-based algorithms when base objects are observed (e.g., through data augmentation) and approximate the objective when objects are not observed (MatchDG). Our simple matching-based algorithms are competitive to prior work on out-of-domain accuracy for rotated MNIST, Fashion-MNIST, PACS, and Chest-Xray datasets. Our method MatchDG also recovers ground-truth object matches: on MNIST and Fashion-MNIST, top-10 matches from MatchDG have over 50% overlap with ground-truth matches.

연구 동기 및 목표

  • 도메인 일반화를 위한 클래스-조건부 도메인 불변 표현의 충분성에 의문을 제기한다.
  • 클래스 내 변이와 객체 수준의 안정성을 포착하기 위한 구조적 인과 모델을 도입한다.
  • 객체가 관찰될 때 이상적 완전 매칭 정규화를 제안한다.
  • 객체가 관찰되지 않을 때 객체 기반 매칭을 근사하기 위한 MatchDG를 개발한다.
  • 데이터 증강을 완벽한 객체 매치로 활용하기 위해 MDGHybrid로 확장한다.

제안 방법

  • 안정적인 인과 특징 X_C 와 도메인 의존 특징 X_A 를 사용하여 객체 기반 불변성을 정의하기 위한 데이터 생성 모델링.
  • 이상적 불변성을 수식화한다: 같은 객체에서 파생된 입력에 대해 도메인 간에 표현이 같아야 하며, 즉 G(X) 는 도메인 조건부로 X_C 를 도메인 간에 정렬한다.
  • 같은 객체에 대해 도메인 간 표현 거리 를 최소화하면서 예측 능력을 보존하는 완전 매칭 정규화를 도출한다.
  • MatchDG를 제안한다: ERM 손실 없이 대조 학습으로 표현을 먼저 학습한 다음 객체 기반 매치를 학습하여 분류기를 규칙화하는 두 단계의 반복 알고리즘.
  • 데이터 증강으로부터 알려진 객체 매치를 추가 정규화로 도입하여 MatchDG 를 MDGHybrid 로 확장한다.
  • 표준 도메인 불변성 방법이 X_C 를 포착하지 못한다는 이론적 정당성과 제안된 완전 매칭 목적함수가 실제 인과 특징을 겨냥한다는 점을 보장한다.

실험 결과

연구 질문

  • RQ1안정적인 특징의 클래스 내 변이로 인해 클래스-조건부 도메인 불변성이 보이지 않는 도메인에 일반화되지 못할 수 있는가?
  • RQ2객체가 관찰되지 않을 때 도메인 간 정렬되는 객체 수준 불변성을 식별하거나 근사화하는 방법은?
  • RQ3같은 객체에 대한 표현의 일관성을 강제하는 매칭 기반 정규화가 외부 도메인 일반화에 도움이 되는가?
  • RQ4데이터 증강이 MDGHybrid 를 통해 객체 기반 매칭을 강화하는 신뢰할 만한 완전 매치를 제공하고 일반화를 개선할 수 있는가?
  • RQ5회전된 MNIST, Fashion-MNIST, PACS, Chest X-ray 와 같은 벤치마크에서 MatchDG 와 MDGHybrid 의 성능은 최신 도메인 일반화 방법에 비해 어떤가?

주요 결과

  • 안정 특징 분포가 도메인 간에 다를 때 클래스-조건부 불변성은 도메인 일반화에 충분하지 않다.
  • 객체 중심의 불변성은 인과 특징 X_C 에 조건을 걸어 이론적으로 도메인 일반화 가능한 예측을 달성할 수 있다.
  • 두 단계로 구성된 MatchDG (반복적 대조 학습과 매칭을 활용) 은 Rotated MNIST, Fashion-MNIST, PACS, Chest X-ray 데이터세트에서 외부 도메인에서의 정확도가 경쟁력 있게 달성된다.
  • 객체 매치가 알려진 데이터셋에서 MatchDG는 실제 정답에 근접한 매치를 회복하며 겹침이 두드러진다(상위 10 매치가 50% 이상 겹침).
  • MDGHybrid 는 데이터 증강을 활용해 완벽한 객체 매치를 제공하고 실무에서 성능을 더 향상시킨다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.