QUICK REVIEW

[논문 리뷰] Multi-Source Domain Adaptation for Text Classification via DistanceNet-Bandits

Han Guo, Ramakanth Pasunuru|arXiv (Cornell University)|2020. 01. 13.

Domain Adaptation and Few-Shot Learning인용 수 28

한 줄 요약

이 논문은 텍스트 분류를 위한 다중 소스 도메인 적응 프레임워크인 DistanceNet-Bandits를 제안한다. 이 프레임워크는 MMD, CORAL, 코사인 등의 거리 기반 측정치를 보조 손실 함수로 사용하여 소스 도메인과 타겟 도메인 표현을 정렬한다. 또한 학습 중에 최적의 소스 도메인을 동적으로 선택하기 위해 다중 손잡이 밴딧 컨트롤러를 도입하여, 도메인 분산 오차를 줄이고 저자원 타겟에 대한 일반화 능력을 향상시켜 감성 분석 벤치마크에서 최신 기술 수준의 성능을 달성한다.

ABSTRACT

Domain adaptation performance of a learning algorithm on a target domain is a function of its source domain error and a divergence measure between the data distribution of these two domains. We present a study of various distance-based measures in the context of NLP tasks, that characterize the dissimilarity between domains based on sample estimates. We first conduct analysis experiments to show which of these distance measures can best differentiate samples from same versus different domains, and are correlated with empirical results. Next, we develop a DistanceNet model which uses these distance measures, or a mixture of these distance measures, as an additional loss function to be minimized jointly with the task's loss function, so as to achieve better unsupervised domain adaptation. Finally, we extend this model to a novel DistanceNet-Bandit model, which employs a multi-armed bandit controller to dynamically switch between multiple source domains and allow the model to learn an optimal trajectory and mixture of domains for transfer to the low-resource target domain. We conduct experiments on popular sentiment analysis datasets with several diverse domains and show that our DistanceNet model, as well as its dynamic bandit variant, can outperform competitive baselines in the context of unsupervised domain adaptation.

연구 동기 및 목표

NLP 작업에서 도메인 불일치를 추정하기 위한 다양한 거리 기반 측정치를 연구하고 비교하는 것.
작업 손실과 도메인 이질성 손실을 동시에 최소화하는 DistanceNet 모델을 개발하여 비지도 도메인 적응을 향상시키는 것.
다중 손잡이 밴딧 컨트롤러를 사용하여 다중 소스 설정으로 DistanceNet을 확장하고 동적으로 효과적인 소스 도메인을 선택하는 것.
다양한 도메인을 가진 실제 감성 분석 데이터셋에서 거리 측정치와 제안된 프레임워크의 효과를 평가하는 것.

제안 방법

논문은 다섯 가지 거리 측정치를 평가한다: L2, 최대 평균 이질성(MMD), 피셔 선형 판별(FDA), 코사인, 상관관계 정렬(CORAL).
DistanceNet은 소스 도메인과 타겟 도메인 특징 간의 분포 차이를 최소화하기 위해 학습 중에 이러한 거리 측정치를 추가 손실 항목으로 통합한다.
초파rameter 민감도를 줄이고 강건성을 향상시키기 위해 거리 측정치의 혼합을 사용하며, 비지도 기준을 적용한다.
다중 소스 적응을 위해 다중 손잡이 밴딧 컨트롤러가 각 학습 단계에서 성능 피드백에 기반해 가장 효과적인 소스 도메인을 동적으로 선택한다.
밴딧 정책은 분류 손실 및 거리 손실과 함께 엔드 투 엔드로 훈련되어 적응형 도메인 스케줄링을 가능하게 한다.
실험은 다섯 개의 도메인(MR, Books, Apparel, Baby, Camera)을 가진 다중 도메인 감성 분석 데이터셋에서 수행된다.

실험 결과

연구 질문

RQ1NLP 작업에서 동일 또는 다른 도메인의 샘플을 가장 잘 구분하는 도메인 거리 측정치는 무엇인가?
RQ2다양한 거리 측정치가 경험적 도메인 적응 성능와 어떻게 상관관계가 있는가?
RQ3여러 거리 측정치를 조합하면 단일 측정치 기반 베이스라인을 초월해 비지도 도메인 적응을 향상시킬 수 있는가?
RQ4동적 밴딧 기반 소스 도메인 선택 컨트롤러는 다중 소스 도메인 적응에서 정적 또는 라운드 로빈 스케줄링을 능가할 수 있는가?

주요 결과

MMD 기반 DistanceNet 모델은 도메인 외 설정에서 평균 성능에서 기준편차 1개를 초월하여 베이스라인을 능가한다.
DistanceNet에서 거리 측정치의 혼합은 가장 높은 평균 성능을 달성하여, 기준편차 2개를 초월해 베이스라인을 향상시킨다.
DistanceNet-Bandit 모델은 개별 타겟 도메인 성능을 향상시키며, 비밴딧 베이스라인 대비 평균 1.1점 향상되었으며, 이는 두 표준편차 수준에서 유의미하다.
시각화 결과는 밴딧 컨트롤러가 맥락 기반 도메인 선호도를 학습하고 있음을 보여주며, 예를 들어 'MR' 타겟에는 'Books'를, 'Baby' 타겟에는 'Apparel'을 선호하는 경향을 보인다.
단일 소스 실험에서의 초파rameter를 재사용하더라도 밴딧은 항상 비밴딧 베이스라인을 능가하며, 이는 강건성과 적응 가능성의 증거이다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.