Skip to main content
QUICK REVIEW

[논문 리뷰] Unsupervised Domain Adaptation of Black-Box Source Models

Haojian Zhang, Yabin Zhang|arXiv (Cornell University)|2021. 01. 08.
Domain Adaptation and Few-Shot Learning참고 문헌 58인용 수 37
한 줄 요약

본 논문은 IterLNL이라는 프레임워크를 제시한다. 이는 검은 상자 소스 모델의 예측을 이용하여 대상 데이터를 반복적으로 라벨링하되 노이즈 처리와 카테고리별 샘플링을 적용하는 블랙박스 비지도 도메인 적응(B2UDA) 프레임워크로, 소스 데이터나 소스 모델 자체에 접근하지 않으면서도 경쟁력 있는 성능을 달성한다.

ABSTRACT

Unsupervised domain adaptation (UDA) aims to learn models for a target domain of unlabeled data by transferring knowledge from a labeled source domain. In the traditional UDA setting, labeled source data are assumed to be available for adaptation. Due to increasing concerns for data privacy, source-free UDA is highly appreciated as a new UDA setting, where only a trained source model is assumed to be available, while labeled source data remain private. However, trained source models may also be unavailable in practice since source models may have commercial values and exposing source models brings risks to the source domain, e.g., problems of model misuse and white-box attacks. In this work, we study a subtly different setting, named Black-Box Unsupervised Domain Adaptation (B$^2$UDA), where only the application programming interface of source model is accessible to the target domain; in other words, the source model itself is kept as a black-box one. To tackle B$^2$UDA, we propose a simple yet effective method, termed Iterative Learning with Noisy Labels (IterLNL). With black-box models as tools of noisy labeling, IterLNL conducts noisy labeling and learning with noisy labels (LNL), iteratively. To facilitate the implementation of LNL in B$^2$UDA, we estimate the noise rate from model predictions of unlabeled target data and propose category-wise sampling to tackle the unbalanced label noise among categories. Experiments on benchmark datasets show the efficacy of IterLNL. Given neither source data nor source models, IterLNL performs comparably with traditional UDA methods that make full use of labeled source data.

연구 동기 및 목표

  • 오직 블랙박스 소스 모델의 API에만 접근 가능한 프라이버시 보존형 UDA를 다룬다.
  • 블랙박스 예측에서 발생하는 불균형한 라벨 노이즈에 맞춘 견고한 노이즈 라벨 학습(LNL) 전략을 개발한다.
  • 레이블된 타깃 데이터 없이 노이즈 비율을 추정하고 카테고리별로 학습 샘플을 적응적으로 선택한다.
  • 소스 데이터 없이도 전통적인 UDA 및 화이트박스 UDA 기준선에 근접한 타깃 도메인 성능을 향상시킨다.

제안 방법

  • 블랙박스 소스 모델로부터 타깃 예측을 얻어 라벨이 없는 타깃 데이터에 대한 노이즈 라벨을 생성한다.
  • 학습에 정보를 주기 위해 재스케일된 확률 기반 지표를 사용하여 타깃 예측으로부터 노이즈 비율을 추정한다(식 6–10).
  • 카테고리별 샘플링을 적용하여 학습을 위한 각 카테고리당 손실이 가장 작은 샘플을 선택한다(카테고리별 버퍼 포함).
  • 학습-with-noisy-labels(LNL)을 사용하여 타깃 모델을 업데이트하고, 반복마다 감소하는 커리큘럼 R(n)(식 6)을 따라 안내한다.
  • 타깃 모델을 반복적으로 업데이트하고 이를 다음 라운드의 새로운 검은 박스 소스로 재사용한다(IterLNL 루프).

실험 결과

연구 질문

  • RQ1소스 데이터 없이 오직 블랙박스 소스 모델 API만 이용할 때 B2UDA가 경쟁력 있는 성능을 달성할 수 있는가?
  • RQ2도메인 시프트로 인해 유발되는 불균형 라벨 노이즈를 B2UDA에서 효과적으로 처리하는 방법은 무엇인가?
  • RQ3노이즈 비율 추정, 카테고리별 샘플링, 반복 등 어떤 메커니즘이 IterLNL의 로버스트한 학습을 이끄는가?
  • RQ4표준 벤치마크 데이터셋에서 IterLNL이 기존의 B2UDA, 소스-프리 UDA, 및 일반 UDA 방법들과 어떻게 비교되는가?

주요 결과

  • IterLNL은 벤치마크 데이터셋에서 기존 B2UDA 방법들보다 상당히 향상시킨다.
  • 소스 데이터나 소스 모델 내부에 접근하지 못함에도 불구하고 흰박스 UDA 방법 및 전통적 UDA와 비슷한 성과를 달성한다.
  • 카테고리별 샘플링과 반복 학습은 매우 불균형한 라벨 노이즈를 다루고 카테고리 특정 실패를 피하는 데 중요하다.
  • 에블레이션 연구는 노이즈 비율 추정, 재스케일 곡선, 그리고 카테고리별 샘플링이 견고한 성능에 중요함을 보인다.
  • VisDA-2017, Office31, Digits 작업에서 IterLNL은 기본 소스-모델 및 여러 B2UDA 변형들을 상당한 차이로 능가한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.