Skip to main content
QUICK REVIEW

[논문 리뷰] AdaNPC: Exploring Non-Parametric Classifier for Test-Time Adaptation

Yifan Zhang, Xue Wang|arXiv (Cornell University)|2023. 04. 25.
Domain Adaptation and Few-Shot Learning인용 수 14
한 줄 요약

AdaNPC는 테스트 시 적응을 위한 비모수적 메모리 기반 분류기를 도입하여, 여러 표적 도메인에 걸친 강력한 DG 성능과 로딩 없이 연속적인 도메인에 대한 견고함을 제공합니다.

ABSTRACT

Many recent machine learning tasks focus to develop models that can generalize to unseen distributions. Domain generalization (DG) has become one of the key topics in various fields. Several literatures show that DG can be arbitrarily hard without exploiting target domain information. To address this issue, test-time adaptive (TTA) methods are proposed. Existing TTA methods require offline target data or extra sophisticated optimization procedures during the inference stage. In this work, we adopt Non-Parametric Classifier to perform the test-time Adaptation (AdaNPC). In particular, we construct a memory that contains the feature and label pairs from training domains. During inference, given a test instance, AdaNPC first recalls K closed samples from the memory to vote for the prediction, and then the test feature and predicted label are added to the memory. In this way, the sample distribution in the memory can be gradually changed from the training distribution towards the test distribution with very little extra computation cost. We theoretically justify the rationality behind the proposed method. Besides, we test our model on extensive numerical experiments. AdaNPC significantly outperforms competitive baselines on various DG benchmarks. In particular, when the adaptation target is a series of domains, the adaptation accuracy of AdaNPC is 50% higher than advanced TTA methods. The code is available at https://github.com/yfzhang114/AdaNPC.

연구 동기 및 목표

  • 미지의 분포에 대한 도메인 일반화와 강건성에 대한 동기를 부여한다.
  • 메모리 보강 비모수적 접근법을 테스트 시 적응(AdaNPC)으로 제안한다.
  • 비모수 분류기가 어떻게 도메인 분리도와 대상 위험을 감소시키는지 이론적으로 정당화한다.
  • 다양한 백본을 갖춘 다수의 DG 벤치마크에서 강력한 실증적 이득을 보여준다.

제안 방법

  • 동일 레이블 특성을 함께 모으고 다른 레이블 특성을 퍼뜨리는 KNN 기반 손실(Eq. 4)을 사용하여 표현을 학습한다.
  • 소스 특징과 라벨의 메모리 뱅크 M를 구성하고 테스트 시 근처 K개의 이웃과 투표하는 데 사용한다(Eq. 5).
  • 확신도 높을 때 테스트 특징과 예측 라벨로 메모리를 업데이트하여 메모리 기반 테스트 시 적응을 수행한다.
  • 적응 중 표현 품질을 높이기 위해 BN 계층을 재훈련하는 것을 선택적으로 수행한다.
  • 효율성을 위해 FIFO 기반의 간단한 메모리 관리와 직관적인 KNN 탐색을 구현한다.

실험 결과

연구 질문

  • RQ1비모수적이고 메모리 기반의 분류기가 그래디언트 기반 업데이트 없이 도메인 일반화에 대한 테스트 시 적응을 개선할 수 있는가?
  • RQ2메모리에 온라인 타깃 샘플을 포함시키는 것이 대상 위험과 도메인 발산에 어떤 영향을 미치는가?
  • RQ3공변량 및 후방 분포 변화하에서 KNN 기반 적응에 대한 이론적 보장은 무엇이 있는가?
  • RQ4AdaNPC가 다양한 DG 벤치마크와 백본에서, 연속적 도메인 적응 시나리오를 포함하여 얼마나 성능을 내는가?

주요 결과

MethodRMNISTPACSVLCSTerraIncognitaDomainNetAvg
ERM97.8 ± 0.177.6 ± 0.386.7 ± 0.341.3 ± 0.153.0 ± 0.371.3
IRM97.5 ± 0.276.9 ± 0.684.5 ± 1.128.0 ± 5.150.5 ± 0.767.5
GDRO97.9 ± 0.177.4 ± 0.587.1 ± 0.133.4 ± 0.352.4 ± 0.169.6
CORAL98.0 ± 0.077.7 ± 0.287.1 ± 0.541.8 ± 0.152.8 ± 0.271.5
DANN97.9 ± 0.179.7 ± 0.585.2 ± 0.238.3 ± 0.150.6 ± 0.470.3
MTL97.9 ± 0.177.7 ± 0.586.7 ± 0.240.8 ± 0.152.2 ± 0.471.1
SagNet97.9 ± 0.077.6 ± 0.186.4 ± 0.440.8 ± 0.252.5 ± 0.471.1
ARM98.1 ± 0.177.8 ± 0.385.8 ± 0.236.0 ± 0.251.2 ± 0.569.8
VREx97.9 ± 0.178.1 ± 0.287.2 ± 0.630.1 ± 3.751.4 ± 0.568.9
Fish97.9 ± 0.177.8 ± 0.685.8 ± 0.643.4 ± 0.350.8 ± 0.471.1
Fishr97.8 ± 0.178.2 ± 0.286.9 ± 0.241.8 ± 0.253.6 ± 0.471.7
AdaNPC98.5 ± 0.179.5 ± 2.488.8 ± 0.142.9 ± 0.553.9 ± 0.372.7
AdaNPC +BN98.4 ± 0.180.2 ± 0.288.9 ± 0.143.1 ± 0.854.0 ± 0.172.9
  • AdaNPC는 다섯 가지 OOD 벤치마크에서 DG 성능이 경쟁력 있게 혹은 최첨단에 근접하다.
  • AdaNPC 및 AdaNPC +BN이 많은 베이스라인을 능가하며 평균 정확도에서 상당한 이득을 보인다.
  • BN 재훈련은 매개변수 업데이트를 최소화하면서도 추가 이득을 제공한다.
  • AdaNPC는 파인튜닝 없이도 강한 성능을 보여주고, 소스 데이터셋이 커질수록 스케일이 잘된다.
  • 연속적 적응에서 AdaNPC는 망각을 크게 완화하고 소스 도메인 정확도를 유지한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.