Skip to main content
QUICK REVIEW

[논문 리뷰] Efficient Test-Time Model Adaptation without Forgetting

Shuaicheng Niu, Jiaxiang Wu|arXiv (Cornell University)|2022. 04. 06.
Domain Adaptation and Few-Shot Learning인용 수 66
한 줄 요약

요약: 효율적 완전 테스트-타임 적응 방법인 EATA를 제안하며, 활성 샘플 선택과 Fisher 규제화를 통해 OOD 성능을 향상시키고 ID 데이터에서의 망각을 완화합니다. BN의 affine 매개변수만 업데이트하고 엔트로피 기반 및 다양성 기반 기준으로 적응 샘플을 선택합니다.

ABSTRACT

Test-time adaptation (TTA) seeks to tackle potential distribution shifts between training and testing data by adapting a given model w.r.t. any testing sample. This task is particularly important for deep models when the test environment changes frequently. Although some recent attempts have been made to handle this task, we still face two practical challenges: 1) existing methods have to perform backward computation for each test sample, resulting in unbearable prediction cost to many applications; 2) while existing TTA solutions can significantly improve the test performance on out-of-distribution data, they often suffer from severe performance degradation on in-distribution data after TTA (known as catastrophic forgetting). In this paper, we point out that not all the test samples contribute equally to model adaptation, and high-entropy ones may lead to noisy gradients that could disrupt the model. Motivated by this, we propose an active sample selection criterion to identify reliable and non-redundant samples, on which the model is updated to minimize the entropy loss for test-time adaptation. Furthermore, to alleviate the forgetting issue, we introduce a Fisher regularizer to constrain important model parameters from drastic changes, where the Fisher importance is estimated from test samples with generated pseudo labels. Extensive experiments on CIFAR-10-C, ImageNet-C, and ImageNet-R verify the effectiveness of our proposed method.

연구 동기 및 목표

  • Motivation: training과 testing 사이의 분포 변화에 대해 다루되 학습 데이터에 접근하거나 무거운 역전파 없이.
  • Goal: 효율적인 테스트-타임 적응을 달성하여 동일 분포 데이터의 성능을 유지.
  • Aim: 각 테스트 샘플당 역전 계산을 줄이면서 OOD 일반화를 개선.
  • Aim: Fisher 정보 기반 정규화로 적응 중 대 catastrophic forgetting 방지.

제안 방법

  • 샘플-적응 엔트로피 최소화를 도입하여 S(x)라는 활성 샘플 점수로 백워드 업데이트를 위한 신뢰할 수 있고 중복되지 않는 테스트 샘플을 선택합니다.
  • S(x)를 엔트로피 기반 가중치 S_ent(x)와 다양성 기반 가중치 S_div(x)의 곱으로 계산하여 고엔트로피 및 중복 샘플을 필터링합니다.
  • 적응 중 배치 정규화 계층의 affine 매개변수만 업데이트합니다.
  • 중요 매개변수의 큰 변화로부터 제한하는 Fisher 정보 기반 중요도 ω(θ_i)를 사용한 반망강(anti-forgetting) 정규화 R( tildeTheta, tildeTheta^o )를 제안합니다.
  • 원래 모델 예측으로 구성된 소수의 추정된 ID 테스트 샘플로부터 Fisher 중요도 ω(θ_i)를 추정합니다.
  • 적응을 위한 전체 목적 함수에 엔트로피 최소화와 정규화를 결합합니다.
  • 매 학습 배치 후 매개변수를 재설정하지 않는 평생/적응 설정을 제공합니다.

실험 결과

연구 질문

  • RQ1테스트-타임 적응을 어떻게 부분 매개변수와 선택적 샘플만 업데이트하여 효율적으로 만들 수 있을까?
  • RQ2엔트로피 기반 샘플 선택과 다양성 필터링이 계산량을 줄이면서 OOD에 대한 강건성을 향상시킬 수 있을까?
  • RQ3Fisher 기반 정규화가 테스트-타임 적응 중 ID 성능의 망각을 방지할 수 있을까?
  • RQ4제안된 방법이 CIFAR-10-C, ImageNet-C, ImageNet-R에서 기존 TTA 방법들과 비교해 어떤 성능을 보일까?

주요 결과

  • EATA는 ImageNet-C와 ImageNet-R에서 여러 기준선보다 더 높은 OOD 정확도를 달성하고 역전 패스를 줄였습니다.
  • ET A (efficient)는 신뢰할 수 없거나 중복된 샘플을 제외함으로써 TTT 및 MEMO에 비해 평균 역전 패스를 감소시킵니다.
  • EATA (lifelong)는 지속적 적응 동안 ID 청정 정확도를 유지하면서 OOD 성능을 보존하거나 개선합니다.
  • 고엔트로피 및 중복 샘플 제거가 효율성과 OOD 성능을 향상시키는 것을 나타내는 제거 실험이 있습니다.
  • Fisher 정규화는 OOD 이득을 해치지 않으면서 망각을 효과적으로 완화합니다.
  • 실험은 EATA가 벤치마크 전반에 걸쳐 ETA 및 유사 방법들보다 효율성과 견고성 면에서 우수하거나 비슷한 성능을 보임을 보여줍니다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.