Skip to main content
QUICK REVIEW

[논문 리뷰] Test-Time Adaptation to Distribution Shift by Confidence Maximization and Input Transformation

Chaithanya Kumar Mummadi, Robin Hutmacher|arXiv (Cornell University)|2021. 06. 28.
Anomaly Detection Techniques and Applications참고 문헌 39인용 수 40
한 줄 요약

이 논문은 target 라벨 없이 비포화되지 않는 likelihood-ratio 손실(HLR/SLR), 이동 평균을 이용한 다양성 정규화, 그리고 분포 이동에 대한 견고성을 높이기 위한 학습 가능한 입력 변환 모듈을 도입한 완전한 테스트 타임 적응을 제안한다.

ABSTRACT

Deep neural networks often exhibit poor performance on data that is unlikely under the train-time data distribution, for instance data affected by corruptions. Previous works demonstrate that test-time adaptation to data shift, for instance using entropy minimization, effectively improves performance on such shifted distributions. This paper focuses on the fully test-time adaptation setting, where only unlabeled data from the target distribution is required. This allows adapting arbitrary pretrained networks. Specifically, we propose a novel loss that improves test-time adaptation by addressing both premature convergence and instability of entropy minimization. This is achieved by replacing the entropy by a non-saturating surrogate and adding a diversity regularizer based on batch-wise entropy maximization that prevents convergence to trivial collapsed solutions. Moreover, we propose to prepend an input transformation module to the network that can partially undo test-time distribution shifts. Surprisingly, this preprocessing can be learned solely using the fully test-time adaptation loss in an end-to-end fashion without any target domain labels or source domain data. We show that our approach outperforms previous work in improving the robustness of publicly available pretrained image classifiers to common corruptions on such challenging benchmarks as ImageNet-C.

연구 동기 및 목표

  • 소스/타깃 라벨 없이 분포 이동 하에서 사전 학습된 모델의 견고한 성능을 촉진한다.
  • 높은 신뢰도 예측에서의 학습 지속을 위해 비포화 회귀 유사 손실을 도입한다.
  • 배치 간 런닝 어브레이지 다양성 정규화로 붕괴 해를 방지한다.
  • 도메인 시프트를 부분적으로 되돌리도록 학습 가능한 입력 변환을 앞에 두어 적응을 강화한다.
  • 여러 사전 학습 백본에서 ImageNet-C와 ImageNet-R에 대한 강인성이 향상됨을 보여준다.

제안 방법

  • 도메인 시프트를 부분적으로 상쇄하도록 학습 가능한 입력 변환 모듈을 사전 학습 네트워크에 앞에 배치하여 g = f ∘ d를 형성한다.
  • 매개변수의 부분집합만 적응시키고(예: BN의 아핀 매개변수) 테스트 시간에 타깃 데이터에서 BN 통계를 업데이트한다.
  • 자기지도 학습적 적응을 위해 비포화적 likelihood-ratio 기반 손실 L_hlr와 L_slr를 사용하고, 높은 신뢰도에서의 기울기 소실을 피한다.
  • 무난한 예측으로의 붕괴를 막기 위해 p_t(y)로의 런닝 어브레지 업데이트를 갖는 다양성 정규화 항 L_div를 도입한다.
  • L_div를 비포화 버전의 L_conf와 결합하여 정보를 가진 적응을 수행하면서 다양성을 유지한다.

실험 결과

연구 질문

  • RQ1소스 데이터 없이 손상되거나 시프트된 분포에서 완전한 테스트 타임 적응이 정확도를 향상시킬 수 있는가?
  • RQ2비포화적 likelihood-ratio 기반 손실(HLR/SLR)이 적응 중 높은 신뢰도 예측에서 엔트로피 기반 손실보다 더 나은 그래디언트 신호를 제공하는가?
  • RQ3런닝 어브레인지 다양성 정규화가 적응을 안정시키고 붕괴를 방지하는가?
  • RQ4테스트 시점에 학습된 입력 변환 모듈이 분포 시프트를 더 효과적으로 완화할 수 있는가?
  • RQ5제안된 방법들이 ImageNet-C와 ImageNet-R에서 여러 사전 학습 아키텍처에 대해 어떻게 작동하는가?

주요 결과

  • HLR 및 SLR은 ImageNet-C 및 ImageNet-R에서 여러 사전 학습 모델을 대상으로 TENT 및 TENT+보다 우수하다.
  • 제안된 손실로의 적응은 평균 손상 정확도를 향상시킴을 보이며, 특히 강건한 백본(예: DeepAugment+AugMix)을 사용할 때 두드러진다.
  • 단일 에폭의 테스트 타임 적응만으로도 상당한 이득을 얻고, 에폭 5까지 추가 이득이 있으며, L_div가 학습을 안정시킨다.
  • Shift를 부분적으로 되돌리는 입력 변환(IT) 모듈은 여러 왜곡(예: Impulse, Contrast)에 대한 강인성을 증가시킨다.
  • 실제 정답 감독 하의 적응이 상한치를 주며, 제안된 방법은 여러 설정에서 이 상한에 근접한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.