Skip to main content
QUICK REVIEW

[論文レビュー] AdaNPC: Exploring Non-Parametric Classifier for Test-Time Adaptation

Yifan Zhang, Xue Wang|arXiv (Cornell University)|Apr 25, 2023
Domain Adaptation and Few-Shot Learning被引用数 14
ひとこと要約

AdaNPC はテスト時適応のための非パラメトリックでメモリベースの分類器を導入し、 heavy gradient 更新なしで連続するターゲットドメインに対して強力な DG パフォーマンスと頑健性を発揮します。

ABSTRACT

Many recent machine learning tasks focus to develop models that can generalize to unseen distributions. Domain generalization (DG) has become one of the key topics in various fields. Several literatures show that DG can be arbitrarily hard without exploiting target domain information. To address this issue, test-time adaptive (TTA) methods are proposed. Existing TTA methods require offline target data or extra sophisticated optimization procedures during the inference stage. In this work, we adopt Non-Parametric Classifier to perform the test-time Adaptation (AdaNPC). In particular, we construct a memory that contains the feature and label pairs from training domains. During inference, given a test instance, AdaNPC first recalls K closed samples from the memory to vote for the prediction, and then the test feature and predicted label are added to the memory. In this way, the sample distribution in the memory can be gradually changed from the training distribution towards the test distribution with very little extra computation cost. We theoretically justify the rationality behind the proposed method. Besides, we test our model on extensive numerical experiments. AdaNPC significantly outperforms competitive baselines on various DG benchmarks. In particular, when the adaptation target is a series of domains, the adaptation accuracy of AdaNPC is 50% higher than advanced TTA methods. The code is available at https://github.com/yfzhang114/AdaNPC.

研究の動機と目的

  • ドメイン一般化と未知分布に対する頑健性を動機づける。
  • テスト時適応のためのメモリ拡張型非パラメトリック手法(AdaNPC)を提案する。
  • 非パラメトリック分類器がドメイン分岐とターゲットリスクを低減する方法を理論的に正当化する。
  • 複数の DG ベンチマークとさまざまなバックボーンでの実証的な利得を示す。

提案手法

  • 同じラベルの特徴を引き寄せ、異なるラベルの特徴を離すような表現を学習する KNN ベースの損失で訓練する(式 4)。
  • ソース特徴とラベルのメモリバンク M を構築し、テスト時に最近傍を用いて投票する(式 5)。
  • 信頼度が高い場合にテスト特徴と予測ラベルでメモリを更新して memory-based なテスト時適応を実施する。
  • 適応中の表現品質を改善するためにBN層を再訓練するオプションを提供。
  • 効率のために FIFO ベースのシンプルなメモリ管理と直接的な KNN 探索を実装する。

実験結果

リサーチクエスチョン

  • RQ1非パラメトリックでメモリベースの分類器は勾配更新を伴わずにテスト時適応を改善し、ドメイン一般化を達成できるか。
  • RQ2オンラインのターゲットサンプルをメモリに取り込むことはターゲットリスクとドメイン分岐にどのような影響を与えるか。
  • RQ3共変量シフトと事後分布シフトに対して KNN ベースの適応に理論的保証は存在するか。
  • RQ4AdaNPC は複数の DG ベンチマークとバックボーンで、連続的なドメイン適応シナリオを含めてどのように性能を示すか。

主な発見

MethodRMNISTPACSVLCSTerraIncognitaDomainNetAvg
ERM97.8 ± 0.177.6 ± 0.386.7 ± 0.341.3 ± 0.153.0 ± 0.371.3
IRM97.5 ± 0.276.9 ± 0.684.5 ± 1.128.0 ± 5.150.5 ± 0.767.5
GDRO97.9 ± 0.177.4 ± 0.587.1 ± 0.133.4 ± 0.352.4 ± 0.169.6
CORAL98.0 ± 0.077.7 ± 0.287.1 ± 0.541.8 ± 0.152.8 ± 0.271.5
DANN97.9 ± 0.179.7 ± 0.585.2 ± 0.238.3 ± 0.150.6 ± 0.470.3
MTL97.9 ± 0.177.7 ± 0.586.7 ± 0.240.8 ± 0.152.2 ± 0.471.1
SagNet97.9 ± 0.077.6 ± 0.186.4 ± 0.440.8 ± 0.252.5 ± 0.471.1
ARM98.1 ± 0.177.8 ± 0.385.8 ± 0.236.0 ± 0.251.2 ± 0.569.8
VREx97.9 ± 0.178.1 ± 0.287.2 ± 0.630.1 ± 3.751.4 ± 0.568.9
Fish97.9 ± 0.177.8 ± 0.685.8 ± 0.643.4 ± 0.350.8 ± 0.471.1
Fishr97.8 ± 0.178.2 ± 0.286.9 ± 0.241.8 ± 0.253.6 ± 0.471.7
AdaNPC98.5 ± 0.179.5 ± 2.488.8 ± 0.142.9 ± 0.553.9 ± 0.372.7
AdaNPC +BN98.4 ± 0.180.2 ± 0.288.9 ± 0.143.1 ± 0.854.0 ± 0.172.9
  • AdaNPC は 5 つの OOD ベンチマークにおいて競合的で最先端の DG パフォーマンスを達成している。
  • AdaNPC および AdaNPC +BN は多くのベースラインを上回り、平均精度で substantial な向上を示す。
  • BN 再訓練はパラメータ更新を最小限に抑えつつ追加の利得を提供する。
  • AdaNPC は微調整なしでも強い性能を発揮し、ソースデータセットの規模が拡大してもスケールする。
  • 連続適応において、AdaNPC は忘却を大幅に抑制し、ソースドメインの精度を維持する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。