Skip to main content
QUICK REVIEW

[论文解读] Tent: Fully Test-time Adaptation by Entropy Minimization

Dequan Wang, Evan Shelhamer|arXiv (Cornell University)|Jun 18, 2020
Domain Adaptation and Few-Shot Learning参考文献 51被引用 284
一句话总结

Tent 通过通过通道级特征调制在推断阶段进行自适应,最小化预测熵,在没有源数据的情况下更新,达到最先进的鲁棒性和领域自适应结果。

ABSTRACT

A model must adapt itself to generalize to new and different data during testing. In this setting of fully test-time adaptation the model has only the test data and its own parameters. We propose to adapt by test entropy minimization (tent): we optimize the model for confidence as measured by the entropy of its predictions. Our method estimates normalization statistics and optimizes channel-wise affine transformations to update online on each batch. Tent reduces generalization error for image classification on corrupted ImageNet and CIFAR-10/100 and reaches a new state-of-the-art error on ImageNet-C. Tent handles source-free domain adaptation on digit recognition from SVHN to MNIST/MNIST-M/USPS, on semantic segmentation from GTA to Cityscapes, and on the VisDA-C benchmark. These results are achieved in one epoch of test-time optimization without altering training.

研究动机与目标

  • 在只有未标注的目标数据和模型参数可用的情况下,推动完全的测试时自适应。
  • 提出基于熵的目标函数(test entropy)来驱动自适应。
  • 通过低维的、通道级特征调制实现高效的在线自适应。
  • 保持训练数据和训练过程;仅在测试时进行自适应,而不改变训练。

提出的方法

  • 使用一个在有监督下训练的概率性、可微模型。
  • 将测试时目标定义为最小化目标数据上的预测熵。
  • 通过更新通道级仿射参数(gamma, beta)并估计每层的统计量(mu, sigma)来调制特征。
  • 在测试期间逐批更新归一化统计量和仿射参数,而无需访问源数据。
  • 仅用熵损失的梯度来优化调制参数(模型参数的一个小子集)。
  • 提供在线和离线自适应协议:在线更新随测试数据继续;离线更新在推断之前进行。

实验结果

研究问题

  • RQ1仅在未标注的测试数据上进行熵最小化,是否能够在没有源数据的情况下有效引导测试时自适应?
  • RQ2通道级特征调制(gamma, beta)结合实时统计估计是否足够高效地实现跨任务的鲁棒自适应?
  • RQ3在腐蚀、域移位和从仿真到真实的设置下,tent 与现有的测试时和领域自适应方法相比如何?

主要发现

  • Tent 在 ImageNet-C 上实现了最先进的鲁棒性,在线错误率为 44.0%,离线自适应为 42.3%。
  • 在 CIFAR-10-C 和 CIFAR-100-C 上,在最强腐蚀下,Tent 分别达到 14.3% 和 37.3% 的错误率,优于若干基线。
  • 对数字域移(SVHN 到 MNIST、MNIST-M、USPS),Tent 相对于批量归一化基线有所改进,且在无需源数据的情况下常常接近源训练的域自适应方法的表现。
  • Tent 可扩展到大模型以及语义分割(Cityscapes)和 VisDA-C,且受益于测试时熵最小化带来显著提升。
  • 仅调整调制参数(gamma, beta)需要很少的更新(通常<1% 的参数)并支持在线推断。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。