[论文解读] Tent: Fully Test-time Adaptation by Entropy Minimization
Tent 通过通过通道级特征调制在推断阶段进行自适应,最小化预测熵,在没有源数据的情况下更新,达到最先进的鲁棒性和领域自适应结果。
A model must adapt itself to generalize to new and different data during testing. In this setting of fully test-time adaptation the model has only the test data and its own parameters. We propose to adapt by test entropy minimization (tent): we optimize the model for confidence as measured by the entropy of its predictions. Our method estimates normalization statistics and optimizes channel-wise affine transformations to update online on each batch. Tent reduces generalization error for image classification on corrupted ImageNet and CIFAR-10/100 and reaches a new state-of-the-art error on ImageNet-C. Tent handles source-free domain adaptation on digit recognition from SVHN to MNIST/MNIST-M/USPS, on semantic segmentation from GTA to Cityscapes, and on the VisDA-C benchmark. These results are achieved in one epoch of test-time optimization without altering training.
研究动机与目标
- 在只有未标注的目标数据和模型参数可用的情况下,推动完全的测试时自适应。
- 提出基于熵的目标函数(test entropy)来驱动自适应。
- 通过低维的、通道级特征调制实现高效的在线自适应。
- 保持训练数据和训练过程;仅在测试时进行自适应,而不改变训练。
提出的方法
- 使用一个在有监督下训练的概率性、可微模型。
- 将测试时目标定义为最小化目标数据上的预测熵。
- 通过更新通道级仿射参数(gamma, beta)并估计每层的统计量(mu, sigma)来调制特征。
- 在测试期间逐批更新归一化统计量和仿射参数,而无需访问源数据。
- 仅用熵损失的梯度来优化调制参数(模型参数的一个小子集)。
- 提供在线和离线自适应协议:在线更新随测试数据继续;离线更新在推断之前进行。
实验结果
研究问题
- RQ1仅在未标注的测试数据上进行熵最小化,是否能够在没有源数据的情况下有效引导测试时自适应?
- RQ2通道级特征调制(gamma, beta)结合实时统计估计是否足够高效地实现跨任务的鲁棒自适应?
- RQ3在腐蚀、域移位和从仿真到真实的设置下,tent 与现有的测试时和领域自适应方法相比如何?
主要发现
- Tent 在 ImageNet-C 上实现了最先进的鲁棒性,在线错误率为 44.0%,离线自适应为 42.3%。
- 在 CIFAR-10-C 和 CIFAR-100-C 上,在最强腐蚀下,Tent 分别达到 14.3% 和 37.3% 的错误率,优于若干基线。
- 对数字域移(SVHN 到 MNIST、MNIST-M、USPS),Tent 相对于批量归一化基线有所改进,且在无需源数据的情况下常常接近源训练的域自适应方法的表现。
- Tent 可扩展到大模型以及语义分割(Cityscapes)和 VisDA-C,且受益于测试时熵最小化带来显著提升。
- 仅调整调制参数(gamma, beta)需要很少的更新(通常<1% 的参数)并支持在线推断。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。