无遗忘的不确定性校准的测试时间模型适应

Mar, 2024

无遗忘的不确定性校准的测试时间模型适应

Uncertainty-Calibrated Test-Time Model Adaptation without Forgetting

Mingkui Tan, Guohao Chen, Jiaxiang Wu, Yifan Zhang, Yaofo Chen...

TL;DR测试时间适应 (Test-time adaptation，TTA) 在适应给定模型到任何测试样本，以解决训练与测试数据之间的潜在分布差异。然而，现有方法在每个测试样本上执行反向传播，导致对许多应用而言无法承受的优化成本，并且现有的 TTA 在无分布数据上可以显著提高测试性能，但在分布数据上经常遭受严重的性能退化（即遗忘）。为了解决这个问题，我们提出了一种高效的抗遗忘测试时间适应（Efficient Anti-Forgetting Test-Time Adaptation，EATA）方法，该方法通过开发主动样本选择准则来识别可靠且非冗余的测试样本，以实现测试时间熵的最小化。为了减轻遗忘，EATA 引入了一种从测试样本估计的 Fisher 正则化约束重要模型参数以防止剧烈变化的方法。然而，在 EATA 中，采用的熵损失通常将更高的置信度分配给不确定的样本，导致过度自信的预测。为了解决这个问题，我们进一步提出了用校准（Calibration）的 EATA（EATA-C）来分别利用可减小的模型不确定性和固有数据不确定性进行校准的 TTA。具体来说，我们通过完整网络和其子网络之间的预测差异来衡量模型不确定性，为此我们提出了一种差异损失来鼓励一致的预测而不是过度自信的预测。为了进一步重新校准预测置信度，我们利用预测标签之间的差异作为数据不确定性的指标，然后设计了一种最小最大熵正则化器来有选择地增加和减小不同样本的预测置信度。图像分类和语义分割的实验验证了我们方法的有效性。

Abstract

test-time adaptation (TTA) seeks to tackle potential distribution shifts between training and test data by adapting a given model w.r.t. any test sample. Although recent TTA has shown promising performance, we st

test-time adaptation distribution shifts anti-forgetting calibration prediction confidence

发现论文，激发创造

无遗忘的高效测试时间模型自适应

本研究提出了一种主动样本选择的准则，以确定可靠和不冗余的样本，从而使模型更新以最小化测试时适应的熵损失。同时，引入了一个 Fisher 正则化器，约束重要的模型参数使其不会发生剧烈变化，从而缓解 “灾难性遗忘” 的问题。

Apr, 2022

从聚类视角改进基于熵的测试时适应性

领域转移是现实世界中常见的问题，完全测试时间适应（TTA）利用测试时间遇到的未标记数据来调整模型。我们从聚类的视角介绍了熵基于 TTA 方法（EBTTA），解释了为什么现有的 EBTTA 方法对初始分配、异常值和批次大小敏感，并提出了改进的方法。实验结果表明，我们的方法在各种数据集上都能取得一致的改进。

Oct, 2023

动态野外环境中稳定的测试时适应性

论文通过分析测试样本及训练数据的分配差异，发现批处理层对测试时间调整法的不稳定性有重要影响。作者提出了一种基于群组及层规范化的调整稳定方法，并提出一种名为 SAR 的方法，通过消除嘈杂测试样本及鼓励模型权重保持平稳的最小值，从两个方面进一步稳定 TTA，效果比先前方法更稳定，且在上述野外测试方案下计算效率更高。

Feb, 2023

REALM：强健的熵自适应损失最小化，为改进单样本测试时间自适应提供支持

提出了一种名为 Robust Entropy Adaptive Loss Minimization (REALM) 的方法，通过改进 F-TTA 中的噪声样本问题，提高了自适应过程的准确性。

Sep, 2023

共轭伪标签测试时调整

本文研究了针对分布漂移进行测试时间自适应（TTA）的方法，在各种函数类中元学习 TTA loss 能够迅速获得与熵函数类似的 loss 函数，并基于最优 loss 函数提供了更好的 TTA 方法。同时，在新型的 supervised training loss 函数中，我们的方法也显示了优异的表现，为改善测试时间自适应提供了广阔的框架。

Jul, 2022

基于群体智慧的熵最小化方法，实现测试时的开放集适应

通过以熵最小化为灵感来源的样本选择方法，我们过滤掉适应模型中的置信度值降低的样本，从而解决测试时自适应方法中由于错误预测导致的噪音问题，显著改善了图像分类和语义分割的长期适应性能。

Aug, 2023

SoTTA：嘈杂数据流上的鲁棒测试时适应

通过高置信度统一类别采样实现输入层面的健壮性和通过熵 - 锐度最小化提高模型参数对噪声样本大梯度的健壮性，我们提出了一种对噪声样本具有鲁棒性的新颖的测试时适应性算法（SoTTA），在各种噪声场景下，我们的方法优于基准测试时适应性方法，并在没有噪声样本的情况下达到可比较的准确度。

Oct, 2023

主动测试时间适应：理论分析与算法

使用主动学习在完全的测试时间适应设置中，通过限制标记测试实例的数量，提高测试领域之间的整体性能，同时避免灾难性遗忘，从而在测试时间适应（TTA）下解决领域偏移的问题。

Apr, 2024

可靠的测试时间适应性通过线上协议

通过对测试数据的自适应方法（TTA）进行评估和校准，解决了分布转移时的困难，同时提出了关于 OOD 准确性估计和超参数调整的可靠方法。

Oct, 2023

AETTA: 测试时适应的无标签精度估计

我们提出了一种适用于测试时间自适应（TTA）的无标签准确度估计算法 AETTA，通过与辍学推断比较目标模型预测来改进预测不一致性以扩展 AETTA 在适应失败下的适用性。我们进行了广泛的评估，并使用四个基线模型和六种 TTA 方法进行实验证明了 AETTA 相比基线方法具有平均高出 19.8％的准确度估计，此外通过模型恢复案例研究进一步证明了准确度估计的有效性。

Apr, 2024