Mar, 2024

无遗忘的不确定性校准的测试时间模型适应

TL;DR测试时间适应 (Test-time adaptation,TTA) 在适应给定模型到任何测试样本,以解决训练与测试数据之间的潜在分布差异。然而,现有方法在每个测试样本上执行反向传播,导致对许多应用而言无法承受的优化成本,并且现有的 TTA 在无分布数据上可以显著提高测试性能,但在分布数据上经常遭受严重的性能退化(即遗忘)。为了解决这个问题,我们提出了一种高效的抗遗忘测试时间适应(Efficient Anti-Forgetting Test-Time Adaptation,EATA)方法,该方法通过开发主动样本选择准则来识别可靠且非冗余的测试样本,以实现测试时间熵的最小化。为了减轻遗忘,EATA 引入了一种从测试样本估计的 Fisher 正则化约束重要模型参数以防止剧烈变化的方法。然而,在 EATA 中,采用的熵损失通常将更高的置信度分配给不确定的样本,导致过度自信的预测。为了解决这个问题,我们进一步提出了用校准(Calibration)的 EATA(EATA-C)来分别利用可减小的模型不确定性和固有数据不确定性进行校准的 TTA。具体来说,我们通过完整网络和其子网络之间的预测差异来衡量模型不确定性,为此我们提出了一种差异损失来鼓励一致的预测而不是过度自信的预测。为了进一步重新校准预测置信度,我们利用预测标签之间的差异作为数据不确定性的指标,然后设计了一种最小最大熵正则化器来有选择地增加和减小不同样本的预测置信度。图像分类和语义分割的实验验证了我们方法的有效性。