非平稳测试时间适应的逐层自动加权
本文提出了一种名为 ROID 的方法,该方法通过使用确定性和多样性加权、源模型和自适应模型的加权平均以及自适应添加先验校正方案等多项技术手段,解决了在线测试时自适应的问题,以及由于多种因素引起的模型性能下降问题。该方法在多种数据集、模型和场景下进行了评估,并在普遍 TTA 领域取得了新的标准。
Jun, 2023
提出了一个基于权重平均和增强平均预测的持续测试时间自适应方法,在长期内实现了所有神经网络参数的适应,同时有效避免了疾病遗忘和噪声伪标签带来的错误积累,该方法处理的问题主要集中在测试时间域适应和深度学习等领域。
Mar, 2022
通过引入 Layerwise EArly STopping (LEAST) 和使用一种新的基于梯度的度量来衡量当前学习特征对新域的相关性,我们提出了一种解决 Test Time Adaptation (TTA) 中保持学习新特征和保留预训练特征之间平衡的方法。这种方法可以在多个数据集、域转换、模型架构和 TTA 损失上提高现有 TTA 方法的性能。
Apr, 2024
通过在不依赖于伪标签的情况下,通过模型预测不确定性的量化来识别层,以克服先前方法的局限性;在 CIFAR-10C、CIFAR-100C 和 ImageNet-C 等标准测试数据集上进行了详细的图像分类实验,证明了我们方法的功效。
Mar, 2024
本研究提出了一种主动样本选择的准则,以确定可靠和不冗余的样本,从而使模型更新以最小化测试时适应的熵损失。 同时,引入了一个 Fisher 正则化器,约束重要的模型参数使其不会发生剧烈变化,从而缓解 “灾难性遗忘” 的问题。
Apr, 2022
论文通过分析测试样本及训练数据的分配差异,发现批处理层对测试时间调整法的不稳定性有重要影响。作者提出了一种基于群组及层规范化的调整稳定方法,并提出一种名为 SAR 的方法,通过消除嘈杂测试样本及鼓励模型权重保持平稳的最小值,从两个方面进一步稳定 TTA,效果比先前方法更稳定,且在上述野外测试方案下计算效率更高。
Feb, 2023
PETAL 是一种基于概率视角和部分数据相关先验的测试时间自适应方法,利用 Fisher 信息矩阵的数据驱动模型参数重置机制应对非平稳目标领域转移,实验结果表明 PETAL 在多个基准测试数据集中表现出更好的预测性能和不确定性指标。
Dec, 2022
通过无监督领域变化检测方法,该论文解决了传统测试时适应方法在动态环境中适应连续变化的目标分布时所面临的挑战,包括之前学习的有价值源知识的灾难性遗忘和由于错误标签的错误校准而导致的渐进性误差积累问题。
Nov, 2023
测试时间适应 (Test-time adaptation,TTA) 在适应给定模型到任何测试样本,以解决训练与测试数据之间的潜在分布差异。然而,现有方法在每个测试样本上执行反向传播,导致对许多应用而言无法承受的优化成本,并且现有的 TTA 在无分布数据上可以显著提高测试性能,但在分布数据上经常遭受严重的性能退化(即遗忘)。为了解决这个问题,我们提出了一种高效的抗遗忘测试时间适应(Efficient Anti-Forgetting Test-Time Adaptation,EATA)方法,该方法通过开发主动样本选择准则来识别可靠且非冗余的测试样本,以实现测试时间熵的最小化。为了减轻遗忘,EATA 引入了一种从测试样本估计的 Fisher 正则化约束重要模型参数以防止剧烈变化的方法。然而,在 EATA 中,采用的熵损失通常将更高的置信度分配给不确定的样本,导致过度自信的预测。为了解决这个问题,我们进一步提出了用校准(Calibration)的 EATA(EATA-C)来分别利用可减小的模型不确定性和固有数据不确定性进行校准的 TTA。具体来说,我们通过完整网络和其子网络之间的预测差异来衡量模型不确定性,为此我们提出了一种差异损失来鼓励一致的预测而不是过度自信的预测。为了进一步重新校准预测置信度,我们利用预测标签之间的差异作为数据不确定性的指标,然后设计了一种最小最大熵正则化器来有选择地增加和减小不同样本的预测置信度。图像分类和语义分割的实验验证了我们方法的有效性。
Mar, 2024
该研究探讨了测试时间自适应的方法,使用特征修正、自我蒸馏以及空间本地化聚类等技术,提高了医学图像分割任务的性能,进一步提高了现有测试时间适应方法的性能表现。
Mar, 2023