可靠的测试时间适应性通过线上协议
本次研究调查了测试时间适应(TTA)在机器学习中的应用与优化方法。针对不同的学习场景,研究紧分测试时间领域适应、测试时间批适应、在线测试时间适应和测试时间先验适应四类,总结了高级算法的分类方法,探讨了 TTA 的应用与未来研究的挑战。
Mar, 2023
本文提出了针对测试时间适应(TTA)的测试基准 TTAB,通过实验表明:在线批次依赖性使得选择适当的超参数尤其是选择模型极为困难,TTA 的有效性取决于模型的质量和属性,并且即使在最优算法条件下,现有方法也无法处理所有常见类型的分布转移,因此需要在更广泛的模型和转移集上进行严格评估和重新审视 TTA 的实证成功条件。
Jun, 2023
在测试期间,通过使用未标记的测试数据流独占地对预先训练的模型进行适应,测试时间适应(TTA)在实际应用中具有重要价值。本研究引入了一个更具挑战性的实用测试时间适应(PTTA)设置,并提出了一种广义鲁棒的测试时间适应(GRoTTA)方法来有效解决困难问题。通过稳定地通过鲁棒参数适应使模型平衡预测测试样本,实验表明 GRoTTA 在 PTTA 设置下明显优于现有竞争对手,有助于在实际应用中采用。
Oct, 2023
该论文提出了一种新颖的在线评估协议,用于对测试时间自适应(TTA)方法进行评估,通过为较慢的方法提供更少的自适应样本来惩罚它们。我们将该协议应用于多个数据集和场景中,评估了几种 TTA 方法,并表明当考虑推理速度时,简单快速的方法可以胜过更复杂但较慢的方法。
Apr, 2023
通过建立一个基准测试来评估和比较测试时间调整方法在提高模型稳健性和泛化性能方面的有效性,我们提供了一个可靠的评估方式,并探索了不同测试时间调整方法与不同网络骨干的兼容性。
Jul, 2023
本研究提出了一种主动样本选择的准则,以确定可靠和不冗余的样本,从而使模型更新以最小化测试时适应的熵损失。 同时,引入了一个 Fisher 正则化器,约束重要的模型参数使其不会发生剧烈变化,从而缓解 “灾难性遗忘” 的问题。
Apr, 2022
通过高置信度统一类别采样实现输入层面的健壮性和通过熵 - 锐度最小化提高模型参数对噪声样本大梯度的健壮性,我们提出了一种对噪声样本具有鲁棒性的新颖的测试时适应性算法(SoTTA),在各种噪声场景下,我们的方法优于基准测试时适应性方法,并在没有噪声样本的情况下达到可比较的准确度。
Oct, 2023
全面测试时间适应 (TTA) 旨在使模型适应数据漂移,最近引起了广泛的兴趣。我们提供了选择的正交 TTA 技术的分类,并对其对不同情景的影响进行了细致分析。我们揭示了这些技术在准确性、计算能力和模型复杂性之间产生的权衡,并发现了将技术结合起来产生的协同效应,从而取得了新的最先进结果。
Oct, 2023
本文研究了针对分布漂移进行测试时间自适应(TTA)的方法,在各种函数类中元学习 TTA loss 能够迅速获得与熵函数类似的 loss 函数,并基于最优 loss 函数提供了更好的 TTA 方法。同时,在新型的 supervised training loss 函数中,我们的方法也显示了优异的表现,为改善测试时间自适应提供了广阔的框架。
Jul, 2022