盲目图像质量评估的测试时间适应
通过建立一个基准测试来评估和比较测试时间调整方法在提高模型稳健性和泛化性能方面的有效性,我们提供了一个可靠的评估方式,并探索了不同测试时间调整方法与不同网络骨干的兼容性。
Jul, 2023
本次研究调查了测试时间适应(TTA)在机器学习中的应用与优化方法。针对不同的学习场景,研究紧分测试时间领域适应、测试时间批适应、在线测试时间适应和测试时间先验适应四类,总结了高级算法的分类方法,探讨了 TTA 的应用与未来研究的挑战。
Mar, 2023
本研究提出了一种主动样本选择的准则,以确定可靠和不冗余的样本,从而使模型更新以最小化测试时适应的熵损失。 同时,引入了一个 Fisher 正则化器,约束重要的模型参数使其不会发生剧烈变化,从而缓解 “灾难性遗忘” 的问题。
Apr, 2022
本文提出了一种改进的测试时间自适应方法(ITTA),通过引入一个可学习的一致性损失,用于更新辅助测试任务,并且只在测试阶段更新可训练参数,从而解决了域泛化中分布偏移问题,实验表明,该方法在多个评估基准上具有卓越的性能。
Apr, 2023
该研究探讨了测试时间自适应的方法,使用特征修正、自我蒸馏以及空间本地化聚类等技术,提高了医学图像分割任务的性能,进一步提高了现有测试时间适应方法的性能表现。
Mar, 2023
通过将输入图像增强的新视角加入到 TTA 方法中,以减少预测的不确定性,我们提出了一种名为 TECA 的新方法。通过与图像增强模型结合,TECA 将分类模型与图像增强模型相结合,通过现有的 TTA 方法进行更新,从而减少预测的不确定性,提高 TTA 方法的准确性。
Mar, 2024
该论文提出了一种新颖的在线评估协议,用于对测试时间自适应(TTA)方法进行评估,通过为较慢的方法提供更少的自适应样本来惩罚它们。我们将该协议应用于多个数据集和场景中,评估了几种 TTA 方法,并表明当考虑推理速度时,简单快速的方法可以胜过更复杂但较慢的方法。
Apr, 2023
本研究旨在探讨如何通过测试时间适应(TTA)方法,提高已部署的问题回答(QA)模型的性能,评估了多种 TTA 方法(包括一种新方法 - OIL)在一个统一的 QA 评估基准(COLDQA)下的鲁棒性,研究表明,在已进行鲁棒性调优(RT)之后,应用 TTA 方法可以显著提高 QA 模型的性能。
Feb, 2023
本文提出了针对测试时间适应(TTA)的测试基准 TTAB,通过实验表明:在线批次依赖性使得选择适当的超参数尤其是选择模型极为困难,TTA 的有效性取决于模型的质量和属性,并且即使在最优算法条件下,现有方法也无法处理所有常见类型的分布转移,因此需要在更广泛的模型和转移集上进行严格评估和重新审视 TTA 的实证成功条件。
Jun, 2023