发现邻居:动态世界中的高级稳定测试时适应
论文通过分析测试样本及训练数据的分配差异,发现批处理层对测试时间调整法的不稳定性有重要影响。作者提出了一种基于群组及层规范化的调整稳定方法,并提出一种名为 SAR 的方法,通过消除嘈杂测试样本及鼓励模型权重保持平稳的最小值,从两个方面进一步稳定 TTA,效果比先前方法更稳定,且在上述野外测试方案下计算效率更高。
Feb, 2023
提出了一种新的测试时间自适应方法 Test-time Adaptation via Self-Training with nearest neighbor information (TAST),其利用最近邻信息生成伪标签并通过自训练进行分类,能够在领域一般化和图像破坏等方面取得优于现有方法的性能。
Jul, 2022
测试时间适应(TTA)已成为解决测试数据训练和测试之间意外分布变化导致性能下降的有希望的方法。本研究提出中位数批归一化(MedBN)来应对 TTA 中的恶意示例对模型造成的潜在威胁,通过在测试推理期间的批归一化层中利用中位数来进行统计估计。我们的实验结果表明,MedBN 在维护不同攻击场景下的鲁棒性表现方面优于现有方法,且在无攻击情况下仍能保持良好的性能。
Mar, 2024
本文提出了一种基于 alpha-BN 的测试时间适应框架 Core,通过混合源和目标统计信息来校准批次统计量以缓解域漂移并保留区分结构。实验证明我们的方法在包括图像分类和语义分割的三个主题的 12 个数据集上实现了最先进的性能。特别地,在没有任何训练的情况下,我们的 alpha-BN 改进了 28.4%至 43.9%,甚至超过了最新的源无关域自适应方法。
Oct, 2021
本文提出了一种新型的批次规范化策略 —— 测试时间适应的归一化统计方法,通过调整传统归一化和传输归一化统计信息的权重,以适应各种实际评估场景,提高模型对于不同批次大小和领域转移的鲁棒性,实现了各项标准评测中的最佳性能。
Feb, 2023
本研究提出一种新的测试时间适应方案,该方案主要通过实例感知批量归一化 (IABN) 和预测平衡库采样 (PBRS) 增强模型对非独立同分布数据流的鲁棒性。在各种数据集(包括真实世界的非独立同分布流)上的评估表明,所提出的鲁棒 TTA 不仅在非独立同分布环境下优于现有方法,而且在独立同分布假设下也能达到同等性能。
Aug, 2022
通过在测试时进行领域适应,提出了一种抗干扰的实用测试时间适应(ResiTTA)方法,用于解决模型退化和数据质量问题。利用鲁棒批量归一化方法和软对齐策略缓解过拟合和模型退化,并采用熵驱动的记忆库存储高质量数据。通过教师 - 学生模型和自学习损失对模型进行周期性的适应,最终在多个基准数据集上取得了最先进的性能。
Jan, 2024
通过在测试阶段将源域模型适应到测试数据,测试时间适应旨在应对未见过的损坏并证明其成功。然而,在更具挑战性的真实场景下,这些尝试可能会失败。现有的作品主要考虑了非独立同分布的真实世界测试时间适应和持续的域漂移。在这项工作中,我们首先用全局类别不平衡的测试集对现有的真实世界 TTA 协议进行补充。我们证明将所有设置结合起来对现有方法提出了新的挑战。我们认为现有最先进的方法的失败首先是由于在不平衡的测试数据上不加选择地适应归一化层引起的。为了解决这个缺点,我们提出了一个平衡的 batchnorm 层,用于在推理阶段替换正常的 batchnorm。新的 batchnorm 层能够适应而不偏向多数类别。我们受到自我训练(ST)在学习无标签数据中的成功启发,并将 ST 用于测试时间适应。然而,单独使用 ST 容易出现过适应,这是持续域漂移下性能不佳的原因。因此,我们提出通过使用锚定损失对模型更新进行正则化来改进持续域漂移下的自我训练。最终的 TTA 模型,称为 TRIBE,建立在一个带有平衡的 batchnorm 层的三网络结构上。我们在代表真实世界 TTA 设置的四个数据集上评估了 TRIBE。在多个评估协议中,TRIBE 始终实现了最先进的性能。代码可在 https://github.com/Gorilla-Lab-SCUT/TRIBE 上获取。
Sep, 2023
通过无监督领域变化检测方法,该论文解决了传统测试时适应方法在动态环境中适应连续变化的目标分布时所面临的挑战,包括之前学习的有价值源知识的灾难性遗忘和由于错误标签的错误校准而导致的渐进性误差积累问题。
Nov, 2023