揭秘批归一化对于现实测试时适应性的作用
本文提出了一种基于alpha-BN的测试时间适应框架Core,通过混合源和目标统计信息来校准批次统计量以缓解域漂移并保留区分结构。实验证明我们的方法在包括图像分类和语义分割的三个主题的12个数据集上实现了最先进的性能。特别地,在没有任何训练的情况下,我们的alpha-BN改进了28.4%至43.9%,甚至超过了最新的源无关域自适应方法。
Oct, 2021
本文提出了一种简单而有效的方法,可以在测试期间估算批量标准化统计量以快速适应目标测试样本,并提出两种新的评估设置,避免对大量在线批次的依赖并能够仅通过单个样本估算准确的批量标准化统计量。该方法在测试时间自适应任务的新提出的设置中明显优于现有方法,并且在其他设置中也有所改进。
Oct, 2021
本研究提出一种新的测试时间适应方案,该方案主要通过实例感知批量归一化(IABN)和预测平衡库采样(PBRS)增强模型对非独立同分布数据流的鲁棒性。在各种数据集(包括真实世界的非独立同分布流)上的评估表明,所提出的鲁棒TTA不仅在非独立同分布环境下优于现有方法,而且在独立同分布假设下也能达到同等性能。
Aug, 2022
本文提出了一种新型的批次规范化策略——测试时间适应的归一化统计方法,通过调整传统归一化和传输归一化统计信息的权重,以适应各种实际评估场景,提高模型对于不同批次大小和领域转移的鲁棒性,实现了各项标准评测中的最佳性能。
Feb, 2023
论文通过分析测试样本及训练数据的分配差异,发现批处理层对测试时间调整法的不稳定性有重要影响。作者提出了一种基于群组及层规范化的调整稳定方法,并提出一种名为SAR的方法,通过消除嘈杂测试样本及鼓励模型权重保持平稳的最小值,从两个方面进一步稳定TTA,效果比先前方法更稳定,且在上述野外测试方案下计算效率更高。
Feb, 2023
通过在测试阶段将源域模型适应到测试数据,测试时间适应旨在应对未见过的损坏并证明其成功。然而,在更具挑战性的真实场景下,这些尝试可能会失败。现有的作品主要考虑了非独立同分布的真实世界测试时间适应和持续的域漂移。在这项工作中,我们首先用全局类别不平衡的测试集对现有的真实世界TTA协议进行补充。我们证明将所有设置结合起来对现有方法提出了新的挑战。我们认为现有最先进的方法的失败首先是由于在不平衡的测试数据上不加选择地适应归一化层引起的。为了解决这个缺点,我们提出了一个平衡的batchnorm层,用于在推理阶段替换正常的batchnorm。新的batchnorm层能够适应而不偏向多数类别。我们受到自我训练(ST)在学习无标签数据中的成功启发,并将ST用于测试时间适应。然而,单独使用ST容易出现过适应,这是持续域漂移下性能不佳的原因。因此,我们提出通过使用锚定损失对模型更新进行正则化来改进持续域漂移下的自我训练。最终的TTA模型,称为TRIBE,建立在一个带有平衡的batchnorm层的三网络结构上。我们在代表真实世界TTA设置的四个数据集上评估了TRIBE。在多个评估协议中,TRIBE始终实现了最先进的性能。代码可在https://github.com/Gorilla-Lab-SCUT/TRIBE上获取。
Sep, 2023
在测试时适应方法中,通过引入一种名为“Un-Mixing Test-Time Normalization Statistics”(UnMix-TNS)的突破性策略,通过与多个未混合的统计成分混合来重新校准用于批处理中每个实例的统计信息,从而在本质上模拟独立同分布的环境,从而实现了解决非独立同分布条件下的系统稳定性问题。该方法能够出色地处理具有时间相关性的测试数据流,并在多个评估基准中显著提高稳定性和性能。
Jan, 2024
通过在测试时进行领域适应,提出了一种抗干扰的实用测试时间适应(ResiTTA)方法,用于解决模型退化和数据质量问题。利用鲁棒批量归一化方法和软对齐策略缓解过拟合和模型退化,并采用熵驱动的记忆库存储高质量数据。通过教师-学生模型和自学习损失对模型进行周期性的适应,最终在多个基准数据集上取得了最先进的性能。
Jan, 2024
本研究解决了传统测试时间适应方法在动态数据模式下(如低多样性或高多样性模式)导致性能下降的问题。提出的新方法DATTA,通过多样性得分动态选择最佳的批归一化方法和微调策略,有效提高了模型的推理质量。实验结果表明,DATTA相比于现有方法最大可提升21%的准确率,展示了其良好的模型性能和鲁棒性。
Aug, 2024
本研究针对机器学习算法在测试样本分布偏离训练样本分布时所面临的挑战,提出了一种新的测试时适应学习范式,结合了领域适应和领域泛化的优点。通过对400多篇相关论文的系统性回顾,本文将现有方法分类为五个类别,并深入分析其在分布变化评估及实际应用中的有效性,展望了测试时适应的研究机会。
Nov, 2024