文章介绍了一种新的文档测试时间自适应方法,利用跨模态自监督学习和伪标记来使源域的模型适应测试时未标记的目标域,并在各种视觉文档理解任务中提升效果。
Jun, 2022
研究表明,零温度的 TTA 方法(ZERO)能够在只进行一次前向传播的情况下,准确性大大超过或与现有技术相当,且速度约为 10 倍快,内存占用约为 13 倍少。
May, 2024
本次研究调查了测试时间适应(TTA)在机器学习中的应用与优化方法。针对不同的学习场景,研究紧分测试时间领域适应、测试时间批适应、在线测试时间适应和测试时间先验适应四类,总结了高级算法的分类方法,探讨了 TTA 的应用与未来研究的挑战。
Mar, 2023
通过快慢测试时适应(FSTTA)方法,解决视觉语言导航(VLN)模型的适应性与稳定性困境,实现模型的快速自适应和稳定回归,获得卓越的性能提升。
Nov, 2023
在本研究中,我们提出了一种名为 TT-DNA 的测试时分布学习适配器,通过在测试期间直接建模来自支持集的视觉特征的高斯分布,将其与原始的 CLIP 预测进行残差连接,得到最终预测。我们在人类对象交互的视觉推理方面的广泛实验结果表明,我们提出的 TT-DNA 方法在性能上明显优于现有的最先进方法。
Mar, 2024
为了使现有的视觉模型适应于不同的下游场景,本文探讨了在线测试时间自适应方法在各种真实世界场景下的表现,并针对该方法的局限性提出了一种特别保守的方法 —— 使用 LAME 目标来解决问题,并通过高效的凸凹过程求解该目标,从而使其在场景中表现更佳。
Jan, 2022
本研究提出 Continual Test-Time Adaptation (CTTA) 任务及 Visual Domain Adapter (ViDA) 实现了对预训练模型的修改,以适应不断变化的目标领域;同时还提出了 Homeostatic Knowledge Allotment (HKA) 策略,通过对各个 ViDA 分配不同等级的知识以适应实际应用中不同领域的变化,并在分类和分割任务等方面实现了最新的表现。
Jun, 2023
对视觉 - 语言模型的测试时间适应性策略进行系统探索,包括提示工程策略和现有的测试时间适应方法,以提高模型在真实场景中的适应性和鲁棒性。
该研究提出了一种基于扩散生成模型的测试时间自适应方法(DDA),该方法可在不重新训练模型的情况下通过对输入数据进行自适应来提高模型在移位目标数据上的准确性,并在 ImageNet-C 基准测试中展现了更加鲁棒的表现。
Jul, 2022
在该文中,作者提出了一种用于 Continual Test-time Domain Adaptation 的 Dynamic Sample Selection(DSS)方法,通过动态阈值、正向学习和反向学习等过程,选择低质量样本并进行联合学习,从而提高模型在图像领域的效果,并展示了其在 3D 点云领域的适用性和潜力。
Oct, 2023