Dec, 2023

提升存储效率训练的伪造令牌

TL;DR深度神经网络在计算机视觉任务中取得了显著的性能提升,但实现高度可泛化和高性能的视觉模型需要大量的数据集,这对于扩展视觉模型来说是一个关键瓶颈。本文提出了一种基于向量量化的特征向量(即标记)作为视觉分类网络输入,以解决存储挑战,并通过引入 TokenAdapt 和 ColorAdapt 等简单而有效的基于标记的数据增强策略来解决输入域转移问题。实验证明了在各种场景下我们方法的一致性性能提升。