Nov, 2023

使用增量随机平滑快速验证视觉-语言模型

TL;DR在本论文中,我们介绍了一种针对基于开放词汇的模型(如CLIP)的快速认证方法,通过随机平滑技术实现。该方法利用基础“训练”集和对应的认证CLIP分类器,通过将具有新提示的分类器视为基础训练集中附近分类器的扰动版本,从而快速认证新分类器。通过使用缓存技巧,我们在新提示的认证过程中实现了近两个数量级的加速。为了进一步加快速度(启发式),OVC透过使用多元正态分布来近似给定输入的嵌入空间,绕过通过视觉主干进行采样的需要。我们通过对CIFAR-10和ImageNet测试数据集上的多个视觉语言主干进行实验评估,证明了OVC的有效性。