Jul, 2024

Dude: 大规模视觉 - 语言模型的双分布感知上下文提示学习

TL;DR基于大型语言模型,使用前期训练的上下文知识和少量的训练数据来自定义大视觉语言模型到新的领域的快速学习方法,通过结合隐式和显式因素,提高模型特征表示,并通过不同的质量分布来确保可处理无关或噪声元素,从而使得 Unbalanced Optimal Transport (UOT) 理论与图像增强的特点相融合,同时在保证样本合理距离的情况下扩展训练样本池,通过在少样本分类和适配器设置等广泛实验证明了我们模型的优越性。