ECCVJul, 2024

GalLoP: 学习视觉 - 语言模型的全局和局部提示

TL;DR全球局部提示(GalLoP)是一种新的提示学习方法,通过学习多种多样的提示,利用全局和局部视觉特征,以提高视觉 - 语言模型在少样本图像分类中的准确性和鲁棒性。在不同的少样本设置和各种背景下,GalLoP 在准确性方面优于以前的提示学习方法,并且在域泛化和 OOD 检测方面表现出强大的鲁棒性,甚至优于专门的 OOD 检测方法。