Mar, 2024

利用视觉语言模型将少样本图像分类和分割作为视觉问答

TL;DR用视觉引导的分割和评估方法将少样本图像分类和分割问题转化为视觉问答问题,利用视觉语言模型以无需训练的方式进行解决,并通过交互式学习和模块化框架达到最先进的性能。