Mar, 2024
利用视觉语言模型将少样本图像分类和分割作为视觉问答
Few-Shot Image Classification and Segmentation as Visual Question Answering Using Vision-Language Models
Tian Meng, Yang Tao, Ruilin Lyu, Wuliang Yin
TL;DR用视觉引导的分割和评估方法将少样本图像分类和分割问题转化为视觉问答问题,利用视觉语言模型以无需训练的方式进行解决,并通过交互式学习和模块化框架达到最先进的性能。