Jun, 2023

探讨零样本和少样本视觉问答的提示技术

TL;DR本研究探索了使用各种提示策略来增强零样本视觉问答性能的方法,重点关注 BLIP2 模型,通过在多个视觉问答数据集上进行全面研究,发现精心设计的问题模板和集成附加视觉提示,如图像标题,可以提高 VQA 绩效,特别是在与少量样本示例结合使用时。