Oct, 2021

良好的提示价值数百万个参数:面向低资源的基于提示的视觉语言模型学习

TL;DR本论文研究了基于prompt的低资源视觉语言(VL)任务few-shot学习。 对大规模预训练的VL模型进行了实验,证明FewVLM在VQA任务上的效果优于Frozen,而且能够达到比更大的模型PICa相当的结果。