ACLOct, 2021

良好的提示价值数百万个参数:面向低资源的基于提示的视觉语言模型学习

TL;DR本论文研究了基于 prompt 的低资源视觉语言(VL)任务 few-shot 学习。 对大规模预训练的 VL 模型进行了实验,证明 FewVLM 在 VQA 任务上的效果优于 Frozen,而且能够达到比更大的模型 PICa 相当的结果。