Sep, 2023

无需进一步训练的预训练基础模型应对 VQA

TL;DR通过结合预训练大型语言模型和其他基础模型,本研究探索了一种无需进一步训练即可解决视觉问答问题的方法,并对不同的解码策略在 VQAv2 数据集上进行了性能评估。