Jun, 2023
通过动态视觉提示将预训练语言模型应用于视觉语言任务
Adapting Pre-trained Language Models to Vision-Language Tasks via
Dynamic Visual Prompting
TL;DR本文旨在研究使用预训练语言模型(Pre-trained language models,PLMs)作为一个独立的模型来进行视觉语言推理任务。提出了一个名为Dynamic Visual Prompting(DVP)的新型转移学习方法,通过搜索算法,在保持PLMs参数完整性的情况下,有效地将其与不同的视觉语言任务相结合。经过广泛的实验验证,DVP在效率和性能方面都具有优势,并且能够很好地适应预训练语言模型与VL任务相结合的需求。