Oct, 2022

MAPL:针对视觉语言少样本提示的单模态预训练模型参数高效自适应

TL;DRMAPL是一种有效的参数少、可复用预训练模型并利用其在多模态视觉语言领域中的强大泛化能力的方法,能够将不同模态的模型的表示空间通过对齐的图像文本数据进行轻量级映射,从而在现场学习过程中减少训练量并产生较好的性能。