Aug, 2023

利用无监督提示学习改进图像字幕泛化性能

TL;DR通过无监督的提示学习方法,本文提出了一种改进图像字幕生成通用性的方法,该方法利用预训练的视觉 - 语言模型来学习目标领域的特定提示向量,通过属性一致性和语义一致性优化领域特定提示向量,从而有效地保留了大型模型中的知识并引入了领域特定知识。