Jul, 2023

探索利用检索增强的伪造句子生成进行无注释图像字幕生成

TL;DR提出了一种新的策略 “基于 LPM 和检索增强学习” 来训练图像说明器,该策略利用大型预训练模型(LPM)的先验知识作为监督,并通过检索过程来进一步增强其有效性,在不使用昂贵的预训练过程的情况下,超越了目前最先进的预训练模型,并通过使用生成的伪句子作为弱监督来提高 1%半监督图像说明基准的性能。