ACLMay, 2023

基于相对表示的弱监督视觉语言预训练

TL;DR本研究提出了使用相对表示(relative representations)来构建跨模态锚点,从而实现高质量的图像 - 文本对预训练的 WVLP 框架 RELIT,并通过四个下游任务的实验表现得出了新的最先进结果。