ACLJun, 2024

VISTA:可视化文本嵌入用于通用多模态检索

TL;DR我们提出了一种新的嵌入模型 VISTA,用于通用的多模态检索,该模型在零样本和监督设置下在各种多模态检索任务中都取得了优越的性能。