May, 2023

Twitter图像的条件性替代文本生成

TL;DR本研究提出了一种方法,利用 CLIP 前缀模型从社交媒体中的图片和相关的文本生成互补的文本描述,实验结果表明,利用文本和视觉信息来生成互补文本能够显著提高其性能。