May, 2023

使用大型视觉 - 语言模型学习文本的视觉特征

TL;DR该论文提出了一种基于大型视觉语言模型 CLIP 的 fine-tuning 策略,用于从文本中评分文本的视觉性,并对其进行分类,得到了比其他方法更好的结果,并展示了文本视觉性对于文本生成任务的重要性。