May, 2023

MemeCap: 用于字幕和解释 Memes 的数据集

TL;DR该研究介绍了一个新的数据集 MemeCap 及可视化模型综合能力的实验,验证了 VL 模型在理解 meme 中的视觉隐喻方面存在的问题。