Feb, 2024

ConVQG:带有多模态引导的对比式视觉问句生成

TL;DR通过使用对比可视化问题生成(ConVQG)方法,我们成功地提出了一种生成基于图像、文本约束以及知识的对比问题的方法,实验证明ConVQG在相关性、图像相关性和知识丰富性等方面优于现有方法,并通过人类评估显示对ConVQG问题的偏好。