May, 2023

你所看到的就是你所读到的?—— 改进文本 - 图像对齐评估

TL;DR本文研究了文本和对应图像是否语义对齐这一问题,提出了使用人类判断和自动化方法来确定文本 - 图像对齐的方式,本文改进了以前的方法,并提出了一种新的方法,它可以定位图像和给定文本的特定不对齐部分,并将其应用于自动重新排列生成的文本到图像的候选项中。