Nov, 2024

Image2Text2Image:一种新颖的无标签图像到文本生成评估框架,基于文本到图像的扩散模型

TL;DR本研究解决了自动生成图像描述质量评估的复杂问题,现有的自动化指标与人工评估相关性弱。我们提出的Image2Text2Image框架利用扩散模型生成新图像,通过比较原始图像与生成图像的特征相似性来评估描述的准确性,该方法不依赖于人工注释的参考标题,提供了有效的评估工具。