May, 2023

X-IQE: 可解释的基于视觉大语言模型的文本生成图像质量评估

TL;DR本论文提出了一种新的可解释的图像质量评估方法——X-IQE,它利用视觉大语言模型来评估文本到图像生成方法,通过生成文本解释,采用层次化思想链实现MiniGPT-4生成自洽、无偏见,且与人类评估高度相关的文本,提高了深度图像质量评估模型的透明度和可解释性。