May, 2024

理解和评估人类对 AI 生成图像的偏好与指导调试

TL;DR人工智能生成内容(AIGC)在近年来迅速增长,其中基于人工智能图像生成的技术因其高效且富有想象力的图像创作能力而受到广泛关注。然而,由于其独特的失真问题,人工智能生成的图片(AIGIs)可能无法满足人们的喜好,因此有必要了解和评估人们对 AIGIs 的偏好。为此,本文首先建立了一个新颖的 AIGIs 图像质量评估(IQA)数据库,称为 AIGCIQA2023+,该数据库提供了人类视觉偏好评分以及从质量、真实性和对应性等三个角度的详细偏好解释。然后,基于构建的 AIGCIQA2023 + 数据库,本文提出了一种名为 MINT-IQA 的模型,该模型可从多个角度对 AIGIs 的人类偏好进行评估和解释。具体而言,MINT-IQA 模型首先从多个角度学习和评估人们对 AI 生成图像的偏好,然后通过视觉语言指令调整策略,MINT-IQA 能够对 AIGIs 的人类视觉偏好进行强大的理解和解释,这可用于反馈以进一步提高评估能力。广泛的实验结果表明,所提出的 MINT-IQA 模型在理解和评估人类对 AIGIs 的视觉偏好方面达到了最先进的性能水平,并且与最先进的 IQA 模型相比在传统 IQA 任务上也取得了竞争性的成果。AIGCIQA2023 + 数据库和 MINT-IQA 模型将会发布以促进未来的研究。