Jun, 2024

盲人视觉 - 语言一致性引导的多模态提示学习用于 AI 生成图像质量评估

TL;DR提出了一种基于视觉 - 语言一致性指导的多模态提示学习方法,称为 CLIP-AGIQA,用于盲目的 AI 生成图像质量评估,该方法在两个公共 AGIQA 数据集上的实验结果表明其优于现有的质量评估模型。