PKU-I2IQA:基于图像的图像质量评估数据库用于 AI 生成图像
近年来,图像生成技术迅速发展,产生了大量的人工智能生成图像(AIGIs),然而,这些 AIGIs 的质量不一致,并严重影响了用户的视觉体验。因此,基于人类感知角度评估 AIGIs 质量的 AI 生成图像质量评估(AIGIQA)引起了学者们的广泛关注,然而,现有研究尚未完全探索该领域。本研究通过构建名为 PKU-AIGIQA-4K 的大规模感知质量评估数据库,旨在填补现有研究领域中的关键空白,该数据库兼顾文本到图像和图像到图像的 AIGIs,提出了基于预训练模型的三种图像质量评估方法:无参考方法 NR-AIGCIQA,全参考方法 FR-AIGCIQA 和部分参考方法 PR-AIGCIQA,并利用 PKU-AIGIQA-4K 数据库进行了广泛的基准实验,与当前的图像质量评估方法进行了比较。
Apr, 2024
通过考虑 15 个流行生成模型和动态超参数,本研究组织了一项挑战,全面评估人类主观评分、感知质量和文本图像对齐等方面,以创建迄今最大的细粒度 AIGI 主观质量数据库 AIGIQA-20K,并通过基准实验评估 16 个主流 AIGI 质量模型与人类感知之间的相应关系。预期该数据库将推动 AIGC 在视觉领域的进展。
Apr, 2024
本文建立了一个大规模的 AIGC IQA 数据库,用于评估人类对于每个图像的质量、真实性和对应性的视觉偏好,并在该数据库上进行了基准实验来评估几个最先进的 IQA 度量标准的性能。
Jul, 2023
该研究旨在解决基于文本生成图像的模型中存在的主观质量差异问题并提出了 StairReward 模型评估主观文本图像对齐的一致性,并以此建立了 AGIQA-3K 数据库。
Jun, 2023
人工智能生成内容(AIGC)在近年来迅速增长,其中基于人工智能图像生成的技术因其高效且富有想象力的图像创作能力而受到广泛关注。然而,由于其独特的失真问题,人工智能生成的图片(AIGIs)可能无法满足人们的喜好,因此有必要了解和评估人们对 AIGIs 的偏好。为此,本文首先建立了一个新颖的 AIGIs 图像质量评估(IQA)数据库,称为 AIGCIQA2023+,该数据库提供了人类视觉偏好评分以及从质量、真实性和对应性等三个角度的详细偏好解释。然后,基于构建的 AIGCIQA2023 + 数据库,本文提出了一种名为 MINT-IQA 的模型,该模型可从多个角度对 AIGIs 的人类偏好进行评估和解释。具体而言,MINT-IQA 模型首先从多个角度学习和评估人们对 AI 生成图像的偏好,然后通过视觉语言指令调整策略,MINT-IQA 能够对 AIGIs 的人类视觉偏好进行强大的理解和解释,这可用于反馈以进一步提高评估能力。广泛的实验结果表明,所提出的 MINT-IQA 模型在理解和评估人类对 AIGIs 的视觉偏好方面达到了最先进的性能水平,并且与最先进的 IQA 模型相比在传统 IQA 任务上也取得了竞争性的成果。AIGCIQA2023 + 数据库和 MINT-IQA 模型将会发布以促进未来的研究。
May, 2024
本研究提出 Generated Image Quality Assessment (GIQA) 算法,从学习和数据两个角度,定量评估 GAN 模型生成的图像质量。实验证明 GIQA 算法结果与人工评估基本一致,可应用于 GAN 模型的真实性和多样性评估,并能在训练中支持在线 hard negative mining。
Mar, 2020
我们提出了一个基于文本和图像编码器的回归(TIER)框架,用于评估从人类感知角度来看的人工智能生成图像的质量,实验证明我们的方法在大多数情况下相较于基准表现出更优异的性能。
Jan, 2024
研究提出了一种基于混合提示编码和基于集成的特征混合模块的 AIGC 质量评估框架,验证了方法在两个数据集上的有效性,从而促进了多模态生成领域的研究发展。
Apr, 2024
通过图像和提示的融合,IP-IQA 是一个多模态框架,旨在解决 AI 生成图像质量评估中的问题,并在 AGIQA-1k 和 AGIQA-3k 数据集上达到最先进的水平。
Mar, 2024
利用深度神经网络对 AI 生成的图像进行质量评估存在挑战,我们引入了一个大型多模态模型辅助 AI 生成图像质量评估(MA-AGIQA)模型,通过文本提示敏锐感知语义信息并提取语义向量,并使用专家混合结构动态整合语义信息和传统 DNN 基于 IQA 模型提取的质量感知特征来解决当前 IQA 模型在语义感知方面的不足,实验证明 MA-AGIQA 在评估 AI 生成图像质量方面具有最先进的性能和出色的泛化能力。
Apr, 2024