Jun, 2024

基于视觉语言建模的图像质量评估:内容、失真和外观

TL;DR本文介绍了一种名为 SLIQUE 的新型盲目图像质量评估 (BIQA) 模型,该模型采用联合视觉 - 语言和视觉对比表示学习框架,通过获取关于图像语义内容、畸变特征和外观属性的高级知识来进行质量评估。为了训练 SLIQUE,我们开发了一种系统的方法来构建一个首个具有所有三类质量相关文本注释的大型图像数据库 TADAC。TADAC 数据库拥有超过 160 万张图像,用文本描述它们的语义内容、畸变特征和外观属性。构建 TADAC 的方法和数据库本身将特别有助于利用视觉 - 语言建模进行高级图像质量评估应用。大量实验结果显示,SLIQUE 在性能上优于现有技术,证明了其设计原理的完整性和实现的有效性。