Jan, 2024

AesBench:多模态大型语言模型在图像美学感知方面的专业基准

TL;DR通过构建一个包含多样化图像内容和高质量专业审美专家注释的专家标记的美学感知数据库(EAPD)和一套综合性评判标准,我们提出了 AesBench 来全面评估多模态大规模语言模型(MLLMs)的美学感知能力,实验结果表明,目前的 MLLMs 只具有初步的美学感知能力,与人类之间仍然存在显著差距。希望此研究能激发学术界对 MLLMs 美学潜力的进一步探索。