Mar, 2024

使用视觉评估 GPT-4 的美学评价能力:来自群体和个体评估的见解

TL;DR最近,研究发现大型语言模型在各种智力任务中表现出色,然而,很少有研究探讨其与人类行为对齐,特别是涉及审美评价的行为。本研究调查了可以处理图像输入的先进语言模型 GPT-4 with Vision 在图像的审美评价任务上的表现。我们采用了两个任务,一个是预测一个群体的平均评价值,另一个是预测个体的评价值。通过探索提示和分析预测行为,我们调查了 GPT-4 with Vision 的表现。实验结果显示,GPT-4 with Vision 在预测审美评价方面表现出优秀的性能,并展现出对美和丑之间不同响应的特性。最后,我们讨论了基于人类对美感知的科学知识以及融合传统深度学习模型和大型语言模型的代理技术来开发用于审美评价的 AI 系统。