ICCVAug, 2023

Socratis:大型多模态模型是否具备情感意识?

TL;DRSocratis 是一个社会反应基准测试,用于注释图像 - 标题对中的多种情绪及其产生原因。通过对现有模型的评估,发现人类更喜欢人工撰写的情绪原因,这表明该任务相比标准生成任务更具挑战性。同时,大型视觉 - 语言模型的字幕度量标准也未能与人类偏好相关联。我们希望这些发现和我们的基准测试能够激发关于训练情感感知模型的进一步研究。