Feb, 2024

通过模型生成的图像满意度的动机背景的视角理解主观性

TL;DR图像生成模型在各种应用中变得普遍。这些模型通常通过使用假设普遍标准的人类质量判断进行微调和评估,而未考虑任务的主观性。为了研究如何量化主观性及其影响的规模,我们测量了不同使用情况下人类标注者之间的评估差异。通过模拟标注者主观性的潜在因素,我们设计了一组任务(T 恤图形、演示文稿视觉效果和手机背景图像),以从上下文中分析众包任务。研究结果表明,在个别情境和组合情境下,对图像的人工评估存在差异。图像外观、与文本的对齐以及文本中提到的对象的表达是影响这种主观性的三个关键因素。我们的研究强调了在构建和评估生成模型时考虑个别用户和情境的重要性。