EMNLPNov, 2023

模型反馈下的人类学习:迭代提示与中途过程动态

TL;DR通过研究用户与 Text-to-Image 模型的迭代交互,分析了用户提示的动态,发现提示在迭代过程中趋于特定特征。进一步研究表明,这种趋同既可能是用户因忽略重要细节而调整,也可能是为适应模型的偏好而产生具有特定语言风格的更好图像。初步证据显示这两种可能性都存在。用户数据偏好模型的情况引发对进一步训练中重复使用用户数据的担忧,因为提示可能偏向于特定模型的偏好,而不是与人类意图和自然表达方式相一致。