Jul, 2024

改善语言模型的上下文感知偏好建模

TL;DR本研究针对自然语言中的偏好反馈不明确和多维标准问题,提出了一种两步偏好建模方法。此方法首先选择上下文以解决不足指定性,然后基于所选上下文评估偏好。研究表明,添加上下文可以显著提高偏好模型的表现,并且开发的上下文条件偏好数据集展示了语言模型对于上下文特定偏好的评估能力,超越了现有的领先模型。