Mar, 2024

基于语言模型的贝叶斯偏好引导

TL;DR将 AI 系统与用户的兴趣相协调需要理解和融入人类复杂的价值观和偏好。我们介绍了一个名为 OPEN 的框架,它利用贝叶斯最优实验设计(BOED)指导选择信息丰富的问题,并利用语言模型(LM)提取特征和将抽象的 BOED 查询转化为自然语言问题。通过将 LM 的灵活性与 BOED 的严谨性结合起来,OPEN 能够在保持适应性于现实世界领域的同时优化查询的信息量。用户研究中显示,OPEN 在偏好获取方面优于现有的基于 LM 和 BOED 的方法。