Jul, 2024

PERSONA:多元化对齐的可重复测试平台

TL;DR本研究解决了当前语言模型在优化用户偏好时忽视多样性的问题,主要聚焦于用户意见的多元性。提出的PERSONA为评估和改进语言模型的多元对齐提供了一种新颖的方法,生成了1586个合成用户档案和大规模评估数据集。研究发现,PERSONA Bench可作为多元对齐方法的基准,从而推动语言模型的更广泛应用。