May, 2024

通过系统消息概括与数千个偏好进行对齐

TL;DR用户指定系统信息并通过训练大型语言模型与用户意图更好地对齐的新方法,通过多方面的数据集和用户指令训练模型,该模型在各项测试中表现优于其他大型语言模型。