Jun, 2024

用自动生成的偏好数据对齐大型语言模型

TL;DR通过自动生成的优先数据 (Selfie) 和少量的人工标注优先数据,我们提出了一种新的框架,可以显著增强大型语言模型的对齐性能,进一步提取模型的内在偏好。