BriefGPT.xyz
大模型
Ask
alpha
关键词
self-generated preference data
搜索结果 - 1
用自动生成的偏好数据对齐大型语言模型
通过自动生成的优先数据 (Selfie) 和少量的人工标注优先数据,我们提出了一种新的框架,可以显著增强大型语言模型的对齐性能,进一步提取模型的内在偏好。
PDF
a month ago
Prev
Next