BriefGPT.xyz
Ask
alpha
关键词
fine-grained quality signals
搜索结果 - 1
超越模仿:利用细粒度质量信号进行对齐
我们提出了一种名为 FIGA 的改进对齐方法,通过利用细粒度的质量信号,即对比好坏回答的方式,指导大型语言模型的对齐学习。实验证明了我们的方法的有效性。
PDF
8 months ago
Prev
Next