BriefGPT.xyz
Ask
alpha
关键词
fine-grained reward
搜索结果 - 1
细粒度人类反馈为语言模型训练提供更好的奖励
本文介绍了 Fine-Grained RLHF 框架,可以对包含一定程度错误或无效信息的长文本提供细化的人类反馈进行训练,并实验表明使用该框架能够改善语言模型生成过程中生成虚假、有毒、无关的输出等问题。
PDF
a year ago
Prev
Next