BriefGPT.xyz
Ask
alpha
关键词
rlaif
搜索结果 - 3
应用 RLAIF 用于轻量级 LLMs 中的 API 使用的代码生成
使用 AI 反馈的强化学习(RLAIF)已在多个领域展示了巨大的潜力,包括减少 LLM 输出中的伤害、提升文本摘要以及数学推理等。本文引入了一个 RLAIF 框架,用于提高轻量级(小于 1B 参数)LLMs 的代码生成能力,特别关注需要编写
→
PDF
8 days ago
HRLAIF:通过 AI 反馈在开放域强化学习中的有用性和无害性改进
通过使用 AI 反馈进行增强学习(RLAIF)在大型语言模型(LLM)训练的快速策略迭代阶段比通过人类反馈进行增强学习(RLHF)具有更短的注释周期和更低的成本,使其效率更高。本文提出了混合增强学习来自 AI 反馈(HRLAIF)方法,通过
→
PDF
4 months ago
ICLR
用合成数据对 LLM 进行精简自我评价:一个贝叶斯视角
本文通过引入精简自我批判(dSC)将 RLAIF 的解释视为贝叶斯推理,通过 Gibbs 采样器对 LLM 的输出进行改进并提炼为经过调整的模型。只需合成数据,dSC 在安全、情感和隐私控制实验中表现出能够成为与 LLMs 相符的可行且廉价
→
PDF
7 months ago
Prev
Next