BriefGPT.xyz
Ask
alpha
关键词
nash learning
搜索结果 - 2
ICML
通过 Nash 学习和自适应反馈进行语言对齐
借助 Nash 学习和自适应反馈的语言对齐算法(LANA)消除了学习偏好模型或存在注释数据集的需求,实现了大规模语言模型对齐的自我对齐能力。
PDF
14 days ago
纳什学习从人类反馈下的一般 KL 正则化偏好的理论分析
这篇论文研究了基于人类反馈的强化学习方法,通过一种概率偏好模型来学习,实验了一种新的学习范式,KL 正则化 NLHF,旨在找到以初始模型为基础,持续生成优于竞争策略的响应的策略,并将其与传统的强化学习理论联系起来,验证了无奖励模型学习在一般
→
PDF
5 months ago
Prev
Next