BriefGPT.xyz
Ask
alpha
关键词
multi-party rlhf
搜索结果 - 1
多方可证明强化学习与多样化人工反馈
多方强化学习与人类反馈是新兴的方法,以使模型符合人类的偏好。本文通过理论研究,探讨了多个个体的多样化偏好的多方强化学习方法,并展示传统方法不适用的情况。文章提出了引入元学习以及采用不同的社会福利函数来聚合多方偏好的方式,其中包括纳什、功利主
→
PDF
4 months ago
Prev
Next