关键词rl from human feedback
搜索结果 - 2
  • 基于原则的惩罚方法在双层强化学习和 RLHF 中的应用
    PDF5 months ago
  • 使用模型编写的评价方法发现语言模型行为
    PDF2 years ago
Prev
Next