关键词reinforcement learning from feedback
搜索结果 - 1
  • 通过人类反馈进行强化学习的 AI 对齐?矛盾和限制
    PDF8 days ago
Prev
Next