关键词human preference alignment
搜索结果 - 3
  • SPO:多维偏好顺序对齐与隐式奖励建模
    PDF2 months ago
  • ICDPO:通过上下文中的直接偏好优化有效地借用他人的对齐能力
    PDF5 months ago
  • 对抗性偏好优化
    PDF8 months ago
Prev
Next