关键词maxmin alignment objective
搜索结果 - 1
  • MaxMin-RLHF: 大规模语言模型与多样化人类偏好的公平对齐
    PDF5 months ago
Prev
Next