关键词sequence likelihood calibration
搜索结果 - 5
  • 大型语言模型的人类对齐通过在线偏好优化
    PDF4 months ago
  • BRAIn: 基于贝叶斯奖励条件化摊销推理的自然语言生成
    PDF5 months ago
  • 统计拒绝抽样改进偏好优化
    PDF10 months ago
  • SLiC-HF: 序列似然校准与人类反馈
    PDFa year ago
  • 校准序列似然改进条件语言生成
    PDF2 years ago
Prev
Next