关键词alignment tasks
搜索结果 - 2
  • ChatGLM-RLHF:大型语言模型与人类反馈的对齐实践
    PDF3 months ago
  • RLCD: 强化学习从对比教育中提炼的语言模型对齐
    PDFa year ago
Prev
Next