关键词human alignment
搜索结果 - 4
  • 使用 DPO 隐式奖励进行自助式语言模型训练
    PDF22 days ago
  • 辩证统一:解决 LLM 的 3H 与安全威胁的张力
    PDF3 months ago
  • VBench: 视频生成模型综合基准套件
    PDF7 months ago
  • CITING:大型语言模型为指导调整课程创作
    PDF9 months ago
Prev
Next