BriefGPT.xyz
Ask
alpha
关键词
zero-shot cross-lingual alignment
搜索结果 - 1
重用奖励:零 - shot 跨语对齐的奖励模型转移
本研究探讨了一种简单的零 - shot 跨语言对齐方法,该方法基于偏好数据训练了一个奖励模型,在摘要生成和开放式对话生成任务中,经过全面的评估表明,这种方法在不同语言间的对齐中始终是成功的,包括人工评估:跨语言对齐模型在超过 70%的评估实
→
PDF
3 months ago
Prev
Next