Jul, 2024

RLHF 能够说多种语言:解锁面向LLMs的多语言偏好优化

TL;DR通过对23种语言进行详尽的研究,我们的工作在多语言大型语言模型对齐领域取得了新的最优成果,通过引入一种新颖可扩展的方法生成高质量多语言反馈数据以平衡数据覆盖,我们得到了优势训练模型,其在参数类别中击败了当前最先进的多语言大型语言模型,并在广泛使用的模型中取得了69.5%或更高的优势胜率,将对齐技术的边界扩展到全球人口的一半所涵盖的23种语言。