ACLJun, 2024

超越英语的 LLMs:通过跨语言反馈扩展 LLMs 的多语言能力

TL;DR通过构建两个数据集,将 LLaMA 和 BLOOM 的多语言能力扩展到 100 种语言,并使用 DPO 算法对 LLMs 进行与人类反馈的对齐,实现了对 100 种语言的支持,从而定义了最新的、支持 100 种语言的多语言 LLMs 的最新技术。