Jun, 2024
超越英语的LLMs:通过跨语言反馈扩展LLMs的多语言能力
LLMs Beyond English: Scaling the Multilingual Capability of LLMs with
Cross-Lingual Feedback
TL;DR通过构建两个数据集,将 LLaMA 和 BLOOM 的多语言能力扩展到 100 种语言,并使用 DPO 算法对 LLMs 进行与人类反馈的对齐,实现了对 100 种语言的支持,从而定义了最新的、支持 100 种语言的多语言 LLMs 的最新技术。