Dec, 2023

将以英语为中心的LLMs转变为多语种模型:需要多少语言能力?

TL;DR通过与只使用英文进行微调的模型相比较,研究发现只使用三种语言进行多语种微调可以显著提高模型在生成式任务上的跨语言转移能力,而在高度结构化的任务上影响较小。