Jan, 2024

加速单语文本生成的多语言语言模型的简单框架

TL;DR最近大型语言模型的进展不仅在英语中,还在非英语语言中完成了复杂语言任务的执行。然而,大多数语言模型的分词器(如 Llama)在训练时采用的是以英语为中心的语料库,往往会在非英语语言中过度分词。针对这个问题,我们的研究引入了一种新颖的框架,旨在加快这些语言的文本生成。此框架预测的语言单元较传统的多语言分词器更大,并且专门针对目标语言进行了定制,从而减少了所需的解码步骤。我们的实证结果表明,与标准解码相比,所提出的框架将生成速度提高了 1.9 倍,同时在单语任务上保持了预训练多语言模型的性能。