Jun, 2024

大词汇量提升大型语言模型

TL;DR本文通过实证研究了子词词汇大小与大型语言模型(LLM)性能之间的关系,以提供关于如何定义词汇大小的洞见。实验结果表明,更大的词汇大小可提高 LLM 的性能。此外,我们考虑了一个持续训练的情景,其中一个预训练的语言模型在不同的目标语言上进行训练。我们引入了一种简单的方法,使用新的词汇代替预定义的词汇。我们证明使用新词汇优于使用预训练词汇的模型。