Jan, 2024

MaLA-500: 大规模语言模型的大规模语言适应

TL;DR为了弥补大型语言模型在低资源语言方面的不足,本研究引入了 MaLA-500,一个设计用于覆盖 534 种语言范围的新型大型语言模型。通过词汇扩展和持续的预训练,MaLA-500 在 SIB-200 上的实验表明其实现了最新的上下文学习结果。我们将 MaLA-500 发布在指定的 URL 上。