Mar, 2024

优化多语言大型语言模型的语言增强:以韩文为例的案例研究

TL;DR本研究提出了三种策略以增强不太具备资源的语言在大型语言模型中的表现:扩展词汇表、使用双语数据进行预训练以对齐高资源语言和低资源语言、构建高质量的小规模指令数据集并进行指令微调。通过对比八个任务的其他大型语言模型,在质量分析中,我们的提出的Bllossom模型表现出优异的性能。