Apr, 2024

Sailor:东南亚开放式语言模型

TL;DRSailor 是一个面向东南亚语言的一系列开放语言模型,包括从 0.5B 到 7B 参数的模型。通过从 Qwen1.5 继续预训练,Sailor 模型接受 200B 到 400B 个 token,主要涵盖英语、中文、越南语、泰语、印度尼西亚语、马来语和老挝语。实验结果显示,Sailor 模型在常识推理、问答、阅读理解和考试等多个基准任务上表现出强的性能,鼓励开发更多多语种大语言模型的兴趣。