Apr, 2024

中文细粒度 LLM:预训练中心化大型语言模型

TL;DR通过引入 CT-LLM,这项研究介绍了一个 2B 规模的大型语言模型(LLM),以优先考虑中文语言的发展。这项研究挑战了在英文语料库上培训 LLMs 并将其适应其他语言的常规模式,为 LLM 培训方法学的拓宽开创了新的可能性。