Mar, 2023

扩展 BLOOM 的预训练,以改进对繁体中文的支持:模型、方法和结果

TL;DR本文介绍了多语言语言模型 BLOOM-zh,以强化对繁体中文的支持。通过在传统中文和英语领域中增加 74 亿个标记的预训练,BLOOM-zh 在大多数传统中文基准测试中优于其前身。