Sep, 2022

MonoByte:单语字节级语言模型池

TL;DR本研究发布了 10 个在相同配置下严格预训练的单语模型,它们是基于字节的,不需要分词,可以消除未见标记嵌入的问题,并且可以在不同文字脚本的语言中尝试更广泛的跨语言实验,通过 QA 和 NLI 任务的实验证明,这些单语模型的性能与多语言模型相当,可以加强我们对语言模型跨语言可迁移性的理解。