ACLMay, 2023

Glot500: 将多语言语料库和语言模型扩展到 500 种语言

TL;DR该研究开发了覆盖 511 种语言的大型多语言模型 Glot500-m,通过将其预训练与应用于 5 种不同语言任务中表现出较好的表现,探讨了多语言 LLM 的质量因素,旨在实现 NLP 技术在尽可能多的语言和文化中的应用。