Jan, 2023

XLM-V: 克服多语言掩码语言模型中的词汇瓶颈

TL;DR本文介绍了一种新方法,通过降低语言之间的词汇共享并分配单独语言的词汇容量,实现非常大的多语言词汇量的扩展,用于构建 XLM-V 多语言模型,其表现优于 XLM-R 模型。