Dec, 2020

UNKs无处不在:将多语言语言模型适应新的字符集

TL;DR本文介绍了一种基于矩阵分解和词汇重叠的方法,能够快速适应预先训练的多语言模型以适应资源匮乏的语言和未知脚本,并且在这些语言中能够获得显著的性能提升。