ACLMar, 2021

多视角次词正则化

TL;DR应用现有子词规范化方法 (Kudo,2018;Profilkov et al., 2020) 对预训练的多语言表示进行微调,通过多视角子词规范化(MVR)方法增强跨语言转移的有效性,同时改善标准分词算法的效果,提高多语种基准测试 (XTREME) 的一致性改进 2.5 个点。