Sep, 2019

使用词汇扩展提高预训练多语言模型的性能

TL;DR本文研究了两种方法(联合映射和混合映射)来解决预先训练的BERT多语言模型中的词汇表大小和词汇缺失问题,并在多个任务中进行了实验。结果表明,使用混合映射更有前途。这是首次在多语言环境下试图解决词汇缺失问题。