Apr, 2020

多语言 BERT 中跨语言能力和语言特异信息的研究

TL;DR本研究针对跨语言能力对多语言 BERT 进行了深入实验研究,发现数据大小和上下文窗口大小是跨语言能力的关键因素,探讨了多语言 BERT 中的语言特定信息,通过操作潜在表示控制多语言 BERT 的语言输出,实现了无监督令牌翻译,并提出了一种计算成本低但有效提高多语言 BERT 跨语言能力的方法。