May, 2019

深度双向跨语言 Transformer 在俄语语言上的应用

TL;DR该论文介绍了适用于特定语言的多语言遮蔽语言模型的自适应方法,展示了从多语言模型到单语言模型的迁移学习可以显著提高阅读理解、情感分析等任务的性能,且多语言初始化的单语言模型可以大幅度降低训练时间。俄语的预训练模型已公开。