EMNLPOct, 2020

RussianSuperGLUE: 俄语语言理解评测基准

TL;DR本文介绍了一种先进的俄语语言理解评估基准 ——RussianGLUE,并提供了包括基线、人类评估、开源框架和总排行榜等丰富内容。我们还比较了多语言模型在适应性诊断测试集上的表现,并提出了进一步扩展或评估最先进模型的第一步。