Mar, 2020
XTREME: 用于评估跨语言通用化的大规模多语言多任务基准数据集
XTREME: A Massively Multilingual Multi-task Benchmark for Evaluating
Cross-lingual Generalization
TL;DR该论文介绍了一个名为XTREME的跨语言多任务基准测试,它可以在40种语言和9个任务上评估多语言表示的跨语言泛化能力,研究表明,跨语言模型在句法和句子检索任务上的性能仍有相当大的差距,该基准测试旨在促进跨语言学习方法的研究。