ACLApr, 2020

GLUECoS : 用于代码交替自然语言处理的评估基准

TL;DR在一个名为,GLUECoS, 的评估基准中,使用多语境上下文嵌入模型进行评估,评估基准包括领域从文本中识别、POS 标记、命名实体识别、情感分析、问答和一项新的代码交换任务的多个自然语言处理任务。我们使用跨语言和多语言模型在所有这些任务上展示结果,并在人工生成的代码交换数据上微调多语言模型,结果表明多语言模型可以进一步针对代码交换任务进行优化,即使多语言模型比跨语言模型表现显著好,但我们的结果表明,在大多数任务中,无论是跨语言还是多种语言,微调代码交换数据上的多语言模型效果最佳。