EMNLPAug, 2019

PAWS-X: 用于语义相似度识别的跨语言对抗数据集

TL;DRPAWS-X 是一个新的数据集,由六种不同类型的语言中的 23,659 个人类翻译评估成对组成,并提供了三个不同容量模型的基线数字,这些模型具有捕捉非本地上下文和句子结构的不同能力,并使用不同的多语种训练和评估模式。