EMNLPOct, 2020

PARADE: 面向计算机科学领域知识的近义识别新数据集

TL;DR本文提出了一个名为 PARADE 的新型基准数据集,用于测试包含不同领域专业知识的文本相似性鉴别模型。结果表明,即使是最先进的神经网络模型以及普通人类标注者在此数据集上的表现也十分糟糕。PARADE 可以为需要加入专业领域知识的模型提供一个资源。我们公开了数据集和代码。