EMNLPAug, 2019

我们在模拟任务还是模拟标注者?—— 自然语言理解数据集中标注者倾向的研究

TL;DR本文通过实验展示了人群智力数据集在自然语言理解中的存在问题和缺陷,建议在数据集创建过程中监控注释者的偏见,测试集注释者应该与训练集注释者无交集。