Apr, 2021

将语言学家参与是否提高 NLU 数据收集的效果?

TL;DR本研究以自然语言推理为测试案例,探究在众包数据收集过程中加入语言学家以动态地识别和解决数据中的漏洞和偏见是否有利于减轻偏见,提高数据的可靠性。对比了三种数据收集方案,发现加入语言学家对数据的挑战性的提高不会将数据的质量降低,并提出建议在数据收集期间整合专家的分析以解决数据中的偏见和系统漏洞。