ACLSep, 2022

自然语言推理不一致性原因的调查研究

TL;DR本研究探讨自然语言推理中的不一致性注释是如何产生的,并识别了 10 种引起不一致的原因,其中某些不一致是由于句子意义的不确定性,而另一些则是由于注释者偏见和任务工件的存在。我们通过两种建模方法来检测存在潜在分歧的文本项目:一个比标准 NLI 标签多一个 “复杂” 标签的四分类方法,和一个多标签分类方法。我们发现多标签分类方法更具表现力,并对数据的可能解释提供了更好的召回率。