EMNLPNov, 2022

CONDAQA: 一个针对否定逻辑推理的对比阅读理解数据集

TL;DR该研究介绍了 CONDAQA,这是第一个要求关于段落中否定语句涵义的英语阅读理解数据集,它挑战现有的自然语言理解系统,具有多样化的否定提示符,重点精心设计了具有谐音、范围变化和否定转变的三种编辑方式,细致构建了一系列难以回答的问题 - 答案对来测试模型的性能。最终的 CONDAQA 包含 14182 个问题 - 答案对及 200 多个唯一的否定提示符,最好的模型 (UnifiedQA-v2-3b) 仅在一致性测度上达到 42% 的表现,远低于人类表现 (81%),因此研究团队希望将他们的数据集、每个问题答案的完整编辑和全面微调发布出来,以促进未来针对否定语言的 NLP 方法的发展。