EMNLPSep, 2019

WIQA:一份针对过程文本中的 “What if…” 推理的数据集

TL;DRWIQA 是一个包含大量关于程序性文本 “What if…” 问题的数据集,其中包括描述过程的段落、描述一个变化如何影响另一个的众包影响图和从图中派生的大量 “what if…” 多项选择问题,包括对段落中提到的步骤进行干扰、需要常识知识的外部干扰以及无关紧要的干扰等三种类型。我们发现,当前的最先进模型的准确率为 73.8%,远低于人类表现的 96.3%。该数据集是社区的一个开放性挑战,其中一个主要的挑战是跟踪影响链。