EMNLPSep, 2021

NOAHQA: 可解释计算图的数值推理问答数据集

TL;DR介绍一个双语问答数据集 NOAHQA,旨在解决目前数值推理问题缺乏复杂问题以及提供推理过程的可解释性问题,通过使用 NOAHQA 数据集,开发了一个可解释的推理图,并提出了适当的评估指标来衡量答案质量。在 NOAHQA 上对现有 QA 模型进行评估,表明人类表现为 89.7,最好的 QA 模型只能达到 55.5 的准确匹配分数。