Jun, 2022

MultiHiertt: 对多层次表格和文本数据的数值推理

TL;DR构建一个新的 QA benchmark (MultiHiertt),使用金融报告构建。包含多个表以及更长的非结构化文本,大部分表格是分层的;提供了复杂的数量推理的细粒度注释;提出了一个新的 QA 模型 MT2Net,它首先应用事实检索来提取相关事实,然后使用推理模块对检索到的事实进行符号推理。与现有基线相比,实验结果表明 MultiHiertt 对现有基线提出了严峻的挑战。