ACLJun, 2019

SParC: 跨领域上下文语义解析

TL;DR本研究提出了 SParC 数据集,旨在解决复杂的语义解析问题,该数据集跨域,包含了超过 138 个领域的 200 个复杂数据库,包括 4298 个连贯的问题序列和 12000 多个与 SQL 查询一起注释的单独问题。该数据集引入了新的挑战,如复杂的上下文依赖性、更大的语义多样性,需要在未见领域中进行泛化。研究者使用两种最先进的文本到 SQL 模型进行实验。最佳模型在所有问题上的完全匹配准确率为 20.2%,在所有交互序列上少于 10%,这表明数据集的跨域设置和上下文现象对未来研究具有重大挑战。