Jun, 2023

CATS:一个实用的中文问答序列数据集,具有大规模且高质量

TL;DR本研究提出了CATS数据集,它是一个实用的基于表格问答系统的大规模高质量的答案到描述的中文数据集,并通过提出统一图转换方法,将这一任务转化为图到文本问题,以建立输入SQL和表之间的语义对齐。实验结果表明了我们提出的方法的有效性,并进一步分析了CATS数据集的质量和挑战。