TSQA:基于表格场景的问答系统
本文提出了一种新的多表问题回答模型,称作 MultiTabQA,除了回答多表问题外,还能生成表格回答。为了实现有效的训练,我们构建了一个包括 132,645 个 SQL 查询和表格回答的预训练数据集。通过引入不同严格程度的特定于表格的评估指标,我们评估了生成的表格。经过在三个数据集(Spider、Atis 和 GeoQuery)上微调后,MultiTabQA 优于在多表 QA 环境中改编成的最先进的单表 QA 模型。
May, 2023
该研究介绍了 GeoSQA 数据集,它包括 1,981 个高中地理领域的场景和 4,110 个多项选择题。通过手动注释自然语言描述的图表,为 NLP 研究提供了便利,并在问答、文本蕴含和阅读理解方面对各种最先进的方法进行了基准测试,证明了 SQA 对未来研究的独特挑战。
Aug, 2019
本文在生物医学领域维度构建了一个表格问答数据集 BioTABQA,包含 22 个模板和上下文中的信息。通过该数据集,本文提出了一种基于指导学习的方法,在多个评估方式下,该方法比单一和多任务基线模型表现提高约 23% 和 6%。最重要的是,在跨任务方面,该方法的性能比基线模型提高了约 5%。
Jul, 2022
该研究主要介绍了一个针对航空业公司数据集的领域特定的表格问答数据集 AIT-QA,分析了使用 Transformer 模型进行 Table QA 的现有方法在处理领域特定的表格数据时面临的挑战,并提出了一些实用的表格预处理步骤。
Jun, 2021
该研究调查了目前表格问答的数据集和方法,并将现有的表格问答方法分类为五类,即基于语义解析的、生成式的、提取式的、基于匹配的和检索式的方法。此外,研究还提出了该领域的一些主要挑战和未来方向。
Jul, 2022
研究报告通过构建新的 SciTabQA 数据集评估现有的科学混合表格问答模型的稳健性和性能,发现表格问答模型在科学信息上的解释能力较低,需要进一步改进。
Mar, 2024
本文提出了一个新的 QA 数据集 TAT-QA,并提出了一个新的 QA 模型 TAGOP,该模型可以同时推理表格和文本的含义,但该模型的 F1 值达到了 58.0%,距离专家水平还有较大的差距(90.8%),本文提供的 TAT-QA 可以作为处理混合形式数据的 QA 模型的基准。
May, 2021
本文设计了新的挑战测试基准 WikiSQL-TS 和 WikiTQ-TS,模拟了实际主题转移场景,并提出了适用于 TableQA 的 T3QA(主题可转移的表格问题回答)方案,包括注入特定主题词汇、生成主题专用训练数据生成程序和逻辑形式重新排序器。我们认为我们的主题分裂基准将会促进更好的部署的鲁棒的 TableQA 解决方案。
Sep, 2021
本篇论文介绍了 FeTaQA 数据集,该数据集包含 10K 个基于维基百科的 {表格,问题,自由形式答案,支持表格单元格} 对,可以用于进行表格问答系统的复杂推理和信息集成;并提出了一个基于语义解析的 QA 系统和一个基于大型预训练文本生成模型的端到端方法来处理该任务。
Apr, 2021
使用开源语言模型,我们提出了一种基于推理和摘要的分解问题和回答的多跳表 - 文本问答的 TTQA-RS 模型,它在现有的 HybridQA 和 OTT-QA 数据集上的表格 - 文本 QA 任务中表现出色,同时与基于训练的最先进模型相当,展示了基于提示的方法利用开源 LLMs 的潜力,此外,通过使用 GPT-4 与 LLaMA3-70B,我们的模型在多跳表 - 文本 QA 的基于提示的方法上实现了最先进的性能。
Jun, 2024