TSQA：基于表格场景的问答系统

AAAIJan, 2021

TSQA: Tabular Scenario Based Question Answering

Xiao Li, Yawei Sun, Gong Cheng

TL;DR本文提出了一种基于结构化数据的问答任务：表格情境问答，以及一个新的数据集 GeoTSQA。作者利用 TTGen 生成句子并结合多种信息回答问题，在 GeoTSQA 上优于现有强基线方法。

Abstract

Scenario-based question answering (SQA) has attracted an increasing research interest. Compared with the well-studied machine reading comprehension (mrc), SQA is a more challenging task: a scenario may contain not only a textual passage to read but also structured data like tables, i.e

tabular scenario based question answering geotsqa ttgen table-to-text generator mrc

发现论文，激发创造

MultiTabQA：为多表问答生成表格答案

本文提出了一种新的多表问题回答模型，称作 MultiTabQA，除了回答多表问题外，还能生成表格回答。为了实现有效的训练，我们构建了一个包括 132,645 个 SQL 查询和表格回答的预训练数据集。通过引入不同严格程度的特定于表格的评估指标，我们评估了生成的表格。经过在三个数据集（Spider、Atis 和 GeoQuery）上微调后，MultiTabQA 优于在多表 QA 环境中改编成的最先进的单表 QA 模型。

May, 2023

GeoSQA：高中地理领域基于情境的问答基准

该研究介绍了 GeoSQA 数据集，它包括 1,981 个高中地理领域的场景和 4,110 个多项选择题。通过手动注释自然语言描述的图表，为 NLP 研究提供了便利，并在问答、文本蕴含和阅读理解方面对各种最先进的方法进行了基准测试，证明了 SQA 对未来研究的独特挑战。

Aug, 2019

BioTABQA: 医学表格问答的指令学习

本文在生物医学领域维度构建了一个表格问答数据集 BioTABQA，包含 22 个模板和上下文中的信息。通过该数据集，本文提出了一种基于指导学习的方法，在多个评估方式下，该方法比单一和多任务基线模型表现提高约 23% 和 6%。最重要的是，在跨任务方面，该方法的性能比基线模型提高了约 5%。

Jul, 2022

航空行业复杂表格的问答数据集

该研究主要介绍了一个针对航空业公司数据集的领域特定的表格问答数据集 AIT-QA，分析了使用 Transformer 模型进行 Table QA 的现有方法在处理领域特定的表格数据时面临的挑战，并提出了一些实用的表格预处理步骤。

Jun, 2021

表格问答调查：最新进展

该研究调查了目前表格问答的数据集和方法，并将现有的表格问答方法分类为五类，即基于语义解析的、生成式的、提取式的、基于匹配的和检索式的方法。此外，研究还提出了该领域的一些主要挑战和未来方向。

Jul, 2022

科学表格的标签问答模型有多稳健？使用自定义数据集的研究

研究报告通过构建新的 SciTabQA 数据集评估现有的科学混合表格问答模型的稳健性和性能，发现表格问答模型在科学信息上的解释能力较低，需要进一步改进。

Mar, 2024

TAT-QA：面向金融领域表格和文本混合内容的问答基准

本文提出了一个新的 QA 数据集 TAT-QA，并提出了一个新的 QA 模型 TAGOP，该模型可以同时推理表格和文本的含义，但该模型的 F1 值达到了 58.0％，距离专家水平还有较大的差距（90.8％），本文提供的 TAT-QA 可以作为处理混合形式数据的 QA 模型的基准。

May, 2021

可迁移的表格问答

本文设计了新的挑战测试基准 WikiSQL-TS 和 WikiTQ-TS，模拟了实际主题转移场景，并提出了适用于 TableQA 的 T3QA（主题可转移的表格问题回答）方案，包括注入特定主题词汇、生成主题专用训练数据生成程序和逻辑形式重新排序器。我们认为我们的主题分裂基准将会促进更好的部署的鲁棒的 TableQA 解决方案。

Sep, 2021

FeTaQA：自由形式表格问答

本篇论文介绍了 FeTaQA 数据集，该数据集包含 10K 个基于维基百科的 {表格，问题，自由形式答案，支持表格单元格} 对，可以用于进行表格问答系统的复杂推理和信息集成；并提出了一个基于语义解析的 QA 系统和一个基于大型预训练文本生成模型的端到端方法来处理该任务。

Apr, 2021

TTQA-RS - 多跳表格 - 文本问题回答的细化提示方法与推理及总结

使用开源语言模型，我们提出了一种基于推理和摘要的分解问题和回答的多跳表 - 文本问答的 TTQA-RS 模型，它在现有的 HybridQA 和 OTT-QA 数据集上的表格 - 文本 QA 任务中表现出色，同时与基于训练的最先进模型相当，展示了基于提示的方法利用开源 LLMs 的潜力，此外，通过使用 GPT-4 与 LLaMA3-70B，我们的模型在多跳表 - 文本 QA 的基于提示的方法上实现了最先进的性能。

Jun, 2024