表格问答调查：最新进展

Jul, 2022

A Survey on Table Question Answering: Recent Advances

Nengzheng Jin, Joanna Siebert, Dongfang Li, Qingcai Chen

TL;DR该研究调查了目前表格问答的数据集和方法，并将现有的表格问答方法分类为五类，即基于语义解析的、生成式的、提取式的、基于匹配的和检索式的方法。此外，研究还提出了该领域的一些主要挑战和未来方向。

Abstract

table question answering (Table QA) refers to providing precise answers from tables to answer a user's question. In recent years, there have been a lot of works on table QA, but there is a lack of comprehensive surveys on this research topic. Hence, we aim to provide an overview of ava

table question answering datasets methods challenges future directions

发现论文，激发创造

现代问答数据集和基准：一项调查

本文调查了在深度学习时代发布的有影响力的问答数据集，并介绍了文本问答和视觉问答两个最常见的问答任务，涵盖了最具代表性的数据集，并提出了当前的一些 QA 研究挑战。

Jun, 2022

MultiTabQA：为多表问答生成表格答案

本文提出了一种新的多表问题回答模型，称作 MultiTabQA，除了回答多表问题外，还能生成表格回答。为了实现有效的训练，我们构建了一个包括 132,645 个 SQL 查询和表格回答的预训练数据集。通过引入不同严格程度的特定于表格的评估指标，我们评估了生成的表格。经过在三个数据集（Spider、Atis 和 GeoQuery）上微调后，MultiTabQA 优于在多表 QA 环境中改编成的最先进的单表 QA 模型。

May, 2023

TableQAKit：一套全面实用的基于表格的问题回答工具包

TableQAKit 是第一个专门设计用于 TableQA 的综合工具包，它提供了丰富的 TableQA 数据集、集成了流行的方法和大型语言模型，并且在一些数据集上实现了新的最佳性能，同时还提供了一个基于大型语言模型的 TableQA 基准测试。

Oct, 2023

BioTABQA: 医学表格问答的指令学习

本文在生物医学领域维度构建了一个表格问答数据集 BioTABQA，包含 22 个模板和上下文中的信息。通过该数据集，本文提出了一种基于指导学习的方法，在多个评估方式下，该方法比单一和多任务基线模型表现提高约 23% 和 6%。最重要的是，在跨任务方面，该方法的性能比基线模型提高了约 5%。

Jul, 2022

表格与文本的开放式问题回答

该论文研究了开放式问答系统（QA）在同时检索结构化表格和非结构化文本数据时的困难之处，并提出了两种新技术以提高检索准确率，让模型的精确匹配得分提高至 27% 以上，这为该领域的未来研究提供了重要的参考价值。

Oct, 2020

航空行业复杂表格的问答数据集

该研究主要介绍了一个针对航空业公司数据集的领域特定的表格问答数据集 AIT-QA，分析了使用 Transformer 模型进行 Table QA 的现有方法在处理领域特定的表格数据时面临的挑战，并提出了一些实用的表格预处理步骤。

Jun, 2021

FeTaQA：自由形式表格问答

本篇论文介绍了 FeTaQA 数据集，该数据集包含 10K 个基于维基百科的 {表格，问题，自由形式答案，支持表格单元格} 对，可以用于进行表格问答系统的复杂推理和信息集成；并提出了一个基于语义解析的 QA 系统和一个基于大型预训练文本生成模型的端到端方法来处理该任务。

Apr, 2021

本地化、检索和融合：用于自由形式表格问答的通用框架

该论文提出了一种名为 TAG-QA 的广义三阶段方法，通过表格到图的转换、外部知识检索和表格 - 文本融合来解决生成型 TableQA 中推断长篇自由格式答案的挑战。实验显示，TAG-QA 在 BLEU-4 和 PARENT F-score 指标上优于多个最先进的基准模型。

Sep, 2023

基于检索增强生成的端到端表格问答

我们提出了 T-RAG，一个端到端的表格问答（Table QA）模型，其中一个非参数密集向量索引与 BART 共同微调，通过一个统一的流程搜索表格语料库来直接定位正确答案，并将其应用到最近的开放域表格 QA 基准测试中，并证明微调后的 T-RAG 模型在端到端表格 QA 和表格检索任务中均能够取得最先进的性能。

Mar, 2022

从信息检索和深度神经网络角度的基于文本的问答：一项综述

本文综述了传统信息检索方法和深度神经网络方法在文本问答任务中的应用，介绍了相关模型以及可供比较的数据集和文献结果。

Feb, 2020