表格问答调查:最新进展
本文调查了在深度学习时代发布的有影响力的问答数据集,并介绍了文本问答和视觉问答两个最常见的问答任务,涵盖了最具代表性的数据集,并提出了当前的一些 QA 研究挑战。
Jun, 2022
本文提出了一种新的多表问题回答模型,称作 MultiTabQA,除了回答多表问题外,还能生成表格回答。为了实现有效的训练,我们构建了一个包括 132,645 个 SQL 查询和表格回答的预训练数据集。通过引入不同严格程度的特定于表格的评估指标,我们评估了生成的表格。经过在三个数据集(Spider、Atis 和 GeoQuery)上微调后,MultiTabQA 优于在多表 QA 环境中改编成的最先进的单表 QA 模型。
May, 2023
TableQAKit 是第一个专门设计用于 TableQA 的综合工具包,它提供了丰富的 TableQA 数据集、集成了流行的方法和大型语言模型,并且在一些数据集上实现了新的最佳性能,同时还提供了一个基于大型语言模型的 TableQA 基准测试。
Oct, 2023
本文在生物医学领域维度构建了一个表格问答数据集 BioTABQA,包含 22 个模板和上下文中的信息。通过该数据集,本文提出了一种基于指导学习的方法,在多个评估方式下,该方法比单一和多任务基线模型表现提高约 23% 和 6%。最重要的是,在跨任务方面,该方法的性能比基线模型提高了约 5%。
Jul, 2022
该论文研究了开放式问答系统(QA)在同时检索结构化表格和非结构化文本数据时的困难之处,并提出了两种新技术以提高检索准确率,让模型的精确匹配得分提高至 27% 以上,这为该领域的未来研究提供了重要的参考价值。
Oct, 2020
该研究主要介绍了一个针对航空业公司数据集的领域特定的表格问答数据集 AIT-QA,分析了使用 Transformer 模型进行 Table QA 的现有方法在处理领域特定的表格数据时面临的挑战,并提出了一些实用的表格预处理步骤。
Jun, 2021
本篇论文介绍了 FeTaQA 数据集,该数据集包含 10K 个基于维基百科的 {表格,问题,自由形式答案,支持表格单元格} 对,可以用于进行表格问答系统的复杂推理和信息集成;并提出了一个基于语义解析的 QA 系统和一个基于大型预训练文本生成模型的端到端方法来处理该任务。
Apr, 2021
该论文提出了一种名为 TAG-QA 的广义三阶段方法,通过表格到图的转换、外部知识检索和表格 - 文本融合来解决生成型 TableQA 中推断长篇自由格式答案的挑战。实验显示,TAG-QA 在 BLEU-4 和 PARENT F-score 指标上优于多个最先进的基准模型。
Sep, 2023
我们提出了 T-RAG,一个端到端的表格问答(Table QA)模型,其中一个非参数密集向量索引与 BART 共同微调,通过一个统一的流程搜索表格语料库来直接定位正确答案,并将其应用到最近的开放域表格 QA 基准测试中,并证明微调后的 T-RAG 模型在端到端表格 QA 和表格检索任务中均能够取得最先进的性能。
Mar, 2022