MFORT-QA：多跳少样本开放丰富表格问答

Mar, 2024

MFORT-QA：多跳少样本开放丰富表格问答

MFORT-QA: Multi-hop Few-shot Open Rich Table Question Answering

Che Guan, Mengyu Huang, Peng Zhang

TL;DR通过多跳式少样本开放式丰富表格问答（MFORT-QA）方法，利用大型语言模型、少样本学习和多跳式推理思路，从表格数据中提取信息并显著改善抽取式表格问答方法的准确性。

Abstract

In today's fast-paced industry, professionals face the challenge of summarizing a large number of documents and extracting vital information from them on a daily basis. These metrics are frequently hidden away in tables and/or their nested hyperlinks. To address this challenge, the approach of →

table question answering large language models multi-hop few-shot open rich table qa few-shot learning chain-of-thought prompting

发现论文，激发创造

TTQA-RS - 多跳表格 - 文本问题回答的细化提示方法与推理及总结

使用开源语言模型，我们提出了一种基于推理和摘要的分解问题和回答的多跳表 - 文本问答的 TTQA-RS 模型，它在现有的 HybridQA 和 OTT-QA 数据集上的表格 - 文本 QA 任务中表现出色，同时与基于训练的最先进模型相当，展示了基于提示的方法利用开源 LLMs 的潜力，此外，通过使用 GPT-4 与 LLaMA3-70B，我们的模型在多跳表 - 文本 QA 的基于提示的方法上实现了最先进的性能。

Jun, 2024

表格与文本的开放式问题回答

该论文研究了开放式问答系统（QA）在同时检索结构化表格和非结构化文本数据时的困难之处，并提出了两种新技术以提高检索准确率，让模型的精确匹配得分提高至 27% 以上，这为该领域的未来研究提供了重要的参考价值。

Oct, 2020

HRoT：表 - 文混合问答中的混合提示策略与思维检索

通过提出混合提示策略和检索思路以进行文本表格问答，我们的方法通过上下文学习和以连贯思路引导模型，在少样本情况下，相对于完全监督的最先进方法，在 MultiHiertt 数据集上实现了卓越的性能。

Sep, 2023

本地化、检索和融合：用于自由形式表格问答的通用框架

该论文提出了一种名为 TAG-QA 的广义三阶段方法，通过表格到图的转换、外部知识检索和表格 - 文本融合来解决生成型 TableQA 中推断长篇自由格式答案的挑战。实验显示，TAG-QA 在 BLEU-4 和 PARENT F-score 指标上优于多个最先进的基准模型。

Sep, 2023

基于检索增强生成的端到端表格问答

我们提出了 T-RAG，一个端到端的表格问答（Table QA）模型，其中一个非参数密集向量索引与 BART 共同微调，通过一个统一的流程搜索表格语料库来直接定位正确答案，并将其应用到最近的开放域表格 QA 基准测试中，并证明微调后的 T-RAG 模型在端到端表格 QA 和表格检索任务中均能够取得最先进的性能。

Mar, 2022

S$^3$HQA：用于多跳文本 - 表格混合问答的三阶段方法

在本文中，我们提出了一个三阶段的 TextTableQA 框架 S3HQA，它包括检索器、选择器和推理器。在推理操作方面，我们采用了基于生成模型的推理器，包括一种行生成器和 LLM 提示生成器 (首次在这一任务中使用)。实验结果表明，我们的方法在少样本情况下取得了竞争性成果。当在整个数据集上训练时，我们的方法优于所有基线方法，在 HybridQA 排行榜上排名第一。

May, 2023

TAT-QA：面向金融领域表格和文本混合内容的问答基准

本文提出了一个新的 QA 数据集 TAT-QA，并提出了一个新的 QA 模型 TAGOP，该模型可以同时推理表格和文本的含义，但该模型的 F1 值达到了 58.0％，距离专家水平还有较大的差距（90.8％），本文提供的 TAT-QA 可以作为处理混合形式数据的 QA 模型的基准。

May, 2021

MultiTabQA：为多表问答生成表格答案

本文提出了一种新的多表问题回答模型，称作 MultiTabQA，除了回答多表问题外，还能生成表格回答。为了实现有效的训练，我们构建了一个包括 132,645 个 SQL 查询和表格回答的预训练数据集。通过引入不同严格程度的特定于表格的评估指标，我们评估了生成的表格。经过在三个数据集（Spider、Atis 和 GeoQuery）上微调后，MultiTabQA 优于在多表 QA 环境中改编成的最先进的单表 QA 模型。

May, 2023

知识密集型多步问题的交错检索与思维链推理

提出了 IRCoT 方法，在多步 QA 过程中使用检索和 CoT 交替进行，同时使用检索的结果来改善 CoT。在 HotpotQA、2WikiMultihopQA、MuSiQue 和 IIRC 四个数据集上，使用 IRCoT 方法取得了显著的检索和 QA 性能改进，即便是在小型模型 T5-Flan-large（0.7B）上也能奏效。

Dec, 2022

FeTaQA：自由形式表格问答

本篇论文介绍了 FeTaQA 数据集，该数据集包含 10K 个基于维基百科的 {表格，问题，自由形式答案，支持表格单元格} 对，可以用于进行表格问答系统的复杂推理和信息集成；并提出了一个基于语义解析的 QA 系统和一个基于大型预训练文本生成模型的端到端方法来处理该任务。

Apr, 2021