MFORT-QA:多跳少样本开放丰富表格问答
使用开源语言模型,我们提出了一种基于推理和摘要的分解问题和回答的多跳表 - 文本问答的 TTQA-RS 模型,它在现有的 HybridQA 和 OTT-QA 数据集上的表格 - 文本 QA 任务中表现出色,同时与基于训练的最先进模型相当,展示了基于提示的方法利用开源 LLMs 的潜力,此外,通过使用 GPT-4 与 LLaMA3-70B,我们的模型在多跳表 - 文本 QA 的基于提示的方法上实现了最先进的性能。
Jun, 2024
该论文研究了开放式问答系统(QA)在同时检索结构化表格和非结构化文本数据时的困难之处,并提出了两种新技术以提高检索准确率,让模型的精确匹配得分提高至 27% 以上,这为该领域的未来研究提供了重要的参考价值。
Oct, 2020
通过提出混合提示策略和检索思路以进行文本表格问答,我们的方法通过上下文学习和以连贯思路引导模型,在少样本情况下,相对于完全监督的最先进方法,在 MultiHiertt 数据集上实现了卓越的性能。
Sep, 2023
该论文提出了一种名为 TAG-QA 的广义三阶段方法,通过表格到图的转换、外部知识检索和表格 - 文本融合来解决生成型 TableQA 中推断长篇自由格式答案的挑战。实验显示,TAG-QA 在 BLEU-4 和 PARENT F-score 指标上优于多个最先进的基准模型。
Sep, 2023
我们提出了 T-RAG,一个端到端的表格问答(Table QA)模型,其中一个非参数密集向量索引与 BART 共同微调,通过一个统一的流程搜索表格语料库来直接定位正确答案,并将其应用到最近的开放域表格 QA 基准测试中,并证明微调后的 T-RAG 模型在端到端表格 QA 和表格检索任务中均能够取得最先进的性能。
Mar, 2022
在本文中,我们提出了一个三阶段的 TextTableQA 框架 S3HQA,它包括检索器、选择器和推理器。在推理操作方面,我们采用了基于生成模型的推理器,包括一种行生成器和 LLM 提示生成器 (首次在这一任务中使用)。实验结果表明,我们的方法在少样本情况下取得了竞争性成果。当在整个数据集上训练时,我们的方法优于所有基线方法,在 HybridQA 排行榜上排名第一。
May, 2023
本文提出了一个新的 QA 数据集 TAT-QA,并提出了一个新的 QA 模型 TAGOP,该模型可以同时推理表格和文本的含义,但该模型的 F1 值达到了 58.0%,距离专家水平还有较大的差距(90.8%),本文提供的 TAT-QA 可以作为处理混合形式数据的 QA 模型的基准。
May, 2021
本文提出了一种新的多表问题回答模型,称作 MultiTabQA,除了回答多表问题外,还能生成表格回答。为了实现有效的训练,我们构建了一个包括 132,645 个 SQL 查询和表格回答的预训练数据集。通过引入不同严格程度的特定于表格的评估指标,我们评估了生成的表格。经过在三个数据集(Spider、Atis 和 GeoQuery)上微调后,MultiTabQA 优于在多表 QA 环境中改编成的最先进的单表 QA 模型。
May, 2023
提出了 IRCoT 方法,在多步 QA 过程中使用检索和 CoT 交替进行,同时使用检索的结果来改善 CoT。在 HotpotQA、2WikiMultihopQA、MuSiQue 和 IIRC 四个数据集上,使用 IRCoT 方法取得了显著的检索和 QA 性能改进,即便是在小型模型 T5-Flan-large(0.7B)上也能奏效。
Dec, 2022
本篇论文介绍了 FeTaQA 数据集,该数据集包含 10K 个基于维基百科的 {表格,问题,自由形式答案,支持表格单元格} 对,可以用于进行表格问答系统的复杂推理和信息集成;并提出了一个基于语义解析的 QA 系统和一个基于大型预训练文本生成模型的端到端方法来处理该任务。
Apr, 2021