HRoT:表 - 文混合问答中的混合提示策略与思维检索
使用开源语言模型,我们提出了一种基于推理和摘要的分解问题和回答的多跳表 - 文本问答的 TTQA-RS 模型,它在现有的 HybridQA 和 OTT-QA 数据集上的表格 - 文本 QA 任务中表现出色,同时与基于训练的最先进模型相当,展示了基于提示的方法利用开源 LLMs 的潜力,此外,通过使用 GPT-4 与 LLaMA3-70B,我们的模型在多跳表 - 文本 QA 的基于提示的方法上实现了最先进的性能。
Jun, 2024
通过多跳式少样本开放式丰富表格问答(MFORT-QA)方法,利用大型语言模型、少样本学习和多跳式推理思路,从表格数据中提取信息并显著改善抽取式表格问答方法的准确性。
Mar, 2024
在本文中,我们提出了一个三阶段的 TextTableQA 框架 S3HQA,它包括检索器、选择器和推理器。在推理操作方面,我们采用了基于生成模型的推理器,包括一种行生成器和 LLM 提示生成器 (首次在这一任务中使用)。实验结果表明,我们的方法在少样本情况下取得了竞争性成果。当在整个数据集上训练时,我们的方法优于所有基线方法,在 HybridQA 排行榜上排名第一。
May, 2023
多模态问题回答(MMHQA)是一个具有挑战性的任务,我们提出了一个 MMHQA-ICL 框架,包括强大的异构数据检索器和图像描述模块,并首次使用了端到端 LLM 提示方法。实验结果表明,我们的框架在多模态问题回答上表现出色,优于所有基准线和使用完整数据集训练的方法,达到了多模态 QA 数据集在少样本设置下的最新成果。
Sep, 2023
HybridQA 是一个基于异构信息的新的大规模问答数据集,通过对表格和文本信息的聚合完成问答,结果表明使用异构信息的混合模型可以获得高于基准模型的精确度。
Apr, 2020
提出了 IRCoT 方法,在多步 QA 过程中使用检索和 CoT 交替进行,同时使用检索的结果来改善 CoT。在 HotpotQA、2WikiMultihopQA、MuSiQue 和 IIRC 四个数据集上,使用 IRCoT 方法取得了显著的检索和 QA 性能改进,即便是在小型模型 T5-Flan-large(0.7B)上也能奏效。
Dec, 2022
本文介绍了一种基于大型语言模型的 In-context learning 方法用于文本到 SQL 查询转换中,通过不同的演示选择策略和指令格式来提高 LLMs 性能。实验结果表明,该方法在 Spider 数据集上超出了最先进系统 2.5 个点,超出了最佳微调系统 5.1 个点。
May, 2023
本文提出一种基于大型语言模型的 Text-to-SQL 框架 —— 检索增强提示法,包括样本感知提示和动态修订链,通过引入检索来生成针对自然语言问题的 SQL 查询。
Jul, 2023
该论文研究了开放式问答系统(QA)在同时检索结构化表格和非结构化文本数据时的困难之处,并提出了两种新技术以提高检索准确率,让模型的精确匹配得分提高至 27% 以上,这为该领域的未来研究提供了重要的参考价值。
Oct, 2020
通过比较分析不同 Table-to-Text 方法生成的语料库对 QA 系统性能的影响,为开发稳健 QA 系统的学术和工业界提供有价值的参考。
Feb, 2024