基于逻辑的数据组织范例在使用检索增强生成的问答系统中的应用
一种促进阅读理解的策略是以问答形式呈现信息。我们展示了一个集成了问答和问题生成任务的系统,用于生成传达多段文档内容的问答项。我们报告了一些 QA 和 QG 的实验结果,并评估了它们如何相互作用以产生文本的 Q&A 列表。该演示可在 qna.sdl.com 上访问。
Mar, 2021
检索增强生成 (RAG) 通过提供相关的上下文文本,可以约束生成模型的输出,并减轻产生虚假信息的可能性。我们提出了一个双层 RAG 框架用于查询焦点答案生成,并在社交媒体论坛中对此框架的概念验证进行评估,重点是从新兴的与药物相关信息中生成查询焦点摘要。评估结果表明,在资源受限的环境中,双层框架能够帮助研究人员从用户那里获取几乎实时的数据。
May, 2024
该论文介绍了一种新的开放域问答框架,其中检索器和阅读器相互迭代交互,引入了多步推理机制,有助于从长度为百万级的语料库中检索信息性段落,并应用于不同的问答数据集和模型中均取得了一致性的提升。
May, 2019
提出了 IRCoT 方法,在多步 QA 过程中使用检索和 CoT 交替进行,同时使用检索的结果来改善 CoT。在 HotpotQA、2WikiMultihopQA、MuSiQue 和 IIRC 四个数据集上,使用 IRCoT 方法取得了显著的检索和 QA 性能改进,即便是在小型模型 T5-Flan-large(0.7B)上也能奏效。
Dec, 2022
本文提出了一种基于数据和文本的统一问答框架 UDT-QA,并使用数据到文本方法将 Wiki 百科中的表格和 Wikidata 中的图表达为口语化信息,以扩展知识索引。实验证明,该方法取得了自然问答 (Single-model state-of-the-art) 的最佳成果,并表明对于调整和热插拔的两种情况,口语化知识的优先考虑可以优化答案推理。
Oct, 2021
这篇研究论文介绍了 HiQA,一种集成了层叠元数据和多路检索机制的高级多文档问答框架,并提出了用于多文档问答研究评估的基准 MasQA。该框架在多文档环境中展示了最先进的性能。
Feb, 2024
本文提出了一种基于图模型和关联反馈的检索方法,用于连续的问答交互中提高检索效率和准确性。实验结果显示,与当前流行的方法相比,该方法大幅提高了问题回答的 F1 得分。
Apr, 2021
本研究介绍了一个基于 NFDI4DataScience Gateway 的学术问答系统,采用了检索增强生成模型(RAG)的方法。该系统利用强大的大语言模型提供动态交互和会话式搜索,通过实验分析证明了 Gateway 和学术问答系统的有效性。
Jun, 2024
使用 PaperQA,通过对科学文献进行信息检索,评估来源和段落的相关性,并利用 RAG 提供答案的方法,超越现有的 LLMs 和 LLM 代理在当前科学问答基准测试上的表现,使得该代理模型能够进行大规模、系统化的科学知识处理。
Dec, 2023