基于逻辑的数据组织范例在使用检索增强生成的问答系统中的应用

Jun, 2024

基于逻辑的数据组织范例在使用检索增强生成的问答系统中的应用

Thread: A Logic-Based Data Organization Paradigm for How-To Question Answering with Retrieval Augmented Generation

Kaikai An, Fangkai Yang, Liqun Li, Junting Lu, Sitao Cheng...

TL;DR利用新型数据组织范式 Thread，将文档按照其相互连接性转换为逻辑单元，能显著提高基于检索增强生成的问答系统在处理详细逐步说明和解释需求的 how-to 问题上的性能。

Abstract

Current question answering systems leveraging retrieval augmented generation perform well in answering factoid questions but face challenges with non-factoid questions, particularly →

question answering systems retrieval augmented generation how-to queries thread data organization paradigm

发现论文，激发创造

AnswerQuest: 从多段落文档生成问题答案项目的系统

一种促进阅读理解的策略是以问答形式呈现信息。我们展示了一个集成了问答和问题生成任务的系统，用于生成传达多段文档内容的问答项。我们报告了一些 QA 和 QG 的实验结果，并评估了它们如何相互作用以产生文本的 Q&A 列表。该演示可在 qna.sdl.com 上访问。

Mar, 2021

低资源医疗问答应用的两层信息检索增强生成框架：基于 Reddit 数据的概念验证

检索增强生成 (RAG) 通过提供相关的上下文文本，可以约束生成模型的输出，并减轻产生虚假信息的可能性。我们提出了一个双层 RAG 框架用于查询焦点答案生成，并在社交媒体论坛中对此框架的概念验证进行评估，重点是从新兴的与药物相关信息中生成查询焦点摘要。评估结果表明，在资源受限的环境中，双层框架能够帮助研究人员从用户那里获取几乎实时的数据。

May, 2024

基于图的问答系统

本文介绍了如何使用基于图形数据库的信息提取和检索系统以实现对大数据分析的自动化检索和快速文本分析。

Dec, 2018

可扩展开放领域问答的多步检索器和阅读器交互

该论文介绍了一种新的开放域问答框架，其中检索器和阅读器相互迭代交互，引入了多步推理机制，有助于从长度为百万级的语料库中检索信息性段落，并应用于不同的问答数据集和模型中均取得了一致性的提升。

May, 2019

知识密集型多步问题的交错检索与思维链推理

提出了 IRCoT 方法，在多步 QA 过程中使用检索和 CoT 交替进行，同时使用检索的结果来改善 CoT。在 HotpotQA、2WikiMultihopQA、MuSiQue 和 IIRC 四个数据集上，使用 IRCoT 方法取得了显著的检索和 QA 性能改进，即便是在小型模型 T5-Flan-large（0.7B）上也能奏效。

Dec, 2022

一种带有统一知识接口的开放领域问答系统

本文提出了一种基于数据和文本的统一问答框架 UDT-QA，并使用数据到文本方法将 Wiki 百科中的表格和 Wikidata 中的图表达为口语化信息，以扩展知识索引。实验证明，该方法取得了自然问答 (Single-model state-of-the-art) 的最佳成果，并表明对于调整和热插拔的两种情况，口语化知识的优先考虑可以优化答案推理。

Oct, 2021

HiQA：一种用于大规模文档 QA 的层次上下文增强 RAG 模型

这篇研究论文介绍了 HiQA，一种集成了层叠元数据和多路检索机制的高级多文档问答框架，并提出了用于多文档问答研究评估的基准 MasQA。该框架在多文档环境中展示了最先进的性能。

Feb, 2024

用图引导的多轮检索方法解决面向对话的开放领域问答

本文提出了一种基于图模型和关联反馈的检索方法，用于连续的问答交互中提高检索效率和准确性。实验结果显示，与当前流行的方法相比，该方法大幅提高了问题回答的 F1 得分。

Apr, 2021

利用大型语言模型在 NFDI4DataScience Gateway 中进行学术问题回答

本研究介绍了一个基于 NFDI4DataScience Gateway 的学术问答系统，采用了检索增强生成模型（RAG）的方法。该系统利用强大的大语言模型提供动态交互和会话式搜索，通过实验分析证明了 Gateway 和学术问答系统的有效性。

Jun, 2024

PaperQA: 科学研究的增强检索生成代理

使用 PaperQA，通过对科学文献进行信息检索，评估来源和段落的相关性，并利用 RAG 提供答案的方法，超越现有的 LLMs 和 LLM 代理在当前科学问答基准测试上的表现，使得该代理模型能够进行大规模、系统化的科学知识处理。

Dec, 2023