G-Retriever:文本图理解与问答的检索增强生成
通过结合文档检索技术与大型语言模型 (LLM),我们提出了一种名为 Generator-Retriever-Generator (GRG) 的新方法,通过首先命令模型根据给定的问题生成上下文文档,然后使用双编码器网络从外部语料库中检索与问题相关的文档。将生成的和检索的文档传递给第二个 LLM 模型,生成最终的答案。通过结合文档检索和 LLM 生成,我们的方法解决了开放域问答的挑战,如生成信息丰富且上下文相关的答案。GRG 在 TriviaQA、NQ 和 WebQ 数据集上表现优于最先进的生成 - 阅读和检索 - 阅读流水线 (GENREAD 和 RFiD),性能至少提高了 + 5.2、+4.2 和 + 1.6。我们提供代码、数据集和检查点。
Jul, 2023
本文介绍了 GNN-RAG,一种将 LLMs 的语言理解能力与 GNNs 的推理能力以检索增强生成(RAG)风格相结合的新方法。通过 GNN 在稠密的 KG 子图上推理,提取连接问题实体和答案候选的最短路径,将其转化为 LLM 推理的输入。实验证明,GNN-RAG 在 WebQSP 和 CWQ 这两个广泛使用的 KGQA 基准测试中取得了最先进的性能,在 7B 调整的 LLM 上胜过或与 GPT-4 性能相匹配。此外,GNN-RAG 在多跳和多实体问题上表现出色,其答案 F1 得分超过竞争方法 8.9-15.5%。
May, 2024
我们提出了一种名为 GNN-Ret 的新型检索方法,利用图神经网络(GNNs)考虑段落间的相关性来增强检索过程,并通过 RGNN-Ret 处理多跳推理问题,从而提高问题回答准确率。实验结果表明,GNN-Ret 相比多次查询的强基线方法在单次查询 LLM 的问题回答准确率上更高,而 RGNN-Ret 进一步提高了准确率,在 2WikiMQA 数据集上的准确率提高了 10.4%。
Jun, 2024
我们介绍了一种将 RAG 与知识图谱相结合的新型客户服务问答方法,通过保留内部问题结构和问题间关系,从历史问题中构建知识图谱用于检索,提高检索精度和解答质量。该方法在实证评估中显示,相对于基准模型,该方法在 MRR 上提升了 77.6%,在 BLEU 上提升了 0.32。我们的方法在 LinkedIn 的客户服务团队中使用了近六个月,并将平均每个问题的解决时间减少了 28.6%。
Apr, 2024
本文提出了一种基于图模型和关联反馈的检索方法,用于连续的问答交互中提高检索效率和准确性。实验结果显示,与当前流行的方法相比,该方法大幅提高了问题回答的 F1 得分。
Apr, 2021
该研究提出了一种名为 PG-RAG 的预检索框架,使用大量阅读材料和结构化的语境记录来构建伪图数据库,该框架在单文档和多文档的问题回答任务中表现出明显的改进,具有高性能的检索和生成能力。
May, 2024
使用图形增强生成(Graph RAG)方法结合知识源和查询集中的总结方法,能够在大规模语言模型中回答关于私人文档集合的全局问题,提高生成答案的完整性和多样性。
Apr, 2024
StackRAG 是一种基于 LLMs 的检索增强多智能体生成工具,通过聚合来自 Stack Overflow 的知识,提高了生成答案的可靠性。初步评估表明生成的答案是正确、准确、有关和有用的。
Jun, 2024
使用 PaperQA,通过对科学文献进行信息检索,评估来源和段落的相关性,并利用 RAG 提供答案的方法,超越现有的 LLMs 和 LLM 代理在当前科学问答基准测试上的表现,使得该代理模型能够进行大规模、系统化的科学知识处理。
Dec, 2023
Retrieval-augmented generation (RAG) has been enhanced with Think-on-Graph 2.0, aligning questions with knowledge graphs to improve information collection, integration, and precision, ensuring logical and factual consistency, advancing large language models' accuracy and reliability.
Jul, 2024