May, 2024

控制令牌与密集段落检索

TL;DR本研究解决了大型语言模型 (LLMs) 中的幻觉问题。我们采用了检索增强生成 (Retrieval-Augmented Generation, RAG) 技术,通过在提示信息中嵌入相关信息来获得准确答案。然而,RAG 在检索正确信息方面也面临固有问题。为了解决这个问题,我们采用了密集路径检索 (Dense Passage Retrieval, DPR) 模型,用于获取与用户查询相关的领域专业文档。尽管如此,DPR 模型在文档检索方面仍然精度不足。我们通过引入控制符号来增强 DPR 模型,取得了显著优异的性能,Top-1 准确率提高了 13%,Top-20 准确率提高了 4%。