Jul, 2024

优化检索增强生成环境中的异常检测

TL;DR我们在这篇论文中关注减小问题回答系统所需的提示上下文的大小和提高其质量的方法。我们通过使用嵌入向量的距离,提出并评估了几种识别离群点的方法,该嵌入向量是从向量数据库中检索得到的,以及与质心和查询向量的距离有关的特征。通过比较检索到的大型语言模型回答与使用 OpenAI GPT-4o 模型获得的基本答案的相似性进行评估,发现随着问题和答案的复杂性增加,取得了最大的改进。