May, 2024

聚类检索增强生成(CRAG)

TL;DR提供外部知识给大规模语言模型是实际应用中的关键点之一,为了融入实时的内容、提供特定领域知识以及预防生成虚构内容。通过数据库向量检索增强生成(RAG)方法已经被广泛采用,然而在某些应用中,使用 RAG 方法可能不可行,因为所检索的上下文可能需要比 LLM 支持的上下文窗口更长。为了解决这个问题,我们提出了一种名为 CRAG 的新方法,能够有效减少提示词数量,而不会降低生成的响应质量与使用 RAG 的解决方案相比。通过实验证明,与 RAG 相比,CRAG 方法可以至少减少 46% 的词数量,在某些情况下甚至能达到 90% 以上。此外,与 RAG 相比,CRAG 的词数在分析评论数增加时不会显著增加,当评论数从 4 个增加到 75 个时,RAG 的词数几乎增加了 9 倍。