May, 2024

R4: 强化召回 - 重排 - 回应器用于检索增强的大型语言模型

TL;DR提出了一种名为 “Reinforced Retriever-Reorder-Responder”(R^4)的新流程,用于学习检索增强大型语言模型(LLM)的文档排序,从而进一步增强它们的生成能力,同时保持 LLM 的参数不变。