May, 2024
R4: 强化召回 - 重排 - 回应器用于检索增强的大型语言模型
R4: Reinforced Retriever-Reorder-Responder for Retrieval-Augmented Large Language Models
Taolin Zhang, Dongyang Li, Qizhou Chen, Chengyu Wang, Longtao Huang...
TL;DR提出了一种名为 “Reinforced Retriever-Reorder-Responder”(R^4)的新流程,用于学习检索增强大型语言模型(LLM)的文档排序,从而进一步增强它们的生成能力,同时保持 LLM 的参数不变。