Nov, 2023

RRescue: 提升对上下文的推理能力的 LLM 响应排序

TL;DR通过使用排名度量标准优化 LLMs,本研究提出了一种增强 LLMs 情境理解的新方法 RRescue,该方法通过对一系列具有情境依据的候选回复进行排序,以部分排序的方式来教授 LLMs。