Feb, 2024

最佳问题询问:将大型语言模型与检索器在对话式搜索中的偏好进行对齐

TL;DR通过 RetPO 框架,使用 Retrievers' Feedback 构建了一个大规模数据集,属于对话语境下的问题重述,并通过该数据集对较小的语言模型进行了微调,从而在两个最新的对话式搜索基准测试中实现了最新、显著超越包括 GPT-3.5 在内的现有基准。