最佳问题询问：将大型语言模型与检索器在对话式搜索中的偏好进行对齐

Feb, 2024

最佳问题询问：将大型语言模型与检索器在对话式搜索中的偏好进行对齐

Ask Optimal Questions: Aligning Large Language Models with Retriever's Preference in Conversational Search

Chanwoong Yoon, Gangwoo Kim, Byeongguk Jeon, Sungdong Kim, Yohan Jo...

TL;DR通过 RetPO 框架，使用 Retrievers' Feedback 构建了一个大规模数据集，属于对话语境下的问题重述，并通过该数据集对较小的语言模型进行了微调，从而在两个最新的对话式搜索基准测试中实现了最新、显著超越包括 GPT-3.5 在内的现有基准。

Abstract

conversational search, unlike single-turn retrieval tasks, requires understanding the current question within a dialogue context. The common approach of rewrite-then-retrieve aims to decontextualize questions to

conversational search rewrite-then-retrieve retpo retrieval results large-scale dataset

发现论文，激发创造

检索增强大型语言模型的查询重写

该研究介绍了一个新的 Rewrite-Retrieve-Read 框架，该框架从查询重写的角度改进了检索增强方法，并通过强化学习调整该框架的策略模型，通过开放域 QA 等下游任务进行了验证。

May, 2023

加强对话式搜索：大型语言模型辅助的信息性查询改写

通过利用大型语言模型作为查询重写器，并结合精心设计的指令，我们定义了四个重写的关键属性，提出了基于大型语言模型的查询重写方法。我们还介绍了 LLMs 的重写能力的提炼，并采用 “先重写后编辑” 的方法来处理初始查询重写。实验结果在 QReCC 数据集上表明，信息丰富的查询重写可以显著提高检索性能，特别是在检索器稀疏的情况下。

Oct, 2023

聊天检索器：将大型语言模型用于通用和鲁棒的对话密集检索

ChatRetriever 是一个通过对比学习调整的对话式检索模型，能够准确解读用户意图并表示复杂对话会话，通过在高质量对话指令数据上进行掩码训练进一步提升对话理解，实验证明在五个对话式检索基准上 ChatRetriever 显著优于现有模型，在复杂对话上表现出卓越的鲁棒性，展示了适应 LLM 的潜力并推进了对话式检索研究的发展方向。

Apr, 2024

个性化大型语言模型的优化方法：通过检索增强

本研究论文探讨了扩展的检索方法用于个性化大型语言模型，通过两种优化算法从下游任务获取反馈进行检索优化，并引入了一个预生成和后生成的检索模型来决定每个语言模型输入应选择哪个检索器。在多个任务中进行了大量实验，并获得了显著的统计结果。

Apr, 2024

检索重构：大规模语言模型推理

本文提出了一种名为 'rethinking with retrieval' (RR) 的后置处理方法，借助 'chain-of-thought' (CoT) 提示中的分解推理步骤检索相关的外部知识，从而改善大语言模型在常识推理、时间推理和表格推理等方面的性能。

Dec, 2022

自检索的长距离语言建模

本文中，我们提出了一种用于从头开始联合训练检索增强语言模型的架构和训练流程，名为 Retrieval-Pretrained Transformer（RPT），并使用四个长程语言建模任务进行了评估，横跨图书、代码和数学写作，证明了与强基线相比，RPT 改善了整体的检索质量和困惑度。

Jun, 2023

强化信息检索与生成的大型语言模型

我们提出了一种迭代检索 - 生成的协作框架，该框架可以利用参数化和非参数化知识，帮助找到正确的推理路径，并显著提高大型语言模型的推理能力。实验结果显示我们的方法优于之前的基线模型，在单跳和多跳问答任务上取得了显著的改进。

Oct, 2023

端到端任务导向对话系统的检索生成对齐

利用最大边际似然方法训练感知检索器，通过利用生成回应的信号来提高生成回应的质量，并结合元知识指导生成器，以增强知识的利用能力。

Oct, 2023

通过大型语言模型整合总结和检索，实现个性化增强

通过使用离线总结和运行时检索，我们提出了一种新颖的基于总结的方法，扩展了基于检索的个性化，以实现更好的实时系统性能，并在实际约束下取得了更好的个性化性能。

Oct, 2023

基于检索的知识迁移：一种有效的极端大型语言模型压缩方法

我们介绍了一种称为 Retrieval-based Knowledge Transfer (RetriKT) 的新型压缩模型的方法，通过从大规模预训练语言模型中提取知识，构建一个知识存储库，小规模模型可以从中检索相关信息并利用它进行有效推理，实验证明该方法显著提升了小规模模型的性能。

Oct, 2023