利用段落嵌入提高大型语言模型的高效排序

Jun, 2024

利用段落嵌入提高大型语言模型的高效排序

Leveraging Passage Embeddings for Efficient Listwise Reranking with Large Language Models

Qi Liu, Bo Wang, Nan Wang, Jiaxin Mao

TL;DR这篇论文介绍了一种名为 PE-Rank 的方法，它利用单个段落嵌入作为有效的上下文压缩，以提高大型语言模型在段落排名中的效率。通过将每个段落视为特殊标记，将段落嵌入直接输入到语言模型中，从而减少输入长度。此外，还介绍了一种动态约束解码空间的推理方法，加速解码过程。通过在多个基准测试上的评估结果表明，PE-Rank 在预填充和解码方面显著提高了效率，同时保持了有竞争力的排名效果。

Abstract

Recent studies have demonstrated the effectiveness of using large language language models (LLMs) in passage ranking. The listwise approaches, such as rankgpt, have become new state-of-the-art in this task. However, the

large language models rankgpt pe-rank passage reranking efficiency

发现论文，激发创造

Rank-without-GPT: 基于开源大型语言模型构建独立的 GPT - 无关的列表排序器

通过消除对 GPT 模型的依赖，本研究首次构建了有效的零阶科学可复现性的无需 GPT 依赖的排序器，能够在通行回收实验中表现出 13% 超越基于 GPT-3.5 的排序器，并达到了基于 GPT-4 构建的排序器的 97% 有效性。研究结果还显示，现有的点对点排序训练数据对于构建此类基于列表的排序器是不足够的，需要高质量的基于列表的排序数据，呼吁进一步建立人工标注的列表数据资源。

Dec, 2023

逐步重新排序：研究大型语言模型的预过滤重新排序

使用人工生成的相关性评分和 LLM 相关性评分，在对信息检索进行重新排序之前进行预过滤，能够有效地过滤掉不相关的段落，并使较小模型如 Mixtral 能够与更大的专有模型（如 ChatGPT 和 GPT-4）具有竞争力。

Jun, 2024

通过基于大型语言模型的文本补充和重写增强嵌入性能

利用大型语言模型丰富和重写输入文本，改善嵌入模型的性能，并在特定领域取得显著改进。

Apr, 2024

BERT 的文章重新排序

本文介绍了一个基于查询的段落重排的 BERT 的简单重新实现，该系统在 TREC-CAR 数据集上处于技术先进地位，是 MS MARCO 段落检索任务排行榜中的前列，优于以前的技术领先 27%（相对于 MRR @ 10）。

Jan, 2019

利用显式知识提升预训练语言模型的段落重排能力

使用知识图谱，结合自然语言处理模型和图神经网络为基础，研究出一种新的知识型篇章再排序方法，提高了特定领域问题的查询准确性。

Apr, 2022

大型语言模型具有配对排名提示的有效文本排名器

本文提出了一种新的技术叫做 Pairwise Ranking Prompting (PR)，通过使用适当的排名提示，减少了 LLMs 的负担，使用 moderate-sized open-sourced LLMs 在标准的基准测试中实现了最先进的排名表现。

Jun, 2023

APEER：自动提示工程提升大型语言模型重排

通过自动提示工程算法 APEER，大型语言模型在信息检索中的零样本相关性排名取得了显著的性能提升，并展现出更好的跨任务和跨语言模型的可迁移性。

Jun, 2024

基于大型语言模型的零样本列表式文档重排序

在 TREC 网络搜索数据集和 MIRACL 跨语言数据集上，使用无需特定任务训练数据的 Listwise Reranker with a Large Language Model (LRL) 可以作为第一阶段和最终阶段的重新排序方法，在多层文本排序任务中取得了强大的效果。

May, 2023

EcoRank: 使用大型语言模型的预算限制文本重新排序

利用 Large Language Models（LLMs）实现了文本重新排名，并通过预算约束方法中的预测策略、预算分配和 LLM APIs 的选择，提出了一种高效的文本重新排名方法 EcoRank，实验结果表明其优于其他预算感知的监督和非监督基准方法。

Feb, 2024

大型语言模型中问题回答中的段落重排之段落专用提示调整

本文提出了一种针对开放域问答中重新排序的特定段落提示调优方法（PSPT），该方法能够通过微调可学习的段落特定软提示，并结合限定的问题 - 段落相关性对段落特定知识进行增强，以基于模型生成问题的对数似然和学到的软提示对检索到的段落进行排序。通过在三个公开可用的开放域问答数据集上使用 Llama-2-chat-7B 模型进行广泛实验，结果证明了所提方法的有效性。

May, 2024