Nov, 2024
早期FIRST重现及单标记解码在快速列表重排名中的改进
An Early FIRST Reproduction and Improvements to Single-Token Decoding
for Fast Listwise Reranking
TL;DR本研究解决了大语言模型(LLMs)在列表重排名任务中的高计算需求问题,提出了一种结合学习排名目标的FIRST方法,通过仅利用第一个生成标记的logits,显著降低了推理延迟。研究表明,FIRST在不同模型和基准中均能够提高效果,且与传统方法相比,在不降低域外重排名质量的情况下实现了21%-42%的计算效率提升。