SIGIRApr, 2024

生成式检索中的先行规划:通过同时解码引导自回归生成

TL;DR本文介绍了 PAG,一种新的优化和解码方法,通过同时解码来指导生成式检索模型中文档标识符的自回归生成。PAG 为每个文档构建了一种基于集合和顺序的标识符,其中基于集合的标识符基于词汇标记建立,而顺序标识符则通过量化文档的基于相关性的表示获得。在 MSMARCO 和 TREC 深度学习赛道数据上进行的大量实验证明 PAG 在性能上超过了现有的生成式检索模型(例如,在 MS MARCO 上提高了 15.6% 的 MRR),同时查询延迟方面达到了 22 倍的加速。