ICMLMay, 2024

生成文档检索的瓶颈最小化索引

TL;DR利用信息论的视角重新思考生成式文档检索(GDR)问题,我们使用神经自回归模型将查询与索引进行匹配,通过应用香农的速率失真理论,我们分析索引的最优性并提出了一种最小瓶颈索引方法,在 NQ320K 和 MARCO 数据集上验证了该方法的优越性。