Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li
TL;DR本研究提出了一种新的生成式检索方法,使用合成标识符来代替传统的数字 ID 或文本片段标识符。同时,多视图标识符的综合排名可以更好地匹配查询 - 检索。在三个公共数据集上进行的实验证明了这种方法的高效性和稳定性。
Abstract
Instead of simply matching a query to pre-existing passages, generative
retrieval generates identifier strings of passages as the retrieval target. At
a cost, the identifier must be distinctive enough to represent a passage.
Current approaches use either a numeric ID or a text piece (s