May, 2023

生成式检索在百万篇章上的可扩展性?

TL;DR本文对生成式检索技术进行了第一次经验研究,通过使用合成查询作为文档表示进行索引,以及调整内部架构,探索了在不同语料库规模下扩展生成式检索的几个关键点,发现在小规模语料库上生成式检索和最先进的双编码器具有竞争力,但在数百万篇章的大规模语料库上实现可扩展性仍然是一个重要的未解决问题。