Nov, 2022

SeDR: 面向长文档的片段表示学习与密集检索

TL;DR通过提出基于区间表征的密集检索技术(SeDR),采用区间交互 Transformer 编码超长的文档,并提出延迟缓存负样本的方法,提高了文档的表征质量和检索性能。在 MS MARCO 和 TREC-DL 数据集上的实验证明了该方法在长文档检索中的优越性。