BriefGPT.xyz
大模型
Ask
alpha
关键词
long document retrieval
搜索结果 - 2
SeDR: 面向长文档的片段表示学习与密集检索
通过提出基于区间表征的密集检索技术(SeDR),采用区间交互 Transformer 编码超长的文档,并提出延迟缓存负样本的方法,提高了文档的表征质量和检索性能。在 MS MARCO 和 TREC-DL 数据集上的实验证明了该方法在长文档检
→
PDF
2 years ago
基于 Bag 采样和分组损失的文档排序中的标签噪声信息检索
该研究提出了预训练模型、包采样和基于组的本地对比评估(LCE)方法以消除长文档排序中的噪音、数据标签噪音、负数据不平衡采样等问题。在 MS MARCO 长文档排名榜上表现出了良好的性能。
PDF
2 years ago
Prev
Next