BriefGPT.xyz
Aug, 2022
面向大规模检索的词库增强密集检索器(LED)
LED: Lexicon-Enlightened Dense Retriever for Large-Scale Retrieval
HTML
PDF
Kai Zhang, Chongyang Tao, Tao Shen, Can Xu, Xiubo Geng...
TL;DR
本研究提出一种基于知识蒸馏的方法,将富有知识的词典嵌入模型对齐到密集检索模型中,从而在第一阶段检索中取得稳定且显著的提高。在三组公开数据集上的实验证明了该模型的有效性,并且与标准排名器蒸馏相结合可以进一步提高检索效果。
Abstract
retrieval models
based on
dense representations
in semantic space have become an indispensable branch for
first-stage retrieval
. These ret
→