SIGIRMay, 2022

从蒸馏到硬负采样:使稀疏神经 IR 模型更加有效

TL;DR本文研究基于稀疏表达的 SPLADE 检索器的训练提升方法,结合蒸馏、硬负例挖掘以及预训练语言模型初始化,证明其在效率和效果方面同样具有优势,能够在领域内和零样本情况下实现最先进的结果。