Mar, 2024

低延迟检索的浅交叉编码器

TL;DR我们展示了在低延迟情境下,基于较浅的变形器模型(即具有有限层数的变形器)的交叉编码器实际上比全规模模型表现更好,因为它们可以在相同的时间预算内估计更多文档的相关性。我们进一步展示,较浅的变形器模型可能受益于目前成功应用于推荐任务的广义二进制交叉熵 (gBCE) 训练方案。我们在 TREC 深度学习通过排序查询集上的实验中,展示了低延迟环境下较浅和全规模模型的显着改进。