Dec, 2022

跨编码器在零样本检索中的防御

TL;DR本文探讨了双编码器(Bi-encoders)和交叉编码器(Cross-encoders)在领域内外的广义能力,并发现了交叉编码器的参数数量和早期查询文档的交互对检索模型的泛化能力起到了重要作用。此外,在几项任务中,交叉编码器比相似规模的双编码器表现更优异,其中最大的交叉编码器比一个最先进的双编码器超过 4 个平均点。最后,我们发现在领域外任务中,使用双编码器作为第一阶段检索器与 BM25 等更简单的检索器相比没有提供优势。