Apr, 2023

重新思考多向量检索中令牌检索的作用

TL;DR本文介绍了一种名为 XTR 的上下文化 Token 获取器,利用一个简单却新颖的目标函数,该目标函数鼓励模型首先检索最重要的文档 Token 来简化多向量检索的推理过程。在流行的 BEIR 基准测试中,XTR 在不进行任何蒸馏的情况下将 nDCG@10 的最高记录提高了 2.8,详细分析表明,相对于 ColBERT,XTR 在 Token 检索阶段具有更好的召回能力。