Nov, 2022

CITADEL: 通过动态词汇路由的条件化令牌交互,实现高效和有效的多向量检索

TL;DR本文从令牌路由视角统一不同的多向量检索模型,提出通过动态词汇路由的条件令牌交互,即 CITADEL,以实现高效且有效的多向量检索。通过将不同的令牌向量路由到预测的词汇 “关键词”,以便查询令牌向量只与路由到相同关键词的文档令牌向量进行交互,从而显著减少计算成本,同时保持高准确性。值得注意的是,CITADEL 在速度方面几乎快 40 倍,同时在领域内(MS MARCO)和领域外(BEIR)评估中均获得了与之前的最高水平 ColBERT-v2 相同或略好的性能。