Dec, 2021

关于 ColBERT 的词元剪枝研究

TL;DR本文研究了 ColBERT 模型的不同设计,通过采用 token pruning 技术对 ColBERT 模型进行优化,实现了在不降低性能的情况下减小索引大小。通过在 MS MARCO 文档上的实验,揭示了实现这种机制面临的各种挑战。