May, 2022

适用于内存高效密集检索的领域适应

TL;DR本文探讨了二进制文档向量的性能及传统压缩技术的局限性,并提出了一个基于 GPL 的领域自适应策略,可在不需要标注训练数据的情况下,将 BPR 和 JPQ 调整适应任何语料库,提高了 nDCG@10 平均 11.6 - 19.3 分,并且仍保持了 32 倍的内存效率。