Sep, 2015

基于量化的快速内积搜索

TL;DR我们提出了一种基于量化的方法,用于快速近似最大内积搜索(MIPS),该方法利用一组通过最小化内积量化误差直接学习的码书对每个数据库向量在多个子空间上进行量化。通过子空间量化器的内积和来近似查询到数据库向量的内积。与最近提出的 LSH 方法不同,数据库向量和查询不需要在高维特征空间中进行扩展。我们还提供了所提出方法的理论分析,在较温和的假设下得出集中结果。此外,如果在训练时给出少量示例查询,则我们提出了修改的码书学习过程,可以进一步提高准确性。在包括来自深度神经网络的数据集在内的各种数据集上进行的实验结果表明,所提出的方法明显优于现有最先进的方法。