Feb, 2011

在十亿个向量中搜索:用源编码重新排序

TL;DR本文提出了一种在高维向量的压缩域内重新排列邻居猜想的方法,通过短量化码优化估算距离,以避免从磁盘中读取完整向量,实验证明该方法准确高效且占用较少内存。