NIPSSep, 2018

范数范围局部敏感哈希用于最大内积搜索

TL;DR该研究提出了 Norm-ranging LSH 的哈希方法,它可以通过将数据集划分为多个子数据集,为每个子数据集建立一个哈希索引,改善 Simple-LSH 中长尾规范化问题,并且证明 Norm-ranging LSH 具有比 Simple-LSH 更低的查询时间复杂度。此外,该研究还提出了一种新的相似度度量方法。实验证明,相对于 Simple-LSH,Norm-ranging LSH 可以实现一个数量级的加速,并显著提高了涉及最大内积搜索的应用程序性能。