May, 2012

实践中的b-Bit最小哈希:大规模批处理和在线学习,以及使用GPU进行快速预处理和简单哈希函数

TL;DR本文探讨在搜索场景下使用b位最小哈希法(“minwise hashing”)需要解决的问题,并提出了并行化方案、基于简单哈希函数的b位最小哈希实现方法等,验证了该方法在数据大小和训练效果上的优势。