Jul, 2017

可伸缩和强健的集合相似性连接

TL;DR本文提出了一种新的集合相似性连接的随机算法,可以实现任何期望的召回率,这种方法在数据不具有罕见令牌结构时也具有鲁棒性,本文的方法在很大程度上提高了现有方法的效率。