Apr, 2010

自学习哈希用于快速相似性搜索

TL;DR该论文提出一种基于自学习的哈希方法,通过无监督学习为给定语料库中的所有文档找到 $l$ 位二进制码,再通过有监督学习训练 $l$ 个分类器,以预测之前未见过的查询文档的 $l$ 位码。在三个真实的文本数据集上的实验表明,该方法比现有技术显著地优越。