文本文件的变分深层语义哈希
本文提出了两种混合先验生成模型以产生高质量文件哈希码,实验结果显示这些方法在几个基准数据集上比现有方法表现出更好的性能,特别是使用 Bernoulli 混合先验的方法。
Aug, 2019
使用神经网络结合深度学习的方式,针对多标签图像,提出了一种能够保持多层语义相似度的哈希函数学习方法,并在多标签图像数据集上的排名评估中证明了该方法的优越性。
Jan, 2015
本文提出一种基于深度学习的监督离散哈希算法,利用分类信息和成对标签信息在单流框架中学习哈希码,并通过交替最小化方法进行优化,实验结果表明该方法在基准数据集上优于当前最先进的方法。
May, 2017
提出了一种新的无监督生成语义哈希方法 (Ranking based Semantic Hashing,RBSH),它由一个变分部分和一个基于排名的部分组成,能够通过哈希码生成实现文档排序,实验结果显示,相较于传统方法和最新的语义哈希方法,这种方法在不同哈希码长度下均表现得更好,使用的哈希码长度通常减少 2-4 倍。
Jun, 2019
本文介绍了一种基于 GANs 的新型监督哈希方法 Deep Semantic Hashing,通过针对大规模图像检索任务,利用半监督生成对抗网络在非标注大规模图像数据集和少量标注数据集的基础上生成高质量的综合数据,以此提升哈希搜索技术的效果和精度。实验证明,该方法比当前的深度哈希模型有着更好的效果。
Apr, 2018
本文研究了稠密分布式文本数据表示的两种新型神经模型:一种用于学习文档级表示,另一种用于学习词级表示。我们提出的模型分别在信息检索和语义关系识别等任务中优于现有方法,并且直接从原始文本数据中学习嵌入。其中,词级表示模型不同于以往的模型,可以用梯度下降算法进行训练。
Jan, 2019
本文引入了一种无监督的辨别模型,用于在线文档检索。我们仅使用文本证据,通过无监督学习分布式词表示来避免显式特征工程。我们将我们的模型与最先进的无监督统计向量空间和概率生成方法进行比较,并发现我们的模型在大多数情况下可以与监督方法匹配,且算法成本较低,因此可以取得与所谓的基于档案的方法相同的检索性能水平。
Aug, 2016