文本文件的变分深层语义哈希

Aug, 2017

Variational Deep Semantic Hashing for Text Documents

Suthee Chaidaroon, Yi Fang

TL;DR本文提出了一系列新颖的基于深度生成模型的文本哈希方法，并通过实验证明了深度学习在文本哈希中的有效性。

Abstract

As the amount of textual data has been rapidly increasing over the past decade, efficient similarity search methods have become a crucial component of large-scale information retrieval systems. A popular strategy

发现论文，激发创造

文本处理的神经变分推断

通过引入一个通用变分推断框架来构建生成式和条件文本模型的变分推断网络，我们验证了该框架在生成式文档建模和监督式问题回答两个不同的文本建模应用中的有效性。

Nov, 2015

混合先验生成模型的文档哈希

本文提出了两种混合先验生成模型以产生高质量文件哈希码，实验结果显示这些方法在几个基准数据集上比现有方法表现出更好的性能，特别是使用 Bernoulli 混合先验的方法。

Aug, 2019

基于深度语义排名的多标签图像检索哈希

使用神经网络结合深度学习的方式，针对多标签图像，提出了一种能够保持多层语义相似度的哈希函数学习方法，并在多标签图像数据集上的排名评估中证明了该方法的优越性。

Jan, 2015

深度监督离散哈希

本文提出一种基于深度学习的监督离散哈希算法，利用分类信息和成对标签信息在单流框架中学习哈希码，并通过交替最小化方法进行优化，实验结果表明该方法在基准数据集上优于当前最先进的方法。

May, 2017

无监督神经生成语义哈希

提出了一种新的无监督生成语义哈希方法 (Ranking based Semantic Hashing,RBSH)，它由一个变分部分和一个基于排名的部分组成，能够通过哈希码生成实现文档排序，实验结果显示，相较于传统方法和最新的语义哈希方法，这种方法在不同哈希码长度下均表现得更好，使用的哈希码长度通常减少 2-4 倍。

Jun, 2019

伯努利变分自编码器和自控梯度估计的成对监督哈希

介绍了一种基于离散隐变量 VAE 的成对损失函数，通过使用无偏的低方差梯度估计器，优化网络并获得了良好的性能

May, 2020

生成式对抗网络实现的深度语义哈希

本文介绍了一种基于 GANs 的新型监督哈希方法 Deep Semantic Hashing，通过针对大规模图像检索任务，利用半监督生成对抗网络在非标注大规模图像数据集和少量标注数据集的基础上生成高质量的综合数据，以此提升哈希搜索技术的效果和精度。实验证明，该方法比当前的深度哈希模型有着更好的效果。

Apr, 2018

文本生成的深度潜在变量模型

使用深度潜变量模型进行文本生成可以提高标准编码器 - 解码器模型的效果，同时保持深度神经网络的表达能力。

Mar, 2022

深度学习中文本数据的向量表示

本文研究了稠密分布式文本数据表示的两种新型神经模型：一种用于学习文档级表示，另一种用于学习词级表示。我们提出的模型分别在信息检索和语义关系识别等任务中优于现有方法，并且直接从原始文本数据中学习嵌入。其中，词级表示模型不同于以往的模型，可以用梯度下降算法进行训练。

Jan, 2019

无监督，高效和语义型专家检索

本文引入了一种无监督的辨别模型，用于在线文档检索。我们仅使用文本证据，通过无监督学习分布式词表示来避免显式特征工程。我们将我们的模型与最先进的无监督统计向量空间和概率生成方法进行比较，并发现我们的模型在大多数情况下可以与监督方法匹配，且算法成本较低，因此可以取得与所谓的基于档案的方法相同的检索性能水平。

Aug, 2016