ACLNov, 2016

二进制段落向量

TL;DR本文介绍了 Binary Paragraph Vector 模型,它是一种使用简单的神经网络生成高效信息检索的短二进制编码。我们发现,Binary Paragraph Vector 在使用更少的位数时优于自编码二进制编码,并在转移学习场景中评估它们的精度,结果表明,二元段向量可以捕获与各个特定领域相关的语义。最后,我们提出了一种同时学习短二进制码和长实数表示的模型,可用于在大型文档集合中快速检索高度相关的文档。