Jul, 2016

doc2vec 的实证评估与文档嵌入生成的实用洞见

TL;DR本文通过对 doc2vec 在两个任务上的实验评估,与两种基线和两种最先进的文档嵌入方法进行比较,发现使用大型外部语料库训练模型时,doc2vec 的性能表现出色,并且可以通过使用预训练的词嵌入进一步改进,同时提供了针对通用应用的超参数设置建议,并发布使用训练好的 doc2vec 模型得出文档嵌入的源代码