Dec, 2015

通过预测 N 元语法组合来学习文档嵌入,用于长篇电影评论的情感分类

TL;DR通过改进 Paragraph Vector 的架构,使其可以学习预测单词和 n-gram 特征的文档向量,捕捉了文档中的语义和单词顺序,从而在 IMDB 电影评论数据集上实现比其他模型更好的情感分类结果,同时保持了向量的表达能力。