Dec, 2015
通过预测 N 元语法组合来学习文档嵌入,用于长篇电影评论的情感分类
Learning Document Embeddings by Predicting N-grams for Sentiment Classification of Long Movie Reviews
Bofang Li, Tao Liu, Xiaoyong Du, Deyuan Zhang, Zhe Zhao
TL;DR通过改进 Paragraph Vector 的架构,使其可以学习预测单词和 n-gram 特征的文档向量,捕捉了文档中的语义和单词顺序,从而在 IMDB 电影评论数据集上实现比其他模型更好的情感分类结果,同时保持了向量的表达能力。