May, 2016

Yelp 数据挑战:评论评分预测

TL;DR本文使用 16 种不同的特征提取方法(包括 unigrams、bigrams、trigrams 和潜在语义索引)和 4 种机器学习算法(包括逻辑回归、朴素贝叶斯分类、感知器和线性支持向量分类)将评论评级预测视为多类分类问题,并分析了每种模型的性能,从而提出了最佳模型。使用 Yelp 数据集来训练和测试模型。