EMNLPJul, 2017

文本预处理在神经网络架构中的作用:文本分类和情感分析的评估研究

TL;DR本文研究了文本预处理决策(特别是分词、词形还原、小写和多词组合)对标准神经文本分类器性能的影响,并在文本分类和情感分析这两个方面进行了广泛的评估。我们发现,虽然简单的分词通常足够,但预处理技术之间仍存在显着差异,因此这个通常被忽视的步骤很重要,特别是在比较不同模型时,最终评估提供了有关训练词嵌入的最佳预处理实践的见解。