Apr, 2022
文本分类的 12 种机器学习模型的流程和比较研究
A pipeline and comparative study of 12 machine learning models for text classification
Annalisa Occhipinti, Louis Rogers, Claudio Angione
TL;DR本文介绍了一个基于机器学习文本分类器的新技术管道,并应用于公共垃圾邮件语料库中,优化参数选择和改善预处理阶段中特定方法的模型表现,评估了不同评估指标,如精确度,召回率等,最终发现可在 Enron 数据集上实现 94%的 F-Score,得出关键词包括自然语言处理、垃圾邮件过滤。